Baixe o app para aproveitar ainda mais
Prévia do material em texto
39 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Unidade II5 10 15 20 25 30 35 6 INTRODUÇÃO À PROBABILIDADE Quando estudamos algum fenômeno a partir do método estatístico, na maior parte das vezes é preciso estabelecer uma distinção entre o modelo matemático que construímos para tentar explicar tal fenômeno e o fenômeno em si. A maioria dos fatos estudados pela estatística apresenta resultados de difícil previsibilidade, dados que variam de uma observação para outra, mesmo em condições normais de experimentação. Para analisar, interpretar e explicar tais fenômenos é preciso utilizar a probabilidade. Derivado do latim probare (provar ou testar), o termo “probabilidade” também tem ligação com a palavra “provável”, que informalmente é utilizada em eventos incertos ou conhecidos e também substituída por “sorte”, “risco”, “azar”, “incerteza” ou “duvidoso”, dependendo do contexto. A teoria das probabilidades, assim como a teoria da mecânica, que atribui definições precisas a termos de uso diário, como “trabalho” e “força”, também tenta quantificar a noção de provável. Podemos dizer que a probabilidade é uma técnica estatística empregada na para encontrar a chance de ocorrência de um determinado evento. O evento, por sua vez, é o resultado que se espera de um determinado experimento. Como eventos, temos cara (no caso do lançamento de uma moeda), um número compreendido de 1 a 6 (no caso do 40 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 lançamento de um dado), chuva (no caso da observação do tempo), entre muitos outros. A probabilidade de ocorrer determinado evento será sempre um número entre 0 e 1, que indica aproximadamente a chance de ocorrência. Quanto mais próxima de 1, maior é a probabilidade de ocorrer este evento; quanto mais próxima de zero, menor a chance. Quando a probabilidade de determinado evento é zero, diz-se que este é um evento impossível. Sendo assim, temos: 0<P(A)<1 6.1 Teoria dos conjuntos, espaço amostral e eventos Um conjunto é definido como um grupo de objetos ou itens que apresentam características comuns. São exemplos de conjuntos os habitantes de São Paulo, os estudantes de Ciência da Computação da UNIP, o número de consoantes do alfabeto, o número de vogais do alfabeto etc. Podemos descrever os elementos de um conjunto de duas formas: enumerando cada um deles entre chaves ou indicando suas características comuns, também entre chaves. conjuntoA={a,e,i,o,u} ou conjuntoA={conjunto das vogais do alfabeto}; conjuntoB={todos os números inteiros maiores que 23}. Em um conjunto finito, podemos identificar todos os seus subconjuntos. O número de subconjuntos de um conjunto finito será obtido por meio da seguinte fórmula: 41 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Nsubconjunto=2 n, em que “n” corresponde ao número de elementos do conjunto. Por exemplo, dado o conjunto a seguir, calcule a quantidade de subconjuntos e faça a sua apresentação: A={2,4,6,8} A quantidade de subconjuntos de A será: NsubconjuntoA=2 n=24=16 Os subconjuntos do conjunto A serão, portanto: A={{2},{4},{6},{8},{2,4},{2,6},{2,8},{4,6},{4,8},{6,8}, {2,4,6},{2,6,8},{2,4,8},{4,6,8},{2,4,6,8},{ }} Ora, se trazemos estes conceitos para a probabilidade, podemos definir então o que seria espaço amostral e evento. Na teoria das probabilidades, temos o chamado experimento, uma experiência que poderá ser repetida sob as mesmas condições indefinidamente. Para cada experimento existe um conjunto S formado por todos os possíveis resultados deste experimento. Este conjunto é denominado de espaço amostral. Por exemplo, ao lançar um dado e observar o número da face que fica para cima, teríamos o seguinte conjunto de resultados possíveis deste experimento e, portanto, o seguinte espaço amostral: S = Ω {1,2,3,4,5,6}, em que Ω é o espaço amostral. O espaço amostral poderá ser representado pela letra ômega. Sendo o espaço amostral o conjunto de todos os resultados possíveis de uma dada experiência, a probabilidade do espaço amostral deverá ser igual a 1 ou 100%, pois ao menos um dos resultados deve ocorrer. 42 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 P(evento qualquer espaço amostral Ω)=1,00 Os eventos são os resultados de um experimento. No caso do exemplo, de lançar um dado, seriam exemplos de eventos: A: Ocorrer face igual a 6; B: Ocorrer face igual a 5. O evento é geralmente simbolizado por meio de uma letra maiúscula. Poderíamos simbolizar graficamente o espaço amostral e o evento por meio do diagrama de Venn para que possamos visualizar melhor a diferença entre estes dois importantes conceitos da Teoria das probabilidades. Evento Espaço amostral O que significa então este gráfico? Para entendermos melhor, vamos relembrar algumas relações que se estabelecem entre dois ou mais conjuntos e que tipo de classificação didática isto gera, de modo a entender que implicações isto pode ter para a teoria das probabilidades. Dois ou mais conjuntos que não possuam elementos em comum são chamados conjuntos disjuntos. Por exemplo, consideremos os conjuntos a seguir: A={3,5,7} B={9,11} 43 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Ambos são conjuntos que claramente não apresentam qualquer elemento em comum e podem ser representados pelo diagrama de Venn, como segue: 3 5 7 9 11 A B Como A e B não possuem elementos em comum, o resultado da união destes conjuntos irá gerar um novo conjunto cujo número de elementos será dado pela soma dos elementos de A e dos elementos de B. Temos, então: n(A∪B)=n(A)+n(B) n(A∪B)=5 Se dois ou mais conjuntos apresentam elementos em comum, teremos o caso de conjuntos não disjuntos. Neste caso, o número de elementos da união dos dois conjuntos será dado pela soma dos elementos de cada conjunto, subtraindo-se os elementos que estes possuem em comum. A={2,4,6,8,10} e B{8,10,12} n(A∪B)=n(A)+n(B)–n(A∩B); (A∪B)=5+3-2=6 Podemos verificar este resultado comparando-o ao diagrama de Venn, que apresentará claramente os elementos da união dos dois conjuntos A e B. 2 4 6 12 A B 6 8 10 44 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Estes conceitos de conjuntos são importantes porque nos permitem, por exemplo, definir novos eventos utilizando estas operações de união e interseção. Assim: a. (A∪B) → Quando A ou B ocorre, ou ambos ocorrem, temos este evento; b. (A∩B) → Evento só ocorre se A e B ocorrerem simultaneamente; c. A → Evento quando A não ocorre. A partir disso, podemos definir os eventos como complementares, mutuamente exclusivos, não mutuamente exclusivos e coletivamente exaustivos. Diz-se que dois eventos são complementares quando completam um determinado espaço amostral. É importante ressaltar que os eventos complementares não devem apresentar elementos em comum. A soma das probabilidades de eventos complementares é sempre igual a 1. Podemos representar dois eventos complementares com o diagrama que segue: Espaço amostral A Espaço amostral A Por exemplo: podemos considerar como eventos complementares ocorrer cara ou coroa no lançamento de uma 45 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en -D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 moeda, ou então atender ou não à porta. O espaço amostral dos dois experimentos respectivamente será: Ω={cara, coroa} onde: A: ocorrer cara; B: ocorrer coroa. Ω2={atender, não atender} onde: C: atender à porta; D: não atender à porta. Em ambos os experimentos, podemos observar que a soma das probabilidades será igual a 1, porque os eventos completam o espaço amostral. Assim, no caso dos dois exemplos acima, teremos: P A P B P A P B ( ) ( ) ( ) ( ) = = ⇒ + = 1 2 1 2 1 P C P D P C P D ( ) ( ) ( ) ( ) = = ⇒ + = 1 2 1 2 1 Dois ou mais eventos que não possuem elementos comuns ou que não podem ocorrer simultaneamente são ditos eventos 46 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 mutuamente excludentes. Diferentemente dos eventos complementares, eles não necessariamente completam o espaço amostral. Sendo assim, podemos dizer que todos os eventos complementares são mutuamente exclusivos, mas nem todos os eventos mutuamente exclusivos são complementares. Também é importante ressaltar que na teoria dos conjuntos, os eventos mutuamente exclusivos são os chamados conjuntos disjuntos. Isso significa que: (A∩B)=∅ Para ilustrar graficamente dois eventos mutuamente exclusivos, podemos mais uma vez nos valer de um diagrama de Venn. A Ω: Espaço amostral B Por exemplo: no lançamento de um dado, podem ocorrer as faces 1, 2, 3, 4, 5, 6. São seis eventos mutuamente excludentes, já que dois não podem ocorrer simultaneamente, portanto a ocorrência de um exclui a ocorrência do outro. Se restringirmos este experimento a apenas duas faces, temos: Experimento: lançamento de um dado Ω={1,2,3,4,5,6}; (espaço amostral) 47 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 A: ocorrer à face 2; B: ocorrer à face 4. Temos aqui dois eventos mutuamente exclusivos e que não são complementares. Quando dois eventos apresentam elementos em comum ou podem ocorrer simultaneamente, diz-se que eles são eventos não mutuamente excludentes. Estes eventos podem ser representados por meio de um diagrama de Venn, como segue: Ω: Espaço Amostral Ω: Espaço amostral BA Podemos nos valer da distribuição de frequências do quadro a seguir para exemplificar dois eventos que sejam não mutuamente excludentes. Vejamos então a distribuição de frequência das idades dos alunos formandos do curso de Gestão de uma Universidade AB: Distribuição de frequência das idades Classe Frequência absoluta simples 20 |– 22 5 22 |– 24 12 24 |– 26 11 26 |– 28 16 28 |– 30 20 30 |– 32 14 32 |– 34 8 34 |– 36 8 36 |– 38 4 38 |– 40 2 ∑ 100 48 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Tomando-se esta distribuição de frequência, podemos dar exemplo de dois eventos não mutuamente exclusivos: A: apresentar idade entre 20 e 26 anos no momento da formatura; B: apresentar idade entre 22 e 30 anos no momento da formatura. Como entre estes dois eventos existem elementos em comum, ou seja, os intervalos de 22 a 26 anos, esses eventos são não mutuamente excludentes. Os eventos podem ser ainda coletivamente exaustivos. Isto acontece quando os eventos em questão ocuparem todo o espaço amostral, tornando impossível qualquer outro resultado além daqueles eventos dados. São considerados eventos coletivamente exaustivos os eventos complementares, mas nem sempre os eventos coletivamente exaustivos serão complementares. Além disso, os eventos coletivamente exaustivos serão, em alguns casos, mutuamente excludentes. Podemos então representar graficamente eventos coletivamente exaustivos com o diagrama a seguir: Ω: Espaço amostral A B C Assim, são exemplos de eventos coletivamente exaustivos, no caso de um experimento de lançar uma moeda: A: ocorrer cara; B: ocorrer coroa. 49 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Outro exemplo seria, ao se fazer a experiência de retirar cartas de um baralho, definir como eventos: A: carta de copas; B: carta de paus; C: carta de ouros; D: carta de espadas. Assim, temos aqui dois exemplos de eventos coletivamente exaustivos. Vamos a alguns exemplos: Exemplo 1 Em um grupo de 100 pessoas, 70 têm sangue com RH positivo e 45 têm sangue tipo O. Escolhendo-se, ao acaso, uma pessoa desse grupo, qual é a probabilidade de o sangue dessa pessoa ser de tipo diferente de O? Solução: Seja x o número de pessoas que têm sangue RH positivo e têm também sangue tipo O. Representando os conjuntos por meios de diagramas de Euler-Venn: 70 – x + x + 45 – x = 100. RH+ 70 – x 45 – xx O 50 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Daí vem que 70 + 45 – x = 100. Então, x = 115 – 100 = 15. Assim, o número de pessoas que têm sangue do tipo diferente de O é: 70 – 15 = 55. Logo, num total de 100 pessoas, temos 55 possibilidades (chances) de escolha. Então, podemos dizer que a probabilidade de o sangue dessa pessoa ser de tipo diferente de O é 55/100 = 55%. De outra maneira, mais rápida: como 45 têm sangue tipo O, o número de pessoas que têm sangue do tipo diferente de O é: 100 – 45 = 55. Logo, a probabilidade é de 55 possibilidades num total de 100, isto é, 55%. Exemplo 2 Maria vai sair com suas amigas e, para escolher a roupa que usará, separou duas saias e quatro blusas. De quantas maneiras ela pode se arrumar? Solução O chamado Princípio Fundamental da Contagem (PFC) diz: se alguma escolha pode ser feita de M diferentes maneiras e alguma escolha subsequente pode ser feita de N diferentes maneiras, há M×N diferentes maneiras pelas quais essas escolhas podem ser feitas sucessivamente. Observe a tabela: Blusa 1 Blusa 2 Blusa 3 Blusa 4 Saia 1 Saia 1 e blusa 1 Saia 1 e blusa 2 Saia 1 e blusa 3 Saia 1 e blusa 4 Saia 2 Saia 2 e blusa 1 Saia 2 e blusa 2 Saia 2 e blusa 3 Saia 2 e blusa 4 51 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Contando as possibilidades, vemos que Maria pode se arrumar de oito maneiras distintas. De fato, a ação é constituída de duas etapas sucessivas: a primeira (vestir a saia) pode ser realizada de duas maneiras diferentes, sendo que, para cada uma dessas possibilidades, a segunda (vestir a blusa) pode ser realizada de quatro maneiras distintas. Assim, pelo princípio fundamental da contagem (PFC), o número de efetuar a ação completa é 2 × 4 = 8. Exemplo 3 Há quatro estradas ligando as cidades A e B e três estradas ligando as cidades B e C. De quantas maneiras distintas pode-se ir de A a C passando por B? Solução: A ação é constituída de duas etapas sucessivas. A primeira (ir de A até B) pode ser realizada de três maneiras. Para cada uma dessas possibilidades, a segunda (ir de B até C) pode ser realizada de quatro maneiras. Então, pelo PFC, o número de maneiras de ir de A até C é: 3 × 4 = 12. Exemplo 4 Uma prova de matemática tem dez questões do tipo V ou F. Se todas as questões forem respondidas ao acaso, qual o número de maneiras de preencher a folha de resposta? Solução: O PFC é também conhecido como princípio multiplicativo e pode ser generalizado para ações constituídas de mais de duas etapas sucessivas. Resolveruma prova de dez questões do tipo V ou F representa uma ação constituída de dez etapas sucessivas, que correspondem à resolução das dez questões propostas. Para 52 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 cada questão, há duas possibilidades de escolha de resposta: V ou F. Logo, pelo PFC, o resultado procurado é: 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 = 210 = 1024. Exemplo 5 De quantas maneiras podemos arrumar cinco pessoas em fila indiana? Solução: Ao escolher uma pessoa para ocupar a primeira posição na fila, temos cinco possibilidades; para o segundo lugar, como uma pessoa já foi escolhida, temos quatro possibilidades; para o terceiro lugar sobram três pessoas a serem escolhidas; para o quarto lugar, duas pessoas, e para o último lugar na fila sobra apenas a pessoa ainda não escolhida. Então, pelo PFC, temos: 5 × 4 × 3 × 2 × 1 = 120. Assim, calculamos o número de modos de ordenar (“embaralhar”) cinco elementos distintos. Em outras palavras, calculamos o número de permutações simples de cinco elementos, ou seja, P5 = 120. Exemplo 6 (UFJF) Ao lançarmos dois dados, a probabilidade de obtermos resultados cuja soma é sete é: 1+1 1+2 1+3 1+4 1+5 1+6 2+1 2+2 2+3 2+4 2+5 2+6 3+1 3+2 3+3 3+4 3+5 3+6 4+1 4+2 4+3 4+4 4+5 4+6 5+1 5+2 5+3 5+4 5+5 5+6 6+1 6+2 6+3 6+4 6+5 6+6 53 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Solução: Para cada dado lançado ao acaso, temos seis possibilidades de resultado. Então, pelo PFC, o número de casos possíveis é 6 × 6 = 36. O número de casos favoráveis é o número de elementos dos conjuntos de pares ordenados {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}, ou seja, é seis. Assim, a probabilidade é P = 6/36 = 1/6. 6.2 Conceito de Probabilidade em espaços amostrais equiprováveis Espaços amostrais equiprováveis são aqueles cujos elementos amostrais têm a mesma probabilidade de ocorrer. Definimos a probabilidade de ocorrência de um evento E como sendo: p E elementos E elementos S ( ) ( ) ( ) = isto é, o número de elementos de E dividido pelo número de elementos de S. Como E⊂S e n(E)<n(S), temos que p E n E n S ( ) ( ) ( ) = , de modo que 0<p(E)<1 6.3 Propriedades da Probabilidade 0 = P(E) = 1 P(S) = 1 (evento certo) P(Ø) = 0 (evento impossível) 54 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Se E é o evento complementar de E, então P(E) = 1 – P(E) Se E e F são dois eventos de um espaço amostral S, finito e não vazio, então: P(E ∪ F) = P(E) + P(F) – P(E ∩ F) Se E ∩ F = ∅, então E e F são chamados eventos mutuamente exclusivos e: P(E ∪ F) = P(E) + P(F) Se os eventos E, F, G,..., R de S forem dois a dois, sempre mutuamente exclusivos, são chamados exaustivos, e E ∪ F ∪ G ∪ ... ∪ R= S. Assim sendo, temos P(E) + P(F) + P(G) +... + P(R) = 1 6.4 Probabilidade Condicionada Sendo E e F dois eventos de um espaço amostral S, finito e não vazio, a probabilidade F de condicionada a E é a probabilidade de ocorrer F sabendo que já ocorreu E: P F E n E F n E ( / ) ( ) ( ) = ∩ Exemplo: Retira-se uma carta de um baralho de 52 cartas. Qual é a probabilidade de retirar-se um rei, sabendo que a carta é de espada? 55 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Resolução E: evento sair carta de espadas n(E) = 13 F: evento sair rei n(F) = 4 E ∩ F: sair rei de espadas n(E ∩ F) = 1 P(F / E) = 1 3 6.5 Eventos Independentes Dois eventos E e F são independentes se, e somente se: P(E / F) = P(E) P(F / E) = P(F) Se E e F são independentes, então: P(E ∩ F) = P(E) . P(F) Exemplo: Sendo P(E) = 0,3 e P(E ∪ F) = 0,8, determine P(F) sabendo que E e F são independentes. Resolução: P(F) = x Se E e F são independentes, então P(E ∩ F) = P(E) . P(F) = 0,3 . x Sabendo que P(E ∪ F) = P(E) + P(F) – P(E ∩ F), 0,8 = 0,3 + x – 0,3x x = 5 7 56 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 7 DISTRIBUIÇÃO BINOMIAL É comum encontrarmos problemas em estatística com dois resultados possíveis e repetitivos por várias vezes nas mesmas condições. Nessas condições, chamamos-os de experimento binomial. Exemplos: • nascimento de crianças (masculino ou feminino); • Processo de fabricação de um componente eletrônico (com defeito ou sem defeito). Para termos um experimento binomial, são necessários os seguintes requisitos: • Ter um número de repetições determinadas; • As repetições devem ser independentes; • Cada repetição só poderá ter um resultado definido por duas possibilidades; • A probabilidade de ocorrer cada repetição deve ser constante. Suponhamos que n repetições independentes sejam realizadas e que a probabilidade de sucesso em qualquer repetição seja p. Seja ainda x o número total de sucessos dentre as n repetições. Nestas condições, podemos calcular a distribuição de probabilidade na variável x pela fórmula: p x p p onde n x n xx n x n x x n( ) ( ). .( ) , ( ) ! !( )! = − = − −1 n!=n.(n–1).(n–2). ... . 3 . 2 . 1 57 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Exemplo: Um estudo de uma companhia telefônica em uma cidade mostrou que a duração média de uma chamada telefônica residencial é de 3,8 minutos e que a probabilidade que uma chamada aconteça, selecionada aleatoriamente, com duração de 3,8 minutos, é de 0,25. Qual é probabilidade de que em três chamadas aleatoriamente selecionadas, • exatamente duas (x=2) durem mais que 3,8 minutos? • nenhuma (x=0) dure mais que 3,8 minutos? Resolução: Seja x o número de chamadas, dentre as três selecionadas, que duram mais que 3,8 minutos. Para encontrar as probabilidades pedidas aplicaremos o seguinte procedimento: • Identificar um sucesso: um sucesso é uma chamada que dure mais que 3,8 minutos; • Determinar p,a probabilidade do sucesso: a probabilidade da chamada durar mais que 3,8 minutos é igual a 0,25; • Determinar n, o número de repetições: o número de chamadas é 3 (repetições); • Aplicar os dados na fórmula e encontrar a probabilidade para x sucessos. a) P( ) ( ). , .( , ) ,2 0 25 1 0 25 0 1412 3 2 3 2= − =− A probabilidade que duas das três chamadas durem mais que 3,8 minutos é de 14,1%. b) P( ) ( ). , .( , ) ,0 0 25 1 0 25 0 4220 3 0 3 0= − =− 58 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 A probabilidade que nenhuma das três chamadas dure mais do que 3,8 minutos é de 42,2%. 8 DISTRIBUIÇÃO DE POISSON Trata-se de uma distribuição semelhante à binomial, porém os eventos ocorrem em intervalos de tempo ou espaço e em tentativas fixadas. Exemplo: Quantidade de informações que chegam por hora no servidor de uma rede de computadores. Se o número médio de contagem no intervalo for λ > 0, a variável aleatória x, que é igual ao número de contagem no intervalo, terá um distribuição de Poisson, com parâmetro λ1, e poderá ser calculado pela fórmula: P x e x x ( ) . ! = −λ λ na qual λ é o número médio de sucesso para um específica dimensão de tempo ou de espaço, e e é o número de Néper, aproximadamente 2,7183. Exemplo: Uma equipe de manutenção de computadores atende em média cinco chamadas por hora. Determine a probabilidadede que, em uma hora selecionada aleatoriamente, sejam recebidas exatamente quatro chamadas. Para resolver, usaremos o seguinte procedimento: Identificar a variável aleatória. x=4 59 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Determinar o número médio λ de sucessos para uma específica dimensão de tempo ou espaço: λ=5 Aplicar a fórmula: P x e x x ( ) . ! = −λ λ P ex ( ) . ! ,4 5 4 0 1755 5 = = − A probabilidade de que em uma hora sejam recebidas exatamente quatro chamadas é de 17,55%. 9 CORRELAÇÃO LINEAR E REGRESSÃO LINEAR 9.1 Correlação Linear Trata-se de um parâmetro que indica com qual grau duas variáveis estão relacionadas. Por exemplo, podemos afirmar que o número de livros lidos por uma pessoa está relacionado com sua idade? O grau de correlação pode ser perfeita, em que os valores das variáveis se comportam perfeitamente como uma reta. Exemplo: vamos supor duas grandezas relacionadas conforme a tabela a seguir: xi 1 2 3 4 5 6 7 yi 2 4 6 8 10 12 14 Perceba que ao representarmos graficamente os pares de variáveis da tabela, construiremos exatamente um reta. Nessas condições, podemos dizer que as variáveis estão perfeitamente correlacionadas. 60 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Adotaremos a letra “r” para representar o coeficiente de correlação de Pearson (conhecido como coeficiente de correlação linear), que poderá ser calculado pela fórmula: r n x y x y n x x n y y i i i i i i i i = − −( ) −( ) ∑ ∑∑∑ ∑ ∑ ∑ ∑ . . ( ).( ) . ( ) . . ( )2 2 2 2 Neste caso, i representa o número de pares de dados em estudo (no caso do exemplo anterior, temos i=7). Como o coeficiente de correlação é uma razão, seus valores poderão variar no intervalo [–1, +1], sendo classificado pelo seguinte critério: r = – 1,00: correlação negativa perfeita r = – 0,75: correlação negativa forte r = – 0,50: correlação negativa média r = – 0,25: correlação negativa fraca r = 0,00: ausência de correlação r = + 0,25: correlação positiva fraca r = + 0,50: correlação positiva média r = + 0,75: correlação positiva forte r = + 1,00: correlação positiva perfeita 61 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 9.2 Regressão Linear Chamamos de regressão o processo de traduzir o comportamento do conjunto de duas variáveis na forma de uma curva que deverá ser expressa por uma função matemática, que chamaremos de “equação da regressão”. Usaremos um critério chamado “Método dos Mínimos Quadrados”, cuja finalidade é estabelecer a melhor reta que se ajusta os todos pontos definidos pelas duas variáveis. Essa reta será chamada de “Reta Interpoladora”. Como a equação de uma reta, de maneira geral pode ser expressa pela lei: Y = A X + B Por analogia, tiramos a equação geral na forma y k x y K xy i y= + −. ( . ) onde: x x n S x x n i x i n i= = − − ∑ ∑ =1 2 1 ( ) y y n S y y n i y i n i= = − − ∑ ∑ =1 2 1 ( ) ; K r S Sy y x = Exemplo: Um estudante levantou o seguinte conjunto de dados em laboratório. xi 5 15 20 25 30 35 yi 48 43 34 19 11 6 62 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Querendo saber como se comportavam as variáveis, solicitou ajuda a um professor de estatística que o orientou a determinar o coeficiente de correlação linear e em seguida encontrar a reta de regressão linear. O seu desenho mostrará o comportamento das variáveis. Resolução: Note que o número de pares das variáveis n = 6. Construiremos inicialmente uma tabela com 9 colunas e 8 linhas. i xi yi xi 2 yi 2 xiyi xi– x (xi– x) 2 yi– y (yi– y) 2 1 5 48 25 2304 240 -16,667 277,7889 21,167 448,0419 2 15 43 225 1849 645 -6,667 44,4489 16,167 261,3719 3 20 34 400 1156 680 -1,667 2,7789 7,167 51,3659 4 25 19 625 361 475 3,333 11,1089 -7,833 61,3559 5 30 11 900 121 330 8,333 69,4389 -15,833 250,6839 6 35 6 1225 36 210 13,333 177,7689 -20,833 434,0139 � 130 161 3400 5827 2580 583,3334 1506,8334 x Sx= = − =130 6 583 333 6 1 10 8012 , , y Sy= = − =161 6 15 8334 6 1 17 3599 , , ; Ky = − = −0 969 17 3599 10 8012 1557, . , , , Substituindo na equação da regressão: y=–1,557xi+(26,883-(-1,557).21,667) y=–1,557xi+60,568 63 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 A figura a seguir ilustra o diagrama de dispersão e a reta traçada pela equação da regressão linear. 60 50 40 30 20 10 0 y x 0 5 10 15 20 25 30 35 40 10 ESTIMATIVA DE PARÂMETROS 10.1 Definições Podemos definir em estatística os parâmetros de média e desvio padrão para amostra (x, S) e também para população (µ, σ), sendo que a média da população é a média das médias das amostras e o desvio padrão da população pode ser considerado como igual ao desvio padrão da amostra multiplicado pela raiz quadrada do número de dados amostrais n, σ = S n. . O desvio padrão da distribuição amostral das médias das amostras é denominado erro padrão da média (E). 10.2 Teorema do Limite Central Quando são retiradas amostras com 30 ou mais elementos de uma população qualquer, a distribuição amostral das médias das amostras se comportam aproximadamente a uma distribuição Normal, mesmo que os dados da amostra não sejam normalmente distribuídos. 64 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 10.3 Estimação Pontual É uma estimativa de um único valor para um parâmetro populacional, como a média da amostra, por exemplo. 10.4 Estimativa por Intervalos É uma estimativa em que um parâmetro populacional possa variar de um valor z para mais ou para menos. Por exemplo: média – z < média < média + z 10.5 Intervalo de Confiança para Médias (amostras grandes, n>30) Um intervalo de confiança c para uma média populacional µ é dado por x E x E− < < +µ onde E pode ser calculado pela fórmula E Z nc = . σ Nota: quando temos amostras grandes (n>30), o desvio padrão amostral S pode ser usado no lugar do desvio padrão populacional, ao passo que zc pode ser retirado da tabela de Distribuição Normal a seguir. 10.6 Tabela Normal Área sob a curva Normal Padrão 0 z 65 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Segunda casa decimal de Z Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.36211.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993 3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995 3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997 3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998 3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 66 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Exemplo: Uma amostra aleatória de 49 resistores retirados de uma população aproximadamente normal forneceu uma resistência média de 20Ω e um desvio padrão de 1,5Ω. Construa um intervalo de 90% de confiança para a média dessa população. Resolução: C=95% = 0,95 Ω c 2 = 0,475 (corresponde na curva normal à região escura) n = 49 S = 1,5 x = 20 Da tabela, encontramos zc= 1,96. Substituindo na fórmula do erro, teremos: E = = =196 15 49 0 4199 0 42, . , , , 20 – 0,42 < µ <20 + 0,42 19,58 < µ <20,42 Resposta: Com 95% de confiança, podemos dizer que a média populacional dos resistores escolhidos está entre 19,58Ω e 20,42Ω. 10.7 Intervalos de Confiança para Médias (amostras pequenas, n<30) O erro pode ser calculado da mesma forma, com a diferença apenas que o desvio padrão Σ deve ser conhecido. 67 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Se a população for normalmente distribuída e a amostra tiver menos de 30 elementos, construímos um intervalo de confiança para a média e utilizamos a distribuição t de Student, sendo que: t x s n = − µ Propriedades da Curva t de Student: • A curva tem a forma de um sino; • A área total ob a curva é igual a 1; • A curva é simétrica em relação à média; • A distribuição t é uma família de curvas e cada uma delas depende de um parâmetro denominado Grau de Liberdade. Quando usamos a distribuição t para estimar a média populacional, o número de grau de liberdade é igual ao tamanho da amostra menos 1 (gl = n – 1). Exemplo: em uma amostra de 20 elementos temos gl = 19. Para encontrarmos um intervalo de confiança para a média populacional de amostras pequenas devemos encontrar primeiramente o erro máximo, que é calculado pela fórmula: E t S nc = . , onde tc pode ser retirado da tabela t-Studet a seguir: 68 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 10.8 Tabela t-Student “�”Unilateral 0,25 0,10 0,05 0,025 0,01 0,005 “�”Bilateral 0,50 0,20 0,10 0,05 0,02 0,01 C -> 0,50 0,80 0,90 0,95 0,98 0,99 g.l. 1 1,000 3,078 6,314 12,706 31,821 63,657 2 0,816 1,886 2,920 4,303 6,965 9,925 3 0,765 1,638 2,353 3,182 4,541 5,841 4 0,741 1,533 2,132 2,776 3,747 4,604 5 0,727 1,476 2,015 2,571 3,365 4,032 6 0,718 1,440 1,943 2,447 3,143 3,707 7 0,711 1,415 1,895 2,365 2,998 3,499 8 0,706 1,397 1,860 2,306 2,896 3,355 9 0,703 1,383 1,833 2,262 2,821 3,250 10 0,700 1,372 1,812 2,228 2,764 3,169 11 0,697 1,363 1,796 2,201 2,718 3,106 12 0,695 1,356 1,782 2,179 2,681 3,055 13 0,694 1,350 1,771 2,160 2,650 3,012 14 0,692 1,345 1,761 2,145 2,624 2,977 15 0,691 1,341 1,753 2,131 2,602 2,947 16 0,690 1,337 1,746 2,120 2,583 2,921 17 0,689 1,333 1,740 2,110 2,567 2,898 18 0,688 1,330 1,734 2,101 2,552 2,878 19 0,688 1,328 1,729 2,093 2,539 2,861 20 0,687 1,325 1,725 2,086 2,528 2,845 21 0,686 1,323 1,721 2,080 2,518 2,831 22 0,686 1,321 1,717 2,074 2,508 2,819 23 0,685 1,319 1,714 2,069 2,500 2,807 24 0,685 1,318 1,711 2,064 2,492 2,797 25 0,684 1,316 1,708 2,060 2,485 2,787 26 0,684 1,315 1,706 2,056 2,479 2,779 27 0,684 1,314 1,703 2,052 2,473 2,771 28 0,683 1,313 1,701 2,048 2,467 2,763 ∞ 0,674 1,282 1,645 1,960 2,326 2,576 69 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Exemplo: Encontrar o valor de tc na tabela para uma amostra de 15 elementos, com nível de confiança de 90%. Resolução: N=15 . gl=14 c = 90% = 0,90 Da tabela tiramos o valor 1,761 10.9 Intervalo de Confiança para Variância e Desvio Padrão Podemos controlar o tamanho da variabilidade de um processo, para o qual usamos a distribuição “qui quadrado” (X2). Se uma variável aleatória tiver uma distribuição normal, então formará uma distribuição qui quadrado para qualquer n>1, sendo que X n S2 2 2 1= −( ) σ Propriedades: • A distribuição qui-quadrado é uma família de curvas definidas, cada uma pelo grau de liberdade. • Ao estimarmos a variância populacional com o teste do qui-quadado, sempre usaremos o grau de liberdade sendo o tamanho da amostra menos um (gl = n – 1). • A área sob cada curva sempre será igual a um. 70 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Para encontrarmos o intervalo de confiança para variância, iniciaremos determinando os parâmetros α1 e α2, ou seja: α1 1 2 = − c e α2 1 2 = + c ; Daí, com o gl calculado, encontramos Xα1 2 e Xα2 2 Exemplo: Encontrar Xα1 2 e Xα2 2 para um amostra de 30 elementos com 80% de confiança. Resolução: n = 30 → gl = 30 – 1 = 29 α1 1 0 8 2 0 1= − =, , α2 1 0 8 2 0 9= + =, , Na tabela a seguir encontraremos os valores Xα1 2 39 087= , Xα2 2 19 768= , 71 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 10.10 Tabela da distribuição qui-quadrado g.l. Α 0,995 0,990 0,975 0,950 0,900 0,100 0,050 0,025 0,010 0,005 1 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879 2 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597 3 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,34512,838 4 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860 5 0,412 0,554 0,831 1,145 1,610 9,236 11,071 12,833 15,086 16,750 6 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548 7 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278 8 1,344 1,646 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955 9 1,735 2,088 2,700 3 325 4,168 14,684 16,919 19,023 21,666 23,589 10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188 11 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757 12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,299 13 3,565 4,107 5,009 5,892 7,042 19,812 22,362 24,736 27,688 29,819 14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,139 15 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,448 30,578 32,801 16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267 17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718 18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156 19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582 20 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997 21 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401 22 8,643 9,542 10,982 12,338 14,042 30,813 33,924 36,781 40,289 42,796 23 9,262 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181 24 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,559 25 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928 26 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290 27 11,808 12,879 14,573 16,151 18,114 36,741 40,113 43,194 46,963 49,645 28 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,993 29 13,121 14,257 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,336 30 13,787 14,954 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672 40 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766 50 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490 60 35,534 37,485 40,482 43,188 46,459 74,397 79,082 83,298 88,379 91,952 70 43,275 45,442 48,758 51,739 55,329 85,527 90,531 95,023 100,425 104,215 80 51,172 53,540 57,153 60,391 64,278 96,578 101,879 106,629 112,329 116,321 90 59,196 61,754 65,647 69,126 73,291 107,565 113,145 118,136 124,116 128,299 100 67,328 70,065 74,222 77,929 82,358 118,498 124,342 129,561 135,807 140,169 72 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Uma vez encontrado os valores de Xα1 2 e Xα2 2 , podemos determinar: O intervalo de confiança para a variância populacional σ2: ( ). ( ).n S X n S X − < < −1 1 2 1 2 2 2 2 2 α α α e o intervalo de confiança para o desvio padrão populacional σ: ( ). ( ).n S X n S X − < < −1 1 2 1 2 2 2 2 α α α Exemplo: Uma amostra de 20 elemento, extraídos de uma população com distribuição normal, forneceu variância = 8,01. Determinar o intervalo de confiança para variância e para desvio padrão com 90% de confiança. Resolução: Xα2 2 10 117= , O intervalo com 90% de confiança para variância populacional ( ). , , ( ). , , 20 1 8 01 30 144 20 1 8 01 10 117 2− < < −α 5 0487 15 04292, ,< <α O intervalo com 90% de confiança para desvio padrão populacional 73 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 ( ). , , ( ). , , 20 1 8 01 30 144 20 1 8 01 10 117 − < < −α 2,2469 < α < 3,8785 11 TESTE DE HIPÓTESE 11.1 Conceitos O teste de hipótese é usado para resolver problemas estatísticos em que possamos aceitar ou rejeitar uma determinada afirmação sobre um determinado parâmetro. Podemos usar o teste de hipótese para comprovar se a autonomia da bateria de um computador tem a duração determinada pelo fabricante, ou se o consumidor está sendo prejudicado. O teste consiste em analisar duas hipóteses; hipótese nula, representada por Ho, e hipótese alternativa Ha. Definiremos hipótese nula Ho como a hipótese a ser testada, e hipótese alternativa Ha como a hipótese alternativa à hipótese nula, caso seja rejeitada. Exemplo: As garrafas de água mineral têm em média o volume de 500 ml. Podemos usar esse dado como um hipótese nula, ao passo que a hipótese alternativa poderia ser que o volume de cada garrafa é diferente de 500 ml. Podemos indicar por: Ho: µ=500 (nessa situação, o volume está correto) Ha: µ≠500 (nessa situação, o volume não está correto) Daí, H0: µ= µ0 74 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 11.2 Definições Para a hipótese alternativa, ficamos com três possibilidades: Ha : µ≠µ0 → nestas condições podemos entender que a média da população poderá ser maior ou menor que a média µ0. Chamaremos de teste bilateral. Ha : µ < µ0 → nestas condições podemos entender que a média da população é menor que o valor pré-determinado µ0. Chamaremos de teste unilateral à esquerda. Ha : µ > µ0 → nestas condições podemos entender que a média da população é maior que o valor pré-determinado µ0. Chamaremos de teste unilateral à direita. Uma vez definidas as duas hipóteses, nula ou alternativa, escolheremos se aceitamos H0 ou rejeitamos Ho e aceitamos Ha como verdadeira. Para entender melhor, tomemos o exemplo das garrafas de água. Peguemos uma amostra aleatória da população e façamos uma comparação com a hipótese nula. Se a média da amostra for consistente com µ0, não rejeitaremos H0. Por outro lado, se os dados a amostra não forem consistentes, rejeitamos a hipótese nula e aceitamos a hipótese alternativa como verdadeira. É fácil perceber que existe a possibilidade de fazermos a escolha errada, o que pode acontecer de duas maneiras: chamaremos de erro tipo I e erro tipo II. O erro tipo I ocorre quando rejeitamos a hipótese nula e aceitamos erradamente a hipótese alternativa, pois a nula é que era verdadeira. 75 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 11.3 Nível de Significância É a probabilidade máxima de ocorrer um erro tipo I. Geralmente é representada pela letra α e especificada antes de retirarmos uma amostra, de modo que os resultados não influenciem a escolha. Na prática, é mais comum a escolha do nível de significância 5% ou 1%, porém que possam ser usados outros valores. Ao usarmos um nível de significância α=5%=0,05, por exemplo, devemos entender que essa é a probabilidade de rejeitarmos a hipótese nula, quando deveria ser aceita. Em outras palavras, temos uma confiança de 95% de que a decisão foi tomada corretamente. A tabela a seguir indica alguns valores mais usuais do nível de significância. α 0,100 0,050 0,025 0,010 0,005 zα z0,10 z0,50 z0,025 z0,010 z0,005 Valores críticos de zα 1,280 1,645 1,960 2,333 2,575 11.4 Teste de Hipótese para Média de População 11.4.1 Grandes Amostras (n>30) Roteiro para efetuar o teste de hipótese: 1. Escrever as hipóteses nula e alternativa; 2. Definir o nível de significância α (geralmente fornecido); 3. Determinar o(s) valor (res) crítico (s) zα; 3.1 Teste bilateral, usar ±tα2 ; 76 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 3.2 Teste unilateral à esquerda, usar –zα; 3.3 Teste unilateral à direita, usar +zα; 3.4 Usar a tabela de distribuição z, normal padrão; 4. Calcular o valor estatístico do teste, usando a fórmula z x S n = − µ0 ; 5.Se o valor de encontrado no item anterior cair na região de rejeição, então rejeita-se Ho; caso contrário, não rejeita-se H0; 6. Dê a sua conclusão. Exemplo: Supondo uma amostra aleatória de 50 garrafas de água mineral de 500 ml, obtivemos uma média de volume de 498,42ml e um desvio padrão de 2.55ml. Podemos afirmar com nível de significância 1% que a máquina que produz as garrafas está desregulada? Resolução: As hipóteses para o teste podem ser definidas como um teste bilateral: H0: µ=500 Ha: µ≠500 Para realizarmos o teste, basta verificarmos se a média é 500 ml, o que nos faz aceitar Ho. Porém a média das 50 garrafas difere de 500ml, o que é normal, porém o que precisamos decidir 77 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 é se a diferença µ – x = 500 – 498,42 = 1,58ml é um erro de amostragem ou se a diferença é grande o suficiente para indicar que a média da população não é 500 ml. O nível de significância é 1%, logo temos que α = 0,01. Os valores críticos para o teste são ± = ± = ±zα2 0 05 2 575, , Cálculo estatístico z = − = −498 42 500 00 158 50 7 071 , , , , α/2 α/2 rejeite HO não rejeite HO rejeite HO f(z) 0 Z O valor estatístico z=–7,071 cai dentro da região de rejeição de H0, à esquerda de −zα 2 . Conclusão: os dados são suficientes para concluirmos que a máquina está desregulada. 11.4.2 Pequenas Amostras (n<30) Como já estudamos anteriormente, se uma amostra de uma população for considerada pequena, ou seja, se n < 30, porém 78 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 essa população se comporta normalmente distribuída, com média µ, as probabilidades para as vaiáveis aleatórias são iguais às áreas sob a curva. Roteiro para efetuar o teste de hipótese: 1. Escrever as hipóteses nula e alternativa; 2. Definir o nível de significância α (geralmente fornecido); 3. Determinar o(s) valor (res) crítico (s) tα; 3.1 Teste bilateral, usar ±tα2 ; 3.2 Teste unilateral à esquerda, usar –tα; 3.3 Teste unilateral à direita, usar +tα; 3.4 Usar a tabela de distribuição t, com GL = n – 1; 4. Calcular o valor estatístico do teste, usando a fórmula t x S n = − µ0 ; 5. Se o valor de t encontrado no item anterior cair na região de rejeição, então rejeita-se Ho; caso contrário, não rejeita-se H0; 6. Dê a sua conclusão. Exemplo: Suponhamos que no ano de 2009 tenha sido feito um estudo sobre o consumo de suprimentos de informática e chegado à conclusão de que o gasto médio de todas as famílias de uma cidade de porte médio foi de R$ 1300,00. 79 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 Na mesma pesquisa, foram selecionadas 15 famílias de classe média, obtendo os valores de gastos como mostra a tabela a seguir. Podemos dizer, com um nível de significância de 5%, que as famílias de classe média gastam, em média, mais do que a média da região? Considere que a distribuição de consumo de suprimentos de informática seja normalmente distribuída. 1254 1615 1711 1350 1521 1293 1227 908 1205 1154 1231 1351 1790 1369 1185 Desta tabela encontramos a média x=1344,27 e o desvio padrão S=231. Solução: 1. H0: µ <1200 (as famílias não gastam mais que a média da cidade); Ha: µ > 1200 (as famílias gastam mais que a média da cidade); 2. Nível de significância α=5%=0,05; 3. Como o Teste é unilateral à direita, encontraremos tα=t0,05, com GL=20 – 1 = 19. Da tabela t-Student, encontramos t0,05=1,729; 4. Cálculo do valor estatístico do teste t = − = =1344 27 1300 231 15 44 27 59 655 0 7421 , , , , ; 5. Comparando os valores, notamos que t<t0,05, logo o teste cai dentro da região H0; 80 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 6. Podemos concluir que, pelos dados da amostras, as famílias de classe média gastam menos que a média da cidade. Aceitamos H0 como verdadeiro. Referências bibliográficas CRESPO, Antonio Arnot. Estatística fácil. São Paulo: Saraiva, 2007. DANTE, Luiz Roberto. Matemática – contexto e aplicação volume único. São Paulo: Ática, 2007. IEZZI, Gelson; HASSAN, Samuel; DEGENSZAJN, David. Fundamentos de matemática elementar volume 11 - matemática comercial, matemática financeira e estatística descritiva. São Paulo: Atual, 2005. 81 ESTATÍSTICA E PROBABILIDADE Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11 82 Unidade II Re vi sã o: A ile en - D ia gr am aç ão : M ár ci o - 10 /0 2/ 11
Compartilhar