Baixe o app para aproveitar ainda mais
Prévia do material em texto
PROBABILIDADE UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATÍSTICA DOCENTE: Mariana Oliveira Cedraz Preliminares Nas aulas anteriores, vimos como caracterizar um conjunto de dados. Nas próximas aulas será apresentada a teoria matemática que dá a base teórica para o desenvolvimento de técnicas estatísticas. Preliminares Para se aprender estatística, é necessário um bom entendimento do conceito de probabilidade. O termo probabilidade refere-se ao estudo da aleatoriedade e da incerteza. Preliminares A probabilidade se faz presente no dia-a-dia de maneira informal em vários contextos escritos ou falados, por exemplo: “É provável que a média Dow-Jones cresça no final do ano”; “Há 50% de chance do titular buscar a reeleição”; “As chances favorecem um acordo rápido para o fim da greve”; “Espera-se que pelo menos 20 mil ingressos sejam vendidos para o show”. Probabilidade Os fenômenos que iremos estudar podem ser de duas naturezas. • Experimentos Determinísticos; • Experimentos Aleatórios (ou não determinísticos). Probabilidade Experimentos Determinísticos: Por essa expressão pretendemos nos referir a um modelo que estipule que as condições sob as quais um experimento seja executado determinem o resultado do experimento. Por exemplo, vamos supor que irá ser selecionada uma pessoa aleatoriamente em uma turma de mulheres, e vamos observar o sexo da pessoa escolhida. Qual é sexo da pessoa escolhida? Se repetirmos esse experimento varias vezes sob as mesmas condições, saberemos do resultado antes que ele seja executado? F = m.a Probabilidade Experimentos Aleatórios ou não determinísticos: São experimentos que ao serem repetidos nas mesmas condições não produzem sempre o mesmo resultado, ou seja, exibem variação nos seus resultados. Embora não sejamos capazes de afirmar qual o particular resultado deste experimento, poderemos descrever o conjunto de todo os seus possíveis resultados. Probabilidade Exemplo 1. Considere alguns exemplos de experimentos aleatórios, denotados aqui por ε. •ε1: Número de itens defeituosos em uma linha de produção em um período de 24 horas; •ε2: Ocorrência ou não de hipertensão em um paciente; •ε3: A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes; •ε4: Lançamento de um moeda até que apareça cara pela primeira vez. Probabilidade ESPAÇO AMOSTRAL: Denotado por S ou Ω, é definido como o conjunto de todos os possíveis resultados de um experimento aleatório. Exemplo 2. Consideramos a seguir o espaço amostral associado a cada um dos experimentos citados no exemplo 1. •Ocorrência ou não de hipertensão em um paciente; Ω3 = { sim , não } • Número de itens defeituosos em uma linha de produção em um período de 24 horas; Ω2 = {0, 1, ..., n}; sendo n o número máximo de itens produzidos em 1 dia. Probabilidade • A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes; Ω4 = {cccc, ccck, cckc, ckcc, kccc, kkkk, kkkc, kkck, kckk, ckkk, cckk, ckck, kckc, kkcc, ckkc, kcck} • Lançamento de um moeda até que apareça cara pela primeira vez. Ω5 = {c, kc, kkc, kkkc, kkkkc, ...} Probabilidade EVENTO: É um subconjunto de um espaço amostral. Exemplo 3. Os eventos Ai a seguir referem-se aos espaços amostrais dados no exemplo 2. • Número de itens defeituosos em uma linha de produção em um período de 24 horas; A2 = {“ menos de 5 itens defeituosos ”} A2 = { 0, 1, 2, 3, 4 }; •Ocorrência ou não de hipertensão em um paciente; A3 = {“ individuo hipertenso ”} A3 = { sim }; Probabilidade • A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes; A4 = {“ somente caras ”} A4 = { cccc }; • Lançamento de um moeda até que apareça cara pela primeira vez. A5 = {“ apareça cara em até 3 lançamentos ”} A5 = { c, kc, kkc }. Também são eventos: O próprio Ω, o conjunto vazio Ø, ou qualquer resultado individual de Ω. Podemos usar as propriedades de conjuntos para combinar e obter novos eventos como mostram as propriedades a seguir. Probabilidade Propriedades: Sejam A, B e Ai , i = 1, 2, ..., n, eventos. 1. A B representa o evento em que A OU B (ou ambos) ocorrem; 2. A ∩ B representa o evento em que A E B ocorrem; 3. Ā representa o evento em que A não ocorre; 4. representa o evento em que ao menos um dos Ai ocorre; 5. representa o evento em todos os Ai ocorrem. Propriedades: Sejam A, B e Ai , i = 1, 2, ..., n, eventos. 1. A B representa o evento em que A OU B (ou ambos) ocorrem; 2. A ∩ B representa o evento em que A E B ocorrem; 3. Ā representa o evento em que A não ocorre; 4. representa o evento em que ao menos um dos Ai ocorre; 5. representa o evento em todos os Ai ocorrem. n i iA 1 n i iA 1 A Ā BA A B Probabilidade EVENTOS DISJUNTOS OU EXCLUDENTES: Dois eventos A e B são disjuntos, ou mutuamente excludentes, se não podem ocorrer simultaneamente, ou seja, A ∩ B =Ø. Exemplo 4: Considere os seguintes eventos: A = {1, 2, 3} B = {3, 4, 5} C = {5, 6, 7} Calcule: a) A B b) A B c) A C Probabilidade Exemplo 5. Considere um experimento feito para avaliar a durabilidade de uma lâmpada. O espaço amostral associado é Ω = {t; t ≥ 0}. Sejam A, B e C os eventos: A = {t; t < 100}, B = {t; 50 ≤ t ≤ 200} e C = {t; t > 150}. Obtenha: a) A U B = {t; t ≤ 200}. b) A ∩ B = {t; 50 ≤ t < 100}. c) A ∩ C = Ø. (A e B são disjuntos) d) Ā = {t; t ≥ 100}. Probabilidade EVENTO EXPAÇO AMOSTRAL = Conjunto de todos os possíveis resultados de um experimento aleatório. Probabilidade ABORDAGEM CLÁSSICA: Seja Ω um espaço amostral finito, formado por n eventos elementares, igualmente prováveis (equiprováveis). Seja A um evento de Ω com m destes elementos. Então a probabilidade de A é a fração, º ( ) º n de pontos de favoráveis a A P A n de pontos de Probabilidade Exemplo 6. Considere o lançamento de um dado “honesto”. Queremos obter a probabilidade da ocorrência de um número par. O espaço amostral associado é Ω = {1, 2, 3, 4, 5, 6}. Se definirmos A = {“número par”} = {2, 4, 6}, a probabilidade deste evento é dada por: P(A) = 3/6 = 1/2. Probabilidade Exemplo 7. Considere o lançamento de duas moedas. Queremos saber a probabilidade do evento A = {“duas caras”}. Considere o espaço amostral Ω1 = {“duas caras”, “duas coroas”, “uma cara e uma coroa”}. Se usamos a definição acima com este espaço amostral, diríamos que P(A) = 1/3. Esta resposta é falsa, pois os elementos de Ω1 não são equiprováveis. O espaço amostral equiprovável seria Ω = {cc, ck, kc, kk} e como A = {cc} temos que P(A) = 1/4. Probabilidade Suponha que lançamos um dado conhecido por favorecer a ocorrência do número 3. • Os 6 eventos elementares do espaço amostral são igualmente prováveis? NÃO !!! • Qual a probabilidade da ocorrência do número 1? A definição clássica não nos ajuda neste caso. Limitações da definição clássica: Só se aplica a espaços amostrais finito e equiprováveis, levaram a considerar outra forma de calcular probabilidade de um evento partindo da frequência relativa do evento ao se repetir o experimento, n vezes, sob as mesmas condições. Probabilidade ABORDAGEM FREQUENTISTA: Podemos definir P(A) como o limite da frequência relativa da ocorrência de A em n repetições independentes de um experimento, com n tendendo ao infinito, ou seja, se n(A) é o número de vezes em que o evento A ocorreu nas n repetições independentes de um experimento, dizemos então que Na prática a probabilidade de A é aproximada pela frequência relativa do evento emum certo número de repetições com um erro desprezível. ( ) ( ) lim n n A P A n Probabilidade Conde de Buffon, realizou 4040 lançamentos de uma moeda e observou a ocorrência de 2048 caras, obtendo uma frequência relativa de 0,5064. No início do século passado, por volta de 1900, o inglês Karl Pearson realizou 24000 lançamentos de moedas, obtendo 12012 caras e uma frequência relativa de 0,5005. A abordagem frequentista da probabilidade é bastante utilizada por estatísticos aplicados e demais profissionais que trabalham com dados em geral. Probabilidade Exemplo 8. Considere uma certa moeda cuja probabilidade de ocorrência de “cara” é desconhecida. Para se obter essa probabilidade, esta moeda é submetida a n repetições independentes de cada lançamento em um software estatístico. A Tabela 1 e a Figura 1 a seguir mostram os resultados obtidos. Número de lançamentos F r e q u ê n c ia r e la ti v a d o e v e n to Figura 1: Frequência relativa de “cara” n 10 100 200 300 ... 1600 1800 2000 2300 2600 F(A) 0,800 0,520 0,595 0,5000 ... 0,506 0,509 0,501 0,496 0,499 Tabela 1: Frequência relativa de “cara” Probabilidade ABORDAGEM AXIOMÁTICA: Seja ε um experimento aleatório e Ω o espaço amostral associado a este experimento. Associamos a cada evento A , um número real representado por P(A) e denominado “probabilidade de A”, satisfazendo as seguintes condições: 1. 0 ≤ P(A) ≤ 1; 2. P(Ω) = 1; 3. P(AUB) = P(A) + P(B), se A∩B=Ø 4. Se A1, A2, ..., forem eventos excludentes, isto é, (Ai∩Aj)=Ø, , então 1 2 1 2 11 ( ) ( ) ( )i i ii P A A P A P A P A P A i j A Probabilidade PRINCIPAIS CONSEQUÊNCIAS DA ABORDAGEM AXIOMÁTICA. 1. P(Ø) = 0 2. P( A ) = 1 – P(A) 3. Se A e B são dois eventos quaisquer então: 4. Se A, B e C são eventos quaisquer então: 5. Se então P(A) P(B) ( ) ( ) ( ) ( )P A B P A P B P A B ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) P A B C P A P B P C P A B P A C P B C P A B C A B Probabilidade Exemplo 9: Observou-se em dois estacionamentos de uma cidade 13 carros pretos e 37 vermelhos. Dos pretos, 5 são do estacionamento A e dos vermelhos 21 são do estacionamento A. Os resultados estão na tabela a seguir: Seleciona-se carros aleatoriamente, pergunta-se: a) Qual a probabilidade de um carro ser preto? b) Qual a probabilidade do carro ser vermelho? c) Qual a probabilidade do carro ser vermelho ou do estacionamento A? d) Qual a probabilidade do carro ser preto ou do estacionamento B? Carros Estacionamento A Estacionamento B Total Preto 5 8 13 Vermelho 21 16 37 Total 26 24 50 Probabilidade Condicional Em muitas situações práticas, o fenômeno aleatório com o qual trabalhamos pode ser separado em etapas. A informação do que ocorreu em uma determinada etapa pode influenciar nas probabilidades de ocorrência das etapas sucessivas. Nesse caso podemos “recalcular” as probabilidades de interesse. Essas probabilidades “recalculadas” recebem o nome de probabilidade condicional, cuja definição apresentamos a seguir. Probabilidade Condicional Podemos estar interessados em responder a seguinte pergunta: Considere o exemplo aseguir: Verificou-se que o carro escolhido é vermelho, qual a probabilidade desse carro ser do estacionamento A ? P(do carro ser do estacionamento A dada informação que ele é vermelho) = Carros Estacionamento A Estacionamento B Total P 5 8 13 V 21 16 37 Total 26 24 50 n de carros do estacionamento A dentre os vermelhos n total de carros vermelhos Probabilidade Condicional De maneira geral para dois eventos quaisquer A e B, sendo P(B) > 0, definimos a probabilidade condicional de A, dado que ocorreu o evento B, denotado por P(A|B), como sendo: Então o exemplo pode ser resolvido da seguinte forma. Considere os seguintes eventos: Evento A: O carro é do estacionamento A . Evento B: O carro é vermelho. ( ) ( | ) . ( ) P A B P A B P B 21 2150( | ) 0,567 37 37 50 P A B Probabilidade Condicional Exemplo 2: No curso de Ed. Física homens e mulheres praticam duas modalidades esportivas, ou vôlei ou futebol. Quarenta pessoas praticam vôlei, enquanto trinta pessoas praticam futebol. Sendo que, dos que praticam vôlei, 21 pessoas são mulheres e que praticam futebol, 12 pessoas são mulheres. Pergunta-se: a) Qual a probabilidade da pessoa ser mulher? b) Qual a probabilidade da pessoa ser mulher ou da pessoa praticar futebol? c) Dado que a pessoa é mulher qual a probabilidade dela praticar vôlei? Sexo/Modalidade Vôlei Futebol Total Homens 19 18 37 Mulheres 21 12 33 Total 40 30 70 Probabilidade Condicional Solução: Eventos A: Praticar vôlei. B: Praticar futebol. H: A pessoa é homem. M: A pessoa é mulher. Probabilidade Condicional Solução: a) b) c) 33 ( ) 0,4714 70 P M ( ) ( ) ( ) ( ) 33 30 12 ( ) 70 70 70 51 ( ) 0,7286 50 P M B P M P B P M B P M B P M B 21 ( ) 2170 ( | ) 0,6364( | ) 33( ) 33 70 P A M A M P A MP P M Probabilidade Condicional Propriedades:1) 0 ( | ) 1 2) ( | ) 1 3) , ( | ) ( | ) ( | ) P A B P A Se A B P A B C P A C P B C Independência Se as probabilidades condicionais representam atualizações na avaliação de riscos, independência significa que saber se B ocorreu não altera a avaliação de riscos de A, ou seja, um evento é independente quando a sua ocorrência não afeta a de outro e vice-versa. Dizemos que o evento A é independente do evento B se: Se A é independente B, então: OBS: Se A é independente de B, então B é independente de A. . ( | ) ( ), ( ) 0P A B P A P B ( ) ( ) ( ) ( ). ( ) ( ) P A B P A P A B P A P B P B Independência Exemplo: Os dados de uma empresa, referentes a participação dos funcionários em planos de aposentadoria, vejamos a tabela a seguir: Verifique se os eventos Plano da empresa (E) e plano pessoal (P) são independentes. Plano Pessoal Total Sim Não Plano da empresa Sim 200 200 400 Não 0 100 100 Total 200 300 500 Independência Solução: Resposta: Como a probabilidade da interseção entre os eventos “P” e “E” não pode ser decomposta no produto das probabilidades, então os eventos não são independentes. 2 ( ) 5 4 ( ) 5 2 ( ) 5 ( ) ( ). ( ) P P P E P P E P P E P P P E Teorema de Bayes Exemplo: Em uma linha de produção de uma certa fábrica, determinada peça é produzida em duas máquinas. A máquina 1, mais antiga, é responsável por 35% da produção e os 65% restantes vêm da máquina 2. A partir dos dados passados e das informações do fabricante das máquinas, estima-se em 5% a proporção de peças defeituosas produzidas pela máquina 1 e em 2,5% a proporção de defeituosas produzidas pela máquina 2. As peças produzidas pelas duas máquinas seguem para o departamento de armazenamento e embalagem, para venda posterior, sem distinção de qual máquina a produziu. 1. Qual é a proporção de peças defeituosas colocadas no mercado por essa fábrica? 2. Se um cliente identifica uma peça defeituosa, qual é a probabilidade de que ela tenha sido produzida pela máquina 2? Teorema de Bayes Partindo do conceito de probabilidade condicional temos, Agora Considerando o segundo e o último termo na expressão anterior podemos escrever: Esse é um resultado útil que nos capacita a resolver P(A|B) em termos de P(B|A). () ( | ). ( ) ( ) ( | ). ( )P A B P A B P B P B A P B A P A ( | ). ( ) ( | ) , para ( ) 0 ( ) P B A P A P A B P B P B ( ) ( | ) . ( ) P A B P A B P B Teorema de Bayes Solução: M1: A peça é produzida pela máquina 1. M2: A peça é produzida pela máquina 2. D: A peça é defeituosa. 1 2 ( ) 0,35 ( ) 0,65 P M P M 1 2 ( | ) 0,05 ( | ) 0,025 P D M P D M 1 2 1 2 1 2 1 1 2 2 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( | ) ( ) ( | ) ( ) 0,35 0,05 0,65 0,025 ( ) 0,03375 D D M D M P D P D M P D M P D P D M P D M P D P M P D M P M P D M P D P D Teorema de Bayes Note que a probabilidade de uma peça ser defeituosa é uma média ponderada das probabilidades de defeito em cada máquina; os pesos são definidos de acordo com o nível de produção de cada máquina. Na segunda parte do exemplo, temos uma informação sobre a peça: ela é defeituosa, ou seja, sabemos que ocorreu o evento D. O que o problema pede é que, com essa informação, reavaliemos a probabilidade de a peça ter sido produzida pela máquina 2. Essa probabilidade é chamada probabilidade a posteriori, ou seja, é a probabilidade que calculamos depois de realizado o experimento de sorteio e teste da peça. Em notação matemática, temos que calcular . Por definição, temos: 2( | )P M D 2 2 2 ( | ). ( ) ( | ) ( ) P D M P M P M D P D Teorema de Bayes Solução: Comparando os resultados: sem qualquer informação sobre o resultado do experimento, nossa estimativa para a probabilidade de ocorrência de M2−peça ser produzida pela máquina 2 − era 0,65; com a informação de que a peça é defeituosa, a probabilidade de ter sido produzida pela máquina 2 diminui para 0,4815 2 2 2 2 2 ( | ). ( ) ( | ) ( ) 0,65 0,025 ( | ) 0,35 0,05 0,65 0,025 0,01625 ( | ) 0,4815 0,03375 P M D P M P M D P D P M D P M D Teorema de Bayes Exercício: Certo professor 4/5 das vezes vai trabalhar usando um fusca e nas demais vezes usa um carro importado. Quando ele usa o fusca, 75% das vezes ele chega em casa antes das 23 horas e quando usa o carro importado só chega em casa antes das 23 horas em 60% das vezes. Ontem o professor chegou em casa após às 23 horas. Qual a probabilidade de que ele, no dia de ontem, tenha usado o fusca? Teorema de Bayes Solução: B1: Usar o fusca B2: Usar carro importado A: Chegar em casa após 23 horas P(B1) = 4/5 =0,80 P(B2) = 1/5 =0,20 P( A | B1) = 1 - 0,75 =0,25 P( A | B2) = 1 - 0,60 =0,40 P (B1 | A)= P (B1) . P( A | B1) / P (B1) . P( A | B1) + P (B2) . P( A | B2) P (B1 | A)= 0,80 x 0,25 /(0,80 x 0,25) + (0,20 x 0,40) = P (B1 | A)= 0,20 / (0,20 + 0,08) =0,7143 ou 71,43 % Na formalização que faremos a seguir, nos ocuparemos apenas das variáveis quantitativas, contudo as variáveis qualitativas podem ser, em algumas ocasiões e com o devido cuidado, tratadas como discretas na atribuição de probabilidade. Vimos nas aulas anteriores que, utilizando uma tabela de frequências, podemos representar, sem grande perda de informação e evitando repetições, as vezes muito grande, os valores de uma variável. Analogamente, vamos formalizar, com a ajuda das Teorias das Probabilidade, o comportamento da variável na população associando a cada valor possível sua respectiva probabilidade de ocorrência. Variável Aleatória Exemplo: Em um processo de fabricação de um semicondutor, pastilhas de um lote são testadas. Cada pastilha é classificada como condutora (C) e não condutora (Ñc). O dono da fabrica deseja saber o número de pastilhas condutoras em duas retiradas. Suponha independência nas retiradas. Variável Aleatória Solução: Vamos primeiramente definir o evento. Seja o evento X definido como: X= Número de pastilhas testadas que são condutoras. Nesse caso vamos obter a seguinte tabela: Variável Aleatória Tabela 1 - Número de pastilhas condutoras Resultados Possíveis (Ω) Probabilidades Valor de X CC 1/4 2 CÑc 1/4 1 ÑcC 1/4 1 ÑcÑc 1/4 0 As variáveis aleatórias (v.a.) podem ser classificadas em discretas e contínuas. Uma v.a. discreta é aquela que assume valores inteiros e finitos, dentro de um intervalo, não podendo apresentar, entre seus possíveis valores números decimais ou não inteiros. Uma v.a. contínua, por outro lado, é aquela que pode assumir diversos valores em um intervalo de números reais. Variável Aleatória Seja X é uma v.a. discreta e x1, x2, ..., xn seus diferentes valores, a função discreta de probabilidade, ou função de probabilidade ou simplesmente FP. Definição: Função de probabilidade é a função que atribui a cada valor da variável aleatória sua probabilidade. A notação utilizada é: P(X=xi) = p(xi) = pi, i= 1, 2, ... ou ainda, Em uma função de probabilidade verifica-se 0 < pi < 1 e Variável Aleatória Tabela 3 - Distribuição de probabilidade X x1 x2 x3 .... Σ P(X=x) p1 p2 p3 .... 1 ip 1. i No exemplo anterior, percebam que X =1, irá ocorre nos eventos CÑc e ÑcC, enquanto X =2 e X = 0, tem apenas um evento associado a eles, respectivamente CC e ÑcÑc. Segue então que as probabilidades associadas aos valores de X são as seguintes: Com esse exemplo podemos ver que, para descrever um experimento aleatório é interessante que o pesquisador associe valores numéricos aos respectivos resultados. Uma variável aleatória (v.a.) pode ser caracterizada como uma variável que representa um valor único para cada resultado de um experimento. Variável Aleatória Tabela 2 - Função de distribuição do número de pastilhas condutoras X 0 1 2 Σ P(X=x) 1/4 1/2 1/4 1 Exemplo: Há uma chance de que seguros sejam compensados em uma certa seguradora. Seja X o número de riscos compensados. A probabilidade de que nenhum seguro seja compensado nessa seguradora é igual a 0,032; a de apenas um seguro ser compensado é igual 0,065; de dois seguros serem compensados é igual a 0,129; de três seguros serem compensados é igual a 0,258 e a de quatro seguros serem compensados é igual a 0,515. Baseado no exemplo anterior construa a função de probabilidade. Variável Aleatória Solução: P(X = 0) = 0,032 P(X = 1) = 0,065 P(X = 2) = 0,129 P(X = 3) = 0,258 P(X = 4) = 0,516 Variável Aleatória Tabela 4 - Distribuição de probabilidade dos bits transmitidos X 0 1 2 3 4 Σ P(X=xi) 0,032 0,065 0,129 0,258 0,516 1 Não basta, apenas, conhecer a distribuição de probabilidade de uma variável aleatória, precisamos também conhecer valores que sejam característicos dessa distribuição, por exemplo um valor que esteja no centro dessa distribuição. Para isso iremos definir o valor esperado ou valor médio de uma variável aleatória discreta. Definição: Se X é uma variável aleatória discreta, sendo x1, x2, ..., xn seus possíveis valores, então o valor esperado (ou esperança matemática ou valor médio) de X é definido como: Esperança de Variáveis Aleatória 1 ( ) ( ) n i i i E X x P X x Propriedades da esperança: 1. E(a) = a 2. E(bX) = bE(X) 3. E(X+a) = E(X)+a 4. E(a+bX) = a+bE(X) Esperança de Variáveis Aleatória Exemplo: Calcule a esperança. Vamos atribui números as possibilidades, 1 para pé direito e 0 para pé esquerdo. Utilizando a formula temos: Esperança de Variáveis Aleatória Tabela 2 - Função de distribuição do número de pastilhas condutoras X 1 0 P(X=x) 7/11 4/11 7 4 ( ) 1. 0. 0,64 11 11 E X 1 ( ) ( ) n i i i E X x P X x Exemplo: Calcule a esperança. Esperança de Variáveis Aleatória Tabela 2 - Função de distribuição do número de pastilhas condutorasX 0 1 2 P(X=x) 1/4 1/2 1/4 1 1 1 ( ) 0. 1. 2. 1 4 2 4 E X 1 ( ) ( ) n i i i E X x P X x Utilizando a formula temos: Exemplo: Calcule a esperança. Esperança de Variáveis Aleatória Tabela 4 - Distribuição de probabilidade dos bits transmitidos X 0 1 2 3 4 Σ P(X=xi) 0,032 0,065 0,129 0,258 0,516 1 ( ) 0 0,032 1 0,065 2 0,129 3 0,258 4 0,516 3,161E X 1 ( ) ( ) n i i i E X x P X x Da mesma forma que caracterizamos uma variável aleatória com relação ao centro da sua distribuição, também precisamos de um valor que caracterize a dispersão de X em torno do seu valor esperado. Para isso definimos a variância: Definição: Seja X uma variável discreta. Definimos a variância de X, denotada por V(X) ou , da seguinte maneira: Variância de Variáveis Aleatória 2 X 22 2( ) ( ) ( ) ( )V X X E X E X Propriedades da Variância: Variância de Variáveis Aleatória 2 2 1. ( ) 0 2. ( ) ( ) 3. ( ) ( ) 4. ( ) ( ) V X V X a V X V bX b V X V a bX b V X Exercício calcule a variância dos exemplos anteriores. Variância de Variáveis Aleatória Função de distribuição acumulada: A função de distribuição de probabilidade ou função acumulada de probabilidade de uma v.a. discreta X é definida para qualquer número real x, pela seguinte expressão: Exemplo: Considere novamente o exemplo 2. Suponha que quatro bits foram observados aleatoriamente, qual a probabilidade de dois bits serem transmitidos com erro? Variável Aleatória ( ) ( )F x P X x Solução: Ao observar a distribuição de probabilidade dessa variável fica fácil responder essa pergunta. Verifica-se que a probabilidade de dois bits serem transmitidos com erro é igual a 0,129. Agora vamos supor que queremos verificar a probabilidade de até dois serem transmitidos com erro. É preciso obter a função de distribuição acumulada no ponto 2. Função de Distribuição Acumulada Tabela 4 - Distribuição de probabilidade dos bits transmitidos X 0 1 2 3 4 Σ P(X=xi) 0,032 0,065 0,129 0,258 0,516 1 Solução: Função de Distribuição Acumulada ( ) ( ) (2) ( 2) ( 0) ( 1) ( 2) (2) ( 2) 0,032 0,065 0,129 F x P X x F P X P X P X P X F P X Os valores completos da distribuição são: Como exercício calcule a distribuição acumulada do exemplo 1. Função de Distribuição Acumulada Quando o conjunto dos possíveis valores de uma v.a X é não enumerável, ou seja um intervalo, dizemos que X é uma v.a. contínua. Ao invés de atribuirmos probabilidades aos valores possíveis da variável, como ocorre com as v.a. discretas, aqui se atribui probabilidades aos intervalos, por meio de uma função f(x) (função densidade de probabilidade). A função f(x) é chamada de função densidade de probabilidade (fdp) da v.a contínua X, de modo que: Variável Aleatória (Não será cobrado na avaliação) ( ) 1, ( ) 0f x dx f x Para a função densidade de probabilidade (fdp) verifica-se as seguintes propriedades: Variável Aleatória (Não será cobrado na avaliação) 1) ( ) 0 2) ( ) 1 3) ( ) ( ) ( ), . b a f x f x dx P a X b f x dx área sob f x de a e b para qualquer a e b O ponto importante é que a fdp é usada para calcular uma área que representa a probabilidade de X ser um valor no intervalo [a,b], por esse fato a probabilidade de X em qualquer ponto é zero. Uma vez que a probabilidade de cada ponto é zero: Variável Aleatória (Não será cobrado na avaliação) P(a<X<b) ( ) ( ) ( ) ( )P a X b P a X b P a X b P a X b A esperança matemática de uma variável aleatória contínua X com função densidade de probabilidade f(x) é dada por: A variância de uma variável aleatória contínua X é calculada da seguinte maneira: Variável Aleatória (Não será cobrado na avaliação) ( ) . ( ) E X x f x dx ` 2 2 2( ) ( ( )) ( ) ( ( ))V X x E X dx x f x dx E X EXERCÍCIO PARA SER FEITO EM SALA Sabe-se que a chegada de clientes a uma loja de material computacional, durante intervalos aleatoriamente escolhidos de 10 minutos, segue uma distribuição de probabilidade dada na tabela abaixo. Calcule: a) O número esperado de chegada de clientes por intervalo de 10 minutos; b) A variabilidade das chegadas; c) Calcule E(3X) d) Calcule E(5X + 2) e) Var(X+2) f) Var(3X – 2) Número de chegadas X 0 1 2 3 4 5 Probabilidade P(X) 0,15 0,25 0,25 0,2 0,1 0,05 EXERCÍCIO PARA SER FEITO EM SALA Seja a variável W o número de voltas concluídas em uma quadra e P(W=w) a probabilidade de cada um dos eventos. W tem função de probabilidade dada por: Calcule: a) A esperança e a variância da variável W. b) A probabilidade de existirem 4 voltas concluídas. c) A probabilidade de existirem no máximo 3 voltas concluídas. W 1 2 3 4 5 P(W=w) 1/21 2/21 ? 4/21 5/21 1 Distribuições de Probabilidade Discretas: Uniforme Distribuição Uniforme Discreta. Se X é uma v.a. cujo os possíveis valores são representados por x1, x2, ..., xn. Dizemos que X seque uma distribuição Uniforme Discreta se atribui a mesma probabilidade 1/n a cada um desse n valores, isto é, a sua função de probabilidade é dada por: Então, 1 ( )if x n 1 ( ) , 1, 2, ..., .iP X x i n n Distribuições de Probabilidade Discretas: Uniforme Exemplo 1: Uma rifa tem 100 bilhetes numerados de 1 a 100. Apenas um bilhete é premiado. Qual a probabilidade de Dona Jurema que comprou um bilhete, de número 43, ser sorteada? Distribuições de Probabilidade Discretas: Uniforme Exemplo 2: Considere agora que Juca tem os bilhetes de números de 21 a 25 e o seu colega Peter tem os bilhetes com os números 1, 11, 29, 68, 93. Quem tem maior possibilidade de escolher o bilhete premiado? Distribuições de Probabilidade Discretas: Bernoulli Distribuição de Bernoulli Suponha que o experimento, ou tentativa cujo, resultado possa ser classificado como sucesso ou fracasso. Se X=1 quando o resultado é sucesso e X=0 quando o resultado é fracasso, então a sua distribuição de probabilidade, com p representando a probabilidade de sucesso, 0 < p <1, é dada por: Então temos: X 0 1 P(X=xi) 1-p p Distribuições de Probabilidade Discretas: Bernoulli Exemplo 2: Suponha que Geraldo tem uma gaiola com pássaros amarelos e verdes, ele pede para Juca escolher um pássaro. Geraldo está interessado em saber qual a probabilidade de Juca escolher um pássaro verde. Sabe-se que a probabilidade do pássaro ser verde é igual a 0,87. Resposta: A probabilidade do pássaro ser verde é igual a 0,87. Distribuições de Probabilidade Discretas: Bernoulli Exemplo 3: Uma moeda é jogada uma vez, seja X definida por: 1, ; 0, . se ocorrer cara X se ocorrer coroa Aqui a distribuição de X é: X 0 1 P(X=xi) 1/2 1/2 Distribuições de Probabilidade Discretas: Bernoulli Exemplo 4: Suponha que a probabilidade de uma pessoa levar um choque ao manusear um equipamento é igual a 0,01. Se definimos: 1, ; 0, . se pessoa leva choque Y se a pessoa não leva choque Y 0 1 P(Y=yi) 0,99 0,01 Como exercício calcule a esperança e a variância da distribuição de Bernoulli, para os exemplos 2, 3, 4. X~Bernoulli(p) E(X) = p Var(X)= p(1- p) Distribuições de Probabilidade Discretas: Bernoulli Distribuições de Probabilidade Discretas: Binomial Distribuição Binomial Se um experimento consiste de n repetiçõesindependentes de Bernoulli, sendo constante e igual a p a probabilidade de sucesso em cada repetição, então, que esse é um experimento de binomial. Se X corresponde ao número de sucessos em n repetições, então pode-se dizer que X tem distribuição Binomial com parâmetros n e p. Costuma-se escrever X~Bin(n,p). Sua distribuição de probabilidade é dada por: ( ) (1 ) , 0, 1 , 2, ..., x n x n P X x p p x n x Distribuições de Probabilidade Discretas : Binomial Exemplo 5: Suponha que o Geraldo tem uma caixa com 8 bolas, ele deseja saber qual a probabilidade do Joca escolher pelo menos 2 bolas em perfeito estado. Sabe-se de antemão, que a probabilidade de uma bola, dessa caixa, em perfeito estado é igual a 0,5. Solução: X = Número de bolas perfeitas na caixa. 0 8 0 1 8 1 8 ( 2) 1 ( 2) 1 [ ( 0) ( 1) 8 8 ( 2) 1 .(0,5) .(1 0,5) .(0,5) (1 0,5) 0 1 ( 2) 1 9(0,5) 0,9648 P X P X P X P X P X P X Distribuições de Probabilidade Discretas : Binomial Exemplo 6: Em 10 lançamentos de uma moeda, qual será a probabilidade de ocorrerem 3 caras? Solução: X = Número de caras nos 10 lançamentos. 3 10 3 10 1 1 ( 3) . . 1 3 2 2 ( 3) 0,1172 P X P X Resposta: A probabilidade de que em 10 lançamentos ocorram 3 caras é igual a 0,1172. Distribuições de Probabilidade Discretas : Binomial Exemplo 7: Considere o exemplo 4. Suponha que 20 pessoas utilizaram o tal equipamento. Qual a probabilidade de que 14 levem choque ao manusear o equipamento. Solução: X = Número de pessoas que levam choque. 14 20 14 10 20 ( 14) .(0,1) (1 0.1) 14 ( 14) 2,0599 10 P X P X Resposta: A probabilidade de que em 20 pessoas 14 levem choque ao manusear o equipamento é igual a 2,0599x10-10. Como exercício calcule a esperança e a variância da distribuição binomial, , para os exemplos 5, 6, 7. X~Bin(n,p) E(X) = np Var(X)= np(1-p) Distribuições de Probabilidade Discretas: Binomial Distribuição Hipergeométrica Considere uma população com N elementos, dos quais, r tem a característica A. Se retiramos, sem reposição, uma amostra de tamanho n e definimos X = número de elementos com a característica A, temos que a distribuição de probabilidade de X é dada por: Dizemos que X~Hiper(N,n,r). ( ) , 0 r N r x n x P X x x n N n Distribuições de Probabilidade Discretas: Hipergeométrica Exemplo 8: Pequenos motores são guardados em caixas de 50 unidades. Um inspetor de qualidade examina cada caixa antes da posterior remessa, testando 5 motores. Se nenhum motor for defeituoso, a caixa é aceita. Se pelo menos um deles for defeituoso, todos os 50 motores são testados. Dado que existem 6 motores defeituosos numa caixa, qual a probabilidade de que seja necessário todos os motores serem examinados? Distribuições de Probabilidade Discretas: Hipergeométrica Solução: X = Número de motores defeituosos na amostra de 5 motores. N = 50 (total de motores) r = 6 (total de motores defeituosos) n = 5 (tamanho da amostra) 6 44 0 5 ( 1) 1 ( 0) 1 1 0,51 0,49 50 5 P X P X Resposta: A probabilidade de que todos os motores sejam examinados é igual a 0,49 Distribuições de Probabilidade Discretas: Hipergeométrica Exemplo 9: Considere o experimento, retiram-se 3 bolas da urna (sem reposição). Define-se uma v.a. X cujos valores representam o número total de bolas vermelhas dentre as 3 escolhidas. N = 7 (total de bolas) r = 5 (total de bolas vermelhas) n = 3 (número de bolas retiradas, amostra) Solução: 5 7 5 3 3 3 ( 3) 0,2857 7 3 P X Resposta: A probabilidade de 3 bolas retiradas, sem reposição, dessa urna, ser vermelha é igual a 0,2857. Distribuições de Probabilidade Discretas: Hipergeométrica Como exercício calcule a Esperança e a Variância do exemplo 8 e 9. E(X) = np Var(X) = np(1-p) . ( ) ( 1) N n N Distribuições de Probabilidade Discretas: Hipergeométrica Distribuições de Probabilidade Discretas: Poisson Distribuição de Poisson Uma variável aleatória X tem distribuição de Poisson com parâmetro λ se: Dizemos que X~Poisson(λ) . ( ) , 0, 1 , 2, ... ! xe P X x x x Exemplo 10: Falhas ocorrem ao acaso ao longo do comprimento de um fio delgado de cobre. Seja X a variável aleatória que conta o número de falhas em um comprimento de 1 milímetro. Qual a probabilidade de existirem exatamente 2 falhas? Considere um taxa média de 2,3 falhas por milímetro. 2,3 22,3 ( 2) 0,265 2! e P X Distribuições de Probabilidade Discretas: Poisson Exemplo 11: A emissão de partículas radioativas tem sido modelas através de uma distribuição de Poisson. Suponha que o número de partículas alfa, emitidas por minuto seja uma variável aleatória seguindo o modelo de Poisson com parâmetro 5, isto é, a taxa média de ocorrência é de 5 emissões a cada minuto. Calculemos a probabilidade de haver mais de 2 emissões em um minuto. Solução: A = Número de partículas alfa emitidas por minuto. 5 0 5 1 5 2 ( 2) 1 ( 2) 1 ( 0) ( 1) ( 2) 5 5 5 ( 2) 1 0! 1! 2! ( 2) 1 0,125 0,875 P X P X P X P X P X e e e P X P X Distribuições de Probabilidade Discretas: Poisson Distribuições de Probabilidade Contínuas: Normal Distribuição Normal ou Gaussiana Essa distribuição foi desenvolvida pelo matemático francês Abraham DeMoivre e foi estendida posteriormente por Laplace e por Gauss. Hoje essa distribuição está incorporada em um teorema probabilístico conhecido como teorema do limite central. A distribuição normal e comumente utilizada em situações que incluem características populacionais, tais como a altura de pessoas, velocidade de uma molécula de gás, corrente elétrica em um fio, entre varias outras. Distribuições de Probabilidade Contínuas: Normal Dizemos que X é uma v.a. normal, ou simplesmente que X é normalmente distribuída, com parâmetros µ e σ², se a função densidade de X é dada por: A esperança e a variância de uma v.a. X com distribuição Normal , são dadas por: A notação utilizada será a seguinte X~N(µ, σ²) 2 2 ( ) 2 1 ( ) , 2 x f x e x 2( ) ( )E X V X Distribuições de Probabilidade Contínuas: Normal Algumas características da distribuição normal: i) f(x) é simétrica em relação à µ; ii) f(x) → 0 quando x → iii) o valor máximo de f(x) se dá para x = µ x f(x) Distribuições de Probabilidade Contínuas: Normal Esse gráfico nos mostra que: 99,74% das observações estão entre a média e ± 3 desvios- padrões; 95,44% das observações estão entre a média e ± 2 desvios- padrões; 68,26% das observações estão entre a média e ± 1 desvio-padrão. Distribuições de Probabilidade Contínuas: Normal Exemplo 4: Suponha que o tempo que um atleta gasta para dar uma volta completa em um circuito siga a distribuição normal, com média de 10 minutos e uma variância de 4 (minutos)². Qual a probabilidade de que o tempo que o atleta gaste para concluir exceda 13 minutos? Solução: 2 2 ( ) 2 13 1 ( 13) 2 x P x e dx Distribuições de Probabilidade Contínuas: Normal Obs.: No cálculo de probabilidadepara variáveis contínuas, devemos resolver a integral da função densidade no intervalo de interesse. Entretanto, a integral da distribuição densidade da Normal só é resolvida de modo aproximado e por métodos numéricos. Por essa razão as probabilidades para a distribuição Normal são calculadas com o auxílio de uma tabela. Para o uso da tabela da distribuição normal é necessário padronizar a variável. Distribuições de Probabilidade Contínuas: Normal Para padronizar a variável utilizaremos a seguinte fórmula: A padronização não afeta a normalidade da variável. Após padronizar a variável terá distribuição N(0,1), e será denominada de Normal Padrão ou Normal Reduzida. X Z 98 Distribuições de Probabilidade Contínuas: Normal Distribuições de Probabilidade Contínuas: Normal Exemplo 5: Considere o exemplo 4. Em que a variável tem média de 10 minutos e uma variância de 4 (minutos)² e perguntava-se qual a probabilidade de que o tempo que o atleta gaste para concluir exceda 13 minutos? Solução: 10 13 10 13 10 ( 13) 2 2 2 ( 1,5) X P X P P Z P Z 100 Distribuições de Probabilidade Contínuas: Normal Distribuições de Probabilidade Contínuas: Normal .Conclusão: A probabilidade de que tempo que o atleta gaste para concluir exceda 13 minutos é igual a 0,5 - 0,43319 = 0,06681. INTERVALO DE CONFIANÇA UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATÍSTICA DOCENTE: Mariana Oliveira Cedraz A estimação, por pontos, de um parâmetro não possui uma medida do possível erro cometido na estimação. Uma maneira de expressar a precisão da estimação é estabelecer limites, que com certa probabilidade incluam o verdadeiro valor do parâmetro da população. Esses limites são chamados de limites de confiança. Logo, a estimação, por intervalos, consiste na fixação de dois valores tais que 1-α seja a probabilidade de que o intervalo de confiança, determinados pelos dois valores, contenha o verdadeiro valor do parâmetro . Intervalo de confiança Possíveis: 1) Para média populacional, com variância conhecida; 2) Para média populacional, com variância desconhecida; 3) Para a proporção. OBS: Qual o tamanho da amostra? Essa informação vai influenciar no cálculo! Intervalo de confiança Procedimentos para a construção do intervalo de confiança: 1) Retirar uma amostra aleatória simples de n elementos; 2) Calcular a média amostral (ou proporção – p); 3) Calcular o desvio padrão (quando necessário) associado a cada tipo de medida; 4) Fixar um nível de significância α, e com ele determinar zα ou tα . 1-α 2 2 Perceba que α nos dá a medida de incerteza. Como temos um intervalo, o α tem que ser dividido por dois. -z z Intervalo de confiança para média populacional Intervalo de confiança para média populacional: Com variância conhecida Considerando uma população normal com média desconhecida, que desejamos estimar, e σ² conhecida, isto é, temos informações da variância populacional. Então para determinarmos os valores do intervalo de confiança para estimarmos a média utilizaremos a seguinte fórmula: ou ( ,1 ) . xIC x z ( . . ) 1x xP x z x z Você determina! Intervalo de confiança para média populacional: Com variância desconhecida Considerando que NÃO temos informações da variância populacional, isto é, σ² desconhecida e além do mais o tamanho da amostra (n) é menor que 30, utilizaremos a distribuição t-Student para encontrar o quantil da distribuição. Então para determinarmos os valores do intervalo de confiança para estimarmos a média utilizaremos a seguinte fórmula: ou ( ,1 ) . xIC x t s ( . . ) 1x xP x t s x t s 1 2( ) 1 n i ix xs n Você determina! Intervalo de confiança para proporção Quando temos interesse na proporção de uma determinada característica da população, utilizaremos a seguinte fórmula: ou Intervalo de confiança Procedimentos para encontrar o valor na tabela: 1. Distribuição normal (n>30): Qual a área de interesse? Supondo ser 95% Dividirá a área por 2 e irá procurar no corpo da tabela o valor correspondente. Ex: 0,95/2 = 0,475 --> A partir dessa área acha o valor (1,96) 2. Distribuição t-Student (n≤30): Encontrar quantos graus de liberdade: n-1 Qual o valor de (alfa)? Supondo n=10, portanto temos 9 graus de liberdade e =5% --> A partir dessas duas informações, o valor é: 2,262 Intervalo de confiança Exercício: O projetista de uma indústria tomou uma amostra de 36 funcionários para verificar o tempo médio gasto para montar um determinado brinquedo. Lembrando que foi verificado que uma média de 19,9 minutos e desvio padrão de 5,73. Qual o intervalo de confiança, com nível de significância de 5%? E com nível de significância de 10%? Intervalo de confiança Exercício: As notas na disciplina de estatística dos alunos de uma turma segue distribuição normal com σ²= 2. Uma amostra de 9 alunos foi selecionada obtendo-se as seguintes notas: Construa, ao nível de significância de 5%, o intervalo de confiança para média. 5,5 7,9 8,3 6,4 5,7 6,6 7,0 8,8 7,1 Intervalo de confiança Exercício: Uma amostra de 10 alunos foi escolhida, a idade deles está descrita na tabela abaixo, construa um intervalo de confiança para a média com 98% de confiança. 9 8 12 7 9 6 11 6 10 9 Intervalo de confiança Exercício: Sabe-se que dentre 400 pessoas que tomaram vacina contra a gripe, 136 sentiram algum efeito colateral. Construa um intervalo de 90% de confiança para a verdadeira proporção dos que sofreram efeito colateral com a referida vacina. Intervalo de confiança Cálculo para determinar o tamanho da amostra ideal: •Média: •Proporção: 2 2/ . E sZ n 2 2)1.( p Z ppn Erro! Erro! Intervalo de confiança Exercício: Em um estudo para a determinação do perfil dos alunos da Faculdade Pitágoras, a característica de maior interesse tem s = 0,3. Qual deve ser o tamanho da amostra para que tenhamos 95% de confiança em que o erro da estimativa da correspondente a esta característica não supere 0,05? Intervalo de confiança Exercício: Suponha que se deseja estudar uma população de idosos com diabetes. Sabe-se de pesquisas anteriores que a probabilidade de ser diabéticos é de 42%.Calcule o tamanho da amostra necessário para ter uma margem de erro de 3%? e para 6%? Usando um nível de significância de 95%. TESTE DE HIPÓTESES UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATÍSTICA DOCENTE: Mariana Oliveira Cedraz Teste de hipóteses Técnica para se fazer inferência estatística sobre uma população a partir de uma amostra HIPÓTESE ESTATÍSTICA Trata-se de uma suposição quanto ao valor de um parâmetro populacional, ou quanto à natureza da distribuição de probabilidade de uma variável populacional. TESTE DE HIPÓTESE É uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos elementos amostrais. Teste de hipóteses HIPÓTESE NULA (H0): É representada por uma igualdade, o que é convencional a ser usado. HIPÓTESE ALTERNATIVA (H1): É o que deverá ser testado, o que você está interessado. Ex: H0: =70 Kg H1: ≠70 Kg Ex: H0: =1.65 m H1: ≠1.65 m Teste de hipóteses TIPOS DE ERRO Ao se testar H0 contra H1, podem ocorrer dois tipos de erro: Erro do tipo I: Rejeitar H0, quando H0 é verdadeira P(Rejeitar H0 | H0 verdadeira)= P(Erro tipo I) = Erro do tipo II: Não rejeitar H0, quando H0 é falta P(Não rejeitar H0 | H0 falsa) = P(erro tipo II) = Teste de hipóteses EXEMPLO DE ERRO Uma pessoa é acusada de ter cometido um delito, até que se prove o contrário, a pessoa é considerada inocente Criando as hipóteses: H0: O réu é inocente. H1: O réu é culpado. A acusação tem que apresentar provas para culpar o suspeito, se essas não forem suficientes o juiz não pode acusar o réu, ou seja, não pode rejeitar H0. Quais erros podem acontecer? Aceitar H0 Rejeitar H0 H0 verdadeira Acerto!! Erro do tipo I H0 falsa Erro do tipo II Acerto!! Condenar um inocente Não condenar um culpado Teste de hipóteses COMO PLANEJAR UM TESTE DE HIPÓTESES? 1) Definir as hipóteses a serem testadas; 2) Fixar a probabilidade de erro (Geralmente usa =0.01, 0.05 ou 0.10); OBS: Quanto menor o , maior a confiança ao decidir rejeitar H0. Teste de hipóteses COMO PLANEJAR UM TESTE DE HIPÓTESES? 3) Determinar a região crítica em função da variável tabelada: 4) Calcular o valor da variável do teste obtido na amostra; 5) Concluir sobre a rejeição das hipóteses, com base na comparação do valor calculado e do tabelado; Tabela o1 - Valores de Z para distribuição N(0,1) Teste de hipóteses LÓGICA DO TESTE DE SIGNIFICÂNCIA 1) Atribuem-se baixos valores para , geralmente entre 1 e 10%; 2) Formula-se H0 com a pretensão de rejeitá-la, daí o nome de hipótese nula; 3) Se o teste indicar a rejeição de H0 tem-se um indicador mais seguro da decisão; 4) Caso o teste indique a aceitação de H0, diz-se que, com o nível de significância , não se pode rejeitar H0. Teste de hipóteses TESTE DE HIPÓTESES PARA MÉDIA Podem ser divididos em: Testes para média: Variância populacional conhecida Variância populacional desconhecida Teste para diferença entre médias: Variância populacional conhecida Variância populacional desconhecida e iguais Variância populacional desconhecida e diferentes Observações emparelhadas Teste de hipóteses TESTE DE HIPÓTESE PARA MÉDIA COM VARIÂNCIA POPULACIONAL CONHECIDA Rejeita-se H0 (hipótese nula) se o valor de Z calculado da expressão acima for: (i) Maior do que Zα (no teste unilateral à direita); (ii) Menor do -Zα (no teste unilateral à esquerda) e (iii) Maior que Zα/2 ou menor que -zα/2 (no teste bilateral). Teste de hipóteses TESTE DE HIPÓTESE PARA MÉDIA COM VARIÂNCIA POPULACIONAL DESCONHECIDA Rejeita-se H0 (hipótese nula) se o valor de t calculado da expressão acima for: (i) Maior do que tα (no teste unilateral à direita); (ii) Menor do -tα (no teste unilateral à esquerda) e (iii) Maior que tα/2 ou menor que -tα/2 (no teste bilateral). Como o desvio padrão é desconhecido é necessário estima-lo, passando a ter uma distribuição t de Student. Teste de hipóteses ÁREA DE REJEIÇÃO DO TESTE Teste de hipóteses APLICAÇÃO A empresa de Queijo de Coalho compra leite de diversos fornecedores. O leite é uma matéria-prima essencial para a fabricação do queijo. O gerente de produção Titico, muito experiente, suspeita de que os fornecedores estejam adicionando água ao leite para aumentarem o seu lucro. Titico sabe que a temperatura média de congelamento do leite puro é de μ = -0,545o ºC com desvio padrão σ = 0,008o ºC. Além disso, Titico está ciente de que a adição de água eleva a temperatura de congelamento do leite em direção a zero grau Celsius. Assim Titico resolve fazer um teste de qualidade com algumas amostras de leite. Para tanto, ele mede a temperatura de congelamento de cinco lotes de leites de um determinado fornecedor. A média amostral encontrada foi de -0,538. Teste de hipóteses APLICAÇÃO Temos alguma evidência de que o determinado fornecedor está adicionando água? Para responder essa pergunta, iremos realizar um teste de hipóteses. 1) Criando as hipóteses: H0: Temperatura média de congelamento do leite é igual a - 0,545 H1: Temperatura média de congelamento do leite é maior a - 0,545 H0: μ = -0,545 H1: μ > -0,545 Teste de hipóteses APLICAÇÃO Sob H0, μ0 = -0,545 e Zc é igual: Como o valor calculado encontra-se na área de rejeição, iremos rejeitar H0, ou seja, há indícios de que o fornecedor esteja adicionando água ao leite. .96,1 5/008,0 545,0538,0 / 0 n x z Teste de hipóteses TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS COM VARIÂNCIAS CONHECIDAS Teste de hipóteses TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS COM VARIÂNCIAS DESCONHECIDAS E IGUAIS g.L: n1 + n2 - 2 Teste de hipóteses TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS COM VARIÂNCIAS DESCONHECIDAS E DIFERENTES com Teste de hipóteses TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS COM OBSERVAÇÕES EMPARELHADAS Um caso especial de testes t para duas amostras ocorre quando as observações nas duas populações de interesse são coletados em pares. Cada par de observações, como (X1j, X2j), é tomado sob condições homogêneas, mas essas condições podem mudar de um par para outro. Para observações emparelhadas, o teste consiste em determinar primeiro a diferença “d” entre cada par de valores e então testar a hipótese nula de que a média das diferenças na população é igual a zero. Então, do ponto de vista de cálculo, o teste é aplicado a uma única amostra de valores d. Teste de hipóteses TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS COM OBSERVAÇÕES EMPARELHADAS A média, desvio padrão e erro padrão da amostra de valores “d” são obtidos pelas fórmulas: Teste de hipóteses TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS COM OBSERVAÇÕES EMPARELHADAS Continuação: Uma vez que o erro padrão da diferença média é calculado com base nas diferenças observadas em amostras emparelhadas (logo σ é desconhecido) e os valores de d geralmente podem ser admitidos como tendo distribuição Normal, as distribuições t são apropriadas para testar a hipótese nula de que μd= 0. A estatística de teste, então, será dada por: Com: gl = n - 1 Teste de hipóteses APLICAÇÃO Estuda-se o conteúdo de nicotina de duas marcas de cigarros (A e B), obtendo-se os seguintes resultados. A: 17; 20; 23; 20 B: 18; 20; 21; 22; 24 Admitindo que o conteúdo de nicotinas das duas marcas tem distribuição normal e que as variâncias populacionais são iguais, com α=0,05, pode-se afirmar que existe alguma diferença significativa no conteúdo médio de nicotina nas duas marcas? Teste de hipóteses APLICAÇÃO Sejam X: O conteúdo de nicotina da marca A Y: O conteúdo de nicotina da marca B •Nosso interesse é testar as seguintes hipóteses: H0: A média do conteúdo de nicotina presente na marca A é igual ao presente na marca B. H1: A média do conteúdo de nicotina presente na marca A é diferente ao presente na marca B. OU Teste de hipóteses da diferença entre duas médias populacionais com variâncias desconhecidas e iguais A: 17; 20; 23; 20 B: 18; 20; 21; 22; 24 APLICAÇÃO APLICAÇÃO Sendo assim temos: A estatística calculada é: APLICAÇÃO A região critica da distribuição t-Student, para α=0,05 e gl= n1 + n2 – 2 = 4+5-2=7
Compartilhar