Baixe o app para aproveitar ainda mais
Prévia do material em texto
Inferência Estatística Material Teórico Responsável pelo Conteúdo: Prof.ª Me. Adriana Domingues Freitas Revisão Textual: Prof.ª Dr.ª Luciene Oliveira da Costa Granadeiro Inferência Estatística e Conceitos de Probabilidade • Inferência Estatística; • População e Amostra, Parâmetros e Estimadores; • A Ideia de Probabilidade; • Propriedades da Probabilidade de Eventos Aleatórios; • Modelos Probabilísticos Contínuos; • A Distribuição Normal de Probabilidade; • Normal Padronizada ou Reduzida; • Como Associar uma Distribuição Normal a uma Normal Reduzida? • Reconhecer e diferenciar parâmetros e estimadores estatísticos; • Reconhecer e diferenciar modelos probabilísticos discretos e contínuos; • Calcular probabilidades de eventos em modelos discretos; • Calcular probabilidades em modelos contínuos por meio da distribuição normal de probabilidade. OBJETIVOS DE APRENDIZADO Inferência Estatística e Conceitos de Probabilidade Orientações de estudo Para que o conteúdo desta Disciplina seja bem aproveitado e haja maior aplicabilidade na sua formação acadêmica e atuação profissional, siga algumas recomendações básicas: Assim: Organize seus estudos de maneira que passem a fazer parte da sua rotina. Por exemplo, você poderá determinar um dia e horário fixos como seu “momento do estudo”; Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma alimentação saudável pode proporcionar melhor aproveitamento do estudo; No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam- bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua interpretação e auxiliarão no pleno entendimento dos temas abordados; Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus- são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de aprendizagem. Organize seus estudos de maneira que passem a fazer parte Mantenha o foco! Evite se distrair com as redes sociais. Mantenha o foco! Evite se distrair com as redes sociais. Determine um horário fixo para estudar. Aproveite as indicações de Material Complementar. Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma Não se esqueça de se alimentar e de se manter hidratado. Aproveite as Conserve seu material e local de estudos sempre organizados. Procure manter contato com seus colegas e tutores para trocar ideias! Isso amplia a aprendizagem. Seja original! Nunca plagie trabalhos. UNIDADE Inferência Estatística e Conceitos de Probabilidade Inferência Estatística A inferência estatística consiste em obter informações de uma população a partir das observações e análises de uma ou mais amostras dessa população, ou seja, a partir da análise de determinados resultados amostrais, é possível estimar informa- ções e características numéricas acerca da população; matematicamente, dizemos que a partir do cálculo e observação de medidas de um determinado subconjunto, podemos estimar medidas que representem todo o conjunto. Obviamente, ao partir da análise de uma parte para representar o todo, temos que ter em mente de que se trata de estimativa e assim como tal pode não se apre- sentar totalmente fiel. Portanto, ao generalizar uma situação com base em dados reduzidos a ponto de estender para uma conclusão do todo, temos que levar em consideração o quão próximo do real está a estimativa. O conjunto de técnicas e procedimentos matemáticos e probabilísticos permite à inferência estatística não só extrapolar esses cálculos como também gerenciar o grau de aproximação de confiabilidade, gerenciando o erro estatístico, chamado também de grau de incerteza, que é inerente ao processo do cálculo das estimativas. Para compreender a inferência estatística, devemos alicerçar conceitos estatís- ticos como população, amostra, parâmetros e estimadores, bem como conceitos fundamentais de probabilidade para modelos contínuos e discretos, esse último essencial para a compreensão dos intervalos de confiança e testes de significância. População e Amostra, Parâmetros e Estimadores Importante termos clareza sobre os conceitos de amostra, população, estima- dores (também chamados de estatística ou medidas) e parâmetros. Por definição, a população é todo o conjunto de dados de determinada pesquisa, todos os dados possíveis de observação ou todos os dados que podem ser obtidos em um experi- mento. Como, por exemplo, todos os produtos produzidos em uma fábrica, todos os habitantes de determinada cidade, todos os alunos de determinada instituição, todos os clientes atendidos em uma rede de assistência médica, todas as ligações recebidas por uma central de atendimento, todos os veículos que passaram em determinada rodovia em certo período, todas as decolagens registradas em um ae- roporto, todas as crianças vacinadas em uma determinada campanha, entre outros. Já a amostra é um subconjunto dessa população: como, por exemplo, no caso de a população ser todo o conjunto de itens produzidos em uma fábrica, a amostra pode ser uma amostra aleatória simples de 15% dessa produção, ou seja, é uma parte, mas não o todo. Isso define uma amostra. Ou ainda, no caso do aeroporto, a amostra seriam os voos que decolaram em determinado período observado. 8 9 Ao buscar caracterizar uma população, são usadas medidas numéricas, como, por exemplo, média, desvio-padrão, variância e proporção – são os chamados parâmetros. Já ao buscar caracterizar uma amostra, também utilizamos medidas numéricas, como média, desvio-padrão, variância e proporção, porém, nesse caso, são chama- dos de estimadores ou estatísticas. Vale destacar que, quando nos referimos a “parâmetros”, estamos automatica- mente nos referindo às medidas numéricas da população; já quando nos referimos a “estatísticas” (ou, ainda, estimadores, em alguns livros), estamos referenciando medidas numéricas das amostras. A simbologia também é diferente quando se refere à população ou à amostra, como se observa na tabela abaixo, na qual temos a relação entre Amostras, Popu- lação, Estimadores e Parâmetros e seus respectivos símbolos. Tabela 1 População símbolos dos Parâmetros Amostra símbolos dos Estimadores Média µ x Desvio Padrão σ S Variância σ2 S2 Proporção π p Estimadores, chamados também de estatística, são provenientes de amostras já os parâmetros são provenientes de população. Tendo ciência da distinção entre amostra e população e entre estimadores e parâmetros seguimos adiante com o conceito de inferência estatística e como ela ocorre, reforçando que a ideia essencial da inferência que é utilizar amostras para estimar parâmetros da população. A Ideia de Probabilidade Como vimos, uma ideia básica na estatística é: a partir do resultado observado em uma amostra, podemos estimar algo sobre uma população. Devemos ter claro que, quando temos uma determinada população e, a partir dela, analisamos dife- rentes amostras, podemos ter resultados distintos entre as amostras analisadas. E justamente nesse cenário vamos discutir agora a importância da probabilidade. Como confiar, ou melhor, com qual nível de precisão podemos confiar em uma amostra aleatória? Como uma amostra aleatória, ou um conjunto de amostras dis- tintas podem representar uma população? 9 UNIDADE Inferência Estatística e Conceitos de Probabilidade É comprovado que comportamento do acaso é imprevisível no curto prazo, mas que tem padrão regular e previsível no longo prazo. Na probabilidade, classificamos como aleatório o fenômeno cujo resultado é incerto, mesmo que se tenha, ao repetir esse evento por inúmeras vezes, uma dis- tribuição regular dos resultados. Por exemplo: ao lançar uma moeda e verificarqual a face ficou voltada para cima, não há como garantir qual será o resultado desse lançamento. O que pode- mos garantir é que certamente teremos ou cara ou coroa, mas não temos como garantir exatamente o resultado em um lançamento que ainda não ocorreu. A probabilidade então pode ser definida como a proporção de vezes que o resul- tado ocorreria em uma série muito longa de resultados. Voltamos ao exemplo da moeda, observe que temos dois resultados possíveis {cara, coroa}, é intuitivo pensar que a chance, em um único lançamento, de ocorrer o resultado {cara} é de uma 1 em 2, ou seja de 0,5 já que {cara} é um resultado em dois que são os possíveis {cara, coroa}. Agora, suponha que vamos usar essa mes- ma moeda em uma sequência de seis lançamentos, o resultado seria igualmente dividido entre cara e coroa? Até seria possível, assim como também não, pois aqui está explícita a aleatoriedade do evento – pode ser que nesses seis lançamentos tenhamos mais cara do que coroa, ou mais coroa do que cara, ou exatamente três caras e três coroas. Porém, se nesse mesmo evento o lançamento de uma moeda com faces cara e coroa for repetido exaustivamente, o padrão irá se aproximar de metade de vezes para cara, metade de vezes para coroa. A imagem abaixo ilustra o comportamento do resultado, cara ou cora, à medida que se realizam mais eventos de lançamento. Figura 1 – Lançamento de Moedas Fonte: MOORE, NOTZ E FLIGNER, 2017 10 11 Observe que, nos primeiros lançamentos, há uma disparidade de resultados, ora para cara, ora para coroa, porém, à medida que se repetem os lançamentos, por vol- ta de 5.000 lançamentos, a proporção para ambos os resultados tende a ser de 0,5. Essa é a essência da probabilidade: a existência de um padrão regular nos resultados que surgem após muitas repetições de um determinado evento, sob mesmas condições. Obviamente temos que ter em mente que, por se tratar de probabilidade, lida- mos com as chances de ocorrer e nunca com a certeza da ocorrência. Trazendo essa essência para a estatística, se tivermos uma determinada popula- ção e dela observarmos amostras, cada vez mais amostras (sob mesmas condições) dessa população, chegaremos ao resultado que poderá caracterizar a população. Assim, uma amostra poderá, dentro de uma determinada margem de erro, expres- sar uma população de acordo com certa probabilidade. Antes de prosseguir, relembre alguns conceitos e termos utilizados em Probabilidade: • Espaço Amostral (S): trata-se do conjunto de resultados possíveis para um determinado experimento aleatório. Para um espaço amostral finito, podemos determinar o número de elementos (ou resultados) que o compõe, o que deno- tamos por n(S). Observe a seguir alguns exemplos: » Exemplo 1 – Espaços Amostrais: a) O espaço amostral do lançamento de uma moeda será S = {Cara, Co- roa} e, nesse caso, n(S) = 2; b) O espaço amostral do lançamento de um dado será S = {1, 2, 3, 4, 5, 6}, portanto n(S)= 6; c) O espaço amostral do lançamento de uma moeda e de um dado (juntos), será S = {(Cara, 1), (Cara, 2), (Cara, 3), (Cara, 4), (Cara, 5), (Cara, 6), (Coroa, 1), (Coroa, 2), (Coroa, 3), (Coroa, 4), (Coroa, 5), (Coroa, 6)} e, nesse caso, n(S) = 12; d) O espaço amostral do lançamento de dois dados simultaneamente, será dado por S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), ... , (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)} o que expressa n(S) = 36; e) O espaço amostral da retirada de uma carta de um determinado baralho será descrito pelas 52 cartas que compõe o baralho, o que resulta em n(S) = 52. Como destacam Moore, Notz e Fligner (2017), podemos ter um espaço amos- tral S muito simples ou muito complexo. Quando o Gallup extrai uma amostra aleatória de 1.005 adultos, o espaço amostral contém todas as escolhas possí- veis de 1.005 pessoas dos 241 milhões de pessoas. Nesse caso, cada membro de S é uma possível amostra, de modo que S é a coleção, ou “espaço” de todas as possíveis amostras. Veremos também que poderemos ter um espaço 11 UNIDADE Inferência Estatística e Conceitos de Probabilidade amostral infinito (chamado também de contínuo), mas detalharemos um pouco mais à frente. • Evento (E): em Probabilidade, quando falamos de Evento, tratamos de um re- sultado possível, mas para o qual não há a certeza premeditada da ocorrência. Matematicamente, um evento é definido como um subconjunto dos resulta- dos possíveis, ou seja: um subconjunto do espaço amostral. Normalmente, o evento é representado por uma letra maiúscula do alfabeto, e temos por “n” o número de elementos do subconjunto Evento, ou seja: o número de resultados possíveis. Observe a seguir: » Exemplo 2 – Eventos: a) Evento A: observar a face Cara em uma moeda, portanto: A = {Cara} e n(A) = 1; b) Evento B: observar a face 5 em um dado, logo: B = {Face 5} e n(B) = 1; c) Evento C: no lançamento de um dado e uma moeda, o evento C {ob- servar o número 3 como resultado}, logo C = { (Cara, 3), (Coroa, 3) } e temos que n(C)= 2; d) Evento D: no lançamento simultâneo de dois dados, o evento D {que a soma das faces observadas seja igual a 8}, para esse evento temos: D = {(2, 6), (6, 2), (3, 5), (5, 3), (4, 4)} e n(D) = 5. Quando tratamos de espaços amostrais equiprováveis, ou seja, nos quais cada evento possui igual chance de ocorrer, calculamos a probabilidade de um de- terminado evento ocorrer pela razão entre o número de elementos (resultados) do evento, pelo número de elementos (resultados) do espaço amostral. Assim, sendo E um determinado evento e S o Espaço Amostral Equiprovável, temos que a probabilidade do evento E ocorrer, ou seja, P(E) será dada por: ( ) número de elementos do evento número deelementos do espaço amostral P E = Ou seja: ( ) ( )( ) n E P E n S = » Exemplo 3: voltamos novamente no exemplo do lançamento da moeda e observamos a face voltada para cima e ela ser igual à Cara. a) Evento E= {face cara} b) E = {Cara}, n(E) = 1 c) S = {Cara, Coroa}, n(S) = 2 12 13 ( ) ( )( ) 1 0,5 2 n E P E n S = = = Logo, probabilidade de termos a face igual à cara, em um lançamento, é de 1 em 2, ou seja: ½ ou ainda 0,5. » Exemplo 4: Ao lançar um dado honesto, observar sua face voltada para cima e ela ser igual a 6. a) Evento E = {Face 6}, portanto n(E) = 1, já que só há uma face igual a 6 no dado. b) Espaço Amostral S = {1, 2, 3, 4, 5, 6}, portanto n(S) = 6. Sendo assim, temos que: ( ) ( )( ) 1 0,1667 6 n E P E n S = = ≅ Logo, a probabilidade de termos a face 6, em um lançamento, é de 1 em 6, ou seja: 1/6, ou 0,1667. • Exemplo 5: a) Evento D: no lançamento simultâneo de dois dados, o evento D {que a soma das faces observadas seja igual a 8}, para esse evento temos: D = {(2, 6), (6, 2), (3, 5), (5, 3), (4, 4)} e n(D) = 5 , em um espaço amostral S = { (1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3) ... (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)} que sabemos ser de 36 resultados. Logo: ( ) ( )( ) 5 0,1389 36 n E P E n S = = ≅ Logo, a probabilidade de termos, com o lançamento de dois dados, a soma das faces igual a 8 será de 5 em 36 ou 5/36 que é aproximadamente 0,1389. Propriedades da Probabilidade de Eventos Aleatórios Vejamos agora algumas propriedades importantes: • A probabilidade P(E), de um evento E qualquer resulta em 0 ≤ P(E) ≤ 1. Isso quer dizer que a probabilidade de um evento é um número compreendido entre 0 (zero) e 1, inclusive pode ser igual a 0, quando temos um evento inexistente, 13 UNIDADE Inferência Estatística e Conceitos de Probabilidade ou igual a 1 quando temos o evento chamado de certo, ou seja, o evento que temos certeza de que irá ocorrer. Observe que, no lançamento de um dado, a probabilidade do evento E = {sair a face igual a 7} é igual a 0 (zero), já que a face ser igual a 7 é um evento inexistente no espaço amostral. Já a probabilidade, no lançamento de um dado, do evento E = {face ser igual a 1, 2, 3, 4, 5, ou 6} é igual a 1 , pois todos os elementos do espaçoamostral S = { 1, 2, 3, 4, 5, 6} fazem parte do evento E { 1, 2, 3, 4, 5, 6 }. • P(S) = 1. Ou seja: a probabilidade da ocorrência do próprio espaço amostral é igual a 1. Nesse caso, é intuitivo verificar que, de fato, se o evento corresponder ao pró- prio espaço amostral, então se trata do evento certo e, nesse caso, a probabilidade é igual a 1. • Para qualquer evento E, a probabilidade desse evento E não ocorrer será dada por P(E não ocorrer) = 1 – P(E). Vale refletir que, se a probabilidade de um evento E está em 0 ≤ P(E) ≤ 1 e se, por exemplo, a probabilidade de um determinado evento ocorrer P(E) = 0,35, então a probabilidade desse mesmo evento não ocorrer é o complementar para 1, nesse caso P (E não ocorrer) = 1 - 0,35 = 0,65. Não é foco neste estudo explorar as regras gerais de probabilidade, como regra da adição, regra da multiplicação e probabilidade condicional. Mas, para explorar o tema, indicamos o vídeo de “Probabilidade. Conceitos Fundamentais” da UNIVESP. Disponível em: https://youtu.be/yWJB3nMHRYE Ex pl or Importante observar que todos os exemplos listados até agora se referem a um número inteiro de eventos (resultados), o que, normalmente, é definido pelos esta- tísticos como modelos probabilísticos discretos. Porém, há modelos nos quais não podemos atribuir probabilidades a valores individuais, ou ainda nos quais o que se quer calcular está entre um intervalo de números reais; são os denominados modelos probabilísticos contínuos e aqui há uma diferença do cálculo da probabilidade que passa a ser equivalente a uma deter- minada área sob uma curva de densidade. Dessa forma, a probabilidade é atribuída a intervalos de resultados e não mais a resultados individuais. Quando temos um modelo probabilístico contínuo, o cálculo da probabilidade ocorre a partir do cálculo da área sob uma curva de densidade. 14 15 Modelos Probabilísticos Contínuos Devemos retomar o conceito de que a curva densidade é a que descreve o padrão idealizado de uma amostra. Veja, quando temos a representação gráfica dos dados de uma amostra, temos todo o conjunto de dados da amostra representados na imagem e, conforme ilustra a imagem abaixo, podemos ainda ter uma curva que está sempre sobre o eixo horizontal ou acima dele e que representa esse mesmo conjunto. A Curva Densidade representa, então, o conjunto de dados da amostra já que a área formada por essa curva e o eixo horizontal possuirá área total igual a 1, o que corresponde a 100% dos registros analisados e, por consequência, a área sob a curva e acima de qualquer intervalo de valores no eixo horizontal será a proporção de todos os registros nos intervalos. Figura 2 – Ilustração de uma Curva de Densidade de uma Amostra Fonte: Acervo do Conteudista Figura 3 – Ilustração da Curva Densidade de uma Amostra Normal Fonte: Acervo do Conteudista 15 UNIDADE Inferência Estatística e Conceitos de Probabilidade Para saber mais sobre curva densidade, trata-se de um vídeo criado e disponibilizado gratui- tamente pela Khan Academy. Disponível em: http://bit.ly/2AB05TIEx pl or Dentre as curvas densidade mais usuais, destacamos: a Normal, a T de Student e a Qui-Quadrado. Nesse momento, teremos como foco a Curva Normal. Sabemos que, quando temos um modelo probabilístico contínuo, o cálculo da probabilidade ocorre a partir do cálculo da área sob uma curva de densidade. Ve- remos agora como esse cálculo ocorre, tomando como foco a distribuição normal de probabilidade. A Distribuição Normal de Probabilidade Observe a ilustração abaixo que representa um esboço de uma curva normal. Por sua representação gráfica lembrar a forma de um sino, ela é popularmente chamada de função sino ou bell. Figura 4 – Curva Normal Fonte: Acervo do Conteudista Nessa curva, que representa a distribuição dos resultados, temos que os resul- tados são dispersos em forma da curva de sino, onde há um ponto central, e essa curva é simétrica em relação a esse ponto, que representa a média da amostra, que, por sua vez, é igual à Moda (Mo) e à Mediana (Md). Dessa forma, observe que os valores mais prováveis estão concentrados em um ponto central e os menos prováveis nos respectivos extremos, o que nos remete à famosa regra 68 – 95 – 97,7 da Distribuição Normal. 16 17 Figura 5 – Curva Normal e regra 68-95-97,7 Fonte: Acervo do Conteudista Essa regra diz que, na distribuição normal, com média µ e desvio padrão , temos que, aproximadamente: • 68% dos valores estão entre –1σ e 1σ; • 95% dos valores estão entre –2σ e 2σ; • 99,7 dos valores estão entre –3σ e 3σ. O que permite rapidamente análises aproximadas acerca dessas proporções. Como já vimos, há uma relação numérica direta entre a área que se forma sob a curva, que representa a distribuição normal, e a probabilidade de ocorrência de registros de determinada amostra. Essa relação é de extrema importância: já que, como a área abaixo da curva representa todos os dados da amostra, temos então 100% da amostra. Assim, se quisermos calcular a probabilidade de determinados registros ocorrerem, devemos pensar na proporcionalidade entre as áreas que re- presentam os determinados registros, abaixo da curva, e é a partir dessa relação que efetuamos os cálculos das probabilidades de uma distribuição normal. Esse cálculo pode ser realizado por meio do cálculo da integral da área formada pela curva em um dado intervalo, porém, como o cálculo por meio dessa integral é analiticamente complexo, trabalhamos então com uma Tabela Normal Padronizada que permite o cálculo de forma prática e direta. Normal Padronizada ou Reduzida A Curva Normal Padronizada ou Normal Reduzida tem, por convenção, a média igual a zero (média nula) e o desvio-padrão igual a 1. Além disso, muda-se a variável x para uma variável padronizada que chamaremos de z. O cálculo de uma Normal Padronizada torna-se extremamente usual, pois seus valores já são previamente tabulados, o que a torna extremamente prática. 17 UNIDADE Inferência Estatística e Conceitos de Probabilidade Observe o esboço abaixo, como a média é igual a zero, temos que a normal pa- dronizada é simétrica em relação ao zero e seus pontos de inflexão ocorrem em 1 e -1 respectivamente, já que o desvio-padrão considerado é igual a 1. Para a Distribuição Normal Reduzida, temos: o desvio-padrão σ = 1 e média x = 0, e a variável padronizada z. Figura 6 – Área sob a Curva de uma Distribuição Normal Reduzida Fonte: Acervo do Conteudista Decorre do fato de a Normal Padronizada possuir área total igual a 1, e ser cen- trada na média, que temos duas áreas iguais de 0,5 e que são simétricas em relação à média zero. E esse fato é extremamente importante para o cálculo das probabili- dades com a tabela que apresentaremos ainda nesta unidade. Como qualquer outra curva densidade, o cálculo da probabilidade então, por meio da normal reduzida, consiste em associar os intervalos observados à área correspondente sob a curva. Dessa forma, então, dada uma amostra, de característica de distribuição normal, para calcular a probabilidade de determinados registros ocorrerem, devemos asso- ciá-los à normal reduzida e, então, por meio de dados tabelados, obter o resultado. Vejamos, a seguir, como realizar essa associação e calcular a probabilidade. Como Associar uma Distribuição Normal a uma Normal Reduzida? Usualmente, chamamos de “normalizar”, ou ainda “padronizar”, a transforma- ção de uma distribuição normal qualquer para a distribuição normal padronizada. 18 19 O processo consiste em associar a variável x a uma variável z, da seguinte forma: ii x xz σ − = Assim, a partir da variável z, equiparar a área da distribuição normal original para a distribuição padronizada e, então, procurar nos valores tabelados. Veja o exemplo a seguir: • Exemplo 6: Para uma amostra cuja média = 80 e desvio-padrão igual a 16, va- mos calcular a probabilidade de ocorrência para resultados entre 80 ≤ x ≤ 100. Observe, na Figura a seguir, que a probabilidade procuradaé numericamente igual à área formada entre o eixo OX e a curva destacada em vermelho e que, no caso desse intervalo, será 80 ≤ x ≤ 100. Figura 7 – Esboço de Distribuição Normal do exemplo 6 Fonte: Acervo do Conteudista Para calcular essa área, utilizaremos a Normal Padronizada, o que implica ini- cialmente em fazer a relação (transformação) da variável x para a variável padroni- zada z. Logo, se temos: ii x xz σ − = E os dados do exemplo são: x = 80, σ = 16 e xi = 100. Portanto: 100 80 1,25 16 i i x xz σ − − = = = 19 UNIDADE Inferência Estatística e Conceitos de Probabilidade A partir da variável x “padronizada”, ou seja, transformada para a variável z, temos agora o seguinte esboço para a mesma distribuição: Figura 8 – Esboço de Distribuição Normal Reduzida do exemplo 6 Fonte: Acervo do Conteudista Perceba que os intervalos 80 ≤ x ≤ 100 e 0 ≤ x ≤ 1,25 possuem áreas equiva- lentes e, por consequência, mesma probabilidade. Figura 9 – Esboço de Equivalência de Áreas Simétricas do Exemplo 6 Fonte: Acervo do Conteudista O cálculo se torna extremamente simples e prático, uma vez que os dados das áreas da Normal Padronizada são, como já mencionamos antes, tabelados. A tabela que apresentaremos nesta unidade fornece o valor das áreas para da- dos intervalos em que 0 ≤ x ≤ z e é chamada de Tabela Normal Reduzida (z ≥ 0). Outra tabela que também pode ser referência para essas observações é Tabela Normal Acumulada. Tabela 2 – Tabela normal reduzida z ≥ 0 Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 20 21 Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 A partir dos dados contidos nessa tabela, podemos facilmente calcular áreas em outros tipos de intervalos, como veremos nos exemplos a seguir. 21 UNIDADE Inferência Estatística e Conceitos de Probabilidade Importante! Essa tabela apresenta os dados a partir da média 0 (zero) e logo teremos, dependendo da situação, que associar à área simétrica, que está à esquerda da média, porém, há uma outra tabela que traz valores acumulados para a distribuição normal e que também pode ser utilizada. Para análise final dos dados, ambas possuem o mesmo resultado, porém, há uma mudança sutil na leitura e intepretação dos registros. No Material Complemen- tar, indicaremos vídeos com exemplos de como calcular e consultar a tabela acumulada. Importante! Observe, a seguir, um recorte dessa tabela: veja que, na primeira coluna da es- querda, temos o valor inteiro e o primeiro decimal de z. As demais colunas corres- pondem ao segundo decimal do valor de z. Consideraremos o valor z sempre com duas casas decimais. Então, para o valor de z = 1,25, devemos procurar 1,2 na parte inteira e 0,05 para o segundo decimal, conforme segue: Figura 10 – Consulta à Tabela Normal Reduzida referente ao exemplo 6 Fonte: Acervo do Conteudista Note que, no cruzamento da linha de 1,2 (primeira coluna) com a coluna do segundo decimal (0,05), temos o valor igual a 0,3944, que é a área do correspon- dente ao intervalo 0 ≤ z ≤ 1,25. 22 23 Assim, a probabilidade para esse intervalo e que corresponde ao intervalo 80 ≤ x ≤ 100 será igual a 0,3944, ou seja, em uma determinada amostra em que a média é igual a 100, o desvio-padrão igual a 16, a probabilidade de ocorrer um valor de x que esteja entre 80 e 100 é de 0,3944 ou em representação percentual: 39,44%. No próximo exemplo, veremos um intervalo em que a estratégia é a soma das áreas, além disso, também deveremos observar a importância da simetria. Importante ressaltar que, para a busca, a tabela somente apresenta números para z com duas casas decimais e, portanto, números com mais casas decimais devem ser arredondados. Se você estivesse consultado a tabela normal acumulada (também muito usual e presente em diversos livros). O valor para z = 1,25 na tabela seria de 0,8944 porque ela possui a área acumulada, à esquerda da média, e, nesse caso (desse exemplo), teria então que subtrair 0,5 desse valor, obtendo o 0,3944. Note que o resultado final é o mesmo, o que muda é a referência da tabela e sua análise. • Exemplo 7: Em uma amostra de registros das alturas de determinados indiví- duos, na qual a média é igual a 1,6m e o desvio-padrão igual a 0,06m. Qual a probabilidade de um dos registros dessa amostra estar entre os valores de 1,70 e 1,75? O esboço para essa distribuição está na seguinte Figura: Figura 11 – Esboço da Distribuição Normal do Exemplo 7 Fonte: Acervo do Conteudista Transformando para a Normal Reduzida, temos: 1 1,70 1,60 1,67 0,06 z −= = 2 1,75 1,60 2,50 0,06 z −= = 23 UNIDADE Inferência Estatística e Conceitos de Probabilidade E no esboço da Normal Reduzida: Figura 12 – Esboço da Distribuição Normal Reduzida do Exemplo 7 Fonte: Acervo do Conteudista Os valores consultados na tabela Normal Reduzida são: • para 1,67 o valor de 0,4525; • para 2,50 o valor de 0,4938. A área que procuramos está compreendida entre 1,67 e 2,50, como calculá-la então? Os valores observados na tabela são os valoresa partir de 0, tanto para 1,67 como para 2,50. Então o que devemos fazer é subtrair da área formada pelo inter- valo 0 ≤ z ≤ 2,50 a área formada pelo intervalo 0 ≤ z ≤ 1,67 obtendo, assim, a área formada pelo intervalo 1,67 ≤ z ≤ 2,50. Se você estiver com a tabela Normal Acumulada, os valores serão: • para 1,67 o valor de 0,9525; • para 2,50 o valor de 0,9938. E a diferença entre eles é a mesma: 0,0413. Logo, a probabilidade para esse intervalo será 0,4938 – 0,4525 = 0,0413. • Exemplo 8: O nível de produção de uma montadora é uma variável em distri- buição normal com média de 485 peças por dia e desvio-padrão de 18 peças. Se a meta imposta pela gerência é 492, qual é a probabilidade de a produção ser igual ou superior à meta? Da leitura da situação problema, temos que: x = 485, σ = 18, P(x) ≥ 492. Na sequência, devemos “padronizar” para a variável z e construir o esboço para identificar a área que representa a probabilidade procurada. z = (492 – 485)/18 = 0,39 Como esboço para a representação da área já padronizada, temos: 24 25 Figura 13 - Esboço da Distribuição Normal Reduzida do Exemplo 8 Fonte: Acervo do Conteudista Observamos que a área procurada está em um intervalo que não inicia em z = 0. Logo, como a tabela só fornece valores a partir de 0 (Zero), calcularemos então 0 ≤ z ≤ 0,39 e subtrairemos esse valor de 0,5 que corresponde à área para 0 ≤ z. Na tabela, o valor correspondente a 0,39 é igual a 0,1517, portanto, a probabi- lidade será dada por 0,5 – 0,1517 = 0,3483. Logo, a probabilidade de a produção ser igual ou superior à meta (minimante 492 peças) é de 0,3483 ou, em termos percentuais, 34,83%. Veremos agora o processo inverso, ou seja, de uma determinada área vamos encontrar uma variável x que a contemple. Exemplo 9: Em um determinado concurso, cujas pontuações seguem uma dis- tribuição normal, a média da pontuação foi de 485 pontos com desvio-padrão de 18 pontos. Foram relacionados para a segunda fase os candidatos que estavam en- tre os 8% melhores colocados. Qual a pontuação mínima obtida pelos candidatos que foram relacionados para a segunda fase? Importante observar que esse exemplo traz o valor da área e pede o valor de x, ou seja: é o inverso do que estávamos fazendo até então. Os dados informados são: x = 485, σ = 18 , proporção igual ou maior a 8%, portanto, a representação gráfica será: Figura 14 – Esquema Gráfi co da Distribuição do Exemplo 9 Fonte: Acervo do Conteudista 25 UNIDADE Inferência Estatística e Conceitos de Probabilidade Como a informação fornecida é a área sob a curva, realizaremos o cálculo inverso para saber qual valor na tabela normal reduzida corresponde à área informada. Sabemos que os valores que constam na tabela normal reduzida correspondem sempre a valores de áreas para um intervalo a partir do valor zero de z = 0. Logo, na tabela, o valor a ser procurado não poderá corresponder a 0,08, mas sim a 0,42, já que 0,5 – 0,08 = 0,42. Procuraremos, então, na tabela, o valor mais próximo de 0,42 e temos dois possíveis valores que são: 0,4207 e 0,4192. Entre os dois, o mais próximo de 0,42 será 0,4207 já que 0,4207 – 0,42 = 0,0007 e 0,42 – 0,4192 = 0,0008. Sendo 0,4207 o mais próximo, e verificando na tabela, no número de z será igual a 1,41. Figura 15 – Consulta à Tabela Normal Reduzida do Exemplo 9 Fonte: Acervo do Conteudista Sabendo que z = 1,41, x = 485 e σ = 18, vamos aos cálculos para identificar o valor de x. 4851,41 18 4785 1,41 18 25,38 485 510,38 x x x − = − = ⋅ = + = 26 27 Como x = 510,38, então, para estar entre os 8% melhores colocados, ou seja, estar nessa região gráfica, minimamente, a pontuação deve ser de 510,38 pontos. Figu ra 16 – Esboço Gráfi co da Curva Normal para o Exemplo 9 Fonte: Acervo do Conteudista Na Figura representada, podemos observar que é justamente a partir de 510,38 pontos que estão os 8% melhores pontuados, nessa distribuição normal, cuja média é 485 pontos e desvio-padrão de 18 pontos. Bem, chegamos ao fim desta unidade, releia o texto, assista à videoaula, refaça os exemplos numéricos e veja o material complementar indicado. Sobre o que vimos nesta unidade, é importante que você saiba reconhecer a diferença entre população e amostra, parâmetros e estimadores, bem como a diferença entre mo- delos probabilísticos discretos e contínuos, sobretudo para o cálculo de probabilida- des dos modelos contínuos que ficam então associados ao cálculo da área sob uma curva de densidade de distribuição. Bons estudos! 27 UNIDADE Inferência Estatística e Conceitos de Probabilidade Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Livros A estatística básica e sua prática MOORE, D. S.; NOTZ, W. I.; FLIGNER M. A. A estatística básica e sua prática. Tradução de Ana Maria Lima de Farias. Rio de Janeiro: LTC, 2017. Para melhor aprofundamento dos temas tratados nesta unidade, leia os capítulos 12 e 13 do livro. Nesta unidade, fiz uma recuperação de informações sobre a Distribuição Normal que você também pode encontrar no capítulo 3 do mesmo livro. Vídeos Tabela Normal Padrão: como usar. Distribuição Normal de Probabilidades Para compreender melhor como fazer a leitura de uma Tabela Normal Reduzida, assista ao vídeo do prof. Conrad Pinheiro. https://youtu.be/OTyc8gUHqv0 Distribuição de Probabilidade – Como usar a tabela da distribuição normal Sobre a Tabela Normal Acumulada e a diferença para a Tabela Normal Reduzida. https://youtu.be/ec9HWoY2kt8 Tabela distribuição Normal Reduzida Neste video, você terá acesso à resolução de exercícios utilizando a Tabela de Distribuição Normal Reduzida. https://youtu.be/xtLjpZ1XjzQ 28 29 Referências MOORE, D. S.; NOTZ, W. I.; FLIGNER M. A. A estatística básica e sua prática. Tradução de Ana Maria Lima de Farias. Rio de Janeiro: LTC, 2017. 29
Compartilhar