Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 2 SEBASTIÃO GAZOLA é professor lotado no Departamento de Estatística da Universidade Estadual de Maringá – UEM. Mestre em Engenharia de Produção pela UFSC e doutor em Agronomia pela UEM. Ministra disciplinas de estatística nos diversos cursos de graduação da UEM. IVANI APARECIDA BASSO DA SILVA é professora lotada no Departamento de Estatística da Universidade Estadual de Maringá – UEM. Mestre em Estatística pela UEL. Ministra disciplinas de estatística nos diversos cursos de graduação da UEM. 3 Apresentação do livro Este livro de Introdução à Estatística tem o objetivo de servir como apoio didático aos alunos iniciantes no estudo de estatística. Consideramos que o texto pode ser usado de maneira eficaz como um curso básico para qualquer estudante interessado nas aplicações dos métodos estatísticos. A leitura do texto não exige conhecimento de matemática além do nível dos cursos do ensino médio. Estruturalmente, iniciamos o livro com alguns conceitos básicos no capítulo 1 e com uma introdução às técnicas de amostragem no capítulo 2. Prosseguimos o texto com a análise descritiva dos dados realizada por meio da apresentação dos dados no capítulo 3 e das medidas descritivas no capitulo 4. Uma introdução à teoria de probabilidade e alguns modelos probabilísticos, que são necessários para o desenvolvimento dos capítulos posteriores, são apresentados no capitulo 5. Para um conhecimento inicial da inferência estatística apresentamos as distribuições amostrais e a estimação de parâmetros no capitulo 6 e no capítulo 7 alguns testes de hipóteses. Ao final foram citadas as referências utilizadas para o desenvolvimento deste material as quais recomendamos como complementação do conteúdo apresentado. No anexo estão algumas tabelas necessárias para as aplicações da metodologia. 4 Sumário Capítulo 1: Introdução .......................................................................... 1.1 Conceitos Básicos .............................................................................. Capítulo 2: Técnicas de Amostragem ................................................... 2.1 Amostragem Probabilística ................................................................ 2.1.1 Amostragem Aleatória Simples .................................................. 2.1.2 Amostragem Aleatória Sistemática ............................................ 2.1.3 Amostragem Aleatória Estratificada .......................................... 2.2 Amostragem Não-Probabilística ................................................... Capítulo 3: Apresentação de Dados ...................................................... 3.1 Tabelas e Gráficos de dados Qualitativos ......................................... 3.2 Tabelas e Gráficos de dados Quantitativos ....................................... Capítulo 4: Medidas Descritivas .......................................................... 4.1 Medidas de Posição ou Tendência Central ....................................... 4.2 Medidas de Dispersão ........................................................................ 4.3 Medidas de Simetria ........................................................................... Capítulo 5: Noções de Probabilidade E Principais Distribuições ...... 5.1 Definições Básicas ............................................................................. 5.2 Introdução à Probabilidade ................................................................ 5.3 Distribuições Teóricas de Probabilidade ............................................ 5.3.1 Variáveis Aleatórias ................................................................... 5.3.2 Distribuições de Probabilidade ................................................... 5.3.3 Distribuição Binomial ................................................................ 5.3.4 Distribuição de Poisson .............................................................. 5.3.5 Distribuição Normal ................................................................... Capítulo 6: Distribuições Amostrais e Estimação de Parâmetros .... 6.1 Distribuições Amostrais ..................................................................... 00 5 6.1.1 Distribuição Amostral da Média ................................................ 6.1.2 Distribuição Amostral da Diferença de Médias ......................... 6.1.3 Distribuição Amostral da Proporção .......................................... 6.2 Estimação por Ponto .......................................................................... 6.3 Estimação por Intervalo ..................................................................... 6.3.1 Intervalos de Confiança para a Proporção (p) Populacional .... 6.3.2 Intervalos de Confiança para a Média Populacional com Variância Conhecida ................................................................ 6.3.3 Intervalos de Confiança para a Média Populacional com Variância Desconhecida ........................................................... Capítulo 7: Testes de Hipóteses ............................................................ 7.1 Construção de um Teste de Hipóteses para o Parâmetro µ ............... 7.2 Construção de um Teste de Hipóteses para o Parâmetro P ............... 7.3 Teste para Comparação de Variâncias de duas Populações ............. 7.4 Teste para a Comparação de duas Médias Populacionais para Amostras Independentes .................................................................. 7.5 Teste para a Comparação de duas Médias Populacionais para Dados Emparelhados (Amostras Dependentes) ........................................... 7.6 Teste de Associação Qui-quadrado ................................................... Anexos: Tabela de Números Aleatórios Tabelas de distribuições de probabilidade 6 Capítulo 1 INTRODUÇÃO 7 A estatística tem grande aplicação na maioria das áreas do conhecimento humano, como por exemplo, área de Ciências Biológicas, Ciências da Saúde, Ciências Sociais Aplicadas, Ciências Agrárias e outras. Quando necessitamos tomar decisões com base em conjuntos de dados, a estatística ensina como coletar, organizar, analisar e interpretar esses dados para tirar conclusões adequadas. Dentre as diversas definições de estatística, citamos: Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, a organização, a descrição, a análise e a interpretação de dados, visando a tomada de decisões (CRESPO, 1995, p. 13). Estatística é a ciência dos dados. Envolve a coleta, a classificação, o resumo, a organização, a análise e a interpretação da informação numérica. (VIEIRA, 1999). A Estatística envolve técnicas para coletar, organizar, descrever, analisar e interpretar dados, ou provenientes de experimentos, ou vindo de estudos observacionais (BARBETTA; REIS; BÓRNIA, 2004 p. 11). A Estatística pode ser didaticamente classificada em duas áreas: a estatística descritiva e a inferencial. A estatística descritiva é a parte da estatística que tem por objetivo coletar, descrever e analisar dados de determinada população, sem pretender conclusões de caráterextensivo. Utiliza métodos numéricos e gráficos para resumir e mostrar o comportamento dos dados. A estatística inferencial, fundamentada na teoria matemática das probabilidades, é a parte da estatística que, baseando-se em resultados obtidos na análise de amostras da população, procura inferir ou estimar leis de comportamento da população da qual a amostra foi retirada. 8 1.1 CONCEITOS BÁSICOS População: É o conjunto de elementos sobre o qual desejamos obter informações. A população pode ser FINITA ou INFINITA. Representamos por “N” o número de elementos da população. Censo: É o processo utilizado para levantar as características observáveis, abordando todos os elementos de uma população. Exemplo: Desejamos conhecer a faixa-etária dos alunos do curso de Ciências Biológicas – Ensino a Distância. Qual é a população de interesse? Todos os alunos matriculados no curso de Ciências Biológicas a Distância. Parâmetros: São características numéricas obtidas da população. Exemplo: média da altura dos alunos do Curso de Ciências Biológicas – Educação a Distância. Amostra: É um subconjunto retirado de uma população, obtido através de técnicas de amostragem. O número de elementos da amostra representamos por “n”. Exemplo: Em uma pesquisa de opinião para saber o resultado das eleições para presidente do Brasil, qual a população de interesse? Qual seria a amostra? A população é constituída de todos os eleitores do Brasil. A amostra seria um subconjunto (por exemplo, de n=2.000 eleitores) da população. Amostragem: É o processo de se extrair ou obter amostras. Estatísticas: São características numéricas obtidas da amostra. Exemplo: média da altura obtida de uma amostra dos alunos do Curso de Ciências Biológicas – Educação a Distância. Variável: É a característica que está sendo analisada em cada elemento de uma população. Exemplo: Na população de alunos do Curso de Ciências Biológicas – Educação a Distância, podemos estudar as variáveis peso, idade, sexo, etc. As variáveis podem ser classificadas conforme o quadro 1. 9 Quadro 1: Classificação das variáveis Qualitativas: Quando seus valores são expressos por atributos (não numéricas). Podem ser: - Nominais (sexo, estado civil, etc.) - Ordinais (Grau de escolaridade) Quantitativas: São as inerentemente numéricas. Podem ser: - Contínuas: Quando podem assumir valores num intervalo. (peso, altura, etc.) - Discretas: Quando assumem valores pontuais, geralmente de números inteiros. (número de filhos de um casal, número de aparelhos de TV vendidos no mês, etc.) Em geral, as medições dão origem às variáveis contínuas e as contagens ou enumerações, as variáveis discretas. 10 Capítulo 2 TÉCNICAS DE AMOSTRAGEM 11 Para que um conjunto de dados produza resultados úteis é necessário fazer um planejamento para a coleta destes dados. As decisões do dia-a-dia estão direta ou indiretamente baseadas em dados observados. Os dados observados devem produzir informações que atendam nossas indagações e que sejam confiáveis. Para tal, a coleta dos dados e a análise devem ser realizadas com critérios. Em geral, os parâmetros de uma população são desconhecidos, pois na prática nem sempre é possível observar toda a população. Então, é muito comum observarmos apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter valores aproximados, ou estimativas, para as características populacionais de interesse. Este tipo de pesquisa é usualmente chamado de levantamento por amostragem. Num levantamento por amostragem, a seleção dos elementos que serão observados deve ser feita sob uma metodologia adequada, de tal forma que os resultados da amostra sejam informativos para avaliar características de toda a população. Assim, antes de selecionarmos uma amostra, é preciso conhecermos as técnicas de amostragem. As amostras devem ser tão grandes quanto possível, pois quanto maior o tamanho da amostra, maior é a confiança nos resultados. As amostras muito pequenas, em geral, não dão boas estimativas. Como se determina o tamanho da amostra será ensinado no capítulo de inferência. Quadro 2.1 Vantagens em realizar o censo e a amostragem. Censo Amostragem - População pequena - Tamanho da amostra grande em relação à população - Exigência de precisão completa - População infinita - Tempo limitado - Teste destrutivo - Custo muito alto CÁLCULO DO NÚMERO DE AMOSTRAS: Dada uma população qualquer de N elementos, o número de amostras de tamanho n, possíveis, é dado por: Nn - Quando é feita a reposição do elemento sorteado, amostragem com reposição. n N - Quando não é feita a reposição do elemento sorteado, amostragem sem reposição. Exemplo: Considere a população {1,2,3,4,5,6}. O número de amostras possíveis de tamanho n=2, é: 12 Com reposição: Nn = 62 = 36 - Sem reposição: n N = 2 6 = 15 TAMANHO DA AMOSTRA: As amostras devem ser tão grandes quanto possível, pois quanto maior o tamanho da amostra, maior é a confiança que se tem nos resultados. As amostras muito pequenas, em geral, não dão boas estimativas. Por outro lado, amostras muito grande, porém mal feitas, são piores porque dão idéia de conter uma verdade que não contem. Como se determina o tamanho da amostra será ensinado no capítulo 6. 2.1. AMOSTRAGEM PROBABILÍSTICA A amostragem probabilística ou aleatória é aquela em que cada elemento da população tem a mesma probabilidade p (dada por n/N) conhecida, 0<p<1, de pertencer à amostra. 2.1.1 Amostragem Aleatória Simples Esta amostragem é feita através de sucessivos sorteios. Para selecionarmos uma amostra aleatória simples é necessário termos uma lista de todos os elementos da população. A amostra pode ser realizada com reposição (quando o elemento sorteado volta para a população, ou seja, pode ser sorteado de novo) ou sem reposição (quando o elemento sorteado não pode ser sorteado de novo). Para populações pequenas numeramos todos os elementos da população e efetuamos sucessivos sorteios, sem reposição, até completarmos o tamanho da amostra. Para populações grandes, usamos a tabela de números aleatórios (Tabela 1 do anexo) ou os números aleatórios fornecidos por uma calculadora ou um software computacional. Exemplo 2.1 Com o interesse de conhecermos algumas características dos alunos de uma turma de graduação com 45 alunos, vamos extrair uma amostra aleatória de 6 alunos. a) Numeramos todos os elementos da população. Os números devem ter a mesma quantia de algarismos. Assim temos: 01 Ariane, 02 Bernardo, ..., 45 Viviane. 13 b) Tomamos n=6 números aleatórios do conjunto {01, 02, ... , 45}, desprezando os números que estão fora do conjunto e os que se repetem. Os números podem ser tomados da tabela de números aleatórios, de uma calculadora que contenha a função números aleatórios ou ainda usando um software computacional. c) Verificamos quais os alunos que correspondem aos números selecionados aleatoriamente. Estes são os alunos que formam a amostra aleatória simples. 2.1.2 Amostragem Aleatória sistemática O processo consiste em sortearmos o primeiro elemento de um intervalo denominado “intervalo de amostragem” e selecionarmos sistematicamente os demais. É mais utilizada quando os elementos da população estão numerados. Para selecionarmos os elementos sistematicamente é preciso: a) Calculamoso intervalo de amostragem, dado por, K=N/n, desprezando as decimais (K deve ser arredondado para cima). b) Sorteamos um número entre os números 1,2, ...,K. c) Selecionamos o elemento de cada intervalo de amostragem, correspondente ao número sorteado. Exemplo 2.2 Vamos supor uma população de 800 alunos de certa Faculdade, já numerados, de onde se quer extrair uma amostra de 50 alunos. a) Determinamos o intervalo de amostragem: K=N/n=800/50=16 b) Selecionamos 1 (um) número aleatório de 1 a 16, usando uma calculadora ou a tabela de números aleatórios. Tomamos os números da posição correspondente ao número sorteado a cada intervalo de amostragem de 16 elementos. Supomos que o número sorteado seja 7. Os números que farão parte da amostra são: 7, 23, 39, 55, ..., 775, 791. c) Verificamos quais os alunos correspondentes a estes números e então temos a amostra. 2.1.3 Amostragem Aleatória Estratificada Consiste em dividir uma população heterogênea em subpopulações (ou subgrupos) mais ou menos homogêneas. As subpopulações são chamadas de “estratos”, dos quais são extraídas amostras do tipo aleatória simples ou sistemática, independentes de estrato para 14 estrato. A amostra final é obtida através da união das amostras de cada estrato. Geralmente, os estratos são de tamanhos diferentes em função de buscarmos a homogeneidade dentro de cada estrato com relação à característica em estudo. Assim, a amostragem estratificada pode ser obtida de duas formas: Amostragem Estratificada Proporcional: O tamanho da amostra de cada estrato é proporcional ao tamanho de cada estrato em relação à população. Desta forma, cada elemento da população tem a mesma probabilidade de pertencer à amostra. Exemplo 2.3 Desejamos fazer um estudo dos alunos do ensino médio de uma escola pública para investigar o uso de bebidas alcoólicas. A escola tem três turmas de 1ª série (125 alunos), duas de 2ª (75 alunos) e uma de 3ª série (50 alunos) num total de 250 alunos. Desejamos realizar um levantamento por amostragem, de tamanho n=50 alunos. a) Determinamos os estratos por série e o tamanho da amostra proporcional a cada estrato. Tabela 2.1 Cálculo do tamanho proporcional da amostra por estrato. Estrato A (1ª série) Estrato B (2ª série) Estrato C (3ª série) N. de alunos NA=125 NB=75 NC=50 Proporção pA=125/250=0,5 pB=75/250=0,3 pC=50/250=0,2 Amostra nA==0,5.(50)=25 nB=0,3.(50)=15 nC=0,2.(50)=10 b) Para cada estrato selecionamos a amostra usando a amostragem aleatória simples ou a sistemática. Não é necessário utilizar a mesma técnica em todos os estratos. c) A amostra final é composta pelas amostras dos três estratos. Amostragem Estratificada Uniforme: O tamanho da amostra de cada estrato é o mesmo. E usada quando desejamos comparar os diversos estratos. No exemplo 2.1, para obtermos uma amostra aleatória estratificada uniforme de tamanho n=30, devemos selecionar 10 alunos de cada estrato. 15 2.1.4 Amostragem de Conglomerados Conglomerado é um agrupamento de elementos da população. Por exemplo, num carregamento de laranjas, as caixas de laranjas são os conglomerados. A amostragem consiste em selecionarmos aleatoriamente algumas caixas de laranja e analisarmos toda a caixa ou ainda, fazer uma nova seleção aleatória de elementos (laranjas) de cada caixa. 2.2. AMOSTRAGEM NÃO-PROBABILÍSTICA A amostragem não-probabilística é aquela em que os elementos da população não têm todos a mesma probabilidade de pertencer à amostra. Isto pode ocorrer em situações tais como a inacessibilidade a toda a população, população formada por material contínuo (líquido ou sólido). Em tais situações é mais adequada uma amostragem não-aleatória. Porém procuramos gerar amostras que representam razoavelmente bem a população. 16 EXERCÍCIOS 1) Uma clínica veterinária possui os registros dos animais que atende organizados em um arquivo. Descreva o procedimento para obter uma amostra aleatória sistemática de tamanho igual a 1/3 do total de animais atendidos. 2) Um pesquisador tem 5 gaiolas que contém, cada uma, 4 ratos. Descreva a maneira de selecionar 1 rato de cada gaiola, para compor uma amostra de tamanho n=5. 3) Dada uma população de 10 alunos {Aline, Beatriz, Carlos, Darlei, Eliane, Fabíola, Geraldo, Hélio, Isabela e João}. Obtenha todas as possíveis amostras distintas, do tipo sistemática, de 5 elementos. 4) Dada uma população de 125 alunos, estabeleça uma forma de obter uma amostra casual simples de 10 alunos. 5) Os dados abaixo se referem aos pesos (em gramas) de animais de laboratório. 250 272 276 257 363 298 281 260 276 295 285 277 261 299 310 318 295 320 312 255 281 315 306 296 310 275 312 265 315 288 305 265 269 276 284 291 273 294 288 299 306 318 291 267 298 305 286 257 305 290 291 275 260 271 259 289 281 295 297 313 290 298 265 271 260 305 312 303 293 285 288 255 274 283 296 302 318 320 251 262 a) Selecione uma amostra aleatória de tamanho n=8, através de uma amostragem aleatória simples. b) Selecione uma amostra aleatória de tamanho n=8, através de uma amostragem aleatória sistemática. c) Divida a população em dois estratos: Estrato A: pesos menores que 300 gramas e Estrato B: pesos maiores ou iguais a 300 gramas. Selecione uma amostra estratificada proporcional de tamanho n=16, através de uma amostragem sistemática, considerando os estratos. 17 Capítulo 3 APRESENTAÇÃO DE DADOS 18 A apresentação de dados estatísticos pode ser feita por meio de tabelas ou gráficos. A tabela é o resumo de um conjunto de observações, dispostos ordenadamente em linhas e colunas. As tabelas são constituídas por: Cabeçalho: é a parte superior da tabela, apresentando as variáveis envolvidas e indicando as respostas numéricas. Corpo da tabela: é a distribuição numérica das observações em relação à variável. Coluna indicadora: é a coluna da variável principal e suas variações. As respostas são colocadas em ordem alfabética e apenas a primeira letra maiúscula. Total: é optativo, mas quando utilizado deve aparecer em destaque, ou seja, deixar um espaço de uma variável antes de inserir o total. Quanto às informações: Título: é a indicação que precede a tabela e que contém a designação do fato observado, o local e a época em que foi registrado. (o que? onde? quando?). Fonte: a indicação da entidade responsável pelo fornecimento dos dados ou pela sua elaboração. Notas: são informações de natureza geral, destinados a conceituar ou esclarecer o conteúdo das tabelas, ou a indicar a metodologia utilizada no levantamento ou na elaboração dos dados. Chamadas: são informações de natureza específica sobre determinada parte da tabela, destinadas a conceituar ou esclarecer dados. Quanto à sua divisão: Traços horizontais: separam o cabeçalho e aparece no final da tabela. Salientamos ainda que o primeiro traço e o último devem ser mais fortes ou duplos. Traços verticais: só aparecem para destacar a coluna indicadora do corpo da tabela. Os demais traços verticais se necessário devem ser feitos apenas no cabeçalho. O gráfico estatístico produz, no público em geral, uma impressão rápida e viva do fenômeno em estudo. Os gráficos são constituídos por: Título: acima do gráfico, completo, claro e conciso; Fonte: abaixo do gráfico; Legenda: não deve prejudicar a leitura do gráfico. 19 Forma: a altura do gráfico deve ter, aproximadamente, 75% da largura, de modo que, incluindo o título, legenda e o rodapé, a moldura do gráficoassuma mais ou menos, a forma quadrada. Tipos de gráficos: Os gráficos mais utilizados na estatística são os diagramas e esteriogramas. Daremos maior enfoque ao aprendizado dos diagramas, dentre os quais se destacam: Gráficos de Colunas: É a representação de dados por meio de retângulos, dispostos verticalmente. Gráficos em Barras: É a representação de dados por meio de retângulos, dispostos horizontalmente. Gráficos de Linhas: É a representação de dados por meio de uma linha. Gráficos de Setores: É a representação de dados com base em um círculo, e é empregado sempre que se deseja ressaltar a participação de uma parte em relação ao total. Gráficos Comparativos: É a representação de mais de uma variável em um mesmo gráfico. 3.1 TABELAS E GRÁFICOS DE DADOS QUALITATIVOS As variáveis qualitativas são aquelas em que seus valores são expressos por atributos (não numéricas), por exemplo, sexo, estado civil, graus de escolaridade, etc. Temos dois tipos de tabelas: a) Tabela simples: É a representação de valores de uma única variável. Tabela 3.1: Grau de escolaridade de uma amostra de moradores do Bairro Sanenge, Maringá – PR, 2004. Grau de escolaridade Número Percentual 1ª a 4ª série 23 22,5 5ª a 8ª série 22 21,6 2º grau 44 43,1 3º grau 6 5,9 Sem escolaridade 7 6,9 Total geral 102 100,0 Fonte: Alunos do ensino médio do Colégio Estadual Silvio M. Barros. 20 22,5 21,6 43,1 5,9 6,9 0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0 40,0 45,0 50,0 1ª a 4ª série 5ª a 8ª série 2º grau 3º grau Sem escolaridade Percentagem Figura 3.1 Grau de escolaridade de uma amostra dos moradores do Bairro Sanenge, Maringá – PR, 2004. b) Tabela de dupla entrada ou de contingência: É a representação, em uma única tabela, de valores de mais de uma variável, isto é, a conjugação de duas tabelas. Tabela 3.2 Grau de escolaridade versus sexo de uma amostra de moradores do bairro Sanenge, Maringá - PR, 2004. Grau de escolaridade Sexo 1ª a 4ª s. 5ª a 8ª s. 2º grau 3º grau Sem esc. Total Masculino 10 5 10 3 1 29 Feminino 13 17 34 3 6 73 Total 23 22 44 6 7 102 Fonte: Alunos do ensino médio do Colégio Estadual Silvio M. Barros. 10 5 10 3 1 13 17 34 3 6 0 5 10 15 20 25 30 35 40 1ª a 4ª série 5ª a 8ª série 2º grau 3º grau Sem esc. Fr eq u ên ci a Masculino Feminino Figura 3.2 Grau de escolaridade versus sexo dos moradores do bairro Sanenge, Maringá - PR, 2004. 21 3.2 TABELAS E GRÁFICOS DE DADOS QUANTITATIVOS Muitas vezes, nós trabalhamos com variáveis quantitativas com muitos valores distintos, de forma que sua análise fica cansativa e não é possível visualizar a distribuição dos dados. As tabelas para variáveis quantitativas discretas ou contínuas são construídas levando em consideração a frequência com que os dados aparecem no conjunto, ou seja, o número de vezes em que ele se repete. Estas tabelas são chamadas de distribuição de frequências. Há dois tipos de tabelas de distribuição de frequências: de variável discreta e de variável contínua. 3.2.1 Distribuição de Frequências para Variáveis Discretas Quando temos poucos resultados diferentes para a variável fazemos a contagem dos dados para cada valor. Exemplo 3.1: Vamos supor que foram contados os filhos de 138 famílias da cidade de Maringá, em 2004. A tabela de distribuição de frequências (Tabela 3.3) do número de filhos das famílias é construído através da contagem das repetições dos resultados observados. Tabela 3.3 Distribuição de frequências do número de filhos de 138 famílias que residem em Maringá, 2004. N0 de Filhos N0 de Famílias 0 5 1 30 2 55 3 30 4 10 5 5 6 3 Total 138 Fonte: Dados fictícios A representação gráfica pode ser feita de duas maneiras, por hastes verticais sobre os valores observados (Figura 3.3) ou retângulos justapostos e com a mesma largura (Figura 3.4). 22 5 30 55 30 10 5 3 0 10 20 30 40 50 60 0 1 2 3 4 5 6 Número de filhos N úm er o de fa m íli as Figura 3.3 Distribuição de frequências do número de filhos de 138 famílias que residem em Maringá-PR, 2004. 5 30 55 30 10 5 3 0 10 20 30 40 50 60 0 1 2 3 4 5 6 Número de filhos N úm er o de fa m íli as Figura 3.4 Distribuição de frequências do número de filhos de 138 famílias que residem em Maringá-PR, 2004. Quando temos muitos valores diferentes da variável devemos criar classes de valores de ocorrência de modo análogo ao que é feito para variáveis contínuas que veremos a seguir. 3.2.2 Distribuição de Frequências para Variáveis Contínuas 23 Quando a variável é do tipo contínua, os valores observados dificilmente se repetem, então, a forma apropriada de resumir os dados é através da distribuição de frequências em classes ou intervalos. Exemplo 3.2: Supõe-se que foram coletados os pesos de 100 alunos. A tabela de distribuição de frequências (Tabela 3.4) do peso dos alunos é construída através da contagem dos valores observados em cada intervalo. Tabela 3.4 Distribuição de frequências dos pesos dos alunos da disciplina de estatística da UEM, 2004. Peso em kg Freqüência 50 ├─── 55 55 ├─── 60 60 ├─── 65 65 ├─── 70 70 ├─── 75 75 ├─── 80 80 ├─── 85 85 ├─── 90 90 ├─── 95 95 ├─── 100 2 3 10 14 30 18 11 7 4 1 TOTAL 100 Fonte: Dados fictícios Construção da Tabela de Distribuição de Frequências em Classes. a) Crítica dos dados: É a verificação que se deve fazer nos dados, após sua coleta, a procura de possíveis falhas, imperfeições e erros. b) Dados brutos (xI): É o conjunto de dados numéricos obtidos após a crítica dos valores coletados x1, ..., xn (se amostrais) e x1, ..., xN (se populacionais). c) Rol: É o arranjo dos dados brutos em ordem crescente ou decrescente. d) Amplitude total (AT): É a diferença entre o maior e o menor valor dos dados observados. AT = xmáx-xmín. e) Número de Classes (k): A sintetização dos dados em tabelas nos leva a separá-los em subconjuntos segundo “k “ classes de valores. Existem diversas maneiras para se encontrar o número de classes (k), uma delas é a raiz quadrada do número de elementos ( k n= ou k = N ). Na realidade, a prática do pesquisador é que vai determinar se o número de classes é razoável, levando em conta a amplitude total (AT) e o número de elementos (n ou N). Recomendamos (5 ≤ k ≤ 12). 24 f) Amplitude das classes (h): É o intervalo de valores estabelecido para cada classe, que é dado por h = AT/k. h tem que ter o mesmo número de casas decimais que os escores e deve ser arredondado somente para um valor maior. g) Limites de classes (li ou Li): São os valores extremos de cada intervalo de classe representados por: li = limite inferior e Li = limite superior Notações entre os limites de classes: ├──┤ inclui os dois limites na classe. ├── inclui somente o limite inferior. ──┤ inclui somente o limite superior. ─── não inclui nenhum do limites. h) Frequências absolutas de classes (FI ): É o número de dados cujos valores pertencem a cada classe. O limite superior da última classe pode ser obtido por: LK = l1 + h.K Colunas complementares na tabela de distribuição de frequências i) Ponto médio de classe ( xi ): É o valor que representa os elementos de uma classe dado por: xi=(Li+li)/2 j) Frequências absolutas acumuladas (Fai): Consiste em acumular o número de dados de uma dada classe acrescido de todos os dados das classes anteriores. k) Frequências relativas (fiou fi %): É a proporção ou percentual de dados em cada classe, dada pela expressão: fi=Fi/n ou fi%=(Fi/n).100 l) Frequências absolutas acumuladas percentuais (Fai %): Traduzem a percentagem de dados acumulados até a classe “ i ”: Fai%=(Fai/n).100 Exemplo 3.3 Vamos construir a tabela de distribuição de frequências para os pesos (kg) de 28 alunos de certa universidade. 58 49 65 79 73 84 81 76 67 63 52 61 48 55 63 75 81 52 66 68 74 70 69 72 58 67 67 60 a) Colocamos os dados em ordem crescente (rol). 48 55 61 66 68 73 79 49 58 63 67 69 74 81 52 58 63 67 70 75 81 52 60 65 67 72 76 84 b) Calculamos a amplitude total (AT): AT = xmáx-xmín=84-48=36 kg c) Definimos o número de classes (k): k n 28 5,29= = = . 25 Podemos considerar 5 ou 6 classes. Vamos usar 6 classes. d) Determinamos o tamanho da classe (h): h = AT/k=36/6=6. e) Construímos a tabela de distribuição de frequências e determinamos as frequências absolutas de classes (FI): Por exemplo, na primeira classe existem 4 valores: 48, 49, 52, 52. Tabela 3.5 Distribuição de frequências para os pesos (kg) de 28 alunos de uma certa universidade. Peso em kg Frequência (FI) 48 ├─── 54 54 ├─── 60 60 ├─── 66 66 ├─── 72 72 ├─── 78 78 ├───┤84 4 3 5 7 5 4 Total 28 Colunas complementares na tabela de distribuição de frequências: f) Calculamos o ponto médio de cada classe (xi): x1=(L1+l1)/2=(54+48)/2=51. Assim, procedemos para cada classe. g) Calculamos as frequências absolutas acumuladas (Fai): o valor acumulado da primeira classe consiste no valor da frequência absoluta, o valor acumulado da segunda classe é a soma dos valores das frequências absolutas da primeira e segunda, e, assim, sucessivamente se acumula o número de dados de uma dada classe acrescido de todos os dados das classes anteriores. Tabela 3.6 Distribuição de frequências e colunas complementares para os pesos (kg) de 28 alunos de uma certa universidade. Peso em kg Frequência (FI) Ponto Médio (xi) Fai fi fi% Fai% 48 ├─── 54 54 ├─── 60 60 ├─── 66 66 ├─── 72 72 ├─── 78 78 ├───┤84 4 3 5 7 5 4 51 57 63 69 75 81 4 7 12 19 24 28 0,143 0,107 0,179 0,250 0,179 0,143 14,3 10,7 17,9 25,0 17,9 14,3 14,3 25,0 42,9 67,9 85,8 100,0 Total 28 1,000 100,0 26 h) Calculamos as frequências relativas (fi ou fi %): f1=F1/n=4/28=0,143, ... f6=F6/n=4/28=0,143. Em percentual, multiplicamos por 100 a fi. i) Calculamos as frequências absolutas acumuladas percentuais (Fai%): Fa1%=(Fa1/n)100=(4/28)100=14,3% ... Fa6%=(Fa6/n)100=100,0% Construção de Gráficos de Distribuição de Frequências em Classes. A representação gráfica é feita de três formas: Histogramas: As classes da distribuição de frequências são representadas por colunas justapostas, cujas alturas são definidas pelas respectivas frequências absolutas (Fi). O histograma é construído sobre os intervalos de classe e as áreas dos retângulos que o compõem representam proporcionalmente os dados cujos valores ocorrem em cada classe. Polígonos de frequências: É um gráfico de área construído unindo-se os pontos (xi ; Fi) onde xi são os pontos médios dos intervalos de classe e Fi são as frequências absolutas das classes. Cria-se no eixo das abcissas um ponto médio aquém do menor valor de xi e outro além do maior valor de xi, para que o polígono fique definido e tenha equivalência de área com o histograma da mesma distribuição. Suavizando a linha poligonal que define o polígono obtém-se uma curva que visualiza a tendência de variação dos dados. Polígonos de frequências acumuladas ou ogivas: As ogivas (mais utilizadas) são construídas unindo os pontos (Li ; Fai) ou (Li ; Fai%), onde Li são os extremos superiores dos intervalos de cada classe. Para a tabela 3.4 os gráficos são apresentados nas Figuras 3.5, 3.6 e 3.7. 2 3 10 15 29 18 11 7 4 1 0 5 10 15 20 25 30 35 50 55 60 65 70 75 80 85 90 95 100 Peso em kg Fr eq üê n ci a 27 Figura 3.5 Histograma de frequências dos pesos dos alunos da disciplina de estatística da UEM, 2004. 0 5 10 15 20 25 30 35 47 , 5 52 , 5 57 , 5 62 , 5 67 , 5 72 , 5 77 , 5 82 , 5 87 , 5 92 , 5 97 , 5 10 2, 5 Peso em kg Fr eq u en ci a Figura 3.6 Polígono de frequências dos pesos dos alunos da disciplina de estatística da UEM, 2004. 0 2 5 15 29 59 77 88 95 99 100 0 20 40 60 80 100 120 50 55 60 65 70 75 80 85 90 95 100 Peso em kg Fr eq u ên ci a Figura 3.7 Polígono de frequências acumuladas dos pesos dos alunos da disciplina de estatística da UEM, 2004. 28 EXERCÍCIOS 1) Numa pesquisa por amostragem, realizada com 25 pessoas em um supermercado, levantaram-se as seguintes informações: Aluno Número de pessoas na família Sexo Grau de escolaridade Idade Renda familiar (R$) 1 3 M Fundamental 32 1200 2 2 F Médio 45 1500 3 4 F Fundamental 38 1000 4 3 M Fundamental 35 950 5 5 M Médio 41 750 6 2 M Superior 40 1800 7 1 F Superior 39 2200 8 1 F Superior 33 1100 9 2 M Médio 36 1600 10 2 F Fundamental 35 2000 11 5 M Superior 33 1250 12 3 F Fundamental 40 1400 13 7 M Médio 42 1800 14 4 M Superior 45 1700 15 6 F Fundamental 36 1700 16 6 M Médio 40 1500 17 5 F Médio 36 2000 18 4 F Superior 38 1700 19 2 M Superior 43 1800 20 3 F Fundamental 38 2100 21 3 F Médio 41 2000 22 3 M Superior 35 1300 23 4 M Médio 40 1500 24 3 F Superior 34 1200 25 4 F Médio 41 1500 a) Classificar o tipo de cada variável. b) Construir uma tabela de distribuição de frequências adequada para cada variável. b) Construir os gráficos adequados para cada variável. 29 Capítulo 4 ANÁLISE DE DADOS 30 4.1 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL São medidas que objetivam representar, através de um só número, características quantitativas dos dados. São elas: a média, a mediana e a moda. a) Média. Representa o ponto de equilíbrio de um conjunto de dados. Seja (x1,...,xn ) um conjunto de dados. Média da amostra: n x x i∑ = e Média da população: N x µ i∑ = Para obtemos a média em tabelas de distribuição de frequências usamos a seguinte expressão: ∑ ∑ = i ii F F x x . - Para tabelas sem intervalos de classe, xi são os valores da variável. - Para tabelas com intervalos de classe, xi corresponde ao ponto médio do intervalo. Algumas propriedades da média: 1) A soma algébrica dos desvios (di) tomados em relação a média é nula. di = xi - x e ∑ = k 1i di = 0 2) Somando ou subtraindo uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada ou diminuída dessa constante. yi = xi ± c ⇒ y = x ± c 3) Multiplicando ou dividindo todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada ou dividida por essa constante. yi = xi . c ⇒ y = x . c e c xy c xy ii =⇒= b) Moda. É o valor que ocorre com maior frequência em um conjunto de dados. Existem séries em que nenhum valor aparece mais vezes que outros (séries amodais). Em outros casos, pode aparecer dois (bimodal), três (trimodal), ou mais valores de concentração. Para localizar o valor da moda, usamos os dados em rol. A moda de dados de tabelas de distribuição de frequênciasé apurada, geralmente, pela expressão de Czuber. 31 )F(F)F(F )Fh.(FlM 1ii1ii 1ii io +− − −+− − += (i representa a classe de maior frequência). c) Mediana. A mediana de um conjunto de valores ordenados segundo uma ordem de grandeza é a medida que ocupa a posição central do conjunto de dados, ou seja, ela divide o conjunto em duas partes iguais, 50% dos valores estão abaixo e 50% estão acima do valor da mediana. Se a série tiver um número ímpar de termos, a Md é o valor que está no centro da série. Neste caso, determina-se a mediana da seguinte forma: Md = xp onde p=(n+1)/2 é a posição do elemento central. Se a série tiver um número par de termos, temos dois elementos ocupando o centro da série, então, a mediana é a média aritmética destes elementos, calculada da seguinte forma: p p+1 d x + x M 2 = (p=n/2 é a posição do primeiro elemento central da série). A mediana de dados de tabelas de distribuição de frequências em classes é calculada por: i 1i id F )Fah.(plM −−+= . ( p n / 2= e i representa a classe que contém o menor valor de Fai , para o qual Fai≥n/2). A mediana divide um conjunto de dados em duas partes iguais, assim, a mediana é uma medida separatriz. Existem outras separatrizes, que não são medidas de tendência central, mas tem similaridade com a mediana. Uma medida separatriz que muitas vezes é de interesse do pesquisador é o “Quartil”. Quartis (Qi): Denominamos quartis os valores de uma série que a divide em quatro partes iguais. O primeiro quartil (Q1) delimita os 25% menores valores, o terceiro quartil (Q3) delimita os 25% maiores valores e o segundo quartil é a própria mediana que separa os 50% menores dos 50% maiores valores. Para calcularmos os quartis, organizamos os dados em ordem crescente. Obtemos a mediana, que é o segundo quartil. 32 Obtemos o primeiro quartil, procedendo como se fosse calcular a mediana dos dados menores que a mediana já calculada. Obtemos o terceiro quartil, procedendo como se fosse calcular a mediana dos dados maiores que a mediana já calculada. Os quartis para dados de tabelas de distribuição de frequências em classes são calculadas da seguinte forma: k i-1 i i h.(p-Fa )Q =l + F Onde: - i é a classe que contém o quartil ( Q1 , Q2 , Q3 ) -K é a ordem do quartil: K = 1, 2, 3 -p é a posição do quartil desejado e é calculado pela expressão: np= .K 4 Exemplo 4.1 Obtenha as medidas de posição para os dados do exemplo 3.3. a) média: n x x i∑ = = (48+49+ ... +84)/28=66,179 kg O peso médio dos alunos é de 66,179 kg, que representa o ponto de equilíbrio do conjunto de dados. b) moda: A moda é o valor da série que ocorre com maior frequência. O valor 67 kg ocorreu três vezes, é a moda da série. Mo=67 kg. c) mediana: Como a série tem número par de termos, temos dois elementos ocupando o centro da série. Então, a mediana é a média aritmética destes elementos, calculada da seguinte forma: p=n/2=28/2=14, assim: p p+1 14 15d x + x x + x 67 + 67M = 67 2 2 2 = = = Logo, 50% dos alunos têm peso abaixo de 67 kg. d) quartis: Primeiro quartil: i=1/4(28+1)=7,25 , temos então que o primeiro quartil é: 33 Q1=x7,25= x7+0,25(x8-x7)=58+0,25(60-58)=58,5 Terceiro quartil: i=3/4(28+1)=21,75 , temos então que o terceiro quartil é: Q3=x21,75= x21+0,75(x22-x21 )=73+0,75(74-73)=73,75 Exemplo 4.2 Obtenha as medidas de posição dos dados da tabela 3.5 de distribuição de frequências. a) média: ∑ ∑ = i ii F F x x = (51.4+ ... +81.4)/28=66,857 kg O peso médio dos alunos obtido da distribuição de frequências é de 66,857 kg. b) moda: )F(F)F(F )Fh.(FlM 1ii1ii 1ii io +− − −+− − += (i representa a classe de maior frequência). A classe de maior frequência absoluta é i=4. Assim, temos: 4 4 1 o 4 4 4 1 4 4 1 h.(F F ) 6.(7 5)M l 66 69(F F ) (F F ) (7 5) (7 5) − − + − − = + = + = − + − − + − A moda obtida da distribuição de frequências é de 69 kg. c) mediana: i 1i id F )Fah.(plM −−+= . (p=28/2=14 e i=4 representa a classe que contém o menor valor de Fai=19>14). Assim: i 1 4 1d i 4 i 4 h.(p Fa ) h.(p Fa ) 6.(14 12)M l l 66 67,714 F F 7 − − − − − = + = + = + = A mediana obtida da distribuição de frequências é de 67,714 kg. d) quartis: Primeiro quartil: Posição: p=(n/4).k =28/4.1=7. A posição do quartil desejado e é a classe 2. k i-1 2-1 i 2 i 2 h.(p-Fa ) h.(p-Fa ) 6.(7-4)Q =l + l + 54+ 60 F F 3 = = = Terceiro quartil: Posição: p=(n/4).k =28/4.3=21. A posição do quartil desejado e é a classe 5. k 5-1i-1 i 5 i 5 h.(p-Fa )h.(p-Fa ) 6.(21-19)Q =l + l + 72+ 74,4 F F 5 = = = 34 4.2 MEDIDAS DE DISPERSÃO São medidas estatísticas que visam fornecer o grau de variabilidade ou dispersão dos dados pesquisados, utilizando como referência uma medida de tendência central (geralmente utilizamos a média). As medidas de dispersão são importantes em termos de análise, pois dois ou mais conjuntos de dados podem estar centrados em um mesmo valor (medidas de tendência central), mas seus valores poderão estar muito mais dispersos num conjunto do que no outro. As medidas de dispersão que nos interessam são: a amplitude total, a variância, o desvio-padrão e o coeficiente de variação. a) Variância e desvio padrão. A variância e o desvio padrão são medidas que avaliam a dispersão dos dados de forma a complementar as informações contidas na média. A variância é a medida que fornece o grau de variabilidade ou dispersão dos dados em torno da média, na unidade quadrática. Dados originais Distribuição de frequências Amostral ( ) 1n xx s 2 i2 − − = ∑ ( ) 1n Fxx s i 2 i2 − − = ∑ Populacional ( ) N µx σ 2 i2 ∑ − = ( ) N Fµx σ i 2 i2 ∑ − = O desvio-padrão é a medida que fornece o grau de variabilidade ou dispersão dos dados em torno da média na unidade dos dados. Amostral Populacional 2ss = 2σσ = b) Coeficiente de variação. O coeficiente de variação (CV) mede a variação ou dispersão dos dados em termos relativos, pois ao dividir o desvio-padrão pela média, a unidade de medida é cancelada. Assim, o coeficiente de variação é muito útil quando se quer comparar as variações de diferentes unidades de medida. Quanto mais próximo de 0 ou 0%, menor a 35 variabilidade dos dados. Para valores do cv ≤ 50%, a média é representativa dos dados. Quanto mais próximo de 1 ou 100%, maior a variabilidade dos dados. Neste caso, cv > 50%, a média não representa bem o conjunto de dados. Amostral: CV%=(s/ x ).100 Populacional; CV%=(σ/µ).100 Exemplo 4.3 Obtenha as medidas de dispersão para os dados do exemplo 3.3. a) variância: ( ) 1n xx s 2 i2 − − = ∑ ( ) ( )2 2 2 2i2 x x 48 66,179 (49 66,179) ... (84 66,179)s 97,707 n 1 28 1 − − + − + + − = = = − − ∑ ∑ É a dispersão dos dados em relação a média, na unidade quadrática. b) desvio padrão: 2ss = 2s s 97,707 9,885= = = É a dispersão dos dados em relação a média na unidade original. c) coeficiente de variação: CV%=(s/ x ).100=(9,885/66,179).100=14,94%. Como o valor do CV<50%, a média é representativa do conjunto de dados. Exemplo 4.4 Obtenha as medidas de dispersão para os dados da tabela 3.5. a) variância é: ( ) ( )2 2 2i i2 x x F 51 66,857 .4 ... (81 66,857) .4s 93,901 n 1 28 1 − − + + − = = = − − ∑ ∑ b) desvio padrão: 2s s 93,901 9,690= = = c) coeficiente de variação: CV%=(s/ x ).100=(9,690/66,857).100=14,49%.4.3 MEDIDAS DE SIMETRIA Tem por objetivo básico medir o quanto uma distribuição se afasta da condição de simetria. Pode ser: 36 a) Simétrica: Quando a média e a mediana coincidem. b) Assimétrica negativa: Quando a média é menor que a mediana. c) Assimétrica positiva: Quando a média é maior que a mediana. Uma medida possível para quantificar a assimetria de uma distribuição é a dada pelo primeiro coeficiente de assimetria de Pearson. Populacional:: A Ms o= −µ σ e Amostral: A x M s s o = − Onde: As = 0 ( distribuição simétrica ). As > 0 ( assimétrica positiva ). As < 0 ( assimétrica negativa ). Exemplo 4.5 Analisar a simetria para os dados do exemplo 3.3. Temos que: média=66,179<67=moda<67,7=mediana. Calculo do coeficiente de assimetria de Pearson: os x M 66,179 67A 0,083 s 9,885 − − = = = − = Logo, os dados têm assimetria negativa. Exemplo 4.6 Analisar a simetria dos dados da tabela 3.5 de distribuição de frequências. Temos que: média=66,643< mediana=67,7<moda=70. Calculo do coeficiente de assimetria de Pearson: os x M 66,643 70A 0,356 s 9,429 − − = = = − = Logo, os dados têm assimetria negativa. 37 EXERCÍCIOS 1) Numa pesquisa realizada com 46 alunos, levantaram-se as seguintes informações: Número de filhos nas famílias 0 1 2 3 4 5 Número de famílias 2 6 17 15 4 2 a) Construir uma tabela de distribuição de frequências. b) Construir os gráficos adequados. a) Calcular e interpretar as seguintes medidas: média; mediana; moda; variância; desvio padrão; coeficiente de variação e coeficiente de assimetria. 2) O quadro abaixo mostra o número de faltas de 30 alunos nas aulas de certa disciplina, durante todo o curso. Aluno Nº de faltas Aluno Nº de faltas Aluno Nº de faltas 1 2 3 4 5 6 7 8 9 10 3 1 8 1 5 1 4 3 2 6 11 12 13 14 15 16 17 18 19 20 1 2 2 1 5 7 1 5 6 1 21 22 23 24 25 26 27 28 29 30 5 2 1 2 1 4 5 6 1 3 a) Construir uma tabela de distribuição de frequências. b) Calcular e interpretar as seguintes medidas: média; mediana; moda; variância; desvio padrão; coeficiente de variação e coeficiente de assimetria. 3) Para os dados da variável “número de pessoas na família” do exercício 1 do capítulo 3, calcule as seguintes medidas: média; mediana; moda; variância; desvio padrão; coeficiente de variação e coeficiente de assimetria. 4) Para os dados da variável “idade” e “renda familiar” do exercício 1 do capítulo 3, calcule: a) nos dados em rol: média; mediana; moda; variância; desvio padrão; coeficiente de variação e coeficiente de assimetria. 38 b) nos dados da tabela de distribuição de frequências: média; mediana; moda; variância; desvio padrão; coeficiente de variação e coeficiente de assimetria. 5) A tabela abaixo mostra a distribuição de frequências das notas de 40 alunos. Nota do aluno Freqüência Ponto médio 0├─── 2 2├─── 4 4├─── 6 6├─── 8 8├─── 10 2 4 9 15 10 1,0 3,0 5,0 7,0 9,0 Total 40 ---- Calcular e interpretar as seguintes medidas descritivas: média; mediana; moda; variância; desvio padrão e coeficiente de variação. 39 Capítulo 5 NOÇÕES DE PROBABILIDADE E PRINCIPAIS DISTRIBUIÇÕES 40 Em suas origens, a estatística teve por função principal a organização e a apresentação de dados coletados empiricamente. O desenvolvimento da teoria das probabilidades permitiu à estatística, a criação de técnicas mais adequadas de amostragem e formas de relacionar as amostras e as populações de onde provieram essas amostras. Nos tópicos anteriores, foi visto que a distribuição das frequências das observações de um fenômeno é recurso poderoso para entender a variabilidade do mesmo. Com a teoria da probabilidade pode-se criar um modelo teórico que reproduza muito bem a distribuição das frequências quando o fenômeno é observado diretamente. Tais modelos são chamados modelos de probabilidades ou distribuições de probabilidades e são consideradas a espinha dorsal da teoria estatística, pois todos os processos inferenciais são aplicações de tais modelos ou distribuições. 5.1 DEFINIÇÕES BÁSICAS Experimento Probabilístico: É todo experimento em que verificamos as condições: a) Podemos repetir indefinidamente, sempre nas mesmas condições; b) Antes de realizá-lo não podemos prever o resultado que será obtido; c) O resultado obtido pertence a um conjunto conhecido de possíveis resultados. Espaço Amostral: É o conjunto de todos os resultados possíveis de um experimento probabilístico e é, geralmente, representado por S. Exemplo 5.1 Como exemplo consideremos os experimentos: a) “Jogar um dado e observar o número mostrado na face de cima”. b) “Jogar uma moeda e observar a face voltada para cima”. c) “Escolher um aluno de uma escola e verificar seu tipo sanguíneo” Para esses experimentos, temos, respectivamente, os seguintes espaços amostrais: a) S={1, 2, 3, 4, 5, 6} b) S={c , k}, onde c denota cara e k denota coroa. c) S={A, B, O, AB} O espaço amostral de um experimento probabilístico pode ser finito ou infinito. 41 Evento: É qualquer subconjunto de resultados possíveis, ou seja, qualquer subconjunto do espaço amostral. Exemplo 5.2 Para o exemplo 5.1 acima, podemos definir os eventos: a) A={2,4,6}={ocorre número par} ; B={5,6}={ocorre número maior que 4} b) A={c}={ocorre cara} ; B={k}={ocorre coroa} c) A={O}={aluno com sangue tipo O} O próprio S, espaço amostral, é um evento chamado evento certo, o conjunto vazio também é um evento, chamado evento impossível. Eventos com apenas um elemento do espaço amostral é chamado evento simples. Dois eventos A e B são mutuamente exclusivos se não possuem elementos comuns, ou seja, A∩ B=∅ . Operações Com Eventos: Seja S um espaço amostral e sejam A e B subconjuntos ou eventos de S. Assim temos: a) União: O evento A ∪ B é formado pelos pontos do espaço amostral que pertence a pelo menos um dos eventos, ou seja, A ∪ B ocorre quando ou A, ou B, ou ambos ocorrem. b) Intersecção: O evento A ∩ B é formado pelos pontos do espaço amostral que pertencem simultaneamente aos dois eventos, ou seja, A ∩ B ocorre quando A e B ocorrem simultaneamente. c) Complementação: O evento complementar Ac é formado pelos pontos do espaço amostral que não pertencem ao evento A, ou seja, Ac é o evento que ocorre se A não ocorre. Exemplo 5.3 No lançamento de duas moedas, sejam, A={saída de faces iguais} e B={saída de cara na primeira moeda}. Então: O espaço amostral é S={(c , c) , (c , k) , (k , c), (k , k)} A = {(c , c) , (k , k)} e B = {(c , c) , (c , k)} A ∪ B = {(c , c) , (c , k) , (k , k)}, A ∩ B = {(c , c)} e Ac = {(c , k) , (k , c)} 42 5.2 INTRODUÇÃO À PROBABILIDADE Definição: A cada evento A de um espaço amostral S, associamos um número real P(A) denominado probabilidade de A, tal que: 0≤P(A)≤1 e P(S)=1 Esta definição não nos diz como calcular P(A). Apenas nos dá algumas propriedades gerais que P(A) deve ter. Antes de aprendermos como calcular P(A), vejamos outras propriedades: Propriedades: a) P(∅)=0 b) P(Ac)=1-P(A) c) P(A ∪ B)=P(A)+P(B)-P(A∩B). Se A e B forem mutuamente excludentes então P(A ∪ B)=P(A)+P(B) d) Se S for finito, então a soma das probabilidades de todos osresultados possíveis é igual a 1. e) P(Ac∪Bc)=P((A∩B)c) =1 – P(A∩B). Resultados Igualmente Prováveis (Definição clássica): Seja A um evento qualquer de um espaço amostral S. Se os eventos simples de S têm todos a mesma probabilidade de ocorrência, ou seja, são equiprováveis, podemos calcular a probabilidade do evento A como: N(A)P(A)= N(S) , onde N(A), é o número de elementos de A e N(S) é o número de elementos de S. Exemplo 5.4 Consideremos o exemplo em que um dado é lançado e o evento B que ocorrerá se, e somente se, um número maior que 4 aparecer, isto é, B={5,6}. Consequentemente, P(B)=2/6=1/3 já que S={1,2,3,4,5,6} é um espaço equiprovável. 43 Exemplo 5.5 Para o experimento do lançamento de uma moeda o espaço amostral S também é equiprovável. Assim, para os eventos A={c} e B={k}, temos P(A) = P(B) = ½. Frequência Relativa como Aproximação da Probabilidade (Definição frequentista): Na maioria das situações práticas, os eventos simples do espaço amostral não são equiprováveis e não podemos calcular probabilidades usando a definição clássica. Uma forma de lidar com essas situações é obter alguns dados empíricos na tentativa de estimar as probabilidades. Para isso, usamos o conceito de frequência relativa como estimativa de probabilidade da seguinte forma: Seja E um experimento e A um evento. Se após n realizações do experimento E, com n suficientemente grande, forem observados x resultados favoráveis ao evento A, então um estimativa da probabilidade P(A), é dada pela frequência relativa: fA=x/n, ou seja, P(A) ~ fA É muito importante saber que fA e P(A) não são a mesma coisa. Nós apenas utilizaremos fA para aproximar P(A), ou seja, se nós identificarmos fA com P(A), deveremos compreender que estaremos tão somente substituindo o valor de P(A) por uma aproximação obtida experimentalmente. A qualidade desta estimativa depende do número de repetições do experimento. Quanto maior o número de repetições, a estimativa mais se aproxima do verdadeiro valor da probabilidade, ou seja, A n P(A)= lim f →∞ Exemplo 5.6 Uma amostra de 6800 pessoas de uma determinada população foi classificada quanto à cor dos olhos e à cor dos cabelos conforme tabela a seguir. Tabela 5.1 Distribuição conjunta de frequências da cor dos olhos e dos cabelos. Cor dos cabelos Cor dos olhos Loiro Castanho Preto Ruivo TOTAL Azul 1768 807 189 47 2811 Verde 937 1139 485 53 2614 Castanho 115 438 288 16 857 Preto 9 248 261 - 518 TOTAL 2829 2632 1223 116 6800 44 Consideremos o sorteio de uma pessoa dessa amostra e suponhamos que os eventos de interesse sejam: A={a pessoa tem olhos azuis}; C={a pessoa tem cabelos castanhos}. Assumindo que o número de repetições do experimento é grande, podemos usar a frequência relativa como aproximação da probabilidade desses eventos ocorrerem, ou seja: P(A) = amostra na pessoas de número azuis olhos de pessoas de número = 6800 2811 = 0,4134 P(C) = amostra na pessoas de número castanhos cabelos de pessoas de número = 6800 2632 = 0,3871 Vamos supor agora que queremos saber a probabilidade da pessoa ter olhos azuis e cabelos castanhos. O evento {a pessoa tem olhos azuis e cabelos castanhos} é chamado de evento interseção e é representado por A∩C. Assim, P(A∩C) = 6800 807 = 0,1187 O evento {a pessoa tem olhos azuis ou cabelos castanhos} é chamado de evento união e é representado por A∪C. A probabilidade do evento união nesse caso será. P(A∪C)=P(A)+P(C)-P(A∩C) = 0,4134 + 0,3871 - 0,1187 = 0,6818 A probabilidade do evento {a pessoa não tem olhos azuis} é a probabilidade do evento Ac: P(Ac)=1-P(A) = 1 - 0,4134 = 0,5866 Exemplo 5.7 Supomos que em uma universidade 50% dos alunos falam inglês, 20% falam espanhol e 5% falam os dois idiomas. Qual a probabilidade de um aluno falar pelo menos um desses idiomas? Consideremos os eventos A={o aluno fala inglês}, B={o aluno fala espanhol} e A∩B={o aluno fala inglês e espanhol}. Temos que P(A)=0,5, P(B)=0,2 e P(A ∩ C)=0,05. O evento {o aluno fala pelo menos um desses idiomas} corresponde ao evento A ou B, ou seja, A∪B. Logo P(A∪B)=P(A)+P(B)-P(A∩B) = 0,5 + 0,2 - 0,05 = 0,65. Assim, a probabilidade de o aluno falar pelo menos um desses idiomas é de 65%. 45 Probabilidade Condicional e Independência: A probabilidade de um evento A ocorrer, sabendo que um outro evento B já ocorreu, é chamada de “probabilidade condicional de A dado B”. Essa probabilidade é representada por P(A/B) e calculada por: P(A/B) = )B(P )BA(P ∩ Esta expressão pode ser reescrita na forma chamada “regra do produto”: P(A ∩ B) = P(A/B)P(B). Dois eventos são independentes quando a ocorrência de um não interfere na probabilidade de ocorrência do outro, ou seja, P(A/B)=P(A). Assim, se A e B são independentes, da regra do produto temos: P(A∩B)=P(A)P(B) A probabilidade de um evento Ac ocorrer, sabendo que um outro evento B já ocorreu, isto é, P(Ac/B) e calculada por: P(Ac/B) = 1 - P(A/B) Exemplo 5.8 Para o exemplo 5.6 a probabilidade do evento {a pessoa tem olhos azuis sabendo que possui cabelos castanhos}, é: P(A/C) = )C(P )CA(P ∩ = 3871,0 1187,0 = 0,3066 Por outro lado, a probabilidade do evento {a pessoa não tem olhos azuis sabendo que possui cabelos castanhos}, é: P(Ac/C) = 1 - P(A/C) = 1 - 0,3066 = 0,6934 Exemplo 5.9 Um casal deseja ter 2 filhos. Qual a probabilidade de ambos serem do sexo masculino? Os eventos M={nascer uma criança do sexo masculino} e F={nascer uma criança do sexo feminino} são equiprováveis. Logo, P(M) = P(F) = ½. Por outro lado, a ocorrência do evento A={o primeiro filho é do sexo masculino} não altera a probabilidade de ocorrência do evento B={o segundo filho é do sexo masculino}. Assim, A e B são independentes e a probabilidade do evento A∩B={o primeiro filho é do sexo masculino e o segundo filho é do sexo masculino} será dada por: P(A∩B)=P(A)P(B)=(1/2)(1/2)=1/4 46 Teorema da Probabilidade Total: Considere um espaço amostral particionado em k eventos, C1, C2, ... Ck e satisfazendo as seguintes propriedades: a) Cj∩Cj) ≠ φ para todo i ≠ j; b) C1∪C2 ... ∪ Ck = Ω e c) P(Cj) > 0 para todo i. Seja E um evento de interesse do espaço amostral. Então: F=(F∩C1)∪(F∩C2)∪ ... ∪(F∩Ck). Onde os eventos (F∩Ci) (i=1,...,n) são mutuamente exclusivos entre si. A probabilidade de ocorrer o evento B é dada por: P(F)=∑ = k 1i ii )).P(F/CP(C Exemplo 5.10: Supomos que uma caixa 1 tem duas bolas brancas e duas bolas pretas, a caixa 2 tem duas bolas brancas e uma bola preta e a caixa 3 tem uma bola branca e três bolas pretas. Se selecionarmos ao acaso uma bola, qual é a probabilidade de ela ser branca? Se soubermos de qual caixa é a bola selecionada, a resposta seria simples. Como você não sabe qual é a caixa, o teorema da probabilidade total permite solucionarmos esse problema. Sejam os eventos C1 , C2 e C3 (representando as caixas) e o evento B (representando bola branca). Os eventos Ci são mutuamente exclusivos. O evento B tem intersecção com todos os Ci. Supomos a mesma probabilidade para todas as caixas: P(C1)= P(C2)= P(C3)=1/3. A probabilidade de bola branca para cada caixa é: P(B/C1)=1/2, P(B/C2)=2/3 e P(B/C3)=1/4. A probabilidade de bola branca é dada por: P(B)= P(C1) e P(B/C1) ou P(C2) e P(B/C2) ou P(C3) e P(B/C3) = P(C1).P(B/C1) + P(C2).P(B/C2) + P(C3).P(B/C3)= 1/3.1/2 + 1/3.2/3+1/3.1/4=1/6+2/9+1/12=17/36. 47 Teorema da Bayes. O teorema de Bayes está relacionado com teorema da Probabilidade Total. As condições são as mesmas, eventos mutuamente exclusivos e exaustivos e um evento qualquer. O teorema deBayes permite obter a probabilidade de um evento ocorrer sabendo-se que um outro evento ocorreu. Para o caso das três caixas é possível calcular: Qual a probabilidade da bola ser da caixa B sabendo-se que ela é branca? Usando a expressão da probabilidade condicional P(A/B) = P A B P B ( ) ( ) ∩ e a regra do produto P(A∩B) = P(B).P(A/B), pode-se escrever o teorema de Bayes: P(CI/F) = P(F) )).P(F/CP(C II Onde P(F)=∑ = k 1i ii )).P(F/CP(C Exemplo: Sabendo-se que a bola é branca, qual a probabilidade dela ser da caixa 2? Temos, calculado no exemplo anterior, que a probabilidade da bola ser branca é: P(B)= P(C1) e P(B/C1) ou P(C2) e P(B/C2) ou P(C3) e P(B/C3) = P(C1).P(B/C1) + P(C2).P(B/C2) + P(C3).P(B/C3)= 1/3.1/2 + 1/3.2/3+1/3.1/4=1/6+2/9+1/12=17/36. Suponha a mesma probabilidade para todas as caixas, P(C1)= P(C2)= P(C3)=1/3. A probabilidade de bola branca para a caixa 2 é P(B/C2)=2/3. Então P(C2/B) = P(B) )).P(B/CP(C 22 = 17/36 1/3.2/3 =2/9.36/17=8/17 5.3 DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADE Uma distribuição de probabilidade é um modelo probabilístico aplicável aos fenômenos cujos resultados exatos em cada experimento futuro são imprevisíveis. O estudo de tais modelos é o objetivo da teoria de probabilidade e sua aplicação só é possível nas situações em que há incerteza quanto à ocorrência ou não dos eventos estudados. Em todo modelo matemático é essencial o conceito de variável, assim também é no modelo probabilístico que por estar associado a fenômenos aleatórios sua variável recebe o nome especial de “variável aleatória”. 48 5.3.1 Variáveis Aleatórias É uma função definida no espaço amostral S, que costuma ser representada por X, e cujo valor é um número real determinado pelo resultado de uma experiência aleatória. As variáveis aleatórias podem ser de dois tipos: a) Discretas: quando assume valores num conjunto finito ou infinito, mas numerável. b) Contínuas: quando assume qualquer valor real num conjunto infinito não enumerável. Exemplo 5.11: São exemplos de variáveis aleatórias: a) No de caras no jogo de duas moedas. b) Nº de glóbulos brancos por unidade de volume de sangue humano c) Peso dos alunos de certa universidade. 5.3.2 Distribuição de Probabilidade Quando associamos a cada ponto do espaço amostral a correspondente probabilidade de ocorrência do evento, obtemos a distribuição das probabilidades do experimento. Se além disso, associamos a esses mesmos pontos uma variável aleatória indicadora obtemos uma distribuição que pode ser entendida como a distribuição das probabilidades das variáveis aleatórias associadas aos pontos do espaço amostral. A distribuição assim obtida nos mostra como a probabilidade total se divide pelos diversos resultados possíveis do experimento. Distribuição ou Função de Probabilidade Discreta: É a função P(X=x)=p(x) que atribui a cada valor da variável aleatória a sua probabilidade de ocorrência e que satisfaz as seguintes condições: a) p(x) ≥ 0 , ∀ x e b) ∑ = i i 1)x(p Se X é uma variável discreta e x1, x2, ... , são seus valores, a distribuição de X pode também ser representada pela tabela abaixo: Valores de X x1 x2 ... Total P(X=xi) p(x1) p(x2) ... 1 49 Exemplo 5.12 Na jogada de duas moedas, o espaço amostral é S = { cc, ck, kc, kk }, onde c=cara e k = coroa. Seja X a variável aleatória que represente o número de caras. A distribuição de probabilidade de X é: Valores de X 0 1 2 Total P(X=xi) 0,25 0,5 0,25 1,0 Distribuição ou Função Densidade de Probabilidade Contínua: É a função f(x) que satisfaz as seguintes condições: a) f(x) ≥ 0 , ∀ x ∈R e b) 1dx)x(f =∫ ∞ ∞− c) P(a≤X≤b) = P(a≤X<b) = P(a<X≤b) = P(a<X<b) = ∫ b a dx)x(f Note que P(a ≤ X ≤ b) é igual à área sob a curva f(x) do segmento horizontal (a , b): P(X=a) = ∫ a a dx)x(f = 0 Média e Variância de uma Variável Aleatória: Tal como a distribuição de frequências de uma variável qualquer, também uma distribuição de probabilidade pode ser descrita usando uma medida de tendência central e uma medida de dispersão. A média ou valor esperado de uma variável aleatória é uma medida do centro de uma distribuição, representada por E(X) e dada por: a) E(X) = ∑ )x(px ii para variáveis aleatórias discretas b) E(X) = ∫ dx)x(xf para variáveis aleatórias contínuas Uma medida de dispersão em relação ao valor médio, é dada pela variância que pode ser representada por σ2 ou Var(X): σ 2 = Var(X) = E[(X-E(X))2] = E(X2) - [E(X)]2 . O desvio padrão é dado por: 2σ= σ =DP(x)= Var(x) Onde: i 2 2 iE(X ) x p(x )=∑ para variável discreta. 2 2E(X ) x f (x)dx= ∫ para variável contínua. 50 Exemplo 5.13 Para o experimento do exemplo 5.12, a média ou valor esperado é: Média: E(X) = ∑ )x(px ii =0.0,25+1.0,5+2.0,25=1,0. Variância: E(X2) = i 2 ix p(x )∑ =02.0,25+12.0,5+22.0,25=1, 5. σ 2 = Var(X) = E(X2) - [E(X)]2 =1,5 – (1)2=0,5. Desvio padrão: 2σ= σ = Var(x) = 0,5=0,707 . Quadro 5.1 Propriedades da média e da variância. média variância a) E(a)=a b) E(a+bX)=a+bE(X) c) E(X+Y)=E(X)+E(Y) d) Se X e Y forem independentes E(XY)=E(X).E(Y) a) Var(X)≥0 b) Var(a) = 0 c) Var(aX+b)=(a)2Var(X) d) Se X e Y forem independentes Var(X+Y)=Var(X)+Var(Y) 5.3.3 Distribuição Binomial Uma das mais importantes distribuições (ou modelos) de probabilidades para variáveis aleatórias discretas é a distribuição Binomial. O modelo Binomial se aplica a toda situação em que um conjunto de provas repetidas satisfaz as seguintes condições: a) As diversas provas se realizam sob condições idênticas; b) Cada prova comporta apenas dois resultados possíveis, mutuamente exclusivos, designados por sucesso (representado por 1) e falha (representado por 0); c) A probabilidade de sucesso, representada por p é a mesma em cada prova, e permanece constante durante todo o experimento. A probabilidade de falha representada por q é também constante, e q=(1-p), de modo que (p+q)=1. d) As provas são independentes umas das outras. O conhecimento do sucesso (ou falha) de uma delas não modifica a probabilidade de sucesso (ou falha) nas provas subsequentes. Uma variável que comporta somente uma única repetição do experimento e dois resultados possíveis como na condição (b) acima se chama variável de Bernoulli. 51 Seja então um experimento que consiste em um número fixo n de repetições independentes de Bernoulli, com probabilidade p (constante) de sucesso em cada repetição. X será a variável aleatória que dá o número x de sucessos em n ensaios. A distribuição de probabilidade da variável aleatória X é chamada distribuição binomial com n repetições e probabilidade p de sucesso. Designa-se por b(n,p), onde n e p são os parâmetros da distribuição. Naturalmente, os valores possíveis da variável aleatória X são os inteiros 0, 1, 2, ... n. Como cada repetição só comporta dois resultados distintos - sucesso ou falha - mutuamente exclusivos, a ocorrência de k sucessos em n ensaios deve ser acompanhada de n-k falhas. Sendo p a probabilidade de sucesso e (1-p)=q a probabilidade de falha, temos que a probabilidade de ocorrência de k sucessos e n-k falhas, numa dada ordem, é, pelo princípio fundamental da contagem, pkqn-k . Mas como só interessa o número de sucesso e falhas, e não a ordem que ocorrerem, há k n disposições possíveis daquelas ocorrências. Finalmente, a função de probabilidade de X é: P(X=k)= k n pkqn-k , k= 0, 1, ... , n.Média e Variância da Distribuição Binomial: Se X é a variável aleatória com distribuição binomial e parâmetros n e p, então: E(X)=np e Var (X)=npq Exemplo 5.13 Determine a probabilidade de obtermos um único 6 em três jogadas de um dado. Em dezoito jogadas quantas vezes podemos esperar que saia o número 6? Neste caso, sucesso é obter o número 6 e como n=3, os valores possíveis de X serão: 0, 1, 2, 3. Além disso, a probabilidade de sucesso em cada jogada é p=1/6 e como queremos a probabilidade de se obter apenas um (1) sucesso, temos: P(X=1) = ( )31 16 56 0 352 = , . O número médio ou esperado de ocorrência do número 6 em n=18 jogadas é: E(X)=np=18.1/6=3 52 Exemplo 5.14 Em uma prova com 10 questões do tipo verdadeiro ou falso, qual a probabilidade de um aluno acertar “por palpite” ao menos oito? Neste caso, a probabilidade do aluno acertar (sucesso) é igual à probabilidade de errar (falha), ou seja, p = q = 0,5. Além disso, n=10 e os valores possíveis de X são: 0, 1, 2,...,10. A probabilidade do aluno acertar ao menos oito questões é a soma das probabilidades de acertar 8, 9 ou 10 questões. P( X≥8)= P(X=8) + P(X=9) + P(X=10) 8 10-8 9 10-9 10 10-1010 10 10P(x 8) 0,5 .0,5 + 0,5 .0,5 + 0,5 .0,5 =0,0547 8 9 10 ≥ = A probabilidade de um aluno acertar ao menos oito questões é de 5,47%. 5.3.4 Distribuição de Poisson Esta distribuição é muito usada quando desejamos obter a probabilidade de ocorrência de eventos em intervalos de tempo, ou superfície, ou volume, tais como: a) número de chamadas telefônicas durante um intervalo de tempo. b) número de falhas de um computador em um dia. c) número de acidentes de trabalho em uma empresa num determinado mês. De modo geral, dizemos que a variável aleatória X tem uma distribuição de Poisson com parâmetro λ>0 se: P(X = k) = !k e kλλ− , k = 0, 1, 2, ... . Média e Variância da Distribuição de Poisson: Podemos facilmente demonstrar que: E(X) = VAR(X) = λ Assim, λ representa o número médio de tais eventos ocorrendo no intervalo considerado. Exemplo 5.15 Suponhamos que 10.000 bactérias movam-se independente e aleatoriamente em um volume de 20000 cm3. a) Qual a probabilidade de um cm3 escolhido ao acaso não conter bactérias? b) Qual a probabilidade de um cm3 escolhido ao acaso conter mais de 53 uma bactéria? Ou ainda, c) qual a probabilidade de dois cm3 escolhidos ao acaso conterem duas bactérias? Se X é a v.a. que representa o número de bactérias presentes em um cm3, temos: a) O número médio de bactérias por cm3 é: E(X) = λ = (10000/20000) = 0,5 P(X = 0) = -0,5 0e .(0,5) 0! = 5,0e− = 0,6065. Assim, a probabilidade de um cm3 escolhido ao acaso não conter bactérias é 60,65%. b) P(X > 1) = 1 – (P(X = 0) + P(X = 1)) = 1 – (0,6065 + -0,5 1e (0,5) 1! ) = 1 – 0,9097 = 0,0903. Assim, a probabilidade de um cm3 escolhido ao acaso conter mais de uma bactéria é 9,03%. Se Y é a v.a. que representa o número de bactérias presentes em dois cm3, temos: c) O número médio de bactérias por 2cm3 é: E(Y) = λ = 2(0,5) = 1 e, portanto: P(Y = 2) = !2 )1(e 21− = 0,1839. Assim, a probabilidade de dois cm3 escolhidos ao acaso conterem duas bactéria é 18,39%. Aproximação da Binomial pela Poisson Para n grande e p pequeno, podemos aproximar a distribuição Binomial pela distribuição de Poisson. Ou seja, se X tem distribuição binomial, b(n,p), tal que np≤7, então: P(X = k) ≈ !k )np(e knp− Exemplo 5.16: Se a probabilidade de um indivíduo sofrer uma reação nociva, resultante da injeção de um determinado soro é 0,001, determinar a probabilidade de, entre 2000 indivíduos, exatamente 3 sofrerem essa reação. Se X é a variável que representa o número de indivíduos que sofrem a reação, temos: n = 2000; p = 0,001; np = 2. Assim, a aproximação pela Poisson pode ser usada: P(X = 3) = -2 3e (2) 3! = 0,1804. Assim, a probabilidade de, entre 2000 indivíduos, exatamente 3 sofrerem essa reação é 18,04%. 54 5.3.5 Distribuição Normal A distribuição normal surgiu no século XVIII ligada ao estudo de erros de medições repetidas de uma mesma quantidade. As suas propriedades matemáticas foram estudadas por DeMoivre, Laplace e Gauss, sendo por este fato, conhecida por distribuição de Gauss. As principais razões da sua importância se devem ao fato de muitas variáveis biométricas serem aproximadamente normais e à possibilidade de que mesmo as variáveis não normais possam ser aproximadas pela normal. A distribuição normal tem sua função de densidade dada por: 21 x-µ - 2 σ1f(x)= e σ 2π , onde µ e σ são os parâmetros da distribuição e -∝<x<∝. Figura 5.1 Curva normal típica: A função f(x) possui as seguintes características: A média da distribuição é µ e o desvio padrão é σ. A curva é simétrica em relação a um eixo vertical passando por x=µ. A moda ocorre em x = µ. A curva tem inflexões nos pontos x = µ ± σ. A curva normal é assintótica ao eixo horizontal em ambas as direções. A área total sob a curva e acima do eixo x é 1. Para mesma média µ e diferentes desvios padrão σ , a distribuição apresenta-se mais achatada para quem possui maior desvio padrão e pico mais acentuado e maior concentração em torno da média para quem tem menor desvio padrão. µ µ - σ. µ + σ. 55 Para médias µ diferentes e mesmo desvio padrão σ , a distribuição apresenta-se a mesma, mas muda a localização, quanto maior a média, mais à direita está a curva. Verificação da Adequação do Modelo A maneira mais simples de verificarmos através de uma amostra se a variável em estudo pode ser adequadamente descrita pelo modelo normal consiste em examinarmos graficamente a distribuição dos dados, por exemplo, através do histograma. Se o gráfico apresentar razoável simetria e forma aproximada da curva normal, temos indicação de adequacidade do modelo aos dados. Além disso, é importante verificarmos as proporções de observações em determinados intervalos que envolvam a média. Para uma distribuição normal com média µ e desvio padrão σ, os intervalos (µ -σ ; µ + σ), (µ -2σ ; µ + 2σ), (µ -3σ ; µ +3 σ), compreendem respectivamente 68,3%, 95,4% e 99,7% da distribuição. Em geral, tanto µ quanto σ são desconhecidos, mas com uma amostra razoavelmente grande, digamos n ≥ 30, é de se esperar que a média amostral x esteja próxima de µ e que o desvio padrão s esteja próximo de σ. Podemos então, com base nos dados amostrais, calcular x e s , e contar o número de observações nos intervalos ( x - s ; x + s), ( x - 2s ; x +2 s), ( x - 3s ; x +3 s). Dividindo essas contagens por n, obtemos as frequências relativas observadas que devem ser comparadas com as probabilidades teóricas (0,683; 0,954 e 0,997). Grandes discrepâncias entre as frequências relativas observadas e as probabilidades acima indicam uma possível falta de adequação ao modelo normal. µ = 1 0 σ= 5 µ = 2 0 σ = 5 56 Existem outros critérios mais precisos para se verificar se há uma boa aderência ao modelo normal. Um deles é o gráfico denominado Q-Q plot, disponível nos programas de computador. É construído de tal forma que se há boa aderência dos dados ao modelo normal, as observações estarão alinhadas em torno de uma reta. Exemplo 5.17 Os alunos de uma turma de 60 estudantes do sexo masculino mediram a pressão sistólica (mmHg), uns dos outros, obtendo os resultados abaixo. 142 142 134 110 98 130 136 120 146 122 130 118 128 114 138 104 116 110 100 128 116 132 112 128 152 118 140 128 116
Compartilhar