Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Regina Maria Sigolo Bernardinelli Adaptada por Antonio Fernando Silveira Alves / Revisada por Sandra Regina Leme Forster É com satisfação que a Unisa Digital oferece a você, aluno(a), esta apostila de Estatística, parte in- tegrante de um conjunto de materiais de pesquisa voltado ao aprendizado dinâmico e autônomo que a educação a distância exige. O principal objetivo desta apostila é propiciar aos(às) alunos(as) uma apresen- tação do conteúdo básico da disciplina. A Unisa Digital oferece outras formas de solidificar seu aprendizado, por meio de recursos multidis- ciplinares, como chats, fóruns, aulas web, material de apoio e e-mail. Para enriquecer o seu aprendizado, você ainda pode contar com a Biblioteca Virtual: www.unisa.br, a Biblioteca Central da Unisa, juntamente às bibliotecas setoriais, que fornecem acervo digital e impresso, bem como acesso a redes de informação e documentação. Nesse contexto, os recursos disponíveis e necessários para apoiá-lo(a) no seu estudo são o suple- mento que a Unisa Digital oferece, tornando seu aprendizado eficiente e prazeroso, concorrendo para uma formação completa, na qual o conteúdo aprendido influencia sua vida profissional e pessoal. A Unisa Digital é assim para você: Universidade a qualquer hora e em qualquer lugar! Unisa Digital APRESENTAÇÃO SUMÁRIO INTRODUÇÃO ............................................................................................................................................... 5 1 NOÇÕES BÁSICAS ................................................................................................................................. 7 1.1 Arredondamento de Dados .................................................................................................................................... 8 1.2 População e Amostra ................................................................................................................................................ 9 1.3 Resumo do Capítulo ................................................................................................................................................11 1.4 Atividades Propostas...............................................................................................................................................12 2 ORGANIZAÇÃO DE DADOS .......................................................................................................... 13 2.1 Tipos de Variáveis .....................................................................................................................................................13 2.2 Distribuição de Frequências .................................................................................................................................16 2.3 Resumo do Capítulo ................................................................................................................................................19 2.4 Atividades Propostas...............................................................................................................................................20 3 GRÁFICOS ESTATÍSTICOS ............................................................................................................... 23 3.1 Gráfico de Setores ou Disco ou Pizza ou Diagrama Circular .....................................................................23 3.2 Gráfico de Colunas ou Barras ...............................................................................................................................24 3.3 Histograma .................................................................................................................................................................25 3.4 Polígono de Frequências .......................................................................................................................................25 3.5 Resumo do Capítulo ................................................................................................................................................26 3.6 Atividades Propostas...............................................................................................................................................27 4 MEDIDAS ................................................................................................................................................... 29 4.1 Medidas de Posição .................................................................................................................................................29 4.2 Medidas de Dispersão ............................................................................................................................................33 4.3 Resumo do Capítulo ................................................................................................................................................37 4.4 Atividades Propostas...............................................................................................................................................37 5 PROBABILIDADES ............................................................................................................................... 41 5.1 Fenômeno Determinístico ....................................................................................................................................41 5.2 Fenômeno Aleatório ou Probabilístico .............................................................................................................41 5.3 Espaço Amostral (S) .................................................................................................................................................42 5.4 Evento (E).....................................................................................................................................................................42 5.5 Probabilidade ............................................................................................................................................................42 5.6 Propriedades ..............................................................................................................................................................42 5.7 Variável Aleatória Discreta .....................................................................................................................................43 5.8 Função Discreta de Probabilidade .....................................................................................................................43 5.9 Variável Aleatória Contínua ..................................................................................................................................44 5.10 Função Contínua de Probabilidade .................................................................................................................44 5.11 Resumo do Capítulo .............................................................................................................................................44 5.12 Atividades Propostas ............................................................................................................................................45 6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS ................................................................................... 47 6.1 Modelo Normal ou Distribuição Normal..........................................................................................................47 6.2 Resumo do Capítulo ................................................................................................................................................49 6.3 Atividades Propostas...............................................................................................................................................50 7 ESTIMAÇÃO .............................................................................................................................................51 7.1 Estimação por Intervalo .........................................................................................................................................51 7.2 Resumo do Capítulo ................................................................................................................................................57 7.3 Atividades Propostas...............................................................................................................................................58 8 CORRELAÇÃO ......................................................................................................................................... 59 8.1 Correlação Linear Simples .....................................................................................................................................59 8.2 Resumo do Capítulo ................................................................................................................................................64 8.3 Atividades Propostas...............................................................................................................................................64 RESPOSTAS COMENTADAS DAS ATIVIDADES PROPOSTAS ..................................... 69 REFERÊNCIAS ............................................................................................................................................. 77 Unisa | Educação a Distância | www.unisa.br 5 Prezado(a) aluno(a), esta apostila reúne os principais tópicos de Estatística, de forma condensada e objetiva, com a finalidade de orientá-lo(a), aluno(a) do Curso de Ensino a Distância (EaD), no desen- volvimento do conteúdo desta disciplina. Em sua elaboração, não tive a pretensão de demonstrar as diversas fórmulas matemáticas nela existentes, mas de mostrar suas aplicações nos diversos assuntos abordados. É, portanto, um guia indis- pensável para acompanhar as aulas web. A disciplina de Estatística tem por objetivo fornecer ao(à) aluno(a) subsídios que o(a) auxiliem nas demais disciplinas do Curso de EaD, bem como desenvolver-lhe a capacidade de utilizar os diversos métodos estatísticos e o raciocínio necessário para a interpretação e análise de pesquisas na área a que se destina. Profa. Regina Maria Sigolo Bernardinelli INTRODUÇÃO Unisa | Educação a Distância | www.unisa.br 7 1 NOÇÕES BÁSICAS Prezado(a) aluno(a), você conhece a origem da palavra ‘estatística’? Conhece algumas aplica- ções desta ciência? Vamos iniciar este texto abor- dando esses pontos. A palavra ‘estatística’, de origem latina, sig- nificou por muito tempo “ciência dos negócios do Estado”. Os que governavam, sentindo neces- sidade de informações, organizavam departamen- tos, que tinham a responsabilidade de fazer essas investigações. As sociedades modernas acumulam grande quantidade de dados numéricos relativos a even- tos sociais, econômicos, científicos, esportivos etc. Desse modo, notamos que o uso da pesquisa é bastante comum nas várias atividades humanas. Exemplos: 1. O índice de analfabetismo no Brasil; 2. A mortalidade infantil no Nordeste bra- sileiro; 3. A porcentagem de crianças vacinadas na última campanha de vacinação; 4. A pesquisa realizada pelas indústrias, en- tre os consumidores, para o lançamento de um novo produto; 5. As pesquisas eleitorais, fornecendo ele- mentos para que os candidatos direcio- nem suas campanhas; 6. As pesquisas utilizadas pelas emissoras de TV, mostrando a preferência dos es- pectadores, para organizar sua progra- mação. Você deve saber que a realização de uma pes- quisa envolve muitas etapas, tais como: a escolha da amostra, a coleta e a organização dos dados, o resumo e a apresentação desses dados e, também, a interpretação dos resultados para a obtenção de conclusões e tomada de decisões razoáveis. Todas essas etapas são trabalhadas com métodos cientí- ficos pela Estatística. O tratamento estatístico de um conjunto de dados pode envolver dois processos distintos, isto é, a descrição dos dados e o estabelecimento de conclusões sobre a população a partir dos dados obtidos por amostragem. Para tanto, temos: Estatística descritiva: utiliza métodos numéricos e gráficos para mostrar os padrões de comportamento dos dados, DicionárioDicionário A palavra ‘estatística’ surge da expressão em latim statisticum collegium ou palestra sobre os assun- tos do Estado, de onde surgiu a palavra em língua italiana statista, que significa “homem de estado”, ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A palavra ad- quiriu um significado de coleta e classificação de dados, no início do século 19. Fonte: http://pt.wikiversity.org AtençãoAtenção O tratamento estatístico pode envolver a descrição dos dados e o estabelecimento de conclusões a partir da amostragem. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 8 para resumir a informação contida nes- ses dados e para apresentar a informação de forma conveniente; Inferência estatística: utiliza dados de amostras para obter estimativas sobre a população. 1.1 Arredondamento de Dados Como na maioria das vezes, os dados dispo- níveis não são números inteiros, para efetuar os cál- culos estatísticos, é necessário efetuar o arredon- damento desses dados. A seguir, apresentamos os critérios utilizados para efetuar o arredondamento. De acordo com o Instituto Brasileiro de Ge- ografia e Estatística (IBGE)2, o arredondamento é feito da seguinte forma: a. Quando o primeiro algarismo a ser aban- donado é 0, 1, 2, 3 ou 4, fica inalterado o último algarismo a permanecer. Exemplo: aproximação de uma casa decimal: 53,24 passa a 53,2. b. Quando o primeiro algarismo a ser aban- donado é 6, 7, 8 ou 9, aumenta-se em uma unidade o algarismo a permanecer. Exemplos: aproximação de uma casa decimal: 42,87 passa a 42,9; 25,08 passa a 25,1; 53,99 passa a 54,0. c. Quando o primeiro algarismo a ser aban- donado é 5, há duas soluções: se ao 5 seguir, em qualquer casa, um algarismo diferente de zero, aumen- ta-se uma unidade ao algarismo a permanecer. Exemplos: aproximação de uma casa decimal: 2,352 passa a 2,4; 25,6501 passa a 25,7; 76,25002 passa a 76,3. se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último Saiba maisSaiba mais A Estatística é uma área do conhecimento que utiliza teorias probabilísticas para explicação de eventos, estudos e experimentos. Tem por objetivo obter, organizar e analisar dados, determinar as correlações que apresentem, tirando delas suas consequências para descrição e explicação do que passou e pre- visão e organização do futuro. Em suma, estatística é a ciência que estuda os dados. Dentro dela, exis- tem duas subdivisões: a estatística descritiva (que estuda métodos e ferramentas de coleta de dados e modelos matemáticos para descrevê-los e interpretá-los) e a estatística inferencial (sistemas e técnicas utilizadas para tomar boas decisões baseadas nos dados). A estatística é também uma ciência e prática de desenvolvimento de conhecimento humano através do uso de dados empíricos. Baseia-se na teoria estatística, um ramo da matemática aplicada. Na teoria estatística, a aleatoriedade e incerteza são modeladas pela teoria da probabilidade. Algumas práticas estatísticas incluem, por exemplo, o planejamento, a sumarização e a interpretação de observações. Porque o objetivo da estatística é a produção da “melhor” informação possível a partir dos dados dispo- níveis, alguns autores sugerem que a estatística é um ramo da teoria da decisão. Fonte: http://pt.wikiversity.org 2 Em conformidade com a Resolução nº 886/66 da Fundação IBGE, Adaptado de CRESPO, 1991.Estatística Unisa | Educação a Distância | www.unisa.br 9 algarismo a ser conservado só será aumentado de uma unidade se for ímpar. Exemplos: aproximação de uma casa decimal: 24,75 passa a 24,8; 24,65 passa a 24,6; 24,75000 passa a 24,8; 24,6500 passa a 24,6. Prezado(a) aluno(a), para iniciar o estudo da Estatística, é necessário que você conheça, com- preenda e se aproprie do significado de alguns ter- mos que serão utilizados. Analise cuidadosamente cada termo defini- do a seguir. População É o conjunto de todos os elementos envolvi- dos no fenômeno a ser estudado. Amostra É o conjunto de elementos retirados da po- pulação para a realização do estudo. É, portanto, um subconjunto da população. Exemplos: 1. Queremos obter informações sobre a audiência de certo programa de TV, na Grande São Paulo: População: é o conjunto de todos os domi- cílios da Grande São Paulo que possuem TV; Amostra: é o conjunto dos domicílios que serão visitados. 2. Estudar a procedência dos candidatos a uma determinada universidade: População: conjunto de todos os candida- tos à referida universidade; Amostra: conjunto dos candidatos que se- rão entrevistados. 3. Queremos fazer um estudo sobre a ida- de dos alunos do curso de Publicidade e Propaganda de uma determinada uni- versidade: População: todos os alunos do curso de Pu- blicidade e Propaganda; Amostra: uma classe do primeiro ano do curso de Publicidade e Propaganda. Quando são obtidos dados de toda uma po- pulação, dizemos que foi feito um recenseamento e a este conjunto de dados damos o nome de censo. Quando os dados são obtidos de parte da po- pulação, foi feita uma amostragem. A Escolha da Amostra Os métodos de escolha da amostra devem garantir a representatividade do grupo. É neces- sário escolher, no mínimo, 10% do número total dos elementos da população e garantir, por meio de um critério de seleção, que nenhum elemento tenha maior chance de ser escolhido do que outro. Desse modo, podemos recorrer a diferentes formas de amostragem: amostragem aleatória simples, amostragem sistemática e amostragem estrati- ficada proporcional. 1.2 População e Amostra AtençãoAtenção Os métodos de escolha da amostra devem garantir a representatividade do grupo. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 10 Vejamos o procedimento através de dois exemplos: Exemplo 1: suponhamos uma pesquisa so- bre o nível de escolaridade de um grupo de oito- centas pessoas. Vamos escolher uma amostra com, no mínimo, oitenta pessoas (10% de 800), selecio- nadas através de: a. Amostragem aleatória simples: em primeiro lugar, elaboramos uma lista com os oitocentos nomes dos elemen- tos da população numerados de 1 a 800, para serem submetidos a um sorteio. Bolas ou cartões, também numerados de 1 a 800, são colocados em uma urna e bem misturados. Em cada etapa do sor- teio, todo número ainda não escolhido tem a mesma probabilidade de ser sor- teado. Esse processo não é muito prático para grandes populações, quando pode- mos então trabalhar com uma numeração de 0 a 9, sorteando os números por meio de blocos de três algarismos e tomando o cuidado de repor na urna todo algarismo dela retirado. Como temos dez algarismos, cada um deles tem de probabilidade de aparecer em determinada posição. Sem- pre que um bloco de algarismos indicar um elemento já selecionado, ou um ele- mento que não exista na população, será descartado. 1 10 Suponhamos que os seguintes algarismos foram obtidos no sorteio: 2 4 3 5 6 4 7 2 0 0 3 5 8 1 1 0 0 5 1 9 8 6 4 3 5 2 4 7 8 9 7 7 6 5 4 2 2 3 0 1 2 1 1 6 7 8 9 1 0 3 4 5 6 7 2 2 8 8 1 9 0 0 6 0 7 2 1 0 5 6 4 3 Agrupando-os em blocos de três, teremos os números: 243 564 720 035 811 005 198 643 524 789 776 542 230 121 167 891 034 567 228 819 006 072 105 643. Observem que devemos descartar 811, 891 e 819, porque não pertencem à população, e 643, por- que já foi selecionado. Continuamos o sorteio, até completarmos os 80 elementos da amostra. b. Amostragem sistemática: sorteamos um número de 1 a 10, ao acaso. Supondo que tenha sido obtido o número 6, ele será o primeiro elemento da amostra e os demais serão determi- nados em intervalos de dez unidades. Nossa amostra, então, será: 6 16 26 36 46 56 66 76 86 96 106 . . . 796 Este tipo de amostragem é simples de ser realizado e aconselhável no caso de amostras muito grandes. Estatística Unisa | Educação a Distância | www.unisa.br 11 1.3 Resumo do Capítulo Exemplo 2: na escola Sapequinha, quer fazer-se um estudo sobre o peso dos alunos de 7 anos de idade. Existem 120 crianças na faixa de 7 anos de idade, distribuídas em cinco classes, do seguinte modo: a primeira série A tem 20 alunos com 7 anos, a primeira B tem 15, a C tem 35, a D, 30 e a E tem 20. Vamos escolher uma amostra com, no mínimo, 12 crianças (10% de 120), selecionadas através de: c. Amostragem estratificada proporcional: sorteamos os nomes das crianças em quantidades proporcionais ao número de crianças com 7 anos de cada classe, que constituem os estratos da amostra. Vamos, agora, determinar a porcentagem de crianças com 7 anos, em cada classe, em relação à população (120 crianças): De modo análogo, determinamos as porcentagens para as classes C, D e E, obtendo: C: c = 29,2% D: d = 25% E: e = 16,7% Para calcularmos quantas crianças de cada classe serão sorteadas, para uma amostra de 12 crian- ças, fazemos: A: 16,7% de 12 = 16,7/100 . 12 = 0,167 . 12 = 2,004 = 2 B: 12,5% de 12 = 0,125 . 12 = 1,5 = 2 C: 29,2% de 12 = 0,292 . 12 = 3,504 =3 (nesse caso, arredondamos para 3, ao invés de 4, porque o total de crianças da amostra é 12) D: 25% de 12 = 0,25 . 12 = 3 E: 16,7% de 12 = 0,167 . 12 = 2,004 = 2 Desse modo, obtivemos a quantidade de elementos de cada estrato e o total da amostra. Prezado(a) aluno(a), vimos neste capítulo que a palavra ‘estatística’, de origem latina, significou por muito tempo “ciência dos negócios do Estado”. Estudamos também que a Estatística Descritiva utiliza métodos numéricos e gráficos para mostrar os padrões de comportamento dos dados, para resumir a informação contida nesses dados e para apresentar a informação de forma conveniente, e que a In- ferência Estatística utiliza dados de amostras para obter estimativas sobre a população. Aprendemos ainda sobre arredondamentos e amostra. Vamos, agora, avaliar a sua aprendizagem. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 12 1.4 Atividades Propostas 1. Faça o arredondamento dos seguintes números para uma casa decimal: a. 2,36. b. 3,57. c. 4,62. d. 8,81. e. 4,451. f. 5,501. g. 5,55. h. 5,65. 2. Arredonde cada um dos numerais abaixo, conforme a precisão pedida. a. para o décimo mais próximo: 23,40 234,7832 45,09 48,85002 78,85 12,35 120,4500 129,98 199,97 b. para o centésimo mais próximo: 46,727 28,255 299,951 253,65 123,842 37,485 c. para a unidade mais próxima: 26,6 128,5 68,2 67,5 49,98 39,49 d. para a dezena mais próxima: 42,3 59 446,4 265,31 265,0 265 295 302,7 2995,000 Unisa | Educação a Distância | www.unisa.br 13 2 ORGANIZAÇÃO DE DADOS Prezado(a) aluno(a), falaremos agora sobre a organização de dados. Vamos lá! Dado um conjunto de dados, vamos estudar como devemos “tratar” os valores, numéricos ou não, a fim de extrairinformações a respeito de uma ou mais características de interesse. Suponhamos, por exemplo, que um questio- nário foi aplicado a alunos do 1º ano de uma escola fornecendo as seguintes informações: Id: identificação do aluno; Turma: A ou B; Sexo: Feminino (F) ou Masculino (M); Idade: em anos; Alt: altura em metros; Peso: em quilogramas; Filhos: nº de filhos na família; Fuma: hábito de fumar: Sim (S) ou Não (N); Toler: tolerância ao cigarro: (I) Indiferen- te; (P) incomoda Pouco; (M) incomoda Muito; Exerc.: horas de atividade física, por se- mana; Cine: nº de vezes que vai ao cinema por semana; Op Cine: opinião a respeito das salas de cinema na cidade: (B) regular a Boa; (M) Muito boa; TV: horas gastas assistindo à TV, por se- mana; Op TV: opinião a respeito da qualidade da programação na TV: (R) ruim; (M) mé- dia; (B) boa; (N) não sabe. O conjunto de informações, após a tabulação do questionário ou pesquisa de campo, é denomi- nado tabela de dados brutos e contém os dados da maneira que foram coletados inicialmente (Ta- bela 1). Cada uma das características perguntadas aos alunos, como o peso, a idade, a altura etc., é denominada variável e, como podemos observar, tem naturezas diferentes quanto aos possíveis va- lores que podem assumir. 2.1 Tipos de Variáveis Existem dois tipos de variáveis: qualitativas (variáveis não numéricas) e quantitativas (variá- veis numéricas). Variáveis qualitativas Seus valores representam uma qualidade (ou atributo) do indivíduo pesquisado. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 14 Exemplos: sexo, turma, estado civil, grau de instrução, hábito de fumar etc. Entre as variáveis qualitativas, ainda existem dois tipos: a. Variável qualitativa nominal: não exis- te ordenação em seus possíveis resulta- dos. Exemplos: sexo, turma, hábito de fumar; b. Variável qualitativa ordinal: existe cer- ta ordem em seus possíveis resultados. Exemplos: tamanho (P, M, G), classe social (baixa, média, alta), grau de instrução (1º grau, 2º grau, grau superior), estado civil. Variáveis quantitativas Seus valores são numéricos e resultantes de uma contagem ou mensuração. Exemplos: número de filhos, salário, peso, altura etc. Entre as variáveis quantitativas, ainda exis- tem dois tipos: a. Variáveis quantitativas discretas: seus possíveis valores formam um conjunto finito ou enumerável de números que resultam frequentemente de uma con- tagem. Exemplos: número de filhos, ida- de (em anos), cine (número de vezes que vai ao cinema por semana); b. Variáveis quantitativas contínuas: seus possíveis valores formam um inter- valo de números reais que resultam, nor- malmente, de uma mensuração. Exem- plos: peso, altura, salário. AtençãoAtenção A Estatística permite que dados quali- tativos sejam apresentados de maneira quantitativa. Saiba maisSaiba mais Por exemplo, a variável idade, medida em anos completos, é quantitativa (contínua); mas, se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos etc.), é qualitativa (ordinal). Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua), se trabalhamos com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado etc.). Outro ponto importante é que nem sempre uma variável representada por números é quanti- tativa. O número do telefone de uma pessoa, o número da casa, o número de sua identidade. Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo. Isso não significa que a variável sexo passou a ser quantitativa! Exemplo dos ursos marrons: Num levantamento de dados de uma amostra da população de ursos marrons coletados nos EUA, teremos como qualitativas as variáveis sexo (nominal) e mês da observação (ordinal); são quantitativas contínuas: idade, comprimento da cabeça, largura da cabeça, perímetro do pes- coço, perímetro do tórax, altura e peso. Estatística Unisa | Educação a Distância | www.unisa.br 15 Figura 1 – Classificação de uma variável. ESqUEMA Id Turma Sexo Idade Alt Peso Filho Fuma Toler Exerc Cine Op Cine TV OpTV 1 A F 17 1,60 60,5 2 Não P 0 1 B 16 R 2 A F 18 1,69 55,0 1 Não M 0 1 B 7 R 3 A M 18 1,85 72,8 2 Não P 5 2 M 15 R 4 A M 25 1,85 80,9 2 Não P 5 2 B 20 R 5 A F 19 1,58 55,0 1 Não M 2 2 B 5 R 6 A M 19 1,76 60,0 3 Não M 2 1 B 2 R 7 A F 20 1,60 58,0 1 Não P 3 1 B 7 R 8 A F 18 1,64 47,0 1 Sim I 2 2 M 10 R 9 A F 18 1,62 57,8 3 Não M 3 3 M 12 R 10 A F 17 1,64 58,0 2 Não M 2 2 M 10 R 11 A F 18 1,72 70,0 1 Sim I 10 2 B 8 N 12 A F 18 1,66 54,0 3 Não M 0 2 B 0 R 13 A F 21 1,70 58,0 2 Não M 6 1 M 30 R 14 A M 19 1,78 68,5 1 Sim I 5 1 M 2 N 15 A F 18 1,65 63,5 1 Não I 4 1 B 10 R 16 A F 19 1,63 47,4 3 Não P 0 1 B 18 R 17 A F 14 1,82 66,0 1 Não P 3 1 B 10 N 18 A M 18 1,80 85,2 2 Não P 3 4 B 10 R 19 A F 20 1,60 54,5 1 Não P 3 2 B 5 R 20 A F 18 1,68 52,5 3 Não M 7 2 B 14 M 21 A F 21 1,70 60,0 2 Não P 8 2 B 5 R 22 A F 18 1,65 58,5 1 Não M 0 3 B 5 R 23 A F 18 1,57 49,2 1 Sim I 5 4 B 10 R 24 A F 20 1,55 48,0 1 Sim I 0 1 M 28 R 25 A F 20 1,69 51,6 2 Não P 8 5 M 4 N 26 A F 19 1,54 57,0 2 Não I 6 2 B 5 R 27 B F 23 1,62 63,0 2 Não M 8 2 M 5 R 28 B F 18 1,62 52,0 1 Não P 1 1 M 10 R 29 B F 18 1,57 49,0 2 Não P 3 1 B 12 R 30 B F 25 1,65 59,0 4 Não M 1 2 M 2 R Tabela 1 – Informações de questionário estudantil – Dados brutos. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 16 Id Turma Sexo Idade Alt Peso Filho Fuma Toler Exerc Cine Op Cine TV OpTV 31 B F 18 1,61 52,0 1 Não P 2 2 M 6 N 32 B M 17 1,71 73,0 1 Não P 1 1 B 20 R 33 B F 17 1,65 56,0 3 Não M 2 1 B 14 R 34 B F 17 1,67 58,0 1 Não M 4 2 B 10 R 35 B M 18 1,73 87,0 1 Não M 7 1 B 25 B 36 B F 18 1,60 47,0 1 Não P 5 1 M 14 R 37 B M 17 1,70 95,0 1 Não P 10 2 M 12 N 38 B M 21 1,85 84,0 1 Sim I 6 4 B 10 R 39 B F 18 1,70 60,0 1 Não P 5 2 B 12 R 40 B M 18 1,73 73,0 1 Não M 4 1 B 2 R 41 B F 17 1,70 55,0 1 Não I 5 4 B 10 B 42 B F 23 1,45 44,0 2 Não M 2 2 B 25 R 43 B M 24 1,76 75,0 2 Não I 7 0 M 14 N 44 B F 18 1,68 55,0 1 Não P 5 1 B 8 R 45 B F 18 1,55 49,0 1 Não M 0 1 M 10 R 46 B F 19 1,70 50,0 7 Não M 0 1 B 8 R 47 B F 19 1,55 54,5 2 Não M 4 3 B 3 R 48 B F 18 1,60 50,0 1 Não P 2 1 B 5 R 49 B M 17 1,80 71,0 1 Não P 7 0 M 14 R 50 B M 18 1,83 86,0 1 Não P 7 0 M 20 B A partir da tabela de dados brutos (Tabela 1), vamos construir uma nova com as informações resumidas, para cada variável, denominada tabela de frequência, que conterá os valores da variável e suas respectivas contagens, as quais são denomi- nadas frequências absolutas ou, simplesmente, frequências. No caso de variáveis qualitativas ou quantita- tivas discretas, a tabela de frequência consiste em listar os valores possíveis da variável, numéricos ou não, e fazer a contagem na tabela de dados brutos do número de suas ocorrências. Notação: Para efeito de comparação com outros gru- pos ou conjuntos de dados, é conveniente traba- lharmos com a frequência relativa, definida por 2.2 Distribuição de Frequências Estatística Unisa | Educação a Distância | www.unisa.br 17 Note que, para variáveis cujos valores possuem ordenação natural (qualitativas ordinais e quanti- tativas em geral), incluímos na tabela de frequência uma coluna contendo as frequências acumuladas (fac), quando o número de valores i for maior do que 2. A frequência acumulada até certo valor é obtida pela soma das frequências de todos os valores da variável menores ou iguais ao valor considerado. Tabela de Frequência para a Variável Toler (extraída da Tabela 1) Tabela 3 – Variável Toler.Exemplos Tabela de Frequência para a Variável Sexo (extraída da Tabela 1) Tabela 2 – Variável Sexo. Sexo: variável qualitativa nominal. Toler: variável qualitativa ordinal. A variável Peso, classificada como quantita- tiva contínua, apresenta valores que podem ser qualquer número real num certo intervalo. Pela Tabela 1, verificamos que os valores variam entre 44,0 kg e 95,0 kg e, como existe um grande número de valores diferentes, vamos cons- truir faixas ou classes de valores e contar o núme- ro de ocorrências em cada faixa. Não existe uma regra formal para determinar o número de faixas ou classes a serem utilizadas. Entretanto, deve-se observar que, com um pe- queno número de classes, perde-se informação e, com um número grande de classes, o objetivo de resumir os dados fica prejudicado. No geral, é con- veniente trabalharmos com 5 a 8 faixas de mesma amplitude, devendo ressaltar que faixas de tama- nho desigual podem ser convenientes para repre- sentar valores nas extremidades da tabela. Para a variável Peso, usaremos faixas de am- plitude 10 e iniciaremos com 40,0 kg. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 18 Tabela de Frequência para a Variável Peso (extraída da Tabela 1) Tabela 4 – Variável Idade. Peso: variável quantitativa contínua. Observe, pela fac, que 76% dos alunos pesam menos que 70,0 kg e 100 – 88 = 12% têm peso maior ou igual a 80,0 kg. Na Tabela 5, temos 6 faixas ou classes ou intervalos. Consideremos, por exemplo, a 1ª classe ou intervalo: 40,0 ├─ 50,0, onde temos: Limite inferior (li): 40,0 Ponto Médio (PM) = Limite superior (ls): 50,0 Amplitude ou tamanho do intervalo (h): h = ls – li; (h = 50,0 – 40,0 = 10,0) O símbolo ├─ indica que o intervalo é fechado à esquerda e aberto à direita (40,0 faz parte dessa classe, mas 50,0 não; 50,0 está na 2ª classe). Na Tabela 1, a variável TV (quantitativa discreta) tem valores inteiros entre 0 e 30 e uma tabela re- presentando tais valores e respectivas frequências seria muito extensa e pouco prática. Por esse motivo, trataremos essa variável como quantitativa contínua, criando, por exemplo, faixas de amplitude 6 para representar seus valores. Estatística Unisa | Educação a Distância | www.unisa.br 19 Tabela de Frequência para a Variável TV (extraída da Tabela 1) Tabela 5 – Variável TV. TV: variável quantitativa discreta, que foi “tratada” como contínua. Observe que, na última classe, o intervalo é fechado à esquerda e à direita, incluindo, portanto, o valor 30 e não tendo, assim, que abrir mais uma classe por causa de um único valor. Outra sugestão seria usar uma amplitude maior nessa última classe, por exemplo, 24 ├─ 36, que inclui o valor 30. Saiba maisSaiba mais Frequência Absoluta (ni ) - é o número de vezes que o valor de determinada variável é observado Frequência Absoluta Acumulada (fac)- é a soma das frequências absolutas anteriores com a frequência abso- luta deste valor. Frequência Relativa (fi) - é o quociente entre a frequência absoluta do valor da variável e o número total de observações. Frequência Relativa Acumulada (fac %) - é a soma das frequências relativas anteriores com a frequência rela- tiva desse valor. fac% = n i=1 fi∑ 2.3 Resumo do Capítulo Prezado(a) aluno(a), neste capítulo estudamos sobre variáveis e suas frequências. O conjunto de informações, após a tabulação do questionário ou pesquisa de campo, é denominado de tabela de dados brutos. Cada uma das características perguntadas aos alunos tais como, o peso, a idade, a altura etc., é denominada de variável, e, como podemos observar, possuem naturezas diferentes quanto aos possíveis valores que podem assumir, sendo classificadas como variáveis qualitativas (nominal e ordinal) ou variá- veis quantitativas (continuas e discretas). Vamos, agora, avaliar a sua aprendizagem. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 20 1. Monte a tabela com as distribuições de frequência da variável Idade de acordo com os dados da Tabela 1. 2. Na Escola São Leopoldo, para estudar a preferência em relação a refrigerantes, sortearam-se 150 estudantes, entre os 1.000 matriculados. Responda: a. Qual é a população envolvida na pesquisa? b. Que tipo de amostragem foi utilizado e qual é a amostra considerada? 3. A população envolvida em uma pesquisa sobre a incidência de cárie dentária em escolares da cidade de Morro Grande é apresentada na Tabela 6. Tabela 6 – Incidência de cárie em escolares. Baseando-se nesses dados, estratifique uma amostra com 200 elementos. 4. Em uma cidade com 30.000 habitantes, deseja-se fazer uma pesquisa sobre a preferência por tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem. a. Qual a população envolvida na pesquisa? b. Supondo que, na cidade, haja 5.500 mulheres e 6.000 homens com 20 anos, determine uma amostra com 1.200 pessoas. 5. Em uma fábrica, foram testadas 400 lâmpadas; a duração delas aparece na distribuição por frequência da Tabela 7: 2.4 Atividades Propostas Estatística Unisa | Educação a Distância | www.unisa.br 21 Tabela 7 – Duração de lâmpadas. a. Complete a tabela dada com as demais colunas que você conhece. b. Qual a amplitude de cada classe? c. Qual o limite inferior da 3ª classe? d. Qual o limite superior da 8ª classe? e. Qual o ponto médio da 5ª classe? f. Qual a frequência relativa da 6ª classe? g. Qual a porcentagem de lâmpadas com durabilidade máxima de 500 horas? h. Qual a porcentagem de lâmpadas com durabilidade de 900 horas ou mais? Unisa | Educação a Distância | www.unisa.br 23 Prezado(a) aluno(a), neste capítulo, iremos estudar sobre gráficos. A organização dos dados em tabelas de frequência proporciona um meio eficaz de estudo do comportamento de caracterís- ticas de interesse. Muitas vezes, a informação contida nas ta- belas pode ser mais facilmente visualizada através de gráficos. Vamos definir quatro tipos básicos de gráficos: setores ou pizza, colunas ou barras, his- tograma e polígono de frequências. 3 GRÁFICOS ESTATÍSTICOS 3.1 Gráfico de Setores ou Disco ou Pizza ou Diagrama Circular Adapta-se muito bem às variáveis qualitati- vas, mas também pode ser usado para as variáveis quantitativas discretas. Fazendo uso do computador para o traça- do do gráfico, basta conhecer as porcentagens de cada valor da variável. Se, ao contrário, formos tra- çar o gráfico com o auxílio de compasso e transferi- dor, precisamos determinar a medida em graus de cada setor correspondente aos valores da variável, lembrando que o disco todo mede 360°. Exemplo: gráfico de setores para a variável Toler (Tabela 3): I: 20% P:42% M: 38% Procedemos de maneira análoga para os valores de P e M. AtençãoAtenção A utilização de tabelas e gráficos são frequentes na Estatística. As tabelas servem para orga- nizar e tabular os dados, já os gráficos transmitem as informações com clareza e transparên- cia, contribuindo para uma leitura objetiva. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 24 Gráfico 1 – Setores. 3.2 Gráfico de Colunas ou Barras Adapta-se melhor às variáveis discretas ou qualitativas ordinais. Utiliza o plano cartesiano com os valores da variável no eixo das abscissas e as frequências ou porcentagens no eixo das ordenadas. Exemplo: gráfico de colunas para a variável Idade (Tabela 4): Gráfico 2 – Colunas. Estatística Unisa | Educação a Distância | www.unisa.br 25 3.3 Histograma 3.4 Polígono de Frequências É utilizado para variáveis quantitativas contí- nuas. Consiste em retângulos contíguos ou adja- centes, nos quais a base, colocadano eixo das abs- cissas, corresponde aos intervalos das classes e a altura, colocada no eixo das ordenadas, é dada pela frequência absoluta ou relativa das classes. Observação: A área de um histograma é proporcional à soma das frequências absolutas. No caso de trabalharmos com as frequências relativas, a área será igual à constante de proporcionalidade. Exemplo: histograma para a variável Peso (Tabela 5): Gráfico 3 – Histograma. DicionárioDicionário Um histograma é uma representação gráfica da distribuição de frequências de uma massa de medições, normalmente um gráfico de barras verticais. O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva frequência. A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados. É também utilizado para variáveis quantitati- vas contínuas. Para construir o polígono de frequências, ad- mitem-se, como representantes de cada classe, os pontos médios de cada intervalo que as definem. Após obter os pontos (ponto médio, frequência correspondente) em relação a cada intervalo, estes são ligados entre si por meio de segmentos de re- tas, sendo que o primeiro e o último são ligados ao eixo das abscissas, na metade de classes hipotéti- cas, imediatamente anterior à primeira e posterior à última. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 26 Exemplo: polígono de frequências para a variável Peso (Tabela 5): Gráfico 4 – Polígono de frequências. Saiba maisSaiba mais Você poderá obter esses gráficos, utilizando o Excel. Abaixo segue o link onde você poderá obter informações, caso ainda não as saiba, de quais gráficos são possíveis cons- truir com o Excel e como construí-los. Porém é importante você observar que essa é apenas uma dica. O fato de poder utilizar o Excel para a construção de gráficos não o exime do dever de saber construir esses gráficos manualmente, ou seja, sem o auxílio desta ferramenta, pois certamente você precisará desenvolver essas atividades nas avaliações presenciais. Confira as dicas em: http://office.microsoft.com/pt-br/excel-help/tipos-de-graficos-disponiveis-HA001233737.aspx. 3.5 Resumo do Capítulo Prezado(a) aluno(a), muitas vezes, a informação contida nas tabelas pode ser mais facilmente vi- sualizada através de gráficos. Nesse sentido, definimos, neste capítulo, quatro tipos básicos de gráficos: setores ou pizza, colunas ou barras, histograma e polígono de frequências. E, por fim, vimos que o histo- grama é utilizado para variáveis quantitativas contínuas. Vamos, agora, avaliar a sua aprendizagem. Estatística Unisa | Educação a Distância | www.unisa.br 27 3.6 Atividades Propostas 1. Com relação às variáveis: Turma, Alt, Filhos, Fuma, Exerc, Cine, Op Cine, Op TV, da Tabela 1: a. Classifique essas variáveis. b. Faça a distribuição de frequência para cada uma delas. c. A variável Exerc poderia ser tratada de forma diferente com relação à sua classificação? Justifique sua resposta e, em caso afirmativo, construa a nova distribuição de frequência. d. Construa os gráficos que melhor se adaptam a cada uma das variáveis apresentadas. 2. Quinze pacientes de uma clínica de ortopedia foram entrevistados quanto ao número de me- ses previstos de fisioterapia, se haverá (S) ou não (N) sequelas após o tratamento e o grau de complexidade da cirurgia realizada: alto (A), médio (M) ou baixo (B). Os dados são apresenta- dos na Tabela 8: Tabela 8 – Levantamento em clínica de ortopedia. a. Classifique cada uma das variáveis. b. Para cada variável, construa a tabela de frequência e faça uma representação gráfica. c. Para o grupo de pacientes que não ficaram com sequelas, faça um gráfico de barras para a variável Fisioterapia. Você acha que essa variável se comporta de modo diferente nesse grupo? 3. Os dados da Tabela 9 referem-se ao salário (em salários-mínimos) de 20 funcionários admi- nistrativos em uma indústria. Tabela 9 – Salários de funcionários administrativos (em salários-mínimos). a. Construa uma tabela de frequência agrupando os dados em intervalos de amplitude 2, a partir de 1. b. Construa o histograma. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 28 4. Um grupo de estudantes do ensino médio foi submetido a um teste de Matemática resultan- do em: Tabela 10 – Teste de Matemática. a. Construa o histograma. b. Se a nota mínima para aprovação é 5, qual será a porcentagem de aprovação? Unisa | Educação a Distância | www.unisa.br 29 4 MEDIDAS Prezado(a) aluno(a), agora falaremos sobre medidas. Nosso interesse é caracterizar o conjunto de dados através de medidas que resumam a informa- ção, por exemplo, representando a tendência cen- tral dos dados ou a maneira pela qual esses dados estão dispersos. 4.1 Medidas de Posição Se estivermos numa parada de ônibus e nos pedirem alguma informação sobre a demora em passar um determinado ônibus, ninguém imagina que poderíamos dar como resposta uma tabela de frequências que coletamos no último mês. Quem perguntou deseja uma resposta breve e rápida, que sintetize a informação que dispomos, e não uma completa descrição dos dados. É para isso que servem as medidas de posição. Medidas de Posição para um Conjunto de Dados Seja uma variável X, com observações repre- sentadas por Média Aritmética ou, Simplesmente, Média ( ) É a soma dos valores da variável dividida pelo número total de observações. Exemplo: calcular a média aritmética dos va- lores: 9, 12, 8, 6, 14, 11, 5. Para calcularmos a média quando os dados estão agrupados em classes, representamos todos os valores de cada classe pelo ponto médio da clas- se (visto no capítulo 2). Mediana (md) É o valor da variável que ocupa a posição cen- tral dos dados ordenados. Para o cálculo da mediana, temos duas consi- derações a fazer: a. o número de observações (n) é ímpar: a mediana será o valor da variável que ocupa a posição de ordem . AtençãoAtenção As medidas de posição ou medidas de tendência central para um conjunto de dados qualquer (população ou amostra) são: a média, a mediana e a moda. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 30 Exemplo: calcular a mediana dos valores: 9, 12, 8, 6, 14, 11, 5. Em primeiro lugar, vamos montar o Rol, ou seja, organizar os dados em ordem crescente: 5, 6, 8, 9, 11, 12, 14 Observe que n = 7 (ímpar) Logo, a medida será dada pelo elemento que divide o Rol em duas partes iguais. b. o número de observações (n) é par: não existe, portanto, um valor que ocupe o centro; convencionou-se que a mediana será a média aritmética dos valores que ocupam as posições de ordem Exemplo: calcular a mediana dos valores já ordenados: 6, 8, 9, 11, 12, 14. n = 6 (par) A mediana será dada pela média aritmética entre o 3º e 4º elementos da sequência: Para calcularmos a mediana quando os da- dos estão agrupados em classes, não levamos em consideração se n é par ou ímpar e procedemos do seguinte modo: 1º) Calcula-se ; 2º) Pela frequência acumulada, identifica-se a classe que contém a mediana; 3º) Aplica-se a fórmula: onde: limd = limite inferior da classe md n = nº total de elementos da amostra fac = frequência acumulada da classe ante- rior à classe md h = amplitude da classe md nimd = frequência da classe md Moda (mo) É o valor da variável mais frequente da distri- buição. Exemplo: calcular a moda para o seguinte conjunto de dados: 65, 87, 49, 58, 65, 65, 67, 83, 87, 79, 87. Observe que, mo = 65 (aparece 3 vezes) e mo = 87 (aparece 3 vezes).Temos então duas modas, portanto a distri- buição é bimodal. Quando a distribuição não apre- sentar moda, será chamada amodal; se tiver uma só moda, recebe o nome de unimodal e, se apre- sentar várias modas, será multimodal. Para calcularmos a moda quando os dados estão agrupados em classes, usaremos o seguinte processo: DicionárioDicionário Rol é a sequência de dados obtida após a ordena- ção dos dados (crescente ou decrescente). Estatística Unisa | Educação a Distância | www.unisa.br 31 1º) Identifica-se a classe modal (a que possuir maior frequência); 2º) Aplica-se a fórmula: onde: limo = limite inferior da classe modal = diferença entre a frequência da classe modal e a imediatamente anterior = diferença entre a frequência da classe modal e a imediatamente posterior h = amplitude da classe modal Exemplos: 1. Calcule média, mediana e moda para a variável Idade (Tabela 11) (Ver Tabela 23): Tabela 11 – Variável Idade. n = 50 é par, portanto, a mediana será a média aritmética dos dois valores centrais Pela fac, observamos que o valor da frequência acumulada até 18 é igual a 31 e, portanto, o 25º elemento é igual ao 26º elemento e ambos correspondem ao valor da variável igual a 18 Para o cálculo de mo, olhamos a maior frequência (22), que corresponde à idade de 18 anos. 2. Calcule média, mediana e moda para a variável Peso (Tabela 12) (Ver Tabela 4): Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 32 Pela fac (30), a 2ª classe contém a mediana, isto é, o intervalo 50,0 ├─ 60,0. Tabela 12 – Variável Peso. Saiba maisSaiba mais As medidas de posição podem ser utilizadas em conjunto para auxiliar a análise dos dados, mas existem situações em que uma pode ser mais conveniente do que a outra. Por exemplo, quando existe um ou mais valores muito discre- pantes, a média é muito influenciada por este valor e se torna inadequada para representar o conjunto de dados, sendo melhor trabalhar com a mediana. Por outro lado, para conjuntos de dados muito numerosos, a ordenação é custosa e a mediana se torna difícil de calcular. Estatística Unisa | Educação a Distância | www.unisa.br 33 Prezado(a) aluno(a), como visto, efetuar uma análise dos dados, utilizando-se somente as medi- das de posição, pode levar-nos a conclusões equi- vocadas. Para nos auxiliar na tarefa da análise de dados, utilizaremos também as medidas de disper- são. Observe o exemplo a seguir. Um bairro nobre da capital paulista inclui uma das maiores favelas de São Paulo. O que pode- mos dizer da renda média do bairro? Certamente, os altos rendimentos de alguns residentes serão suficientes para fazer a média atingir um patamar comparável às melhores economias do mundo, porém a discrepância entre os diversos valores deve ser muito grande. O que podemos estar es- quecendo é a variabilidade dos valores da variável e isso não é captado pela média, mas pelas medi- das de dispersão. As medidas de dispersão ou de variabili- dade servem para quantificar a variabilidade dos valores da variável, isto é, a dispersão dos dados, ou a forma como os valores de cada conjunto se espa- lham ao redor das medidas de tendência central. 4.2 Medidas de Dispersão Medidas de Dispersão para um Conjunto de Dados Sejam os valores assumidos por uma variável X. Consideremos, por exemplo, as séries: A: 10, 10, 11, 12, 12, 13, 14, 14, 14, 15 com = 12,5 e md = 12,5 B: 7, 7, 8, 9, 12, 13, 13, 16, 17, 23 com = 12,5 e md = 12,5 Observamos que essas séries não são homogêneas, apesar de ambas terem o mesmo valor para a média e a mediana. É preciso, pois, calcular as constantes de dispersão, que medem os afastamentos dos valores dessas séries em torno do valor central. Entre as medidas de dispersão ou de variabilidade mais usadas, temos: amplitude total, variân- cia, desvio padrão e coeficiente de variação. Amplitude total (R) É a diferença entre o maior e o menor valor de um conjunto de dados. Exemplos: Para a série A: R = 15 – 10 = 5. Para a série B: R = 23 – 7 = 16. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 34 A utilização da amplitude total como medida de dispersão é muito limitada, pois só leva em consi- deração dois valores de todo o conjunto de dados. Variância ( ) Para medir a dispersão dos valores de uma variável em torno da média, é interessante estudar o comportamento dos desvios de cada valor em relação à média, isto é, . Na determinação de cada desvio id , estaremos medindo a dispersão entre cada ix e a média x . Porém, se somarmos todos os desvios, teremos 0)xx(d n 1i i n 1i i =−= ∑∑ == . Para contornar o problema, resolveu-se considerar o quadrado de cada desvio 2i )xx( − . Assim, defini-se: Variância é a média aritmética dos quadrados dos desvios. A seguir, estão outras fórmulas que podem ser usadas para facilitar o cálculo da variância popula- cional e amostral. 2 N 1i 2 i 2 x N 1 µ−=σ ∑ = (dados não agrupados) ∑ = −= n 1i 22 i 2 )x(x n 1S (dados não agrupados) ∑ = µ−⋅=σ N 1i 22 ii 2 )xn( N 1 (dados agrupados) ∑ = −⋅= n 1i 22 ii 2 )x()xn( n 1S (dados agrupados) Estatística Unisa | Educação a Distância | www.unisa.br 35 Exemplos: Desvio padrão ( ) O desvio padrão é a raiz quadrada da variância. É assim definido para que a unidade original da variável, se houver, seja mantida, pois, pela fórmula do cálculo da variância, a unidade é elevada ao quadrado. 2σ=σ (desvio padrão populacional) 2SS = (desvio padrão amostral) Exemplos: Para a série A: Para a série B: Observação: O desvio padrão define, em torno da média populacional ou amostral, um intervalo [μ – σ, μ + σ ] ou [ Sx,Sx +− ] de amplitude 2σ ou 2S, respectivamente, chamado zona de normalidade. Coeficiente de variação (CV) O coeficiente de variação é uma medida relativa da dispersão que serve para comparar o grau de concentração em torno da média de conjuntos de dados distintos. Exemplos: Para a série A: Para a série B: Vemos, portanto, que há maior variação na série B do que na A, pois o CV, na série B, é bem maior que na série A. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 36 Exemplos: 1. Calcule amplitude total, variância, desvio padrão e coeficiente de variação para a variável Ida- de (Tabela 13) (Ver Tabela 11): Tabela 13 – Variável Idade. R = 25 – 17 = 8 (amplitude total) 2. Calcule amplitude total, variância, desvio padrão e coeficiente de variação para a variável Peso (Tabela 14) (Ver Tabela 12): Tabela 14 – Variável Peso. Estatística Unisa | Educação a Distância | www.unisa.br 37 4.4 Atividades Propostas 4.3 Resumo do Capítulo Prezado(a) aluno(a), vimos neste capítulo que as medidas de posição ou medidas de tendência central para um conjunto de dados qualquer (população ou amostra) são: a média, a mediana e a moda. Também foram apresentadas as medidas de dispersão. Entre as medidas de dispersão ou de variabilida- de mais usadas, temos: amplitude total, variância, desvio padrão e coeficiente de variação, que comple- mentarão as informações necessárias para a análise dos dados. Vamos, agora, avaliar a sua aprendizagem. 1. Vinte e cinco residências de certo bairro foram sorteadas e visitadas por um entrevistador, que, entre outras questões, perguntou sobre o número de televisores. Os dados foram os seguintes: 2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1,1, 3, 1, 2, 1, 0 e 2. Organize os dados numa tabela de frequência e determine todas as medidas de posição e de dispersão. 2. Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso avaliado no fim de um mês. Os dados referentes ao ganho de peso (em quilogramas) foram os seguintes: 1,5; 1,6; 2,3; 1,7; 1,5; 2,0; 1,5; 1,8; 2,1; 2,1; 1,9; 1,8; 1,7; 2,5 e 2,2. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 38 a. Utilizando os dados brutos, determine as medidas de posição e de dispersão desse con- junto. b. Organize uma tabela de frequência com faixas de amplitude 0,2 a partir de 1,5. c. Calcule, a partir da tabela de frequência e com o ponto médio como representante de cada faixa, as medidas de posição e de dispersão. Comente as diferenças encontradas com o item (a). d. Se ao invés de 15, fossem 500 coelhos, qual seria o procedimento mais conveniente: o de (a) ou o de (c)? Justifique. 3. As pulsações de 10 estudantes no início de uma prova de Estatística foram as seguintes (em batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Calcule as medidas de posição e de dispersão desse conjunto de dados. 4. Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo tive- ram o seu consumo observado durante 1000 quilômetros. A informação obtida é apresentada na Tabela 15, em km/litro. Tabela 15 – Consumo de combustível. Determine as medidas de posição e de dispersão do consumo. 5. Se a média das alturas de um grupo de pessoas é 175 cm e o desvio padrão é 20 cm, uma pes- soa com estatura de 150 cm está dentro da normalidade? Por quê? 6. Numa escola, duas turmas conseguiram os seguintes resultados: Responda: a. Qual a turma mais homogênea? Por quê? b. Um aluno com média 40 é considerado normal na turma A? E na turma B? Por quê? Estatística Unisa | Educação a Distância | www.unisa.br 39 7. Na aplicação de um teste de motricidade, conseguiram-se os resultados da Tabela 16. Tabela 16 – Motricidade. Responda: a. Qual é a média aritmética? b. Qual é o desvio padrão? c. Qual a zona considerada de normalidade? d. Uma criança que obteve 28 pontos é considerada com motricidade normal? Por quê? 8. Na pesagem de 20 crianças de quinta série, obtiveram-se os seguintes resultados, em kg: 38 40 45 42 45 40 43 38 45 45 40 41 41 38 46 32 48 46 42 43 44 50 38 40 Nesse grupo de crianças, um menino com 35 kg seria considerado com peso normal? Por quê? Unisa | Educação a Distância | www.unisa.br 41 5 PROBABILIDADES Prezado(a) aluno(a), neste capítulo, não será efetuado um estudo completo sobre a teoria das probabilidades, mas serão apresentados alguns conceitos que serão necessários para o estudo da Estatística e aplicados posteriormente. 5.1 Fenômeno Determinístico É aquele em que repetindo um experimen- to, nas mesmas condições, o resultado esperado é sempre o mesmo. Exemplo: se um corpo percorre uma distân- cia de 120 km, com velocidade média de 60 km/h, podemos determinar, pelas leis da Física, que ele gastará 2 horas para percorrer o referido espaço e isso sempre ocorrerá, desde que sejam mantidas as mesmas condições. 5.2 Fenômeno Aleatório ou Probabilístico É aquele cujo resultado não pode ser previsto com certeza, ainda que mantidas as mesmas con- dições de realização. Exemplo: no lançamento de um dado, não podemos dizer, com certeza, qual será o resultado. Só podemos saber que é provável que ocorra o re- sultado 1 ou 2 ou 3 ou 4 ou 5 ou 6. Veremos que modelos podem ser estabele- cidos para quantificar as incertezas das diversas ocorrências. AtençãoAtenção A maioria dos fenômenos tratada pela Es- tatística é de natureza aleatória ou proba- bilística. Observe que durante a escolha da amostra, temos um fenômeno proba- bilístico. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 42 5.3 Espaço Amostral (S) É o conjunto de todos os resultados possíveis de certo fenômeno aleatório. 5.4 Evento (E) É um subconjunto do espaço amostral. Exemplo: lançamos uma moeda duas vezes. Se C indica cara e R, coroa, temos: S = {(C, C); (C, R); (R, C); (R, R)} (espaço amos- tral) Seja o evento “obtenção de faces iguais”, te- mos: E = {(C, C); (R, R)} (evento) Seja o evento “obtenção de cara no 1º lança- mento”, temos: E = {(C, C); (C, R)} (evento) Exemplo: um experimento consiste em re- tirar uma lâmpada de um lote e medir seu tempo de vida antes de se queimar. Um espaço amostral conveniente é: S = {t: t ≥ 0}, isto é, o conjunto de to- dos os números reais não negativos. Seja o evento “o tempo de vida da lâmpada é inferior a 20 horas”, temos: E = {t: 0 ≤ t < 20}. Este é um exemplo de es- paço amostral contínuo, enquanto os outros ante- riores são discretos. 5.5 Probabilidade É a relação entre o número de possíveis resul- tados de E e todos os possíveis resultados do expe- rimento. Indicamos: P(E). No caso dos dois eventos anteriores, P(E) = 2 1 4 2 = . 5.6 Propriedades Sendo o modelo probabilístico um modelo teórico para as frequências relativas, podemos ve- rificar algumas das propriedades a seguir: Como toda frequência relativa é um nú- mero entre 0 e 1, temos que: 0 ≤ P(E) ≤ 1, para qualquer evento E; Considerando o espaço todo S e o con- junto vazio como eventos, temos: P(S) = 1 (evento certo) e P(Ø) = 0 (evento impossível) Estatística Unisa | Educação a Distância | www.unisa.br 43 5.7 Variável Aleatória Discreta Uma quantidade X, associada a cada possível resultado do espaço amostral S, é denominada vari- ável aleatória discreta se assume valores num conjunto enumerável de pontos do conjunto real, com certa probabilidade de ocorrência. Saiba maisSaiba mais Um pouco de História Os primeiros estudos envolvendo probabilidades foram motivados pela análise de jogos de azar. Sabe-se que um dos primeiros matemáticos que se ocupou com o cálculo das probabilidades foi Cardano (1501-1576). Data dessa época a expressão que utilizamos até hoje para o cálculo da probabilidade de um evento (número de casos favoráveis dividido pelo número de casos possíveis). Com Fermat (1601-1665) e Pascal (1623-1662), a teoria das probabilidades começou a evoluir e ganhar mais consistência, passando a ser utilizada em outros aspectos da vida social, como, por exemplo, auxiliando na descoberta da vacina contra a varíola no século XVIII. Atualmente, a teoria das probabilidades é muito utilizada em outros ramos da Matemática (como o Cálculo e a Estatística), da Biologia (especialmente nos estudos da Genética), da Física (como na Física Nuclear), da Economia, da Sociologia etc. 5.8 Função Discreta de Probabilidade A função que atribui a cada valor n321 x,,x,x,x da variável aleatória X sua pro- babilidade de ocorrência n321 p,,p,p,p , res- pectivamente, é denominada função discreta de probabilidade ou, simplesmente, função de pro- babilidade. Notação: ,3,2,1i,p)xX(P)x(p iii ==== ou, ainda, Uma função de probabilidade satisfaz: ∑ =≤≤ 1pe1p0 ii . Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 44 5.9 Variável Aleatória Contínua Uma quantidade X, associada a cada possível resultado do espaço amostral S, é denominada va- riável aleatória contínua se assume valores num intervalo do conjunto dos números reais, com cer- ta probabilidade de ocorrência. Exemplos: renda, salário, tempo de uso de um equipamento, área atingida por certa praga agrícola. 5.10 Função Contínua de Probabilidade Função contínua de probabilidade ou fun- ção densidade de probabilidade para uma vari- ável aleatória contínua X é toda função f (X) que satisfaz a duas condições:a. f (X) ≥ 0, para todo X ( , )∈ −∞ + ∞ ; b. a área definida por f (X) é igual a 1. 5.11 Resumo do Capítulo Prezado(a) aluno(a), neste capítulo, apresentamos alguns conceitos fundamentais sobre Probabili- dade, entre eles a definição de Espaço Amostral (S), Evento (E), Probabilidade, Variável Aleatória Discreta, Função Discreta de Probabilidade, Variável Aleatória Contínua e Função Contínua de Probabilidade. O cálculo das probabilidades pertence ao campo da Matemática, entretanto a maioria dos fenôme- nos de que trata a Estatística são de natureza aleatória ou probabilística. O conhecimento dos aspectos fundamentais do cálculo das probabilidades é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferência. Vamos, agora, avaliar a sua aprendizagem. Estatística Unisa | Educação a Distância | www.unisa.br 45 5.12 Atividades Propostas 1. Um número é escolhido ao acaso entre os 50 inteiros compreendidos entre 1 e 50. Qual a pro- babilidade do número: a. Ser múltiplo de 9? b. Ser múltiplo de 3 e de 4? c. Ser múltiplo de 3 ou de 4? d. Ser um número primo? 2. Numa caixa estão guardadas peças nas cores e formatos conforme a tabela abaixo: Ao sortear-se ao acaso uma das peças, qual a probabilidade de ocorrer uma peça: a. Circular Amarela? b. Retangular? c. Não Triangular? Unisa | Educação a Distância | www.unisa.br 47 6 VARIÁVEIS ALEATÓRIAS CONTÍNUAS Entre os principais modelos teóricos para variáveis aleatórias contínuas, estudaremos o modelo normal, pois vários fenômenos, como es- tatura, QI, orientação política, desgaste dos pisos etc., aproximam-se, na prática, muito bem desse modelo. 6.1 Modelo Normal ou Distribuição Normal Dizemos que uma variável aleatória contínua X tem distribuição normal com parâmetros , respec- tivamente a média e a variância da distribuição, –∞ < μ < +∞ e 0 < σ2 < +∞, se a sua função densidade de probabilidade é dada por: , para –∞ < X < +∞ AtençãoAtenção A função densidade de probabilidade é dada por: , para –∞ < X < +∞ Notação: X ~ N(μ, σ2) significa: X tem distribuição normal com parâmetros μ e σ2. Gráfico 5 – Curva normal. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 48 Saiba maisSaiba mais Modelo Normal O modelo normal, ou Gaussiano, é certamente o mais importante dos modelos para variáveis aleatórias contínu- as. Isto se justifica pelo grande número de aplicações que a utilizam e pela sua capacidade de aproximar outros modelos. Nesta distribuição, a média, mediana e moda são valores coincidentes. O cálculo de probabilidades na distribuição normal é feito mediante o conhecimento da média e desvio padrão da variável aleatória. Dada a importância desta distribuição, estas duas medidas são consideradas as mais importantes para verificar tendência central e dispersão, respectivamente. Observando-se o gráfico, temos: a. f (X) é simétrica em relação a μ, isto é, f (μ + X ) = f (μ – X ), para todo X, –∞ < X < +∞; b. f (X) 0 quando X ±∞; c. o valor máximo de f ( X ) se dá para X = μ, isto é, a curva normal é unimodal e média (μ), me- diana (Md) e moda (Mo) coincidem; d. E (X) = μ (valor esperado ou média); e. Var (X) = σ2 (variância); f ( X ) 0 quando X→ → ±∞f ( X ) 0 quando X→ → ±∞ Como calcular P (a ≤ X ≤ b)? Gráfico 6 – Probabilidade. As probabilidades para o modelo normal são calculadas com o auxílio de tabelas e, para evitarmos a multiplicação desnecessária de tabelas para cada par de valores (μ, σ2), utiliza-se uma transformação que conduz sempre ao cálculo de probabilidades com uma variável de parâmetros (0, 1), isto é, μ = 0 (média) e σ² = 1 (variância). Desse modo, se X ~ N(μ, σ2) , definimos uma nova variável σ µ− = XZ , para qual se demonstra que μ ( Z ) = 0 e σ2 ( Z ) = 1. Logo Z ~ N(μ, σ2) e é denominada Normal padrão ou Normal reduzida. Estatística Unisa | Educação a Distância | www.unisa.br 49 6.2 Resumo do Capítulo Agora, para calcularmos P ( a ≤ X ≤ b), fazemos a seguinte transformação: P ( a ≤ X ≤ b) = )bZa(P σ µ− ≤≤ σ µ− , onde X ~ N(μ, σ²). Portanto, quaisquer que sejam os valores de μ e σ, utilizamos a normal padrão para obter proba- bilidades com a distribuição normal. Os valores P ( 0 ≤ Z ≤ z ), z ≥ 0 são tabelados. Pela simetria da curva normal, podemos calcular valores de probabilidades em outros intervalos e, também, temos que a probabilidade de estar à direita (ou à esquerda) de zero é 0,5. Como a probabilida- de é sempre um número compreendido entre 0 e 1, a tabela contém apenas a parte decimal. DicionárioDicionário Simetria Matemática: disposição de duas figuras que se correspondem ponto por ponto de tal sorte que os dois pontos corres- pondentes de uma e da outra estejam a igual distância de um ponto, de uma reta ou de um plano dado. Eixo de simetria, reta comum a todos os planos de simetria. Note que temos um eixo central na curva normal. Se pegarmos um ponto pertencente à curva normal à direita do eixo central, teremos um ponto correspondente à es- querda deste eixo que estará à mesma distância do eixo central. Gráfico 7 – Normal padrão ou normal reduzida. Prezado(a) aluno(a), neste capítulo, vimos como criar um modelo probabilístico e o que é uma fun- ção densidade de probabilidade. De modo geral, podemos dizer que as variáveis aleatórias, cujos valores resultam de mensurações ou medições, são variáveis aleatórias contínuas. A construção de modelos probabilísticos para variáveis aleatórias contínuas envolve a ideia da ge- 0 -1 1 f ( Z ) Z Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 50 neralização do histograma, fazendo o número de classes e o número de valores tenderem para o infinito, que significa construir intervalos de classes extremamente pequenos, ínfimos. Observe que a forma do histograma sofre uma modificação, passando a apresentar uma curva sua- ve, ou seja, uma linha contínua, como visto no Gráfico 5. Esta curva contínua é a representação gráfica de uma função da variável aleatória X, chamada de função densidade de probabilidade. Vamos, agora, avaliar a sua aprendizagem. 6.3 Atividades Propostas 1. As alturas de 10.000 alunos têm distribuição aproximadamente normal, com média 170 cm e desvio padrão 5 cm. Qual a probabilidade de termos: a. Alunos com alturas entre 165 cm e 170 cm. b. Entre 165 cm e 180 cm. c. Entre 168 cm e 185 cm. d. Menores que 160 cm. e. Maiores que 180 cm. f. Qual o número esperado de alunos com altura superior a 165 cm? 2. Suponha um consultor investigando o tempo que os trabalhadores de uma fábrica levam para montar determinada peça. Suponha que análises da linha de produção tenham calculado um tempo médio de 75 segun- dos e desvio padrão de 6 segundos. O que isso significa graficamente? Ainda na Escala de X, o tempo central é a média de 75 segundos. Na Escala de Z, a média é 0 e os intervalos têm como base o desvio padrão. Mas, assim como X, a variável Z é contínua. Pergunta: Como 87, na Escala de X, pode ser relacionado a 2σ, na Escala de Z? 3. Suponha, agora, que o consultor queira saber qual a probabilidade de um trabalhador levar um tempo entre 75 e 81 segundos para montar uma peça, ou seja, P(75≤X≤81). Unisa | Educação a Distância | www.unisa.br 51 7 ESTIMAÇÃO 7.1 Estimação por Intervalo A estimação faz parte da Inferência Estatísti- ca, que tem por objetivo fazer generalizações sobre uma população com base em dados de uma amos- tra. A estimação por ponto não permite julgar qual a possível magnitude do erro que estamos co- metendo ao substituir o parâmetro por um único valor. Daí surge a ideia de construir intervalos de confiança, que são baseados na distribuição amos- tral do estimadorpontual, incorporando à estimati- va pontual do parâmetro informações a respeito de sua variabilidade. Um intervalo de confiança é determinado por dois valores, que são os seus limites, chamados “limites de confiança”, que com certa probabili- dade incluem o verdadeiro valor do parâmetro da população. Logo, a estimação por intervalo consiste na fixação de dois valores tais que γ seja a probabilida- de de que o intervalo, por eles determinado, conte- nha o verdadeiro valor do parâmetro. Prezado(a) aluno(a), neste capítulo iremos abordar aspectos relacionados à Inferência Estatís- tica. Até o presente momento, você aprendeu a descrever uma amostra por meio de medidas de tendência central e medidas de dispersão, que compõem a Estatística Descritiva. A partir de ago- ra, você irá aprender a utilizar a Inferência Estatís- tica para inferir indutivamente propriedades de uma população, com base nos resultados obtidos com uma amostra. A Inferência Estatística nos permitirá tomar decisões sobre populações com base nas informa- ções obtidas em amostras das mesmas. Por exem- plo, com base nos dados amostrais, podemos de- cidir se uma determinada droga é eficiente para o tratamento de uma doença entre outros. Existem dois tipos de estimação: por ponto e por intervalo. Na estimação por ponto, é proposto um úni- co valor para substituir o parâmetro (dado da população). Assim, o estimador por ponto da mé- dia aritmética populacional μ é a média aritméti- ca amostral x ; o estimador por ponto da variância populacional σ² é a variância amostral S². DicionárioDicionário Inferir: Tirar uma conclusão a partir de um fato, de um princípio. Concluir, deduzir. AtençãoAtenção A estimação faz parte da Inferência Esta- tística, que tem por objetivo fazer gene- ralizações sobre uma população com base em dados de uma amostra. Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 52 γ é chamado de coeficiente de confiança ou nível de confiabilidade. 1 – γ é o nível de significância ou nível de incerteza ou, ainda, grau de desconfiança. Portanto, a partir de informação de amostra, devemos calcular os limites de um intervalo, que, em γ % dos casos, inclua o valor do parâmetro a estimar e, em (1 – γ)% dos casos, não inclua o valor do parâ- metro. Intervalo de Confiança (IC) para a Média Populacional (Variância Conhecida) Consideremos, inicialmente, o intervalo de confiança para a média μ (desconhecida) de certa po- pulação normal, com variância conhecida σ². Supondo uma amostra X de tamanho n, com valores X1, X2, ..., Xn, temos que Xonde,)n ,(N~X 2σ µ é a média amostral. Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para μ, com coeficiente de confiança γ, como: IC (μ , γ ) = X 2 X 2 X 2 X 2 .zX.zX.zX;.zX σ+≤µ≤σ−= σ+σ− γγγγ , onde: X é a média amostral. 2 z γ é obtido da tabela da normal padrão, localizando o valor de 2 γ no corpo da tabela e obtendo o valor 2 z γ nas margens correspondentes. nX σ =σ é o desvio padrão da média amostral. Os “limites de confiança” citados anteriormente são os números obtidos por X 2 X 2 .zXe.zX σ+σ− γγ . A expressão IC (μ , γ) envolve a quantidade X , que é uma variável aleatória e, sendo assim, o inter- valo obtido também é aleatório, com probabilidade γ de conter o verdadeiro valor da média populacio- nal μ. Assim, uma interpretação conveniente para o intervalo de confiança é: se obtivermos várias amostras de mesmo tamanho e, para cada uma delas, calcularmos os correspondentes intervalos de confiança com coeficiente de confiança γ, esperamos que a proporção de intervalos que conte- nham o valor de μ seja igual a γ. Exemplo: Suponha que os comprimentos de jacarés adultos de certa raça sigam o modelo normal com mé- dia μ desconhecida e variância igual a 0,01 m². Uma amostra de dez animais foi sorteada e forneceu mé- dia 1,69 m. Desejamos uma estimativa para o parâmetro desconhecido μ, com coeficiente de confiança de 95%. Identificando os dados do problema, temos: σ² = 0,01; n = 10; X = 1,69; γ = 95%; Estatística Unisa | Educação a Distância | www.unisa.br 53 ) n ,(N~X 2σ µ IC (μ , γ ) = [ ].zX;.zX X 2 X 2 σ+σ− γγ IC (μ , 95% ) = [ 1,63 ; 1,75 ] Concluindo, podemos dizer que, em 100 intervalos construídos, 95 contêm a verdadeira média e, de modo geral, admitimos que o intervalo calculado é um dos que contém a verdadeira média μ. Por essa razão, além de informar o intervalo obtido, devemos também fornecer o índice de confiança utilizado. Observações: A amplitude do intervalo de confiança é dada pela diferença entre o extremo superior e infe- rior, isto é, X 2 X 2 X 2 .z2).zX(.zX σ=σ−−σ+ γγγ A semiamplitude, ou seja, X 2 .z σγ nos fornece o erro envolvido na estimação; Se a população for finita e de tamanho N conhecido e se a amostra de tamanho n dela retirada for sem reposição, então: 1N nN. nX − −σ =σ Exemplo: De uma população de 1000 elementos com distribuição aproximadamente normal com σ² = 400, tira-se uma amostra de 25 elementos, obtendo-se = 150. Fazer um IC para μ, ao nível de 5%. Identificando os dados do problema, temos: N = 1000; σ² = 400; n = 25; = 150; 1 – γ = 5%.150X = 150X = Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 54 Esquema para melhor compreensão Estatística Unisa | Educação a Distância | www.unisa.br 55 Figura 2 – Intervalo de Confiança – Média Populacional. Intervalo de Confiança para a Proporção Quando o tamanho da amostra ( n ) for grande, temos: , onde pˆ é a proporção amos- tral e q = 1 – p. Consideramos uma amostra grande quando n > 30. Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para p, com coeficiente de confiança γ, como: IC (p , γ ) = [ ].zpˆ;.zpˆ pˆ 2 pˆ 2 σ+σ− γγ = , onde: pˆ é a proporção amostral. 2 z γ é obtido da tabela da normal padrão, localizando o valor de 2 γ no corpo da tabela e obtendo o valor 2 z γ nas margens correspondentes. n qˆ.pˆ pˆ =σ é o desvio padrão da proporção amostral, com pˆ1qˆ −= . Exemplo: Suponha que, em n = 400 provas, obtemos k = 80 sucessos. Vamos obter um intervalo de confiança para p, com coeficiente de confiança γ = 90%. Identificando os dados do problema, temos: n = 400; γ = 90% pˆ 2 pˆ 2 .zpˆp.zpˆ σ+≤≤σ− γγ Regina Maria Sigolo Bernardinelli Unisa | Educação a Distância | www.unisa.br 56 IC (p , 90%) = [0,2 – 1,64 . 0,02 ; 0,2 + 1,64 . 0,02] IC (p , 90%) = [ 0,167 ; 0,233 ] Observação: Para a proporção, o erro envolvido na estimação é dado por: pˆ 2 .z σγ Intervalo de Confiança (IC) para a Média Populacional (Variância Desconhecida) Para estimarmos a média de uma população normal com variância desconhecida, quando o tama- nho (n) da amostra for grande, n > 30, substituímos σ² pela variância amostral S2 e usamos a distribuição normal. Fixado um valor γ tal que 0 < γ <1, definimos o intervalo de confiança para μ, com coeficiente de confiança γ, como: IC (μ , γ ) = [ ].zX;.zX X 2 X 2 σ+σ− γγ , onde: X é a média amostral. 2 z γ é obtido da tabela da normal padrão, localizando o valor de 2 γ no corpo da tabela e obtendo o valor 2 z γ nas margens correspondentes. n S X =σ é o desvio padrão da média amostral, com Exemplo: 1. De uma população normal com parâmetros desconhecidos, tiramos uma amostra de tama- nho 100, obtendo-se 112X = e S = 11. Fazer
Compartilhar