. 122 6.1.3.4.2 Amostras pequenas (n ≤ 30) . . . . . . . . . . . . 123 6.1.3.5 Intervalo de confianc¸a para a variaˆncia (σ2) . . . . . . . . 123 6.2 Teoria da decisa˜o (Testes de Hipo´teses) . . . . . . . . . . . . . . . . . . . . 123 6.2.1 Metodologia de um teste de hipo´tese . . . . . . . . . . . . . . . . . 124 6.2.2 Tipos de erros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 6.2.3 Tipos de testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 6 6.2.4 Algoritmo para realizac¸a˜o de um teste de hipo´tese . . . . . . . . . . 128 6.2.5 Estat´ıstica apropriadas para os testes de hipo´teses . . . . . . . . . . 130 6.2.6 Teste de Qui-Quadrado (χ2) . . . . . . . . . . . . . . . . . . . . . . 131 6.2.6.1 Teste de adereˆncia . . . . . . . . . . . . . . . . . . . . . . 131 6.2.6.2 Teste de independencia . . . . . . . . . . . . . . . . . . . . 133 7 Regressa˜o e Correlac¸a˜o linear 136 Cap´ıtulo 1 Introduc¸a˜o O cidada˜o comum pensa que a estat´ıstica se resume apenas a apresentar tabelas de nu´meros em colunas esportivas e ou econoˆmicas de jornais e revistas, ilustradas com gra´ficos, pilhas de moedas, etc. ou quando muito associam a estat´ıstica a` previsa˜o de resultados eleitorais. Mas estat´ıstico de hoje na˜o se limita a compilar tabelas de dados e os ilustrar graficamente. Pois a` partir de 1925, com os trabalhos de Fisher, a estat´ıstica iniciou-se como me´todo cient´ıfico, enta˜o, o trabalho do estat´ıstico passou a ser o de ajudar a planejar experimentos, interpretar e analisar os dados experimentais e apresentar os re- sultados de maneira a facilitar a tomada de deciso˜es razoa´veis. Deste modo, podemos enta˜o definir estat´ıstica como sendo a cieˆncia que se preocupa com a coleta, organizac¸a˜o, apre- sentac¸a˜o, ana´lise e interpretac¸a˜o de dados. Didaticamente podemos dividir a estat´ıstica em duas partes a estat´ıstica descritiva e a infereˆncia estat´ıstica. A estat´ıstica descritiva se refere a maneira de apresentar um conjunto de dados em tabelas e gra´ficos, e ao modo de resumir as informac¸o˜es contidas nestes dados a algumas medidas. Ja´ a infereˆncia es- tat´ıstica baseia-se na teoria das probabilidades para estabelecer concluso˜es sobre todo um grupo (chamado populac¸a˜o), quando se observou apenas uma parte (amostra) desta pop- ulac¸a˜o. E´ necessa´rio ter em mente que a estat´ıstica e´ uma ferramenta para o pesquisador, nas respostas dos “por queˆs” de seus problemas. E que para ela ser bem usada e´ necessa´rio conhecer os seus fundamentos e princ´ıpios, e acima de tudo que o pesquisador desenvolva um esp´ırito cr´ıtico e jamais deixe de pensar. Pois ”em cieˆncia e´ fa´cil mentir usando a 7 8 estat´ıstica, o dif´ıcil e´ falar a verdade sem usar a estat´ıstica”. Cap´ıtulo 2 Estat´ıstica descritiva 2.1 Organizac¸a˜o e apresentac¸a˜o de dados. As observac¸o˜es sa˜o o material ba´sico com que o pesquisador trabalha. Es- tas observac¸o˜es podem ser por exemplo a produtividade de uma planta, a velocidade de processamento de um computador, a resisteˆncia a` ruptura de determinado cabo, suscetibil- idade ou na˜o de um indiv´ıduo a determinada doenc¸a, cor de uma flor, sexo do primeiro filho de um casal, opinia˜o dos alunos quanto a dida´tica de um professor, etc. Estas ob- servac¸o˜es apresentam uma caracter´ıstica em comum que e´ a variac¸a˜o ou variabilidade, ou seja assumem diferentes valores de indiv´ıduo para indiv´ıduo. Uma caracter´ıstica que pode assumir diferentes valores de indiv´ıduo para indiv´ıduo e´ denominada varia´vel. Caso contra´rio e´ denominada constante. As varia´veis sa˜o classificadas em: • QUALITATIVAS: Sa˜o aquelas para as quais uma medic¸a˜o nume´rica na˜o e´ poss´ıvel. Ex: Cor de flor, sexo, sabor. • QUANTITATIVAS: Sa˜o aquelas para as quais e´ poss´ıvel se realizar-se uma medic¸a˜o nume´rica, subdivide-se em: – DISCRETAS: Pro´prias de dados de contagem, ou seja so´ assumem valores in- teiros. Ex: nu´mero de filhos, nu´mero de acidentes de traˆnsito ocorridos num 9 10 certo per´ıodo, etc. – CONTI´NUAS: Sa˜o aquelas origina´rias de medic¸o˜es, deste modo, podem assumir qualquer valor real entre dois extremos. Ex: Peso corporal, altura, resisteˆncia a ruptura, volume, etc. Os dados coletados no campo e trazidos para o laborato´rio (escrito´rio), na forma em que se encontram, como os apresentados na Tabela 2.1, sa˜o denominados dados brutos. Normalmente este tipo de dados tra´s pouca ou nenhuma informac¸a˜o ao leitor, sendo necessa´rio uma elaborac¸a˜o (organizac¸a˜o) destes dados, afim de aumentar sua ca- pacidade de informac¸a˜o. Tabela 2.1: Diaˆmetro a` altura do peito (DAP), em mm de 40 pe´s de Eucalyptus citriodora aos 6 anos de idade em Lavras - MG 104 122 129 144 183 108 142 138 151 138 138 106 122 146 115 101 201 161 82 179 163 169 167 137 142 141 120 189 132 111 90 210 132 172 140 154 98 127 87 136 A mais simples organizac¸a˜o nume´rica e´ ordenac¸a˜o dados em ordem crescente ou decrescente (ROL). Como pode-se observar na Tabela 2, a simples organizac¸a˜o dos dados em um Rol, aumenta muito a capacidade de informac¸a˜o destes. Pois enquanto a Tabela 2.1 nos informava apenas que t´ınhamos 40 pe´s de Eucalipto, e alguns D.A.P., na Tabela 2.2, verificamos que o menor diaˆmetro observado foi 82 mm e o maior 210 mm, o que nos fornece uma amplitude total de variac¸a˜o da ordem de 128 mm. Amplitude total 11 A = maior valor observado−menor valor observado (2.1) A = 210mm− 82mm = 128mm Pode-se observar ainda que alguns diaˆmetros como 122 mm, 132 mm 138 mm e 142 mm sa˜o mais comuns. Tabela 2.2: Tabela 2. Diaˆmetro a` altura do peito (DAP), em mm de 40 pe´s de Eucalyptus citriodora aos 6 anos de idade em Lavras - MG 82 111 132 142 167 87 115 136 142 169 90 120 137 144 172 98 122 138 146 179 101 122 138 151 183 104 127 138 154 189 106 129 140 161 201 108 132 141 163 210 2.1.1 Apresentac¸a˜o tabular 2.1.1.1 Distribuic¸o˜es de frequ¨eˆncias Apo´s esta primeira organizac¸a˜o dos dados, podemos ainda agrupa-los em classes de menor tamanho, afim de aumentar sua a capacidade de informac¸a˜o. Distribuindo-se os dados observados em classes e contando-se o numero de in- div´ıduos contidos em cada classe, obte´m-se a frequ¨eˆncia de classe. A disposic¸a˜o tabular dos dados agrupados em classes, juntamente com as frequ¨eˆncias correspondentes denomina-se distribuic¸a˜o de frequ¨eˆncia. Para identificar uma classe, deve-se conhecer os valores dos limites inferior e superior da classe, que delimitam o intervalo de classe. Por exemplo, para o caso dos 12 DAP dos eucaliptos, pode-se desejar incluir em uma u´nica classe todos os indiv´ıduos que possuam DAP entre 120 e 138 mm assim, o intervalo de classe seria de 120 mm a 138 mm. Neste ponto surge uma du´vida fundamental. Indiv´ıduos que apresentem DAP exatamente iguais a 120 mm ou a 138 mm pertencem ou na˜o a esta classe? Deste modo surge a necessidade de definir a natureza do intervalo de classe, se e´ aberto ou fechado. Quando o intervalo de classe e´ aberto, os limites da classe na˜o pertencem a ela, e quando o intervalo e´ fechado, os limite de classe pertencem a classe em questa˜o. Notac¸a˜o: • Intervalos abertos ]128mm - 138mm[ • Intervalos fechados [128mm - 138mm] (128mm - 138mm) • Intervalos mistos Sa˜o fechados em um extremo e abertos no outro, como por exemplo: [128mm - 138mm[ para este tipo de intervalo pode-se utilizar ainda a seguinte notac¸a˜o: 128mm ` 138mm Construc¸a˜o de uma distribuic¸a˜o de frequ¨eˆncia Para montar uma distribuic¸a˜o de frequ¨eˆncia e´ necessa´rio que primeiramente se determine o nu´mero de classes (k) em que os dados sera˜o agrupados. Por questo˜es de ordem