apostila
139 pág.

apostila


DisciplinaProbabilidade e Estatística12.138 materiais114.837 seguidores
Pré-visualização19 páginas
. 122
6.1.3.4.2 Amostras pequenas (n \u2264 30) . . . . . . . . . . . . 123
6.1.3.5 Intervalo de confianc¸a para a varia\u2c6ncia (\u3c32) . . . . . . . . 123
6.2 Teoria da decisa\u2dco (Testes de Hipo´teses) . . . . . . . . . . . . . . . . . . . . 123
6.2.1 Metodologia de um teste de hipo´tese . . . . . . . . . . . . . . . . . 124
6.2.2 Tipos de erros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.2.3 Tipos de testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6
6.2.4 Algoritmo para realizac¸a\u2dco de um teste de hipo´tese . . . . . . . . . . 128
6.2.5 Estat´\u131stica apropriadas para os testes de hipo´teses . . . . . . . . . . 130
6.2.6 Teste de Qui-Quadrado (\u3c72) . . . . . . . . . . . . . . . . . . . . . . 131
6.2.6.1 Teste de adere\u2c6ncia . . . . . . . . . . . . . . . . . . . . . . 131
6.2.6.2 Teste de independencia . . . . . . . . . . . . . . . . . . . . 133
7 Regressa\u2dco e Correlac¸a\u2dco linear 136
Cap´\u131tulo 1
Introduc¸a\u2dco
O cidada\u2dco comum pensa que a estat´\u131stica se resume apenas a apresentar
tabelas de nu´meros em colunas esportivas e ou econo\u2c6micas de jornais e revistas, ilustradas
com gra´ficos, pilhas de moedas, etc. ou quando muito associam a estat´\u131stica a` previsa\u2dco de
resultados eleitorais. Mas estat´\u131stico de hoje na\u2dco se limita a compilar tabelas de dados e
os ilustrar graficamente. Pois a` partir de 1925, com os trabalhos de Fisher, a estat´\u131stica
iniciou-se como me´todo cient´\u131fico, enta\u2dco, o trabalho do estat´\u131stico passou a ser o de ajudar
a planejar experimentos, interpretar e analisar os dados experimentais e apresentar os re-
sultados de maneira a facilitar a tomada de deciso\u2dces razoa´veis. Deste modo, podemos enta\u2dco
definir estat´\u131stica como sendo a cie\u2c6ncia que se preocupa com a coleta, organizac¸a\u2dco, apre-
sentac¸a\u2dco, ana´lise e interpretac¸a\u2dco de dados. Didaticamente podemos dividir a estat´\u131stica
em duas partes a estat´\u131stica descritiva e a infere\u2c6ncia estat´\u131stica. A estat´\u131stica descritiva
se refere a maneira de apresentar um conjunto de dados em tabelas e gra´ficos, e ao modo
de resumir as informac¸o\u2dces contidas nestes dados a algumas medidas. Ja´ a infere\u2c6ncia es-
tat´\u131stica baseia-se na teoria das probabilidades para estabelecer concluso\u2dces sobre todo um
grupo (chamado populac¸a\u2dco), quando se observou apenas uma parte (amostra) desta pop-
ulac¸a\u2dco. E´ necessa´rio ter em mente que a estat´\u131stica e´ uma ferramenta para o pesquisador,
nas respostas dos \u201cpor que\u2c6s\u201d de seus problemas. E que para ela ser bem usada e´ necessa´rio
conhecer os seus fundamentos e princ´\u131pios, e acima de tudo que o pesquisador desenvolva
um esp´\u131rito cr´\u131tico e jamais deixe de pensar. Pois \u201dem cie\u2c6ncia e´ fa´cil mentir usando a
7
8
estat´\u131stica, o dif´\u131cil e´ falar a verdade sem usar a estat´\u131stica\u201d.
Cap´\u131tulo 2
Estat´\u131stica descritiva
2.1 Organizac¸a\u2dco e apresentac¸a\u2dco de dados.
As observac¸o\u2dces sa\u2dco o material ba´sico com que o pesquisador trabalha. Es-
tas observac¸o\u2dces podem ser por exemplo a produtividade de uma planta, a velocidade de
processamento de um computador, a resiste\u2c6ncia a` ruptura de determinado cabo, suscetibil-
idade ou na\u2dco de um indiv´\u131duo a determinada doenc¸a, cor de uma flor, sexo do primeiro
filho de um casal, opinia\u2dco dos alunos quanto a dida´tica de um professor, etc. Estas ob-
servac¸o\u2dces apresentam uma caracter´\u131stica em comum que e´ a variac¸a\u2dco ou variabilidade, ou
seja assumem diferentes valores de indiv´\u131duo para indiv´\u131duo.
Uma caracter´\u131stica que pode assumir diferentes valores de indiv´\u131duo para
indiv´\u131duo e´ denominada varia´vel. Caso contra´rio e´ denominada constante. As varia´veis
sa\u2dco classificadas em:
\u2022 QUALITATIVAS: Sa\u2dco aquelas para as quais uma medic¸a\u2dco nume´rica na\u2dco e´ poss´\u131vel.
Ex: Cor de flor, sexo, sabor.
\u2022 QUANTITATIVAS: Sa\u2dco aquelas para as quais e´ poss´\u131vel se realizar-se uma medic¸a\u2dco
nume´rica, subdivide-se em:
\u2013 DISCRETAS: Pro´prias de dados de contagem, ou seja so´ assumem valores in-
teiros. Ex: nu´mero de filhos, nu´mero de acidentes de tra\u2c6nsito ocorridos num
9
10
certo per´\u131odo, etc.
\u2013 CONTI´NUAS: Sa\u2dco aquelas origina´rias de medic¸o\u2dces, deste modo, podem assumir
qualquer valor real entre dois extremos. Ex: Peso corporal, altura, resiste\u2c6ncia
a ruptura, volume, etc.
Os dados coletados no campo e trazidos para o laborato´rio (escrito´rio), na
forma em que se encontram, como os apresentados na Tabela 2.1, sa\u2dco denominados dados
brutos. Normalmente este tipo de dados tra´s pouca ou nenhuma informac¸a\u2dco ao leitor,
sendo necessa´rio uma elaborac¸a\u2dco (organizac¸a\u2dco) destes dados, afim de aumentar sua ca-
pacidade de informac¸a\u2dco.
Tabela 2.1: Dia\u2c6metro a` altura do peito (DAP), em mm de 40 pe´s de Eucalyptus citriodora
aos 6 anos de idade em Lavras - MG
104 122 129 144 183
108 142 138 151 138
138 106 122 146 115
101 201 161 82 179
163 169 167 137 142
141 120 189 132 111
90 210 132 172 140
154 98 127 87 136
A mais simples organizac¸a\u2dco nume´rica e´ ordenac¸a\u2dco dados em ordem crescente
ou decrescente (ROL). Como pode-se observar na Tabela 2, a simples organizac¸a\u2dco dos
dados em um Rol, aumenta muito a capacidade de informac¸a\u2dco destes. Pois enquanto a
Tabela 2.1 nos informava apenas que t´\u131nhamos 40 pe´s de Eucalipto, e alguns D.A.P., na
Tabela 2.2, verificamos que o menor dia\u2c6metro observado foi 82 mm e o maior 210 mm, o
que nos fornece uma amplitude total de variac¸a\u2dco da ordem de 128 mm.
Amplitude total
11
A = maior valor observado\u2212menor valor observado (2.1)
A = 210mm\u2212 82mm = 128mm
Pode-se observar ainda que alguns dia\u2c6metros como 122 mm, 132 mm 138
mm e 142 mm sa\u2dco mais comuns.
Tabela 2.2: Tabela 2. Dia\u2c6metro a` altura do peito (DAP), em mm de 40 pe´s de Eucalyptus
citriodora aos 6 anos de idade em Lavras - MG
82 111 132 142 167
87 115 136 142 169
90 120 137 144 172
98 122 138 146 179
101 122 138 151 183
104 127 138 154 189
106 129 140 161 201
108 132 141 163 210
2.1.1 Apresentac¸a\u2dco tabular
2.1.1.1 Distribuic¸o\u2dces de frequ¨e\u2c6ncias
Apo´s esta primeira organizac¸a\u2dco dos dados, podemos ainda agrupa-los em
classes de menor tamanho, afim de aumentar sua a capacidade de informac¸a\u2dco.
Distribuindo-se os dados observados em classes e contando-se o numero de in-
div´\u131duos contidos em cada classe, obte´m-se a frequ¨e\u2c6ncia de classe. A disposic¸a\u2dco tabular dos
dados agrupados em classes, juntamente com as frequ¨e\u2c6ncias correspondentes denomina-se
distribuic¸a\u2dco de frequ¨e\u2c6ncia.
Para identificar uma classe, deve-se conhecer os valores dos limites inferior
e superior da classe, que delimitam o intervalo de classe. Por exemplo, para o caso dos
12
DAP dos eucaliptos, pode-se desejar incluir em uma u´nica classe todos os indiv´\u131duos que
possuam DAP entre 120 e 138 mm assim, o intervalo de classe seria de 120 mm a 138 mm.
Neste ponto surge uma du´vida fundamental. Indiv´\u131duos que apresentem
DAP exatamente iguais a 120 mm ou a 138 mm pertencem ou na\u2dco a esta classe? Deste
modo surge a necessidade de definir a natureza do intervalo de classe, se e´ aberto ou
fechado. Quando o intervalo de classe e´ aberto, os limites da classe na\u2dco pertencem a ela, e
quando o intervalo e´ fechado, os limite de classe pertencem a classe em questa\u2dco. Notac¸a\u2dco:
\u2022 Intervalos abertos
]128mm - 138mm[
\u2022 Intervalos fechados
[128mm - 138mm]
(128mm - 138mm)
\u2022 Intervalos mistos
Sa\u2dco fechados em um extremo e abertos no outro, como por exemplo:
[128mm - 138mm[
para este tipo de intervalo pode-se utilizar ainda a seguinte notac¸a\u2dco:
128mm ` 138mm
Construc¸a\u2dco de uma distribuic¸a\u2dco de frequ¨e\u2c6ncia
Para montar uma distribuic¸a\u2dco de frequ¨e\u2c6ncia e´ necessa´rio que primeiramente
se determine o nu´mero de classes (k) em que os dados sera\u2dco agrupados. Por questo\u2dces de
ordem