Buscar

Estatistica B

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 9 páginas

Prévia do material em texto

Exemplo 10. Número de filhos e quantidade de alunos são exemplos de va-
riáveis quantitativa discreta.
Contínua: pode assumir qualquer valor entre dois limites.
Exemplo 11. Peso, altura e faixa etária são exemplos de variáveis do tipo
qualitativa contínua.
1.3 Organização dos dados
1.3.1 Distribuição de frequência para variáveis qualitativos
Vamos imaginar uma pesquisa referente ao sexo (masculino – M ou feminino – F) de
10 alunos em uma sala de aula, o qual foi descrito na tabela abaixo:
Tabela 1 – Pessoas do sexo feminino (F) e pessoas do sexo masculino (M)
M F F M M M F M F M
Fonte: Dados hipotéticos
Vamos construir a tabela de frequência para os dados apresentados na Tabela 1:
Tabela 2 – Distribuição de frequência para pessoas do sexo feminino e pessoas do sexo masculino
Sexo (categoria) Frequência absoluta Frequência relativa
Feminino 4 0,4
Masculino 6 0,6
Total 10 1
1.3.1.1 Representação gráfica para dados qualitativos
1.3.1.1.1 Gráfico em colunas ou em barras
O gráfico em colunas ou em barras é utilizado para representar da variáveis quanti-
tativa por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente
(em barras).
Vamos construir os gráficos de colunas e de barras para a Tabela 2.
10
Figura 1 – Gráfico de colunas e de barras para o total de pessoas do sexo feminino e pessoas do
sexo masculino
1.3.2 Distribuição de frequência para dados qualitativos
Vamos imaginar uma pesquisa referente às estaturas (cm) de quarenta alunos, que
compõem uma amostra dos alunos de uma universidade, o que resultou na tabela de
valores abaixo:
Tabela 3 – Estatura dos alunos de uma universidade.
166 160 161 150 162 160 165 167 164 160
162 168 161 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
Fonte:Dados hipotéticos
Obs. 2. A Tabela 3 é denominada de tabela primitiva por considerar que os elementos
ainda não foram organizados.
Visualizando a tabela acima percebemos que fica difícil saber em torno de que valor
tende a se concentrar as estaturas dos alunos, qual a menor ou qual a maior estatura ou,
ainda, quantos alunos se acham abaixo ou acima de uma determinada estatura. Logo é
importante organizar os dados e a maneira mais simples é através de uma certa ordenação
(crescente ou decrescente), a tabela obtida através da ordenação dos dados recebe o nome
de Rol.
Tabela 4 – Estatura dos alunos de uma universidade (Rol).
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
11
Após a ordenação dos dados, é aconselhável a elaboração de tabelas de frequências.
Estas tabelas podem ser classificados em:
1. tabelas de frequências para dados agrupados sem intervalo de classe;
2. tabelas de frequências para dados agrupados com intervalo de classe.
Obs. 3. Podemos chamar de dados não agrupados um conjunto qualquer de valores
assumidos por uma variável quantitativa (tabela primitiva), como por exemplo a Tabela 3.
1.3.2.1 Dados agrupados sem intervalo de classe
Vamos construir a tabela de frequência absoluta para os dados apresentados na Ta-
bela 3:
Tabela 5 – Distribuição de frequência da estatura dos alunos de uma universidade (sem intervalo
de classe)
𝑖 Estatura Frequência (𝑓𝑖) 𝑖 Estatura Frequência (𝑓𝑖)
1 150 1 12 162 2
2 151 1 13 163 2
3 152 1 14 164 3
4 153 1 15 165 1
5 154 1 16 166 1
6 155 4 17 167 1
7 156 3 18 168 2
8 157 1 19 169 1
9 158 2 20 170 1
10 160 5 21 172 1
11 161 4 22 173 1
Total 24 16
Observando a tabela acima, percebemos que a construção desta não é adequada
quando o número de observações da variável é de tamanho razoável. Então é importante
fazermos o agrupamento dos valores em vários intervalos que em estatística chamamos
de classes. Portanto, a Tabela 5 é chamada de distribuição de frequência para dados
agrupados sem intervalo de classe.
1.3.2.2 Dados agrupados com intervalo de classe
Vamos construir a tabela de frequência absoluta para os dados apresentados na Ta-
bela 3 mas agora levando em conta o agrupamento dos dados em intervalos de classe:
12
Tabela 6 – Distribuição de frequência da estatura dos alunos de uma universidade (com intervalo
de classes)
𝑖 Estatura Frequência (𝑓𝑖)
1 150 ⊢ 154 4
2 154 ⊢ 158 9
3 158 ⊢ 162 11
4 162 ⊢ 166 8
5 166 ⊢ 170 5
6 170 ⊢ 174 3
Essa tabela é denominada distribuição de frequência com intervalos de classe.
Obs. 4. O intervalo 150 ⊢ 154 é equivalente ao intervalo [150, 154), isto é, inclui todos o
números reais que estão entre 150 e 154, exceto o 154.
1.3.2.3 Elementos de uma distribuição de frequência
1.3.2.3.1 Classe (𝑖)
Classes de frequência ou, simplesmente, classes, são intervalos de variação da variável.
As classes são representadas simbolicamente por 𝑖, sendo 𝑖 = 1, 2, 3, . . . , 𝑘 (onde 𝑘 é o
número total de classes de distribuição).
1.3.2.3.2 Limites de Classe (𝑙𝑖 e 𝐿𝑖)
Denominamos limites de classe os extremos de cada classe. O menor número é o limite
inferior da classe (𝑙𝑖) e o maior número, o limite superior da classe (𝐿𝑖).
1.3.2.3.3 Amplitude de um intervalo de Classe (ℎ𝑖)
Amplitude de um intervalo de classe, ou simplesmente intervalo de classe, é a medida
do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e
inferior dessa classe e indicada por ℎ𝑖:
ℎ𝑖 = 𝐿𝑖 − 𝑙𝑖.
1.3.2.3.4 Amplitude total da distribuição (𝐴𝑇 )
Amplitude total da distribuição (𝐴𝑇 ) é a diferença entre o limite superior da última
classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mí-
nimo):
13
𝐴𝑇 = 𝐿(𝑀𝑎𝑥)− 𝑙(𝑀𝑖𝑛).
1.3.2.3.5 Amplitude amostral (𝐴𝐴)
Amplitude amostral (𝐴𝐴) é a diferença entre o valor máximo e o valor mínimo da
amostra:
𝐴𝐴 = 𝑥(𝑀𝑎𝑥)− 𝑥(𝑀𝑖𝑛).
1.3.2.3.6 Ponto médio de uma classe
Ponto médio de uma classe (𝑥𝑖) é, como o próprio nome indica, o ponto que divide o
intervalo de classe em duas partes iguais. Para obtermos o ponto médio de uma classe,
procedemos da seguinte forma:
𝑥𝑖 =
𝑙𝑖 + 𝐿𝑖
2 .
1.3.2.3.7 Procedimento para o agrupamento de dados em intervalos de classe
Para construir uma distribuição de frequência para dados agrupados em intervalos de
classes seguimos o seguinte algoritmo:
1. organize os dados brutos em um Rol;
2. calcule o número de classes através da “Regra de Sturges” dada por
𝑘 ≈ 1 + 3, 3 log10 𝑛,
em que 𝑘 é o número de classes e 𝑛 é o tamanho da amostra;
Obs. 5. Uma das formas alternativa para obtenção do número é dado por 𝑘 =
√
𝑛,
para 𝑛 > 25.
3. obtido número de classes, calcule então a amplitude do intervalo de classe, divi-
dindo a amplitude amostra (𝐴𝐴) pelo número de classes 𝑘:
ℎ ≈ 𝐴𝐴
𝑘
.
14
4. obtida a amplitude do intervalo de classe, construímos cada classe como segue:
1a Classe: 𝑥(𝑀𝑖𝑛) ⊢ 𝑥(𝑀𝑖𝑛) + ℎ
2a Classe: 𝑥(𝑀𝑖𝑛) + ℎ ⊢ 𝑥(𝑀𝑖𝑛) + 2ℎ
3a Classe: 𝑥(𝑀𝑖𝑛) + 2ℎ ⊢ 𝑥(𝑀𝑖𝑛) + 3ℎ
... ...
𝑘-ésima Classe: 𝑥(𝑀𝑖𝑛) + (𝑘 − 1)ℎ ⊢ 𝑥(𝑀𝑖𝑛) + 𝑘ℎ
1.3.2.4 Tipos de frequências
1.3.2.4.1 Frequência simples ou absoluta (𝑓𝑖)
A Frequência simples ou absoluta (𝑓𝑖) são os valores que realmente representam o
número de dados de cada classe. A soma das frequências simples é igual ao número total
(𝑛) de dados observados:
𝑘∑︁
𝑖=1
𝑓𝑖 = 𝑛.
1.3.2.4.2 Frequência relativa (𝑓𝑟𝑖)
Frequência relativa (𝑓𝑟𝑖) são os valores das razões entre as frequências simples de cada
classe e a frequência total da distribuição (o total de observações):
𝑓𝑟𝑖 =
𝑓𝑖
𝑘∑︁
𝑖=1
𝑓𝑖
.
A soma das frequências relativas é igual a 1 (100%).
1.3.2.4.3 Frequência acumulada absoluta (𝐹𝑖)
A Frequência acumulada absoluta (𝐹𝑖) para uma classe 𝑖 é obtida atravésda adição
sucessiva das frequências simples de cada classe anterior a ela e a frequência absoluta
dessa classe:
𝐹𝑖 =
𝑖∑︁
𝑘=1
𝑓𝑘.
15
1.3.2.4.4 Frequência acumulada relativa (𝐹𝑟𝑖)
Frequência acumulada relativa (𝐹𝑟𝑖) é a frequência acumulada da classe, dividida pela
frequência total da distribuição:
𝐹𝑟𝑖 =
𝐹𝑖
𝑛∑︁
𝑖=1
𝑓𝑖
Obs. 6. A frequência acumulada relativa (𝐹𝑟𝑖) pode ser obtida através da adição suces-
siva das frequências relativas de cada classe anterior a ela e a frequência relativa dessa
classe: 𝐹𝑟𝑖 =
∑︀𝑖
𝑘=1 𝑓𝑟𝑖.
Podemos agora calcular as diferentes frequências apresentadas para a Tabela 6:
Tabela 7 – Distribuição de frequência da estatura dos alunos de uma universidade (com intervalo
de classes)
𝑖 Estatura 𝑥𝑖 𝑓𝑖 𝑓𝑟𝑖 𝐹𝑖 𝐹𝑟𝑖
1 150 ⊢ 154 152 4 0,100 4 0,100
2 154 ⊢ 158 156 9 0,225 13 0,325
3 158 ⊢ 162 160 11 0,275 24 0,600
4 162 ⊢ 166 164 8 0,200 32 0,800
5 166 ⊢ 170 168 5 0,125 37 0,925
6 170 ⊢ 174 172 3 0,075 40 1,00
Total 40 1,000
De acordo com o estudo destas frequências podemos responder as questões abaixo:
1. Quantos alunos têm estatura entre 158 cm (inclusive) e 156 cm?
Resposta: 11 – Esses são os valores que formam a terceira classe.
2. Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm?
Resposta: 10% – Esses valores são os que formam a primeira classe (𝑓𝑟1 = 0, 100),
obtemos a resposta multiplicando a frequência relativa por 100 : 0, 100× 100 = 10
3. Quantos alunos têm estatura abaixo de 162?
Resposta: 24 – As estaturas abaixo de 162 são aquelas que formam as classes de
ordem 1, 2 e 3. Assim, o número de alunos é dado por: 𝐹3 =
∑︀3
𝑖=1 𝑓𝑖 = 𝑓1+𝑓2+𝑓3 ⇒
𝐹3 = 24
16
1.3.2.5 Representação gráfica de uma distribuição de frequências
As variáveis quantitativas contínuas diferem um pouco das discretas na sua forma de
representação gráfica. A diferença mais importante é que, as frequências são associadas
a intervalos de valores (classes de frequências) e não a valores individuais da variável em
estudo. Graficamente podemos representar pelo histograma, pelo polígono de frequência
e pelo polígono de frequência acumulada.
1.3.2.5.1 Histograma
O histograma é um gráfico formado por um conjunto de colunas retangulares. No eixo
das abscissas marcamos as classes, cujas amplitudes correspondem às bases dos retângulos.
No eixo das ordenadas marcamos as frequências absolutas, que correspondem às alturas
dos retângulos. Os pontos médios das bases dos retângulos coincidem com os pontos
médios dos intervalos de classes.
Vamos construir o histograma para a Tabela 7.
Figura 2 – Histograma da estatura (cm) dos alunos de uma universidade
1.3.2.5.2 Polígono de frequência
Polígono de frequência é a representação gráfica de uma distribuição por meio de um
polígono. É obtido através da ligação dos pontos médios dos intervalos de classe em um
histograma de frequências.
Vamos construir o polígono de frequência para a Tabela 7.
17
Figura 3 – Polígono de frequência da estatura (cm) dos alunos de uma universidade
1.3.2.5.3 Polígono de frequências acumuladas (Ogiva de Galton)
O polígono de frequência acumulada é traçado marcando-se as frequências acumula-
das sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos
limites superiores dos intervalos de classe.
Com base nos valores de frequência acumulada apresentados na Tabela 7 vamos cons-
truir o polígono de frequência.
Figura 4 – Polígono de frequência acumulada da estatura (cm) dos alunos de uma universidade
18

Outros materiais