Buscar

Unidade 2 Estatistica Descritiva

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
Aula 2
Estatística Descritiva
Parte I
Organização dos dados
Dsitribuição de frequências
*
1. Introdução
*
Considere a seguinte situação.
Você desenvolveu um experimento em 20 pés de milho cultivados em casa de vegetação, para testar o efeito de um inseticida orgânico sobre pulgões. 
2. Organização dos dados
*
45, 41, 42, 41, 42, 43, 44, 41 , 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
Após quatro dias de aplicação do inseticida você anotou o número de pulgões mortos em cada planta.
*
Qual a variável em análise?
Relembrando a aula passada ...
Qual a unidade de observação?
Qual a natureza da variável em análise?
Retornando à aula de hoje ...
*
A coleta de dados é o início da análise estatística, pois fornece o material bruto que se quer estudar.
É função do pesquisador transformar os dados brutos em um conjunto organizado de informações.
Ao anotar o número de pulgões mortos em cada pé de milho você realizou uma coleta de dados.
*
Como organizar e apresentar os dados obtidos no seu experimento?
A organização e apresentação dos dados pode ocorrer, basicamente, de duas maneiras: 
 apresentação tabular: é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Estatística. 
 apresentação gráfica: constitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno. 
*
3. Tabela de distribuição de frequências
Um procedimento inicial para organizar e agrupar os dados dispersos referentes a uma variável é através de uma : TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS
*
 Tabela de distribuição de frequências é uma tabela que resume a informação contida na amostra e referente a uma dada variável, ordenando os valores e agrupando-os em classes.
 A tabela de distribuição de frequências pode ser utilizada para organizar dados referentes a variáveis quantitativas ou qualitativas.
*
3.1 Tabela de distribuição de frequências – variável qualitativa 
Para construir uma distribuição de frequências dos dados de uma variável qualitativa basta contar a quantidade de resultados observados em cada categoria.
Como exemplo admita uma pesquisa que tem por objetivo descrever como os produtores de mamona realizam a adubação ou trato nutricional do solo antes do plantio dessa oleaginosa.
 
*
Para tanto, o pesquisador perguntou a 118 produtores:
Que tipo de adubação realiza antes do plantio da mamona?
As opções de resposta foram: ( ) sem adubação
 ( ) adubação química
 ( ) adubação orgânica
*
*
3.2 Tabela de distribuição de frequências – variável quantitativa 
 Tabela de frequências para dados não agrupados em classes com intervalos.
 Tabela de frequências para dados agrupados em classes com intervalos
A Tabela de distribuição de frequências associada a uma variável quantitativa pode ser classificada de duas formas
*
3.2.1 Tabela de distribuição de frequências para dados agrupados SEM intervalos de classes.
É a simples condensação dos dados conforme as repetições de seu valores. 
*
Retornado ao seu experimento com insetida orgânico para combater pulgões em pés de milho, a organização dos 20 dados - referentes à variável número de pulgões mortos - em uma tabela de distribuição de frequências com dados não agrupados em intervalos de classes segue o seguinte procedimento:
*
No exemplo dado anteriormente
45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
1) ROL: É a ordenação dos dados (crescente ou decrescente). 
ROL
Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
*
Valores observados Freqüência	
41	3	
42	2	
43	1	
44	1	
45	1	
46	2	
50	2	
51	1	
52	1	
54	1	
57	1	
58	2	
60	2	
2) Contagem do número de ocorrências ou frequência de cada valor observado
*
Existem situações em que organizar os dados em uma tabela de distribuição de frequências para dados não agrupados em intervalos torna-se inviável, simplesmente porque o banco de dados é composto por um grande número de dados distintos.
Isto é muito comum em variáveis quantitativas contínuas:
 Altura
 Peso
 Temperatura
Assim, para facilitar a análise dos dados, convém organizá-los em um tabela de distribuição de frequências para dados agrupados em classes com intervalos.
*
3.2.2 Tabela de distribuição de frequências para dados agrupados EM intervalos de classes.
 a) Elementos de uma distribuição de frequências com intervalos de classe: 
i) CLASSES
 São os intervalos de variação da variável.
Cada classe é simbolizada por i e o número total de classes simbolizado por k. 
*
Ex: na tabela abaixo k = 5 e 49 |------- 53 é a 3ª classe, onde i = 3 
		Intervalos de Classe
		Frequências
		41 (— 45
		7
		45 (— 49
		3
		49 (— 53
		4
		53 (— 57
		1
		57 (— 61
		5
		Total
		20
*
b) Como definir o número de classes?
i) REGRA DE STURGES para determinação do número de classes:
Essa regra estabelece que o número de classes é igual a:
k = 1 + 3,3 log n
sendo k = número de classes e n = nº total de observações 
Exemplo: 
a) Se o número de observações for 500: 
n = 500 
k = 1 + 3,3 log(500) = 1 + 3,3(2,699) = 9,907 
k = 9,907 ou arredondando k = 10
*
ii) Regra do Quadrado:
K = √n
K = √500 > 20 
Os valores encontrados por meio dos métodos sugeridos não são próximos. Qual a melhor regra?
Na prática, o pesquisador deve utilizar o bom senso. As regras apenas auxiliam na decisão.
 
Regra da Potência de 2
• k = menor valor interiro tal que 2
k
≥ n
– Regra da raiz quadrada
•
– Bom senso !!!
• Decida a quantidade de classes que GARANTA observar 
como os valores se distribuem.
n
*
“ Uma regra de bolso diz que as tabelas de distribuição de freqüências devem ter de 5 a 20 classes, pois abaixo de 5 está se perdendo informação preciosa diluída nas classes e acima de 30 o nível de detalhamento torna-se exagerado e pouco eficaz. Alguns autores sugerem que a distribuição intervalar tenha de 5 até 16 classes .” 
*
c) Limites das classes
 São os extremos de cada classe. O menor número é o limite inferior de classe (l) e o maior número, limite superior de classe(L). 
Ex: em 49 |------- 53... l3= 49 e L3= 53. 
O símbolo |------- representa um intervalo fechado à esquerda e aberto à direita. 
*
O dado 53 do ROL não pertence à classe 3 e sim à classe 4 representada por 53 |------- 57. 
		Classes
		Frequências
		41 (— 45
		7
		45 (— 49
		3
		49 (— 53
		4
		53 (— 57
		1
		57 (— 61
		5
		Total
		20
*
d) Amplitude do intervalo de classe (hi)
É a diferença entre o limite superior e o limite inferior de uma classe
é simbolizada por hi = Li - li. 
Ex: na tabela anterior hi= 53 - 49 = 4. 
Obs: Na distribuição de freqüência c/ classes hi será igual em todas as classes.
*
e) Amplitude total da distribuição
É a diferença entre o limite superior da última classe e o limite inferior da primeira classe. 
AT = L(max) - l(min). 
Ex: na tabela 
AT = 61 - 41= 20.
		Classes
		Frequências
		41 (— 45
		7
		45 (— 49
		3
		49 (— 53
		4
		53 (— 57
		1
		57 (— 61
		5
		Total
		20
*
f) Amplitude total da amostra 
 É a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde AA = Xmax - Xmin. 
Ex: AA = 60 - 41 = 19. 
Obs: AT sempre será maior que AA.
*
g) Ponto médio de classe
É o ponto que divide o intervalo de classe em duas partes iguais. 
Ex: em 49 |------- 53 
o ponto médio x3 = (53+49)/2 = 51, ou seja, 
x3 = (l3+L3)/2.
*
4 Método prático para construção de uma dist. De frequências c/ classe 
1º - Organize os dados brutos em um ROL.
2º - Calcule a amplitude amostral AA.
No nosso exemplo: AA =60 - 41 =19
3º - Calcule o número de classes (k) {k = n1/2}
*
 
4º - Decidido o nº de classes calcule a amplitude do intervalo de classe h > AA/k.
No exemplo: AA/k= 19/5 = 3,8 . 
Obs1: 
Como h > AA/i é um valor ligeiramente superior para haver folga na última classe. Utiliza-se 
h = 4
*
Obs2: Relembrando, qualquer regra para determinação do nº de classes da tabela não nos leva a uma decisão final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado à natureza dos dados.
No exemplo: n = 20 dados, então , em princípio, a regra sugere a adoção de 5 classes.
*
 
5º - Temos então o menor nº da amostra, o nº de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes com freqüência = 0 (zero).
No nosso exemplo: o menor dado da amostra = 41, h = 4 
Logo a primeira classe será representada por 
41 |------- 45. 
As classes seguintes respeitarão o mesmo procedimento.
*
Definidas as classes da tabela as colunas seguintes serão representadas pelas seguintes frequências:
Frequência absoluta
Frequência relativa
Frequencia acumulada absoluta
Frequência acumulada relativa
*
5 Tipos de frequências
Frequência simples ou absoluta (fi): é o número de observações de um valor individual (ou de uma classe).
A soma das freqüências simples é igual ao número total dos dados da distribuição.
*
Frequência relativa (fr): representa a proporção de observações de um valor (ou de uma classe) em relação ao número total de observações.
Fr = fi/∑fi *100
A soma das freqüências relativas é igual a 1 (100 %).
*
Frequência acumulada absoluta (faci): é a soma de todas as frequências absolutas abaixo do limite superior de uma classe considerada.
 
 F4 = f1 + f2 + f3 + f4 = 7 + 3 + 4 + 1 = 15
*
Freqüência acumulada relativa de um classe (Fri):é a freqüência acumulada da classe, dividida pela freqüência total da distribuição.
Fri = Fi/∑Fi *100
*
Concluindo, uma distribuição de frequencias permite diferentes análises. No exemplo do número de pulgões mortos em cada pé de milho:
O total de plantas com o maior número de pulgões mortos;
Quantas plantas estão em determinado intervalo; 
O percentual de plantas contidas em determinado intervalo;
O percentual acumulado de plantas até um determinado número de pulgões mortos.
*
6 Representação gráfica de uma distribuição de frequências
 Histograma
 Polígono de freqüência 
 Ogiva
.
*
Em todos os gráficos citados utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. 
Na linha horizontal (eixo das abscissas) colocamos os valores da variável e na linha vertical (eixo das ordenadas), as freqüências.
*
 
 
Histograma
É formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. 
A área de um histograma é proporcional à soma das freqüências simples ou absolutas.
 
*
*
 
Polígono de freqüência
É um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. 
Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição.
*
*
Ogiva
É o gráfico usado na representação gráfica da distribuição de freqüências acumuladas de uma variável contínua.
 Para a construção da ogiva, são usadas as freqüências acumuladas (absolutas ou relativas) no eixo vertical e os limites superiores de classe no eixo horizontal.
*
*
Resolva exercícios referentes a esta unidade.
*

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes