Buscar

Conteúdo Online Aula 3

Prévia do material em texto

Probabilidade e Estatística
AULA 3 
	APRESENTAÇÃO E ORGANIZAÇÃO DE DADOS AGRUPADOS EM CLASSES
Objetivo desta Aula
Ao final desta aula, você será capaz de:
Agrupar ou compactar os dados de um problema em intervalos que, em Estatística, são chamados de intervalos de classes.
Calcular o número de intervalos de classes que devemos utilizar em função do tamanho da amostra de dados.
Entender as vantagens e desvantagens de agrupar dados em relação a uma listagem não agrupada ou completa.
Construir uma distribuição de freqüências para dados agrupados em classes.
Elaborar gráficos representativos da uma distribuição de freqüências para dados agrupados e deles extrair uma grande quantidade de informações.
Na segunda aula aprendemos a montar e representar graficamente uma distribuição de freqüências para um conjunto 
de dados discretos. Nesta terceira aula veremos que quando os dados coletados possuem vários valores diferentes, uma melhor distribuição de freqüências poderá ser obtida por meio de agrupamentos desses dados em intervalos de classes, com limites inferior e limites superior.
Para ilustrar a criação de classes de freqüências considere o problema a seguir:
Exemplo
Suponha que tenha sido feita uma coleta de dados relativos às estaturas de quarenta alunos da faculdade A. O resultado da pesquisa foi apresentado na seguinte tabela primitiva
Tabela 1: Tabela Primitiva
Estatura de 40 alunos da faculdade A
Esses são os dados primitivos que estão apresentados sem nenhuma ordenação. O primeiro passo é ordená-los em um Rol para que possamos separá–los posteriormente em  intervalos de classes.
Tabela 2: Rol
Estatura de 40 alunos da faculdade A
Com a tabela ordenada fica fácil visualizarmos, por exemplo, que o menor valor da variável 
estatura é 150 cm, e que, o  maior valor é 173 cm.
Podemos então calcular com facilidade a Amplitude Amostral, denotada por AA, que é 
a diferença entre o maior valor e o menor valor da variável do problema.
AA = x máximo – x mínimo
Assim em nosso problema, definindo a variável x como a estatura dos alunos, a amplitude total da nossa amostra será dada por:
AA = 173 – 150 = 23
Para determinar o Número de Intervalos de Classes (i) que devemos utilizar no problema adotaremos a 
“ Regra de Sturges” que nos dá uma estimativa do número de classes em termos do tamanho da amostra (n).
(*)  log n é o logaritmo na base 10 de n.
Assim, o número de classes que devemos adotar em nosso problema será de:
i = 1 + 3, 3. log 40 = 6, 286797970  6 classes
Atenção
Arredonda-se sempre o valor de i para o número inteiro mais próximo, pois o número de classes deve ser sempre inteiro.
Decidido o número de intervalos de classes, devemos então determinar a Amplitude (h) desses intervalos, que é obtida pelo resultado da divisão entre a amplitude amostral (AA)  e o número de classes (i):
Assim, a amplitude do intervalo de classe do nosso problema é dada por:
Por fim, o nosso problema deve ter seus dados agrupados em 6 classes distintas de intervalos com amplitudes iguais a 4.
Por fim, o nosso problema deve ter seus dados agrupados em 6 classes distintas de intervalos com amplitudes iguais a 4.
Atenção
O arredondamento de h deve ser sempre efetuado para cima usando o mesmo número de casas decimais dos elementos da amostra para que nenhum elemento fique fora da tabela.
Vamos então mostrar como devemos montar as classes para tabular os dados
Devemos construir as classes começando do menor valor que a variável assume na amostra.  A partir daí, devemos ir somando a amplitude de classe de modo que o limite superior de uma classe anterior seja o limite inferior da nova classe.
A convenção adotada para a representação de uma classe é a seguinte:
No nosso exemplo, a classe i = 1 terá como limite inferior  150 cm e limite superior 154 cm;
a classe i = 2 terá como limite inferior 154 cm e superior 158 cm e assim por diante.
Com essa lei de formação a tabela de freqüências para as estaturas pode ser apresentada na seguinte forma:
Tabela 3 – Distribuição de frequências
Estatura de 40 alunos da faculdade A
Observe que a última coluna da tabela representa a freqüência simples das estaturas dos alunos encontrados na respectiva classe. Por exemplo, pela classe i = 2, observamos que existem na amostra 9 alunos com estaturas entre 154 cm (inclusive) e 158 cm (exclusive).
Com objetivo de extrair vários tipos de informações da distribuição de freqüências poderemos acrescentar a nossa tabela outros tipos de frequências . São elas:
Frequências Relativas 	
			
Frequências Relativas Percentuais
			
Frequências Acumuladas Simples
			
Frequências Relativas Acumuladas
			
Frequências Relativas Acumuladas Percentuais
			
É comum acrescentarmos a nossa tabela uma coluna com os pontos médios de cada uma das classes, que é o ponto que divide a classe em duas partes iguais. Ou ainda, o ponto médio da classe i, denotado por x i, é igual a
* O ponto médio de uma classe é o valor que a representa.
Acrescentando a tabela 3 uma coluna com os pontos médios das classes, e, ainda, mais outras colunas com os vários tipos de freqüências que conhecemos, vamos obter por fim a seguinte distribuição de freqüências para o problema:
Tabela 4- Distribuição de freqüências 
Estatura dos alunos da faculdade
Agora que você já tem o conhecimento da distribuição de freqüências tabela do problema responda aos seguintes questionamentos:
Quantos alunos têm estatura entre 162 cm, inclusive, e 166 cm?
Solução: Basta observar f4 = 8 alunos.
Qual a percentagem de alunos cujas estaturas são inferiores a 158 cm
Solução: Basta observar Fr2% = 32, 5% dos alunos.
Quantos alunos possuem estatura abaixo de 162 cm?
Solução: Basta observar F3 = 24 alunos.
Quantos alunos possuem estatura igual ou superior a 158 cm?
Solução: Basta fazer a seguinte conta: F6 – F2 = 27 alunos.
Qual a estatura que representa a classe cinco?
Solução: Basta observar o ponto médio da classe i = 5: x5 = 168 cm.
A amplitude total;
9000
O limite superior da quinta classe;
800
O limite inferior da oitava classe;
1000
O ponto médio da sétima classe;
950
A amplitude do intervalo da segunda classe;
100
A freqüência da quarta classe;
76
A freqüência relativa da sexta classe;
0,155
A freqüência acumulada da quinta classe
262
O número de lotes cuja área não atinge 700 m2;
194
O número de lotes cuja área atinge e ultrapassa 800 m2;
138
A percentagem de lotes cuja área não atinge 600 m2;
29,5%
A percentagem de lotes cuja área seja maior ou igual a 900 m2;
19%
A percentagem de lotes cuja área é de 500 m2, no mínimo, mas inferior a 1000 m2;
78%
A classe do 72º lote;
I = 3
Até que classe está incluída 60% dos lotes;
I = 3
A utilização de gráficos para representar problemas de natureza prática é usual em nossa cultura, se percorrermos os jornais e revistas no nosso dia a dia iremos nos defrontar a cada momento com essas figuras ilustrativas que nos possibilitam uma boa compreensão dos fatos estudados.
No caso da Estatística, as representações gráficas de uma distribuição de freqüências para dados agrupados por classes que aparecem mais frequentemente são:
O Histograma
Apresenta as freqüências das classes em colunas e possui as seguintes características:
As frequências apresentadas podem ser simples ou relativas;
As colunas posuuem bases da mesma largura;
Não existem espaços entre classes.
Para ilustrar, o histograma a seguir representa a distribuição de freqüências da Tabela 3. Estaturas de 40 alunos da faculdade A.
Proposta de Atividade 2
O seguinte histograma foi construído com base numa pesquisa do tempo de serviço dos empregados de uma determinada empresa:
Proposta de Atividade 3
A MKT Image é uma empresa de consultoria em marketing e iniciou um trabalho de pesquisa para a TDI, que pretende lançar um novo produto no mercado brasileiro. Foram aplicadas algumas pesquisas de mercado para verificar o potencial de compra por parte da população. A tabela abaixo mostra osdados sobre uma amostra da população pesquisada, referente à renda familiar mensal (em salário mínimo):

Continue navegando