Buscar

Apostila Estatistica

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

-Estatística.doc
			
				
			 Ciências Contábeis
			Disciplina: Estatística Básica
		Professora Maria Ester Domingues de Oliveira
		
					 2010/1
Apresentação
Seja bem vindo.
Nesta nossa disciplina estaremos tratando de assuntos que auxiliam o estudante a coletar, organizar, descrever, analisar e interpretar dados experimentais.
Entender a verdadeira essência da estatística como uma ferramenta importante em processos como a tomada de decisão, ajudará o aluno a saber utilizá-la de maneira eficaz nos diferentes níveis da organização (estratégico, tático e operacional) para processos em que se necessite conhecer determinado objeto de estudo. Aprendendo a utilizar esta importante ferramenta, o aluno terá maior apoio em seus processos de tomada de decisão, entre outros, e consequentemente chegar a resultados mais eficazes e adequados em momentos de tomada de decisão, por estar-se utilizando informações tratadas e pertinentes sobre a situação em questão.
Porém, esta disciplina exige empenho e dedicação. Seu sucesso dependerá do nível de comprometimento seu com você mesmo. 
É nossa expectativa que você aprenda bastante.
Considerando-se que será você quem administrará seu próprio tempo, nossa sugestão é que você dedique ao menos 2h30min horas por semana para esta disciplina, estudando os textos sugeridos e realizando os exercícios propostos. Uma boa forma de fazer isso é já ir planejando o que estudar, semana a semana.
Você deverá buscar entender bastante bem o conteúdo da leitura fundamental, só que essa compreensão será maior, se você acompanhar, também, a leitura complementar. Você mesmo perceberá isso, ao longo dos estudos.
É uma disciplina fascinante e útil para você que em breve será um gestor.
Os conteúdos estão apresentados de forma didática e por meio de exemplos. Sugere-se, como complemento a utilização de outras bibliografias.
Então, vamos ao trabalho.
Sumário
Parte I
Unidade 1- Introdução
Unidade 2- Coletas de Dados.
Unidade 3- Tipos de variáveis.
Unidade 4- Distribuição de freqüências.
Parte II
Unidade 5- Representação gráfica.
Unidade 6- Medidas de posição.
Unidade 7- Medidas de dispersão.
					PARTE I
 Unidade 1- Introdução
Podemos considerar a estatística como a ciência que se preocupa com a coleta, organização, descrição, análise e interpretação dos dados experimentais.
Ouvimos com frequência falar em estatística da bolsa de valores, estatística da loteria esportiva, estatística do crescimento populacional, etc. 
Normalmente esta parte da estatística diz respeito apenas à parte da descrição e organização dos dados observados. Há ainda todo um campo de atuação da estatística que se refere à análise e interpretação destes dados observados.
Os dois modos de estatística são importantes. Para poder-se analisar e interpretar os dados, é necessário que antes seja feita a organização e descrição destes dados. 
A Estatística se divide em dois modos
Estatística Descritiva
Estatística Indutiva
A parte da coleta, organização, descrição faz parte da Estatística Descritiva, enquanto que a análise e interpretação dos dados experimentais faz parte da Estatística Indutiva, como veremos na ilustração abaixo:
�
A Estatística Descritiva é um ramo da estatística que estará descrevendo e resumindo um conjunto de dados.
O objetivo da Estatística Indutiva é o de tirar conclusões sobre as populações com base nos resultados observados em amostras extraídas dessas populações e que foram sumarizadas na Estatística Descritiva. Um processo de indução nunca é exato. Estamos sempre sujeitos a erro. A Estatística Indutiva nos dirá até que ponto poderemos estar errando em nosso raciocínio, e com que probabilidade. 
Em resumo, a Estatística Descritiva trabalha os dados observados para a Estatística Indutiva que busca obter resultados sobre as populações a partir das amostras, dizendo também qual a precisão desses resultados e com que probabilidade se pode confiar nas conclusões obtidas.
A Ciência Estatística é de muita importância em qualquer ramo do conhecimento, sendo uma ferramenta de muito valor e fundamental importância no processo de tomada de decisão em qualquer setor de atividade. Áreas como ciências contábeis, engenharia, ciências médicas, finanças entre outros, tendem a usar cada vez mais a estatística como ferramenta de trabalho, daí sua grande e crescente importância.
Serão apresentados, a partir de agora, dois conceitos fundamentais para o entendimento da estatística. 
População, ou universo 
amostra. 
População e Amostra
Uma população ou universo, de maneira geral, é um conjunto de elementos, com pelo menos uma característica em comum. Para que um conjunto de elementos seja considerado uma população, esta característica comum deverá definir, sem erros, quais os elementos que pertencem a esta população e quais não pertencem. Os dados que serão observados, na tentativa de se tirar conclusões sobre o fenômeno que nos interessa, serão referentes aos elementos desta população.
As populações podem ser finitas, como o conjunto de clientes de uma determinada empresa, ou infinita, como o número de vezes possíveis em que se pode jogar um dado.
Para certas finalidades, as populações finitas podem ser consideradas infinitas de acordo com seu tamanho. Como exemplo, considere as pessoas do sexo feminino, com mais de 50 anos de idade residentes na cidade de Minas Gerais. O número dessas pessoas é matematicamente finito, mas tão grande que um pesquisador, ao analisar uma amostra de 500 pessoas, pode considerar a população como infinita. 
Assim, por exemplo, estamos interessados em fazer uma pesquisa sobre a idade e o sexo dos estudantes universitários da UNIP. Logo, a população física que queremos estudar é aquela constituída pela totalidade dos estudantes universitários da UNIP. Isso parece ser extremamente simples, mas na verdade ainda não temos exatamente caracterizada a população que nos interessa. Será ela constituída apenas de estudantes atuais. Ou deveremos incluir também aqueles que já foram estudantes desta instituição? Além de tudo, ainda teremos o problema de definir qual a característica comum que distingue perfeitamente cada um dos elementos da população que realmente nos interessa pesquisar.
Quando são coletadas as informações de toda a população, dizemos que foi feito um Recenseamento. Censo é o conjunto de dados obtidos através do recenseamento. 
Muitas vezes, por motivos como tempo, orçamento, recursos disponíveis, dificuldades de coleta de dados entre outros, não é possível colher todos os dados de uma população. Por isso, é muito comum fazer-se pesquisas baseadas em amostras desta população que está sendo estudada. Portanto, quando são recolhidas informações de apenas parte da população, diz-se que foi feita uma amostragem. 
Além deste fato, é importante citar que nem sempre é necessário se examinar toda a população para se chegar às conclusões desejadas. Desde que o tamanho da amostra necessária seja convenientemente determinado, induções suficientemente precisas e confiáveis podem ser realizadas, não havendo necessidade
de se onerar o estudo estatístico pelo exame de uma amostra maior ou de toda a população.
Portanto, podemos estabelecer que uma amostra é o subconjunto de uma população, necessariamente finito .
Exemplo de População: Idades de todos os alunos da Universidade Paulista.
 
Exemplo de Amostra: Idades de 2.500 alunos da Universidade Paulista.
 
É intuitivo que, quanto maior a amostra, mais precisas deverão ser as análises e interpretações realizadas sobre as populações. Levando este raciocínio ao extremo, concluiríamos que os resultados mais perfeitos seriam obtidos pelo exame completo de toda a população. Esta conclusão é válida em teoria, mas na prática muitas vezes não se verifica. De fato, o emprego de amostras pode ser feito de modo tal que se obtenham resultados confiáveis, em termos práticos equivalentes, ou até mesmo melhores do que os que seriam conseguidos através de um senso.
Parâmetros – são valores teóricos correspondentes a população. 
Estatísticas – são funções dos valores amostrais. 
Unidade 2- Coletas de Dados.
Os dados são registros obtidos por meio de observações, medidas, respostas a pesquisas ou contagens em geral.
Classificação dos Dados
Dados Brutos
São aqueles valores a que se chegou pela simples coleta, sem qualquer preocupação quanto à sua ordenação.
Exemplo:
Tabela 1
Consumo Mensal de Energia Elétrica, por 50 Usuários Particulares
KWH(quilowatts-hora)
58 62 80 57 08 126 136 96 144 19
90 86 38 94 82 75 148 114 131 28
66 95 121 158 64 118 73 83 81 74
50 92 60 52 89 58 10 105 90 94 
09 75 72 157 125 76 88 78 84 36
 
Como se pode ser observado, as cifras estão dispostas de forma desordenada. Em razão disso, pouca informação se consegue obter inspecionando os dados anotados. Mesmo uma informação tão simples como a de saber os consumos máximo e mínimo requer um certo exame dos dados da tabela.
Técnicas de amostragem
Como podemos determinar quantas pessoas em uma população apresentam certa característica? Por exemplo, quantas são as consumidoras de um determinado estado que comprariam determinado produto? Ou então, da população de determinado estado, quantas pessoas são idosas, qual a incidência de fumantes que desenvolvem doenças pulmonares, quantas pessoas estão desempregadas no país?
Uma forma de responder a essas questões consiste em fazermos um recenseamento, ou seja, colher dados de todos os elementos da população. Mas este é um processo demorado e caro, como citamos anteriormente.
Outra maneira possível consiste, então, em colher de um subgrupo desta população em estudo, ou seja, elementos de uma amostra, dados necessários à pesquisa. Se a amostra representa de fato toda a população, podemos utilizar as características dos seus elementos para estimar as características de toda população.
Apresentaremos a seguir algumas técnicas de amostragem:
Amostragem Aleatória Simples (AAS): A amostragem aleatória simples é a maneira mais fácil para selecionarmos uma amostra probabilística de um população. Para entendermos melhor, usemos como exemplo um sorteio a ser feito dentro de um Shopping. Os clientes (elementos) deste Shopping preenchem um cupom e colocam na urna. Misturando os cupons nesta urna e sorteando tantos cupons quantos desejarmos na amostra. Importante salientar que todos os elementos têm a mesma probabilidade de ser selecionados. Repete-se o procedimento até que sejam sorteadas todos as unidades estabelecidas da amostra (tamanho da amostra).
Podemos ter uma AAS com reposição, se for permitido que uma unidade possa ser sorteada mais de uma vez, e sem reposição, se a unidade sorteada for removida da população. Do ponto de vista da quantidade de informação contida na amostra, amostragem sem reposição é mais adequada. 
A amostragem sem reposição é mais eficiente que a amostragem com reposição e reduz a variabilidade uma vez que não é possível retirar elementos extremos mais do que uma vez.
Amostragem Estratificada: Se a população pode ser dividida em subgrupos que consistem, todos eles, em indivíduos bastante semelhantes entre si, pode-se obter uma amostra aleatória de pessoas em cada grupo. Esse processo pode gerar amostras bastante precisas, mas só é viável quando a população pode ser dividida em grupos homogêneos.
Amostragem Sistemática: Quando se cria um sistema para a coleta de dados. Os elementos da população se apresentam ordenados e a retirada dos elementos da amostra é feita periodicamente, temos uma amostragem sistemática. Assim, por exemplo, em uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária.
Amostragem a esmo: É a amostragem em que o observador, para simplificar o processo, procura ser aleatório sem, no entanto, realizar propriamente o sorteio usando algum dispositivo aleatório confiável. Por exemplo, se desejarmos retirar uma amostra de 100 grampos de uma caixa contendo 10.000, evidentemente não faremos uma AAS, pois seria muito trabalhosa, por este motivo, retira-se os grampos simplesmente a esmo. Os resultados da amostragem a esmo são, em geral, equivalentes aos da amostragem probabilística se a população é homogênea e se não existe a possibilidade de o observador ser inconscientemente influenciado por alguma característica dos elementos da população.
 
Amostragens intencionais: Enquadram-se aqui os diversos casos em que o observador deliberadamente escolhe certos elementos para pertencer à amostra, por julgar tais elementos bem representativos. O perigo desse tipo de amostragem é grande, pois o Observador pode facilmente se enganar em seu pré-julgamento.
Amostragem por voluntários: Ocorre, por exemplo, no caso da aplicação experimental de uma nova droga em pacientes, quando a ética obriga que haja concordância dos escolhidos. 
Amostragem por conveniência A amostra de conveniência é formada por elementos que estão disponíveis para o pesquisador. Por exemplo, um médico que quer realizar uma pesquisa sobre determinado medicamento, para sua conveniência, realiza a pesquisa com pacientes do hospital em que trabalha.
Unidade 3 - Tipos de variáveis.
Chamamos de Variável uma característica de interesse que é medida em cada elemento da amostra ou população. Como o nome diz, seus valores variam de um elemento para o outro. As variáveis podem ser numéricas ou não numéricas. 
Variáveis podem ser classificadas da seguinte forma: 
Variáveis Quantitativas: quando os dados podem ser distribuídos em categorias mutuamente exclusivas. São as caracterizados por não possuírem valores quantitativos, mas, ao contrário, são definidas por várias categorias. Assim, o sexo, por exemplo, é uma variável qualitativa, pois permite distinguir duas categorias: masculino e feminino. Outro exemplo de variável qualitativa é cor: ou é vermelho ou é preto, etc.
As variáveis quantitativas podem ser nominais ou ordinais: 
Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. 
Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). 
Ex: Qualidade (defeituosa ou não defeituosa) de peças produzidas por uma máquina. Grupo sanguíneo (A, B, AB ou O) dos alunos doadores de sangue da Universidade.
Variáveis Quantitativas: são as variáveis expressas
por números. São variáveis quantitativas: idade, estatura, peso corporal, etc. Podem ser Variáveis quantitativas contínuas ou discretas. 
Variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia. 
Variáveis contínuas, características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade. 
Exemplo: O peso líquido de cada um dos sabonetes produzidos por uma empresa. A altura dos alunos do 1º ano do Ensino Médio. O diâmetro de parafusos produzidos por uma máquina.
 Unidade 4- Distribuição de freqüências.
Distribuição de frequências é uma técnica estatística para apresentar uma coleção de elementos classificados de modo a mostrar o número existente em cada segmento. 
Elementos de uma distribuição de freqüências
a) Freqüência Absoluta: é o número de observações correspondentes a essa classe ou a esse valor. Símbolo fi
b) Amplitude Total: é a diferença entre o maior e o menor valor
observado da variável em estudo. Símbolo At
c) Classe estatística: conjunto de valores numéricos agrupados, caracterizado por um certo intervalo de variação que é definido pelos limites de classe, resultante da subdivisão de uma variável; 
d) Limites de Classe:os limites de classes são seus valores extremos. A segunda classe do exemplo
e) Amplitude de Classe: é a distância entre os limites inferiores (LI) de classes consecutivas
 
Existem dois modos de distribuições de freqüências: Distribuição de Freqüências de dados tabulados não-agrupados e Distribuição de Freqüências de dados agrupados em classes
Quando nos referimos ao tipo de apresentação de Distribuição de Freqüências de dados tabulados não-agrupados utilizamos para representar uma variável discreta (que só assume valores pontuais). 
Critério para definir uma Variável Discreta
Devemos optar por uma variável discreta na representação de uma série de valores quando o número de elementos distintos da série for pequeno.
Suponha que observamos o número de irmãos de 50 alunos da turma U de estatística
 Número de irmãos dos alunos da turma U - disciplina Estatística
Tabela Distribuição de freqüências por ponto ou valores do número de irmãos dos alunos da turma U. Disciplina Estatística
Observamos pouca variedade na quantidade do número de irmãos dos alunos da turma U, por isso fizemos uma distribuição discreta de freqüências.
Agora, observemos a idade, em meses, dos 50 alunos da turma U de estatística. 
 Idade (em meses) dos alunos da turma U - Disciplina Estatística
 �
Observando estes valores notamos grande número de elementos distintos, o que significa que neste caso a variável discreta não é aconselhável na redução dos dados. Utilizaremos, então, a distribuição contínua,como mostraremos a seguir.
Critério para definir uma Variável Contínua
Devemos optar por uma variável contínua na representação de uma série de valores quando o número de elementos distintos da série for grande.
Distribuição de Freqüências por classes ou intervalos. Idades dos alunos da turma U – Disciplina Estatística 
 �
Tabela de distribuição de freqüências
Para construirmos uma tabela de distribuição de freqüências, precisamos entender alguns tópicos importantes:
Neste momento, precisamos recordar de alguns símbolos que aprendemos ao longo de nossa vida escolar:
O símbolo significa:
 
Ou seja, valores que sejam exatamente iguais aos valores mostrados do lado esquerdo do símbolo, entram na contagem da classe. Os valores que estiverem com o mesmo valor do lado direito da do símbolo, não entram naquela classe, e sim na próxima. 
Vamos a um exemplo: no momento de classificar os valores nas classes, utilizando o exemplo da tabela anterior, o valor 230, sempre que aparecer na coleta destes dados será classificado na classe 1. Já o valor 250, sempre que aparecer nesta coleta de dados, será contabilizado na classe 2,onde ele está contido. O número 250 não está contido na classe 1 e sim na classe 2.
Ainda no exemplo de distribuição de freqüências acima, são 7 classes , cada uma com um limite inferior (LI) e um limite superior (LS) da classe.
É importante ressaltar que toda classe possui um limite inferior (LI) e um limite 
superior (LS), como veremos a seguir.
Vejamos um exemplo. Considere a distribuição de freqüências abaixo.
A diferença entre o máximo e o mínimo das entradas de dados é chamada Amplitude Total (At). 
 
 At = xmax – xmin 
Ex: Se a entrada máxima de dados for 29 e a entrada mínima for 1 a amplitude total será
 29 – 1 = 28
 
A Amplitude de Classes pode ser calculada pela seguinte fórmula:
 
Sendo n o tamanho da amostra, ou se preferir, a somatória das frequências
A partir destes tópicos é que começaremos a construir uma tabela de distribuição de freqüências.
Pra entendermos melhor este conceito vamos a um exemplo desde o começo, no momento em que os dados ainda não estão agrupados em uma tabela de freqüências. Temos abaixo, dados dos salários de funcionários de um determinado setor de uma empresa. Foi coletada esta amostra de salários, e o que temos são apenas valores coletados. Chamamos estes dados de dados não agrupados.
�
Utilizando–se do exemplo destes dados não agrupados vamos calcular, antes de mais nada, a Amplitude de Classes (AC).
Como vimos, para calcular a amplitude de classes preciso primeiro calcular a amplitude total (At), conforme pedido na fórmula da amplitude de classes
At = xmax – xmin 
Em seguida, precisamos calcular o número de classes que teremos na tabela. Isso se consegue a partir da raiz quadrada do número de elementos da amostra:
(50 = 7,07
Nº de classes = 7
Portanto,
 Arredondar para o primeiro número inteiro superior.
Caso o resultado da amplitude de classes de um valor não inteiro, seja ele qual for, sempre deve ser arredondado este valor para o primeiro número inteiro superior.
Portanto, sabemos que nossa tabela terá uma amplitude de classe igual a 483.
�
Tipos de freqüências
Trabalharemos com três tipos de freqüência:
Freqüência Simples : Absoluta (fi)
Freqüência Acumulada: Absoluta (Fi)
Relativa (Frel ou Frel%)
�
A tabela acima mostra o número de pessoas matriculadas em cada modalidade de ensino; este número é denominado
freqüência Absoluta (fi)
Em Estatística denomina-se freqüência relativa, o resultado obtido da divisão entre a freqüência que o valor é observado na população e a quantidade de elementos da população.
Geralmente é apresentada na forma de porcentagem
Podemos encontrar a freqüência relativa para cada modalidade apresentada em um trabalho estatístico; 
Para isso basta dividir a freqüência absoluta de cada modalidade pelo total de freqüências (( f) 
�
�
Para encontrarmos a frequência acumulada das classes devemos, antes de mais nada, repetir a frequencia absoluta da primeira classe. Em seguida, começamos a somar a freqüência absoluta de cada uma das classes à frequencia acumulada anterior. Por fim, a última soma deve ser igual à somatória das freqüências absolutas.
�
Exemplo: Continuemos do exemplo anteriormente apresentado: 
Vamos encontrar agora as freqüências relativas de cada classe:
�
Vamos encontrar agora as freqüências acumuladas de cada classe:
Vamos a mais um exemplo. Considere a tabela de dados abaixo:
�
A partir da tabela acima, poderemos encontrar as freqüências relativa e acumulada:
�
Parte II
Unidade 5- Representação gráfica.
É através do histograma que representamos uma distribuição de freqüências.
Este tipo de gráfico é formado por um conjunto de retângulos agrupados, de maneira que cada área de cada um dos retângulos seja correspondente à freqüência da classe a qual ele representa. Desta maneira, a soma dos valores que correspondem às áreas dos retângulos será sempre igual à somatória de todas as freqüências.
Para se construir um histograma, toma-se como referência os eixos
Coordenados das ordenadas e das abcissas . No eixo horizontal, são considerados os valores individuais de cada variável em estudo, ou os limites de cada classe. A base horizontal de cada retângulo corresponde a classe.
No eixo vertical, ou seja, eixo das ordenadas, serão posicionados os valores de escala onde se identificará os valores relativos ao número de observações ou freqüências da classe. A área correspondente a cada um dos retângulos deste gráfico corresponde à freqüência da classe que o retângulo representa. 
�
Também podemos fazer a representação gráfica de dados estatísticos em outros tipos de gráficos, como por exemplo os que mostraremos a seguir. 
Um destes tipos de gráficos é o gráfico de barras, muito parecido com o histograma, porém, possuem características diferentes, como por exemplo, não existe fronteira entre uma barra e outra, e não se trabalha por classes de freqüências, e sim, por variável.
Exemplo: 
�
�
Mais um exemplo de representação gráfica muito útil para a interpretação de dados estatísticos é o Diagrama de Pareto, que permite ao observador, por exemplo, a priorização de problemas.
Exemplo:
Os dados a seguir foram coletados por determinado método de coleta de dados.
�
Em seguida, transformam-se as freqüências em freqüências relativa.
�
�
E em seguida, transforma a tabela em um gráfico:
�
Também podemos citar o gráfico de setores, vulgo gráfico de pizza.
Exemplo:
�
�
�
E por fim:
�
Existem mais tipos de gráficos que representam os dados de um estudo estatístico, mas exemplificaremos apenas estes que foram citados.
Unidade 6- Medidas de Posição 
Dizemos como sendo medidas de posição valores que auxiliam na análise da posição da distribuição de freqüências em relação aos valores observados da variável observada. 
As medidas de posição são divididas em medidas de tendência central, caracterizadas pela tendência dos dados se concentrarem em valores centrais.
Medidas de Tendência Central.
Existem várias medidas de tendência central, porém, trabalharemos nesta apostila com as três medidas mais conhecidas e utilizadas, Média, Mediana e Moda. 
 
Como dito, as três medidas de tendência central mais usadas são :
Média
Mediana
Moda
Média 
A média representa o ponto em que os valores um conjunto de dados ou uma seqüência numérica se concentram.
Podem ocorrer duas situações:
1º caso: Dados não agrupados
São os dados que ainda não foram agrupados em uma distribuição de freqüência, ou seja, os dados estão brutos. Neste caso, utilizamos a média aritmética simples:
(( =
Onde,
 n é o nº de elementos do conjunto
�
Vamos entender como esta mesma fórmula de média poderá ser utilizada em uma situação em que os dados já estão distribuídos em uma tabela de freqüência:
�
2º caso: Dados agrupados sem intervalos (variável discreta)
Utilizamos a média aritmética ponderada:
(( =
Onde,
 n é o nº de elementos do conjunto
�
Exemplo: Dada a amostra, distribuir em uma tabela de frequência: 2, 5, 5, 5, 5, 6, 6, 6, 8, 8
		 xi
		fi
		xifi 
		2
		1
		2 
		5
		4
		20
		6
		3
		18
		8
		2
		16
		Total
		10
		56
Então a média será : 
 
(( =
= 56( 10 = 5,6
3º caso: Dados agrupados com intervalos (variável contínua)
Neste caso, também utilizaremos a fórmula anterior, porém com um detalhe muito importante: como em um intervalo de classe, não se sabe quais são os elementos constantes em cada classe, calculamos o seu ponto médio, “que representará” a classe como sendo o valor de x.
Vejamos um exemplo:
�
�
�
Vamos a outro exemplo para entendermos melhor:
		Classe
		Intervalos
		f
		PM
(X)
		PM . f
(X . f)
		1
		2 |--- 5
		1
		3,5
		3,5
		2
		5 |--- 8
		10
		6,5
		65
		3
		8 |--- 11
		8
		9,5
		76
		4
		11 |--- 14
		1
		12,5
		12,5
		Total
		 
		20
		 
		157
Foi introduzida a coluna do ponto médio da classe (Pm), obtido assim:
Portanto:
(( =
= 157( 20 = 7,85
Interpretação: O valor médio desta série é 7,85, isto é, é o valor em torno do qual os elementos desta série se concentram.
Vamos praticar um pouquinho, resolvendo alguns exercícios:
Exercícios:
1) Calcule a média aritmética das séries abaixo:
a) 1, 2, 8, 10, 12, 16, 21, 30
b) 5, 6, 6, 10, 11, 11, 20
2) Calcule a média para as tabelas abaixo:
		xi
		fi
		2
		1
		3
		4
		4
		3
		5
		2
		Total
		
		xi
		fi
		17
		3
18
		18
		19
		17
		20
		8
		21
		4
		Total
		
3) O salário de 39 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule o salário médio destes funcionários.
		classe
		Salários (R$)
		nº func.
		1
		400 |--- 500
		12
		2
		500 |--- 600
		15
		3
		600 |--- 700
		8
		4
		700 |--- 800
		3
		5
		800 |--- 900
		1
4) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo. Calcule a média:
		classe
		Aluguel (R$)
		nº casa
		1
		0 |--- 200
		30
		2
		200 |--- 400
		52
		3
		400 |--- 600
		28
		4
		600 |--- 800
		7
		5
		800 |--- 1000
		3
		Total
		
		
5) Em uma empresa temos 4 operários com salário de R$850,00, 2 supervisores com salário de R$1.200,00, 1 gerente com salário de R$2.000,00 e 6 vendedores com salário de R$1.100,00. Qual a média salarial dessa empresa?
Respostas dos exercícios anteriores: 
		1) a) 12,5
		b) 9,86
		 
		2) a) 3,6
		b) 8,84
		 
		3) 562,82
		4) 335
		5) R$1.107,69
Moda (Mo)
A moda de um conjunto de dados é o valor que ocorre com maior freqüência. Um conjunto de dados pode ser:
Amodal – Nenhum elemento tem a freqüência maior do que os outros elementos
Modal – apenas um elemento tem a freqüência maior do que os outros elementos
Bimodal – apenas dois elementos tem a freqüência maior do que os outros elementos
Trimodal – apenas três elementos tem a freqüência maior do que os outros elementos
Polimodal – quatro ou mais elementos tem a freqüência maior do que os outros elementos
Vamos a um exemplo:
�
Como tivemos apenas um elemento se “destacando” em relação à freqüência dos demais, estamos em uma situação MODAL
1º Caso: Dados não agrupados:
Exemplo: 3, 7, 7, 9, 10, 10, 10, 13, 15.
 
O elemento que apareceu com maior frequência é o 10, portanto Mo=10 portanto, a série é modal
Ex: 2, 4, 8, 11, 12 e 15
 
Todos os elementos da série apresentam a mesma frequência, logo a série é amodal.
 
Ex: 2, 2, 5, 5, 8, 9
 
Temos Mo=2 e Mo=5 (bimodal)
 
2º Caso: Dados agrupados sem intervalo de classes
Só precisamos identificar o elemento que aparece com maior freqüência.
 
		xi
		fi
		0
		2
		2 
		4
		3
		5
		4
		2
		6
		3
Portanto Mo=3, situação modal
Preste atenção que a moda é o elemento 3, que tem uma freqüência de 5
3º Caso: Dados agrupados com intervalos
Observe a tabela:
		classe
		amostra
		fi
		1
		0 I----- 10
		1
		2
		10 I----- 20
		3
		3
		20 I----- 30
		6
		4
		30 I----- 40
		2
Para encontrar a classe modal de dados agrupados em classes, Identificamos aquela que possui maior freqüência
Neste caso, a classe 3:
		classe
		amostra
		fi
		1
		0 I----- 10
		1
		2
		10 I----- 20
		3
		3
		20 I----- 30
		6
		4
		30 I----- 40
		2
Exercícios:
1) Calcule a moda para as séries abaixo:
a) 2, 2, 3, 4, 5, 5, 5, 7
b) 3, 4, 4, 5, 9, 12, 12
Calcule a moda das distribuições abaixo:
		xi 
		fi
		2
		1
		3
		7
		4
		2
		5
		2
		Total
		 
		xi
		fi 
		17
		3
		18
		18
		19
		17
		20
		8
		21
		4
		Total
		 
3) A distribuição abaixo representa o consumo em Kg de um produto colocado em oferta em um supermercado. Calcule a classe modal: 
		classe
		consumo
		nº de clientes
		1
		0 |--- 1
		12
		2
		1 |--- 2
		15
		3
		2 |--- 3
		21
		4
		3 |--- 4
		32
		5
		4 |--- 5
		20
4) A distribuição abaixo representa o número de acidentes de trabalho por dia em uma indústria Petroquímica, verificados durante um mês. Calcule a classe modal:
		classe
		nº de acidentes
		nº de dias
		1
		0 |--- 2
		20
		2
		2 |--- 4
		6
		3
		4 |--- 6
		3
		4
		6 |--- 8
		1
Respostas:
1) a) 5 b) 4 e 12 
2) a) 3 b) 18 
3) classe 4 
4) classe1 
Mediana (Md)
A mediana divide um conjunto ordenado de dados em duas partes com igual número de elementos, ou seja, 50% de elementos para um lado e 50% dos elementos para o outro lado.
1º caso: Dados não agrupados 
O primeiro passo para obtermos a mediana é colocamos a seqüência numérica em ordem crescente ou decrescente. Depois, verificamos se a amostra é par ou ímpar e adotamos um dos procedimentos a seguir.
Se a amostra é constituída por um número ímpar de elementos, a mediana é o valor que fica no centro dos dados ordenados.
Exemplo (n ímpar): 5, 13, 10, 2, 18, 15, 6, 16 e 9:
Colocar os valores em ordem crescente: 2, 5, 6, 9, 10, 13, 15, 16, 18. 
Se n=9, ou seja, temos nove elementos, sendo a série composta por um número ímpar de elementos, logo, o elemento que se encontra na posição central após colocarmos todos em ordem crescente( ou decrescente) é o número 10. 
 Portanto Md= 10
Outro exemplo:
�
Porém, se a amostra é constituída por um número par de elementos, a mediana é a média aritmética dos dois valores centrais dos dados ordenados.
Exemplo (n par): 7, 2, 6, 12, 10, 18, 13 e 21 
Colocar em ordem crescente:
2, 6, 7, 10, 12, 13, 18 e 21 
O número de elementos do exemplo é n=8, portanto, a mediana está entre o 4º e o 5º elementos, ou seja, 10 e 12. Para encontrarmos a mediana, calculamos a média aritmética dos dois valores centrais, ou seja:
 10 + 12 
 2
Obtemos assim, o valor 11, que é, portanto, a mediana desta série de números
Vejamos alguns exemplos. 
�
2º Caso: Dados agrupados com intervalos (variável contínua)
Dada a tabela:
		Classe
		Amostra
		fi
		Fi
		1
		3 |--- 6
		2
		2
		2
		6 |--- 9
		5
		7
		3
		9 |--- 12
		8
		15
		4
		12 |--- 15
		3
		18
		5
		15 |--- 18
		1
		19
		Total
		 
		19
		 
1º Passo: Antes de mais nada, identificar a posição da mediana. A classe da mediana é aquela que contém o elemento de ordem n/2 (na freqüência acumulada) 
2º Passo: Pela freqüência acumulada (F) identificamos a classe que contém a mediana (classe da Md).
3º Passo: Utiliza-se a fórmula:
�
Onde:
 li= limite inferior da classe da mediana
n = tamanho da amostra
facumant= freqüência acumulada anterior à classe da mediana (ou soma dos valores de fi anteriores à classe da mediana)
h = amplitude da classe da mediana
fmd = freqüência da classe da mediana
No exemplo da tabela anterior:
1º Passo: Com n=19, temos 19/2=9,5 
2º Passo: Identifica-se a classe da mediana pela facum. Neste caso, a classe da mediana é a 3ª, ou seja na classe 9 |--- 12 (9,5 está entre 9 e 12)
3º Passo: Aplica-se a fórmula: 
Md = 9 + 19/2 – 7 . 3
 15
Md = 9 + 0,17 . 3
Md = 9 + 0,51
Md = 9,51
Interpretação:
50% dos valores da série são valores menores ou iguais a 9,51 e 50% dos valores da série são valores maiores ou iguais a 9,51.
Vamos exercitar um pouco este capítulo: 
Exercícios:
1) Calcule a média aritmética das distribuições abaixo:
		notas
		fi
		
		salários
		fi
		
		vendas
		fi 
		2
		5
		
		520
		18
		
		145
		10
		3
		8
		
		780
		31
		
		158
		9
		5
		14
		
		940
		15
		
		163
		8
		8
		10
		
		1.240
		3
		
		175
		4
		10
		7
		
		1.590
		1
		
		187
		2
		Total
		
		
		Total
		
		
 
		Total
		
		tabela a
		
		tabela b
		
		tabela c
2) Calcule a moda para as tabelas acima.
3) Calcule a mediana para as tabelas acima.
4) Calcule a média para as tabelas apresentadas a seguir:
 
		Salários(R$)
		nº funcionários
		
		Estaturas(cm)
		fi
		200 |--- 400
		15
		
		150 |--- 158
		5
		400 |--- 600
		 
		
		158 |--- 166
		12
		600 |--- 800
		8
		
		166 |--- 174
		18
		800 |--- 1.000
		2
		
		174 |--- 182
		27
		1.000 |--- 1.200
		1
		
		182 |--- 190
		8
		total
		 
		
		total
		
		Notas
		nº alunos
		
		pesos (Kg)
		Fi
		0 |--- 2
		5
		
		145 |--- 151
		10
		2 |--- 4
		8
		
		151 |--- 157
		9
		4 |--- 6
		14
		
		157 |--- 163
		8
		6 |--- 8
		10
		
		163 |--- 169
		5
		8 |--- 10
		7
		
		169 |--- 175
		3
		Total
		
		
		Total
		
5) Calcule a mediana para as tabelas acima.
6) Calcule a moda para as tabelas acima. 
Respostas:
		1- a) 5,77
		b) 778,68
		c) 159,09
		
		2 – a) 5
		b) 780
		c) 145
		
		3 – a) 5
		b) 780
		c) 158
		
		4 – a) 500
		b) 172,40
		c) 5,27
		d)156,91
		5 – a) 466,67
		b) 174
		c) 5,29
		d)156
		6 - a) 366,67
		b) 176,57
		c) 5,20
		d)150,45
Unidade 7- Medidas de dispersão.
As medidas de dispersão indicam o quanto os dados variam em torno da região central.
São medidas de dispersão:
Amplitude.
Variância.
Desvio-padrão.
Coeficiente de Variação
Amplitude
A amplitude é a diferença entre o maior e o menor dado observado.
 At = X max – X mín
Exemplo: No conjunto de dados: 2, 5, 6, 9, 10, 10, 12, 15, 18, 20, a amplitude é:
 
 20-2=18.
Variância
A variância de uma variável aleatória é uma medida que indica quão longe em geral os seus valores se encontram em relação a sua média.
A para dados não agrupados é calculada pela fórmula
			S2 = 
�� EMBED Equation.3 
A variância para dados agrupados é calculada pela fórmula
 S2 = 
�� EMBED Equation.3 
Onde,
S2 = variância amostral
_
X = média amostral
X = elemento para variável discreta, ou Ponto Médio para variável contínua
n= tamanho da amostra
f= freqüência do elemento ou da classe
Desvio Padrão
É a raiz quadrada da variância.
				S = 
Onde,
S2 = variância amostral
S = Desvio Padrão amostral
Coeficiente de Variação
É o coeficiente entre o desvio padrão e a média entre o Desvio Padrão e a média.
				CV = 
�� EMBED Equation.3 x 100
�
�
�
�
Exemplo:
		Grupo 1
		Grupo 2
		150
150
151
151
151
152
152
152
153
153
		148
150
155
160
165
170
180
190
195
200
		( x = 1515
		( x = 1713
Vamos aos cálculos de cada grupo, e em seguida comparar seus desvios padrões, suas variâncias e seus coeficientes de variação:
Para o Grupo 1: 
(( = 1515( 10 = 151,5 cm
 
� 
S2 = 1,1664 cm 2
S = 1,08 cm
CV = 
�� EMBED Equation.3 x 100
CV = (1,08 ( 151,5 ) . 100 = 0,71%
Para o Grupo 2: 
(( = 1713( 10 = 171,3 cm
 
� 
S2 = 326,89cm 2
S = 18,98 cm
CV = 
�� EMBED Equation.3 x 100
CV = (18,98 ( 171,3 ) . 100 = 11,08%
Importante: Quanto maior o desvio padrão a variação dos dados em relação à média será maior, ou seja, existe uma maior dispersão dos dados em relação a quando o resultado do desvio padrão é menor. Quanto menor o desvio padrão, menor a dispersão dos dados. 
Portanto, o grupo que possui maior dispersão dos dados é o grupo 2.
�
�
 
(( =
	
(( = 2250 reais
 
 S2 = 
�� EMBED Equation.3 
 
S2 = 969.387,76 reais 2
S = 984,58 reais
CV = 
�� EMBED Equation.3 x 100
CV = (984,58 ( 2250) . 100 = 43,76%
A partir de agora é com você, aluno. Estude os tópicos trabalhados com bastante atenção. Observe cada detalhe apresentado anteriormente, pois são dicas preciosas para a resolução dos problemas. Analise os resultados e tente tirar conclusões a partir dele. 
Compreendendo bem a disciplina, temos certeza de que ela será muito útil na sua vida acadêmica, profissional e até mesmo pessoal.
Lembre-se, a estatística está presente no dia a dia das pessoas, fique atento a como utilizá-la correta e eficazmente.
Até breve!
Referências Bibliográficas
Barrow, Michael - Estatística para economia , contabilidade e administração – Editora Ática, 2007
YE Myers, Walpole Mayers - Probabilidade e Estatística para egenharia e Ciências 8ª Edição Pearson /Prentice Hall, 2008
Sincich, McClave Benson - Estatística para Administração e Economia - 10ª Edição Pearson /Prentice Hall, 2008
Profa. Mirtes Vitória Mariano - Material Estatística Descritiva – 2008
Profa. Maria Ester Domingues de Oliveira - Material Estatística Descritiva – 2008
 interpretação
análise
 resumo
organização
coleta
INDUTIVA
DESCRITIVA
ESTATÍSTICA
TIPOS
OU
ATRIBUTOS
VALORES
QUALITATIVOS
QUANTITATIVOS
DADOS
� EMBED Equation.3 ���
====
S2 =
x
x
n


2
(
)
1
S2 =
x
x
n


2
(
)
1
S2 =
x
x
n
Amplitude de classes é a distância entre os limites inferiores (LI) de classes consecutivas
A amplitude de classes no exemplo citado é 
 Ac = 1000-500
Ac = 500
� EMBED Equation.3 ���


2
(
)
1
Md = li + n/2 – facum ant . h
 f md
 
Md = li + n/2 – facum ant . h
 f md
 
Cada Classe possui um limite inferior (LI) e um limite superior (LS).
Neste caso
Na 1ªclasse o LI é 50 e o LS é 1000
Na 2ªclasse o LI é 1000 e o LS é 1500
E assim por diante
Limite inferior da classe
Limite superior da classe
Sempre arredondar para o primeiro número interiro
�
Na 1ªclasse o LI é 50 e o LS é 1000
Na 2ªclasse o LI é 1000 e o LS é 1500
E assim por diante
At = 3900 – 520
At = 3380
8
9
3
8
f= 50
3901
3418
3418
2935
2935
2452
2452
1969
1969
1486
1486
1003
1003
520
 
==== 
Não está contido
Está contido
� EMBED PBrush ���
Sempre a menor entrada
483
483
483
483
7
5
10
� EMBED Equation.3 ���
�PAGE �
�PAGE �3�
_1198151313.unknown
_1198268861.unknown
_1292685688.unknown
_1292687232/BW�
_1300786031.unknown
_1290602528.unknown
_1198268312.unknown
_1198268619.unknown
_1198268309.unknown
_1198149934.unknown
_1198150111.unknown
_1179214506.unknown
_1179214572.unknown

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais