Buscar

Apostila Estatística Aplicada Estatística Descritiva 2018

Prévia do material em texto

Estatística Aplicada
Apostila de apoio.
A PRESENTE APOSTILA TRATA-SE DE UM RESUMO DOS AUTORES CITADOS, PARA MAIORES ESCLARECIMENTOS CONSULTAR AS FONTES ORIGINAIS. SUA UTILIZAÇÃO TEM COMO OBJETIVO EXCLUSIVAMENTE NA APLICAÇÃO DIDÁTICA.
ii
Sumário
INTRODUÇÃO 	1
Histórico e origem 	2
Grandes áreas da estatística 	3
Método experimental e método estatístico 	3
Fases do método estatístico 	4
Definição do problema 	4
Planejamento 	4
Coleta de dados 	5
1.4.3.1 Coleta direta de dados 	5
1.4.3.2. Coleta indireta de dados 	5
Crítica de dados 	5
Apuração dos dados 	5
Apresentação de dados 	5
Análise dos resultados 	5
Mensuração 	6
Variáveis Estatísticas (X) 	6
Variáveis qualitativas 	6
Variáveis quantitativas 	6
POPULAÇÃO (N), AMOSTRA (n) E AMOSTRAGEM 	7
Amostragem casual ou aleatória simples 	8
Amostragem proporcional estratificada 	9
Amostragem sistemática 	10
ORGANIZAÇÃO DE DADOS 	12
Apuração de dados 	12
Organização da distribuição de frequências 	12
Frequência relativa, frequência acumulada e frequência relativa acumulada 	12
Dados contínuos em classes 	13
Elementos de uma distribuição de frequência 	14
Construção de Tabelas 	18
Séries Estatísticas 	20
Construção de Gráficos 	21
Diagramas 	22
Gráfico em linhas ou em curva 	22
Gráfico em colunas ou em barras 	23
Gráfico em setores ou pizza 	25
Histograma e polígono de frequência 	26
Cartogramas 	27
Pictogramas 	28
MEDIDAS ESTATÍSTICAS 	31
Medidas de tendência central 	31
Média aritmética simples e ponderada 	31
Dados isolados ou não tabelados ou não agrupados. 	31
Dados tabelados ou agrupados. 	32
Moda (Mo) 	32
Dados isolados ou não tabelados ou não agrupados. 	32
Dados tabelados ou agrupados. 	32
Mediana (Md) 	33
Dados isolados ou não tabelados ou não agrupados. 	33
Dados tabelados ou agrupados. 	33
As separatrizes 	34
Quartis 	34
Decis 	34
Percentis 	35
Medidas de variabilidade ou dispersão 	38
Amplitude Total (A) 	38
Desvio Médio 	38
Variância e Desvio Padrão 	38
Coeficiente de Variação (CV) 	41
REFERÊNCIAS BIBLIGRÁFICAS 	43
1
INTRODUÇÃO
Estatística Aplicada
A Estatística é uma ciência que coleta, analisa e interpreta dados numéricos para o estudo de fenômenos naturais, econômicos e sociais. Ela utiliza-se das teorias probabilísticas para explicar frequências da ocorrência de eventos, tanto em estudos observacionais quanto em experimentos a modelar a aleatoriedade e a incerteza de forma a estimar ou possibilitar a previsão de fenômenos futuros.
Algumas práticas estatísticas incluem, por exemplo, planejar e coordenar o levantamento de informações por meio de questionários, entrevistas e medições, além de organizar, analisar e interpretar os dados obtidos. Na maior parte dos casos essas ações visam explicar fenômenos sociais, econômicos ou naturais.
O objetivo da Estatística é a produção da melhor informação possível a partir dos dados disponíveis. Nela exprimem-se por meio de números as observações que se faz de elementos com, no mínimo, uma característica comum.
Com o auxílio da Estatística é possível montar bancos de dados para os mais diversos usos, como por exemplo, o controle de qualidade da produção de uma indústria, recenseamento populacional, pesquisa eleitoral ou lançamento de produtos de mercado de consumo, etc. Na indústria acompanha os testes de qualidade, ajuda a fazer previsão de vendas e desenvolve modelos matemáticos para ajustá-los a situações práticas. Em laboratório, cria tabelas para sistematizar os resultados de experimentos e pesquisas.
Na Estatística exprime-se por meio de números observações que se faz de elementos com, pelo menos, uma característica comum, (exemplo: alunos do sexo masculino de uma comunidade), obtendo os chamados dados referentes a esses elementos.
A coleta, organização e descrição dos dados estão a cargo da Estatística Descritiva, enquanto a análise e a“A estatística é uma ciência que se dedica à coleta, análise e interpretação de dados. Preocupa-se com os métodos de recolha, organização, resumo, apresentação e interpretação dos dados, assim como tirar conclusões sobre as características das fontes donde estes foram retirados, para melhor compreender as situações e poder tomar decisões.”
interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.
Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição dos dados (estatística do Ministério da Educação, estatística dos acidentes de tráfego, etc.), desconhecendo que o aspecto essencial da estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente. Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições de funcionamento, produtividade), a formulação de soluções apropriadas e um planejamento objetivo de ação.
Histórico e origem
As necessidades que exigiam o conhecimento numérico dos recursos disponíveis começaram a surgir quando as sociedades primitivas se organizaram. Os Estados, desde tempos remotos, precisaram conhecer determinadas características da população, efetuar a sua contagem e saber a sua composição ou os seus rendimentos para que os governantes das grades civilizações antigas tivessem conhecimento dos bens que os Estados possuíam e como estavam distribuídos pelos habitantes para, através desses dados, determinarem as leis sobre pagamentos de impostos.
O primeiro dado disponível sobre um levantamento estatístico é de 3050 a. C. Onde Heródoto realizou um estudo das riquezas da população do Egito com a finalidade de averiguar quais os recursos humanos e econômicos disponíveis para a construção das pirâmides. Há também notícia de que no ano 2238 a. C. se realizou um levantamento estatístico com fins industriais e comerciais ordenado pelo imperador chinês Yao. Existem indícios, que constam da Bíblia, relativamente a recenseamentos feitos por Moisés (1490 a.C.). Outra estatística referida pelos investigadores foi feita no ano 1400 a. C., quando Ramsés II mandou realizar um levantamento das terras do Egito. As estatísticas realizadas por Pipino, em 758, e por Carlos Magno, em 762, sobre as terras que eram propriedades da Igreja, são algumas das estatísticas importantes de que há referências desde a queda do império romano. Guilherme, “O Conquistador”, que reinou entre 1066 e 1087, ordenou que se fizesse um levantamento estatístico da Inglaterra sendo que este levantamento deveria incluir informações sobre terras, proprietários, uso da terra, animais... e serviria de base, também, para o cálculo de impostos.
A partir do século XVI começam a surgir os primeiros controles sistemáticos de fatos sociais,
como nascimentos, batizados, casamentos e funerais, dando origem às primeiras tábuas e tabelas. Para responder a esse desenvolvimento social surgiram estas primeiras técnicas estatísticas: classificar, apresentar, interpretar os dados recolhido.
Até ao início do séc. XVII, a Estatística limitou-se ao estudo dos “assuntos de Estado”. Usada pelas autoridades políticas na inventariação ou arrolamento dos recursos disponíveis, a Estatística limitava-se a uma simples técnica de contagem, traduzindo numericamente fatos ou fenômenos observados – fase da Estatística Descritiva. No séc. XVII, com os “aritméticos políticos”, nomeadamente John Graunt (1620-1674) e Sir William Petty (1623-1687), inicia-se em Inglaterra uma nova fase de desenvolvimento da Estatística, virada para a análise dos fenómenos observados – fase da Estatística Analítica.
O desenvolvimento do Cálculo das Probabilidades surge também no século XVII. A ligação das probabilidades com os conhecimentos estatísticos veio dar uma nova dimensão à Estatística, que progressivamente se foi tornando um instrumento científico poderoso e indispensável. Considera-se assim uma nova fase, a terceira, em que se começa a fazerinferência estatística: quando a partir de observações se procurou“A palavra „censo‟ deriva do latim „censere‟ que significa taxar, enquanto que a palavra „estatística‟ deriva do latim „status‟ que significa estado, assim, a Estatística servia como ferramenta administrativa nas mãos do Estado, onde os mesmos colhiam informações geralmente com a finalidade tributária ou bélica.”
deduzir	relações	causais,
entre variáveis, realizando-se previsões a partir daquelas relações, dando origem à Estatística Indutiva.
A palavra Estatística
surge, pela primeira vez, no séc. XVIII. Alguns autores atribuem esta origem ao alemão Gottfried Achemmel (1719-1772), que teria utilizado pela primeira vez o termo statistik, do grego statizein;
outros dizem ter origem na palavra estado, do latim status, pelo aproveitamento que dela tiravam os políticos e o Estado.
A partir do século XVIII são vários os nomes que se destacaram na história da evolução da estatística, tais como o francês Simon Laplace e o alemão Carl Friedrich Gauss (1777-1855), Quételet (1796-1874), Ronald Fisher (1890-1962). No início do século XVIII Simon Laplace e Carl Friedrich Gauss desenvolveram a idéia de “Distribuição Normal de Freqüências”, tornando-se uma teoria muito útil para fazer previsões. A teoria da Distribuição Normal foi usada pelo astrônomo e matemático belga Adolphe Quételet (1796-1874) no estudo estatístico de diversas características das populações humanas como altura, peso, natalidade, mortalidade, renda mensal, etc.Ronald Aylmer Fisher (1890 – 1962), geneticista e estatístico britânico, trabalhou com ajustes de curvas de
freqüência, com coeficientes de correlação, os chamados coeficientes de Fisher, na análise de variância e nas técnicas de estimação de um parâmetro.“A Estatística é uma parte da Matemática que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados, viabilizando a utilização dos mesmos na tomada de decisões..”
Assim, as tabelas tornaram-se mais completas, surgiram às representações gráficas e o cálculo das probabilidades, enquanto que a Estatística deixou de ser uma simples catalogação de dados numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (população) partindo da observação de partes desse todo (amostras).
Na sua origem, a Estatística estava ligada ao Estado. Hoje, não só se mantem esta ligação, como todos os Estados e a sociedade em geral dependem cada vez mais dela. Por isso, em todos os Estados existe um Departamento ou Instituto Nacional de Estatística. Na atualidade, a Estatística já não se limita apenas ao estudo da Demografia e da Economia. O seu campo de aplicação alargou-se à análise de dados em Biologia, Medicina, Física, Psicologia, Indústria, Comércio, Meteorologia, Educação, etc., e ainda a domínios aparentemente desligados, como estrutura de linguagem e estudo de formas literárias.
Grandes áreas da estatística
Para fins de apresentação, é usual se dividir a estatística em três grandes áreas, embora não se trate de ramos isolados:
Estatística Descritiva e Amostragem – Conjunto de técnicas que objetivam coletar, organizar, apresentar, analisar e sintetizar os dados numéricos de uma população, ou amostra;
Estatística Inferencial – Processo de se obter informações sobre uma população a partir de resultados observados na amostra;
Probabilidade - Modelos matemáticos que explicam os fenômenos estudados pela Estatística em condições normais de experimentação.
A estatística descritiva é a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe quão frequente é o uso de médias, índices e gráficos nas notícias.
Método experimental e método estatístico
Pode – se dizer que método é um “conjunto dos meios dispostos convenientemente para alcançar um fim e especialmente para chegar a um conhecimento científico ou comunicá-lo aos outros” (MICHAELIS, 1998).
Dos métodos científicos destacam-se o método experimental e o método estatístico.
Método experimental
O método experimental consiste em manter constante todos os fatores que influenciam em um determinado fenômeno, com exceção de um, fazendo variar este fator de modo que o pesquisador possa descobrir seus efeitos sobre o caso em estudo.
Este método é o preferido no estudo da física, da química e em alguns casos da biologia.
Método estatístico
O método estatístico é utilizado para o estudo de fenômenos onde não é possível manter constante os vários fatores que o afeta.“O método estatístico, diante da impossibilidade de manter as causas (fatores) constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma
delas.”
Este método é o preferido no estudo das ciências sociais.
Fases do método estatístico
Quando se pretende empreender um estudo estatístico completo, existem diversas fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais de um estudo capaz de produzir resultados válidos. As fases principais são as seguintes:
definição do problema;
planejamento;
coleta de dados;
crítica de dados;
apuração de dados;
apresentação de dados;
análise e interpretação de dados.
Definição do problema
A primeira fase do trabalho consiste em uma definição ou formulação correta do problema a ser estudado. Além de considerar detidamente o problema objeto do estudo, o analista deverá examinar outros levantamentos realizados no mesmo campo e que sejam análogos, uma vez que parte da informação de que se necessita pode, muitas vezes, ser encontrada nesses últimos.
Planejamento
O passo seguinte, após a definição do problema, compreende a fase do planejamento, que consiste em se determinar o procedimento necessário para se resolver o problema e, em especial, como levantar informações sobre o assunto, objeto do estudo. É preciso planejar o trabalho a ser realizado tendo em vista o objetivo que se pretende atingir. É nessa fase que será escolhido o tipo de levantamento a ser utilizado. Sob esse aspecto, pode haver dois tipos de levantamento:
Levantamento censitário, quando a contagem for completa, abrangendo todo o universo;
Levantamento por amostragem, quando a contagem for parcial.
Outros elementos importantes que devem ser tratados nesta mesma fase são:
Cronograma das atividades, através do qual são fixados os prazos para as várias fases;
Custos envolvidos;
Exame das informações disponíveis;
Delineamento da amostra, etc.
Coleta de dados
A coleta de dados é a fase inicial de muitos estudos tecnológicos, sociais e econômicos ou biológicos. Constitui-se no processo de escolha da unidade de análise que serão consideradas no estudo – os clientes que serão entrevistados, as plantas que serão monitoradas, as peças que serão medidas, os pacientes que serão acompanhados, etc.
Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno, ou seja, da unidade de análise que se deseja pesquisar, dá-se início à coleta de dados numéricos necessários à sua descrição.
Coleta direta de dados
Trata-se da coleta de dados de elementos informativos de registros obrigatórios como nascimento, casamento e óbitos, importação e exportação de mercadorias, etc., ou ainda quando os dados são obtidos pelo próprio pesquisador através de inquéritos e questionários. Pode ser classificada relativamente ao fator tempo em:
Contínua (registro);
Periódica;
Ocasional.
1.4.3.2. Coleta indireta de dados
Quando é inferida de elementos conhecidos obtidos de coleta direta de dados e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo pode- se citar a pesquisa sobre a mortandade infantil.
Crítica de dados
Obtido os dados, eles devem ser cuidadosamente criticados / observados à procura de possíveis falhas, a fim de não incorrermos a erros grosseiros que possam influenciar os resultados. Essa crítica pode ser externa ou interna.A crítica externa visa observar erros nos dados obtidos devido à erros por parte do informante, seja por distração ou por má interpretação das perguntas. Já a crítica interna visa observar os elementos originais dos dados da coleta.
Apuração dos dados
É a operacionalização algébrica e o processamento dos dados obtidos, bem como a disposição mediante critérios de classificação. Pode ser manual ou eletrônica.
Apresentação de dados
Independente da finalidade da pesquisa os dados devem ser apresentados sob fora adequada através de tabelas ou gráficos torna mais fácil a análise daquilo que está sendo objeto de tratamento estatístico para posterior obtenção de medidas típicas.
Análise dos resultados
O objetivo da Estatística é tirar conclusões sobre o todo (população), a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões.
Mensuração
Tudo parece indicar que uma das grandes preocupações do homem é a medição: medir terras, medir a quantidade de gado, a riqueza, porções de medicamentos, etc. supõe-se na antiguidade que o homem utilizava pedrinhas para avaliar o tamanho de seu rebanho. A preservação das informações pelo processo das pedras devia ser trabalhosa e provavelmente volumosa. A invenção dos números permitiu que o homem deixasse de guardar as informações em um lugar específico para guarda-los na memória.
Medir uma magnitude (grandeza) significa associar a essa magnitude um número real. As magnitudes diferem uma das outras quanto à classe (níveis) que pertencem: estatura, peso, inteligência, maturidade, temperatura, etc.
Cada nível supõe certas características associadas às grandezas nele contida.
1⁰ Nível
É o nível de mensuração mais baixo, mais rudimentar possível. A escala de medida desse
nível chama-se nominal. A base para a atribuição dos números é de natureza qualitativa, distintiva. No 1⁰ Nível não são possíveis operações matemáticas, uma vez que elas prestam-se a codificações e essas comportam, no máximo, contagens.
2⁰ Nível
Este nível corresponde ao que popularmente se designa por ordenação. A escala de medida
chama-se ordinal. As grandezas do 2⁰ Nível podem ser avaliadas em termos de mais ou menos, embora a quantificação precisa seja impossível. As operações matemáticas também não são possíveis nesse nível.
3⁰ Nível
É no 3⁰ Nível que surge, pela primeira vez, uma escala de medida propriamente dita. É a
escala intervalar, caracterizada pela existência de uma unidade de medida e um zero relativo, isto é, convencional. As únicas operações permitidas são a adição e subtração.
4⁰ Nível
Esse nível define a chamada escala de razão, ou racional. Essa escala é muito parecida com a
3⁰ Nível, exceto quanto à origem: o zero é absoluto, isto é, o zero mesmo. Em função disso todas as operações podem ser realizadas.
Variáveis Estatísticas (X)
A variável é o conjunto de resultados possíveis de um fenômeno e pode ser dividida em
qualitativa e quantitativa.
Variáveis qualitativas
São quando seus valores são expressos por atributos.
Variáveis quantitativas
São quando seus valores são expressos em números.
As variáveis quantitativas podem ser contínuas ou discretas/descontínuas.
Variáveis contínuas: pode assumir qualquer valor entre dois limites.
Variável discreta / descontínua: só pode assumir valores pertencentes a um conjunto enumerável.
LISTA 01 - EXERCÍCIOS PARA ENTRAGAR
O	método	experimental	é	mais	utilizado	por	ciências	como
As ciências sociais e humanas, para obter os dados que buscam, lançam mão de que método?
O que é estatística?
Cite e comente as fases do método estatístico.
Qual a diferença entre medida e mensuração?
Cite e comente os níveis de mensuração.
Classifique as variáveis em qualitativas e quantitativas (contínuas ou discretas).
Cor de cabelo
Número de filhos
Número de peças produzidas por hora por uma máquina
Sexo de filhos
Salários
POPULAÇÃO (N), AMOSTRA (n) E AMOSTRAGEM
Ao conjunto finito ou infinito de elementos que compõem pelo menos uma característica	comum“A Estatística Indutiva tem por objetivo tirar conclusões a respeito de uma população baseando-se em resultados verificados nas amostras retiradas dessa população.”
denominamos população estatística ou universo estatístico. Assim, os jogadores de futebol, por exemplo, constituem uma população, pois apresentam pelo menos uma característica comum: são aqueles que jogam futebol.
Entretanto, na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população a qual chamamos de amostra. Assim amostra é qualquer conjunto finito e não vazio de uma população, ou seja, um sub-conjunto da população.
População  é o conjunto de entes portadores de, pelo menos, uma característica comum.
Amostra  é um subconjunto de uma amostra, reduz a população a números menores sem perda das características principais.
É comum também ouvirmos o termo população-alvo. Trata-se da população sobre a qual vamos fazer inferências baseadas na amostra. As populações podem ser finitas, quando se é possível analisar todos os elementos, ou infinitas, quando não é possível analisar todos os elementos. Em alguns casos mesmo populações finitas podem ser consideradas infinitas para efeito de estudo, ex: população da cidade de São Paulo, peixes de um rio.
Entretanto, para que as inferências estejam corretas, é necessário garantir que a amostra possuam as mesmas características básicas da população, no que diz respeito ao fenômeno que será
pesquisado, ou seja, que essa seja representativa. Uma forma de se conseguir essa representatividade é fazer com que o processo de escolha das amostras seja de alguma forma, aleatório. Por essas razões as amostras probabilísticas são preferidas, uma vez que em seus processos de seleção são produzidas amostras onde se define claramente a probabilidade de um dado elemento vira fazer parte da amostra.“Amostragem é a técnica utilizada para recolher amostras, que garantam tanto quanto possível, o acaso na escolha.”
Dessa forma, é necessário que a amostra a ser usada seja obtida por processos adequados. A esse procedimento de escolha das amostras damos o nome de amostragem.
A extração dos elementos das amostras pode ser: com reposição, quando um elemento sorteado puder ser sorteado novamente; sem reposição, quando um elemento amostrado só puder figurar uma única vez na amostra.
As técnicas de amostragem devem garantir que todos os elementos da população tenham a mesma chance de ser escolhido, o que garantirá à amostra o caráter de representatividade e imparcialidade. A amostragem pode ser realizada através de três técnicas principais: a amostragem casual ou aleatória simples, a amostragem estratificada e a amostragem sistemática.
Para garantir a representatividade e a imparcialidade é preciso obedecer a certas regras, conforme quadro abaixo:
Quadro 1. Regras para obter representatividade e imparcialidade na obtenção de uma amostra.
	Queremos
	Fazemos
	
Representatividade
	Análise da população para ver se seus elementos distribuem-se homogeneamente ou se formam grupos com características particulares. Se for esse o caso deve-se respeitar as proporções com que esses grupos integram a população.
	Imparcialidade
	Sorteio mediante a utilização de uma máquina geradora de números aleatórios ou de uma tábua de números aleatórios dos elementos que farão parte da amostra.
Amostragem casual ou aleatória simples
Na prática a amostragem causal ou aleatória simples pode ser realizada numerando-se a população de 1 a N sorteando-se, a seguir, por meio de um dispositivo qualquer números dessa sequência, os quais corresponderão aos elementos da amostra.Um instrumento básico para a seleção de uma amostra probabilística é a Tábua de Números Aleatórios (TNA). Essa tábua consiste em um conjunto de algarismos gerados por um programa de computador de forma a simular um sorteio lotérico, desta forma cada um dos dez algarismos (1, 2, ... 9) aparece na tabela aproximadamente na mesma proporção, ou seja, 1/10 para qualquer combinação de dois algarismos (00, 01, ... 99), 1/100 para qualquer combinação de três algarismos (000, 001, ... 999), e assim por diante.
Tabela 1. Tabela de Números Aleatórios (TNA)
Amostragem proporcional estratificada
Muitas vezes a população se divide em subpopulações - estratos. Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos.
Amostragem sistemática
É uma seleção feita por algum critério preestabelecido. Realiza-se esse tipo de amostragem quando a população já se encontra ordenados, não havendo necessidade de construir um sistema de referência. Como exemplos têm: os prontuários médicos em um hospital, os prédios de uma rua, intervalos de tempo para coleta de peças de uma linha de montagem, etc.
Uma amostra sistemática de tamanho n é constituída dos elementos de ordem K, K + r, K + 2r, ..., em que r é o inteiro mais próximo da fração N / n e K é um inteiro escolhido aleatoriamente entre 1 e r.
EXERCÍCIOS PARA SALA DE AULA
A tabela a seguir refere-se aos diâmetros (mm) de 30 eixos produzidos por uma indústria automobilística (dados hipotéticos).
	Eixo
	01
	02
	03
	04
	05
	06
	07
	08
	09
	10
	11
	12
	13
	14
	15
	Diâmetros
	26
	32
	26
	19
	20
	22
	30
	31
	17
	20
	16
	17
	28
	15
	26
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	
	Eixo
	16
	17
	18
	19
	20
	21
	22
	23
	24
	25
	26
	27
	28
	29
	30
	Diâmetros
	19
	14
	16
	16
	26
	27
	31
	13
	26
	18
	29
	18
	16
	21
	24
Extrair, sem reposição, uma amostra aleatória de tamanho n = 5, partindo da coluna 3 da TNA, seguindo de cima para baixo.
Na execução de uma rede elétrica, uma firma especializada utiliza eletrodutos de dois tipos: E e F. Em uma análise de custo do material, foram consideradas 30 faturas, representadas, a seguir, pelo preço de 10 m de eletroduto.
Eletroduto E.
	Fatura
	01
	02
	03
	04
	05
	06
	Preço (R$)
	710
	710
	715
	715
	755
	760
Eletroduto F.
	Fatura
	01
	02
	03
	04
	05
	06
	07
	08
	09
	10
	11
	12
	Preço (R$)
	750
	750
	750
	750
	755
	760
	760
	765
	765
	765
	765
	765
	
	
	
	
	
	
	
	
	
	
	
	
	
	Fatura
	13
	14
	15
	16
	17
	18
	19
	20
	21
	22
	23
	24
	Preço (R$)
	770
	770
	770
	785
	785
	790
	790
	795
	795
	800
	810
	820
Extrair, sem reposição, uma amostra estratificada proporcional de n = 8.
Uma escola de 1o grau abriga 124 alunos. Obtenha uma amostra representativa correspondente a 15% da população. Sugestão: utilize a TNA a partir da coluna 8, linha 1, de cima para baixo.
LISTA 02 - EXERCÍCIOS PARA ENTREGAR
Uma cidade turística tem 32 hotéis três-estrelas. Pretende-se conhecer o custo médio da diária para apartamento de casal. Os valores populacionais consistem nos seguintes preços diários (Em R$).
	20
	35
	21
	22
	24
	25
	30
	38
	24
	28
	24
	20
	20
	25
	20
	19
	28
	26
	23
	25
	24
	25
	27
	23
	22
	24
	32
	31
	26
	23
	20
	25
Utilizando a coluna 01, linha 03 da TNA, seguindo de cima para baixo, extraia uma amostra aleatória simples do tamanho de n = 10.
Uma empresa tem 3.414 empregados repartidos nos seguintes departamentos:
	Administração
	914
	Transporte
	348
	Produção
	1401
	Outros
	751
Deseja-se extrair uma amostra entre os empregados para verificar o grau de satisfação em relação à qualidade da comida servida no refeitório. Diga como a amostragem deve ser realizada.
Os dados seguintes se referem a tempos gastos (em minutos) por veículos de passeio ao se deslocar sucessivas vezes de uma cidade A para uma cidade B.
	120
	126
	134
	140
	120
	126
	122
	118
	116
	124
	124
	130
	128
	132
	125
	128
	130
	119
	120
	122
	127
	131
	118
	129
	126
	127
	132
	131
	128
	128
	130
	120
Ordenar os dados da esquerda para a direita, e de cima para baixo e:
Extrair, sem reposição, uma amostra aleatória simples de tamanho n = 6. Iniciar a leitura da TNA na linha 26, segunda coluna, percorrendo a mesma de cima para baixo.
Extrair uma amostra sistemática de tamanho n = 5.
Um diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extraescolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra. Explique como você utilizou a TNA.
Uma população encontra-se dividida em três estratos, com tamanhos N1 = 40, N2 = 100 e N3 = 60. Sabendo que, ao se realizada amostragem estratificada proporcional, nove elementos foram retirados do 3o estrato, determine o número total de elementos da amostra.
ORGANIZAÇÃO DE DADOS
A estatística tem a finalidade de analisar conjunto de dados. Mas quando o pesquisador coleta os dados, termina o trabalho com muitas fichas nas mãos, cheias de anotações, ou com páginas e páginas de listagens e registros. São os dados brutos, difíceis de serem entendidos. É preciso organizar esse material para transformar os dados brutos em material pronto para análise. Em outras palavras, é necessário agrupar os dados de maneira que seu manuseio, visualização e compreensão sejam realizados de forma simples e eficiente.
Apuração de dados
As fichas ou listas de registros contem, além dos dados que interessam ao pesquisador, informações que, na maioria das vezes, não são usadas nem para compor o resultado da pesquisa: local, hora da coleta de dados, nome e endereço do entrevistado, etc. O pesquisador precisa então proceder à apuração de dados, isto é, organizar os dados que são de seu interesse para análise.
A apuração de dados ocorre de maneira diferente para dados ordinais e nominais ou quantitativos. Se os dados referem-se a uma variável nominal ou ordinal, a apuração reduz-se a simples contagem, isto é, basta o pesquisador contar quantos elementos caem em cada categoria. Já se os dados se referem a uma variável quantitativa, a apuração exige que seja anotado cada um dos valores observados.
Organização da distribuição de frequências
Temos a frequência simples ou frequência absoluta ou, ainda, simplesmente frequência.
Trata-se do número de observações correspondente a um valor. Esse dado é representado por f. A soma de todas as frequências é representada por:k
 f
i1
Sendo que a somatória da frequência equivale sempre a n.
Para a organização dos dados distribuídos de acordo com suas frequências é necessário primeiramente realizar uma contagem da frequência de cada um dos escores que a variável estudada pode assumir, obtendo assim o número de vezes que cada uma delas aparece. Terminada a contagem deve-se organizar a distribuição de frequências. Em uma coluna escreva os escores da variável em ordem crescente e na frente escreva as frequências.
Frequência relativa, frequência acumulada e frequência relativa acumulada Frequência relativa (fr)
É muito mais fácil entender as informações dadas pela distribuição de frequência do que a
informação dada pelos dados brutos. Existe, porém, um problema: as frequências dependem do tamanho da amostra. Como é que se comparam distribuições de frequências que provêm de amostrasde tamanhos diferentes? A maneira de se fazer isso é comparar frequências relativas. Para calcular a frequência relativa de determinada categoria, deve-se dividir a frequência dessa categoria pelo total de elementos da amostra. Esse resultado multiplicado por 100 dá a frequência relativa em porcentagem ou percentual.
Frequência acumulada (F)
Para se obter a frequência acumulada de determinada classe, você soma a frequência da classe às frequências das classes anteriores.
Frequência relativa acumulada (Fr)
Para se obter a frequência relativa acumulada de determinada classe, você soma a frequência relativa dessa classe às frequências relativas das classes anteriores.
Dados contínuos em classes
Consideremos um exemplo de dados brutos das estaturas de 30 atletas do sexo masculino de uma universidade, em cm.
	168
	172
	170
	181
	169
	173
	164
	175
	182
	177
	176
	173
	170
	186
	183
	170
	168
	166
	169
	180
	175
	164
	181
	179
	172
	169
	174
	171
	178
	166
Esses dados são chamados de dados brutos e esse tipo de tabela é denominada Tabela Primitiva, pois não foram submetidos a nenhum tipo de tratamento. Dessa forma tem pouca utilidade, e tudo que sabemos é que temos 30 observações, não sendo possível averiguar em torno de que valor tende a concentrar as estaturas, qual a maior ou menor, ou ainda quantos alunos se encontram abaixo ou acima de uma dada estatura. Dispomos então os dados em ordem crescente:
	164
	164
	166
	166
	168
	168
	169
	169
	169
	170
	170
	170
	171
	172
	172
	173
	173
	174
	175
	175
	176
	177
	178
	179
	180
	181
	181
	182
	183
	186
Podemos perceber agora que, das 30 observações, o menor valor é 164 e o maior é 186. A diferença entre esses dois valores é de 186 – 164 = 22, que chamaremos de amplitude. Esse tipo de tabela obtida após a ordenação dos dados é chamada de Rol. Esse exemplo reflete um número reduzido de informações, mas, quando o volume de dados é muito grande, o processo de ordenação torna-se trabalhoso, e sua listagem, ainda que ordenada, pouco representará. Nesse caso pode-se simplificar o processo agrupando-se os dados em certo número de classes. Embora não exista uma regra única para a determinação do tamanho e da quantidade de classes, devem-se observar as seguintes indicações:
As classes devem abranger todas as observações;
O extremo superior de uma classe é o extremo inferior da classe subsequente;
Cada valor observado deve-se enquadrar-se em apenas uma classe;
A quantidade de classes, de modo geral, não se deve ser inferior a 5 ou superior a 25.
Uma forma de se determinar um número razoável de classes consiste em aplicar a fórmula de Sturges, que sugere o cálculo do número de classes (k) mediante a expressão:
k 1 3,32 log N
Sendo que N é o número total de observações e o logaritmo é de base 10.
Continuando com o exemplo temos que K = 5,9. Arredondamos para 6 teríamos então 6 classes. Dividindo a amplitude por 6 teríamos 3,66. Assim teríamos classes com os seguintes limites:
De 164 a 167,66 exclusive;
De 167,66 a 171,32 exclusive;
De 171,32 a 174,98 exclusive;
De 174,98 a 178,64 exclusive;
•	De 178,64 a 182,30 exclusive;	•	De 182,3 a 185,96 exclusive.
Como as medidas dos atletas foram tomadas em números inteiros devemos tomar também os limites das classes em números inteiros. Para tanto devemos escolher o número mais próximo a 22 que resulte em inteiros e que seja adequado aos resultados que esperamos. Em nosso exemplo uma boa escolha seria 24, pois 24 / 6 = 4. Como a utilização de tamanho de classe igual a 6 leva a obtenção de uma tabela com amplitude maior que a amplitude observada nos dados, é aconselhável, para garantir uma boa representação de dados, que esse aumento seja dividido entre os extremos da tabela e não se concentre no extremo superior. Dessa forma a primeira classe deve iniciar-se em 163. Assim temos:
De 163 a 167 exclusive;
De 167 a 171 exclusive;
De 171 a 175 exclusive;
De 175 a 179 exclusive;
De 179 a 183 exclusive;
De 183 a 187 exclusive.
Por enquanto temos apenas uma simples listagem, criteriosamente ordenada, é certo, mas ainda uma lista. A partir dela podemos construir os chamados quadros ou tabelas de distribuição de frequências (abaixo) que proporciona melhor visualização e aproveitamento dos dados.
Tabela 2. Atura observada de 30 atletas de uma universidade
	Classe (cm)
	Número de atletas
	163 Ⱶ1 167
	4
	 167 Ⱶ 171	
	8	
	 171 Ⱶ 175	
	6	
	 175 Ⱶ 179	
	5	
	 179 Ⱶ 183	
	4	
	183 Ⱶ 187
	3
	Total
	30
Fonte: Adaptado de Farias, 2008.
Elementos de uma distribuição de frequência
Classe Classes de frequência ou simplesmente classes são intervalos de variação da variável.
São representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k (onde k é o número total de classes de distribuição).
Limites de classes Trata-se do extremo de cada classe.
1
Os intervalos devem ser escritos de acordo com a Resolução 886/66 do IBGE, em termos de desta quantidade até menos aquela, empregando para isso o
símbolo Ⱶ (inclusão de li e exclusão de Li ).
O menor número é o limite inferior da classe ( li ) e o maior número é o limite superior da classe ( Li ).Ou simplesmente intervalo de classe é a medida do intervalo que define a classe
Amplitude de um intervalo de classe 
Ela é obtida pela diferença entre os limites superior e inferior dessa classe é representado por hi. Assim:
hi  Li  li
Amplitude total da distribuição É a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo). Representado por AT.
AT  L(máx)  l(mín)
Amplitude amostral É a diferença entre o valor máximo e o valor mínimo da amostra. Representado por AA.
AA  x(máx)  x(mín)
Ponto médio de uma classe Como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. É representado por xi.
 li  Li
2
i
x
Vamos utilizar o exemplo anterior para identificarmos todas as informações possíveis nos dados agrupados.
li ; L(mín)	Li
Tabela 3. Atura observada de 30 atletas de uma universidade
	
	Classe (cm)
	fi
	xi
	fr
	Fi
	Fr
	Classe 1
	163 Ⱶ 167
	4
	165
	13,3333
	4
	13,3333
	Classe 2
	167 Ⱶ 171
	8
	169
	26,6666
	12
	39,9999
	Classe 3
	171 Ⱶ 175
	6
	173
	20,0000
	18
	59,9999
	Classe 4
	175 Ⱶ 179
	5
	177
	16,6666
	23
	76,6665
	Classe 5
	179 Ⱶ 183
	4
	181
	13,3333
	27
	89,9998
	Classe 6
	183 Ⱶ 187
	3
	185
	10,0000
	30
	~100
	
	Total
	30
	
	~100
	
	
L(máx)
EXERCÍCIOS PARA SALA DE AULA
Um professor pergunta a cada um de seus alunos que ramo de conhecimento prefere estudar: Línguas e Literatura (L&L), Ciências Exatas (CE), Ciências Físicas e Naturais (F&N), Arte e Música (A&M). As respostas foram: (A&M), (L&L), (F&N), (CE), (CE), (L&L), (L&L), (A&M), (F&N), (F&N), (F&N), (L&L), (CE), (F&N), (CE), (A&M), (L&L), (F&N), (A&M), (L&L), (F&N), (A&M). Faça a distribuição de frequências.
Os pesos dos jogadores de um time de futebol variam de 75 a 95 kg. Quais seriam os extremos se quiséssemos agrupá-los em 10 classes?
Os pesos de 40 alunos estão relacionados a seguir:
	69
	57
	72
	54
	93
	68
	72
	58
	64
	62
	65
	76
	60
	49
	74
	59
	66
	83
	70
	45
	60
	81
	71
	67
	63
	64
	53
	73
	81
	50
	67
	68
	53
	75
	65
	58
	80
	60
	63
	53
Construa uma tabela de frequências, sabendo que o log 40 = 1,6.
Apresente a frequência relativa, acumulada e relativa acumulada.
A seguir é dada uma tabela de distribuição de frequências que apresenta pesos, em quilogramas, de recém-nascidos vivos.
Calcule as frequências: relativas, acumulada e relativa acumulada.
Qual a porcentagem de recém-nascidos com menos de 3 kg?
Quantos têm menos de 2 kg?
	Classes
	Frequência
	0,5 Ⱶ 1,0
	11,0 Ⱶ 1,5
	3
	1,5 Ⱶ 2,0
	22
	2,0 Ⱶ 2,5
	115
	2,5 Ⱶ 3,0
	263
	3,0 Ⱶ 3,5
	287
	3,5 Ⱶ 4,0
	99
	4,0 Ⱶ 4,5
	32
LISTA 03 - EXERCÍCIOS PARA ENTREGAR
Uma pesquisa de mercado foi especialmente direcionada a consumidores de determinada marca cerveja. Cada pessoa recebia três unidades da marca concorrente e deveria assinar um valor, numa escala de 1 a 5 (1 significava “não compraria essa marca” e 5 “passarei a comprar apenas essa marca”). As respostas são dadas em seguida. Organize a distribuição de frequências. Respostas das entrevistas: 1; 1; 4; 4;
3; 5; 3; 4; 2; 1; 2; 5; 4; 5; 3; 5; 3; 3; 2; 1; 2; 1; 2; 3; 2; 4; 3; 4; 5; 2; 1; 2; 1; 2; 3; 2; 4; 3; 4; 3; 4; 1.
Reveja a distribuição de frequência que você organizou no exercício 1 e responda:
Quantos consumidores tiveram reação negativa (1 e 2 na escala)?
Quantos ficaram neutros (3 na escala)?
Quantos mudarão de marca (5 na escala)?
São dadas as notas de 40 alunos. Construa uma tabela de distribuição de frequências considerando classes com os seguintes intervalos: 0 Ⱶ 5; 5 Ⱶ 7; 7 Ⱶ 9; 9 Ⱶ 10, 10.
	7
	3
	4
	9
	5
	4
	8
	8
	8
	7
	8
	5
	3
	8
	7
	8
	8
	9
	3
	8
	9
	3
	1
	9
	9
	9
	9
	7
	8
	1
	5
	7
	7
	10
	3
	6
	10
	7
	7
	9
Considere os dados obtidos pelas medidas das alturas de 100 indivíduos (dadas em cm):
	151
	152
	154
	155
	158
	159
	159
	160
	161
	161
	161
	162
	163
	163
	163
	164
	165
	165
	165
	166
	166
	166
	166
	167
	167
	167
	167
	167
	168
	168
	168
	168
	168
	168
	168
	168
	168
	168
	169
	169
	169
	169
	169
	169
	169
	170
	170
	170
	170
	170
	170
	170
	171
	171
	171
	171
	172
	172
	172
	173
	173
	173
	174
	174
	174
	175
	175
	175
	175
	176
	176
	176
	176
	177
	177
	177
	177
	178
	178
	178
	179
	179
	180
	180
	180
	180
	181
	181
	181
	182
	182
	182
	183
	184
	185
	186
	187
	188
	190
	190
Com base nesses dados pede-se:
A amplitude da amostra.
O número de classes.
A amplitude das classes.
Os limites das classes.
As frequências absolutas das classes.
As frequências relativas.
Os pontos médios das classes.
A frequência acumulada.
As notas de 32 estudantes de uma classe estão escritas a seguir:
	6,0
	0,0
	2,0
	6,5
	5,0
	3,5
	4,0
	7,0
	8,0
	7,0
	8,5
	6,0
	4,5
	0,0
	6,5
	6,0
	2,0
	5,0
	5,5
	5,0
	7,0
	1,5
	5,0
	5,0
	4,0
	4,5
	4,0
	1,0
	5,5
	3,5
	2,5
	4,5
Determine:
O rol.
A distribuição de frequências. Sugestão: inicie por 0 com intervalos de classe de 1,5).
A amplitude total.
A porcentagem de alunos que tiveram notas menores que 4,0.
O limite superior das classes.
O ponto médio das classes.
O limite inferior das classes.
A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes:
	Áreas
(m2)
	300
	Ⱶ
	400
	Ⱶ
	500
	Ⱶ
	600
	Ⱶ
	700
	Ⱶ
	800
	Ⱶ
	900
	Ⱶ
	1000
	Ⱶ
	1100
	Ⱶ
	1200
	No de
lotes
	
	14
	
	46
	
	58
	
	76
	
	68
	
	62
	
	48
	
	22
	
	6
	
Com referencia nessa tabela determine:
A amplitude total.
O limite superior da quinta classe.
O limite inferior da oitava classe.
O ponto médio da sétima classe.
A amplitude do intervalo de classe da segunda classe.
A frequência da quarta classe.
A frequência relativa da sexta classe.
A frequência acumulada da quinta classe.
O número de lotes cuja área não atinge 700 m2.
O número de lotes que atingem e ultrapassam 800 m2.
A percentagem de lotes cuja área não atinge 600 m2.
A percentagem de lotes cuja área seja maior ou igual a 900 m2.
A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus.
	No Acidentes
	0
	1
	2
	3
	4
	5
	6
	7
	No Motoristas
	20
	10
	16
	9
	6
	5
	3
	1
Determine:
O número de motoristas que não sofreram nenhum acidente.
O número de motoristas que sofreram pelo menos 04 acidentes.
O número de motoristas que sofreram menos de 03 acidentes.
O número de motoristas que sofreram no mínimo 03 e no máximo 05 acidentes.
A percentagem de motoristas que sofreram no máximo 02 acidentes.
Construção de Tabelas
Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E isso fica mais bem compreendido se os dados são apresentados em gráficos ou tabelas, que irão fornecer informações rápidas e seguras a respeito das variáveis em estudo.
Tabela é um quadro que resume um conjunto de observações
As tabelas são constituídas pelos seguintes elementos: título, corpo, cabeçalho e coluna indicadora.
Título: deve explicar o tipo de dado que a tabela contém. Deve ser colocado no topo da tabela;
Corpo: é formado por um conjunto de linhas e colunas onde são apresentados os dados;
Cabeçalho: parte superior da tabela que especifica o conteúdo das colunas;
Coluna Indicadora: parte da tabela que indica o conteúdo das linhas.
Além do título, corpo, cabeçalho e coluna indicadora, as tabelas ainda podem conter os seguintes elementos: fonte, notas e chamadas. A fonte é a entidade responsável pelo fornecimento dos dados. As notas são informações de natureza geral que servem para esclarecer o conteúdo das tabelas e as chamadas são informações de natureza especifica que servem para explicar ou conceituar determinados dados. As chamadas devem ser indicadas por algarismos arábicos entre parênteses, embora seja comum a utilização de asteriscos. O algarismo arábico que indica a chamada deve ser colocado à esquerda da casa, quando estiver no corpo da tabela e à direita quando estiver na coluna indicadora. Caso haja mais de uma chamada na mesma tabela, os números devem ser dados sucessivamente de cima para baixo e da esquerda para direita.
Tabela 4. População residente no Brasil, segundo o sexo, de acordo com o censo demográfico de 2000.
Título Cabeçalho
CorpoSexo
População Residente
Percentual
 Homens	
85.576.015	
49,2	
Mulheres
86.223.155
50,8
Total
169.799.170
100,0
Linhas
Coluna indicadora
Fonte: IBEGE, 2003 apud Vieira, 2003.
 	 Colunas
numéricas
Abaixo são especificadas algumas normas para a confecção de tabelas:
As tabelas devem ser delimitadas no alto e embaixo, por traços horizontais. Esses traços podem ser mais fortes do que os traços feito no interior da tabela, no entanto, as mesmas não devem ser delimitadas à esquerda e à direita por traços verticais;
O cabeçalho deve ser delimitado por traço horizontal;
Podem ser feitos traços verticais no interior da tabela, separando as colunas;
Nenhuma célula da tabela deve ficar em branco, toda célula deve apresentar um número ou um sinal, conforme convenção:
... O dado é desconhecido, podendo o fenômeno existir ou não;
 O dado não existe;
0; 0,0; 0,00 O dado existe mas seu valor é menor que a metade da unidade de medida adotada na tabela;
X dado omitido.
as tabelas muito longas que precisam ser apresentadas em duas ou mais páginas deve ter o cabeçalho repetido em todas elas, sendo o título escrito apenas na primeira, nas demais, em lugar do título escreve-se “continua” e na última escreve-se “conclusão”.
Séries Estatísticas
Denominamos séries estatísticas toda tabela que apresenta a distribuição de um conjunto de dados estatístico em função da época, local ou espécie.
Existem três tipos básicos de séries estatísticas: geográfica, categóricas ou cronológicas.
Séries geográficas, territoriais, regionais ou de localização.
Essas séries são feitas para apresentar dados de diferentes regiões geográficas. Quando se constrói uma série deste tipo devem-se escrever países segundo o continente; municípios segundo Estados, distritos e vilas segundo municípios, etc.
Tabela 5. Percentual de pessoas com 10 anos e mais que declaram rendimento de até um salário mínimo, segundo as grandes regiões do país.
	Região
	PercentualBrasil	
	25,3	
	 	Norte	
	32,8	
	 	Nordeste	
	48,0	
	 	Sudeste	
	16,0	
	 	Sul	
	18,8	
	 	Centro Oeste	
	22,3	
Fonte: Folha de São Paulo, 2002 apud Vieira, 2003.
Séries específicas ou categóricas
São feitas para apresentar dados que se distribuem em diferentes categorias.
Tabela 6. Rebanhos brasileiros efetivos nos estabelecimentos agropecuários.
	Espécies
	Quantidade
	 Bovinos	
	205.886.244	
	 Bubalinos	
	1.156.870	
	 Aves	
	821.541.630	
	 Suínos	
	35.173.824	
	 Ovinos	
	16.019.170	
	 Caprinos	
	10.401.449	
Fonte: IBEGE apud Crespo, 2009.
Séries cronológicas, históricas, temporais ou marchas
Essas séries são feitas para apresentar dados observados ao longo do tempo. Quando se constrói uma série deste tipo é preciso observar rigorosamente a ordenação de dias, meses, anos, etc.
Tabela 7. Frango – Preço médio em São Paulo – 2003 - 2008.
	Anos
	Preço médio (R$)
	 2003	
	2,56	
	 2004	
	2,64	
	 2005	
	2,67	
	 2006	
	2,53	
	 2007	
	3,20	
	 2008	
	3,64	
Fonte: Associação Paulista de Avicultura apud Crespo, 2009.
Além dessas séries, podemos fazer uma tabela com conjugação de duas ou mais séries.
Nesses casos denominamos séries mistas.
Tabela 8. Terminais telefônicos em serviços 1991-1993.
	Regiões
	1991
	1992
	1993
	Norte
	342.938
	375.658
	402.494
	Nordeste
	1.287.813
	1.379.101
	1.486.649
	Sudeste
	6.234.501
	6.729.467
	7.231.634
	Sul
	1.497.315
	1.608.989
	1.746.232
	Centro-oeste
	713.357
	778.925
	884.822
Fonte: Ministério das Comunicações apud Crespo, 2009.
A conjunção no exemplo dado foi série geográfica – série histórica, que dá origem à série geográfico-histórica ou geográfico-temporal. Podem existir também séries compostas de três ou mais entradas, no entanto, devido à dificuldade de representação esse tipo de série é bem mais rara.
Construção de Gráficos
Gráfico Estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno estudado, já que os gráficos “falam” mais rápido à compreensão do que as séries.
Os dados apresentados em tabelas trazem informações sobre o assunto em estudo, no entanto, as figuras sempre causam maior impacto. Para chamar atenção os estatísticos apresentam dados em gráficos devidamente coloridos e bem editados.
A apresentação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para serem realmente úteis:
Simplicidade: o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros;
Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo;
Veracidade: o gráfico deve expressar a verdade sobre o fenômeno em estudo.
Todo gráfico deve ter título, para que possa ser interpretado sem que haja necessidade de esclarecimentos adicionais.
Os principais tipos de gráficos são os diagramas, cartogramas e os pictogramas.
Diagramas
Os diagramas são gráficos de no máximo duas dimensões, sendo que para sua construção, em geral, fazemos uso do sistema cartesiano.
Gráfico em linhas ou em curva
É a representação gráfica de uma série estatística por meio de uma linha poligonal e constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. É a melhor representação para uma série temporal, onde se deve observar a ordem cronológica das informações. É usada para mostrar a variação entre os valores de uma série.
Nesse sistema fazemos uso de duas retas perpendiculares; as retas são os eixos coordenados e o ponto de intersecção, a origem. O eixo horizontal é denominado eixo das abscissas (ou eixo do x) e o eixo vertical, eixo das ordenadas (ou eixo do y).
Exemplo:
Tabela 9. Produção brasileira de óleo de dendê 1987 – 92.
	Anos
	Quantidade (1000 t)
	1987
	39,3
	1988
	39,1
	1989
	53,9
	1990
	65,1
	1991
	69,1
	1992
	59,5
Fonte: Agropalma apud Crespo, 2009.
Tomando os anos como abscissas e as quantidades como ordenadas, temos um dado ano como X e sua respectiva quantidade como dado Y, assim temos um par ordenado (X;Y) que pode ser representado num sistema cartesiano. Determinamos, graficamente, todos os pontos da série, usando as coordenadas, ligamos esses pontos, dois a dois, por segmentos de retas, o que irá nos dar uma poligonal, que é um gráfico em linha ou curvas correspondente à série anterior.
Figura 1. Modelo de gráfico em linhas ou curvas
Fonte: Adaptado de Agropalma apud Crespo, 2009.
Outros modelos de Gráficos de linhas ou em curvas podem ser observados a seguir:
Figura 2. Modelos de gráficos em linhas ou curvas
	linha única
marcada por pontos
	várias linhas
marcadas por pontos
	linha única
contínua
	várias linhas
contínuas
	
	
	
	
Fonte: http://alfaconnection.net/graficos/linha.htm
Figura 3. Modelo de gráfico em linhas ou curvas
Fonte: Dados hipotéticos
Figura 4. Modelo de gráfico em linhas ou curvas
Fonte: Dados hipotéticos
O gráfico em linhas é um dos mais importantes, representam observações feitas ao longo do tempo, em intervalos iguais ou não. Geralmente utilizados para conjunto de dados de séries históricas ou temporais.
Gráfico em colunas ou em barras
Trata-se da representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma
altura e os comprimentos são proporcionais aos respectivos dados. Dessa forma, asseguramos a proporcionalidade entre as áreas dos retângulos e os dados estatísticos.
Exemplo:
Tabela 10. Produção brasileira de carvão mineral bruto 1989 – 92.
	Anos
	Quantidade (1000 t)
	1989
	18.196
	1990
	11.168
	1991
	10.468
	1992
	9.241
Fonte: Ministério da Agricultura apud Crespo, 2009.
Figura 5. Modelo de gráfico em colunas
Fonte: Adaptado de Ministério da Agricultura apud Crespo, 2009.
Exemplo:
Tabela 11. Exportação brasileira Março - 1995.
	Estados
	Valor (US$ Milhões)
	São Paulo
	1.344
	Minas Gerais
	542
	Rio Grande do Sul
	332
	Espírito Santo
	285
	Paraná
	250
	Santa Caratina
	202
Fonte: SECEX apud Crespo, 2009.
Figura 6. Modelo de gráfico em barras
Fonte: Adaptado de SECEX apud Crespo, 2009.
Os gráficos em colunas ou em barras podem ainda ser múltiplos. É geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação.
Exemplo:
Tabela 12. Balança comercial do Brasil 1989 - 1993.
	Especificações 	
	
	Valor (US$ 1.000.000)	
	
	1989
	1990
	1991
	1992
	1993
	Exportação
	34.383
	31.414
	31.620
	35.793
	38.783
	Importação
	18.263
	20.661
	21.041
	20.554
	25.711
Fonte: Ministério da Fazenda apud Crespo, 2009.
Figura 7. Modelo de gráfico em colunas múltiplas
Fonte: Adaptado de Ministério da Fazenda apud Crespo, 2009.
Gráfico em setores ou pizza
É a representação gráfica de uma série estatística por meio de superfícies setoriais. É usado para comparar os valores de uma série com a soma total. O gráfico é construído com base em um círculo dividido em partes, onde cada ângulo central é proporcional à frequência de cada variável. Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde à 360º.
Exemplo:
Tabela 13. Rebanho suíno do sudeste do Brasil - 1992.
	Estado
	Quantidade (mil cabeças)
	 Minas Gerais	
	3.363,7	
	 Espírito Santo	
	430,4	
	 Rio de Janeiro	
	308,5	
	São Paulo
	2.035,9
	Total
	6.138,5
Fonte: IBGE apud Crespo, 2009.
Temos:
	6.138,93.363,7
360o			X1 = 197,2		X1 = 197o X1
	
	X2 = 25,2
	
	X2 = 25o
	
	X3 = 18,0
	
	X3 = 18o
	
	X4 = 119,3
	
	X4 = 120o
Com esses dados marcamos num círculo de raio arbitrário, com um transferidor, os arcos correspondentes, obtendo o gráfico.
Figura 8. Modelo de gráfico em setores ou pizza
Fonte: Adaptado de IBGE apud Crespo, 2009.
Histograma e polígono de frequência
Quando o conjunto de dados é contínuo devemos organizá-los em tabelas de distribuição de frequência conforme visto anteriormente e podemos também representa-los graficamente através de histogramas e polígonos de frequência. O histograma é um conjunto de retângulos com a base sobre um eixo dividido de acordo com o tamanho da classe, centro nos pontos médios das classes e área proporcional às frequências. Já o polígono de frequência é um gráfico que se obtém unindo-se por uma poligonal os pontos correspondentes às frequências das diversas classes, centradas nos respectivos pontos médios. Os histogramas e os polígonos de frequência são gráficos alternativos que contem as mesmas informações.
Exemplo:
Tabela 14. População residente no Brasil por grupos de idade – censo demográfico 2010.
	Grupos de idade
	Valor central
	Frequencia
	0 - 9
	5
	15,08
	10 - 19
	15
	17,91
	20 - 29
	25
	18,01
	30 - 39
	35
	15,53
	40 - 49
	45
	13,02
	50 - 59
	55
	9,65
	60 - 69
	65
	5,95
	70 - 79
	75
	3,31
	80 - 89
	85
	1,3
	90 - 99
	95
	0,22
	100 anos e mais
	
	0,01
Fonte: IBGE, 2011 apud Vieira, 2012.
Figura 9. Modelo de histograma
Fonte: Adaptado de Vieira, 2012.
Figura 10. Modelo de polígono de frequência.
Fonte: Adaptado de Vieira, 2012.
Figura 11. Modelo de histograma e polígono de frequência.
Fonte: Adaptado de Vieira, 2012.
Cartogramas
É a representação de uma carta geográfica. Esse tipo de gráfico é empregado quando o objetivo é o de figurar dados estatísticos relacionados com áreas geográficas ou políticas.
Figura	12.	Modelo	de cartograma			1
Figura	13.	Modelo	de cartograma			2
	
Pictogramas
O pictograma constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras.
Figura	14.	Modelo	de pictograma			1
Figura	15.	Modelo	de pictograma			2
	
LISTA 04 – EXERCÍCIOS PARA ENTREGAR
Classifique as séries abaixo
a)
Produção de borracha natural 1991-93
	Ano
	Toneladas
	 	1991	
	29.543	
	 	1992	
	30.712	
	 	1993	
	40.663	
Fonte: IBGE apud Crespo, 2009.
b)	c)
Avicultura brasileira 1992	Vacinação contra PoliomeliteEspécies
Número
(1.000 cabeças)
 Galinhas	
204.160	
Galos, frangos, frangas e
 pintos	
435.465
 Codornas	
2.488	
Regiões
Quantidade
 Norte	
211.209	
 Nordeste	
631.040	
 Sudeste	
1.119.708	
 Sul	
418.785	
 Centro – Oeste	
185.823	
Fonte: IBGE apud Crespo, 2009.	Fonte: Ministério da Saúde apud Crespo, 2009.
d)	e)
Aquecimento do motor de avião X	Produção brasileira de aço brutoMinutos
Temperatura oC
 	0	
20	
 	1	
27	
 	2	
34	
 	3	
41	
 	4	
49	
 	5	
56	
 	6	
63	
Processos
Quantidade
1991
1992
1993
 Oxigênio básico	
17.934	
18.8545	
19.875	
 Forno elétrico	
4.274	
4.675	
5.098	
 EOF	
409	
448	
444	
Fonte: instituto brasileiro de siderurgia apud Crespo, 2009.
Fonte: Crespo, 2009.
Verificou-se, em 1993, o seguinte movimento de importação de mercadorias: 14.839.804 t oriundas da Arábia Saudita, no valor de US$ 1.469.104.000,00; 10.547.889 t dos Estados Unidos, no valor de US$ 6.034.946.000,00; e 561.024 t do Japão no valor de US$ 1.518.834.000,00. Confeccione uma série correspondente a esses dados e classifique-a.
Construa uma tabela para representar a altura e o peso de oito meninos com idades de 3, 4, 5, 6, 7, 8, 9 e 10 anos. As alturas em cm e o peso em quilogramas são dados a seguir:
Alturas: 94; 100; 107; 113; 118; 124; 129; 133.
Pesos: 14,4; 16,0; 18,0; 19,9; 21,6; 24,1; 26,5; 29,0.
Segundo a Pesquisa Nacional por Amostra de Domicílio 2009 (PNAD, 2009 apud Vieira 2012) feita pelo Instituto Brasileiro de Geografia e Estatística (IBGE), o número médio de filhos por mulher em 2009 era de 1,94, mas havia importantes desigualdades, sobretudo em função de escolaridade. No país como um todo, as mulheres com até 7 anos de estudo tinham, em média, 3,19 filhos, quase o dobro de número de filhos (1,68) daquelas com 8 anos ou mais de estudo. Construa uma tabela para representar esses dados.
O peso ao nascer depende da idade gestacional. Foram obtidos os pesos médios de crianças nascidas nas seguintes faixas de idades gestacionais: de 22 até 27 semanas; de 28 até 31 semanas; de 32 até 37 semanas, de 38 até 41 semanas e mais de 41 semanas. Os pesos médios, em gramas, eram respectivamente: 750; 1.350; 2.425; 3.205; 3.385. Construa uma tabela com esses dados.
24 milhões de pessoas, ou seja, 14,5% da população residente no Brasil em 2000 declararam, no Censo Demográfico de 2000, ter algum tipo de incapacidade ou deficiência (mental ou dificuldade de enxergar, ouvir, locomover-se ou outro tipo de deficiência física). No total de casos declarados de portadores de deficiência investigadas, 8,3% tinham deficiência mental, 48,1% deficiência visual, 16,7% deficiência auditiva, 22,9% deficiência motora e 4,1% outro tipo de deficiência física. Apresente os dados numa tabela.
Monte uma série cronológica para representar os valores das exportações de açúcar, fornecidas pelo Instituto do Açúcar e do Álcool, nos anos de 1965 a 1971 em milhões de dólares: 60.193; 80.114; 812.826; 106.879; 112.064; 126.740; 149.548.
Idealize uma série geográfica para representar o seguinte fato: população da região Norte do Brasil em 1970, sabendo-se que em Rondônia, Acre, Amazonas, Roraima, Pará a Amapá, temos respectivamente: 116.620; 218.006; 960.934; 41.638; 2.197.072 e 116.480 habitantes, segundo dados do IBGE.
Fazer uma tabela estatística para representar o movimento religioso de certo município no período de 1975 – 1977,que apresentou os seguintes dados: em 1975 houve 56.738 habitantes batizados (dos quais 26.914 do sexo feminino), 15.884 casamentos e 13.678 extremas-unções. Em 1976, houve 33.915 batizados do sexo masculino e 29.568 do sexo feminino, 17.032 casamentos e
14.328 extremas-unções. Em 1977, em um total de 71.232 batizados, 34.127 foram do sexo masculino, as extremas-unções foram de 16.107 e os casamentos 16.774.
A Tabela a seguir dá a distribuição de erros cometidos por 150 estudantes em uma prova de estatístico. Construa um histograma.
	No de erros
	Frequência
	 10 Ⱶ 15	
	5	
	 15 Ⱶ 20	
	57	
	 20 Ⱶ 25	
	42	
	 25 Ⱶ 30	
	28	
	 30 Ⱶ 35	
	17	
	 35 Ⱶ 40	
	1	
	 Total	
	150	
MEDIDAS ESTATÍSTICAS
Até agora foi visto a sintetização dos dados sob forma de tabelas, gráficos e distribuições de frequência que, permite descrever, de modo geral, os grupos de valores que uma variável pode assumir. Dessa forma pode-se localizar a maior concentração de valores de uma dada distribuição, isto é, se ela se localiza no início, meio ou final, ou ainda se há uma distribuição por igual. No entanto, através somente dessas informações, pode ser difícil interpretar o que eles significam. É importante, portanto, realizar cálculos que permitam representar um conjunto de dados relativos a determinado fenômeno de forma resumida. São as medidas estatísticas divididas em medidas de posição (também conhecidas como medidas de locação ou medidas de tendência central) e as medidas de dispersão (ou medidas de variabilidade).
As medidas de posição mostram o valor representativo em torno do qual os dados tendem a agrupar-se, com maior ou menor frequência. As medidas de dispersão mostram o grau de afastamentos dos valores em relação aquele valor representativo central. As medidas de posição mais importantes são as medidas de tendência central queenglobam: média aritmética (simples e ponderada), mediana e moda. Outras medidas de posição menos utilizadas são as separatrizes que englobam: mediana, quartis, decis e percentis.
Medidas de tendência central
Média aritmética simples e ponderada
É o quociente da divisão da soma dos valores da variável pelo número deles. A média (aritmética) é, de modo geral, a mais importante de todas as medidas descritivas. Quando alguém fala sobre um conjunto de dados, tanto pode estar se referindo a uma amostra como a uma
_
população. Utilizamos o símbolo μ(lê mi) para a média de uma população e o símbolo X (lê x
traço) para representar a média de uma amostra. A média da população também é obtida dividindo a soma dos dados pelo número de elementos da população. Não calculamos μ porque, em geral, temos apenas uma amostra da população. Mas a média da amostra é uma estimativa da média da população. Às vezes, a média pode ser um número diferente de todos os da série de dados que ela representa, por isso costumamos dizer que a média aritmética não tem existência concreta.
Há dois casos a serem considerados no cálculo da média: dados isolados e dados agrupados.
Dados isolados ou não tabelados ou não agrupados.
Quando desejamos obter a média de dados não agrupados determinamos a média aritmética simples.
Xi
n
_
X 
Trata-se da somatória dos valores da variável dividido pelo número de valores que aparecem
Dados tabelados ou agrupados.
Sem intervalos de classe
Xi * f
n
_
X 
Trata-se da somatória dos valores da variável dividido pelo número de valores que aparecem
Com intervalos de classeNesse caso convenciona-se que todos os valores incluídos em um determinado intervalo de classe coincidem com seu ponto médio. Trata-se, portanto, da somatória dos valores médios das classes de variáveis dividido pelo número de valores que aparecem.
xi * fi
n
_
X 
Moda (Mo)
A moda é o valor que aparece com maior frequência em um conjunto de dados.
Dados isolados ou não tabelados ou não agrupados.
Quando lidamos com valores não agrupados, a moda é facilmente reconhecida, basta, de acordo com a definição, procurar o valor que mais aparece.
Dados tabelados ou agrupados.
Sem intervalos de classe
Uma vez agrupados os dados é possível determinar imediatamente a moda, basta fixar o valor da variável de maior frequência.
Com intervalos de classe
A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, nesse caso é o valor dominante que está compreendido entre os valores da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal, cujo qual denominamos moda bruta.
l *  L*
Mo 
2
Mediana (Md)
A Mediana é o valor que ocupa a posição central de um conjunto de dados ordenados, ou seja, encontra-se no centro de uma série de números, estando esses dispostos segundo uma ordem. Portanto, apresenta antes e depois de si o mesmo número de termos.
Dados isolados ou não tabelados ou não agrupados.
Se n é ímpar, a mediana é um valor único; se n é par, a mediana é a média aritmética simples dos dois valores centrais. Isso para variáveis discretas.Valor próprio
 Ímpar
 n  1 2
Md
T
1o termo
2o termo
Par
 n  2
2
Md 2
T
 n
2
Md 1
T
Tmd
Dados tabelados ou agrupados.
Md  valorT1  valorT2 
2
Valor teórico
O termo mediano (Tmd) não é o valor da mediana!!!
Sem intervalos de classe
Semelhante ao anterior, no entanto, antes devemos encontrar a classe mediana.
Ímpar
 n  1 2
Md
T
Valor próprio
1o termo
2o termo
Par
 n  2
2
Md 2
T
 n
2
Md 1
T
Md  valorT1  valorT2 
2
Valor teórico
Com intervalos de classe
* h *
f *
ant. 
 2
Md  l* 
f i
 F
33
As separatrizes
Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No entanto, ela apresenta outra característica, tão importante quanto à primeira: ela separa a série em dois grupos que apresentam o mesmo número de valores. Assim, além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica, já que se baseiam em sua posição na série. Essas medidas - os quartis, os decis e os percentis - são, juntamente com a mediana, conhecidas pelo nome genérico de medidas separatrizes.
Quartis
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Há, portanto, três quartis:
O primeiro quartil (Q1)
Valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores.
O segundo quartil (Q2)
Evidentemente, coincide com a mediana (Q2 = Md ).
O terceiro quartil (Q3)
Valor situado de tal modo na série que as três quartas partes (75%) dos dados são menores que ele e uma quarta parte (25%) é maior.
Quando os dados estão agrupados, para determinar os quartis usamos as fórmulas abaixo:
kf *

4
 kfi*
 F ant  * h
Q  l *  
Sendo k, o número de ordem do quartil.
Decis
Denominamos decis os valores de uma série que a dividem em dez partes iguais. Há, portanto, dez decis:
O primeiro decil (D1)
Valor situado de tal modo na série que 10% dos dados é menor que ele e 90% são maiores.
O segundo decil (D2)
Valor situado de tal modo na série que 20% dos dados é menor que ele e 80% são maiores.
O terceiro decil (D3)
Valor situado de tal modo na série que 30% dos dados é menor que ele e 70% são maiores.
O quarto decil (D4)
Valor situado de tal modo na série que 40% dos dados é menor que ele e 60% são maiores.
35
O quinto decil (D5)
Valor situado de tal modo na série que 50% dos dados é menor que ele e 50% são maiores.
Evidentemente, coincide com a mediana (D5 = Q2 = Md ).
O sexto decil (D6)
Valor situado de tal modo na série que 60% dos dados é menor que ele e 40% são maiores.
O sétimo decil (D7)
Valor situado de tal modo na série que 70% dos dados é menor que ele e 30% são maiores.
O oitavo decil (D8)
Valor situado de tal modo na série que 80% dos dados é menor que ele e 20% são maiores.
O nono decil (D9)
Valor situado de tal modo na série que 90% dos dados é menor que ele e 10% são maiores.
O décimo decil (D10)
Valor situado de tal modo na série que 100% dos dados é menor que ele e 0% são maiores (ou seja, nenhum é maior).
Os decis são dados pela fórmula abaixo:
kf *

 kfi*
 F ant  * h
D  l *   10
Percentis
Denominamos percentis os noventa e nove valores que separam uma série em 100 partes
iguais.
Os percentis são dados pela fórmula abaixo:
kf *

100
 kfi*
 F ant  * h
*
P  l 
EXERCÍCIOS PARA SALA DE AULA
Considerando o conjunto de dados abaixo: a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6.
b) 20, 9, 7, 2, 12, 7, 20, 15, 7.
c) 15, 18, 20, 13, 10, 16, 14.
Calcule:
A média aritmética;
A mediana;
A moda.
Considerando a distribuição abaixo:
	Xi
	3
	4
	5
	6
	7
	8
	fi
	4
	8
	11
	10
	8
	3
Calcule:
A média;
A mediana;
A moda.
Considerando a distribuição abaixo:
	Notas
	fi
	0 Ⱶ 2
	5
	2 Ⱶ 4
	8
	4 Ⱶ 6
	14
	6 Ⱶ 8
	10
	8 Ⱶ 10
	7
Calcule:
A média;
A mediana;
A moda;
O primeiro e terceiro quartis;
O segundo e o sétimo decil;
Octogésimo primeiro percentil.
LISTA 05 – EXERCÍCIOS PARA ENTREGAR
A média mínima para aprovação em determinada disciplina é 5,0. Se um aluno obtém as notas: 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0 na disciplina, pergunta-se se ele foi aprovado ou não.
Na tabela abaixo estão os escorre do desempenho escolar de 15 alunos que cursavam o 3o ano de produção industrial. Calcule a média e a mediana e compare.
	9,5
	10,0
	8,5
	4,5
	7,5
	8,5
	4,5
	5,5
	7,5
	10,0
	5,5
	6,5
	8,5
	3,5
	7,5
Abaixo temos a distribuiçãodo número de acidentes por dia, durante 53 dias, em certa rodovia:
	No de acidentes
	0
	1
	2
	3
	4
	No de dias
	20
	15
	10
	5
	3
Pede-se:
Determinar a média;
Determinar a mediana;
Determinar a moda;
Qual a porcentagem de dias em que tivemos dois ou mais acidentes por dia?
Abaixo estão as notas de 50 alunos:
	6,0
	8,5
	3,3
	5,2
	6,5
	7,7
	8,4
	6,5
	7,4
	5,7
	7,1
	3,5
	8,1
	5,0
	3,5
	6,4
	7,4
	4,7
	5,4
	6,8
	8,0
	6,1
	4,1
	9,1
	5,5
	7,3
	5,9
	5,3
	7,7
	4,5
	4,1
	5,5
	7,8
	4,8
	6,9
	8,5
	6,7
	3,9
	6,0
	7,6
	9,4
	9,8
	6,6
	6,6
	7,3
	4,2
	6,5
	9,4
	8,8
	8,9
Pede-se:
Determinar a amplitude total da amostra;
O número de classe pela fórmula de Sturges. Dado log 50 = 1,7;
A amplitude das classes;
Quais as classes? (Inicie pelo 30)
Frequência absoluta das classes;
Frequências relativas;
Pontos médios das classes; VIII.Frequências acumuladas;
Média;
Moda;
Mediana;
1o e 3o quartis;
7o decil e 55o percentil.
Em certo ano, uma universidade pagou a cada um de seus 45 professores um salário médio mensal de R$ 1.500,00, a cada um de seus 67 assistentes R$ 2.000,00, a cada um de seus 58 adjuntos R$ 2.600,00 e a cada um de seus 32 titulares R$ 3.100,00. Qual o salário médio mensal dos 202 docentes?
Dadas as estaturas de 140 alunos, conseguiu-se a distribuição abaixo:
	Estaturas (em cm)
	No de alunos
	145 Ⱶ 150
	2
	150 Ⱶ 155
	10
	155 Ⱶ 160
	27
	160 Ⱶ 165
	38
	165 Ⱶ 170
	27
	170 Ⱶ 175
	21
	175 Ⱶ 180
	8
	180 Ⱶ 185
	7
Calcule a média, a mediana e a moda.
Abaixo temos a distribuição dos alugueis de 65 casas. Determine sua média.
	Aluguel (R$)
	1500 Ⱶ 3500
	3500 Ⱶ 5500
	5500 Ⱶ 7500
	7500 Ⱶ 9500
	9500 Ⱶ 11500
	No de casas
	12
	18
	20
	10
	5
Medidas de variabilidade ou dispersão
Com as medidas de tendência central mostra que você pode resumir a informação contida em um conjunto de dados determinando o ponto central em torno do qual os dados se distribuem. No entanto, é necessário calcular também um valor que mostre a variabilidade dos dados.
As medidas de variabilidade ou dispersão são medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão em torno da média. Servem para medir a representatividade da média.
As medidas de dispersão são divididas em absoluta (amplitude (A), variância (S2) e desvio padrão (S)) e relativa (coeficiente de variação (CV)).
Amplitude Total (A)
A amplitude, conforme já vimos, é a diferença entre o maior e o menor dos valores da série. A utilização da amplitude total como medida de dispersão é muito limitada, pois sendo uma medida que depende apenas dos valores externos, é instável, não sendo afetada pela dispersão dos valores internos.
A amplitude total pode ser dada pelas seguintes fórmulas:
Para dados não agrupados: é a diferença entre o maior e o menor valor observado.
A  X Máx  X Mín
Para dados agrupados: é a diferença entre o limite superior da última classe e o inferior da primeira classe.
A  Lsuperior  linf erior
Desvio Médio
Desde que se deseja medir a dispersão os dados em relação à média, parece interessante a análise dos desvios em torno da média, que é dada pela fórmula:
_
di  X i   X
Variância e Desvio Padrão
Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos, que são, na sua maioria, devidos ao acaso. A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados.
A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. Assim, representando a variância, temos:
		Para a população
n
 X i  X 
 2   
_ 2

OBS: quando o objetivo não se restringe a descrição de dados, mas, partindo de uma amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma modificação que consiste em usar o divisor n-1 em lugar de n.
Para a amostra
n  1
 X i  X 
s 2   
_ 2

Quando a media não é exata e tem que ser arredondada, cada desvio fica afetado ligeiramente devido a esse arredondamento. O mesmo acontece que os quadrados, podendo os resultados dos cálculos ser menos exatos, por isso é utilizado a fórmula abaixo que além de mais prática é também mais precisa.
Para a população
n
_ 2
 X 2
 2 i  X
Para a amostra
 2
n X
n  1n  1
 X 2
s 2 i 
Para dados agrupados sem intervalo de classe:ou
Para a população
_ 2
 f X 2
2 ii  X n

Para a amostra
_ 2
n X
n  1n  1
 f X 2
s 2 ii 
Para dados agrupados com intervalo de classe:
Para a população
_ 2
 f x 2
2 i i  X n

39
 	Para a amostra
_ 2
n X
n  1n  1
 f x 2
s 2 i i 
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático é um inconveniente. Por isso mesmo imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada Desvio Padrão, definida como raiz quadrada da variância, representada por:
Para a população
_ 2
X 2
 i  X n
 
Para a amostra
n X 2
n 1n 1
X 2
 i 
s 
Para dados agrupados sem intervalo de classe:
Para a população
_ 2
f X 2
 ii  X n
 
Para a amostra
n X 2
n  1n  1
f X 2
 ii 
s 
Para dados agrupados com intervalo de classe:
Para a população
_ 2
f x 2
 i i  X n
 
Para a amostra
n X 2
n  1n  1
f x 2
 i i 
s 
Tanto o Desvio Padrão como a Variância é usado como medidas de dispersão ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. A variância é uma medida que tem pouca utilidade em estatística descritiva, já o desvio-padrão é a medida mais
41
usada na comparação de diferenças entre conjuntos de dados, por ter grande precisão. O desvio padrão determina a dispersão dos valores em relação à média.
Coeficiente de Variação (CV)
O Desvio Padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 300; no entanto, se a média for igual a 30, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade de medida dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio. Toma-se então uma medida relativa da variabilidade, comparando o desvio padrão com a média. Esta medida é o Coeficiente de Variação (CV).
A grande utilidade do coeficiente de variação é permitir a comparação das variabilidades de diferentes conjuntos de dados. É dada pela fórmula abaixo:
Para a população
_
X
CV   *100
Para a amostra
_
X
CV  s *100
Diz- se que uma distribuição tem: Baixa dispersão: CV ≤ 15%
Média dispersão: 15%< CV<30% Alta dispersão: C≥ 30%
EXERCÍCIOS PARA SALA DE AULA
Considerando as tabelas abaixo apresente as Amplitudes Totais de cada uma. a)
	Xi
	0
	1
	2
	3
	4
	fi
	2
	6
	12
	7
	3
b)
	Estaturas (cm)
	fi
	150 Ⱶ 154
	4
	154 Ⱶ 158
	9
	158 Ⱶ 162
	11
	162 Ⱶ 166
	8
	166 Ⱶ 170
	5
	170 Ⱶ 174
	3
A tabela abaixo apresenta, em minutos, de espera em uma fila de ônibus, durante 13 dias, de um cidadão que se dirige diariamente ao trabalho. Com base nos dados calcule a média conveniente, a variância e o desvio padrão.
15 10 2 17 6 8 3 10 2 9 5 9 13
Calcule a média conveniente, a variância e o

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes