Buscar

ESTATISTICA APLICADA APOSTILA

Prévia do material em texto

Estatística Aplicada
Prof. Bruno Sampaio
A Estatística é uma parte da Matemática 
Aplicada que fornece métodos para a 
coleta, organização, descrição, análise e 
interpretação de dados e para a utilização 
dos mesmos na tomada de decisões.
Estatística
� Acredita-se que o termo Estatística tenha sido
primeiramente empregado para designar
conjunto de dados referentes a assuntos do
Estado, geralmente com finalidade de controle
fiscal ou de segurança nacional. Por esse
motivo, o uso da palavra, segundo estudiosos,
teria a sua origem na expressão latina status,
que significa Estado
Origem da Estatística
Algumas razões para se estudar Estatística:
• Saber apresentar e descrever informações
de forma adequada.
• Saber tirar conclusões a partir das
informações obtidas
• Desenvolver a capacidade crítica e de
análise.
Importância:
� Estatística Descritiva: conjunto de técnicas
destinadas a descrever e resumir os dados, a fim de
que possamos tirar conclusões a respeito da
característica de interesse.
� Probabilidade: teoria matemática utilizada para se
estudar a incerteza oriunda de fenômenos de caráter
aleatório.
� Inferência Estatística: estudo de técnicas que
possibilitam a extrapolação, a um grande conjunto
de dados, das informações e conclusões obtidas a
partir da amostra.
Áreas da Estatística
População: é o conjunto total de elementos que tem determinada característica que se 
deseja estudar.
Amostra: é uma parte da população de interesse a que se tem acesso para se 
desenvolver o estudo estatístico.
Os dados amostrais devem ser coletados de modo apropriado, de modo que os dados 
sejam representativos da população da qual foram extraídos.
Parâmetro: é uma medida numérica que descreve alguma característica de uma 
população.
Estatística: é uma medida numérica que descreve alguma característica de uma 
amostra.
Conceitos Fundamentais
As informações contidas num conjunto de dados são 
referentes a determinadas variáveis em estudo.
Variável é uma característica dos elementos da 
população.
Há dois tipos de variáveis: numéricas e não
numéricas. As numéricas são denominadas
quantitativas, e as não numéricas, qualitativas.
Variáveis
Variáveis
� São variáveis que assumem como possíveis
respostas atributos e /ou qualidades. Se tais
respostas têm uma ordenação natural, então
elas são classificadas como qualitativas
ordinais.
Exemplos:
• Classe social: baixa, média, alta.
• Tamanho de uma embalagem: pequeno,
médio, grande.
Variáveis Qualitativas
� Quando não for possível estabelecer uma
ordem natural entre suas respostas, elas são
classificadas como qualitativas nominais.
Exemplos:
• Gênero: masculino ou feminino.
• Estado civil: solteiro, casado, viúvo,
divorciado.
População: alunos de uma universidade. 
 Variável: sexo (masculino ou feminino). 
População: moradores de uma cidade. 
 Variável: tipo de habitação (casa, apartamento, barraco, etc.). 
População: peças produzidas por uma máquina.
 Variável: qualidade (perfeita ou defeituosa).
 População: Óbitos em um hospital, nos últimos cinco anos 
Variável: causa mortis (moléstia cardiovasculares, cânceres, etc). 
Exemplos de variáveis qualitativas
� São variáveis que assumem como possíveis
respostas números e podem ser subdivididas
em discretas e contínuas.
As variáveis quantitativas discretas são
resultantes de contagens, assumindo assim,
valores inteiros.
Exemplos:
• Número de irmãos: 0, 1, 2, ...
• Número de peças defeituosas em um lote:
0, 1, 2, 3, ...
Variáveis Quantitativas
� As variáveis quantitativas contínuas assumem
valores em intervalos dos números reais e,
geralmente, são provenientes de uma
mensuração.
Exemplos:
• Peso
• Altura
População: habitações de uma cidade. 
Variável: número de banheiros. 
População: casais residentes em uma cidade. 
Variável: número de filhos. 
População: aparelhos produzidos em uma linha de montagem. Variável: número de defeitos 
por unidade. 
População: Bolsa de valores de São Paulo. 
Variável: número de ações negociadas. 
 População: estação meteorológica de uma cidade. 
Variável: precipitação pluviométrica durante um mês. 
População: pregos produzidos por uma máquina. 
Variável: comprimento.
Exemplos de variáveis quantitativas
� • Dados brutos: dados coletados sem
manipulação ou ordenação.
� • Rol: sequência ordenada
(crescente ou decrescente) dos dados brutos.
A ordenação do conjunto de dados brutos
facilita a contagem do número de vezes que
cada dado ocorre.
Organização dos Dados
� Exemplo 1: os dados abaixo são referentes às
idades de funcionários do setor administrativo
de uma empresa:
22 24 19 21 25 18 28 24 25 28 22 25
� Determine o Rol:
Podemos representar este conjunto de dados
através de uma tabela: 20
Tabela de frequência
Idade Frequência de Idades
1) Para as situações descritas a seguir, identifique a
população e a amostra correspondente. Discuta a
validade do processo de inferência estatística para
cada um dos casos.
a) Para avaliar a eficácia de uma campanha de
vacinação no Estado de São Paulo, 200 mães de
recém nascidos, durante o primeiro semestre de
um dado ano e em uma dada maternidade em São Paulo, foram 
entrevistadas a respeito da última vez
em que vacinaram seus filhos.
b) Uma amostra de sangue foi retirada de um
paciente com suspeita de anemia
Atividades 
c) A fim de avaliar a intenção de voto para presidente dos 
brasileiros, 122 pessoas foram entrevistadas em Brasília.
2) Um grupo de estudantes apresentou as
seguintes notas na primeira prova semestral
da disciplina de Matemática:
2,1; 7,1; 4,3; 3,3; 4,7; 6,9; 6,1; 5,2; 5,8; 7,8;
1,1; 9,5; 2,4; 8,5; 5,3; 2,1
Encontre o rol para este conjunto de dados.
Ao se trabalhar com grandes conjuntos de
dados, em geral, é útil organizá-los e resumi-los em uma 
tabela, chamada distribuição de frequências. Esta tabela 
lista as respostas dos dados, juntamente com suas 
frequências correspondentes.
Distribuição de Frequências
Exemplo 1: informações de funcionários de uma empresa.
� Tabela 1: distribuição de frequências
Uma tabela contém, basicamente, 3 colunas:
� 
Os dados abaixo são referentes às idades de
funcionários do setor administrativo de uma empresa:
 
 22 24 19 21 25 18 28 24 25 28 22 25 22 19 27
a) Classifique e indique a variável em estudo.
b) Organize os dados numa distribuição de
frequências.
c) Qual o percentual de funcionários com pelo menos 25 anos?
d) Qual o percentual de funcionários com até 23
anos?
Exemplo
No cálculo de medidas separatrizes (quartis, decis e
percentis) e na construção de um gráfico denominado
ogiva precisamos da frequência acumulada. Então,
vamos aprender como se calcula.
Frequência acumulada (fa): é a soma de cada
frequência com as que lhe são anteriores na
distribuição.
Frequência relativa acumulada (fra): é o quociente da
frequência acumulada pelo número total de dados.
Esta frequência também pode ser expressa em
porcentagem. O valor de (fra x100) é definido como
fra (%).
Observações 
Idade f fr(%) fa fra(%)
� Quando estamos trabalhando com um
conjunto de dados que apresenta um grande
número de valores diferentes, é conveniente
construir classes ou faixas de valores e contar
o número de ocorrências em cada classe.
Agrupamento de Dados
Os salários pagos (R$) em determinada empresa da 
cidade estão apresentados a seguir. Agrupe os dados em 
classes de frequências. O que podemos concluir
sobre as remunerações pagas na empresa?
Exemplo:
Roteiro: 
1º) Ache o mínimo e o máximo dos dados.
2º) Determinar o número de classes através da Regra de 
Sturges:
3º) Determinar o tamanho das classes através do cálculo 
h = R/i, onde R é a diferença entre o valor máximo e o 
valor mínimo.
Através dos dados brutos, vamos construir uma distribuição de 
frequências agrupando as informações em intervalos de classes.
� De modo geral, a quantidade de classes não deve ser 
inferior a 5 e nem superior a 25.
� Os valores de h devem ser arredondados para o maior 
valor.
Observações:
Saláriof 
(Número de 
funcionários)
fr(%) fa far(%)
Resolução:
� O objetivo da utilização de gráficos em análise de
dados é o de facilitar a compreensão do fenômeno 
estatístico por meio do efeito visual imediato que os 
gráficos proporcionam.
Tipos de gráficos:
� Diagramas de área (colunas, barras e setores).
� Gráfico para representar distribuições de
frequências agrupadas em classes: histograma,
polígono de frequências e ogiva. 
Gráficos
� Os gráficos em colunas, barras e setores são
bastante utilizados quando estamos trabalhando com 
variáveis qualitativas.
� As colunas (ou barras) comparam rapidamente o 
tamanho das categorias por meio das frequências 
oufrequências relativas (%).
Diagramas de Área
Exemplo 3: a tabela abaixo apresenta o número de
turistas que chegaram ao Brasil em 2010, segundo
vias de acesso.
Gráfico em colunas:
Gráfico em Barras:
Gráfico em Setores:
� Os gráficos apresentados a seguir são bastante
utilizados quando queremos representar um conjunto de dados 
cujo os mesmos foram agrupados em classes.
� Um histograma é semelhante ao diagrama em
barras, porém não há espaços entre as barras.
� Os intervalos de classes são colocados no eixo
horizontal enquanto as frequências são colocadas
no eixo vertical. As frequências podem ser absolutas
ou relativas.
Gráficos para Dados Agrupados em 
Classes
Figura 1.1: histograma para a variável salário(R$) 
dos funcionários de uma empresa.
� O polígono de frequências é um gráfico de linha
de uma distribuição de frequências. No eixo
horizontal, são colocados os pontos médios de
cada intervalo de classe e no eixo vertical são
colocadas as frequências absolutas ou relativas
(como no histograma).
O histograma e o polígono de frequências são
gráficos alternativos e contêm a mesma
informação. Fica a critério de quem está
conduzindo o estudo a escolha de qual deles
utilizar. 1
Polígono de Frequência
Polígono de Frequência:
� Outro gráfico que podemos construir para
dados agrupados em classes é a Ogiva.
Para construí-lo, devemos usar o limite
superior de cada intervalo no eixo horizontal
e a frequência acumulada no eixo vertical.
A frequência acumulada relacionada com o
limite inferior da primeira classe é sempre zero. 1
Ogiva:
Ogiva:
O departamento de atendimento ao consumidor de
uma concessionária de veículos recebe, via telefone,
as reclamações dos clientes. O número de chamadas
dos últimos 30 dias foram anotados e os resultados
foram:
5 4 4 5 6 8 4 4 5 6 4 3 6 7 4 5 4 5 7 8 8 5 7 5 4 5 7 6 3 4
a) Indique e classifique a variável em estudo.
b) Organize os dados numa distribuição de
frequências.
c) Qual o percentual de dias com pelo menos 5
reclamações.
Exercício de Fixação:
Resolução:

Continue navegando