Buscar

Estatistica Introdução

Prévia do material em texto

Aula 1: Conceitos fundamentais de 
Estatística Estatística 
Caruaru - 2014
Definição
� Estatística:
É uma parte da matemática aplicada que fornece métodos para coleta, organização, descrição, análise e
interpretação dos dados e utilização dos mesmos na tomada de decisões.
A estatística divide-se em duas partes:
– estatística descritiva: preocupa-se com a forma pela qual podemos apresentar um conjunto de dados 
em tabelas e gráficos, e também resumir as informações contidas nestes dados mediante a utilização 
de medidas estatísticas.
– inferência estatística: baseia-se na teoria das probabilidades para estabelecer conclusões sobre todo – inferência estatística: baseia-se na teoria das probabilidades para estabelecer conclusões sobre todo 
um grupo (chamado população), quando se observou apenas uma parte (amostra) representativa desta
população.
� Fases do método estatístico:
� Coleta de dados
� Contínua: frequência de alunos, nascimento e etc
� Periódica: trimestral, de 10 em 10 anos e etc.
� Ocasional: epidemias e etc.
� Apuração de dados
� Exposição ou apresentação de dados
� Análise dos resultados
� Estatística nas empresas:
� É necessário ter em mente que a estatística é uma ferramenta para o gestor ou executivo, nas respostas
dos “porquês” de seus problemas que podem ser explicados por uma análise de dados.
� Para estatística ser bem usada, é necessário conhecer os seus fundamentos e princípios, e acima de
tudo que o gestor ou executivo desenvolva um espírito crítico.
� Atualmente, as empresas têm procurado profissionais como executivos que tenham um nível de
conhecimento de estatística alto, pois este conhecimento tem feito uma diferença grande nos
processos decisórios em empresas.
� A estatística ajudará o administrador na tomada de decisão:
� Através da coleta de dados, ele conhece as informações necessárias para análise;
� Assim, ele é capaz de estabelecer metas e objetivos commaior probabilidade de serem alcançados.
� O planejamento pode ser resumido com auxilio da estatística, em tabelas e gráficos que facilitarão a
compreensão visual dos cálculos.
� Ao analisar os dados através de tabelas e gráficos disponíveis, é possível ao administrador tomar a
melhor decisão sobre o assunto.
� População e amostra:
� Variável: conjunto de variáveis possíveis de um fenômeno.
� Qualitativa: quando seus valores são expressos por atributos.
� Nominal: pode assumir atributos nominais. Ex: sexo, cor da pele e etc.
� Ordinal: pode assumir atributos ordinais. Ex: [pequeno, médio, grande]
� Quantitativa: quando seus valores são expressos em números. Ex: salários , idade etc.
� Variável contínua: pode assumir qualquer valor entre dois limites. Ex: [valores entre 0 e 10]
� Variável discreta: pode assumir valores pertencentes a um conjunto enumerável. Ex: [1,2,3]
� Exercícios
� Diga quais as variáveis abaixo são discretas e quais são contínuas:
� Os números de ovos que as galinhas botam?� Os números de ovos que as galinhas botam?
� Comprimento dos pregos produzidos por uma máquina?
� Funcionários de uma empresa?
� Quantidades de leite produzidos pelas vacas de uma fazenda?
� Diga quais as variáveis abaixo são qualitativas nominais e qualitativas ordinais:
� Cor dos olhos dos alunos de uma escola?
� Tamanho de uma empresa?
� População: conjunto portador de pelo menos uma característica comum.
� Amostra: subconjunto finito de uma população.
• Uma AMOSTRA tem que ser;
– Representativa: conter em proporção tudo o que a população possui qualitativa
e quantitativamente.
– Imparcial: todos os elementos da população tem igual oportunidade de fazer
parte da amostra.
• Uma AMOSTRA é a redução de uma população a dimensões menores, 
porém sem perda de suas características
• Ao processo de definição da amostra chama-se AMOSTRAGEM.
• Técnicas de amostragens:
– Aleatória Simples
– Estratificada
– Sistemática
� Amostragem Aleatória Simples:
• Vamos denotar o tamanho da população por N e o tamanho da amostra por n. Em
uma amostra aleatória simples, todos os itens da população de N tem a mesma
chance de serem escolhidos na amostra de n itens.
• Estabelece-se o tamanho da amostra e aleatoriamente selecionam-se os elementos
que a compõe.
• Exemplo – uma escola com 400 alunos (meninos, idades entre 6 e 16 anos) para 
realizarmos um estudo sobre qual a estatura média?
Exemplo – uma escola com 400 alunos (meninos, idades entre 6 e 16 anos) para 
realizarmos um estudo sobre qual a estatura média?
� Amostragem Aleatória Simples:
� Amostragem Aleatória Simples:
� Vamos supor que os 30 alunos da primeira série são os seguintes:
� Amostragem Aleatória Simples:
� Para garantir Representatividade e Imparcialidade
� Amostragem Aleatória Simples:
� Para garantir Representatividade e Imparcialidade
� Amostragem Aleatória Simples
• Agora vamos sortear os alunos de cada serie,obedecendo a seguinte regra:
1.Utilize a tabela de números aleatórios
2.Escolha as colunas e a linha
3.Escolha o sentido de consulta
� Vamos agora ver as alturas e temos a seguinte tabela:
� Amostragem Proporcional estratificada
• Muitas vezes a população se divide em subpopulações – estratos. Neste caso, de estrato em 
estrato podemos ter um comportamento heterogêneo e dentro de cada estrato, um 
comportamento homogêneo, é importante que o sorteio leve em consideração tais estratos.
• Ex: Supondo que temos uma população de estatura de 90 alunos e queremos pesquisar uma 
amostra de 10%, porém queremos uma amostra proporcional estratificada em relação ao gênero. 
Se na população, temos 54 meninos e 36 meninas, então:
• Temos dois estratos (sexo masculino e feminino):• Temos dois estratos (sexo masculino e feminino):
54,5
100
5410
≈=
×
46,3
100
3610
≈=
×
SEXO:
M
F
� Amostragem Sistemática
• Quando os elementos da população já se encontram ordenados, não há necessidade de 
construir um sistema de referência. Ex: prontuários médicos de um hospital, prédios de uma 
rua, linha de produção e etc.
• Exemplo: Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma 
amostra formada de cinquenta prédios. Neste caso, procedemos da seguinte maneira:
1. Escolhe-se por sorteio um número de 1 a 18.
2. Se por acaso o número sorteado for 4, tomaríamos pelo lado direito da rua, o 40 prédio, 
depois o 220, 400 e assim por diante, até voltarmos ao início da rua pelo lado esquerdo.
� Tamanho da amostra
� Parâmetro: característica da população.
� Estatística: característica descritiva de elementos de uma amostra.
� Estimativa: valor acusado por uma estatística que estima o valor de um parâmetro
populacional.
� ERRO AMOSTRAL: diferença entre o valor que a estatística pode acusar e o verdadeiro 
valor do parâmetro que se deseja estimar.
� ERRO AMOSTRAL TOLERÁVEL: quanto um pesquisador admite errar na avaliação dos 
parâmetros de interesse numa população.
EXEMPLO: o resultado de uma pesquisa eleitoral:
Candidato A = 20%, com 2% de erro amostral (18% - 22%)
• Fórmula para cálculo do tamanho da amostra:
– N = Tamanho da população
– E0 = erro amostral tolerável
– n0 = primeira aproximação do tamanho da amostra
– n = tamanho da amostra
Nn
Nn
n
+
×
=
0
0
2
0
0
1
E
n =
• Fórmula para cálculo do tamanho da amostra:
– N = 200 famílias
– E0 = erro amostral tolerável = 4% (E0 = 0,04)
– n0 = 1/(0,04)2 = 625 famílias
– n (tamanho da amostra corrigido) =
– n = 200x625/200+625 = 125000/825 = 152 famílias
– E se a população fosse de 200.000 famílias?
– n = (200.000)x625/(200.000+625) = 623 famílias
• Fórmula para cálculo do tamanho da amostra:
– Observe que: N = 200 famílias, E0 = 4%
– n = 152 famílias 76% da população
– Observeque: N = 200.000 famílias, E0 = 4%
– n = 623 famílias 0,3% da população
� Tamanho da amostra
1. Numa pesquisa para uma eleição presidencial, qual deve ser o tamanho de uma
amostra aleatória simples, se existe o desejo garantir um erro amostral não superior
a 2% ?
2. Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos2. Numa empresa com 1000 funcionários, deseja-se estimar a percentagem dos
favoráveis a certo treinamento. Qual deve ser o tamanho da amostra aleatória
simples que garanta um erro amostral não superior a 5%?
� Séries Estatísticas:
Toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da
época (tempo), do local (lugar) e da espécie.
� Tabela: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de
maneira sistemática.
� De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar :
• um traço horizontal ( - ) quando o valor é zero; 
• três pontos ( ... ) quando não temos os dados; • três pontos ( ... ) quando não temos os dados; 
• zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; 
• um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de 
determinado valor. 
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto..
� SÉRIES HOMÓGRADAS: são aquelas em que a variável descrita apresenta variação discreta ou descontínua. 
Podem ser do tipo temporal, geográfica ou específica.
� GRÁFICO EM LINHAS
É muito simples, nesse sistema, para cada ano do eixo x, encontraremos uma quantidade de
matrículas correspondente y, formando, assim, o par ordenado (x; y). Em 1999, temos
4.235.278 matrículas, formando o par ordenado (1999; 4.235.278); em 2000, o par
ordenado será (2000; 4.421.332); e assim sucessivamente. Pronto, a tarefa está realizada!
Veja o resultado, abaixo.
� GRÁFICO EM BARRAS
Nesse tipo de gráfico, a representação será em forma de retângulos, dispostos horizontalmente
(em barras). Poderíamos também, dispor a série histórica verticalmente, então, teríamos um
gráfico em colunas. Vamos representar desta vez, a evolução das matrículas na Creche. Dessa vez,
o eixo x será representado pelo número de matrículas na Creche e o período está representado no
eixo y.
Veja como fica o gráfico:
� GRÁFICO EM COLUNAS OU BARRAS MÚLTIPLAS
O Gráfico abaixo é um exemplo de gráfico em colunas ou barras múltiplas. Nele, podemos
comparar, rapidamente e com clareza, a evolução das matrículas na educação infantil brasileira, na
Creche e na Pré-Escola, ao mesmo tempo.
� GRÁFICO EM SETORES
O gráfico em setores é empregado sempre que desejamos ressaltar a participação do dado no
total, dessa maneira, ele serve para mostrar proporções relativas; o total é representado pelo
círculo, que fica dividido em tantos setores quantas são as partes.
� CARTOGRAMAS
Cartogramas são representações sobre uma carta geográfica. Eles são muito úteis quando
queremos relacionar dados estatísticos com áreas geográficas ou políticas. Essas representações
são muito úteis para expressarem população e densidade.
� PICTOGRAMAS
Os pictogramas são os processos gráficos de maior aceitação pública por sua forma atraente e
sugestiva.
� DISTRIBUIÇÃO DE FREQUENCIAS
O objetivo é partir dos dados brutos, isto é, desorganizados, para uma apresentação formal. Nesse
percurso, destacaremos a diferença entre tabela primitiva e rol, bem como a importância do resumo
dos dados por meio de uma técnica que agrupa as repetições, chamadas de freqüência.
� DADOS BRUTOS E ROL
Na Unidade anterior, trabalhamos com exposição de dados. Mas, infelizmente, os dados, raramente, apresentam-se
organizados. Por exemplo, vamos supor que um professor entregue as notas de seus alunos, conforme a Tabela
abaixo:
Observe que as notas não estão numericamente organizadas. Esse tipo de tabela denomina-se Tabela primitiva.
Partindo dessa Tabela, é difícil identificar o comportamento das notas, isto é: onde se concentram? Qual a maior?
Qual a menor? Quantos alunos estão abaixo ou acima de uma determinada nota? Esses dados estão, de fato,
desorganizados, por isso, vamos organizá-los. A maneira mais simples é realizando uma ordenação (crescente ou
decrescente). Após essa ordenação dos dados, a Tabela recebe o nome de rol. Veja como fica:
� DADOS BRUTOS E ROL
De fato, com os dados assim organizados, podemos saber, com facilidade, qual a menor nota (1,5) e qual a 
maior (10,0). E também, podemos encontrar a amplitude de variação, isto é, a diferença entre o maior valor e 
o menor valor: 10,0 – 1,5 = 8,5. Além dessas informações, com um pequeno esforço, podemos ainda 
identificar que as notas se concentram em dois valores (5,0 e 10,0) Convém destacar que os dados são úteis, 
apenas, se conseguirmos transformá-los em informação. 
h (amplitude)= L (limite superior) – l (limite inferior)
� DADOS BRUTOS E ROL
�Rol é um arranjo de dados numéricos brutos em ordem: crescente ou
decrescente.
�Com os dados organizados em um rol, identificamos que existem repetições de
muitos valores. Essa repetição recebe o nome de freqüência.
� TABELA DE FREQUENCIA
�Dispor os dados dessa maneira é melhor do que da forma anterior, mas ainda é inconveniente.
Isso porque exige muito espaço. Uma alternativa é agrupar os dados. Para desenvolver tal tarefa, é
comum, em primeiro lugar, distribuir os dados em classes ou categorias em uma Tabela. Essa
Tabela
receberá o nome de Distribuição de Freqüência ou Tabela de Freqüência.
�Para construir a tabela de freqüência das notas, consideraremos, por exemplo, quatro classes: da
nota 0,0 até a nota 4,9 (0,0–4,9); da nota 5,0 até a nota 6,9 (5,0–6,9); da nota 7,0 até a nota 8,9
(7,0–8,9); por fim, da nota 9,0 até a nota 10,0 (9,0–10,0). Agrupando os dados dessa maneira, é
comum chamá-los de dados agrupados. Vejamos:comum chamá-los de dados agrupados. Vejamos:
� Aplicação das regras ao exemplo
� Bem, primeiro, vamos calcular a diferença entre o maior e o menor número: 10,0 – 1,5 =
8,5. Isso significa que entre a maior nota e a menor nota há uma distância de 8,5. Essa é a
amplitude total, isto é, os valores variam, no máximo, 8,5. De outra forma, a distância do
menor valor para o maior valor é de 8,5.
� Agora, na segunda etapa das regras acima, vamos escolher o número de intervalos de
classe. Vamos tentar o menor número sugerido: 5. Se quero 5 classes e minha amplitude
total é 8,5, basta dividir a amplitude total pelo número de classes escolhido para
determinar os intervalos de classe. Assim,
� Observe que arredondamos o valor para 2 (assim temos um número fácil de trabalhar). O 
que esse resultado significa?
Significa que teremos cinco intervalos de amplitude 2.
�Desse modo, nossa nova tabela de distribuição de freqüência será:

Continue navegando