Conceitos de Estatística Descritiva e Inferencial

•

ESTÁCIO

2

0

2

0

Tarcis Barbosa

07/06/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Ciência Política I

63.483 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Aula 1 - Conceitos introdutórios
Estatística é a ciência que estuda quantitativamente os fenômenos naturais ou sociais, cuja avaliação está baseada em métodos científicos de coleta, organização, apresentação e analise de dados.
· Estatística Descritiva: que se preocupa com a organização e descrição dos dados experimentais.
· Estatística Indutiva: (Estatística Inferencial), que cuida da sua analise e interpretação, ou seja, tirar conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações.
· Estatística Probabilística: representa o estudo de planejar jogadas ou estratégias de jogos de azar, bem como o risco e o acaso em eventos futuros.
População é o conjunto de elementos sobre o qual se faz alguns estudos ou Inferência Estatística, a qual pode ser finita ou infinita. Uma população é infinita se a quantidade de unidades de observação é ilimitada, ou a sua composição é tal que as unidades da população não podem ser contadas.
Variável é uma atribuição de um número a cada característica da unidade de observação, ou seja, é uma função matemática definida na população. Quando uma característica ou variável é não numérica, denomina-se Variável Qualitativa ou Atributo.
· Variável qualitativa – sexo; religião; naturalidade; cor dos olhos; faixa etária. (nestes casos é expressa em categorias, exemplo masculino e feminino; católica, judaica e protestante; etc.)
· Variável quantitativa – duração de uma bateria de celular; quantidade de notas de uma moeda. Podem ser discretas (assumem valores determinados e resultam de contagem, por exemplo quantidade de sabores de refresco) ou continuas (depende de algum fator, exemplo duração de uma bateria de celular)
Amostra é um subconjunto, necessariamente finito, uma parte selecionada das observações abrangidas pela população, através da qual se faz um estudo ou inferência sobre as características da população. A amostra é constituída por n unidades de observação e que deve ter as mesmas características da população. Essa coleta recebe o nome de amostragem que envolve pelo menos dois passos:
· Escolhas das unidades
· Registros das observações
A amostragem pode ser sem reposição e com reposição; na amostragem sem reposição, normalmente utilizada nos trabalhos estatísticos, as unidades são selecionadas apenas uma vez na amostragem com reposição, seleciona-se as unidades mais de uma vez.
Exemplo de Amostragem sem Reposição
Pesquisa eleitoral: as pessoas devem ser ouvidas apenas uma vez, porque, em uma eleição, o voto é individual.
Exemplo de Amostragem com Reposição
Fila de banco: a mesma pessoa pode ser observada duas ou mais vezes, a cada vez que retorna ao banco.
Tipos de amostragem:
Amostragem Sistemática é quando a retirada das unidades de observação é feita periodicamente, sendo o intervalo de seleção calculado, para uma população finita, por meio da divisão do tamanho da população pelo tamanho da amostra a ser selecionada.
Exemplo de Amostra Sistemática
Deseja-se retirar uma amostra de n = 10 unidades de observação de uma população de tamanho N = 874. O intervalo de seleção é, então, 874:10 = 87,4 = 87. Desse modo, vão-se contando as unidades de observação e escolhem-se aquelas que estiverem nas seguintes posições: 87; 174; 261; 348; 435; 522; 609; 696; 783; 870.
Amostragem aleatória simples é quando o processo de retirada de uma amostra de uma população na qual cada unidade tem a mesma chance (ou oportunidade) de ser retirada denomina-se amostragem aleatória simples. O processo de amostragem aleatória simples exige que se atribuam números consecutivos as unidades da população e proceda-se a um sorteio, colocando-se todos os números em um recipiente, por exemplo, e retirando um número, situação na qual cada unidade de observação tem a mesma chance de ser selecionada.
Técnicas de amostragem:
Amostra casual simples é composta por elementos, retirados ao acaso, da população. Então, todo elemento da população tem igual probabilidade de ser escolhido para a amostra.
Exemplo: efetuar um sorteio, com fichas numeradas, de zero a nove.
Amostra Sistemática é quando os elementos são escolhidos não por acaso, mas por um sistema.
Exemplo: no Lugar do sorteio, chamar todo o elemento com um número terminado em determinado dígito.
Amostra Estratificada é composta por elementos provenientes de todos os estratos da população. Devem ser obtidas amostras estratificadas sempre que a população for constituída por diferentes estratos. Por exemplo, se as pessoas que moram nos vários bairros de uma cidade são diferentes, cada bairro é um estrato.
Amostra de conveniência é formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. São comuns na área de saúde, onde se fazem pesquisas com pacientes de uma só clinica ou de um só hospital.
Aula 02 – Tipos de Dados
Dados brutos: dados desorganizados que não foram preparados para análise
ROL: lista ordenada, crescente ou decrescente, de uma série estatística.
Freqüência Simples Absoluta (fi): é o número de repetições de um valor individual ou de uma classe de valores da variável.
Freqüência Simples Relativa (fri ou fri%): representa a proporção de observações de um valor individual ou de uma classe, em relação ao número total de observações: fri= fi/n
Freqüência Absoluta Acumulada (Fi): é a soma da freqüência simples absoluta da classe ou do valor com as freqüências simples absolutas das classes ou dos valores anteriores.
Freqüência Relativa Acumulada (Fri ou Fri%): Apresentaremos duas maneiras de calcular:
a) acumulando as freqüências simples relativas de acordo com a definição de freqüências acumuladas
b) calculando as freqüências relativas diretamente a partir das freqüências absolutas, de acordo com a definição de freqüências relativas: FRI =Fi/n
Exemplo:
1. Determina-se o menor e o maior valor para o conjunto:
Valor mínimo: 5,1
Valor máximo: 14,9
2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente inferior ao menor valor das observações:
LI: 5,1
3. Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente superior ao maior valor das observações:
LS:15
4. Definir o número de classes (K), que será calculado usando K (ou n)= . Obrigatoriamente deve estar compreendido entre 5 a 20.
K: 8,94, aproximadamente, 8
5. Conhecido o número de classes define-se a amplitude de cada classe, A=:
A: 1,23
6. Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior), onde limite Inferior será 5,1 e o limite superior será 15 + 1,23.
Aula 3 - Medidas de Posição Central
MÉDIA ARITMETICA
Uma média aritmética pode ser Simples, Ponderada ou Agrupada em Classe.
· Simples
· Ponderada: Se os valores X1, X2, ..., Xn ocorrem com frequências f1 e f2, ..., fn, então:
· Agrupada: Seja Xi o ponto médio da i-ésima classe, então:
MODA
Pode-se definir como moda o valor mais frequente, quando comparada sua frequência com a dos valores contíguos de um conjunto ordenado.
· Unimodal: um único valor mais frequente
· Amodal: nenhum valor mais frequente
· Bimodal: dois valores mais frequentes
Formula para dados agrupados:
MEDIANA
É o valor que divide a distribuição em duas partes iguais. Sua fórmula é:
Exercícios:
Media = (65+68+70+75+80+80+82+85+88+90+90+95+98+100+100)/15 = 84,4
Moda = 80; 90; 100
Mediana = 65, 68, 70, 75, 80, 80, 82, 85, 88, 90, 90, 95, 98, 100, 100
Media:
Moda: Ponto médio da classe de maior frequência, portanto é 85.
Mediana: Possuindo 80 dados, a mediana é o 40º dado, que cai 8ª classe. Essa classe tem 10 elementos;
70 +(40 – 35). () = 70 + 5 = 75
Aula 4 - Medidas de Ordenamento e Forma
Na análise da distribuição de uma variável, há grande interesse de determinarmos qual o valor que divide a distribuição em duas partes iguais, quatro partes iguais, dez partes iguais e cem partes iguais. A estes valores (separatrizes) chamaremos respectivamente de:
Quartis: Dividem a distribuição em quatro partes iguais. Sua fórmula é:
Qnq = X ( nqn / 4 + ½)
Decis: Dividem a distribuiçãoordenada em dez partes iguais. Sua fórmula é:
Qnq = X ( nqn / 10 + ½)
Percentis: Os percentis dividem a distribuição ordenada em cem partes iguais. Eles podem ser obtidos por meio de uma equação similar à usada para a obtenção dos quartis e dos decis.
Para dados agrupados, utilizamos o centil para todos os casos (adaptando o quartil e o decil para o centil)
C nx = Li + ( (nx * n – Faant)/ Fi ) * h
Onde:
n = quantidade da amostra
nx = 1, 2, .....98,99
Li = limite inferior da classe encontrada
h = amplitude do intervalo
Faant = frequência acumulada anterior à da classe Ci
fi = frequência absoluta da classe encontrada – Ci
Aula 5 - Medidas de dispersão
DESVIO PADRÃO
Formula:
Propriedades:
· Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de números, o desvio padrão não se altera.
· Multiplicando-se ou dividindo-se cada elemento de um conjunto de números por uma constante, o desvio padrão fica multiplicado ou dividido pela constante.
VARIÂNCIA
É a medida de dispersão que é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância.
COEFICIENTE DE VARIAÇÃO
Corresponde à relação entre o desvio padrão sobre a média.
Aula 6 – Gráficos
Para a elaboração de um gráfico devem ser considerado os seguintes itens:
a) Um título geral indicando a situação estudada, época e local;
b) escalas e as respectivas unidades de medida;
c) convenções adotadas;
d) fonte de informação assinalando de onde foram retirados os valores.
Os gráficos podem ser classificados de várias maneiras:
· Quanto à forma:
· Diagramas: gráficos geométricos dispostos em duas dimensões.
· Cartogramas: ilustrações relativas a cartas geométricas.
· Estereogramas: gráficos volumétricos com três dimensões.
· Quanto ao uso:
· Gráficos de Informação: destinados ao público em geral, sendo apresentados de forma completa e clara.
· Gráficos de Análise: tabelas de informação técnica e qualitativa.
Tipos de gráficos:
· Histogramas: É formado por um conjunto de retângulos justapostos, de tal forma que a área de cada retângulo seja proporcional à frequência da classe que ele representa. Os retângulos terão como base o eixo das abscissas, cuja largura será igual a amplitude do intervalo de classe.
Diagrama: Apresenta as frequências sob a forma de colunas verticais ou de barras.São empregados para representar frequência de dados categóricos ou nominais.
· Gráfico de Pareto: Representa as frequências simples ou relativas das classes ou dos valores analisados, de forma ordenada, geralmente da classe de maior frequência para a de menor frequência. É considerado uma ferramenta para a Qualidade Total, no campo da gestão de empresas.
· Gráfico de Ogiva: Representa as frequências geralmente mostradas no histograma.
· Gráfico de Boxplot: Representa a dispersão dos dados, revelando a mediana e os quartis (que são medidas de posição). Assim, é possível verificar a posição central do conjunto ordenado dos dados, denominado mediana, e as subdivisões das séries ordenadas, denominadas quartis.
· Gráfico de Setores: representa as frequências relativas ou simples sobre a forma de setores de círculo. Também é denominado “Gráfico de Pizza”.
· Gráfico de dispersão: Mostra a relação gráfica existente entre duas variáveis numéricas, como custos e vendas.
· Pictograma: Construído a partir de figuras ou conjuntos de figuras representativas da intensidade ou das modalidades do fenômeno.
Falhas na elaboração de gráficos:
· Gráfico sucata
· Ausência de Base Relativa
· Eixo Vertical Comprimido
· Ausência do Ponto Zero
Aula 7 - Distribuições de Amostragem
Zentgraf (2007) aponta que os métodos de amostragem podem apresentar alguns problemas em sua aplicação quando:
· A população for muito pequena;
· Os dados da população apresentarem volatilidade alta;
· Houver casos de necessidade de previsão absoluta;
· Os dados da população já estiverem disponíveis.
Em uma pesquisa, buscamos uma amostra que seja representativa da população analisada. Porém, uma média amostral quase nunca será a mesma de uma média populacional, assim como o desvio padrão.
ERRO PADRÃO: é calculada pela divisão do desvio padrão da população pela raiz quadrada do tamanho da amostra. Vejamos:
FATOR DE CORREÇÃO DE POPULAÇÃO: em casos de uma nova amostragem ser feita em uma população finita sem reposição, os resultados novamente se distorceriam. A media e desvio padrão da população sem a amostra retirada se alteraria.
Aula 8: Intervalos de Confiança
Distribuição da Curva Normal
Características da distribuição normal:
· A variável pode assumir qualquer valor real;
· O gráfico da distribuição normal é uma curva em forma de sino, simétrica em torno da média;
· A área total sob a curva vale 1, porque corresponde à probabilidade de a variável aleatória assumir qualquer valor real;
· Como a curva é simétrica em torno da média, os valores maiores e os menores do que a média ocorrem com igual probabilidade;
· A configuração da curva é dada por dois parâmetros: a média e a variância. Mudando a média, muda a posição da distribuição; mudando a variância, muda a dispersão da distribuição.
Os modelos de aplicação do Intervalo de Confiança são baseados na premissa de que a distribuição normal pode ser usada com os seguintes dados: sempre a amostra deve ser igual/superior a 30; quando for menor do que 30, o desvio padrão é conhecido.
Aula 9: Distribuição Normal
Denomina-se distribuição normal reduzida a distribuição normal de média zero e variância.
As probabilidades associadas à distribuição normal reduzida são facilmente obtidas em tabelas (Área sob a curva normal padronizada compreendida entre os valores 0 e Z).
Fórmula:
X =>
µ => média
τ => desvio padrão
a) Z = (18 – 16)/1
Z = 2
Tabela => 0,4772 ou 47,42%
b) 0,5 – 0,4772 => 0,0228 ou 2,28%
a) Z = (7,5 – 6,5)/1
Z = 1
Tabela = 0,3413 ou 34,13%
0,5 – 0,3413 = 0,1587 ou 15,87%
b) Z = (7,0 – 6,5)/1
Z = 0,5
Tabela = 0,1915 ou 19,15%
0,5 – 0,1915 = 0.3085 ou 30,85%
c) Z = (8,0 – 6,5)/1
Z = 1,5
Tabela = 0,4332 ou 43,32%
0,5 – 0,4332 = 0,0668 ou 6,68%
d) Z = (5,0 – 6,5)/1
Z = -1,5
Tabela = 0,4332 ou 43,32%
0,5 + 0,4332 = 0,9332 ou 93,32%
Aula 10: Teste de Hipóteses
Teste de Hipóteses é um método utilizado para observarmos se determinados dados são compatíveis ou não com alguma hipótese levantada. Pode ser feito através de duas formas:
· Testes paramétricos
· Testes não paramétricos
O uso tanto dos testes paramétricos como dos não paramétricos está condicionado à dimensão da amostra e à respectiva distribuição da variável em estudo. Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão.
Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese alternativa H1.
· Hipótese existente, ou hipótese a ser testada – H0, que sempre alega a igualdade de um determinado parâmetro.
· Hipótese alternativa – H1, que sempre alega a desigualdade de um determinado parâmetro.
Para a realização dos testes de hipóteses, temos que obedecer às seguintes etapas:
· Formulação do Teste de Hipótese: Hipótese Nula (H0) e Alternativa (H1).
· Escolha de Distribuição Normal Adequada.
· Selecionar o nível de significância e região crítica do teste.
· Estabelecer Regra de Decisão.
· Selecionar a amostra, calcular a Estatística de teste e interpretar seus resultados.
Bilateral ≠ (divide área por 2)
Unilateral a esquerda <
Unilateral a direita >
Testes não paramétricos: Os testes não paramétricos envolvem casos em que não podemos supor características da população de onde a amostra foi extraída, como por exemplo, comportamento de distribuição normal. Conheça os principais testes não paramétricos.
· Teste do Qui-Quadrado: Utilizado na análise de frequências, no caso de análise de uma característica da amostra.
· Teste do Qui-Quadrado para Independência ou Associação: Utilizado na análise de frequências, no caso de análise de duas características daamostra.
· Teste dos Sinais: Utilizado em casos emparelhados, ou seja, submetido a duas medidas.
· Teste de Wilcoxon: Analisa os dados emparelhados considerando também as magnitudes encontradas.
· Teste de Mann Whitney: Analisa se dois grupos originam-se de populações com médias diferentes.
· Teste da Mediana: Análise de grupos que originam-se de populações com medianas diferentes.
· Teste de Kruskal-Wallis: Análise de grupos que originam-se de populações com médias diferentes.