Buscar

ESTATÍSTICA APLICADA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ESTATÍSTICA APLICADA
CONCEITOS INTRODUTÓRIOS
Conheça agora alguns exemplos de população:
TIPOS DE DADOS
Distribuição de Frequência – Variável contínua
Frequência Relativa – fri: É obtida pela divisão da frequência simples da classe pelo número total dos elementos. Fri = fi/n
Frequência Acumulada – Fi: Resulta da soma da frequência simples da classe com as frequências simples das classes antecedentes. Fi = f1 + f2 + f3 + ... + fi
Frequência Acumulada Relativa – Fri: É obtida pela divisão da frequência acumulada da classe pelo número total dos elementos. Fri = Fi/n
Cabe salientar que, acrescentados esses valores à tabela original, ela passa a se chamar Distribuição de Frequências.
MEDIDAS DE POSIÇÃO CENTRAL
Média Aritmética
Uma média aritmética pode ser Simples, Ponderada ou Agrupada em Classe. Conheça a definição e exemplo de cada um dos tipos:
Moda
Pode-se definir como moda o valor mais frequente, quando comparada sua frequência com a dos valores contíguos de um conjunto ordenado. A moda pode não existir e, mesmo que exista, pode não ser única. Confira!
Conheça a fórmula para dados agrupados:
Mo = Xo + h(Fm  - Fa)
 -------------------
 2 Fm – (Fa + Fp)
XO é o ponto inicial do intervalo de classe a que pertence Fm.
H é o intervalo de classe.
Fm é a frequência máxima.
Fa é a frequência anterior à Fm.
Fp é a frequência posterior á Fm.
MEDIANA  é o valor que divide a distribuição em duas partes iguais. Sua fórmula é: 
Me  =  Xe  + h (Xm  -  Fiaa)
 ---------------------
 Fi
Xm é o valor mediano, ou seja, metade da frequência total.
Xe é o ponto inicial da classe a qual pertence Xm, na frequência acumulada.
H é o intervalo de classe.
Fiaa é a frequência acumulada imediatamente anterior à classe a qual pertence Xm.
Fi é a frequência simples da classe a qual pertence Xm.
Para pensar e calcular
Considere a seguinte amostra de uma pesquisa feita com 15 consumidores que atribuíram as seguintes notas a uma mercadoria, numa escala de 0 a 100: 65, 68, 70, 75, 80, 80, 82, 85, 88, 90, 90, 95, 98, 100, 100.
Com base nesses dados, calcule:
Média Aritmética Simples
Moda
Mediana
MEDIDAS DE ORDENAMENTO E FORMA
Na análise da distribuição de uma variável, há grande interesse de determinarmos qual o valor que divide a distribuição em duas partes iguais, quatro partes iguais, dez partes iguais e cem partes iguais. A estes valores (separatrizes) chamaremos respectivamente de: Quartis, Decis, Percentis.
ATENÇÃO: O interesse no conhecimento das separatrizes decorre do fato de a partir delas podermos introduzir os índices de Pearson, de uso muito prático na descrição de uma variável X.
Quartis: Dividem a distribuição em quatro partes iguais. Sua fórmula é: Qnq  =  X ( nqn / 4 + ½)	
Qnq são o primeiro, segundo e terceiro quartil (i = 1, 2 e 3)
Nq é o número do quartil que se deseja obter.
X é o elemento da série ordenada.
N é o tamanho da amostra.
Decis: Dividem a distribuição ordenada em dez partes iguais. Sua fórmula é: Qnq  =  X ( nqn / 10 + ½)
Percentis: Dividem a distribuição ordenada em cem partes iguais. Sua fórmula é: Qnq  =  X ( nqn /100 + ½)  
Para pensar e calcular
Considere a seguinte amostra de uma pesquisa feita com 15 
consumidores que atribuíram as seguintes notas a uma 
mercadoria, numa escala de 0 a 100:
65, 68, 70, 75, 80, 80 ,82 ,85, 88 ,90, 90, 95, 98, 100, 100.
Com base nos dados ao lado, calcule:
3º Quartil; 7º Decil e 60º Centil.
MEDIDAS DE DISPERSÃO
Nem sempre, quando se está estudando um grupo de dados, o conhecimento de um promédio é suficiente para se tirar conclusão a respeito desses dados. É necessário também o conhecimento da variabilidade dos dados. Assim, é que não se justifica calcular a média de um conjunto de dados onde não haja nenhuma variação desses elementos.
Da mesma forma, não ajuda muito o conhecimento da média quando o conjunto de dados tiver uma variação muito grande. A tomada de decisões apenas com a média, por exemplo, de um conjunto de dados é inadequada, uma vez que os dados diferem entre si, em maior ou menor grau.
Vamos descobrir qual o melhor aluno entre 2 alunos, cujas notas foram:
ALUNO A
10 matemática
10 português
10 história
2   geografia
ALUNO B
9 matemática
7 português
9 história
7 geografia
Vamos descobrir qual o melhor aluno entre 2 alunos, cujas notas foram:
Média A = 10 + 10 + 10 + 2 / 4 = 8
Média B = 9 + 7 + 9 + 7 / 4 = 8
A média de ambos os alunos é 8, o que nos induziria a ter uma ideia de que ambos os alunos são do mesmo nível, o que não é verdade, já que a variabilidade das notas do aluno B é menor.
Desvio Padrão
O desvio padrão de um conjunto de N números X1, X2, ... Xn é definido por:
FÓRMULA NO EXCEL
S  =  ( (Xi  -  X)² Fi )/  Fi )  ^ (1/ 2)
Propriedades do Desvio Padrão
Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de números, o desvio padrão não se altera.
Multiplicando-se ou dividindo-se cada elemento de um conjunto de números por uma constante, o desvio padrão fica multiplicado ou dividido pela constante.
Para as distribuições simétricas (normais), tem-se:
68,72% das observações estão contidas entre X +- S
95,45% das observações estão contidas entre  X +- 2S
99,73% das observações estão contidas entre  X +- 3S
Variância:  A variância pode ser definida como uma medida de dispersão que é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância.
Coeficiente de variação: Corresponde à relação entre o desvio padrão sobre a média.
Onde: 
Cv: é o coeficiente de variação
S: é o desvio do padrão
X: é a média dos dados
O coeficiente de variação é dado em %, por isso a fórmula é multiplicada por 100.
GRÁFICOS
Para a elaboração de um gráfico devem ser considerado os seguintes itens:
a) Um título geral indicando a situação estudada, época e local;
b) escalas e as respectivas unidades de medida;
c) convenções adotadas;
d) fonte de informação assinalando de onde foram retirados os valores.
Os gráficos podem ser classificados de várias maneiras:  
TIPOS DE GRÁFICOS 
Os gráficos podem se apresentar em diversos tipos. Conheça cada um deles
Histograma
É formado por um conjunto de retângulos justapostos, de tal forma que a área de cada retângulo seja proporcional à frequência da classe que ele representa.
Os retângulos  terão como base o eixo das abscissas, cuja largura será igual a amplitude do intervalo de classe.
Diagrama
Apresenta as frequências sob a forma de colunas verticais ou de barras.
São empregados para representar frequência de dados categóricos ou nominais.
Gráfico de Pareto
Representa as frequências simples ou relativas das classes ou dos valores analisados, de forma ordenada,  geralmente da classe de maior frequência para a de menor frequência. É considerado uma ferramenta para a Qualidade Total, no campo da gestão de empresas.
Gráfico de Ogiva
Representa as frequências geralmente mostradas no histograma.
Gráfico Boxplot
Representa a dispersão dos dados, revelando a mediana e os quartis (que são medidas de posição).  Assim, é possível verificar a posição central do conjunto ordenado dos dados, denominado mediana, e as subdivisões das séries ordenadas, denominadas quartis.
Gráfico de Setores
Representa as frequências relativas ou simples sobre a forma de setores de círculo.  Também é denominado “Gráfico de Pizza”
Gráfico de Dispersão
Mostra a relação gráfica existente entre duas variáveis numéricas, como custos e vendas.
Pictograma
Construído a partir de figuras ou conjuntos de figuras representativas da intensidade ou das modalidades do fenômeno.
FALHAS NA ELABORAÇÃO DE GRÁFICOS
Gráfico Sucata
Ausência de Base Relativa
Eixo Vertical Comprido
Ausência do Ponto Zero
DISTRIBUIÇÃO DE AMOSTRAGEM
Para pensar e calcular
N = tamanho da população
n = tamanho da amostra
INTERVALOS DE CONFIANÇA
Para compreendermos a aplicação do Intervalo de Confiança, precisamoster noções sobre a Distribuição da Curva Normal.
CARACTERÍSTICAS DA DISTRIBUIÇÃO NORMAL
a variável pode assumir qualquer valor real;
o gráfico da distribuição normal é uma curva em forma de sino, simétrica em torno da média;
a área total sob a curva vale 1, porque corresponde à probabilidade de a variável aleatória assumir qualquer valor real;
como a curva é simétrica em torno da média, os valores maiores e os menores do que a média ocorrem com igual probabilidade;
a configuração da curva é dada por dois parâmetros: a média e a variância. Mudando a média, muda a posição da distribuição; mudando a variância, muda a dispersão da distribuição.
Agora que você já conhece as características da distribuição normal, confira a figura dos gráficos de cada uma das situações abaixo:
Distribuição Normal
Duas Distribuições Normais de mesma variância e com médias diferentes
Duas Distribuições Normais de mesma média e com variâncias diferentes
Os intervalos de confiança mais utilizados são os de 90%, , 95% e 99%, seguindo a tabela ao lado:
Os modelos de aplicação do Intervalo de Confiança são baseados na premissa de que a distribuição normal pode ser usada com os seguintes dados: sempre a amostra deve ser igual/superior a 30; quando for menor do que 30, o desvio padrão é conhecido.
Para calcular um intervalo de confiança, utiliza-se a seguinte fórmula:
Xm = média
Z = número de Unidades de Desvio Padrão a partir da Média
Para pensar e Calcular
Em uma dada semana, uma amostra de 30 empregados horistas é selecionada de um grande número de empregados de uma fábrica, teve uma média da amostra de salários de R$ 180,00, com desvio padrão da amostra de R$ 14,00. Estimamos a média dos salários para todos os empregados horistas na empresa com intervalo estimado de forma que podemos estar em 95% confiantes de que o intervalo inclui o valor médio da população da seguinte maneira:
EM uma prova de AV1, uma amostra de 50 estudantes, uma média da nota de 6,5, com desvio padrão da amostra de 1,2, estimamos a média de notas de todos os alunos do EAD (Ensino a Distância) com intervalo estimado de forma que podemos estar em 99% confiantes de que o intervalo inclui o valor médio da população da seguinte maneira:
DISTRIBUIÇÃO NORMAL
A área total sob a curva normal vale 1. Isto significa que a probabilidade de ocorrer qualquer valor real é 1. A curva é simétrica em torno da média zero. Então a probabilidade de ocorrer valor maior do que zero é 0,5. Mas qual seria a probabilidade de ocorrer valor entre zero e z = 1,25, por exemplo?
Qual é a probabilidade de ocorrer valor maior do que z = 1,25?
Como a probabilidade de ocorrer valor maior do que zero é 0,5 e a probabilidade de ocorrer valor entre zero e z = 1,25 é 0,3944, a probabilidade pedida é:
0,5 – 0,3944 = 0,1056 ou 10,56%
Probabilidades na Distribuição Normal 
Para pensar e calcular 
TESTE DE HIPÓTESES
Você já ouviu falar em teste de hipóteses? 
Teste de Hipóteses é um método utilizado para observarmos se determinados dados são compatíveis ou não com alguma hipótese levantada. Este procedimento estatístico tem como base a observação de uma amostra, sendo a teoria de probabilidades utilizada para verificar o comportamento de parâmetros desconhecidos numa população.
O Teste de Hipóteses pode ser feito através de duas formas 
Testes paramétricos
Testes não paramétricos
O uso tanto dos testes paramétricos como dos não paramétricos está condicionado à dimensão da amostra e à respectiva distribuição da variável em estudo. 
Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão.
Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese alternativa H1.
• Hipótese existente, ou hipótese a ser testada – H0, que sempre alega a igualdade de um determinado parâmetro.
• Hipótese alternativa – H1, que sempre alega a desigualdade de um determinado parâmetro.
Para a realização dos testes de hipóteses, temos que obedecer às seguintes etapas:
Formulação do Teste de Hipótese: Hipótese Nula (H0) e Alternativa (H1).
Escolha de Distribuição Normal Adequada.
Selecionar o nível de significância e região crítica do teste.
Estabelecer Regra de Decisão.
Selecionar a amostra, calcular a Estatística de teste e interpretar seus resultados.
Para pensar e calcular
Considere que um determinado professor anunciou que a média de nota de alunos em estatística foi de no mínimo 6,0 na AV1. 
Considerando um teste de hipótese com amostras de 50 elementos e um nível de significância de 5%, calcule:
Se após os dados relativos a 50 elementos encontrarmos a média de 6,2 e desvio-padrão de 0,8.
Etapa 1: H0 = 6,0 e H1<6,0
Etapa 2: Nível de Significância 5%
Etapa 3: De acordo com a Distribuição Normal Reduzida, o Z para nível de significância de 5% é de – 1,65
Etapa 4: Utilização da fórmula 
Z = (6,2 -6) / (0,8/ √   50) = 0,2 / 0,1131 = 1,7678
Como 1,7678 > - 1,65, a hipótese nula será aceita.
Se após os dados relativos a outra amostra com 50 elementos, encontrarmos a média de 5,7 e desvio-padrão de 1,2.
Etapa 1: H0 = 6,0 e H1<6,0
Etapa 2: Nível de Significância 5%
Etapa 3: De acordo com a Distribuição Normal Reduzida, o Z para nível de significância de 5% é de – 1,65
Etapa 4: Utilização da fórmula 
Z = (5,7 -6) / (1,2/  √ 50) = -0,3 / 0,1131 = -2,6525
Como -2,6525 < -1,65, a hipótese nula será rejeitada.  Ou seja, a informação da amostra não nos permite confirmar uma média 6,0 na prova com nível de significância de 5%.
Os testes não paramétricos envolvem casos em que não podemos supor características da população de onde a amostra foi extraída, como por exemplo, comportamento de distribuição normal. Conheça os principais testes não paramétricos.
Teste do Qui-Quadrado – utilizado na análise de frequências, no caso de análise de uma característica da amostra.
Teste do Qui-Quadrado para Independência ou Associação – utilizado na análise de frequências, no caso de análise de duas características da amostra.
Teste dos Sinais – utilizado em casos emparelhados, ou seja, submetido a duas medidas.
Teste de Wilcoxon – Analisa os dados emparelhados considerando também  as magnitudes encontradas.
Teste de Mann Whitney – Analisa se dois grupos originam-se de populações com médias diferentes.
Teste da Mediana – Análise de grupos que originam-se de populações com medianas diferentes.
Teste de Kruskal-Wallis - Análise de grupos que originam-se de populações com médias diferentes.

Outros materiais