Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA APLICADA Aula 1: Conceitos Introdutórios Definição de Estatística O termo estatística vem da palavra também latina “STATUS”, que corresponde a informações e descrições que seriam úteis par ao estado. É desde então uma ferramenta administrativa utilizada para várias áreas como: recursos humanos, finanças, logística, produção e marketing. Logo, Estatística é a ciência que estuda quantitativamente os fenômenos naturais ou sociais, cuja avaliação está baseada em métodos científicos de coleta, organização, apresentação e análise de dados. Podemos considerar a ciência Estatística como dividida basicamente em três etapas: População É um conjunto de elementos sobre o qual se faz alguns estudos ou Inferência Estatística. À Estatística não interessa concluir a respeito de unidades individuais de observação, mas sim de grupos, conjuntos ou agregados, porque seu objetivo é o estudo da chamada POPULAÇÃO, a qual pode ser finita ou infinita. A população finita é aquela em que o número de unidades de observação pode ser contado e é limitado. Confira agora alguns exemplos de população Variáveis Em estatística, variável é uma atribuição de um número a cada característica da unidade de observação, ou seja, é uma função matemática definida na população. Quando uma característica ou variável é não numérica, denomina-se Variável Qualitativa ou Atributo. Exemplo de Amostragem sem Reposição PESQUISA ELEITORAL: as pessoas deve ser ouvidas apenas uma vez, porque, em uma eleição, o voto é individual FILA DE BANCO: a mesma pessoa pode ser observada duas ou amis vezes, a ada vez que retorna ao banco. Tipos e Amostragem Há diferentes maneiras pelas quais as amostras podem ser selecionadas, cada qual com vantagens e desvantagens, e um dos problemas associados à amostragem é a definição do tamanho. Amostragem Aleatória Simples O processo de retirada de uma amostra de uma população na qual unidade tem a mesma chance (ou oportunidade) de ser retirada denomina-se amostragem aleatória simples. Técnicas de Amostragem Definida a população, é preciso estabelecer a técnica de amostragem, isto é, o procedimento que será adotado para escolher os elementos que irão compor a amostra, conforme a técnica utilizada tem-se um tipo de amostra. Amostra Estratificada Amostra de Conveniência Aula 2: Tipos de Dados Conceitos básicos Dados Brutos Normalmente, na prática, os dados originais de uma série estatística não se encontram prontos para análise por estarem desorganizados. Por essa razão, costuma-se chama-los de dados brutos. Rol É a lista ordenada dos dados de uma série estatística. Essa ordenação pode ser crescente ou decrescente. Distribuição de Frequências – Variável Contínua Roteiro para Elaboração da Tabela de Frequência para Dados Agrupados Aula 3: Medidas de Posição Central Média Aritmética Uma média aritmética pode ser Simples, Ponderada ou Agrupada em Classe. Conheça a definição e exemplo de cada um dos tipos: Moda Pode-se definir como moda o valor mais frequente, quando comparada sua frequência com a dos valores contíguos de um conjunto ordenado. A moda pode não existir e, mesmo que exista, pode não ser única. Confira! Conheça a fórmula para dados agrupados: Mo = Xo + h(Fm - Fa) Xo é o ponto inicial do intervalo de classe a que pertence Fm. ------------------- 2 Fm – (Fa + Fp) MEDIANA é o valor que divide a distribuição em duas partes iguais. Sua fórmula é: Me = Xe + h (Xm - Fiaa) Xe é o ponto incial da classe a qual pertence Xm, na --------------------- frequência acumulada. H é o intervalo de classe. Fi Considere a seguinte amostra de uma pesquisa feita com 15 consumidores que atribuíram as seguintes notas a uma mercadoria, numa escala de 0 a 100: 65, 68, 70, 75, 80, 80, 82, 85, 88, 90, 90, 95, 98, 100, 100. Com base nesses dados, calcule: Média Aritmética Simples Moda Mediana Para pensar e calcular As informações ao lado correspondem aos dados agrupados de uma sondagem eleitoral de avaliação do Governador Maciel. Com base nisso, calcule: Média Moda Mediana Aula 4: Medidas de Ordenamento e Forma Na análise da distribuição de uma variável, há grande interesse de determinarmos qual o valor que divide a distribuição em duas partes iguais, quatro partes iguais, dez partes iguais e cem partes iguais. A estes valores (separatrizes) chamaremos respectivamente de: Quartis Dividem a distribuição em quatro partes iguais. Sua fórmula é: Qnq = X ( nqn / 4 + ½) Decis Dividem a distribuição ordenada em dez partes iguais. Sua fórmula é: Qnq = X ( nqn / 10 + ½) Percentis Os percentis dividem a distribuição ordenada em cem partes iguais. Eles podem ser obtidos por meio de uma equação similar à usada para a obtenção dos quartis e dos decis. Para pensar e calcular Considere a seguinte amostra de uma pesquisa feita com 15 consumidores que atribuíram as seguintes notas a uma mercadoria, numa escala de 0 a 100: 65, 68, 70, 75, 80, 80 ,82 ,85, 88 ,90, 90, 95, 98, 100, 100. Com base nos dados ao lado, calcule: 3º Quadril Qnq = X ( [nqn / 4 ] + ½) Q 3 = X ( [3 * 15 / 4 ] + ½ ) = X 11,75 Q 3 = X 11,75 (Posição do 3º Quartil) X 11 = 90 X 12 = 95 Por regra de três, temos : 0,75 ------------------1 X ------------------ 5 ( a diferença entre 90 e 95) X = 5 * 0,75 = 3,75 , Logo somado a 90 temos Q 3 = 90+ 3,75 = 93,75 7º Decil 60º Centil Abaixo, você encontra os dados agrupados de uma sondagem eleitoral de avaliação do Governador Maciel. Tomando-se estes dados por base, calcule: Qual será o 2º Quartil das notas agrupadas do Governador? Qual será o 6º Decil das notas agrupadas do Governador? Qual será o 72º Centil das notas agrupadas do Governador? Aula 5: Medidas de Dispersão Medidas de Dispersão Nem sempre, quando se está estudando um grupo de dados, o conhecimento de um promédio é suficiente para se tirar conclusão a respeito desses dados. É necessário também o conhecimento da variabilidade dos dados. Assim, é que não se justifica calcular a média de um conjunto de dados onde não haja nenhuma variação desses elementos. Da mesma forma, não ajuda muito o conhecimento da média quando o conjunto de dados tiver uma variação muito grande. A tomada de decisões apenas com a média, por exemplo, de um conjunto de dados é inadequada, uma vez que os dados diferem entre si, em maior ou menor grau. Vamos descobrir qual o melhor aluno entre 2 alunos, cujas notas foram: Desvio Padrão Propriedades do Desvio Padrão Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de números, o desvio padrão não se altera. Multiplicando-se ou dividindo-se cada elemento de um conjunto de números por uma constante, o desvio padrão fica multiplicado ou dividido pela constante. Para as distribuições simétricas (normais), tem-se: 95,45% das observações estão contidas entre 99,73% das observações estão contidas entre Aula 6: Gráficos Para a elaboração de um gráfico devem ser considerado os seguintes itens: a) Um título geral indicando a situaçãoestudada, época e local; b) escalas e as respectivas unidades de medida; c) convenções adotadas; d) fonte de informação assinalando de onde foram retirados os valores. Os gráficos podem ser classificados de várias maneiras: Os gráficos podem se apresentar em diversos tipos. Conheça cada um deles Falhas na Elaboração de Gráficos Aula 7: Distribuições de Amostragem Na prática, uma pesquisa dificilmente é realizada com mais de uma ou duas amostras. Seria dificil, dessa forma, chegar à chamada média das médias. O erro padrão da média é calculada pela divisão do desvio padrão da população pela raiz quadrada do tamanho da amostra. Para pensar e calcular Para compreendermos a aplicação do Intervalo de Confiança, precisamos ter noções sobre a Distribuição da Curva Normal. CARACTERÍSTICAS DA DISTRIBUIÇÃO NORMAL A. a variável pode assumir qualquer valor real; B. o gráfico da distribuição normal é uma curva em forma de sino, simétrica em torno da média; C. a área total sob a curva vale 1, porque corresponde à probabilidade de a variável aleatória assumir qualquer valor real; D. como a curva é simétrica em torno da média, os valores maiores e os menores do que a média ocorrem com igual probabilidade; E. a configuração da curva é dada por dois parâmetros: a média e a variância. Mudando a média, muda a posição da distribuição; mudando a variância, muda a dispersão da distribuição. Agora que você já conhece as características da distribuição normal, confira a figura dos gráficos de cada uma das situações abaixo: Os intervalos de confiança mais utilizados são os de 90%, , 95% e 99%, seguindo a tabela ao lado: Os modelos de aplicação do Intervalo de Confiança são baseados na premissa de que a distribuição normal pode ser usada com os seguintes dados: sempre a amostra deve ser igual/superior a 30; quando for menor do que 30, o desvio padrão é conhecido. Xm é a média Z é o número de Unidades de Desvios padrão a partir da Média Para pensar e Calcular Em uma dada semana, uma amostra de 30 empregados horistas é selecionada de um grande número de empregados de uma fábrica, teve uma média da amostra de salários de R$ 180,00, com desvio padrão da amostra de R$ 14,00. Estimamos a média dos salários para todos os empregados horistas na empresa com intervalo estimado de forma que podemos estar em 95% confiantes de que o intervalo inclui o valor médio da população da seguinte maneira: 95% ---------------------- 1,96 Xm + z x = 180 + 2,56*1,96 = 185,02 Xm - z x = 180 – 2,56*1,96 = 174,98 O Intervalo de Confiança será entre 174,98 e 185,02. EM uma prova de AV1, uma amostra de 50 estudantes, uma média da nota de 6,5, com desvio padrão da amostra de 1,2, estimamos a média de notas de todos os alunos do EAD (Ensino a Distância) com intervalo estimado de forma que podemos estar em 99% confiantes de que o intervalo inclui o valor médio da população da seguinte maneira: 99% ---------------------- 2,58 Xm + z x = 6,5 + 0,1697*2,58 = 6,94 Xm - z x = 6,5 – 0,1697*2,58 = 6,06 O Intervalo de Confiança será entre 6,06 e 6,94. Aula 9: Distribuição Normal Probabilidades na Distribuição Normal Aula 10: Teste de Hipóteses Teste de Hipóteses é um método utilizado para observarmos se determinados dados são compatíveis ou não com alguma hipótese levantada. Este procedimento estatístico tem como base a observação de uma amostra, sendo a teoria de probabilidades utilizada para verificar o comportamento de parâmetros desconhecidos numa população. O Teste de Hipóteses pode ser feito através de duas formas Testes paramétricos Testes não paramétricos O uso tanto dos testes paramétricos como dos não paramétricos está condicionado à dimensão da amostra e à respectiva distribuição da variável em estudo. Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão. Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese alternativa H1. • Hipótese existente, ou hipótese a ser testada – H0, que sempre alega a igualdade de um determinado parâmetro. • Hipótese alternativa – H1, que sempre alega a desigualdade de um determinado parâmetro. Para a realização dos testes de hipóteses, temos que obedecer às seguintes etapas: Formulação do Teste de Hipótese: Hipótese Nula (H0) e Alternativa (H1). Escolha de Distribuição Normal Adequada. Selecionar o nível de significância e região crítica do teste. Estabelecer Regra de Decisão. Selecionar a amostra, calcular a Estatística de teste e interpretar seus resultados. Para pensar e calcular Considere que um determinado professor anunciou que a média de nota de alunos em estatística foi de no mínimo 6,0 na AV1. Considerando um teste de hipótese com amostras de 50 elementos e um nível de significância de 5%, calcule: Se após os dados relativos a 50 elementos encontrarmos a média de 6,2 e desvio-padrão de 0,8. Etapa 1: H0 = 6,0 e H1<6,0 Etapa 2: Nível de Significância 5% Etapa 3: De acordo com a Distribuição Normal Reduzida, o Z para nível de significância de 5% é de – 1,65 Etapa 4: Utilização da fórmula Z = (6,2 -6) / (0,8/ √ 50) = 0,2 / 0,1131 = 1,7678 Como 1,7678 > - 1,65, a hipótese nula será aceita. Se após os dados relativos a outra amostra com 50 elementos, encontrarmos a média de 5,7 e desvio-padrão de 1,2. Etapa 1: H0 = 6,0 e H1<6,0 Etapa 2: Nível de Significância 5% Etapa 3: De acordo com a Distribuição Normal Reduzida, o Z para nível de significância de 5% é de – 1,65 Etapa 4: Utilização da fórmula Z = (5,7 -6) / (1,2/ √ 50) = -0,3 / 0,1131 = -2,6525 Como -2,6525 < -1,65, a hipótese nula será rejeitada. Ou seja, a informação da amostra não nos permite confirmar uma média 6,0 na prova com nível de significância de 5%. Os testes não paramétricos envolvem casos em que não podemos supor características da população de onde a amostra foi extraída, como por exemplo, comportamento de distribuição normal. Conheça os principais testes não paramétricos. 1. Teste do Qui-Quadrado – utilizado na análise de frequências, no caso de análise de uma característica da amostra. 2. Teste do Qui-Quadrado para Independência ou Associação – utilizado na análise de frequências, no caso de análise de duas características da amostra. 3. Teste dos Sinais – utilizado em casos emparelhados, ou seja, submetido a duas medidas. 4. Teste de Wilcoxon – Analisa os dados emparelhados considerando também as magnitudes encontradas. 5. Teste de Mann Whitney – Analisa se dois grupos originam-se de populações com médias diferentes. 6. Teste da Mediana – Análise de grupos que originam-se de populações com medianas diferentes. 7. Teste de Kruskal-Wallis - Análise de grupos que originam-se de populações com médias diferentes.
Compartilhar