Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA APLICADA Tutor: Antonio Viana Professor da teletrasmitida: Eudes AULA 1-CONCEITOS INTRODUTÓRIOS A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Fases do método estatístico Coleta de dados: Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno que se quer pesquisar, damos início à coleta dos dados numéricos necessários à sua descrição. Crítica dos dados: Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de falhas e imperfeições. Apuração dos dados: Soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Exposição ou apresentação dos dados Os dados devem ser apresentados sob a forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas Análise dos resultados: O objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as 4 fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos através dos métodos da Estatística Indutiva ou Inferencial, e tiramos desses resultados conclusões e previsões. População estatística ou universo estatístico: Conjunto de entes portadores de, pelo menos, uma característica comum Amostra é um subconjunto finito de uma população Variável: É, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Variável é, pelo menos, uma característica que possa ser observada ou medida nos elementos de uma população. Quantitativa (Ou atributo) Expresso por atributos Gênero, Sexo, Faixa Etária, Estado civil, Escolaridade Religião; católico, umbandista, etc Naturalidade Cor dos olhos, da pele, do cabelo Qualitativa Expressa em números Discretas (Intervalo de um número real inteiro, contagens, enumerações, valores inteiros) Valores de uma moeda R$1, R$5 Sabores de um refresco: manga, limão Nº de alunes de uma classe Nº Viagens feitas Nº de filhos de uma família Contínuas (Medições, valores dentro de intervalos) Temperatura Altura, peso, comprimento, espessura, velocidade Renda R$1.360,00 Idade; 01 ano e 3 meses Tempo de vôo Duração de bateria de celular Técnicas de Amostragem AULA 2 _TIPOS DE DADOS Dados brutos são aqueles que ainda não foram numericamente ordenados. Como são dados primariamente levantados ou reunidos, possui uma característica aleatória. Rol é um arranjo de dados numéricos brutos em ordem crescente ou decrescente de grandeza. Frequencias_Elementos de distribuição de frequencias X = Maior valor observado da variável de freqüências MAX x = Menor valor observado da variável de freqüências MIN h= Intervalo de classe Diferença entre o limite superior e o limite inferior de classe A= Amplitude Diferença entre o limite superior e o limite inferior de classe AT = Amplitude Total = maior dado – menor dado = 15 – 4 = 11 4 6 6 10 12 12 13 13 14 14 15 15 16 19 19 20 AT = 20 - 4 Xi = Ponto médio de classe Valor representativo da classe Para obter o ponto médio de uma classe, some os limites superior e inferior e divida por 2 Limite de classe: Valores extremos. O limite mínimo de uma classe é denominado “limite inferior” e o máximo, “limite superior” fri Frequência Relativa (%) Frequência Relativa de um elemento da série – fr É a divisão da frequência simples de um elemento da série pelo total de elementos da série Apresenta a participação percentual do elemento na série. fri = fi / n Fi Frequência Acumulada Soma das freqüências simples de classe com as freqüências simples da classe antecedente Fi = f1+f2+f3+f4...fi Fri Frequência Acumulada Relativa (%) Divisão da freqüência acumulada (Fi) da classe pelo total dos elementos Fri = Fi / n Elaborando uma tabela de distribuição de freqüências Transformar os dados em rol Encontrar a amplitude total Determinar o número de classes de acordo com o total de observações Xi fi fri fi/n Fi fi1+ fi2+ fi3+... Fri fi / n 2 3 =3/25 12 Repete fi 3 Repete fri 12 3 7 =7/25 28 =3+7 10 12+28 40 4 8 =8/25 32 =10+8 18 40+32 72 6 6 =6/25 24 =18+6 24 72+24 96 7 1 =1/25 4 =24+1 25 96+4 100 n= 25 Ponto Médio Classe Intervalo de classe fi fri fi/n Fi fi1+ fi2+ fi3+... Fri fi / n 1 2 ___________4 6 15 6 15 2 4 ___________6 18 45 24 60 3 6 ___________8 10 25 34 85 4 8 ___________10 6 15 40 100 n = 40 Limite inferior (lim superior + limite superior) / 2 1ª classe = (4+2) / 2 = 3 4ª classe = (8+10) / 2 = 9 AULA 3 _ MEDIDAS DE TENDÊNCIA CENTRAL Uma medida de tendência central ou posição de um conjunto de dados mostra o valor em torno do qual se agrupam as observações. Dividem-se em: 1. Média Aritmética 2. Mediana 3. Moda Média Aritmética: Uma média aritmética pode ser Simples, Ponderada ou Agrupada em Classe Média Aritmética Simples: é média aritmética, ou média, de um conjunto de N números X1, X2, ...., Xn é definido por: Exemplo: Sabe-se que a produção leiteira diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para a produção média da semana: Média Aritmética Com a Frequência Absoluta: A média é obtida através da multiplicação do valor de cada classe pela frequência simples correspondente xi fi Fi fr % Fri% X= (142x6)+(146x4)+(150x3)+(154x2)+(158x5)= 2984= 149,20 --------------------------------------------------------- ------- 20 20 142 6 6 30 30 146 4 10 20 50 150 3 13 15 65 154 2 15 10 75 158 5 20 25 100 ∑ 20 - 100 - Média Aritmética com Dados Agrupados: O modo mais prático de obtenção da média com os dados agrupados é abrir, na tabela, uma coluna correspondente aos produtos xifi: ����� Média aritmética com a freqüência relativa: A média é obtida através da multiplicação do valor de cada classe pela frequência relativa correspondente xi fi Fi fr % Fr% X= (142 x 0,30)+(146 x 0,20)+(150 x 0,15)+(154 x 0,10)+(158 x 0,25)= X= 42,60 + 29,20 + 22,50 + 15,40 + 39,50= 149,20 142 6 6 30 30 146 4 10 20 50 150 3 13 15 65 154 2 15 10 75 158 5 20 25 100 ∑ 20 - 100 - Média Aritmética Com Intervalos De Classe Graficamente podemos observar facilmente a moda. O valor modal localiza-se na parte mais alta da curva onde a frequência tem o maior valor. Moda Com Intervalo De Classe l* é o limite inferior da classe modal L* é o limite superior da classe modal Mediana é o valor que divide a distribuição em duas partes iguais. Sua fórmula é: Mediana Dados Não-agrupados Dada uma série de valores, como por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9 De acordo com a definição de mediana, o primeiro passo a ser dado é ordenar os valores: 2, 5, 6, 9, 10, 13, 15, 16, 18. Md = 10 Número ímpar: É o valor do item médio ou central. Ex.: 4; 7; 8; 9; 12; 13; 17 A mediana é 9. Número par: Quando os números são pares tem-se dois elementos centrais e a mediana será a média aritmética. Ex.: 4; 7; 8; 10;12; 13; 17; 20 A mediana será: (10 + 12) = 22 = 11 2 Mediana: Dados Agrupados Sem Intervalos De Classe Identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Nº de meninos fi Fi Sendo: (∑ fi) ÷ 2 = 34 ÷ 2 = 17 Md = 2 meninos 0 1 2 3 4 2 6 10 12 4 2 8 18 30 34 ∑ = 34 No caso de existir uma frequência acumulada (F1), tal que: Fi = (∑ f1) ÷ 2 A mediana será dada por: Md = [(xi + xi + 1)] ÷ 2 xi fi Fi Sendo: (∑ fi) ÷ 2 = 8 ÷ 2 = 4 Logo: Md = (15 + 16) ÷ 2 = 31 ÷ 2 15,5 Md = 15,5 meninos 12 14 15 16 17 20 1 2 1 2 1 1 1 3 4 6 7 8 ∑ = 8 Mediana com intervalo de classe Mediana Para Dados Agrupados Salários f (nº de pessoas) xi Fi 1º passo : Localizar o ponto que contém a mediana. n = 40 temos: n/2 = 40:2 = 20 (Na 3ª classe, temos Fi = 24) 1º passo: Calcula-se a ordem n/2. 2º passo: Pela Fi identifica-se a classe que contém a mediana (Classe Md = 30 (( 40 ). 3º Passo: utiliza-se a fórmula. 10 (( 20 5 15 5 20 (( 30 8 25 13 30 (( 40 11 35 24 40 (( 50 9 45 33 50 (( 60 4 55 37 60 (( 70 3 65 40 S 40 ----- AULA 4 _ MEDIDAS DE ORDENAMENTO E FORMA Na análise da distribuição de uma variável, há grande interesse de determinarmos qual o valor que divide a distribuição em duas partes iguais, quatro partes iguais, dez partes iguais e cem partes iguais. A estes valores (separatrizes) chamaremos respectivamente de: Quartil: Denominamos quartis os 3 valores de uma série que a dividem em 4 partes iguais. Há três quartis: o primeiro quartil; o segundo quartil (igual à mediana); o terceiro quartil. Dividem a distribuição em quatro partes iguais. Sua fórmula: Qnq = X ( nqn / 4 + ½) _____________________________________________________ 0% 25% 50% 75% 100% Q1 Q2 Q3 2ºQuartil Mediana Sendo que Q2 (segundo quartil) é igual à mediana da série. Decil: Denominamos quartis os 9 valores de uma série que a dividem em 10 partes iguais. Dividem a distribuição ordenada em dez partes iguais. Sua fórmula é: Qnq = X ( nqn / 10 + ½) ___________________________________________________________ d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 mediana O quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana. Percentil: Denominamos percentis os 99 valores que separam uma série em 100 partes iguais. Dividem a distribuição ordenada em dez partes iguais. Sua fórmula é: Qnq = X ( nqn / 10 + ½) ___________________________________________________________ d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 mediana O quinquagésimo centil é igual à mediana. AULA 5 _ MEDIDAS DE DISPERSÃO Nem sempre, quando se está estudando um grupo de dados, o conhecimento de um promédio é suficiente para se tirar conclusão a respeito desses dados. É necessário também o conhecimento da variabilidade dos dados. Assim, é que não se justifica calcular a média de um conjunto de dados onde não haja nenhuma variação desses elementos. Da mesma forma, não ajuda muito o conhecimento da média quando o conjunto de dados tiver uma variação muito grande. A tomada de decisões apenas com a média, por exemplo, de um conjunto de dados é inadequada, uma vez que os dados diferem entre si, em maior ou menor grau. As medidas de tendência central (Média. Moda e Mediana) fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação é aparente, para que nos permita, por exemplo, comparar conjuntos diferentes de valores. Variância: É a média dos quadrados dos desvios das observações em relação à média da amostra. Pode ser definida como uma medida de dispersão que é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância. Habitualmente considera-se uma versão corrigida da variância Desvio Padrão: O desvio padrão de um conjunto de N números X1, X2, ... A variância não vem representada na mesma unidade das observações. Se tomarmos a raiz quadrada da variância obtemos o desvio padrão que também é uma medida de dispersão e vem na mesma unidade das observações. Nos programas de estatística e nas máquinas de calcular o que aparece são as versões corrigidas da variância e do desvio padrão. O desvio padrão e a variância podem ser fortemente afetados por erros ou observações muito afastadas Propriedades do Dp: Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de números, o desvio padrão não se altera. Multiplicando-se ou dividindo-se cada elemento de um conjunto de números por uma constante, o desvio padrão fica multiplicado ou dividido pela constante. Amplitude total: A amplitude de uma amostra é a diferença entre o máximo e o mínimo. Exemplo: Para os valores 40,45,48,52,54,62 e 70, temos que AT = 70 – 40 = 30 Quanto maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável. Coeficiente De Variação: Podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV). Corresponde à relação entre o desvio padrão sobre a média. Considere os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos: Método prático: Não apenas este método é usualmente mais prático, como também mais preciso 1º caso: dados não-agrupados Tomemos como exemplo o conjunto de valores da variável x: 40, 45, 48, 52, 54, 62, 70. O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para xi e outra para xi² 2º caso: dados agrupados sem intervalos de classe Como, neste caso, temos a presença de frequências, temos que levá-las em consideração, resultando a fórmula: O modo mais prático de obter o desvio padrão é abrir, na tabela dada, uma coluna para os produtos fixi e outra para fixi². Logo, considerando os dados da tabela anterior, temos que: 3º caso: dados agrupados com intervalos de classes AULA 6_ TABELAS E GRÁFICOS O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries. Os gráficos podem ser classificados quanto á forma e quanto ao uso Para a elaboração de um gráfico devem ser considerados: a) Um título geral indicando a situação estudada, época e local; b) escalas e as respectivas unidades de medida; c) convenções adotadas; d) fonte de informação assinalando de onde foram retirados os valores. Tipos de Gráficos 1. Gráfico de Colunas: Representação por meio de retângulos não-contíguos, dispostos verticalmente; Os retângulos possuem a mesma base e as alturas são proporcionais aos respectivos dados; É usado em séries temporais, específicas ou geográficas. => (gráfico de colunas compostas) 2. Gráfico em Barras: Representação por meio de retângulos dispostos horizontalmente; Os retângulos possuem mesma altura e os seus comprimentos são proporcionais aos respectivos dados. => (gráfico de colunas compostas) 3. Gráficos em setores: É designado por meio de um círculo, onde cada classe é representado por um setor circular, cujo ângulo é proporcional ao tamanho da amostra. É utilizado quando se deseja mostrar as partes de um todo, ou seja, quando se deseja comparar proporções. As áreas dos setores são proporcionais aos dados da série e a área total da circunferência (100%) corresponde a 360º.360o ( 100% 4. Gráfico de linhas São usados, sobretudo, na representação de séries temporais. 5. Pictogramas Os símbolos devem ser auto-explicativos; As diferentes quantidades devem expressar-se mediante maior ou menor número de símbolos; Estabelecem comparações gerais. 6. Histograma: é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva frequência. AULA 07 _TÉCNICAS DE AMOSTRAGEM É uma técnica especial para recolher amostras, que garante, tanto quanto possível, o acaso da escolha. Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra caráter de representatividade. Amostragem Aleatória Simples É equivalente a um sorteio lotérico.Na prática, a amostragem casual ou aleatória simples pode ser realizada enumerando-se a população de 1 a n e sorteando-se por meio de um dispositivo aleatório qualquer k números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra. Ex.: Obter uma amostra representativa, de 10%, de uma população de 300 alunos de uma escola. 1º) Numerar os alunos de 1 a 300; 2º) Escrever os números de 1 a 300 em pedaços de papel e colocá-los em uma urna; 3º) Retirar 30 pedaços de papel, um a um, da urna, formando a amostra da população. Nesta técnica de amostragem, todos os elementos da população têm a mesma probabilidade de serem selecionados. Amostragem Proporcional Estratificada Muitas vezes a população se divide em sub-populações (estratos). O sorteio dos elementos da amostra deve levar em consideração tais estratos. Além de considerar a existência de extratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos Ex.: Em uma população de 300 alunos, há 180 meninos e 120 meninas. Extraia uma amostra representativa, de 10%, dessa população. Nesse exemplo, há uma característica que permite identificar 2 subconjuntos, a característica Sexo. Considerando essa divisão, vamos extrair a amostra da população. Sexo População Amostra Masc 180 18 Fem 120 12 Total 300 30 Estatística Inferencial Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. Valor esperado de � A média da variável aleatória de � é o valor esperado de�, ou seja, é a media de todas as médias possíveis para uma amostras de tamanho n de uma população. É importante saber que o valor esperado de � é igual ao valor da média da população ((). Assim, temos=> Não há dúvida de que uma amostra não representa perfeitamente uma população. Ou seja, a utilização de uma amostra implica na aceitação de uma margem de erro que denominaremos ERRO AMOSTRAL. Erro Amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias. Ocorrem erros não-amostrais quando: · Os dados amostrais são coletados, registrados ou analisados incorretamente. · Há uma utilização de um instrumento defeituoso durante a realização de mensurações. · Um questionário ou formulário possui questões formuladas de modo tendencioso. Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos limitar seu valor através da escolha de uma amostra de tamanho adequado. Obviamente, o ERRO AMOSTRAL e o TAMANHO DA AMOSTRA seguem sentidos contrários. Quanto maior o tamanho da amostra, menor o erro cometido e vice-versa. Erro Padrão Da Média Quando se obtém uma amostra aleatória de tamanho n, estima-se a média populacional. É bastante intuitivo supor que se uma nova amostra aleatória for realizada a estimativa obtida será diferente daquela primeira. Desta forma, reconhece-se que as médias amostrais estão sujeitas à variação e formam populações de médias amostrais, quando todas as possíveis amostras são retiradas de uma população. O erro padrão analisa a variabilidade de uma média. Desvio-padrão de �, também denominado erro-padrão da média. Caso N ( 30n, usar a fórmula de população infinita. População Infinita Quando o valor de N é desconhecido ou muito grande. Se N ( 30n usar Fator de Correção Finita (FCF) Desvio-padrão de , também denominado erro-padrão da média. População Finita - quando o valor de N é conhecido. AULA 08 _INTERVALO DE CONFIANÇA Para compreendermos a aplicação do Intervalo de Confiança, precisamos ter noções sobre a distribuição da curva normal. Distribuição Normal: Para compreendermos a aplicação do Intervalo de Confiança, precisamos ter noções sobre a Distribuição da Curva Normal. � � Intervalo De Confiança A média calculada para uma amostra dificilmente será igual à média (real) da população. É possível também, estabelecer um intervalo de confiança (IC) para a média da população. O intervalo de confiança da média representa os valores limites, inferior e superior, entre os quais se espera que a “verdadeira” média da população esteja localizada. Os intervalos de confiança mais utilizados são os de 90%, , 95% e 99%, seguindo a tabela abaixo: O intervalo de confiança mais comumente empregado é o de 95% (IC 95%), que indica que, para médias obtidas de diferentes amostras da mesma população, o IC calculado inclua a verdadeira média da população em 95% das vezes Os modelos de aplicação do Intervalo de Confiança são baseados na premissa de que a distribuição normal pode ser usada com os seguintes dados: sempre a amostra deve ser igual/superior a 30; quando for menor do que 30, o desvio padrão é conhecido. Unidades de Desvio Padrão a partir da Média Proporção Verificada 1,64 90% 1,96 95% 2,58 99% O intervalo de confiança é um conjunto de valores dentro do qual a média se situa, sendo que não se pode afirmar exatamente qual é este valor, ou seja, todos têm exatamente a mesma probabilidade de ocorrência. O intervalo de confiança da média é determinado pela equação: AULA 9- DISTRIBUIÇÃO NORMAL Denomina-se distribuição normal reduzida a distribuição normal de média zero e variância. As probabilidades associadas à distribuição normal reduzida são facilmente obtidas em tabelas. Daí o interesse em estudar esse tipo particular de distribuição. Veja os exemplos nas telas seguintes! A área total sob a curva normal vale 1. Isto significa que a probabilidade de ocorrer qualquer valor real é 1. A curva é simétrica em torno da média zero. Então a probabilidade de ocorrer valor maior do que zero é 0,5. Mas qual seria a probabilidade de ocorrer valor entre zero e z = 1,25, por exemplo? Essa probabilidade é encontrada na tabela de distribuição normal. Na primeira coluna da tabela, está o valor 1,2. Na primeira linha da tabela, está o valor 5. O número 1,2 compõe, com o algarismo 5, o número z = 1,25. No cruzamento da linha 1,2 com a coluna 5, está o número 0,3944. Esta é probabilidade de ocorrer valor entre zero e z = 1,25. Qual é a probabilidade de ocorrer valor maior do que z = 1,25? Como a probabilidade de ocorrer valor maior do que zero é 0,5 e a probabilidade de ocorrer valor entre zero e z = 1,25 é 0,3944, a probabilidade pedida é: 0,5 – 0,3944 = 0,1056 ou 10,56% Como transformar uma normal qualquer em uma normal reduzida Para transformar uma curva normal em uma curva normal reduzida, devemos calcular o z equivalente aos limites desejados utilizando a fórmula: x = ponto que se deseja converter em z μ = média da normal original σ = desvio padrão da normal original Ex: A idade de um grupo de 20 pessoas segue uma distribuição normal. A média de idade do grupo é de 60 anos e o desvio-padrão é igual a 4. Qual a probabilidade de existirem pessoas com idade menor que 60 anos? Qual a probabilidade de existirem pessoas com idade maior que60 anos? � AULA 10 _TESTE DE HIPOTESES Teste de Hipóteses é um método utilizado para observarmos se determinados dados são compatíveis ou não com alguma hipótese levantada. Este procedimento estatístico tem como base a observação de uma amostra, sendo a teoria de probabilidades utilizada para verificar o comportamento de parâmetros desconhecidos numa população. O Teste de Hipóteses pode ser feito através de duas formas: Testes paramétricos e Testes não paramétricos ou testes de associação livre O uso tanto dos testes paramétricos como dos não paramétricos está condicionado à dimensão da amostra e à respectiva distribuição da variável em estudo. Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão. Testes Não Paramétricos Envolvem casos em que não podemos supor características da população de onde a amostra foi extraída, como por exemplo, comportamento de distribuição normal. Conheça os principais testes não paramétricos. Os testes não paramétricos ou testes de distribuição livre, têm a mesma finalidade e se aplicam às mesmas situações que os testes paramétricos. Contudo, os testes de distribuição livre não se apoiam na hipótese de as populações que estão sendo analisadas possuam distribuição normal. Desta forma, são aplicáveis em uma gama muito maior de casos do que os testes paramétricos. Por outro lado, apesar dessa vantagem, a eficiência dos testes não paramétricos costuma ser menor, de forma que estes acabam sendo aplicados quando se mostra a inviabilidade da aplicação do correspondente teste paramétrico. Teste do Qui-Quadrado: utilizado na análise de frequências, no caso de análise de uma característica da amostra. Teste do Qui-Quadrado para Independência ou Associação: utilizado na análise de frequências, no caso de análise de duas características da amostra. Teste dos Sinais: utilizado em casos emparelhados, ou seja, submetido a duas medidas. Teste de Wilcoxon: Analisa os dados emparelhados considerando também as magnitudes encontradas. Teste de Mann Whitney: Analisa se dois grupos originam-se de populações com médias diferentes. Teste da Mediana: Análise de grupos que originam-se de populações com medianas diferentes. Teste de Kruskal-Wallis: Análise de grupos que originam-se de populações com médias diferentes. Testes Paramétricos Nos testes paramétricos, as hipóteses envolvem apenas parâmetros populacionais, como a média, a variância, uma proporção, etc. Além disso, em geral, estes testes comportam uma diversidade de suposições fortes a que o seu emprego deve subordinar-se de que são exemplo: as observações devem ser extraídas de populações com distribuição especificada; as variáveis em estudo devem ser medidas em escala intervalar, de modo a que seja possível utilizar operações aritméticas sobre os valores obtidos das amostras (adição, multiplicação, ...), etc. Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão. Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese alternativa H1. • Hipótese existente, ou hipótese a ser testada – H0, que sempre alega a igualdade de um determinado parâmetro. • Hipótese alternativa – H1, que sempre alega a desigualdade de um determinado parâmetro. TESTES DE HIPÓTESES Ho é chamada de hipótese nula e H1 de hipótese alternativa Em geral, a hipótese nula é feita com base no comportamento passado do produto/processo/serviços, enquanto a hipótese alternativa é formulada em função de alterações / inovações recentes. Por exemplo, podemos formular a hipótese que a produtividade é diferente de 2,5 peças/hora. Formalmente isso é escrito como: Ho é chamada de hipótese nula e H1 de hipótese alternativa Para a realização dos testes de hipóteses, temos que obedecer às seguintes etapas: Formulação do Teste de Hipótese: Hipótese Nula (H0) e Alternativa (H1). Escolha de Distribuição Normal Adequada. Selecionar o nível de significância e região crítica do teste. Estabelecer Regra de Decisão. Selecionar a amostra, calcular a Estatística de teste e interpretar seus resultados. Passo 1: Definição da Hipótese: é o estabelecimento das hipóteses: hipótese nula e hipótese alternativa Hipótese Nula (Ho): É um valor suposto para um parâmetro. Se os resultados da amostra não forem muito diferentes de Ho, ela não poderá ser rejeitada. Hipótese Alternativa (H1): É uma hipótese que contraria a hipótese nula, complementar de Ho, Essa hipótese somente será aceita se os resultados forem muito diferentes de Ho. Passo 2: Calcular a estatística do Teste: É o valor calculado a partir da amostra, que será usado na tomada de decisão. Uma maneira de tomar-se uma decisão é comparar o valor tabelado com a estatística do teste. Para o caso de testes de médias, a estatística do teste é a variável padronizada Z: Se α = 10%, uma área de 45% entre a média amostral e o limite inferior do intervalo e outra área de 45% entre a média amostral e o limite superior do intervalo, o que nos fornece uma área total (nível de confiança) de 90%, conforme demonstrado abaixo: Se α = 5%, teremos uma área de 47,5% entre a média amostral e o limite inferior do intervalo e outra área de 47,5% entre a média amostral e o limite superior do intervalo, o que nos fornece uma área total (nível de confiança) de 95%, conforme demonstrado abaixo: Se α = 1%, teremos uma área de 49,5% entre a média amostral e o limite inferior do intervalo e outra área de 49,5% entre a média amostral e o limite superior do intervalo, o que nos fornece uma área total (nível de confiança) de 99%, conforme demonstrado abaixo: Passo 3: Regra de Decisão Aceitar Ho, implica que a hipótese nula não pode ser rejeitada! Rejeitar Ho implica que temos evidências estatísticas para rejeitá-la. � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED PBrush ��� � EMBED PBrush ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� Qnq = Primeiro, segundo e terceiro quartil (i = 1,2 e 3) nq = nº do quartil que se quer X = elemento da série ordenada n = tamanho da amostra � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� � EMBED Equation.3 ��� _1443623668.unknown _1443624219.unknown _1443625455.unknown _1443640139.unknown _1443642225.unknown _1443642352.unknown _1443639924.unknown _1443624759.unknown _1443623822.unknown _1443623933.unknown _1443623792.unknown _1443620180.unknown _1443623654.unknown _1443618903.unknown _1443618115.unknown _1443618453.unknown _1443618429.unknown _1443616871.unknown _1443617066.unknown _1443616824.unknown
Compartilhar