Baixe o app para aproveitar ainda mais
Prévia do material em texto
0 ESTATÍSTICA (GES 101) AULAS TEÓRICAS Prof. Alex de Oliveira Ribeiro Departamento de Estatística - UFLA LAVRAS 2020 1 1- INTRODUÇÃO À ESTATÍSTICA 1.1- INTRODUÇÃO Ao praticar a atividade científica, o pesquisador se depara com situações onde ele deve analisar e entender um conjunto de dados referente ao seu objeto de estudo. Assim, ele terá que manipular os dados para obter informações, compará-las com outros resultados, ou ainda, julgar sua adequação a alguma teoria. A estatística surge então como uma ferramenta que auxilia o pesquisador neste trabalho, fornecendo metodologias adequadas de coleta, redução, análise e modelagem dos dados. Diante do exposto, podemos entender a estatística como a ciência que se ocupa com as técnicas de coleta, organização, análise e interpretação de dados, tendo um modelo por referência. 1.2- CONCEITOS BÁSICOS 1.2.1- POPULAÇÃO Entende-se por população ao conjunto de elementos que têm uma determinada característica em comum. Uma população pode ser finita quando esta possui um número limitado (ou enumerável) de indivíduos, ou infinita, quando não conseguimos enumerar os seus elementos, uma vez que temos um número ilimitado de indivíduos. Exemplos: Alunos matriculados na UFLA no 2º sem/2016 (POPULAÇÃO FINITA) Peças produzidas por lote (POPULAÇÃO FINITA) Plantas de uma espécie de Pinus (POPULAÇÃO INFINITA) Clientes potenciais de uma empresa (POPULAÇÃO INFINITA) Em complemento, quando coletamos informações de todos os elementos de uma população finita, dizemos que foi realizado um censo. Adotaremos, na disciplina, a notação N para representar a quantidade de elementos em uma população finita. 1.2.2- AMOSTRA Uma amostra corresponde a um subconjunto ou uma parte da população. A notação que representa o número de elementos de uma amostra é n. 2 Na verdade, a grande maioria dos trabalhos de pesquisa é realizado através de amostras. Alguns dos motivos que levam os pesquisadores a trabalharem com amostras são: uma população infinita só pode ser estudada através de amostras; as populações finitas muito grandes também devem ser estudadas por meio de amostras; redução de tempo e custo da pesquisa; o estudo cuidadoso de uma amostra tem mais valor científico do que o estudo sumário de toda a população. 1.2.3- VARIÁVEIS Quando realizamos um levantamento de dados, temos o interesse em conhecer ou avaliar uma determinada característica da população, como por exemplo, o peso, o diâmetro, o número de defeitos por peça, a produtividade de madeira de uma espécie de Pinus, a escolaridade dos indivíduos de uma comunidade, dentre outras. Essas características são chamadas de variáveis e visam descrever a população sob estudo. As variáveis podem ser classificadas em: a) Qualitativas: Correspondem a atributos ou categorias. Elas são subdivididas em nominais quando suas categorias não são passíveis de ordenação, e ordinais, no caso de existir uma ordenação natural para seus atributos. Exemplos: Sexo (Masculino, Feminino) – VQN Substâncias Químicas (Ácidos, Bases, Hidrocarbonetos, etc) - VQN Tipos de Linguagem de programação (Java, PHP, R, Delphi, MATLAB dentre outros) – VQN Escolaridade (Fundamental, Médio e Superior) – VQO Classe Social: (Alta, Média e Baixa) - VQO b) Quantitativas: Correspondem a números resultantes de contagens ou medidas. Quando se trata de contagens a variável é dita discreta (sendo representada por números inteiros não-negativos). No caso de medidas, a variável é classificada como contínua (sendo que seus valores podem ser representados por quaisquer números reais). Exemplos: Número de peças com defeito – VQD Temperatura – VQC Diâmetro de barras de aço – VQC 3 Esta classificação é extremamente importante na análise de dados, uma vez que, o tipo de variável a ser trabalhada é um ponto de partida para se determinar os métodos de análise mais apropriados ou mesmo válidos. 2- APRESENTAÇÃO DE DADOS 2.1- Introdução Em uma pesquisa, coletamos dados sobre a(s) variável(is) de interesse. Muitas vezes esses dados surgem de forma desordenada através do qual não conseguimos detectar, a primeira vista, um comportamento que mereça uma explicação plausível. Uma das formas de descrever o comportamento dos dados é organizá-los em tabelas ou gráficos. 2.2- Tabelas de Distribuição de Frequências Simples 2.2.1- Conceitos Básicos a) Frequência: Medida que quantifica a ocorrência dos valores de uma variável. Pode ser classificada em: absoluta (fa), relativa(fr) e percentual (fp). a.1) Frequência Absoluta: para variáveis qualitativas, nada mais é do que o número de observações ocorridas em cada classe da variável sob estudo. a.2) Frequência Relativa: é obtida pela divisão da frequência absoluta pelo número total de dados ou observações. a.3) Frequência Percentual: é calculada multiplicando-se o valor da frequência relativa por 100. 2.2.2- Construção de Tabelas de Distribuição de Frequências a) Variáveis Qualitativas Exemplo: Em 2006 a Associação Nacional de Comerciantes de Material de Construção (ANAMACO) solicitou uma pesquisa para determinar o perfil de produtos do setor da 4 construção civil com maior saída nas lojas. Foram visitadas 30 lojas e os produtos mais vendidos em cada uma estão no quadro abaixo. Tintas Tubos Cerâmica Cimento Cimento Argamassa Cimento Tubos Tintas Tubos Tintas Cerâmica Tubos Cerâmica Tintas Cimento Cimento Tintas Cimento Tintas Cimento Cerâmica Cimento Tubos Argamassa Cimento Cimento Tintas Cimento Cimento Obter: a) as frequências absolutas; b) as frequências relativas; c) as frequências percentuais; d) montar a tabela de distribuição de frequências. Solução: a) frequências absolutas (fa): cimento = 12 tintas = 7 tubos = 5 cerâmica = 4 argamassa = 2 b) frequências relativas (fr): 12 cimento = 0,40 30 7 int 0,23 30 t as 5 tubos = 0,17 30 4 cerâmicas = 0,13 30 2 argamassa = 0,07 30 c) frequências percentuais (fp): cimento = 0,40 100 40% int 0,23 100 23% t as tubos = 0,17 100 17% 5 cerâmica = 0,13 100 13% argamassa = 0,07 100 7% d) Tabela de distribuição de frequências: Tabela 1: Distribuição de frequências referente aos principais produtos comercializados em 30 lojas do setor de materiais de construção. Produtos fa fr fp(%) Cimento 12 0,40 40 Tintas 7 0,23 23 Tubos 5 0,17 17 Cerâmica 4 0,13 13 Argamassa 2 0,07 7 Totais 30 1,00 100 Fonte: Dados Fictícios. Para Variáveis Qualitativas Ordinais, a construção de uma tabela de distribuição de frequências segue o mesmo procedimento adotado para as Variáveis Qualitativas Nominais. Apenas deve-se dispor os atributos na ordem natural da variável. Exemplo. Os dados a seguir fazem parte de uma pesquisa sobre a possibilidade de recuperação de 20 caixas de transmissão automotivas classificadas como defeituosas num processo de controle de qualidade. Os defeitos foram classificados em três níveis: Leve: fácil de ser recuperada; Moderado: envolve troca de alguns componentes; Grave: sem recuperação. Grave Leve Leve Moderado Leve Moderado Leve Moderado Leve Grave Leve Leve Leve Leve Leve Moderado Grave Grave Moderado Moderado 6 Solução: Tabela 2: Distribuição de frequências referenteaos níveis de defeito de caixas de transmissão automotivas. Defeitos fa fr fp(%) Leves 10 0,50 50 Moderados 6 0,30 30 Graves 4 0,20 20 Totais 20 1,00 100 Fonte: Dados Fictícios. b) Variáveis Quantitativas Discretas Conjuntos de dados referentes a variáveis quantitativas, de um modo geral, podem ser descritos de duas maneiras: Distribuição de frequência; Medidas numéricas descritivas (média, variância, etc). O uso de medidas numéricas descritivas será assunto de capítulos futuros. Quanto às distribuições de frequência de uma variável quantitativa discreta, sua representação é bastante semelhante à das variáveis qualitativas, pois os valores inteiros que a variável assume podem ser considerados como “categorias” ou “classes naturais”. Exemplo: Durante o mês de setembro de 1995, o número de acidentes por dia em certo trecho da rodovia MG-53 apresentou o seguinte conjunto de dados: 2 0 1 2 3 1 5 1 0 0 1 2 2 1 2 0 1 4 2 3 0 1 0 2 1 2 4 1 1 1 Represente-o através de sua distribuição de frequência. Apresente fa, fr e fp. Tabela 3: Dist. de frequência do no de acidentes por dia em um trecho da rodovia 32 no mês de setembro de 1995. No de acidentes por dia fa fr fp(%) 0 6 0,20 20 1 11 0,37 37 2 8 0,26 26 3 ou mais 5 0,17 17 TOTAIS 30 1,00 100 Fonte: Dados fictícios. 7 C) Variáveis Quantitativas Contínuas A elaboração de uma tabela de distribuição de frequência para variáveis contínuas requer a apresentação de alguns conceitos: C.1) Amplitude Total: corresponde à diferença entre o maior valor e o menor valor de um conjunto de dados. Em geral, é simbolizada por “A”. C.2) Amplitude de Classe: Consiste na diferença entre o limite superior e o limite inferior de uma classe em uma distribuição de frequência. Será aqui simbolizada por “c” e calculada por: A c k 1 onde: k é o número de classe adotado. Algoritmo para a Construção de uma Distribuição de Frequência Relativa a uma Variável Quantitativa Contínua Passo 1: Escolha do número de classes (k) k n onde: n = número de observações. Passo 2: Calcula-se a amplitude total dos dados. A = MVO – mvo onde: MVO = maior valor observado. mvo = menor valor observado. Passo 3: Calcula-se a amplitude de classe c. A c k 1 Passo 4: O limite inferior LI1 da 1ª classe é obtido por: 8 1 c LI mvo 2 Passo 5: O limite superior da 1ª classe (LS1) é obtido por: 1 1 LS LI c Obs: O LS1 é o limite inferior da 2ª classe: LS1 = LI2. E assim, sucessivamente, as classes vão sendo construídas. Passo 6: Construídas as classes, são contados quantos dados estão contidos em cada classe (frequências absolutas de cada classe). Passo 7: Opcionalmente, são calculadas as frequências relativas e/ou percentuais de cada classe. Ex: Sabe-se que a viscosidade de óleos lubrificantes em motores de carros é um importante fator para a manutenção adequada do veículo. Os óleos mais usados são os chamados multiviscosos, sendo que os mais comuns são 20W40 e 20W50. Porém para motores com alta quilometragem sugere-se a utilização de óleo 25W60. Estes dois números representam a viscosidade em baixa e alta temperatura, respectivamente. Assim, para o controle de qualidade dessa característica (viscosidade) foi montado um experimento com 27 amostras desse último tipo de óleo, verificando sua viscosidade em alta temperatura (aproximadamente 100ºC). Os dados de cada amostra encontram-se no quadro a seguir: Tabela 4: Viscosidade (a 100ºC) de 27 amostras de óleo multiviscoso 25W60 submetidas ao controle de qualidade. 50,3 51,0 51,9 54,0 56,6 57,5 59,5 62,5 64,5 50,5 51,1 52,7 56,0 57,0 57,9 60,7 62,7 65,9 50,8 51,7 53,1 56,5 57,2 58,8 60,9 63,0 68,3 Montar a tabela de distribuição de frequências simples. OBS: É bom que os dados estejam ordenados. 1o passo: no de classes (K) nK 2o passo: Amplitude total, A=MVO-mvo 9 3o passo:Amplitude de classe, c=A/(K-1) 4opasso:LI1 = mvo-(c/2) 5o passo: calcular os demais limites inferior e superior. 6o passo: calcular fa, fr ou fp. 2.2.3- Frequências Acumuladas No caso de variáveis contínuas a distribuição de frequência pode ainda ser apresentada de maneira que as frequências passem por uma acumulação sucessiva. 10 2.3 – Representação gráfica 2.3.1- Gráfico de Barras Usado para descrever o comportamento de variáveis qualitativas (categóricas) e também para descrever variáveis quantitativas discretas. Figura 1: Gráfico de barras verticais dos veículos hath médios mais vendidos em 2013. Figura 2: Gráfico de barras verticais dos veículos hath médios mais vendidos em 2013. 11 Figura 3: Gráfico de barras horizontais do nível de atendimento de recepcionistas de uma construtora. Figura 4: Gráfico de barras verticais do número de pessoas do grupo familiar observadas em uma amostra de 300 famílias de um determinado município. 12 2.3.2- Gráfico de Setores O gráfico de setores ou gráfico de pizza é um gráfico circular dividido em vários setores (fatias) que representam cada classe da variável qualitativa. Figura 5: Gráfico de setores para a distribuição de torcedores de times de futebol mineiros observados em uma amostra de 300 indivíduos. 13 2.3.3- Histograma É um gráfico de barras verticais (unidas), usado para representar a distribuição de frequências de uma variável quantitativa contínua. Figura 6: Histograma para a distribuição de frequências da resistência (MPa) de 80 corpos de prova de concreto. 2.3.4- Polígono de frequências É um gráfico de linhas, utilizado para representar a distribuição de frequências de uma variável quantitativa contínua. Figura 7: Polígono de frequências para a distribuição da resistência (MPa) de 80 corpos de prova de concreto. 14 É bastante comum representar o polígono de frequências no mesmo gráfico do histograma. Deve-se lembrar apenas que como o polígono é formado pelos pontos médios de cada classe, esses pontos que “amarram” o polígono em cima de cada barra representam, no eixo horizontal do gráfico, os pontos médios de cada intervalo de classe. Figura 8: Distribuição da resistência (MPa) de 80 corpos de prova de concreto. A figura 8 mostra uma distribuição simétrica, já a figura 9 é assimétrica. Figura 9: Distribuição do tempo de vida (horas) de 300 lâmpadas. 15 3- MEDIDAS DE POSIÇÃO 3.1- INTRODUÇÃO As medidas de posição visam sintetizar em um único número o conjunto de dados. Estas podem ser divididas em medidas de tendência central e separatrizes. As mais utilizadas na área de saúde são: a média, a mediana e a moda. 3.2- MÉDIA ARITMÉTICA A média aritmética, representada por x é obtida a partir da soma de todos os dados de um conjunto 1 n i i X , dividida pela sua quantidade n. Ou seja: 1 n i i X x n Para exemplificar o cálculo da média aritmética, vamos utilizar os seguintes pesos, em kg, de 10 recém-nascidos: 3,2 2,8 3,2 2,1 2,9 3,1 3,2 3,0 3,5 4,0 1 3,2 2,8 3,2 2,1 2,9 ... 4,0 31 3,1 10 10 n i i X x kg n Assim, o peso médio desses recém-nascidos é de 3,1 kg. 3.2.1- MÉDIA A PARTIR DE UMA TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS Quanto os dados encontram-se agrupados em uma tabela de distribuição de freqüências simples, a média aritmética é calculada utilizando-se a seguinte expressão: k i i i 1 fa pm x n ou k i i i 1 x fr pm 16 onde: fai : frequência absoluta da classe i; pmi : ponto médio da classe i; n : tamanho daamostra. fri : frequência relativa da classe i. Lembrando que: i i i LI LS pm 2 EXEMPLO: Considerando a variável Salário dos empregados da seção de orçamentos da Companhia MB, temos os seguintes dados: Tabela 3.1: Distribuição de Frequências dos 36 empregados da seção de orçamentos da Companhia MB, por faixas de salário Faixa de Renda (Salários Mínimos) fa fr pm [ 04; 08 ) 10 0,278 [ 08; 12 ) 12 [ 12; 16 ) 8 0,222 [ 16; 20 ) 5 [ 20; 24 ) 1 0,028 Totais 36 1,000 a) Complete a tabela. b) Calcule a renda média desses empregados. 17 3.2.2- PROPRIEDADES i) Adicionando-se uma constante k a todas as observações de um conjunto de dados, a nova média será a média original desses dados adicionada à constante k. Me(X k) Me(X) k ii) Multiplicando-se uma constante k a todas as observações de um conjunto de dados, a nova média será a média original desses dados multiplicada pela constante k. Me(X k) Me(X) k iii) A soma dos desvios de cada observação em relação à média é sempre igual a zero. n i i 1 x x 0 3.3- MÉDIA PONDERADA Existem outros processos de obtenção de médias para um conjunto de dados. Um deles consiste no cálculo da média ponderada que é largamente utilizada no âmbito escolar. Um exemplo de sua aplicação é verificado no cálculo da média de um conjunto de notas onde foi atribuído um peso específico para cada uma dessas notas. Em tal situação, a média ponderada pX é dada por: 1 1 n i i i p n i i p X X p Em que: ip - Peso atribuído a nota de índice i. iX - i-ésima nota. 18 3.4- MEDIANA (Md) Trata-se do valor que, no conjunto de dados ordenados, é precedido e seguido pelo mesmo número de observações. Exemplo: Encontre a mediana dos dados a seguir: 3 4 6 8 9 10 37 Md(x) = 8 Quando o número de observações é par, a mediana é definida como a média aritmética dos dois valores centrais. Exemplo: Encontre a mediana dos dados abaixo: 3 7 8 10 12 25 Md(x) = 8 10 2 = 9 OBS: Se os dados estiverem agrupados em uma tabela de distribuição de frequências, a mediana será calculada através dos seguintes passos: Passo 1: Divide-se o total de observações por dois. Acumula-se a frequência absoluta, até que este acúmulo ultrapasse a metade dos dados. Esta será a classe que contém a mediana. Passo 2: A mediana é calculada nesta classe através da seguinte expressão: Anterior Md Md Md (n / 2) Fa Md(x) LI c fa 19 EXEMPLO: Considerando a variável Salário dos empregados da seção de orçamentos da Companhia MB, temos os seguintes dados: Tabela 3.2: Distribuição de Frequências dos 36 empregados da seção de orçamentos da Companhia MB, por faixas de salário Faixa de Renda (Salários Mínimos) fa fr [ 04; 08 ) 10 0,278 [ 08; 12 ) 12 0,333 [ 12; 16 ) 8 0,222 [ 16; 20 ) 5 0,139 [ 20; 24 ) 1 0,028 Totais 36 1,000 Calcule a mediana desses dados. PROPRIEDADES: 20 3.5- MODA (Mo) Trata-se de uma medida que indica o valor ou a gama de valores nos quais a concentração dos dados amostrais ou populacionais é máxima. Se os dados forem considerados realizações de uma variável discreta, a moda é o valor dos dados que ocorre com maior freqüência. Exemplo: Obtenha a moda do conjunto de dados abaixo: 1 2 2 2 3 4 5 A moda corresponde ao valor 2, pois é o mais frequente. Mo(x) = 2 OBS: Para variáveis contínuas a moda é definida como o valor que possui maior densidade de frequência na tabela de distribuição de frequências. Seu cálculo segue os seguintes passos: Passo 1: Selecionar a classe que contém maior freqüência. Esta será a classe que contém o valor da moda. Passo 2: Calcular a moda nesta classe através da seguinte expressão: 1 ( ) 1 2 Mo MoMo X LI c onde: Mo Anterior 1 dfa dfa e Mo Posterior 2 dfa dfa Mo LI : Limite inferior da classe que contém a moda. Mo c : Amplitude da classe que contém a moda. 21 EXEMPLO: Considerando a variável Salário dos empregados da seção de orçamentos da Companhia MB, temos os seguintes dados: Tabela 3.3: Distribuição de Frequências dos 36 empregados da seção de orçamentos da Companhia MB, por faixas de salário Faixa de Renda (Salários Mínimos) fa fr dfa [ 04; 08 ) 10 0,278 2,5 [ 08; 12 ) 12 0,333 [ 12; 16 ) 8 0,222 [ 16; 20 ) 5 0,139 [ 20; 24 ) 1 0,028 Totais 36 1,000 - a) Completar a tabela acima. b) Calcule a moda desses dados. PROPRIEDADES: 22 4- MEDIDAS DE DISPERSÃO Para entender o que é dispersão, imagine que quatro alunos obtiveram, em cinco provas, as notas apresentadas na Tabela 4.1. Tabela 4.1 – Notas de quatro alunos em cinco provas. Aluno Notas Média Antônio 5 5 5 5 5 5 João 6 4 5 4 6 5 José 10 5 5 5 0 5 Pedro 10 10 5 0 0 5 Todos os alunos obtiveram média igual a 5, mas a dispersão das notas em torno da média não é a mesma para todos os alunos. A Tabela 4.1 mostra claramente que: a) As notas de Antônio não variaram (a dispersão é nula). b) As notas de João variaram menos do que as notas de José (a dispersão das notas de João é menor do que a dispersão das notas de José). c) As notas de Pedro variaram mais do que as notas de todos os outros (a dispersão das notas de Pedro é maior). Estas observações serão verificadas através das seguintes medidas de dispersão: amplitude, variância e desvio padrão. 4.1- AMPLITUDE Por definição, amplitude é a diferença entre o maior e o menor dado observado. É fácil calcular a amplitude para os dados apresentados na Tabela 4.1. As notas de Antônio têm amplitude: A = 5 - 5 = 0, as notas de João têm amplitude: A = 6 - 4 = 2, as de José têm amplitude: 23 A = 10 - 0 = 10, e as notas de Pedro têm amplitude: A = 10 - 0 = 10. A amplitude nem sempre capta certas diferenças. No caso das notas dos alunos, a amplitude mostra, acertadamente, que as notas de Antônio não variaram ( a = 0) e que as notas de João variaram menos do que as notas de José ( a = 2, no primeiro caso, e a = 10, no segundo). Entretanto a amplitude não mostra que as notas de Pedro variaram mais do que as notas de José ( a = 10, nos dois casos). A amplitude não mede bem a dispersão dos dados porque, em seu cálculo, usam-se apenas os valores extremos – e não todos os dados. De qualquer forma, a amplitude é muito usada, principalmente porque é fácil de calcular e fácil de interpretar. 4.2- VARIÂNCIA Os dados distribuem-se em torno da média. Então o grau de dispersão de um conjunto de dados pode ser medido pelos desvios em relação à média. A variância é definida como a soma dos quadrados dos desvios, dividida pelo tamanho da amostra menos 1 (n – 1). Os estatísticos chamam o valor (n – 1) de graus de liberdade. Portanto, a variância, que é indicada por s2, é dada pela fórmula: 2 2 ( ) 1 x x s n Desenvolvendo algebricamente a fórmula da variância, obtém-se: 2 2 2 ( ) 1 x x ns n Embora esta fórmula pareça, à primeira vista, difícil, ela na verdade facilita o trabalho de cálculo. Para conferir esta informação, calcule a variância dos dados 0, 4, 6, 8 e 7, usando esta fórmula. Os cálculos intermediários estão apresentados na Tabela 4.2. 24 Tabela 4.2 – Cálculos intermediários para obtenção da variância. x 2x 0 0 4 16 6 36 8 64 7 49 25x 2 165x Agora é fácil obter: 2 2 25 165 5 10,0 4 s Para entender que a variância mede a dispersão dos dados em torno da média, convém observar novamente as notas apresentadas na Tabela 4.1 e verificar que as variâncias são os valores dados na Tabela 4.3. Veja que a variância mede a dispersão porque: a) Para as notas de Antônio, que não variaram 2 0s . b) Para as notas de João, que variaram menos do que as notas de José, 2 1s , menor do que a variância das notas de José, que é 2 12,5s . c) Para as notas de Pedro, que variaram mais do que todas as outras, a variância é 2 25s , maior do que todas as outras variâncias. Tabela 4.3 – Média e variância das notas de 4 alunos em 5 provas. Aluno Notas Média Variância Antônio 5 5 5 5 5 5 0 João 6 4 5 4 6 5 1 José 10 5 5 5 0 5 12,5 Pedro 10 10 5 0 0 5 25 25 4.3- DESVIO PADRÃO Como medida de dispersão, a variância tem a desvantagem de apresentar a unidade de medida igual ao quadrado da unidade de medida dos dados. Por exemplo, se os dados estão em metros, a variância fica em metros ao quadrado. Mas existe uma medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de medida dos dados. É o desvio padrão, definido como a raiz quadrada da variância, com sinal positivo. O desvio padrão é representado por s. Para as notas do aluno José, cuja variância já foi calculada, tem-se o desvio padrão: 12,5 3,54s . 4.4- COEFICIENTE DE VARIAÇÃO O coeficiente de variação é a razão entre o desvio padrão e a média. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem. Então: CV = .100 s x . Para entender como se interpreta o coeficiente de variação, imagine dois grupos de pessoas. No primeiro grupo, as pessoas têm idades 3, 1 e 5 e no segundo grupo as pessoas têm idades 55, 57 e 53. No primeiro grupo, a média de idade é 3 anos e, no segundo grupo, a média de idade é 55 anos. Nos dois grupos a dispersão dos dados é a mesma. Ambos têm variância 2 4s . Mas as diferenças de dois anos são muito mais importantes no primeiro grupo, que tem média 3, do que no segundo grupo, que tem média 55. Agora, veja os coeficientes de variação. 2 CV = .100 66,67% 3 e no segundo grupo, o coeficiente de variação é: 2 CV = .100 3,64% 55 . 26 4.5- BOXPLOT Constitui uma representação gráfica usada para descrever algumas características do conjunto de dados. Essas características são: I) Centro (Mediana); II) Dispersão (diferença interquartílica e amplitude); III) Simetria; IV) Valores extremos (outliers). A utilização da mediana e da diferença interquartílica visão evitar o efeito dos outliers nos valores da média e do desvio padrão. EXEMPLO: Considere as notas de duas turmas A e B na disciplina de estatística. Turma A 20 25 30 40 45 50 60 70 75 80 84 85 88 90 90 93 94 95 95 98 Turma B 50 52 52 53 54 56 60 60 61 62 62 65 66 67 68 70 71 72 72 99 27 Medidas descritivas TURMAS Média 1º quartil Mediana 3º quartil DP Mín. Máx. A 70,35 48,75 82,00 90,75 26,11 20,00 98,00 B 63,60 55,50 62,00 68,50 10,96 50,00 99,00 28 5- TÉCNICAS DE AMOSTRAGEM 5.1- INTRODUÇÃO Uma amostra deve descrever, indiretamente, a população sob estudo. Para que os dados fornecidos por uma amostra sejam confiáveis é necessário que esta seja coletada de forma a conservar as características da população em seus elementos, ou seja, uma amostra deve ser representativa. Em nosso curso, estudaremos algumas técnicas de amostragem denominadas probabilísticas. Essas técnicas são: Amostragem Aleatória Simples Amostragem Aleatória Estratificada Amostragem Aleatória por Conglomerados Amostragem Sistemática 5.2- AMOSTRAGEM ALEATÓRIA SIMPLES (AAS) Neste tipo de amostragem todos os elementos da população têm igual probabilidade de pertencer à amostra e todas as possíveis amostras têm também igual probabilidade de ocorrer. Se considerarmos uma população com N elementos e desta coletarmos amostras com n elementos, o número total de amostras diferentes, sem reposição dos elementos, será: , ! ( )! ! N n N C N n n . Caso haja reposição dos elementos teremos nN amostras diferentes. Na prática, a coleta dos elementos no processo de AAS, pode ser feito através de várias técnicas que garantam o caráter aleatório da amostra. Pode-se por exemplo, identificar os N elementos da população com números naturais, escrevê-los em pedaços de papel, colocá-los em uma caixa e sorteá-los. Pode-se ainda realizar este sorteio por meio de tabelas de números aleatórios ou funções randômicas na calculadora ou computador. EXEMPLOS: 1) Coletar uma amostra, sem reposição, de 5 elementos a partir de uma população com 10 elementos. Utilizar a tabela de números aleatórios a seguir: 349 004 079 908 215 407 721 564 308 200 558 492 866 518 259 964 125 007 451 390 715 744 612 139 210 865 853 941 323 500 29 Quantas amostras diferentes poderiam ser obtidas nesta situação? 2) Usando a tabela anterior coletar uma amostra de 12 elementos a partir de uma população com N = 80 (sem reposição). 5.3- AMOSTRAGEM ALEATÓRIA ESTRATIFICADA (AAE) Em muitas situações, a população de interesse encontra-se dividida em subpopulações ou estratos. Nestes casos a variável de interesse tem uma distribuição aproximadamente homogênea dentro de cada estrato e heterogênea entre os estratos. A amostragem estratificada consiste em especificar quantos elementos da amostra serão retirados em cada estrato. Dentre os critérios existentes para esse fim, o mais utilizado é o proporcional, onde se aplica a expressão abaixo: i i N n n N em que: in é o tamanho da amostra no estrato i; iN é o tamanho da população no estrato i; e N n correspondem ao tamanho total da população e da amostra, respectivamente. Um exemplo prático pode ser citado através das classes socioeconômicas em que a população se divide (A, B, C, D, E), sendo que o comportamento “financeiro” dos indivíduos de uma mesma classe é semelhante, porém entre classes distintas esse comportamento se difere com bastante relevância. Considere então que de uma população com 3000 habitantes desejamos coletar uma amostra de 150 indivíduos. A distribuição dessa população encontra-se na tabela abaixo: Classes A B C D E iN 135 575 1245 735 310 A) Realizar uma AAE nesta situação. b) Qual seria o problema que poderíamos ter ao realizar uma AAS para este exemplo? 5.4- AMOSTRAGEM ALEATÓRIA POR CONGLOMERADOS (AAC) Consiste no processo de subdivisão da população em componentes de mesmas características com o objetivo de facilitar o processo de coleta dos elementos da amostra. Assim, um conglomerado em relação ao outro deve ter características mais 30 semelhantes possíveis (homogêneos) e dentro de cada conglomerado as características devem ser heterogêneas. Na AAC cada unidade de amostragem é um conglomerado e não um indivíduo da população. Assim o sorteio é realizado sobre os conglomerados. Como exemplo, consideremos um bairro que possui 300 residências e nestas, existe em média 5 moradores por domicílio. Se desejamos tomar uma amostra total de 150 moradores do bairro, podemos dividir este bairro em quarteirões de aproximadamente 10 casas cada um e sortearmos 3 deles. Então teremos: 3 (quarteirões) x 10 (residências) x 5 (pessoas) = 150 pessoas 5.5- AMOSTRAGEM SISTEMÁTICA (AS) Por esse sistema os elementos da população devem se encontrar ordenados. A coleta dos elementos da amostra se dá através de intervalos, sendo estes intervalos determinados através do cálculo dos chamados passos ou intervalos de amostragem, dado por: N K n (onde N é o tamanho da população e n é o tamanho da amostra). O processo consiste em sortear o primeiro elemento da amostra dentreos K primeiros elementos da população. A partir deste sorteio os próximos elementos da amostra são retirados saltando-se K elementos a partir do primeiro, segundo, terceiro, e assim sucessivamente, até completar o tamanho da amostra. Se N = 12 e n = 4, teremos um K = 3 e os elementos da amostra poderiam ser: A = { B, E, H, K} A B C D E F G H I J K L OBS: A principal vantagem da AS é facilitar o processo de coleta dos elementos da amostra, porém deve-se tomar o cuidado de verificar se o valor do K não coincide com ciclos de variação já existentes na população, pois se isto ocorrer a amostra não será representativa da população sob estudo. EXEMPLO: Um lote de 500 peças (enumeradas de 1 a 500) deve ser inspecionado durante sua produção. As peças que irão compor a amostra serão coletadas na linha de produção. Selecionar por meio de uma AS uma amostra de 20 peças. 31 6- NOÇÕES SOBRE PROBABILIDADES 6.1 – Conceitos Básicos a) Probabilidade É a frequência relativa associada a uma variável descritora de uma população infinita. b) Espaço Amostral É o conjunto de todos os resultados possíveis de um experimento, sendo geralmente, simbolizado pelas letras S ou Ω. c) Evento Um evento é um subconjunto do espaço amostral e representa um conjunto de resultados de interesse do pesquisador. Geralmente é representado por letras latinas. d) Cálculo de Probabilidades Como as probabilidades são freqüências relativas, a probabilidade de um evento A ocorrer é a divisão do número de elementos deste evento pelo número total de elementos do espaço amostral. ( ) ( ) ( ) n A P A n S Exemplos: 1) Consideremos o lançamento de um dado comum. Trata-se de um experimento aleatório. Calcular: a) a probabilidade de ocorrer face igual a 5. b) a probabilidade de ocorrer face ímpar. 2) Considere agora o lançamento de dois dados. Calcular: a) a probabilidade ocorrerem faces iguais. b) a probabilidade de ocorrerem soma das faces igual a 10. c) a probabilidade de ocorrerem soma das faces maior ou igual a 9. 32 6.2 – Axiomas e Teoremas Axiomas de Kolmogorov (1939). i) ( ) 0P A , para qualquer evento A, pertencente a um espaço amostral S. ii) ( ) 1P S , onde S é o espaço amostral. iii) ( ) ( ) ( )P A B P A P B , se A e B forem mutuamente exclusivos. Alguns Teoremas: iv) ( ) ( ) ( ) ( )P A B P A P B P A B , para A e B dois eventos quaisquer. v) ( ) 1 ( ) CP A P A , para o complemento de A. EXEMPLO: Uma urna contém bolas enumeradas de 1 a 15. Determine a probabilidade de se retirar uma bola desta urna ao acaso e esta ser representada por: a) um número par; b) um número ímpar; c) um número par e múltiplo de 3; d) um número par ou múltiplo de 3. 33 6.3- Probabilidade Condicional A probabilidade condicional é utilizada quando o valor da probabilidade de ocorrência de um determinado evento A, depende da ocorrência de um outro evento B. Assim, a expressão usada para o cálculo de uma probabilidade condicional é: ( ) ( ) ( ) P A B P A B P B EXEMPLO: Um grupo de pessoas foi classificado quanto ao peso e a pressão arterial. Os dados encontram-se na tabela a seguir. Pressão Arterial Peso Totais Excesso Normal Baixo Elevada 20 16 4 40 Normal 30 90 40 160 Totais 50 106 44 200 Determina a probabilidade de uma pessoa, escolhida ao acaso neste grupo, apresentar: a) pressão elevada; b) pressão elevada e peso em excesso; c) sabendo-se que a pessoa escolhida tem excesso de peso, determine a probabilidade desta pessoa apresentar também pressão arterial elevada. d) sabendo-se que a pessoa escolhida tem peso normal, determine a probabilidade desta pessoa apresentar também pressão arterial elevada. 34 6.4- Eventos Independentes Dois eventos A e B são ditos independentes se, e somente se: ( ) ( ) ( ) P A B P A P B 6.5- Teorema de Bayes a) Teorema da Probabilidade Total Sejam A1, A2,..., An eventos que formam uma partição do espaço amostral S. Seja B um evento desse espaço. S B A1 A2 A3 A4 Então: 1 1 ( ) ( ). ( ) n n i i i i i P B A B P A P B A 35 b) Teorema de Bayes Sejam A1, A2,..., An eventos que formam uma partição do espaço amostral S. Seja B S . Considere conhecidas ( )iP A e ( )iP B A , com i = 1, 2, ..., n. Então: 1 ( ). ( ) ( ) , 1,... . ( ). ( ) j j j n i i i P A P B A P A B j n P A P B A EXEMPLO: Um certo programa pode ser usado com uma entre duas sub-rotinas A e B, dependendo do problema. A experiência tem mostrado que a sub-rotina A é usada 40% das vezes e B é usada 60% das vezes. Se A é usada, existe 55% de chance de que o programa chegue a um resultado dentro do limite de tempo. Se B é usada, a chance é de 70%. Considere que em um teste, o programa gerou o resultado dentro do limite de tempo. Qual a probabilidade de que a sub-rotina A tenha sido escolhida? 36 7- DISTRIBUIÇÕES DE PROBABILIDADE 7.1- VARIÁVEIS ALEATÓRIAS 7.1.1- Conceito Considere que um casal deseja ter três filhos. O espaço amostral correspondente ao sexo desses filhos é: S = {(M, M, M), (F, F, F), (M, F, F), (F, M, F), (F, F, M), (F, M, M), (M, F, M), (M, M, F)} Podemos organizar os eventos desse espaço amostral de acordo com a quantidade X de mulheres (sexo feminino - F). EVENTOS CORRESPONDENTES X P(X) A1 = {(M, M, M)} 0 P(X=0) = 1/8 A2 = {(F, M, M), (M, F, M), (M, M, F)} 1 P(X=1) = 3/8 A3 = {(M, F, F), (F, M, F), (F, F, M)} 2 P(X=2) = 3/8 A4 = {(F, F, F)} 3 P(X=3) = 1/8 Observe que para cada evento Ai, associamos um valor de X, de acordo com o número de mulheres em cada um dos resultados do evento. E, cada valor de X está associado a um valor de probabilidade P(X). Portanto, podemos dizer que X é uma variável aleatória, pois para cada evento de interesse, associamos um valor correspondente X. Ainda, cada valor associado ao evento também está associado a uma probabilidade de ocorrência. Então, uma variável aleatória é uma função que associa a todo evento pertencente a uma partição do espaço amostral um único número real. OBS: 37 7.1.2- Função de Probabilidade É a função que associa a cada valor assumido pela variável aleatória a probabilidade do evento correspondente. Deve obedecer as seguintes condições: I) ( ) 0;P X x II) ( ) 1.i i P X x Vários autores denominam a função de probabilidade como distribuição de probabilidade de uma variável aleatória discreta X. 7.2- DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS DISCRETAS 7.2.1 - DISTRIBUIÇÃO DE BERNOULLI Originam-se de experimentos que admitem apenas dois resultados. Exemplos: 1) Uma peça é classificada como boa ou defeituosa; 2) Um entrevistado concorda ou não com a afirmação feita; 3) O resultado de um exame médico para detecção de uma doença é positivo ou negativo; 4) No lançamento de um dado ocorre ou não a face 5. Situações com alternativas dicotômicas (duas respostas) podem ser representadas genericamente por respostas do tipo sucesso-fracasso. Esses experimentos recebem o nome de ensaio de Bernoulli e originam uma v.a. com distribuição Bernoulli. Variável Aleatória de Bernoulli É uma v.a. X que assume apenas dois valores: 1 se ocorrer sucesso, e 0 se ocorrer fracasso, e, sendo p a probabilidade de sucesso, 0 < p < 1.Denotamos por X ~ Bernoulli (p) uma v. a. com distribuição de Bernoulli com parâmetro p. 38 0, se ocorrer "fracasso" X 1, se ocorrer "sucesso" Repetições independentes de um ensaio de Bernoulli dão origem ao modelo binomial. 7.2.2- DISTRIBUIÇÃO BINOMIAL Um Experimento Binomial é aquele que: (a) que consiste em n ensaios de Bernoulli; (b) os ensaios são independentes; e (c) para o qual a probabilidade de sucesso em cada ensaio é sempre igual a p, 0 < p < 1. A v.a. X, correspondente ao número de sucessos num experimento binomial, tem distribuição binomial com parâmetros n e p, com função de probabilidade dada por: x n x n P(X x) .p .(1 p) , X 0,1,2,..., n x onde: n n! e n! n.(n 1).(n 2).....2.1 x x!(n x)! Notação: X ~ B(n; p). Média e Variância da Binomial A Média e a Variância são dadas, respectivamente, por: E(X) = n.p e Var(X) = n.p.(1-p) 39 Exemplo: Suponha que 20% dos clientes de uma empresa sejam inadimplentes. Se 10 pessoas dessa população forem escolhidas ao acaso, determine: (a) O nº esperado de inadimplentes. (b) A probabilidade de selecionar exatamente 3 pessoas inadimplentes. (c) A probabilidade de selecionar no máximo 3 inadimplentes. 7.2.3- DISTRIBUIÇÃO DE POISSON A distribuição de Poisson é empregada em experimentos nos quais não se está interessado no número de sucessos obtido em n tentativas, como ocorre no caso da distribuição binomial, mas sim no número de sucessos ocorridos durante um intervalo contínuo, que pode ser um intervalo de tempo, espaço, etc. Alguns exemplos de variáveis que podem ter a distribuição de Poisson são: (a) número de defeitos por centímetro quadrado; (b) n° de clientes por hora; (c) n° de chamadas telefônicas recebidas por minuto; (d) n° de falhas de um programa de computador num dia de operação. Note-se que a unidade de medida (tempo, área) é contínua, mas a variável aleatória de interesse (número de ocorrência) é discreta. 40 As probabilidades, calculadas agora para todos os números inteiros não negativos k = 0, 1, 2, ... são dadas da seguinte forma: xe . P(X x) , x 0,1,2,.... x! onde “X = números de sucessos em um intervalo” é a variável de interesse, λ > 0 é o número médio de sucessos da variável X e, “e” é a constante 2,7183 (base dos logaritmos naturais). Notação: X ~ P(x, λ) Esperança e Variância: E (X) = Var (X) = λ EXEMPLO: Um departamento de conserto de máquinas recebe uma média de cinco chamadas por hora. Supondo que a distribuição de Poisson seja adequada nessa situação, obter a probabilidade de que, em uma hora selecionada aleatoriamente, sejam recebidas: a) três chamadas; b) até três chamadas. 41 7.2.4- OUTRAS DISTRIBUIÇÕES DISCRETAS a) Distribuição Geométrica xP(X x) p.(1 p) , X 1,2,... parâmetro : p b) Distribuição Hipergeométrica r N r n xx P(X x) , X 0,1,2,... parâmetros : N, r, n N n onde: r é o número de elementos de N com uma característica de interesse e x é o número de elementos com a característica de interesse na amostra de n elementos tomada. 42 7.3- DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS 7.3.1- DEFINIÇÕES a) Função Densidade de Probabilidade (f.d.p) Para variáveis aleatórias contínuas não faz sentido associarmos valores de probabilidade P(X) a valores pontuais de X, como ocorre para variáveis aleatórias discretas, pois todas essas probabilidades em uma variável aleatória contínua têm valores tão pequenos que podemos considerá-los nulos. Assim, o cálculo de probabilidades para esse tipo de variável aleatória é feito através de intervalos de X, como P(x1 < X < x2). Isso resulta em um tipo de função diferente, que denominamos por função densidade de probabilidade. As condições que essa função deve seguir, são: I) ( ) 1;f x dx II) 2 1 1 2 1 2( ) ( ) , para quaisquer e . x x P x X x f x dx x x b) Função de Distribuição Acumulada Independente da variável aleatória ser discreta ou contínua, se quisermos obter probabilidades de que a variável em questão esteja abaixo de um determinado valor, podemos aplicar a função de distribuição acumulada ou simplesmente função de distribuição. Sua definição é: I) 1 ( ) ( ) , para v. a. discretas. k k i i F x P X x II) ( ) ( ) , para v.a. contínuas. x F x f x dx 7.3.2- DISTRIBUIÇÃO UNIFORME CONTÍNUA Uma variável aleatória contínua X tem distribuição uniforme no intervalo , se sua f.d.p. é dada por: 43 1 , se , ( ; , )= 0 , caso contrário. x f x A esperança e a variância dessa distribuição são: ( ) 2 E X e 2 ( ) . 12 Var X Uma das principais aplicações da distribuição uniforme consiste na geração de números aleatórios, de 0 a 1, implementados na maioria das linguagens de programação, planilhas e softwares estatísticos. Esses números são chamados de pseudo-aleatórios, pois é possível repetir uma mesma sequência de números gerados, a partir da mesma semente. 7.3.3- DISTRIBUIÇÃO EXPONENCIAL Uma variável aleatória contínua X tem distribuição exponencial de probabilidade se a sua f.d.p. é dada por: , 0 ; ( ; )= 0 , caso contrário. xe x f x A esperança e a variância dessa distribuição, com parâmetro α, são: 1 ( )E X e 2 1 ( ) .Var X A distribuição exponencial é muita usada para modelar situações em que a ocorrência de uma variável tende a se tornar menos provável à medida que a variável sob estudo aumenta. Assim, pode-se verificar sua aplicação em estudos do tempo de vida útil de equipamentos, tempos de falha e tempo de sobrevivência de espécies. 44 EXEMPLO: Uma empresa que produz processadores de computador determinou que a vida média de um dos seus processadores é de 8.000 horas. Sabendo-se que este tempo segue uma distribuição exponencial, qual a probabilidade de que essa empresa tenha que substituir um processador gratuitamente, se ela oferecer uma garantia de: a) 4.000 horas? b) 2.000 horas? 7.3.4- DISTRIBUIÇÃO NORMAL A distribuição Normal é uma das mais importantes distribuições contínuas de probabilidade. Foi introduzida em 1730 por D´Moivre e depois foi muito utilizada em Astronomia pelo alemão físico/matemático Gauss, trazendo muita confusão para várias pessoas que por esse motivo, acham que foi Gauss que a descobriu. Muitos dos fenômenos aleatórios de interesse comportam-se próximos a essa distribuição com valores muito freqüentes em torno da média e diminuindo a freqüência à medida que nos afastamos da média. Algumas variáveis que seguem este tipo de distribuição são: peso, altura, diâmetro, dentre outras. Ainda que as próprias variáveis individuais não sejam normalmente distribuídas, as somas e as médias das variáveis terão uma distribuição aproximadamente normal sob condições adequadas. Essa é a essência de um famoso teorema em estatística, conhecido como “Teorema do Limite Central”. 45 a) Função Densidade de Probabilidade da Distribuição Normal 2 2 ( x ) 2. 1 f (x; , ) .e , - x 2 . Parâmetros: μ : média ou valor esperado e σ2: variância Notação : 2X ~ N( , ) b) O gráfico da densidade normal Propriedades: A curva normal é simétrica em torno da média μ; A moda e a mediana são iguais a μ; Os pontos de inflexão são μ- σ e μ + σ; A área sob a curva e acima do eixo horizontal é igual a 1. c) Distribuição Normal Reduzida ou Padronizada ( Z ) Para calcular P(a X b) quando X é uma variável normal com parâmetros μ e , devemos resolver a seguinte integral: 46 2 2 ( x ) b 2. a 1 .e dx 2 . Nenhuma das técnicas de integração-padrão podem ser usadas para calcular o valor da expressão acima. Porém, quando μ = 0 e = 1, os valores foram calculados e tabulados para determinados valores de a e b. Esses valores correspondem a probabilidade da variável X se encontrar entre dois valores a e b. A distribuição Normal reduzida ou padronizada, representada pela letra Z, é então aquela em que μ = 0 e = 1. Qualquer variável aleatória X pode ser transformada em uma variável normal padronizada Z, através da seguinte expressão: X Z Onde: X é o valor da variável aleatória que segue uma distribuição normal; μ é a média da variável normal X; é o desvio padrão da variável normal X; EXEMPLOS: 1) Uma variável aleatória X segue uma distribuição normal com média igual a 100 e variância igual a 64. Calcule as seguintes probabilidades: a) a probabilidade de X estar entre 100 e 110; b) a probabilidade de X estar entre 88 e 114; c) a probabilidade de X ser maior que 118; d) a probabilidade de X ser menor que 112. 47 2) Uma máquina que produz rolamentos, inicialmente foi configurada para que o diâmetro real médio dos rolamentos produzidos seja de 0,500 polegadas. Um rolamento é aceitável se o diâmetro está dentro de 0,004 polegadas desse valor-alvo. Suponha, entretanto, que a configuração das máquinas produtoras tenha sido alterada durante o curso da produção, de forma que os rolamentos tenham diâmetros com distribuição normal com média 0,499 polegadas e desvio padrão de 0,002 polegadas. Que porcentagem dos rolamentos produzidos não será aceitável? 48 8- DISTRIBUIÇÕES DE AMOSTRAGEM 8.1- INTRODUÇÃO Do fato de que os elementos de uma amostra são aleatórios (considerando amostragens probabilísticas), decorre que qualquer quantidade calculada em função dos elementos da amostra, também será uma variável aleatória. Essas quantidades calculadas a partir da amostra são chamadas de estatísticas. Assim, a média, a proporção e a variância amostrais, que são medidas obtidas a partir de uma amostra, também terão alguma distribuição de probabilidade, comumente chamada de distribuição de amostragem. 8.2- DISTRIBUIÇÃO AMOSTRAL DE x Sendo a população infinita ou a amostragem feita com reposição, diversos valores da amostra podem ser considerados como variáveis aleatórias independentes e identicamente distribuídas, com a mesma média e variância populacionais. Portanto, se tomarmos infinitas amostras dessa população, cada uma terá uma média amostral ix . Essas médias constituem uma nova variável aleatória com uma distribuição de probabilidade. A forma da distribuição amostral de x dependerá de dois teoremas enunciados a seguir: a) Teorema das Combinações Lineares (de variáveis normais independentes) Se a distribuição da população for normal, com média e variância 2 , a distribuição amostral de x será também normal para qualquer tamanho de amostra, com média e variância 2 n . 49 b) Teorema do Limite Central (TLC) Seja uma população que segue uma distribuição de probabilidade qualquer, de tamanho infinito, com média e variância 2 . Se infinitas amostras, suficientemente grandes, de tamanho n forem coletadas dessa população, então a distribuição amostral de x será aproximadamente normal, com média e variância 2 n . Tal aproximação será cada vez melhor, à medida que n tende ao infinito. 50 Assim, essa condição de normalidade da variável aleatória x dá condição para que ela possa ser expressa na forma padronizada z, através de: 2 x z n É importante notar que em ambos os teoremas citados, sugere-se o conhecimento da variância populacional 2 . 8.3- Distribuição t de Student (Willian S. Gosset) Na maior parte dos estudos realizados com amostras, a variância populacional 2 não é conhecida. Mas, podemos calcular a variância amostral 2s e usá-la no lugar de 2 . Porém, quando fazemos essa substituição, a variável resultante não tem mais uma distribuição normal padrão z, mas sim uma distribuição conhecida como t de Student. Dessa forma, temos: 2 x t s n Essa distribuição tem um único parâmetro, conhecido como grau de liberdade da amostra ( 1n ). 51 8.4 - DISTRIBUIÇÃO APROXIMADA DA PROPORÇÃO AMOSTRAL p̂ É conhecido que a distribuição do número de sucessos observado em um experimento aleatório que se repete um determinado número de vezes segue uma distribuição binomial. Portanto, a distribuição amostral de p̂ depende da distribuição do número de sucessos observado em um experimento. A distribuição exata desse parâmetro é um pouco mais complicada e pouco usual. Em geral, adota-se sua distribuição aproximada, que é uma normal com média np e variância 2 (1 )np p . (1 ) ˆ , p p p N p n 8.5 - DISTRIBUIÇÃO DA VARIÂNCIA AMOSTRAL 2s Lembremos que para o cálculo da variância de uma amostra é necessário trabalhar com os quadrados dos elementos ix da amostra e depois devemos somar esses quadrados. Se considerarmos que os elementos da amostra são independentes e 52 retirados de uma população normal com média e desvio padrão , esses valores de ix poderão ser expressos por uma variável z (normal padronizada). Assim, temos que 2 2 2 1 1 ,i i i i x z onde 2 é a notação de uma distribuição de probabilidade conhecida com qui- quadrado. Seu parâmetro é o número de graus de liberdade da amostra. É interessante observar na figura a seguir que a distribuição de qui-quadrado se aproxima de uma normal à medida que os graus de liberdade aumentam. Se substituirmos por x na expressão anterior ao gráfico, temos: 2 2 2 2 21 1 12 2 2 1 1 .1 . , 1 n n i in i i i n i x x x x n sx x n n ou seja, a menos de uma constante, a estatística 2s segue uma distribuição de qui- quadrado com n-1 graus de liberdade. 53 8.6 - DISTRIBUIÇÃO DA RAZÃO ENTRE DUAS VARIÂNCIAS AMOSTRAIS 2 2 1 2/s s Sabemos pelo item anterior, que a distribuição de probabilidades associada a uma variância amostral é uma qui-quadrado com 1n graus de liberdade. Para uma razão entre duas variâncias amostrais, teremos uma razão entre duas distribuições de qui-quadrado, a do numerador com 1 1 1n graus de liberdade e a do denominador com 2 2 1n . Uma razão entre essas duas distribuições de qui-quadrado resulta em uma nova distribuição, conhecida como F de Snedecor. 1 1 2 2 2 1 , 2 2 F As distribuições t de Student e F de Snedecor possuem uma relação entre si, quando consideramos que o grau de liberdade do numerador da F é igual a 1, dada por: 1 2 2 2, ; 1, ,t F onde é uma área ou probabilidade (em geral 5% ou 1%). EXERCÍCIO: O diâmetro interno de um anel de pistão é uma variável aleatória com valor médio de 12cm e desvio padrão de 0,04cm. a) Se X é o diâmetro médio para uma amostra aleatória de 16 anéis, qual é o desvio padrão da distribuição de X ? b) Se n = 64 anéis, qual será o desvio padrão de X ? c) Para qual das duas amostras aleatórias, a da letra ( a ) oua da letra ( b ), X é mais provável de estar entre 11,99cm e 12,01cm? d) Qual a probabilidade do diâmetro médio da amostra exceder 12,01cm quando n = 25? 54 9 – TEORIA DA ESTIMAÇÃO 9.1- Introdução A maior parte dos trabalhos de pesquisa são realizados através de amostras. Porém, como já sabemos, o foco nesses estudos é a obtenção de informações sobre determinadas características populacionais. Essas características são chamadas de “parâmetros populacionais” e em geral correspondem a medidas de posição (principalmente a média), dispersão (como a variância e o desvio padrão) ou proporções. Esse processo de utilização de amostras para se afirmar algo sobre a população é chamado de Inferência Estatística. De uma forma simplificada, a Inferência Estatística é geralmente subdividida no estudo da teoria da estimação e na teoria da decisão. A primeira será o nosso foco de estudo nesse capítulo e consiste nas técnicas que nos permitem determinar valores aproximados que representam os parâmetros de interesse (estimação pontual), bem como, o erro associado na determinação desses valores (estimação por intervalo). 9.2- Conceitos Básicos Parâmetro (θ): medida usada para descrever uma característica da população. Função dos dados populacionais. Estimativa: valor aproximado de um parâmetro populacional desconhecido. Função dos dados amostrais. Estimador: corresponde à expressão algébrica que permite obter uma estimativa. Geralmente é simbolizado por letras latinas ou por letras que representam o parâmetro populacional acompanhadas de um acento circunflexo ( ̂ ). Estimação: o ato de obter uma estimativa. 9.3- Estimação Pontual Consiste no processo de obtenção de expressões algébricas ou funções dos dados amostrais que determinam valores pontuais de parâmetros populacionais de interesse. A obtenção dessas expressões é feita por processos matemáticos relativamente complexos, que fogem ao escopo dessa disciplina. Assim, o que nos compete é colocar os principais 55 estimadores, já definidos, que são mais utilizados na prática do dia a dia de um pesquisador. Exemplos de estimadores: é o estimador da proporção populacional p. é o estimador da média populacional µ. 2 2 1 1 ( ) 1 n i i S X X n é o estimador da variância populacional para populações infinitas. é o estimador da variância populacional para populações finitas. Propriedades desejadas dos estimadores: a) Não-tendenciosidade: corresponde ao fato de que se tomarmos infinitas amostras de uma população, o valor médio do estimador ̂ será igual ao valor do verdadeiro parâmetro populacional . b) Precisão: está relacionada com o fato de que se temos dois estimadores para um mesmo parâmetro populacional, como é o caso da variância, por exemplo, o estimador mais preciso desse parâmetro será aquele que possuir menor variância entre suas estimativas. 1ˆ n i i i X Y p n n p̂ 1 1 ˆ n i i X X n X 2 2 1 ( ) ( 1) ˆ 1 n i i X X N N n 2S 2 2̂ 2 56 Exemplo – Proporção de pessoas que tem animal doméstico Numa amostra de 3000 domicílios de Porto Alegre - RS, 600 tinham pelo menos um animal doméstico (cão ou gato). Estime pontualmente a proporção de domicílios que tem pelo menos um cão ou gato. 600 1 ˆ 0,20 20% 3000 5 p ou ou 9.4 – Estimação por Intervalo Consiste em cercar o valor da estimativa pontual por uma região cuja probabilidade de conter o verdadeiro parâmetro seja conhecida, gerando um intervalo conhecido como Intervalo de Confiança (IC) do parâmetro sob estudo. 9.4.1- Notações que serão utilizadas a partir de agora (alfa) = nível de significância 1 = nível de confiança 1; 2 nt = valor da distribuição t de Student com n-1 graus de liberdade e área 2 à direita. 2 Z = valor da distribuição normal padrão com área 2 à direita. Em geral, os intervalos de confiança para um parâmetro qualquer, têm uma forma bastante usual de serem expressos. 1 ˆ( ) : IC e Lê-se: existe probabilidade de 1 de que o verdadeiro valor do parâmetro esteja no intervalo de ˆ - e e ˆ + e , em que e é o erro associado à estimativa ̂ . 9.4.2 – Intervalo de confiança (IC) para (média) de uma população normal a) Quando a variância é conhecida. 2 57 Devemos definir primeiro o nível de significância , geralmente 10%, 5% ou 1%. Feito isto, calculamos o nível de confiança do intervalo 1 . Se, por exemplo, =5%, o intervalo de confiança será de 1 – 0,05 = 0,95 ou 95%. Depois, estimamos pontualmente o valor da média ( X ). Calculamos o erro padrão n e finalmente, obtemos o valor tabelado de 2 Z . O IC será então dado por: 1 2 ( ) : IC X Z n b) Quando a variância é desconhecida. Deve-se proceder da mesma forma que o item a, porém além de estimar pontualmente a média deve-se também estimar a variância s2. Nesse caso, troca-se a distribuição normal padrão Z pela distribuição t de Student, obtendo-se o valor tabelado de ; 1 2 n t . Com esses valores, podemos obter o intervalo de confiança para a média, através das fórmulas: 1 ; (n-1) 2 ( ) : s IC X t n , (para populações infinitas) ou 1 ; 1 2 ( ) : n s N n IC X t Nn . (populações finitas) OBS: os termos que são somados e subtraídos da média amostral X , nesses intervalos constituem o erro de estimação da média. Portanto, para populações infinitas, com variância desconhecida, o erro é dado por: ; 1 2 2 2 2 ; 1 2 ou nn s s e t e t nn . Com base nesse erro, podemos dimensionar o tamanho de amostras. 9.4.3 – Intervalo de confiança (IC) para p (proporções) – aproximação normal 2 58 A estimativa pontual para uma proporção é dada diretamente pela proporção amostral. É muito útil construirmos um intervalo em torno da estimativa pontual que possua uma probabilidade conhecida de conter a verdadeira proporção populacional. 1 2 ˆ ˆ(1 ) ˆ( ) : p p IC p p Z n (para populações infinitas) ou 1 2 ˆ ˆ(1 ) ˆ( ) : p p N n IC p p Z n N . (para populações finitas) Se: = 10%, 0,05 2 1,645Z Z ; = 5%, 0,025 2 1,96Z Z ; = 1%, 0,005 2 2,576Z Z . OBS: a margem de erro na estimação de proporções, em populações infinitas, é dada por: 2 ˆ ˆ(1 )p p e Z n Trabalhando esta expressão, podemos dimensionar tamanhos de amostra, utilizando: 2 2 2 ˆ ˆ(1 )Z p p n e OBS: quando p não é estimado, utilizamos o valor 0,5 como estimativa para p. Dessa forma, atribuída uma margem de erro e , encontramos um tamanho de amostra máximo ( máxn ) para um dado estudo. 9.4.4 – Intervalo de confiança (IC) para 2 (variância) de uma população normal 59 Seja uma variável aleatória 2~ ( , )X N associada a uma população da qual é retirada uma amostra aleatória de tamanho n. Um intervalo de confiança para o parâmetro 2 , obtido a partir dessa amostra será: 2 2 2 1 2 2 ; (n-1) 1 ; (n-1) 2 2 ( 1) ( 1) ( ) : ; n s n s IC Supondo que se queira um intervalo para 2 com nível de confiança de 90%, isto é cujo 0,10 , temos que consultar dois valores de qui-quadrado. O primeiro com 2 0,05 e o segundo com 1 0,95 2 . Claro que o graude liberdade da amostra é o mesmo, ou seja, v = n-1. EXEMPLOS 1) Em uma amostra de 21 pacientes, selecionados ao acaso de uma população infinita, a taxa média de glicemia foi de 135mg/dl com um desvio padrão de 13,69mg/dl. Com essas informações, pede-se: a) construir um IC com 95% de confiança para a verdadeira taxa de glicemia desta população. b) construir um IC com 99% de confiança para a verdadeira taxa de glicemia desta população. Qual foi o efeito do aumento do nível de confiança neste IC? c) considere que de uma segunda amostra, agora com n = 31, tomada ao acaso desta mesma população, coincidentemente a média e o desvio padrão também foram iguais a 135mg/dl e 13,69mg/dl, respectivamente. Construir um IC com 95% de confiança para a verdadeira taxa de glicemia desta população. Qual foi o efeito do aumento do tamanho da amostra neste IC? 60 2) Em 15 unidades amostrais de leite enviadas para a análise físico-química no laboratório de controle de qualidade de um laticínio, observou-se uma variância do pH igual a 0,16. Assumindo que o pH do leite segue uma distribuição normal, construa um IC de 95% para 2 . (Dado: 2 20,025; 14 0,975; 145,629 e 26,119 ) 3) Para se estimar a proporção de alunos de um curso favoráveis à modificação do currículo escolar, tomou-se uma amostra de 100 alunos, dos quais 80 foram favoráveis. Considerando a população infinita, determinar: a) um IC para a proporção de todos os alunos do curso favoráveis à modificação com nível de significância 0,05 . b) qual o valor do erro de estimação cometido no item a? c) se a proporção de alunos favoráveis a mudança de currículo foi de 0,80 em uma amostra piloto, qual deve ser o tamanho da amostra necessária para que a margem de erro seja de no máximo 5%, com nível de confiança de 95%? d) caso não seja conhecida uma estimativa da proporção de alunos favoráveis a mudança de currículo, qual seria o tamanho da amostra necessária para estimar essa proporção com margem de erro máxima de 5% e nível de confiança de 95%? 61 10- TEORIA DA DECISÃO 10.1- INTRODUÇÃO Em todas as áreas do conhecimento humano há uma busca contínua e ininterrupta por novos métodos, procedimentos e materiais que melhorem em algum sentido aqueles já existentes. O conhecimento da herdabilidade de determinadas doenças, por exemplo, pode ajudar no desenvolvimento de métodos para a sua prevenção, na indústria automobilística procuram-se motores de maior rendimento e de menor ruído. Na engenharia a busca é por materiais mais leves e resistentes. Na computação, procuram-se algoritmos mais eficientes, com melhor desempenho e confiabilidade. Em todas essas situações é preciso comparar técnicas e materiais tradicionais com as novas técnicas ou materiais alternativos. Estas comparações surgem frequentemente no trabalho de pesquisa e desenvolvimento. Não se trata, entretanto, de tarefa simples como a princípio pode parecer. É necessário coletar dados e fazer inferências a partir de evidências experimentais ou observacionais. Para isto, é comum os pesquisadores reproduzirem os fenômenos que desejam estudar para testarem o comportamento das técnicas ou materiais de interesse. A esta reprodução denominamos “experimento”. 10.2- CONCEITOS FUNDAMENTAIS Em geral, os dados obtidos em um experimento nos ajudam a estimar parâmetros de interesse em cada grupo avaliado (ou em cada população estudada). O principal interesse de um pesquisador, de qualquer área, é verificar se existe ou não diferença dos parâmetros entre os grupos estudados. Para melhor entendimento, considere que desejamos comparar o desempenho de duas turmas A e B que fazem a disciplina de estatística. Para isso, tomamos uma amostra de 10 alunos de cada uma. A questão em si, não é simplesmente obter a nota média de cada amostra e A BX X e compará-las, mas sim, saber se existe ou não diferença entre as médias populacionais µA e µB. Para isso, inicialmente, fazemos algumas afirmativas possíveis sobre essas duas populações, como por exemplo, A B , 62 A B ou A B . Como não conhecemos a população, todas essas afirmativas são apenas hipóteses estatísticas. Uma hipótese estatística é uma afirmativa ou conjectura feita sobre algum parâmetro de interesse na população. O procedimento estatístico usado para verificar a validade ou não dessas afirmativas, com base em dados amostrais é denominado de Teste de Hipóteses. Um teste de hipóteses envolve duas hipóteses estatísticas que serão descritas a seguir. 10.2.1- HIPÓTESES A SEREM TESTADAS Hipótese nula No problema de comparação do desempenho de duas turmas de estatística, por exemplo, é usual fixar como hipótese de interesse a inexistência de diferença entre o desempenho das duas turmas. Se, inexiste diferença, é porque a diferença entre as médias é nula, pois os parâmetros têm o mesmo valor. Por estas razões, a hipótese a ser testada é usualmente chamada hipótese nula (H0). 0 : A BH Hipótese alternativa A hipótese nula deve ser comparada com uma hipótese alternativa, denominada H1, complementar à afirmativa feita na hipótese nula, claro que, envolvendo as possibilidades do espaço paramétrico. Para cada situação existem muitas hipóteses alternativas adequadas. Em geral a hipótese alternativa é expressa por três formas dferentes: 1 : A BH ou 1 : A BH ou 1 : A BH . Estrutura geral dos Teste de Hipóteses 0 1 : : A B A B H H (Teste Bilateral) 0 1 : : A B A B H H (Teste Unilateral) 63 10.2.2- ERROS ASSOCIADOS Outros elementos importantes de um teste de hipóteses são os possíveis erros que se pode cometer, ao se utilizar determinada regra de decisão. São eles: Erro Tipo I: consiste no erro que se comete ao rejeitar 0H , sendo que ela é verdadeira. Erro Tipo II: consiste no erro que se comete ao aceitar 0H , sendo que ela é falsa. Tabela 1: Erros associados e suas probabilidades de ocorrência. Decisão Tomada A verdade na população H0 é verdadeira H0 é falsa H0 é rejeitada Decisão errada (Erro Tipo I) Probabilidade = Decisão correta Probabilidade = 1 - H0 é falsa Decisão correta Probabilidade = 1 - Decisão errada (Erro Tipo II) Probabilidade = Probabilidade Total 1 1 A probabilidade de se cometer o erro tipo I é em geral representada pela letra grega , e comumente também é chamada de nível de significância do teste. A probabilidade de rejeitar H0, sendo que de fato ela é falsa, é denominada de poder do teste. 10.3- TESTES DE HIPÓTESES PARA OS PARÂMETROS 2, p e DE UMA ÚNICA POPULAÇÃO COM DISTRIBUIÇÃO NORMAL (OU APROX. NORMAL) 10.3.1- TESTE PARA A MÉDIA DE UMA POPULAÇÃO COM 2 CONHECIDO I) Estabelecer as hipóteses: 64 0 0 1 0 : : H H , onde 0 é o valor que se quer testar para . II) Se a variância populacional 2 for conhecida, a média amostral X seguirá uma distribuição normal. Portanto, a estatística de teste será: 0 c X Z n III) Obter o valor tabelado de 2 Z , caso o teste seja bilateral. Se o teste for unilateral encontrar o quantil Z . IV) Regra de decisão: Rejeitar a hipótese nula se ou c cZ Z Z Z . Caso contrário, deve-se aceitar H0. 10.3.2- TESTE PARA A MÉDIA DE UMA POPULAÇÃO COM 2 DESCONHECIDO I) Estabelecer as hipóteses: 0 0 1 0 : : H H , onde 0 é o valor que se quer testar para . II) Se a variância populacional 2 for desconhecida, deve-se estimá-la através de s2. Neste caso, a média amostral X seguiráuma distribuição t de Student com v = n-1 graus de liberdade. Estabelecer o nível de significância / 2 para testes bilaterais e para testes unilaterais. A estatística de teste será: 0 c X t s n III) Obter o valor tabelado de , 1 2 v n t , caso o teste seja bilateral. Se o teste for unilateral encontrar o quantil , v=n-1t . 65 IV) Regra de decisão: Rejeitar a hipótese nula se , v=n-1 , v=n-1 2 2 ou c ct t t t . Caso contrário, deve-se aceitar H0. 10.3.3- TESTE PARA A PROPORÇÃO p DE UMA POPULAÇÃO (APROXIMAÇÃO NORMAL) I) Estabelecer as hipóteses: 0 0 1 0 : : H p p H p p , onde 0p é o valor que se quer testar para p . II) Com amostras grandes, a estatística p̂ seguirá uma distribuição aproximadamente normal. Estabelecer o nível de significância para testes unilaterais e / 2 para testes bilaterais. A estatística de teste será: 0 0 0 ˆ (1 ) c p p Z p p n III) Obter o valor tabelado de Z , caso o teste seja unilateral. Se o teste for bilateral encontrar o quantil 2 Z . IV) Regra de decisão: Rejeitar a hipótese nula se ou c cZ Z Z Z . Caso contrário, deve-se aceitar H0. 10.3.4- TESTE PARA A VARIÂNCIA 2 DE UMA POPULAÇÃO NORMAL I) Estabelecer as hipóteses: 2 2 0 0 2 2 1 0 : : H H , onde 2 0 é o valor que se quer testar para 2 . 66 II) A distribuição de s2 segue uma distribuição de qui-quadrado com v = n-1 graus de liberdade.. Estabelecer o nível de significância para testes unilaterais e / 2 e 1 ( / 2) para testes bilaterais. A estatística de teste será: 2 2 2 0 ( 1) c n s III) Obter o valor tabelado de 2 , v=n-1 , caso o teste seja unilateral. Se o teste for bilateral encontrar o quantil 2 2 , v=n-1 1 , v=n-1 2 2 e . IV) Regra de decisão: Rejeitar a hipótese nula se 2 2 2 2 , v=n-1 1 , v=n-1 2 2 ou c c . Caso contrário, deve-se aceitar H0. EXEMPLOS: 1) Considere que o fabricante de uma determinada lâmpada afirma que a média do tempo de vida do seu produto é de 2000 horas. Uma amostra de 25 lâmpadas desse fabricante teve duração média de 1970 horas e desvio padrão de 80 horas. Verificar, ao nível de significância de 1%, se o produto dura menos que 2000 horas? 2) Um relatório de uma companhia afirma que 40% de toda a água obtida através de poços artesianos em uma região é salobra. Há muitas controvérsias sobre essa afirmação, alguns dizem que a proporção é maior, outros que é menor. Para verificar esta afirmação, coletou-se amostras em 400 poços artesianos da região, dentre os quais, 67 120 forneceram água salobra. Assim, ao nível de significância de 5%, a afirmação da companhia procede? 3) Um fabricante de baterias automotivas afirma que a vida útil delas tem distribuição aproximadamente normal, com variância de 0,81 ao ano, mas acredita-se que essa variância seja maior. Em uma amostra aleatória de 10 dessas baterias observou-se uma variância de 1,44 ao ano. Verifique, ao nível de significância de 5%, se a afirmação do fabricante é verdadeira. 68 10.4- TESTE t PARA DUAS POPULAÇÕES 10.4.1- INTRODUÇÃO Às vezes é preciso comparar dois grupos cuja variável analisada possui uma resposta contínua e não mais em proporções. Nestes casos utilizamos o chamado teste t de Student. 10.4.2- TESTE t PARA OBSERVAÇÕES INDEPENDENTES a) Teste sobre a diferença entre médias A B (Variâncias 2 2 e A B iguais) Este teste é aplicado quando temos duas amostras constituídas por indivíduos, ou elementos diferentes e o interesse está na comparação entre as médias das duas populações A e B do qual cada amostra foi retirada. Para isto, a estatística de teste é: 2 2 0 1 1 1 1 A B A B A B A B A B X X X X t s s n n n n 2 1 1 A B A B X X t s n n Onde, 2 2 2 1 1 2 BA A B A B n s n s s n n é a chamada variância ponderada, AX e BX correspondem as médias das amostras A e B e nA e nB representam os tamanhos das amostras dos dois grupos, respectivamente. O teste estabelecido pode, por exemplo, ser formado pelas seguintes hipóteses: 69 0 1 : : A B A B H H E, o critério de decisão consiste em rejeitar H0 se o valor do t calculado, em módulo, for maior ou igual ao valor do t tabelado. O valor do t tabelado é obtido de acordo com o nível de significância /2 estabelecido pelo pesquisador (em geral α = 0,05) e por n1+n2-2 graus de liberdade. b) Teste sobre a diferença entre médias A B (Variâncias 2 2 e A B diferentes) 2 2 A B A B A A X X t s s n n em que, o grau de liberdade v é calculado através de: 2 2 2 2 2 2 2 1 1 A B A B A B A B A B s s n n v s s n n n n conhecida como fórmula de Satterthwaite. Se, o teste estabelecido for unilateral, por exemplo, 0 1 : , : A B A B H H o critério de decisão consistiria em rejeitar H0 se o valor do t calculado for maior ou igual ao valor do t tabelado. O valor do t tabelado é obtido de acordo com o nível de significância estabelecido pelo pesquisador (em geral 0,05) e por v graus de liberdade. 70 10.4.3- TESTE t PARA OBSERVAÇÕES PAREADAS Existem situações em que desejamos comparar dois conjuntos de dados oriundos de um mesmo grupo de indivíduos. Tal é o caso, quando queremos avaliar, por exemplo, o efeito de um medicamento para a redução dos níveis de colesterol. Assim, selecionamos um grupo de pessoas com colesterol elevado, e mensuramos, em cada uma, o nível de colesterol antes do início do tratamento e mensuramos novamente ao final do tratamento, obtendo dois conjuntos de dados provenientes dos mesmos indivíduos. Tais observações são chamadas então de pareadas, pois cada indivíduo fornece um par de observações. Nestes casos, o critério de decisão sobre a eficiência ou não tratamento também é obtida através de um teste t, através de: 2 d d t s n em que, d é a média das diferenças entre os resultados de antes e depois do tratamento. Cada valor de diferença dos dados do i-ésimo indivíduo é: di = xinício(i) – xfinal(i). Para verificar se o tratamento é eficiente, montamos o seguinte teste de hipóteses: 0 0 1 1 : : 0 ou . : : 0 início final início final início final início final H H H H O critério de decisão continua o mesmo, ou seja, rejeita-se H0 se o valor de t calculado for maior ou igual ao t tabelado, com n-1 graus de liberdade e nível de significância. EXEMPLOS: 1) Considere o peso, em gramas, de duas espécies de esquilo (1: esquilo-cinzento e 2: esquilo-peruano). Da espécie 1, foram capturados 9 indivíduos e da espécie 2 foram capturados 6 indivíduos. Tabela 2: Pesos, em quilogramas, dos animais capturados. Espécies 1 498 505 501 498 518 515 510 495 505 2 495 504 496 502 510 505 - - - 71 Considerando um nível de significância de 5%, realizar o teste t para verificar se existe ou não diferença entre os pesos médios das duas espécies. Considere variâncias populacionais iguais. 0 1 2 1 1 2 : : H H I) Estimativa da média de cada amostra. 1 2 4545 3012 9 6 X X II) Estimativa da variância de cada amostra. 2 2 2 2 1 2 4545 3012 2295733- 1512186 9 6s = = s 8 5 III) Estimativa da variância ponderada.
Compartilhar