Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
ANAELENA BRAGANÇA DE MORAES LUCIANE FLORES JACOBI ROSELAINE RUVIARO ZANINI CADERNO DIDÁTICO ESTATÍSTICA Santa Maria UFSM 2013 Ficha catalográfica elaborada por Rosa Maria Fristsch Feijó CRB-10/662 Biblioteca Central – UFSM Sumário 1 - Conceitos Iniciais 1 1.1 Conceito de estatística 1 1.2 Divisão da estatística 1 1.3 População 2 1.4 Amostra 2 1.5 Dados estatísticos 2 1.6 Variável 2 1.7 Níveis de mensuração de uma variável 3 1.8 Arredondamento de dados 4 1.9 Método estatístico 4 1.10 Representação tabular 5 1.11 Séries estatísticas 6 1.12 Representação gráfica 7 2 – Distribuições de Freqüências 10 1 Representação de variáveis 10 1.1 Discretas 10 1.2 Contínuas 10 2 Alguns conceitos básicos 10 2.1 Dados brutos 10 2.2 Rol 10 2.3 Amplitude total 10 2.4 Classe 10 2.5 Limites de classe 11 2.6 Amplitude de classe 11 2.7 Ponto médio de classe 11 2.8 Tipos de freqüências 11 2.9 Exemplos de distribuições de freqüências 12 2.10 Gráficos representativos de uma distribuição de freqüências em classes 12 3 – Medidas Descritivas 17 1 Introdução 17 2 Medidas de tendência central 17 2.1 Média aritmética 17 2.2 Mediana 18 2.3 Moda 20 3 Separatrizes 21 3.1 Quartis 21 3.2 Decis 23 3.3 Percentis 23 4 Medidas de dispersão 23 4.1 Amplitude de variação 24 4.2 Desvio médio 24 4.3 Soma de quadrados 25 4.4 Variância 25 4.5 Desvio padrão 26 4.6 Coeficiente de variação 27 5 Assimetria e curtose 27 5.1 Assimetria 27 5.2 Curtose 28 4 – Probabilidade 30 1 Introdução 30 2 Noções de experimento, espaço amostral e eventos 30 2.1 Experimento aleatório 30 2.2 Espaço amostral 30 2.3 Evento 30 3 Álgebra de eventos 31 4 Conceitos de probabilidade 31 4.1 Conceito empírico 32 4.2 Definição clássica de probabilidade 32 4.3 Definição axiomática 32 5 Probabilidade condicionada 33 6 Independência estatística 34 7 Teorema de Bayes 34 8 Resumo das propriedades do cálculo de probabilidades 36 5 – Variáveis Aleatórias 36 1 Noções sobre variáveis aleatórias 36 2 Variáveis aleatórias discretas 36 2.1 Função de probabilidade 36 2.2 Valor esperado ou média de uma variável aleatória discreta 37 2.3 Variância de uma variável aleatória discreta 37 3 Variáveis aleatórias contínuas 38 3.1 Função densidade de probabilidade 38 3.2 Valor esperado ou média de uma variável aleatória contínua 38 3.3 Variância de uma variável aleatória contínua 39 4 Modelos probabilísticos para variáveis aleatórias 39 4.1 Distribuição binomial 39 4.2 Distribuição de Poisson 40 4.3 Distribuição normal 41 4.4 Distribuição Qui-quadrado (2) 43 4.5 Distribuição “t” de Student 44 4.6 Distribuição “F” (Fisher) 44 6 – Amostragem 45 1 Introdução 45 1.1 Definição de amostragem 45 1.2 Importância da utilização da amostragem 45 1.3 Situações em que pode não valer à pena a realização de uma amostragem 46 1.4 Tipos de investigação 46 2 Tipos de amostragem probabilistica 46 2.1 Amostragem aleatória simples 46 2.2 Amostragem sistemática 47 2.3 Amostragem estratificada 47 3 Distribuição por amostragem 48 3.1 Amostragem com ou sem reposição 49 3.2 Distribuição amostral das médias 49 4 Determinação do tamanho da amostra 49 4.1 Para estimar a média populacional 49 4.2 Para estimar uma proporção populacional 51 7 – Estimação de Parâmetros 52 1 Introdução 52 2 Estimativas pontuais e intervalares 52 3 Tipos de intervalos 52 3.1 Intervalo de confiança para a média 52 3.2 Intervalo de confiança para a proporção populacional p 53 3.3 Intervalo de confiança para a diferença de médias populacionais 1 e 2 54 3.4 Intervalo de confiança para a diferença de proporções populacionais p1 e p2 55 8 – Testes de Hipóteses Paramétricos 56 1 Introdução 56 2 Hipóteses estatísticas 56 3 Testes de hipóteses 56 3.1 Hipóteses 56 3.2 Tipos de erros 56 3.3 Nível de significância do teste 57 3.4 Graus de liberdade 57 3.5 Teste bilateral 57 3.6 Teste unilateral 57 3.7 Probabilidade exata do teste 58 3.8 Procedimento para a realização de um teste de hipóteses 58 4 Testes de hipóteses paramétricos 58 4.1 Teste para uma média com variância populacional 2 conhecida 58 4.2 Teste para uma média com variância populacional 2 desconhecida 59 4.3 Teste para a proporção populacional p 60 4.4 Teste para a diferença entre duas médias populacionais independentes 60 4.5 Teste para a diferença entre duas amostras dependentes – Teste t pareado 63 4.6 Teste para a diferença entre duas proporções populacionais p1 e p2 64 4.7 Teste para a diferença entre duas variâncias 65 9 – Análise de Variância – ANOVA 66 1 Introdução 66 2 Pressuposições básicas à aplicação da ANOVA 66 3 ANOVA – Uma classificação: amostras de mesmo tamanho 66 4 ANOVA – Uma classificação: amostras de tamanhos diferentes 68 5 Comparação de médias 68 5.1 Teste de Tuckey 68 10 – Testes de Hipóteses Não-Paramétricos 70 1 Teste de adequação 70 2 Teste qui-quadrado de independência 71 3 Coeficiente de contingência 72 11 – Correlação e Regressão Linear Simples 74 1 Análise de correlação linear simples 74 1.1 Estimativa do coeficiente de correlação 75 1.2 Teste para o coeficiente de correlação 75 2 Regressão linear simples 75 2.1 Considerações na análise de regressão 76 3 Teste para verificar a significância da regressão 78 4 Coeficiente de determinação ou explicação 79 Referências Bibliográficas 81 Telefone para contato: (055) 3220 8486 sub-ramais 32 ou 33 ou 3220 8612 Departamento de Estatística – CCNE – UFSM http://www.ufsm.br/estat e http://www.ufsm.br/ppgemq 1 - Conceitos Iniciais 1.1 Conceito de estatística Existem muitas definições propostas por autores, objetivando estabelecer com clareza o que é estatística, como por exemplo: a estatística é um conjunto de métodos destinados a coleta, organização, resumo, apresentação e análise de dados de observação, bem como a tomada de decisões razoáveis baseadas em tais análises; a estatística é a matemática aplicada aos dados de observação; a estatística é um conjunto de processos ou técnicas empregadas na investigação e análise de fenômenos coletivos ou de massa. 1.2 Divisão da estatística A estatística divide-se em: Estatística geral Visa elaborar métodos gerais aplicáveis a todas as fases do estudo dos fenômenos de massa. A estatística matemática é a parte da estatística geral que tem por finalidade o estudo das propriedades matemáticas dos fenômenos de massa e a dedução e demonstração rigorosa dos procedimentos e fórmulas usadas. A estatística geral ainda pode ser dividida em dois grandes campos: Estatística descritiva Trata da coleta, da organização, classificação, apresentação e descrição dos dados de observação. Refere-se à maneira de apresentar um conjunto de dados em tabelas e gráficos e à maneira de resumir, através de certas medidas, as informações contidas nestes dados. Estatística indutiva ou inferencial Visa tirar conclusões sobre a população a partir de amostras. Refere-se à maneira de estabelecer conclusões para toda uma população quando se observar apenas parte desta população. Estatística aplicada É todo o ramo do conhecimento científico que proceda, única ou principalmente, por intermédio da metodologia estatística. Exemplos: Biometria (ciência que trata da mensuração da vida e dos processos vitais), Demografia, Econometria, Psicometria (mensuração da personalidade, do desenvolvimento mental e do comportamento de indivíduos e grupos e seus ajustamentos a mudanças no meio ambiente), Mecânica Estatística, Sociometria (maneira como as pessoas vivem, sua cultura, opiniões e atitudes, assim como o relacionamento de uns com os outros). Algumas aplicações da estatística A estatística é uma ciência de múltiplas aplicações e de fundamental importância no campo da investigação científica, sendo de utilização cada vez mais acentuada em qualquer atividade profissional. Então, é razoável que os profissionais de diversas áreas adquiram um mínimo de conhecimento técnico sobre estatística que possibilitem a compreensão de termos como: variabilidade, regressão, correlação, significância, etc. que aparecem com freqüência em artigos de publicações especializadas. 1.3 População É todo o conjunto de elementos que possuam ao menos uma característica comum observável. Obs.: elementos = objetos, animais, pessoas, material contínuo (sólido, líquido ou gás). 1.4 Amostra É uma parte da população, sendo que a mesma deve ser selecionada de acordo com algum critério para que possa ser representativa da população. 1.5 Dados estatísticos São as características observadas ou medidas nos elementos, sendo que os dados de observação constituem a matéria-prima da estatística. 1.6 Variável É um símbolo, como X, Y, Z, ..., que pode assumir resultados de um conjunto, que lhe são atribuídos, conjunto este chamado domínio da variável. Se a variável pode assumir somente um valor, ela é denominada constante. As variáveis podem ser classificadas em: Variáveis qualitativas ou atributos: indica alguma propriedade do fenômeno de observação; Variáveis quantitativas discretas: quando podem assumir apenas alguns valores de um conjunto; Variáveis quantitativas contínuas: quando podem assumir, teoricamente, qualquer valor de um conjunto. Exemplo: Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas). quantidade de alcatrão em cigarros; altitude de um avião; número de assinantes de um serviço de computador on-line; precipitação pluviométrica durante um ano; salário dos funcionários de uma empresa; gênero dos filhos de casais residentes em uma cidade. Em geral, as medições dão origem a variáveis contínuas, enquanto que as enumerações ou contagens resultam em variáveis discretas. Solução: a) Variável quantitativa contínua; b) Variável quantitativa contínua; c) Variável quantitativa discreta; d) Variável quantitativa contínua; e) Variável quantitativa discreta; f) Variável qualitativa. 1.7 Níveis de mensuração de uma variável Nível de mensuração significa a escala em que foi medida a variável, objeto de investigação. São quatro os níveis de mensuração: nominal, ordinal, intervalar e de razão. Nível nominal A mensuração, em seu mais baixo nível, existe quando números ou outros símbolos são utilizados para classificar um elemento. Estes números ou símbolos constituem uma escala nominal ou classificadora. As únicas estatísticas aplicáveis são: a moda e as freqüências. Nível ordinal Pode ocorrer que os elementos em uma categoria de dada escala não sejam apenas diferentes dos elementos de outras categorias da mesma escala, mas que guardem certo tipo de “relação” com eles. Isto é, a variável em estudo é partida em categorias ordenadas em graus convencionados havendo uma relação entre categorias do tipo: “maior do que”. Pode-se calcular a mediana e todas as estatísticas de postos, além da moda e das freqüências. Nível intervalar Quando a escala tem todas as características de uma escala ordinal, e, além disso, se conhecem as distâncias entre dois números quaisquer da escala, então se consegue uma mensuração consideravelmente mais forte que a ordinal. Atribui-se à variável um número real, uma unidade constante e comum de mensuração. A unidade de mensuração e o ponto zero são arbitrários. A escala intervalar é a primeira escala verdadeiramente quantitativa. Neste nível todas as estatísticas paramétricas comuns são aplicáveis. Nível de razão Quando uma escala tem todas as características de uma escala de intervalos e, além disso, tem um verdadeiro ponto zero como origem, é chamada escala de razão. Como no nível anterior, todas as estatísticas são aplicáveis. Exemplo: Determine o nível de mensuração mais adequado (nominal, ordinal, intervalar ou razão). classificação como acima da média, médio ou abaixo da média para encontros marcados com desconhecidos; conteúdo de nicotina (em miligramas) de cigarros; números de inscrição do INSS; temperaturas (em graus Celsius); anos em que ocorreram eleições presidenciais; graus finais (A, B, C, D, F) de estudantes de estatística; códigos de endereçamento postal (CEP); rendas anuais de enfermeiras; carros classificados como subcompacto, compacto, intermediário ou grande; cores de uma amostra de confetes M&M. Solução: a) Nível ordinal; b) Nível de razão; c) Nível nominal; d) Nível intervalar; e) Nível intervalar; f) Nível ordinal; g) Nível nominal; h) Nível razão; i) Nível ordinal; j) Nível nominal. 1.8 Arredondamento de dados Arredondar um número significa reduzir a quantidade de algarismos significativos após a vírgula, deste número. O objetivo é reduzir os erros por arredondamento, quando é grande o volume de números a arredondar. A Portaria 36, de 6 de agosto de 1965 do Instituto Nacional de Pesos e Medidas, estabelece os seguintes critérios para o arredondamento de dados. Regras de arredondamento Quando o primeiro algarismo após aquele que será arredondado for 0, 1, 2, 3, 4, conserva-se o algarismo a ser arredondado e desprezam-se os seguintes; Quando o primeiro algarismo após aquele que será arredondado for 6, 7, 8, 9 ou 5, este último seguido de outros algarismos, onde pelo menos, um é diferente de zero, aumenta-se uma unidade no algarismo a ser arredondado e desprezam-se os seguintes; Quando o primeiro algarismo após aquele que será arredondado for 5, seguido de zeros, conserva-se o algarismo a ser arredondado se ele for par, ou aumenta-se uma unidade, se ele for ímpar, desprezando os seguintes. Par 5 Ímpar Conserva Soma uma unidade 0, 1, 2, 3 ou 4 6, 7, 8, 9 ou 5+ Exemplo: Dado os valores abaixo, fazer o arredondamento para décimo. 33,5630; b) 9,5194; c) 10,32500; d) 63,4850000001; e) 6,7153; f) 0,9880; Solução: a) 33,56; b) 9,52; c)10,32; d) 63,49; e) 6,72; f) 0,99 1.9 Método estatístico Quando se pretende empreender um estudo estatístico completo, existem diversas fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais do estudo. Fases do método estatístico Definição do problema: a primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do problema a ser estudado. Além de considerar detidamente o problema objeto do estudo, o analista deverá examinar outros levantamentos realizados no mesmo campo e análogos, uma vez que parte da informação de que necessita pode, muitas vezes, ser encontrada nesses últimos. Planejamento da pesquisa: o passo seguinte, após a definição do problema, compreende a fase do planejamento, que consiste em se determinar o procedimento necessário para resolver o problema e, em especial, como levantar informações sobre o assunto objeto do estudo. É nessa fase que será escolhido o tipo de levantamento a ser utilizado. Outros elementos importantes que devem ser tratados nessa mesma fase são o cronograma das atividades, através do qual são fixados os prazos para as várias fases, os custos envolvidos, o exame das informações disponíveis, o delineamento da amostra e a forma como serão escolhidos os dados. Coleta ou levantamento dos dados: o terceiro passo é essencialmente operacional, compreendendo a coleta das informações propriamente ditas. Formalmente, a coleta de dados se refere à obtenção, reunião e registro sistemáticos de dados, com um objetivo determinado. Crítica e digitação dos dados: antes de começar a analisar os dados, é conveniente que lhes seja dado algum tratamento prévio, a fim de torná-los mais expressivos. È um trabalho de condensação e de tabulação dos dados, que chegam ao analista de forma desorganizada, tornando impossível a tarefa de apreender todo o seu significado pela simples leitura. Organização e representação dos dados: a apresentação ou exposição dos dados observados constitui a quinta fase do método estatístico. Há duas formas de apresentação, que não se excluem mutuamente. A apresentação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado, segundo algumas regras práticas adotadas pelos diversos sistemas estatísticos. A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica. Embora a apresentação tabular seja de extrema importância, no sentido de facilitar a análise numérica dos dados, não permite ao analista obter uma visão tão rápida, fácil e clara do fenômeno e sua variação como a conseguida através de um gráfico. Análise dos dados e interpretação dos resultados: a última fase do trabalho estatístico é a mais importante e também a mais delicada. Nesta etapa, o interesse maior reside em tirar conclusões que auxiliem o pesquisador a resolver seu problema. A análise dos dados estatísticos está ligada essencialmente ao cálculo de medidas, cuja finalidade principal é descrever o fenômeno. Assim, o conjunto de dados a ser analisado pode ser expresso por números-resumos, as estatísticas, que evidenciam características particulares desse conjunto. 1.10 Representação tabular Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A elaboração de tabelas deve obedecer às normas editadas pelo Instituto Brasileiro de Geografia e Estatística - IBGE. Abaixo se apresenta uma tabela esquemática sendo indicados os seus elementos. Título: O quê; Onde; Quando Cabeçalho Total Coluna Indicadora Corpo da tabela Total Chama de Rodapé No rodapé de uma tabela podem aparecer, se necessário: a fonte (entidade responsável pelas informações contidas na tabela), notas (observações gerais sobre a tabela) e/ou chamadas (observações feitas em relação a pontos específicos da tabela sendo os símbolos usados: *, **, ...; ’, ”, ...; i, ii, ... e k). 1.11 Séries estatísticas Uma série estatística é um conjunto de dados ordenados segundo uma característica comum, sendo apresentadas sob forma de tabela e/ou gráfico. A classificação de uma série é feita de acordo com a variação de três elementos que a compõem: a espécie (o fenômeno), o local (o lugar onde o fenômeno acontece) e a época (fator temporal ou cronológico a que se refere o fenômeno). O nome da série depende do(s) elemento(s) que varia(m). Assim, pode-se ter uma série específica, geográfica, temporal, mista ou uma distribuição de freqüências. Exemplos de séries Série específica (série simples): Tabela: Freqüência e porcentagens dos 2.000 empregados da Companhia MB, segundo o grau de instrução. Grau de instrução Freqüência (ni) Porcentagem Fundamental 650 32,50 Médio 1.020 51,00 Superior 330 16,50 Total 2.000 100,00 Fonte: Dados hipotéticos Série geográfica-específica (série composta ou mista): Tabela: Opinião da população, por local de residência, sobre um projeto governamental Local de residência Total Opinião Urbano Suburbano Rural A favor 30 35 35 100 Contra 60 25 15 100 Total 90 60 50 200 1.12 Representação gráfica Um gráfico é toda a forma de representação das séries estatísticas que seja baseada no desenho. O gráfico deve ser atraente para cumprir sua finalidade de mostrar resultados e bem construído para permitir a análise do fenômeno exposto. A fim de que isso aconteça, deve-se observar alguns aspectos básicos como: simplicidade, clareza e veracidade. Do mesmo modo que nas tabelas estatísticas, nos gráficos, deve-se considerar um título que informe a espécie, o lugar e o tempo do fenômeno representado, bem como a fonte de onde foram coletados os dados expostos. Gráficos analíticos Pontos Linhas Simples Classificação Barras Sobrepostas dos gráficos Justapostas analíticos Superfície Simples Colunas Sobrepostas Justapostas Setores Exemplos de gráficos 2 – Distribuições de Freqüências Uma distribuição de freqüência é uma tabela que reúne o conjunto de dados, conforme as freqüências ou as repetições de seus valores. Esta tabela pode representar os dados em classes ou não, de acordo com a classificação dos dados em discretos ou contínuos. 1 Representação de variáveis 1.1 Discretas Neste caso, representam-se as observações numa tabela de freqüências, não agrupadas em classes, designadas de séries de magnitude por ponto. É útil quando a série apresenta poucos valores distintos. 1.2 Contínuas Neste caso, utiliza-se também a tabela de freqüências, mas sob forma de intervalos, mesmo que isto sacrifique algum detalhe na ordenação de valores individuais. É útil quando a série apresenta muitos valores distintos. 2 Alguns conceitos básicos 2.1 Dados brutos São os valores originais conforme eles foram coletados, não estando ainda prontos para análise, pois não estão numericamente organizados ou tabelados. 2.2 Rol É uma lista, onde as observações são dispostas em uma determinada ordem: crescente ou decrescente. O objetivo da ordenação é tornar possível a visualização das variações ocorridas, uma vez que os valores extremos são percebidos de imediato, e também facilitar a construção da distribuição de freqüências. rol crescente Xmín Xmáx 2.3 Amplitude total [Simbologia: H, At ou R] É a diferença entre o maior e o menor valor observado da variável em estudo: H = Xmáx - Xmín 2.4 Classe É cada um dos grupos ou intervalos de valores em que se subdivide a amplitude total do conjunto de tamanho n. Para a determinação do número de classes, existem diversos métodos, dentre os quais destaca-se a regra de Sturges, que estabelece que o número de classes (k) é calculado por: k = 1 + 3,3 log n O analista deverá ter em mente que a escolha do número de classes dependerá antes da natureza dos dados e da unidade de medida em que eles forem expressos, do que de regras muitas vezes arbitrárias e pouco flexíveis. Recomenda-se considerar 4 k 12. 2.5 Limites de classe São os dois valores extremos de cada classe. Limite inferior (Lf.): é o menor valor da classe considerada; Limite superior (Ls.): é o maior valor da classe considerada. 2.6 Amplitude de classe [Simbologia: h] É a diferença entre o limite superior e o limite inferior da classe, ou seja: h = Ls – Lf, quando a distribuição de freqüências já existe; ou h = H/k, para a determinação da amplitude das classes de uma distribuição de freqüências a ser construída. 2.7 Ponto médio de classe [Simbologia: Xi] É a média aritmética dos limites da classe. É o valor representativo da classe: . 2.8 Tipos de freqüências Para construção de uma tabela de distribuição de freqüência é necessário conhecer alguns de seus termos: Freqüência absoluta [Simbologia: fi] É o número de observações que aparece em uma classe ou valor individual. Freqüência relativa [Simbologia: fri] É o quociente entre a freqüência absoluta e o número total de observações, sendo que: onde: 0 < fr < 1; = 1. Freqüência acumulada crescente [Simbologia: faci ou Fci] É a soma de todas as freqüências anteriores com a freqüência do intervalo considerado. Exemplos de distribuições de freqüências Por ponto: Valores Freqüências(fi) 10 7 15 12 20 14 25 8 30 10 Total 51 Por intervalo: Preço, em R$, de certo produto Classes Freqüências das classes Preço (R$) fi 6 ⊢ 8 2 8 ⊢ 10 5 10 ⊢ 12 10 Limites inferiores 12 ⊢ 14 6 14 ⊢ 16 3 16 ⊢ 18 2 Total 25 Limites superiores ? 2.10 Gráficos representativos de uma distribuição de freqüências em classes Histograma É um gráfico de colunas justapostas, cujas alturas são proporcionais às freqüências absolutas e cujas bases correspondem ao intervalo de classe da distribuição. Polígono de freqüências É um gráfico de linha, cujos vértices são proporcionais às freqüências absolutas e correspondem aos pontos médios das classes da distribuição. Ogiva É um gráfico de linha, cujos vértices são proporcionais às freqüências acumuladas e correspondem aos limites inferiores das classes da distribuição. Exemplo 1: A tabela abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial. Construa uma distribuição de freqüência por pontos: 14 – 12 – 11 – 13 – 14 – 13 – 12 – 14 – 13 – 14 – 11 – 12 – 12 – 14 – 10 – 13 – 15 – 11 – 15 – 13 – 16 – 17 – 14 – 14. Solução: N° de vendas fi fri Fci 10 1 1 0,042 11 3 4 0,125 12 4 8 0,167 13 5 13 0,208 14 7 20 0,292 15 2 22 0,083 16 1 23 0,042 17 1 24 0,042 24 1 O histograma e polígono de freqüência são dados por: Assim como o gráfico das freqüências acumuladas (agivas): Exemplo 2: Dado o rol de 50 notas (dadas em créditos), agrupar os elementos em classe e construir os gráficos: 33 – 35 – 35 – 39 – 41 – 41 – 42 – 45 – 47 – 48-50 – 52 – 53 – 54 – 55 – 55 – 57 – 59 - 60 – 60-61 – 64 – 65 – 65 – 65 – 66 – 66 – 66 – 67 – 68-69 – 71 – 73 – 73 – 74 – 74 – 76 – 77 – 77 – 78-80 – 81 – 84 – 85 – 85 – 88 – 89 – 91 – 94 – 97 Solução: Amplitude total (H) H= 97 – 33 = 64 Número de classes (k): k 1 + 3,3 log 50 1 + 3,3 (1,7) 7 classes Amplitude de classe (h): h 64/7 10 A primeira classe inicia-se por 33. Assim, a distribuição de freqüência será: Classes fi fri Fci Xi 33 ⊢ 43 7 0,14 7 38 43 ⊢ 53 5 0,10 12 48 53 ⊢ 63 9 0,18 21 58 63 ⊢ 73 11 0,22 32 68 73 ⊢ 83 10 0,20 42 78 83 ⊢ 93 6 0,12 48 88 93 ⊢103 2 0,04 50 98 Total 50 1,00 - – O histograma e o polígono de freqüência para os dados estão a seguir: Histograma Polígono de freqüências Assim como o gráfico das freqüências acumuladas (agiva): 3 – Medidas Descritivas 1 Introdução A estatística descritiva visa descrever os dados disponíveis da forma mais completa possível sem, no entanto, se preocupar em tirar conclusões sobre um conjunto maior de dados (população). As medidas descritivas básicas mais importantes são as de posição e as de dispersão ou variabilidade. Classificação das medidas descritivas: Medidas descritivas 2 Medidas de tendência central Quando se trabalha com dados numéricos observa-se uma tendência destes de se agruparem em torno de um valor central. Isto indica que algum valor central é característica dos dados e que o mesmo pode ser usado para descrevê-los e representá-los. As medidas de tendência central são: média, mediana e moda. 2.1 Média aritmética [Simbologia: ] É a mais utilizada das medidas de tendência central para descrever, resumidamente, um conjunto de dados. Média aritmética para dados não-tabelados A média aritmética consiste na soma de todas as observações Xi dividida pelo número "n" de observações do grupo. Propriedades da média aritmética: A soma dos desvios em relação à média é nula; A média de uma constante é igual à constante; A média do produto de uma constante por uma variável é igual ao produto da constante pela média da variável; A soma dos quadrados dos desvios em relação à média é um mínimo. Exemplo: Para os dados do Exemplo 1, determinar a média aritmética. Média aritmética para dados tabelados Se os dados estiverem agrupados em uma tabela de freqüências, pode-se obter a média aritmética da distribuição, calculando-se: onde: Xi = ponto médio da classe i; fi = a freqüência absoluta da classe i. Exemplo: Para os dados do Exemplo 1 e 2, determinar a média aritmética . No exemplo 1: No exemplo 2: 2.2 Mediana [Simbologia: Md ou ] A mediana divide em duas partes o conjunto das observações ordenadas. Colocando-se os valores em ordem crescente ou decrescente, a mediana é o elemento que ocupa o valor central. 50% Md 50% rol crescente Xmín Xmáx Mediana para dados não-tabelados Procedimento no caso de dados brutos: Colocam-se os dados em ordem (rol); Se o número de elementos "n" for ímpar, a mediana será o elemento central que ocupa a posição do rol; Exemplo: Determinar a mediana para os dados do Exemplo 1. Se "n" for par, a mediana será a média aritmética entre os dois elementos centrais que ocupam as posições e do rol. Primeiro se faz o rol: 10 – 11 – 11 – 11 – 12 – 12 – 12 – 12 – 13 – 13 – 13 – 13 – 13 – 14 – 14 – 14 – 14 – 14 – 14 – 14 – 15 – 15 – 16 – 17. Como n = n° par, encontra-se os termo n/2 e n/2 + 1. Os números que ocupam as posições 12° e 13° são os mesmos, então Md = 13. Mediana para dados tabelados Procedimento no caso de distribuição por ponto: Calcula-se a posição da mediana: PMd = (n par) ou PMd = (n ímpar); onde: n=fi = número total de observações; PMd = posição da mediana. Se “n” é ímpar, a mediana será o valor de Xi correspondente à primeira Fci PMd; Se “n” é par, a mediana será o valor de Xi correspondente à primeira Fci > PMd. Caso Fci = PMd, será a média entre o valor de Xi correspondente a esta Faci e o próximo valor de Xi. Exemplo: Determinar a mediana para os dados do Exemplo 1. Solução: Calcula-se PMd, como n = n° par, obtém-se o termo n/2; Como a 1ª Fci maior que 12 é 13, a mediana será o Xi correspondente a essa Fci, logo Md = 13. Procedimento no caso de distribuição por classe: Calcula-se a posição da mediana: PMd = ; A mediana estará localizada na classe onde, pela primeira vez, Fci PMd; Para encontrar o valor da mediana aplica-se a seguinte fórmula: onde: Li = limite inferior da classe que contém a mediana; Fci = freqüência acumulada da classe anterior à classe que contém a mediana; h = amplitude da classe que contém a mediana; fMd = freqüência da classe que contém a mediana. Exemplo: Determinar a mediana para os dados do Exemplo 2. Solução: Primeiro se acha em qual classe esta o termo PMd. O 25° termo se encontra na 4ª classe, assim 2.3 Moda [Simbologia: Mo ou ] A moda de um grupo de observações é definida como a medida de freqüência máxima ou é (são) o(s) valor(es) que se repete(m) mais vezes. Pode ser utilizada para dados qualitativos. Moda para dados não-tabelados A moda será o valor mais freqüente no conjunto de dados, podendo, este mesmo conjunto, possuir mais de uma moda (bimodal ou plurimodal), ou ainda, não apresentar moda (amodal). Exemplo: Ache as modas dos seguintes conjuntos de dados. a) 5,40 1,10 0,42 0,73 0,48 1,10 b) 27 27 27 55 55 55 88 88 99 c) 1 2 3 6 7 8 9 10 Solução: O número 1,10 é a moda porque é o valor que ocorre mais freqüentemente. Os números 27 e 55 são ambos, modas porque ocorrem com a mesma maior freqüência. Esse conjunto de dados é bimodal porque tem duas modas. Não há moda, porque nenhum valor se repete. Moda para dados tabelados Quando a distribuição é por ponto, a determinação da moda é imediata pela simples inspeção da tabela, já que a Mo é o valor de freqüência máxima. Quando a distribuição de freqüências é por intervalo, pode-se calcular a moda bruta que é o ponto médio da classe de maior freqüência (método rudimentar). Exemplo: Determinar a moda para os dados do Exemplo 1 e 2. Solução: No exemplo 1, a moda é o elemento com a maior freqüência, o 14. No exemplo 2, a moda é o valor de Xi da classe onde ocorre a maior freqüência, neste caso o 68. Observações importantes: Não há regra fixa para se escolher entre a média, a mediana e a moda. Entretanto algumas observações podem ser feitas quanto à utilização das mesmas. A média aritmética é a medida de tendência central mais utilizada, principalmente quando não há valores aberrantes (muito extremos) no conjunto de dados, sendo a medida mais conveniente para cálculos posteriores; A mediana deve ser usada, sempre que possível, como medida representativa de distribuições fortemente assimétricas, ou seja, quando os valores extremos do conjunto são muito distantes dos outros, pois o seu valor não é afetado por estes valores; A moda é usada quando há interesse em saber o ponto de concentração do conjunto ou o tipo de distribuição que se está analisando, sendo que o seu valor, em se tratando de dados agrupados, é fortemente afetado pela maneira como as classes são constituídas. 3 Separatrizes São valores de posição, que dividem o rol. As principais medidas separatrizes são: mediana, quartis, decis e centis ou percentis. 3.1 Quartis [Simbologia: Qi] Os quartis dividem um conjunto de dados em quatro partes iguais. Assim: 0% 25% 50% 75% 100% |--------------------|--------------------|--------------------|--------------------| Q1 Q2 =Md Q3 onde: Q1 = primeiro quartil e separa os primeiros 25% dos 75% restantes; Q2 = segundo quartil ou mediana e separa o conjunto de dados em 2 partes iguais; Q3 = terceiro quartil e separa os primeiros 75% dos 25% restantes. Quartis para dados não-tabelados Procedimento no caso de dados brutos: Colocam-se os dados em ordem (rol); Calcula-se a posição do quartil através da fórmula: PQi = i .; O quartil será o valor que ocupa, no rol, a posição calculada anteriormente. Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 1. Solução: Calcula-se a posição do elemento. O 6° e 18° elementos são Q1 12 e Q3 14 respectivamente. Quartis para dados tabelados Procedimento no caso de distribuição por ponto: Calcula-se a posição do quartil PQi = i .= i .; O quartil será o valor de Xi correspondente à primeira Fci PQi. Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 1. Calcula-se a posição do elemento. O 6° e 18° elementos são Q1 12 e Q3 14 respectivamente. Procedimento no caso de distribuição por classe: Calcula-se a posição do quartil PQi = i . = i .; O quartil estará localizado na classe onde, pela primeira vez, Fci PQi; Para encontrar o valor do quartil aplica-se a seguinte fórmula: onde: Li. = limite inferior da classe que contém o respectivo quartil; Fci = freqüência acumulada da classe anterior à classe que contém o quartil; h = amplitude da classe que contém o quartil; fQi = freqüência da classe que contém o quartil. Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 2. Solução: No exemplo 2, calcula-se a posição do elemento. Após verifica-se a classe onde se encontra cada posição. O Q1 encontra-se na 3ª classe e o Q3 encontra-se na 5ªclasse. Assim: 3.2 Decis [Simbologia: Di] São valores que dividem o conjunto das observações em 10 (dez) partes iguais. Para encontrar o valor do decil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do decil, a fórmula será: PDi = i .= i . Para encontrar o valor do decil quando os dados estão agrupados em classe, a fórmula será: 3.3 Percentis [Simbologia: Pi] São valores que dividem o conjunto das observações em 100 partes iguais. Para encontrar o valor do percentil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do percentil, a fórmula será: Ppi = i .= i . Para encontrar o valor do percentil quando os dados estão agrupados em classe, a fórmula será: 4 Medidas de dispersão As medidas de dispersão visam descrever os dados no sentido de informar o grau de dispersão ou afastamento dos valores observados em torno de um valor central. Elas indicam se um conjunto é homogêneo (pouca ou nenhuma variabilidade) ou heterogêneo (muita variabilidade). A descrição do conjunto de dados é mais completa quando se considera além de uma medida de tendência central, uma medida de dispersão ou variação, porque é comum encontrar-se séries que, apesar de apresentarem a mesma média, são compostas de maneiras diferentes, o que mostra que as medidas de tendência central são insuficientes para descrever adequadamente uma série estatística. Algumas medidas de variação são: a amplitude de variação, o desvio médio, a soma de quadrados, a variância, o desvio padrão e o coeficiente de variação. Classificação das medidas de dispersão: 4.1 Amplitude de variação [Simbologia: H] É a diferença entre o maior e o menor valor do conjunto, sendo a mais simples das medidas de dispersão, porém de grande instabilidade, porque considera somente os valores extremos do conjunto. Também é chamada de desvio extremo. H = Xmáx. - Xmín. Exemplo: Determinar H para os dados do Exemplo 1 e 2. Solução: Para o exemplo 1: = 17 – 10 = 7 Para o exemplo 2: = 98 – 38 = 60 4.2 Desvio médio [Simbologia: Dm] É a média aritmética dos valores absolutos dos desvios tomados em relação à média ou à mediana. Considera-se o módulo de cada desvio, , evitando-se, com isso, que . Desvio médio para dados não tabelados Desvio médio para dados tabelados O desvio médio é preferido em relação ao desvio padrão, quando esse for indevidamente influenciado pelos desvios extremos. Exemplo: Determinar Dm para os dados do Exemplo 1 e 2. Solução: Para o exemplo 1: Para o exemplo 2; 4.3 Soma de quadrados [Simbologia: SQ] A soma de quadrados refere-se a soma dos quadrados dos desvios em relação à média: 4.4 Variância [Simbologia ] A variância populacional (2) é a soma de quadrados dividida pelo número de observações N: Quando a variância é calculada a partir de uma amostra para fins de estimação, o denominador passa a ser (n - 1), o que nos fornece uma estimativa imparcial da variância populacional. Variância para dados não-tabelados = O denominador (n - 1) é denominado de "graus de liberdade" dessa estimativa. Exemplo: Determinar a variância para os dados do Exemplo 1. Solução: Propriedades da variância A variância de uma constante é zero; s2(k) = 0 A variância da soma ou diferença de uma constante k com uma variável é igual a variância da variável; s2(k + X) = s2(X) A variância da soma de variáveis independentes é igual a soma das variâncias das variáveis; s2(X + Y) = s2(X) + s2(Y) A variância do produto de uma constante por uma variável é igual ao produto do quadrado da constante pela variância da variável. s2(k.X) = k2. Variância para dados tabelados s2 = ou s2 = Exemplo: Determinar a variância para os dados do Exemplo 1 e 2. Solução: No exemplo 1, No exemplo 2, 4.5 Desvio padrão [Simbologia ] O desvio padrão é uma das medidas mais úteis da variação de um grupo de dados. A vantagem do desvio padrão sobre a variância, é que este permite uma interpretação direta da variação do grupo, pois o mesmo é expresso na mesma unidade em que estão expressas as medidas observadas. O desvio padrão é a raiz quadrada da variância, então, é calculado por: . Exemplo: Determinar o desvio padrão amostral para os dados do Exemplo 1 e 2. Para os dados de medição, especialmente em grandes amostras (n 30), verifica-se que, cerca de 68% das observações estarão entre ; 95% das observações estarão entre e praticamente 100% entre . Solução: No exemplo 1, . No exemplo 2, . 4.6 Coeficiente de variação [Simbologia: CV ou CV%] O coeficiente de variação é uma medida de dispersão relativa, utilizada quando se deseja comparar a variação de conjuntos de dados que apresentem diferentes unidades de medição e ou tamanhos diferentes, pois o coeficiente de variação independe da unidade de medida dos dados. O coeficiente de variação pode também ser expresso como percentagem da média. ou Exemplo: Determinar o CV para os dados do Exemplo 1 e 2. Solução: No exemplo 1, No exemplo 2, 5 Assimetria e curtose As medidas de assimetria e curtose complementam as medidas de posição e de dispersão no sentido de proporcionar uma descrição e compreensão mais completa das distribuições de freqüências. Estas distribuições não diferem apenas quanto ao valor médio e à variabilidade, mas também quanto a sua forma (assimetria e curtose). 5.1 Assimetria Assimetria é o grau de desvio, afastamento da simetria ou grau de deformação de uma distribuição de freqüências. Se a curva de freqüências de uma distribuição tem uma "cauda" mais longa à direita da ordenada máxima do que à esquerda, diz-se que a distribuição é desviada para a direita ou que ela tem assimetria positiva. Se ocorrer o inverso, diz-se que ela é desviada para a esquerda ou tem assimetria negativa. Os coeficientes de assimetria servem para medir o “grau” de deformação da distribuição. Coeficiente de assimetria de Pearson [Simbologia: C.A.] Intensidade da assimetria: < 0,2: simetria; 0,2 < < 1,0: assimetria fraca; > 1,0: assimetria forte. Interpretação: Coeficiente negativo: distribuição assimétrica negativa (à esquerda), sendo < Md < Mo; Coeficiente nulo: distribuição simétrica, sendo = Md = Mo; Coeficiente positivo: distribuição assimétrica positiva (à direita), sendo > Md > Mo. Exemplo: Determinar a assimetria para os dados do Exemplo 1 e 2. Solução: No exemplo 1: ; . Os dados apresentam assimetria fraca. No exemplo 2: ; ; Os dados apresentam simetria. 5.2 Curtose É o grau de achatamento (afilamento) de uma curva em relação à curva normal, tomada como padrão. Uma distribuição pode ser classificada quanto à curtose, como segue: Platicúrtica: a curva é mais achatada do que a normal ( ou s grandes); Mesocúrtica: a curva é normal ( ou s intermediários); Leptocúrtica: a curva é mais alta do que a normal ( ou s pequenos). Para medir o grau de curtose de uma distribuição, podem-se usar dois tipos de medidas: Coeficiente centílico de curtose [Simbologia: K] onde: Q1 = o primeiro quartil; Q3 = o terceiro quartil; D1 = o primeiro decil; D9 = o nono decil. Interpretação: K < 0,263 curva leptocúrtica; K = 0,263 curva mesocúrtica; K > 0,263 curva platicúrtica. Exemplo: Determinar a curtose para os dados do Exemplo 1 e 2 . Solução: No exemplo 1, primeiro se encontra o D1 e D9; PD1 = 1. = 2,4 ou seja, o D1 = 11; PD9 = 9. = 21,6 ou seja, o D9 = 15; Após calcula-se o coeficiente centílico de curtose , então a curva é leptocúrtica. No exemplo 2, primeiro se encontra o D9 e D1; PD1 = 1 . = 5 ou seja, PD9 = 9 . = 45 ou seja, Após calcula-se o coeficiente centílico de curtose: , então a curva é leptocúrtica. 4 – Probabilidade 1 Introdução O trabalho estatístico se desenvolve a partir da observação de determinados fenômenos e emprega dados numéricos relacionados aos mesmos, para tirar conclusões que permitam conhecê-los e explicá-los a ponto de poder, com determinado grau de crença, obter o desenvolvimento teórico do fenômeno. Para tanto é necessário que se formule um modelo que ajude a melhor elucidá-lo. No campo da estatística, os modelos matemáticos utilizados são denominados, modelos não-determinísticos ou probabilísticos, ou seja, que avaliam com que probabilidade os resultados podem ocorrer. 2 Noções de experimento, espaço amostral e eventos 2.1 Experimento aleatório [Simbologia: E] É uma das realizações do fenômeno sob observação. Se o fenômeno seguir um modelo não-determinístico, tem-se um experimento aleatório, com as seguintes características: O experimento pode ser repetido; Embora não seja possível afirmar que resultado em particular ocorrerá, é possível descrever o conjunto de todos os resultados possíveis do experimento; À medida que aumenta o número de repetições aparece uma certa regularidade que torna possível a construção de um modelo matemático. 2.2 Espaço amostral [Simbologia: S] É o conjunto de todos os possíveis resultados de um experimento aleatório. Evento [Simbologia: A, B, C, ...] É qualquer subconjunto do espaço amostral de um experimento. Tipos de eventos: Eventos mutuamente exclusivos: dois eventos A e B são denominados mutuamente exclusivos, se eles não puderem ocorrer juntos, isto é, AB = ; Eventos complementares: são os eventos que se completam em relação ao espaço amostral, isto é, A= S, onde é o evento complementar de A; Eventos impossíveis: são eventos que não possuem elementos no espaço amostral, isto é, A = e P(A) = 0; Eventos certos: são eventos que possuem todos os elementos do espaço amostral, isto é, A = S e P(A) = 1; Eventos independentes: são eventos que podem ocorrer simultaneamente, isto é, AB e P(AB) = P(A) . P(B) Eventos dependentes: são eventos em que a ocorrência de um deles está condicionada à ocorrência de outro, acontece um evento se o outro já ocorreu, isto é, AB e P(AB) = P(A) . P(B/A), com P(A) 0. 3 Álgebra de eventos Podem-se combinar os eventos da mesma maneira que se faz com os conjuntos: Se A e B forem dois eventos, A B significa que A e B ocorrem; Se A e B forem dois eventos, A B significa que A ou B ocorrem Exemplo: Lance um dado e uma moeda. Construa o espaço amostral Enumere os seguintes eventos A = {coroa, marcado por número par} B = {cara, marcado por número ímpar} C = {múltiplos de 3} Expresse os eventos A ou B ocorrem B e C ocorrem Verifique dois a dois os eventos A, B e C e diga quais são mutuamente exclusivos. Solução: C = coroa, K = cara: S = {(1,C);(2,C);(3,C);(4,C);(5,C);(6,C);(1,K);(2,K);(3,K);(4,K);(5,K);(6,K)}; A = {(2,C);(4,C);(6,C)}; B = {(1,K);(3,K);(5,K)}; C = {(3,C);(6,C);(3,K);(6,K)}. = {(1,C);(2,C);(3,C);(4,C);(5,C);(6,C);(2,K);(4,K);(6,K)}; A B = {(2,C);(4,C);(6,C);(1,K);(3,K);(5,K)}; B C = {(3,K)}; = {(1,C);(3,C);(5,C);(2,K);(4,K);(6,K)}. A B = , são mutuamente exclusivos; A C = {(6,C)}, não são mutuamente exclusivos; B C = {(3,K)}, não são mutuamente exclusivos. 4 Conceitos de probabilidade Interpretação como freqüência relativa, definição clássica e definição axiomática. O problema fundamental da probabilidade consiste em: “atribuir um número a cada evento A, o qual avaliará as chances de ocorrência de A quando o experimento for realizado”. 4.1 Conceito empírico É uma interpretação da probabilidade como freqüência relativa. Repetindo-se um experimento E um grande número de vezes e calculando-se a freqüência relativa do evento A, obtém-se um número "p" que pode ser tomado como a probabilidade da ocorrência de A, que nesse caso, poderia ser tomada como: P(A) = 4.2 Definição clássica de probabilidade É válida para espaços amostrais finitos e equiprováveis. Se todos os resultados de um espaço amostral finito forem igualmente prováveis, ou seja, admitindo-se que S possa ser escrito sob a forma S = {a1, a2, .... , ak}, então, a cada evento formado por um resultado simples (ai) associa-se um número "pi", denominado probabilidade de A, que satisfaça as seguintes condições: pi 0; P(S) = p1 + p2 + .... + pk = ; , já que todos os resultados são igualmente prováveis. Disto decorre que, para qualquer evento A constituído de r resultados simples, tem-se: P(A) = r . 1/k = , sendo que: P(A) = = r / k Pela definição clássica de probabilidade devida a Laplace: seja E um experimento aleatório que dá origem a k resultados mutuamente excludentes e igualmente possíveis. Seja A um evento constituído por r resultados de E. A probabilidade de ocorrer o evento A é definida como sendo a razão r/k”. 4.3 Definição axiomática Seja E um experimento e S um espaço amostral associado a E. A cada evento A associa-se um número real representado por P(A) e denominado probabilidade de A, que satisfaça aos seguintes axiomas: 0 P(A) 1; P(S) = 1; Se A e B forem eventos mutuamente excludentes, então: P(A B) = P(A) + P(B); Se A1, A2, ... , An,... forem dois a dois eventos mutuamente excludentes, então: Exemplo: Um lote é formado por 10 peças boas, 4 com defeitos leves e duas com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que: a) ela não tenha defeitos graves; b) ela não tenha defeitos; c) ela seja boa ou tenha defeitos graves. P(Ai) = P(A1) + P(A2) + ... + P(An) + ... Solução: Adotando dl = peça com defeito leve; b = peça boa; dg = peça com defeito grave: P() = P(dl b) = P(dl) + P(b) = 10/16 + 4/16 = 14/16; b) P(b) = 10/16; c) P(b dg) = 10/16 + 2/16 = 12/16. Teoremas fundamentais: Teorema 1: se for um evento (conjunto) vazio, então: P() = 0; Teorema 2: se for um evento complementar de A, então: P() = 1 - P(A); Teorema 3: se A e B forem eventos quaisquer, então: P(A B) = P(A) + P(B) - P(A B); Teorema 4: se A e B forem eventos de um espaço amostral S e se A B, então: P(A) P (B). Exemplo: A probabilidade de uma mulher estar viva daqui a 30 anos é 3/4 e de seu marido é 3/5. Calcular a probabilidade de: a) apenas o homem estar vivo; b) somente a mulher estar viva; c) pelo menos um estar vivo; d) ambos estarem vivos. Solução: Adotando os eventos: M = a mulher estar viva daqui há 30 anos; H = o homem estar vivo daqui há 30 anos. a P( H) = P() x P(H) = 1/4 x 3/5 = 3/20; b) P(M ) = P(M) x P() = 3/4 x 2/5 = 6/20; c) P(H M) = P(H) + P(H) – P(H M) = 3/5 + 3/4 - 3/5 x 3/4 = 18/20. 5 Probabilidade condicionada Seja A e B dois eventos associados a um experimento E. Denota-se por P(B/A), a probabilidade do evento B, condicionada a ocorrência do evento A. Sempre que se calcula a P(B/A), se está, essencialmente, calculando P(B) em relação ao espaço reduzido A e utiliza-se a seguinte fórmula, onde P(A) 0: P(B/A) = com P(A) 0, pois A já ocorreu. Pode-se escrever também, através do teorema do produto: P(AB) = P(A/B) . P(B) e P(BA) = P(B/A) . P(A) Que representa uma alternativa para o cálculo da probabilidade da interseção de dois eventos. Exemplo: Uma urna contém cinco bolas pretas, três vermelhas e duas brancas. Foram extraídas 3 bolas sem reposição. Qual a probabilidade de terem sido duas bolas pretas e uma vermelha? Solução: Sendo os eventos: P = bolas pretas, V = bolas vermelhas e B = bolas brancas; P(P P V) + P(P V P) + P(V P P) = 6 Independência estatística Se a ocorrência ou não do evento A, não afetar a probabilidade de ocorrência do evento B e vice-versa, diz-se que A e B são independentes. É compreensível que os eventos A e B sejam inteiramente não relacionados. Saber que B ocorreu não fornece qualquer informação sobre a ocorrência de A. De fato, o cálculo seguinte mostra isso: Se A e B forem independentes, pode-se escrever: P(A/B) = P(A) e P(B/A) = P(B) Nesse caso, usando-se a expressão anterior para P(AB), tem-se: P(AB) = P(A/B) . P(B) = P(A) . P(B) P(AB) = P(B/A) . P(A) = P(A) . P(B) Chegando-se à condição de independência, na qual A e B serão eventos independentes se e somente se: P(AB) = P(A) . P(B) Exemplo: As probabilidades de 3 jogadores marcarem um penalty são respectivamente 2/3 , 4/5 e 7/10. Se cada um “cobrar” uma única vez, qual a probabilidade de: a) todos acertarem; b) apenas uma certar; c) todos errarem. Solução: Considerando A o jogador 1 acertar, B o jogador 2 acertar e C o jogador 3 acertar, temos: P(A B C) = P(A) + P(B ) + P(C) = P() = 7 Teorema de Bayes P(B1/A) = , onde: P(A) = P(A/B1) . P(B1) + P(A/B2) . P(B2) + ... + P(A/Bk) . P(Bk) = probabilidade total P(B1/A) = P(B1/A) = Generalizando-se essa aplicação para Bi: onde: P(Bi) = probabilidades à priori (conhecidas); P(A/ Bi) = probabilidades condicionais (conhecidas); P(Bi/A) = probabilidades à posteriori. Esse resultado é conhecido como teorema de Bayes. É também denominada fórmula da probabilidade das causas ou dos antecedentes. Desde que os Bi`s constituam uma partição do espaço amostral, um e somente um, dos eventos Bi ocorrerá. Portanto, a expressão acima nos dá a probabilidade de um particular Bi dado que o evento A tenha ocorrido. A fim de aplicar esse teorema, deve-se conhecer os valores dos Bi`s, sendo que, se esses valores são desconhecidos, fica impossibilitada a sua aplicação. Exemplo: Três máquinas, A, B e C produzem respectivamente 0,4, 0,5 e 0,1 do total de peças de uma fábrica. As porcentagens de peças defeituosas nas respectivas máquinas são de 3/100, 5/100 e 2/100. Uma peça é sorteada ao acaso e verifica-se que é defeituosa. Qual a probabilidade de que a peça tenha vindo da máquina B? Solução: P(A) = 0,4; P(B) = 0,5; P(C) = 0,1; P(def/A) = ; P(def/B) = ; P(def/C) = ; Deseja se calcular P(B/def): Resumo das propriedades do cálculo de probabilidades 5 – Variáveis Aleatórias 1 Noções sobre variáveis aleatórias Ao descrever o espaço amostral de um experimento, nem sempre o resultado individual será um número, embora, muitas vezes haja interesse na mensuração de alguma característica e no seu registro numérico. Para que seja possível a utilização dos recursos da estatística descritiva, é necessária uma função, que transforme o espaço amostral não-numérico em um espaço amostral numérico. Sendo assim, considerando-se E um experimento e S o espaço amostral associado ao experimento, a função X, que associa a cada elemento s S, um número real, X(s) é denominada variável aleatória. Desse modo, tem-se uma função definida no espaço amostral, chamada de variável aleatória. 2 Variáveis aleatórias discretas [Simbologia: VAD] Seja X uma variável aleatória. Se o número de valores possíveis de X, Rx (contra-domínio de X) for finito ou infinito numerável (números naturais ou inteiros), denomina-se X de variável aleatória discreta. As variáveis aleatórias discretas surgem, em geral, de medidas de enumeração ou contagem, como por exemplo, número de pontos obtidos em um teste, número de insetos por planta, número de peças boas, número de pessoas que votam, número de erros em contas, etc. S = { s1, s2, ... , sn } RX 2.1 Função de probabilidade [Simbologia: f(X)] É a probabilidade de que a variável aleatória assuma o valor x. Se X é uma variável aleatória, a cada possível valor xi de X (x1, x2, x3, ....), associa-se um número p(xi) = P(X = xi), ou ainda, P(X=x1), P(X=x2), P(X= x3), denominado probabilidade de xi. A função que associa probabilidades não-nulas aos possíveis valores da variável aleatória e zero aos demais valores é denominada função de probabilidade. X x1 x2 x3 ... xn P(X) p(x1 ) p(x2) p(x3) ... p(xn ) Os números p(xi) devem satisfazer as seguintes condições: p(xi) > 0, i; p(xi) = 1. Representação gráfica: gráfico de bastões 2.2 Valor esperado ou média de uma variável aleatória discreta [Simbologia: E(X) ou (X)] Se X é uma VAD, define-se valor esperado de X, como: E(X) = 2.3 Variância de uma variável aleatória discreta [Simbologia: V(X) ou 2] Se X é uma VAD, define-se a variância de X, como: V(X) = = onde: E(X2) = Exemplo: Para o lançamento de duas moedas determine a distribuição de probabilidades do número de caras e após encontre a E(X) e V(X). Solução: Fazendo C= cara e K = coroa e sendo x igual ao número de caras obtidas, tem-se: S = {(C,C);(C,K);(K,C);(K,K)} Associando: x = 0 – nenhuma cara; x = 1 – uma cara; e x = 2 – duas caras; tem-se: x 0 1 2 → x 0 1 2 p(x) 1/4 2/4 1/4 p(x) 1/4 1/2 1/4 Graficamente E(X) = = cara V(X) = = cara2 3 Variáveis aleatórias contínuas [Simbologia: VAC] Seja X uma variável aleatória. Suponha que Rx (contradomínio de X), seja um intervalo ou uma coleção de intervalos. Neste caso, diz-se que X é uma variável aleatória contínua. As variáveis aleatórias contínuas, geralmente, surgem de dados de medições, como por exemplo, comprimento, peso, altura, temperatura, etc.. 3.1 Função densidade de probabilidade [Simbologia: f(X)] Seja X uma VAC, a função densidade de probabilidade f(x), é uma função que satisfaz as condições: f(x) 0, x Rx; = 1. Além disso, para qualquer c < d em RX: P(c < X <d) = . Comentários: P (c < X < d) representa a área sob a curva da função, f(x) entre X = c e X = d; P(X = k) = ; P(c < X < d) = P (c X d) = P (c < X d) = P (c X < d). 3.2 Valor esperado ou média de uma variável aleatória contínua [Simbologia: E(X) ou (X)] Se X é uma VAC, o valor esperado de X é definido por: E(X) = 3.3 Variância de uma variável aleatória contínua [Simbologia: V(X) ou 2] Se X é uma VAC, define-se a variância de X, como: Exemplo: Seja Pede-se: a) encontrar K; b) encontrar P(1≤ x ≤ 2); c) determinar E(X) e V(X); V(X) = onde: E(X2) = Solução: a) ; b) === c) E(X) = == == 1,875 V(X) = = - 1,8752 = - 3,515625 = 4,125 – 3,515625 = 0,609375. 4 Modelos probabilísticos para variáveis aleatórias Os valores possíveis de uma variável aleatória e suas respectivas probabilidades determinam a distribuição de probabilidade da variável aleatória. Algumas, por apresentarem características semelhantes, nos permitem estabelecer um modelo teórico para determinar a solução de certos problemas. Para variáveis aleatórias discretas, os modelos estudados serão: Binomial e Poisson. 4.1 Distribuição binomial A distribuição binomial tem as seguintes características: São realizadas n repetições independentes e do mesmo tipo do experimento E (n ensaios de Bernoulli); Cada repetição do experimento E admite apenas 2 resultados: sucesso ou fracasso; A probabilidade de sucesso em cada repetição do experimento é sempre igual a p. Assim, considerando “n” tentativas independentes de um mesmo experimento aleatório, uma particular amostra aleatória conterá k sucessos e (n-k) fracassos, com probabilidades associadas p e q, respectivamente. A probabilidade total será dada por p + q =1. Como qualquer seqüência com k sucessos e (n-k) fracassos terá a mesma probabilidade de ocorrência, resta-nos saber quantas se pode formar. Para isto calcula-se , que é o número de seqüências possíveis que podem ocorrer. Definição: A variável aleatória discreta X tem comportamento binomial com “n” repetições de E e probabilidade de sucesso p, cuja função de probabilidade é dada por: onde: k = 0, 1, 2, ..., n; k = 1 . 2 . 3 . ... . k. A esperança e a variância são dadas por: E(X) = n.p e VAR(X) = n.p.q Exemplo: Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de: a) dar 5 caras; b) pelo menos uma cara; c) no máximo 2 caras. Notação: X ~ b(n, p) Solução: Sabe-se que: n = 8, p = 1/2 e q = 1/2. Y = número de caras (sucesso). ; b) c) 4.2 Distribuição de Poisson Esta distribuição é muito usada quando se deseja contar o número de eventos de um certo tipo, que ocorrem em um intervalo de tempo, superfície ou volume, como por exemplo: número de falhas em um computador em certo dia; número de chamadas telefônicas durante meio dia; número de relatórios de acidentes enviados a uma seguradora em uma semana, etc.. Sua aplicação aparece freqüentemente em problemas de fila de espera, controle de estoques, controle de qualidade, programação de equipamentos, etc.. O modelo foi desenvolvido pelo matemático francês Poisson. Definição: A variável aleatória X tem distribuição de Poisson, com parâmetro > 0, se: onde: é o número médio de eventos ocorridos no intervalo considerado; k = 0, 1, 2, 3, .......; e 2,7183; k = 1 . 2 . 3 . ... . k. A esperança e a variância são dadas por: E(X) = e VAR(X) = Notação: X ~ P() A distribuição binomial pode ser aproximada para a Poisson, com = n . p, da seguinte forma: quando o tamanho da amostra n é bastante grande (n ) e a probabilidade p é pequena (p 0). Na prática, quando n > 30 e p < 0,05. A seguir, são apresentados alguns modelos para variáveis aleatórias contínuas. Exemplo: Em média há 2 chamadas por hora num certo telefone. Calcular a probabilidade de se receber no máximo 3 chamadas em 2 horas e a probabilidade de nenhuma chamada em 90 minutos. Solução: λ = 2 chamadas/hora. a) P(X ≤ 3(2h)) = P(X = 0(2h)) + P(X = 1(2h)) + P(X = 2(2h)) + P(X = 3(2h)) = = = 0,0183 + 0,0732 + 0,1464 + 0,1953 = 0,433. b) P(X=0(1,5h)) = = 0,0498. 4.3 Distribuição normal A distribuição normal também é conhecida como distribuição de Gauss. É um dos mais importantes modelos de probabilidade para variáveis aleatórias contínuas, sendo aplicado em inúmeros fenômenos e muito utilizado no desenvolvimento teórico em na área de inferência estatística. Definição: A variável aleatória contínua X tem distribuição normal, se a função densidade de probabilidade for: , onde: = média populacional; 2 = variância populacional. A esperança ou média e a variância são os parâmetros da distribuição normal, dados por: E(X) = e VAR(X) = 2. Notação: X ~ N (, 2) A distribuição normal tem as seguintes características: A curva da distribuição tem forma de sino e é simétrica em relação à média ; Na medida em que os pontos se afastam da média , a curva torna-se assintótica, ou seja, ela se aproxima bastante do eixo horizontal, mas não chega a tocá-lo; A área total sobre a curva é 1, devido ao fato da mesma ser uma função densidade de probabilidade; O ponto máximo da função corresponde à média . Para calcular uma probabilidade associada à distribuição normal faz-se: P (a < X < b) = dx Para evitar o uso de integrais, os principais valores das probabilidades podem ser encontrados numa tabela da curva normal, construída através de uma padronização. Esta padronização transforma qualquer valor da variável X numa escala Z, sendo que Z representa número de desvios padrões de afastamento em relação à média. A fórmula para a padronização de X em Z é: sendo que os valores de Z e suas respectivas áreas de probabilidade estão tabelados. Exemplo: Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio padrão 10. Determine a probabilidade de um indivíduo submetido ao teste ter nota: a) maior que 120; b) maior que 80; c) entre 85 e 115; d) maior que 100; e) entre 110 e 120; f) menor que 75 e g) igual a 90. Solução: a) P(X > 120) = P (Z > Z1) = P(Z > 2) = 0,5 – 0,4772 = 0,0228. P(X > 80) = P (Z > Z1) = P(Z > -2) = 0,5 + 0,4772 = 0,9772. e P(75 < X < 115) = P (Z1 < Z < Z2) = P(-1,5 < Z < 1,5) = 0,4332 + 0,4332 = 0,8664. P(X > 80) = P (Z > Z1) = P(Z > 0) = 0,5 + 0,0000 = 0,5000. e P(110 < X < 120) = P (Z1 < Z < Z2) = P(1 < Z < 2) = 0,4772 - 0,3413 = 0,1359. P(X < 75) = P (Z < Z1) = P(Z > -2,5) = 0,5 – 0,4938 = 0,0062. Não é possível calcular a área sobre um ponto, portanto a probabilidade é zero. Exemplo: Certo produto tem peso médio de 10g e desvio-padrão 0,5g. É embalado em caixas de 120 unidades que pesam em média 150g e desvio-padrão 8g. Qual a probabilidade de que uma caixa cheia pese mais de 1.370g? Solução: Peso do produto: μp = 10 e σp = 0,5; Peso da caixa: μc = 150 e σc = 8. A média da caixa cheia é μtotal = 120x10 + 150 = 1350. A variância da caixa cheia é = 120x(0,5)2 + (8)2 = 140,8. Portanto, o desvio-padrão será σtotal = = 11,86 Então: P(X > 1.370) = P (Z > Z1) = P(Z > 1,69) = 0,5 – 0,4545 = 0,0455. 4.4 Distribuição Qui - Quadrado (2) Sejam X1, ....., Xn, variáveis aleatórias independentes, normalmente distribuídas, com média zero e variância 2. Uma variável aleatória: 2 = X12 + .....+ Xn2, ou seja, a soma quadrática das variáveis normais e independentes, segue a distribuição de Qui-quadrado, com “” graus de liberdade. Esta distribuição possui aplicações muito importantes em Inferência Estatística, em testes não-paramétricos, testes de aderência e independência, entre outras. A distribuição Qui-quadrado (2) tem as seguintes características: É sempre positiva e assimétrica; Para n , a distribuição Qui-quadrado aproxima-se da normal; Para = 1, a distribuição Qui-quadrado é igual à normal. A esperança e a variância são dadas por: E(X) = e VAR(X) = 2 Uso da tabela: o “corpo” da tabela fornece valores de “2”, a partir de uma probabilidade e do número de graus de liberdade . Exemplo: Considere uma distribuição Qui-quadrado, com 23 graus de liberdade. Determine: a) a média; b) a variância; c) o desvio-padrão; Solução: a) Média: μ () = 23; b) Variância: = 2x23 = 46; c) Desvio-padrão:= . 4.5 Distribuição “t” de Student A distribuição normal depende de dois parâmetros e 2, mas muitas vezes, não se conhece a variância da população (2) e as investigações e análises são feitas a partir de amostras, que são extraídas desta população. Nessas condições, o desvio padrão da amostra será um estimador de , e então utiliza-se a distribuição t de Student. A distribuição “t” de Student tem as seguintes características: É usada no caso de pequenas amostras (n<30); a partir de amostras maiores que 30, pode-se usar a distribuição normal, pois ambas tornam-se praticamente iguais; Sua curva representativa é semelhante à da normal, sendo simétrica em relação à ordenada máxima, apresentando as extremidades com maior comprimento; A área sob a curva da distribuição “t” é igual a 1; A esperança e a variância são dadas por: E(X) = 0 e VAR(X) = Uso da tabela: “corpo” da tabela fornece valores de “t”, a partir de uma probabilidade e do número de graus de liberdade . Exemplo: Considere uma distribuição t com parâmetro 23. Determine: a) a média; b) a variância; c) o desvio-padrão. Solução: Observando na tabela, considerando v = 23 e α =0,05, encontrasse o número 2,3979. a) A média μ (t23) = 0; b) A variância σ2 (t23) = ; c) O desvio-padrão σ (t23) = ; 4.6 Distribuição “F” (Fisher) Sejam duas amostras independentes, retiradas de populações que seguem a distribuição normal. Se as amostras fornecem variâncias s12 e s22 e deseja-se conhecer a distribuição amostral do quociente entre as mesmas, pode-se utilizar a distribuição F de Snedecor, conhecendo-se os graus de liberdade 1 e 2, respectivamente: Esta distribuição é usada num dos testes mais importantes em estatística, que é a Análise de Variância. A curva da distribuição tem origem no zero e é assimétrica. Uso da tabela: na 1a linha encontra-se o número de graus de liberdade do numerador 1 e na 1a coluna, o número de graus de liberdade do denominador 2. No “corpo” da tabela, onde ocorre o cruzamento dos graus de liberdade, está o valor crítico que deixa à sua direita, determinada área . Para cada valor de tem-se uma tabela. Exemplo: Admite uma distribuição F com v1 = 8, v2 = 10 e α = 5%. Determine a média, a variância, o desvio-padrão e a moda. Solução: A média é dada por: ; A variância é dada por: ; O desvio-padrão é dado por: A moda é dada por: 6 – Amostragem 1 Introdução Em pesquisas científicas, quando se deseja conhecer características de uma população, é comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter valores aproximados, ou estimativas, para as características populacionais de interesse. Esse tipo de pesquisa é usualmente chamado de levantamento por amostragem. Num levantamento por amostragem, a seleção dos elementos que serão observados, deve ser feita sob uma metodologia adequada, de tal forma que os resultados da amostra sejam representativos de toda a população. 1.1 Definição de amostragem A amostragem é definida como sendo o processo de seleção de amostra(s) de uma população, podendo ser probabilística ou não-probabilística. A amostragem é probabilística quando a seleção da amostra é feita de forma aleatória, sendo que cada elemento da população tem uma probabilidade conhecida de participar desta amostra. A amostragem é não-probabilística quando há uma escolha deliberada dos elementos da amostra. Este tipo de amostragem pode prejudicar a representatividade da mesma em relação à população. 1.2 Importância da utilização da amostragem Quatro razões para o uso de amostragem em levantamentos de grandes populações: Economia: em geral, torna-se bem mais econômico o levantamento de somente uma parte da população; Tempo: numa pesquisa eleitoral, faltando três dias para a eleição, não haveria tempo suficiente para pesquisar toda a população de eleitores do país, mesmo que houvesse recursos financeiros em abundância; Confiabilidade dos dados: quando se pesquisa um número reduzido de elementos, pode-se dar mais atenção aos casos individuais, evitando erros nas respostas; Operacionalidade: é mais fácil realizar operações de pequena escala. Um dos problemas típicos nos grandes censos é o controle dos entrevistadores. 1.3 Situações em que pode não valer à pena a realização de uma amostragem População pequena: sob o enfoque de amostragens aleatórias, se a população for pequena, para uma amostra ser capaz de gerar resultados precisos para os parâmetros da população, é necessário que ela seja relativamente grande (em torno de 80% da população); Característica de fácil mensuração: talvez a população não seja tão pequena, mas a variável que se quer observar é de tão fácil mensuração, que não compensaria investir num plano de amostragem; Necessidade de alta precisão: a cada dez anos o IBGE realiza um censo demográfico para estudar diversas características da população brasileira. Dentre estas características tem-se o parâmetro número de habitantes residentes no país, que é fundamental para um bom planejamento. Desta forma, o parâmetro: número de habitantes precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população. Para se construir um plano de amostragem deve-se ter bem definidos: os objetivos da pesquisa, a população a ser amostrada, bem como os parâmetros necessários a serem estimados para que os objetivos da pesquisa sejam alcançados. Num plano de amostragem deve constar a definição da unidade de amostragem, a forma de seleção dos elementos da população e o tamanho da amostra. 1.4 Tipos de investigação Segundo o critério da participação do investigador: Levantamento: observação sem interferência no processo que está ocorrendo; Experimento: quando há interferência no processo para verificar como ele ocorre. Segundo o critério do objetivo: Descritivo: apenas para conhecer o universo; Analítico: desejando analisar possíveis relações. Qual o procedimento (método de levantamento) que produzirá os resultados mais precisos e de um modo mais barato? 2 Tipos de amostragem probabilística 2.1 Amostragem aleatória simples Para a seleção de uma amostra aleatória simples é necessário ter o conjunto de todos os elementos da população e enumerá-los. Este tipo de amostragem consiste em selecionar a amostra através de um sorteio, sem restrição. Na amostragem aleatória simples, cada elemento da população tem a mesma probabilidade de pertencer à amostra, sendo que as tabelas de números aleatórios facilitam o processo de seleção dos números que identificarão os elementos que irão compor a amostra. Estas tabelas são formadas por sucessivos sorteios de algarismos do conjunto {0, 1, 2, ..., 9}, com reposição. Considera-se: N = número de elementos (tamanho) da população; n = número de elementos (tamanho) da amostra. 2.2 Amostragem sistemática Muitas vezes é possível obter uma amostra de características parecidas com a amostra aleatória simples, através do processo de amostragem sistemático, de maneira mais rápida e fácil, desde que a população se encontre, naturalmente, ordenada. Procedimento: Calcula-se o intervalo de amostragem k = N/n, aproximando-o para o inteiro mais próximo; Utilizando-se a tabela dos números aleatórios, sorteia-se um número x dentro do primeiro intervalo de amostragem (1 a k); A amostra será composta pelos elementos correspondentes aos números x, x + k, x + 2k,..., x + (n-1)k. 2.3 Amostragem estratificada A técnica da amostragem estratificada consiste em dividir a população em k subgrupos denominados de estratos. Estes estratos devem ser internamente mais homogêneos do que a população toda, com respeito as variáveis em estudo. Sobre os diversos estratos da população, são realizadas seleções aleatórias, de forma independente. A amostra completa é obtida através da agregação das amostras de cada estrato, considerando-se: N = N1 + N2 + ... + Nk = n = n1 + n2 + ... + nk = onde: k = número de estratos. Amostragem estratificada proporcional Neste caso particular de amostragem estratificada, a proporcionalidade do tamanho de cada estrato da população é mantida na amostra, pois: n / N = ni / Ni Quando, no problema em estudo, são identificados estratos, uma amostra obtida através do processo de amostragem estratificada proporcional tende a gerar resultados mais precisos, quando comparada com uma amostra aleatória simples. Amostragem estratificada uniforme A amostragem estratificada uniforme costuma ser usada em situações em que o maior interesse é obter estimativas separadas para cada estrato, quando os estratos têm aproximadamente o mesmo tamanho (N1 N2 ... Nk), ou ainda, quando se deseja comparar diversos estratos. Sendo assim, seleciona-se a mesma quantidade de elementos em cada estrato, ou seja, n1 = n2 = ... = nk , sendo ni calculado utilizando-se a seguinte fórmula: ni = n / k Exemplo: Como o objetivo de levantar o estilo de liderança preferido pela comunidade de uma escola, vamos realizar um levantamento por amostragem. A população é a seguinte: Professores: P1, P2, P3, P4, P5, P6, P7, P8, P9, P10 Servidores: S1, S2, S3, S4, S5, S6, S7, S8, S9, S10 Alunos: A1, A2, A3, A4, A5, A6, A7, A8, A9, A10, A11, A12, A13, A14, A15, A16, A17, A18, A19, A20, A21, A22, A23, A24, A25, A26, A27, A28, A29, A30 Suponha que a preferência quanto ao estilo de liderança possa ser relativamente homogêneo dentro de cada categoria. Identifique quais serão os professores, os servidores e os alunos que farão parte da amostra de tamanho 10 por meio de uma a.a.s. utilizando a 1ª linha da tabela. Solução: 50/10 = 5, 20% da população são de professores, 20% de servidores e 60% de alunos, portanto retira-se 2 professores, 2 servidores e 6 alunos. Assim: P3, P4, S9, S6, A7, A20, A12, A28, A19, A9. 3 Distribuição por amostragem Consideram-se todas as possíveis amostras de tamanho “n” retiradas da população. Para cada amostra calcula-se a estatística de interesse, obtendo-se, desta maneira, uma distribuição desses resultados, originando uma Distribuição por Amostragem. Assim, podem-se obter as distribuições por amostragem da média, da variância, da proporção e de outras estatísticas. 3.1 Amostragem com ou sem reposição Se o processo de retirada for com reposição, = número de amostras de tamanho “n” que poderão ser extraídas da população de tamanho N; Se o processo de retirada for sem reposição, o número combinatório = número de amostras de tamanho “n”, que poderão ser extraídas da população de tamanho N. 3.2 Distribuição amostral das médias Admita-se que todas as amostras possíveis de tamanho “n” são retiradas, sem reposição, de uma população finita de tamanho N. Se a média e o desvio padrão da distribuição amostral das médias forem designados por , e os valores correspondentes da população o forem por e , respectivamente, então: Se a população for infinita, ou se a amostragem for tomada com reposição, os resultados anteriores reduzem-se a: onde: = erro padrão da distribuição amostral das médias, indicando a dispersão da distribuição, sendo que, quanto maior a amostra, menor é o erro padrão da amostragem. 4 Determinação do tamanho da amostra Em pesquisas, uma etapa de grande importância é a determinação do tamanho da amostra que será utilizada para o levantamento dos dados. A determinação do tamanho da amostra depende de três fatores: Nível de confiança (1-): o pesquisador é que vai determinar o nível de confiança que deseja; Precisão (eo): em toda experimentação ou pesquisa, a utilização da amostragem está condicionada a um erro amostral, que corresponde à diferença entre as estimativas amostrais e os parâmetros populacionais; Tipo de investigação: depende das características populacionais a serem investigadas. Serão apresentadas aqui as fórmulas para o cálculo do tamanho de amostras quando se deseja estimar a média ou a proporção de uma população. 4.1 Para estimar a média populacional Variância populacional conhecida População Infinita População Finita Exemplo: Que tamanho deve ter uma amostra para que possamos estimar a média da glicemia em pessoas normais, com 99% de confiança, desejando que os limites do intervalo não difiram entre si de mais de 2 mg/100ml e sabendo que o desvio padrão deve estar em torno de 4 mg/100ml. Solução: peças. Exemplo: Suponha que a variável escolhida num estudo seja o peso de certa peça e que a população tenha 600 peças. Pelas especificações do produto, o desvio padrão é de 10 Kg. Determine o tamanho de amostra de peças admitindo um nível de confiança de 95% e um erro amostral de 1,5 Kg. Solução: peças. Quando não se conhece o desvio padrão da população, pode-se substituí-lo pelo da amostra, que é obtido através de uma pré-amostra (amostra piloto), de tamanho n1. Assim, tem-se: Variância populacional desconhecida População Infinita População Finita onde: = n1 – 1 graus de liberdade. Considerações após o cálculo do tamanho da amostra: Se n < n1, então a pré-amostra (amostra piloto) selecionada, de tamanho n1, foi suficiente para garantir a precisão desejada; Exemplo 1: Uma pré-amostra de 20 elementos, retirada ao acaso de uma população aproximadamente normal, apresentou a distribuição de freqüência a seguir. Qual deve ser o tamanho da amostra que avalie a média populacional com erro máximo de 0,5 unidades e = 10%? Classes fi 0 |- 2 1 2 |- 4 5 4 |- 6 10 6 |- 8 3 8 |- 10 1 Se n > n1, deve-se completar a pré-amostra, acrescentando elementos até atingir o valor de “n”, que garanta a precisão desejada. Solução: Calcula-se primeiro a média, a variância para achar o desvio padrão da pré-amostra; . Exemplo: Para estimar o preço médio, uma amostra de 6 produtos foi retirada, sem reposição, de uma população aproximadamente normal, com 150 produtos e forneceu s2 = R$ 10,00. Qual deve ser o tamanho de uma amostra, para que a estimativa do preço médio forneça um
Compartilhar