Baixe o app para aproveitar ainda mais
Prévia do material em texto
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística -UFSM UFS ANAELENA BRAGANÇA DE MORAES LUCIANE FLORES JACOBI ROSELAINE RUVIARO ZANINI CADERNO DIDÁTICO ESTATÍSTICA Santa Maria UFSM 2008 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística -UFSM UFS Ficha catalográfica elaborada por Rosa Maria Fristsch Feijó CRB-10/662 Biblioteca Central – UFSM E84e Moraes, Anaelena B. Estatística : caderno didático / Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini. – Santa Maria : UFSM, CCNE, De partamento de Estatística, 2001. 56 p. 1. Estatística I. Jacobi, Luciane F. II. Zanini, Roselaine R. III. Título. CDU : 519.22/.25:311 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM i Sumário 1 - Conceitos Iniciais 1 1.1 Conceito de estatística 1 1.2 Divisão da estatística 1 1.3 População 1 1.4 Amostra 2 1.5 Dados estatísticos 2 1.6 Variável 2 1.7 Níveis de mensuração de uma variável 2 1.8 Arredondamento de dados 3 1.9 Método estatístico 4 1.10 Representação tabular 5 1.11 Séries estatísticas 5 1.12 Representação gráfica 6 2 – Distribuições de Freqüências 8 Representação de variáveis 8 1.1 Discretas 8 1.2 Contínuas 8 2 Alguns conceitos básicos 9 2.1 Dados brutos 9 2.2 Rol 9 2.3 Amplitude total 9 2.4 Classe 9 2.5 Limites de classe 9 2.6 Amplitude de classe 9 2.7 Ponto médio de classe 9 2.8 Tipos de freqüências 9 2.9 Exemplos de distribuições de freqüências 10 2.10 Gráficos representativos de uma distribuição de freqüências em classes 10 3 – Medidas Descritivas 14 Introdução 14 2 Medidas de tendência central 14 2.1 Média aritmética 14 2.2 Mediana 15 2.3 Moda 16 3 Separatrizes 17 3.1 Quartis 17 3.2 Decis 18 3.3 Percentis 19 4 Medidas de dispersão 19 4.1 Amplitude de variação 19 4.2 Desvio médio 20 4.3 Soma de quadrados 20 4.4 Variância 20 4.5 Desvio padrão 22 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM ii 4.6 Coeficiente de variação 22 5 Assimetria e curtose 22 5.1 Assimetria 22 5.2 Curtose 23 4 – Probabilidade 25 1 Introdução 25 2 Noções de experimento, espaço amostral e eventos 25 2.1 Experimento aleatório 25 2.2 Espaço amostral 25 2.3 Evento 25 3 Álgebra de eventos 25 4 Conceitos de probabilidade 26 4.1 Conceito empírico 26 4.2 Definição clássica de probabilidade 26 4.3 Definição axiomática 27 5 Probabilidade condicionada 27 6 Independência estatística 28 7 Teorema de Bayes 29 8 Resumo das propriedades do cálculo de probabilidades 29 5 – Variáveis Aleatórias 30 1 Noções sobre variáveis aleatórias 30 2 Variáveis aleatórias discretas 30 2.1 Função de probabilidade 30 2.2 Valor esperado ou média de uma variável aleatória discreta 30 2.3 Variância de uma variável aleatória discreta 31 3 Variáveis aleatórias contínuas 31 3.1 Função densidade de probabilidade 31 3.2 Valor esperado ou média de uma variável aleatória contínua 32 3.3 Variância de uma variável aleatória contínua 32 4 Modelos probabilísticos para variáveis aleatórias 32 4.1 Distribuição binomial 32 4.2 Distribuição de Poisson 33 4.3 Distribuição normal 34 4.4 Distribuição Qui-quadrado (χ2) 35 4.5 Distribuição “t” de Student 36 4.6 Distribuição “F” (Fisher) 36 6 – Amostragem 37 1 Introdução 37 1.1 Definição de amostragem 37 1.2 Importância da utilização da amostragem 37 1.3 Situações em que pode não valer à pena a realização de uma amostragem 37 1.4 Tipos de investigação 37 2 Tipos de amostragem probabilistica 38 2.1 Amostragem aleatória simples 38 2.2 Amostragem sistemática 38 2.3 Amostragem estratificada 39 3 Distribuição por amostragem 39 3.1 Amostragem com ou sem reposição 40 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM iii 3.2 Distribuição amostral das médias 40 4 Determinação do tamanho da amostra 40 4.1 Para estimar a média populacional 40 4.2 Para estimar uma proporção populacional 42 7 – Estimação de Parâmetros 43 1 Introdução 43 2 Estimativas pontuais e intervalares 43 3 Tipos de intervalos 43 3.1 Intervalo de confiança para a média µ 43 3.2 Intervalo de confiança para a proporção populacional p 44 3.3 Intervalo de confiança para a diferença de médias populacionais µ1 e µ2 44 3.4 Intervalo de confiança para a diferença de proporções populacionais p1 e p2 45 8 – Testes de Hipóteses Paramétricos 46 1 Introdução 46 2 Hipóteses estatísticas 46 3 Testes de hipóteses 46 3.1 Hipóteses 46 3.2 Tipos de erros 46 3.3 Nível de significância do teste 47 3.4 Graus de liberdade 47 3.5 Teste bilateral 47 3.6 Teste unilateral 47 3.7 Probabilidade exata do teste 47 3.8 Procedimento para a realização de um teste de hipóteses 48 4 Testes de hipóteses paramétricos 48 4.1 Teste para uma média com variância populacional σ2 conhecida 48 4.2 Teste para uma média com variância populacional σ2 desconhecida 48 4.3 Teste para a proporção populacional p 49 4.4 Teste para a diferença entre duas médias populacionais independentes 49 4.5 Teste para a diferença entre duas amostras dependentes – Teste t pareado 52 4.6 Teste para a diferença entre duas proporções populacionais p1 e p2 52 4.7 Teste para a diferença entre duas variâncias 53 9 – Análise de Variância – ANOVA 54 1 Introdução 54 2 Pressuposições básicas à aplicação da ANOVA 54 3 ANOVA – Uma classificação: amostras de mesmo tamanho 54 4 ANOVA – Uma classificação: amostras de tamanhos diferentes 55 5 Comparação de médias 55 5.1 Teste de Tuckey 56 10 – Testes de Hipóteses Não-Paramétricos 57 1 Teste de adequação 57 2 Teste qui-quadrado de independência 58 3 Coeficiente de contingência 59 11 – Correlação e Regressão Linear Simples 60 1 Análise de correlação linear simples 60 1.1 Estimativa do coeficiente de correlação 61 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM iv 1.2 Teste para o coeficiente de correlação 62 2 Regressão linear simples 63 2.1 Considerações na análise de regressão 63 3 Teste para verificar a significância da regressão 65 4 Coeficiente de determinação ou explicação 66 Referências Bibliográficas 66 Telefone para contato: (055) 3220 8486 sub-ramais 32 ou 33 ou 3220 8612 Departamento de Estatística – CCNE – UFSM http://www.ufsm.br/estat e http://www.ufsm.br/ppgemq Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 1 1 - Conceitos Iniciais 1.1 Conceito de estatística Existem muitas definições propostas por autores, objetivando estabelecer com clareza o que é estatística, como por exemplo: • A estatística é um conjunto de métodos destinados a coleta, organização, resumo, apresentação e análise de dados de observação, bem como a tomada de decisões razoáveis baseadas em tais análises; • A estatística é a matemática aplicada aos dados de observação; • A estatística é um conjunto de processos ou técnicas empregadas na investigação e análise de fenômenos coletivos oude massa. 1.2 Divisão da estatística A estatística divide-se em: ⎪⎩ ⎪⎨ ⎧ ⎩⎨ ⎧ adaaplicstatísticaE lInferenciaouIndutivaaEstatístic DescritivaaEstatístic cametodológiougeralaEstatístic Estatística geral Visa elaborar métodos gerais aplicáveis a todas as fases do estudo dos fenômenos de massa. A estatística matemática é a parte da estatística geral que tem por finalidade o estudo das propriedades matemáticas dos fenômenos de massa e a dedução e demonstração rigorosa dos procedimentos e fórmulas usadas. A estatística geral ainda pode ser dividida em dois grandes campos: Estatística descritiva Trata da coleta, da organização, classificação, apresentação e descrição dos dados de observação. Refere-se à maneira de apresentar um conjunto de dados em tabelas e gráficos e à maneira de resumir, através de certas medidas, as informações contidas nestes dados. Estatística indutiva ou inferencial Visa tirar conclusões sobre a população a partir de amostras. Refere-se à maneira de estabelecer conclusões para toda uma população quando se observar apenas parte desta população. Estatística aplicada É todo o ramo do conhecimento científico que proceda, única ou principalmente, por intermédio da metodologia estatística. Exemplos: Biometria (ciência que trata da mensuração da vida e dos processos vitais), Demografia, Econometria, Psicometria (mensuração da personalidade, do desenvolvimento mental e do comportamento de indivíduos e grupos e seus ajustamentos a mudanças no meio ambiente), Mecânica Estatística, Sociometria (maneira como as pessoas vivem, sua cultura, opiniões e atitudes, assim como o relacionamento de uns com os outros). Algumas aplicações da estatística A estatística é uma ciência de múltiplas aplicações e de fundamental importância no campo da investigação científica, sendo de utilização cada vez mais acentuada em qualquer atividade profissional. Então, é razoável que os profissionais de diversas áreas adquiram um mínimo de conhecimento técnico sobre estatística que possibilitem a compreensão de termos como: variabilidade, regressão, correlação, significância, etc. que aparecem com freqüência em artigos de publicações especializadas. 1.3 População É todo o conjunto de elementos que possuam ao menos uma característica comum observável. Obs.: elementos = objetos, animais, pessoas, material contínuo (sólido, líquido ou gás). Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 2 1.4 Amostra É uma parte da população, sendo que a mesma deve ser selecionada de acordo com algum critério para que possa ser representativa da população. 1.5 Dados estatísticos São as características observadas ou medidas nos elementos, sendo que os dados de observação constituem a matéria-prima da estatística. 1.6 Variável É um símbolo, como X, Y, Z, ..., que pode assumir resultados de um conjunto, que lhe são atribuídos, conjunto este chamado domínio da variável. Se a variável pode assumir somente um valor, ela é denominada constante. As variáveis podem ser classificadas em: • Variáveis qualitativas ou atributos: indica alguma propriedade do fenômeno de observação; • Variáveis quantitativas discretas: quando podem assumir apenas alguns valores de um conjunto; • Variáveis quantitativas contínuas: quando podem assumir, teoricamente, qualquer valor de um conjunto. Em geral, as medições dão origem a variáveis contínuas, enquanto que as enumerações ou contagens resultam em variáveis discretas. Solução: a) Variável quantitativa contínua; b) Variável quantitativa contínua; c) Variável quantitativa discreta; d) Variável quantitativa contínua; e) Variável quantitativa discreta; f) Variável qualitativa. 1.7 Níveis de mensuração de uma variável Nível de mensuração significa a escala em que foi medida a variável, objeto de investigação. São quatro os níveis de mensuração: nominal, ordinal, intervalar e de razão. Nível nominal A mensuração, em seu mais baixo nível, existe quando números ou outros símbolos são utilizados para classificar um elemento. Estes números ou símbolos constituem uma escala nominal ou classificadora. As únicas estatísticas aplicáveis são: a moda e as freqüências. Nível ordinal Pode ocorrer que os elementos em uma categoria de dada escala não sejam apenas diferentes dos elementos de outras categorias da mesma escala, mas que guardem certo tipo de “relação” com eles. Isto é, a variável em estudo é partida em categorias ordenadas em graus convencionados havendo uma relação entre categorias do tipo: “maior do que”. Pode-se calcular a mediana e todas as estatísticas de postos, além da moda e das freqüências. Exemplo: Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas). a) quantidade de alcatrão em cigarros; b) altitude de um avião; c) número de assinantes de um serviço de computador on-line; d) precipitação pluviométrica durante um ano; e) salário dos funcionários de uma empresa; f) gênero dos filhos de casais residentes em uma cidade. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 3 Nível intervalar Quando a escala tem todas as características de uma escala ordinal, e, além disso, se conhecem as distâncias entre dois números quaisquer da escala, então se consegue uma mensuração consideravelmente mais forte que a ordinal. Atribui-se à variável um número real, uma unidade constante e comum de mensuração. A unidade de mensuração e o ponto zero são arbitrários. A escala intervalar é a primeira escala verdadeiramente quantitativa. Neste nível todas as estatísticas paramétricas comuns são aplicáveis. Nível de razão Quando uma escala tem todas as características de uma escala de intervalos e, além disso, tem um verdadeiro ponto zero como origem, é chamada escala de razão. Como no nível anterior, todas as estatísticas são aplicáveis. Solução: a) Nível ordinal; b) Nível de razão; c) Nível nominal; d) Nível intervalar; e) Nível intervalar; f) Nível ordinal; g) Nível nominal; h) Nível razão; i) Nível ordinal; j) Nível nominal. 1.8 Arredondamento de dados Arredondar um número significa reduzir a quantidade de algarismos significativos após a vírgula, deste número. O objetivo é reduzir os erros por arredondamento, quando é grande o volume de números a arredondar. A Portaria 36, de 6 de agosto de 1965 do Instituto Nacional de Pesos e Medidas, estabelece os seguintes critérios para o arredondamento de dados. Regras de arredondamento • Quando o primeiro algarismo após aquele que será arredondado for 0, 1, 2, 3, 4, conserva-se o algarismo a ser arredondado e desprezam-se os seguintes; • Quando o primeiro algarismo após aquele que será arredondado for 6, 7, 8, 9 ou 5, este último seguido de outros algarismos, onde pelo menos, um é diferente de zero, aumenta-se uma unidade no algarismo a ser arredondado e desprezam-se os seguintes; • Quando o primeiro algarismo após aquele que será arredondado for 5, seguido de zeros, conserva-se o algarismo a ser arredondado se ele for par, ou aumenta-se uma unidade, se ele for ímpar, desprezando os seguintes. Par ← 5 → Ímpar ↓ ↓ Conserva Soma uma unidade 0, 1, 2, 3 ou 4 6, 7, 8, 9 ou 5+ Exemplo: Determine o nível de mensuração mais adequado (nominal, ordinal, intervalar ou razão). a) classificação como: acima da média, médio ou abaixo da média para encontros marcados com desconhecidos; b) conteúdo de nicotina (em miligramas) de cigarros; c) números de inscrição do INSS; d) temperaturas (em graus Celsius); e) anos em que ocorreram eleições presidenciais; f) graus finais (A, B, C, D, F) de estudantes de estatística; g) códigos de endereçamento postal(CEP); h) rendas anuais de enfermeiras; i) carros classificados como subcompacto, compacto, intermediário ou grande; j) cores de uma amostra de confetes M&M. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 4 Solução: a) 33,56; b) 9,52; c)10,32; d) 63,49; e) 6,72; f) 0,99 1.9 Método estatístico Quando se pretende empreender um estudo estatístico completo, existem diversas fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais do estudo. Fases do método estatístico • Definição do problema: a primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do problema a ser estudado. Além de considerar detidamente o problema objeto do estudo, o analista deverá examinar outros levantamentos realizados no mesmo campo e análogos, uma vez que parte da informação de que necessita pode, muitas vezes, ser encontrada nesses últimos. • Planejamento da pesquisa: o passo seguinte, após a definição do problema, compreende a fase do planejamento, que consiste em se determinar o procedimento necessário para resolver o problema e, em especial, como levantar informações sobre o assunto objeto do estudo. É nessa fase que será escolhido o tipo de levantamento a ser utilizado. Outros elementos importantes que devem ser tratados nessa mesma fase são o cronograma das atividades, através do qual são fixados os prazos para as várias fases, os custos envolvidos, o exame das informações disponíveis, o delineamento da amostra e a forma como serão escolhidos os dados. • Coleta ou levantamento dos dados: o terceiro passo é essencialmente operacional, compreendendo a coleta das informações propriamente ditas. Formalmente, a coleta de dados se refere à obtenção, reunião e registro sistemáticos de dados, com um objetivo determinado. • Crítica e digitação dos dados: antes de começar a analisar os dados, é conveniente que lhes seja dado algum tratamento prévio, a fim de torná-los mais expressivos. È um trabalho de condensação e de tabulação dos dados, que chegam ao analista de forma desorganizada, tornando impossível a tarefa de apreender todo o seu significado pela simples leitura. • Organização e representação dos dados: a apresentação ou exposição dos dados observados constitui a quinta fase do método estatístico. Há duas formas de apresentação, que não se excluem mutuamente: a) a apresentação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado, segundo algumas regras práticas adotadas pelos diversos sistemas estatísticos; b) a apresentação gráfica dos dados numéricos constitui uma apresentação geométrica. Embora a apresentação tabular seja de extrema importância, no sentido de facilitar a análise numérica dos dados, não permite ao analista obter uma visão tão rápida, fácil e clara do fenômeno e sua variação como a conseguida através de um gráfico. • Análise dos dados e interpretação dos resultados: a última fase do trabalho estatístico é a mais importante e também a mais delicada. Nesta etapa, o interesse maior reside em tirar conclusões que auxiliem o pesquisador a resolver seu problema. A análise dos dados estatísticos está ligada essencialmente ao cálculo de medidas, cuja finalidade principal é descrever o fenômeno. Assim, o conjunto de dados a ser analisado pode ser expresso por números-resumos, as estatísticas, que evidenciam características particulares desse conjunto. Exemplo: Dado os valores abaixo, fazer o arredondamento para décimo. a) 33,5630; b) 9,5194; c) 10,32500; d) 63,4850000001; e) 6,7153; f) 0,9880; Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 5 1.10 Representação tabular Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A elaboração de tabelas deve obedecer às normas editadas pelo Instituto Brasileiro de Geografia e Estatística - IBGE. Abaixo se apresenta uma tabela esquemática sendo indicados os seus elementos. Título: O quê?; Onde?; Quando? Cabeçalho Total ÍColuna Indicadora Corpo da tabela Total ⎪⎭ ⎪⎬ ⎫ :Nota * :Fonte Chama de Rodapé No rodapé de uma tabela podem aparecer, se necessário: a fonte (entidade responsável pelas informações contidas na tabela), notas (observações gerais sobre a tabela) e/ou chamadas (observações feitas em relação a pontos específicos da tabela sendo os símbolos usados: *, **, ...; ’, ”, ...; i, ii, ... e k). 1.11 Séries estatísticas Uma série estatística é um conjunto de dados ordenados segundo uma característica comum, sendo apresentadas sob forma de tabela e/ou gráfico. A classificação de uma série é feita de acordo com a variação de três elementos que a compõem: a espécie (o fenômeno), o local (o lugar onde o fenômeno acontece) e a época (fator temporal ou cronológico a que se refere o fenômeno). O nome da série depende do(s) elemento(s) que varia(m). Assim, pode-se ter uma série específica, geográfica, temporal, mista ou uma distribuição de freqüências. Exemplos de séries Série específica (série simples): Tabela - Freqüências e porcentagens dos 2.000 empregados da Companhia MB, segundo o grau de instrução Grau de instrução Freqüência (ni) Porcentagem Fundamental 650 32,50 Médio 1.020 51,00 Superior 330 16,50 Total 2.000 100,00 Fonte: Dados hipotéticos Série geográfica-específica (série composta ou mista): Tabela - Opinião da população, por local de residência, sobre um projeto governamental Local de residência Total Opinião Urbano Suburbano Rural A favor 30 35 35 100 Contra 60 25 15 100 Total 90 60 50 200 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 6 1.12 Representação gráfica Um gráfico é toda a forma de representação das séries estatísticas que seja baseada no desenho. O gráfico deve ser atraente para cumprir sua finalidade de mostrar resultados e bem construído para permitir a análise do fenômeno exposto. A fim de que isso aconteça, deve-se observar alguns aspectos básicos como: simplicidade, clareza e veracidade. Do mesmo modo que nas tabelas estatísticas, nos gráficos, deve-se considerar um título que informe a espécie, o lugar e o tempo do fenômeno representado, bem como a fonte de onde foram coletados os dados expostos. Gráficos analíticos Pontos Linhas Simples Classificação Barras Sobrepostas dos gráficos Justapostas analíticos Superfície Simples Colunas Sobrepostas Justapostas Setores Exemplos de gráficos Gráfico de pontos 0 2 4 6 8 10 0 1 2 3 4 5 6 7 8 9 Variável X Va riá ve l Y Gráfico de linha 0 2 4 6 8 10 1 2 3 4 5 6 7 8 9 Variável X Va riá ve l Y Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 7 Gráfico de colunas 0 2 4 6 8 10 1 2 3 4 5 6 7 8 9 Variável X Va riá ve l Y Gráfico de colunas justapostas 0 2 4 6 8 10 1 2 3 4 5 6 7 Variável X Va riá ve l Y Seqüência1 Seqüência2 Gráfico de colunas sobrepostas 0 2 4 6 8 10 1 2 3 4 5 6 7 Variável X Va riá ve l Y Série2 Série1 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 8 Gráfico de barras 0 1 2 3 4 5 6 7 8 9 1 2 3 45 6 7 Variável B Variável A Gráfico de setores A B C 2 – Distribuições de Freqüências Uma distribuição de freqüência é uma tabela que reúne o conjunto de dados, conforme as freqüências ou as repetições de seus valores. Esta tabela pode representar os dados em classes ou não, de acordo com a classificação dos dados em discretos ou contínuos. 1 Representação de variáveis 1.1 Discretas Neste caso, representam-se as observações numa tabela de freqüências, não agrupadas em classes, designadas de séries de magnitude por ponto. É útil quando a série apresenta poucos valores distintos. 1.2 Contínuas Neste caso, utiliza-se também a tabela de freqüências, mas sob forma de intervalos, mesmo que isto sacrifique algum detalhe na ordenação de valores individuais. É útil quando a série apresenta muitos valores distintos. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 9 2 Alguns conceitos básicos 2.1 Dados brutos São os valores originais conforme eles foram coletados, não estando ainda prontos para análise, pois não estão numericamente organizados ou tabelados. 2.2 Rol É uma lista, onde as observações são dispostas em uma determinada ordem: crescente ou decrescente. O objetivo da ordenação é tornar possível a visualização das variações ocorridas, uma vez que os valores extremos são percebidos de imediato, e também facilitar a construção da distribuição de freqüências. ⎥⎯⎯⎯⎯→⎯⎯⎯⎯⎯⎢ rol crescente Xmín Xmáx 2.3 Amplitude total [Simbologia: H, At ou R] É a diferença entre o maior e o menor valor observado da variável em estudo: H = Xmáx - Xmín 2.4 Classe É cada um dos grupos ou intervalos de valores em que se subdivide a amplitude total do conjunto de tamanho n. Para a determinação do número de classes, existem diversos métodos, dentre os quais destaca-se a regra de Sturges, que estabelece que o número de classes (k) é calculado por: k = 1 + 3,3 log n. O analista deverá ter em mente que a escolha do número de classes dependerá antes da natureza dos dados e da unidade de medida em que eles forem expressos, do que de regras muitas vezes arbitrárias e pouco flexíveis. Recomenda-se considerar 4 ≤ k ≤ 12. 2.5 Limites de classe São os dois valores extremos de cada classe. • Limite inferior (Li.): é o menor valor da classe considerada; • Limite superior (Ls.): é o maior valor da classe considerada. 2.6 Amplitude de classe [Simbologia: h] É a diferença entre o limite superior e o limite inferior da classe, ou seja: • h = Ls – Li, quando a distribuição de freqüências já existe; ou • h = H/k, para a determinação da amplitude das classes de uma distribuição de freqüências a ser construída. 2.7 Ponto médio de classe [Simbologia: Xi] É a média aritmética dos limites da classe. É o valor representativo da classe: 2 LL X ii sii += . 2.8 Tipos de freqüências Para construção de uma tabela de distribuição de freqüência é necessário conhecer alguns de seus termos: ⎪⎪ ⎪ ⎩ ⎪⎪ ⎪ ⎨ ⎧ ⎪⎪⎩ ⎪⎪⎨ ⎧ ⎩⎨ ⎧ ⎩⎨ ⎧ ⎩⎨ ⎧ Relativa Absoluta eDecrescent Relativa Absoluta Crescente Acumulada Relativa Absoluta Simples sfreqüênciadeTipos Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 10 Freqüência absoluta [Simbologia: fi] É o número de observações que aparece em uma classe ou valor individual. Freqüência relativa [Simbologia: fri] É o quociente entre a freqüência absoluta e o número total de observações, sendo que: ∑ = = k 1i i i r f ff i ou 100 f f%f k 1i i i ri ⋅= ∑ = , onde: 0 < fr < 1; f r i k i= ∑ 1 = 1. Freqüência acumulada crescente [Simbologia: faci ou Fci] É a soma de todas as freqüências anteriores com a freqüência do intervalo considerado. 2.9 Exemplos de distribuições de freqüências Por ponto: Valores Freqüências (fi) 10 7 15 12 20 14 25 8 30 10 Total 51 Por intervalo: Preço, em R$, de certo produto Preço (R$) fi 6 ⊢ 8 2 8 ⊢ 10 5 10 ⊢ 12 10 12 ⊢ 14 6 14 ⊢ 16 3 16 ⊢ 18 2 Total 25 ? 2.10 Gráficos representativos de uma distribuição de freqüências em classes Histograma É um gráfico de colunas justapostas, cujas alturas são proporcionais às freqüências absolutas e cujas bases correspondem ao intervalo de classe da distribuição. Limites superiores Limites inferiores Classes Freqüências das classes Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 11 Expected Normal Histograma Classes Fr eq üê nc ia s 0 1 2 3 4 5 6 7 8 9 10 11 0 2 4 6 8 10 12 14 16 18 20 Polígono de freqüências É um gráfico de linha, cujos vértices são proporcionais às freqüências absolutas e correspondem aos pontos médios das classes da distribuição. Polígono de freqüências Pontos médios das classes Fr eq üê nc ia s 0 1 2 3 4 5 6 7 8 9 10 11 0 2 4 6 8 10 12 14 16 18 20 Ogiva É um gráfico de linha, cujos vértices são proporcionais às freqüências acumuladas e correspondem aos limites inferiores das classes da distribuição. Ogiva Classes Fr eq üê nc ia s ac um ul ad as 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 0 2 4 6 8 10 12 14 16 18 20 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 12 Solução: N° de vendas fi fri Fci 10 1 0,042 1 11 3 0,125 4 12 4 0,167 8 13 5 0,208 13 14 7 0,292 20 15 2 0,083 22 16 1 0,042 23 17 1 0,042 24 Total 24 1 O histograma e polígono de freqüência são dados por: Assim como o gráfico das freqüências acumuladas (ogiva): Exemplo 1: A tabela abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um mês, por uma firma comercial. Construa uma distribuição de freqüência por pontos: 14 – 12 – 11 – 13 – 14 – 13 – 12 – 14 – 13 – 14 – 11 – 12 – 12 – 14 – 10 – 13 – 15 – 11 – 15 – 13 – 16 – 17 – 14 – 14. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 13 Solução: Amplitude total: H = 97 – 33 = 64 Número de classes: k = 1 + 3,3 log 50 = 1 + 3,3 (1,7) ≅ 7 classes Amplitude de classe: h = 64/7 ≅ 10 A primeira classe inicia-se por 33. Assim, a distribuição de freqüência será: Classes fi fri Fci 33 ⊢ 43 7 0,14 7 43 ⊢ 53 5 0,10 12 53 ⊢ 63 9 0,18 21 63 ⊢ 73 11 0,20 32 73 ⊢ 83 10 0,20 42 83 ⊢ 93 6 0,12 48 93 ⊢103 2 0,04 50 Total 50 1 – O histograma e o polígono de freqüência para os dados estão a seguir: Assim como o gráfico das freqüências acumuladas (ogiva): Histograma Polígono de freqüências Exemplo 2: Dado o rol de 50 notas (dadas em créditos), agrupar os elementos em classe e construir os gráficos: 33 – 35 – 35 – 39 – 41 – 41 – 42 – 45 – 47 – 48 – 50 – 52 – 53 – 54 – 55 – 55 – 57 – 59 – 60 – 60 – 61 – 64 – 65 – 65 – 65 – 66 – 66 – 66 – 67 – 68 – 69 – 71 – 73 – 73 – 74 – 74 – 76 – 77 – 77 – 78 – 80 – 81 – 84 – 85 – 85 – 88 – 89 – 91 – 94 – 97 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 14 3 – Medidas Descritivas 1 Introdução A estatística descritiva visa descrever os dados disponíveis da forma mais completa possível sem, no entanto, se preocupar em tirar conclusões sobre um conjunto maior de dados (população). As medidas descritivas básicas mais importantessão as de posição e as de dispersão ou variabilidade. Classificação das medidas descritivas: Medidas descritivas ⎪⎪ ⎪ ⎩ ⎪⎪ ⎪ ⎨ ⎧ ⎩⎨ ⎧ ⎩⎨ ⎧ CurtoseeAssimetria,Momentos lativaRe Absoluta Dispersão esSeparatriz centralnciaeˆTend Posição 2 Medidas de tendência central Quando se trabalha com dados numéricos observa-se uma tendência destes de se agruparem em torno de um valor central. Isto indica que algum valor central é característica dos dados e que o mesmo pode ser usado para descrevê-los e representá-los. As medidas de tendência central são: média, mediana e moda. 2.1 Média aritmética [Simbologia: ⎩⎨ ⎧ → →µ amostraX população ] É a mais utilizada das medidas de tendência central para descrever, resumidamente, um conjunto de dados. Média aritmética para dados não-tabelados A média aritmética consiste na soma de todas as observações Xi dividida pelo número "n" de observações do grupo. n X n X...XXX n 1i i n21 ∑ ==+++= Propriedades da média aritmética: • A soma dos desvios em relação à média é nula; ( )∑ =− 0XXi • A média de uma constante é igual à constante; k)k(X = • A média do produto de uma constante por uma variável é igual ao produto da constante pela média da variável; [ ])X(Xk)kX(X ii = • A soma dos quadrados dos desvios em relação à média é um mínimo. ( )∑ − 2i XX < ( )∑ ∀− a,aX 2i ≠ X Exemplo: Para os dados do Exemplo 1, determinar a média aritmética. . 21,13 24 14141716131511151310141212111413141213111214 n X X n 1i i =+++++++++++++++++++++== ∑ = Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 15 Média aritmética para dados tabelados Se os dados estiverem agrupados em uma tabela de freqüências, pode-se obter a média aritmética da distribuição, calculando-se: n fX X k 1i ii∑ == Solução: No exemplo 1: 2,13 24 1x171x162x157x145x134x123x111x10 n fXX k 1i ii =+++++++== ∑ = No exemplo 2: 6,65 50 2x986x8810x7811x689x585x487x38 n fX X k 1i ii =++++++== ∑ = 2.2 Mediana [Simbologia: Md ou X~ ] A mediana divide em duas partes o conjunto das observações ordenadas. Colocando-se os valores em ordem crescente ou decrescente, a mediana é o elemento que ocupa o valor central. 50% Md 50% ⎥⎯⎯⎯⎯⎯→⎯⎯⎯⎯⎯⎢ rol crescente Xmín Xmáx Mediana para dados não-tabelados Procedimento no caso de dados brutos: 1. Colocam-se os dados em ordem (rol); 2. Se o número de elementos "n" for ímpar, a mediana será o elemento central que ocupa a posição 2 1n + ; 3. Se "n" for par, a mediana será a média aritmética entre os dois elementos centrais que ocupam as posições 2 n e n 2 1+ do rol. Solução: Primeiro se faz o rol: 10 – 11 – 11 – 11 – 12 – 12 – 12 – 12 – 13 – 13 – 13 – 13 – 13 – 14 – 14 – 14 – 14 – 14 – 14 – 14 – 15 – 15 – 16 – 17. Como n = n° par, encontra-se os elementos que ocupam as posições: n/2 e n/2 + 1. º12 2 24 2 nPMd === º1312 241 2 nPMd =+=+= Os números que ocupam as posições 12° e 13° são 13 e 13. Assim a mediana será igual a 13. Mediana para dados tabelados a) Procedimento no caso de distribuição por ponto: Exemplo: Determinar a mediana para os dados do Exemplo 1. onde: Xi = ponto médio da classe i; fi = a freqüência absoluta da classe i; ∑ = k 1i if = n Exemplo: Para os dados do Exemplo 1 e 2, determinar a média aritmética Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 16 1. Calcula-se a posição da mediana: PMd = 2 n (n par) ou PMd = 2 1n + (n ímpar); 2. Se “n” é ímpar, a mediana será o valor de Xi correspondente à primeira Fci ≥ PMd; 3. Se “n” é par, a mediana será o valor de Xi correspondente à primeira Fci > PMd. Caso Fci = PMd, será a média entre o valor de Xi correspondente a esta Fci e o próximo valor de Xi. Solução: Calcula-se PMd, como n = n° par, obtém-se o termo n/2; 12º 2 24 2 nPMd === Procura-se a 1ª Fci maior que 12. A mediana será o Xi (valor) correspondente a essa Fci, logo Md = 13. b) Procedimento no caso de distribuição por classe: 1. Calcula-se a posição da mediana: PMd = 2 n ; 2. A mediana estará localizada na classe onde, pela primeira vez, Fci ≥ PMd; 3. Para encontrar o valor da mediana aplica-se a seguinte fórmula: onde: Li = limite inferior da classe que contém a mediana; ( ) Md iMd id f FcPh LM −+= Fci = freqüência acumulada da classe anterior à classe que contém a mediana; h = amplitude da classe que contém a mediana; fMd = freqüência da classe que contém a mediana. Solução: Determina-se em qual posição está a mediana: °=== 25 2 50 2 nPMd elemento (4ª classe). 2.3 Moda [Simbologia: Mo ou Xˆ ] A moda de um grupo de observações é definida como a medida de freqüência máxima ou é (são) o(s) valor(es) que se repete(m) mais vezes. Pode ser utilizada para dados qualitativos. Moda para dados não-tabelados A moda será o valor mais freqüente no conjunto de dados, podendo, este mesmo conjunto, possuir mais de uma moda (bimodal ou plurimodal), ou ainda, não apresentar moda (amodal). Solução: a) O número 1,10 é a moda porque é o valor que ocorre mais freqüentemente. b) Os números 27 e 55 são ambos modas, porque ocorrem com a mesma maior freqüência. Esse conjunto de dados é bimodal porque tem duas modas. c) Não há moda, porque nenhum valor se repete. ( ) ( ) 64,66 11 2125x1063 f FcPh LMd Md iMd i =−+=−+= Exemplo: Determinar a mediana para os dados do Exemplo 1. Exemplo: Determinar a mediana para os dados do Exemplo 2. Exemplo: Ache as modas dos seguintes conjuntos de dados. a) 5,40 1,10 0,42 0,73 0,48 1,10 b) 27 27 27 55 55 55 88 88 99 c) 1 2 3 6 7 8 9 10 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 17 Moda para dados tabelados Quando a distribuição é por ponto, a determinação da moda é imediata pela simples inspeção da tabela, já que a Mo é o valor de freqüência máxima. Quando a distribuição de freqüências é por intervalo, pode-se calcular a moda bruta que é o ponto médio da classe de maior freqüência (método rudimentar). Solução: No exemplo 1, a moda é o elemento com a maior freqüência, o 14. No exemplo 2, a moda é o valor de Xi da classe onde ocorre a maior freqüência, neste caso o 68. Observações importantes: Não há regra fixa para se escolher entre a média, a mediana e a moda. Entretanto algumas observações podem ser feitas quanto à utilização das mesmas. • A média aritmética é a medida de tendência central mais utilizada, principalmente quando não há valores aberrantes (muito extremos) no conjunto de dados, sendo a medida mais conveniente para cálculos posteriores; • A mediana deve ser usada, sempre que possível, como medida representativa de distribuições fortemente assimétricas, ou seja, quando os valores extremos do conjunto são muito distantes dos outros, pois o seu valor não é afetado por estes valores; • A moda é usada quando há interesse em saber o ponto de concentração do conjunto ou o tipo de distribuição que se está analisando, sendo que o seu valor, em se tratando de dados agrupados, é fortemente afetado pela maneira como as classes são constituídas. 3 Separatrizes São valores de posição, que dividem o rol. As principais medidas separatrizes são:mediana, quartis, decis e centis ou percentis. 3.1 Quartis [Simbologia: Qi] Os quartis dividem um conjunto de dados em quatro partes iguais. Assim: 0% 25% 50% 75% 100% |--------------------|--------------------|--------------------|--------------------| Q1 Q2 =Md Q3 onde: Q1 = primeiro quartil e separa os primeiros 25% dos 75% restantes; Q2 = segundo quartil ou mediana e separa o conjunto de dados em 2 partes iguais; Q3 = terceiro quartil e separa os primeiros 75% dos 25% restantes. Quartis para dados não-tabelados Procedimento no caso de dados brutos: 1. Colocam-se os dados em ordem (rol); 2. Calcula-se a posição do quartil através da fórmula: PQi = i . 4 n ; 3. O quartil será o valor que ocupa, no rol, a posição calculada anteriormente. Solução: Calcula-se as posições dos quartis. e O 6° e 18° elementos são Q1 = 12 e Q3 = 14 respectivamente. Exemplo: Determinar a moda para os dados do Exemplo 1 e 2. Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 1. °== 6 4 24x1P 1Q °== 184 24x3P 3Q Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 18 Quartis para dados tabelados a) Procedimento no caso de distribuição por ponto: 1. Calcula-se a posição do quartil PQi = i . 4 f k 1n i∑= = i . 4 n ; 2. O quartil será o valor de Xi correspondente à primeira Fci ≥ PQi. Calcula-se a posição do elemento. O 6° e 18° elementos são Q1 = 12 e Q3 = 14 respectivamente. b) Procedimento no caso de distribuição por classe: 1. Calcula-se a posição do quartil PQi = i . 4 f k 1n i∑= = i . 4 n ; 2. O quartil estará localizado na classe onde, pela primeira vez, Fci ≥ PQi; 3. Para encontrar o valor do quartil aplica-se a seguinte fórmula: onde: Li = limite inferior da classe que contém o respectivo quartil; Qi iQi ii f FcPh LQ ⎟⎠ ⎞⎜⎝ ⎛ − += Fci = freqüência acumulada da classe anterior à classe que contém o quartil; h = amplitude da classe que contém o quartil; fQi = freqüência da classe que contém o quartil. Solução: No exemplo 2, calcula-se a posição do elemento. Após verifica-se a classe onde se encontra cada elemento que ocupam essas posições. O Q1 encontra-se na 3ª classe e o Q3 encontra-se na 5ª classe. Assim: ( ) 56,53 9 125,12x1053Q 1 =−+= ( ) 5,78 10 325,37x1073Q 3 =−+= 3.2 Decis [Simbologia: Di] São valores que dividem o conjunto das observações em 10 (dez) partes iguais. Para encontrar o valor do decil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do decil, a fórmula será: °== 6 4 24x1P 1Q °== 18 4 24x3P 3Q °== 5,12 4 50x1P 1Q °== 5,37 4 50x3P 3Q Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 1. Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 2. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 19 PDi = i . 10 fi∑ = i . 10 n Para encontrar o valor do decil quando os dados estão agrupados em classe, a fórmula será: ( ) Di iDi ii f FcPhLD −+= 3.3 Percentis [Simbologia: Pi] São valores que dividem o conjunto das observações em 100 partes iguais. Para encontrar o valor do percentil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do percentil, a fórmula será: Ppi = i . 100 fi∑ = i . 100 n Para encontrar o valor do percentil quando os dados estão agrupados em classe, a fórmula será: ( ) Pi iPi ii f FcPhLP −+= 4 Medidas de dispersão As medidas de dispersão visam descrever os dados no sentido de informar o grau de dispersão ou afastamento dos valores observados em torno de um valor central. Elas indicam se um conjunto é homogêneo (pouca ou nenhuma variabilidade) ou heterogêneo (muita variabilidade). A descrição do conjunto de dados é mais completa quando se considera além de uma medida de tendência central, uma medida de dispersão ou variação, porque é comum encontrar-se séries que, apesar de apresentarem a mesma média, são compostas de maneiras diferentes, o que mostra que as medidas de tendência central são insuficientes para descrever adequadamente uma série estatística. Algumas medidas de variação são: a amplitude de variação, o desvio médio, a soma de quadrados, a variância, o desvio padrão e o coeficiente de variação. Classificação das medidas de dispersão: {⎪ ⎪⎪ ⎩ ⎪⎪ ⎪ ⎨ ⎧ ⎪⎪⎩ ⎪⎪⎨ ⎧ variaçãodeeCoeficientRelativa Variância padrãoDesvio médioDesvio Amplitude Absoluta dispersãodeMedidas 4.1 Amplitude de variação [Simbologia: H] É a diferença entre o maior e o menor valor do conjunto, sendo a mais simples das medidas de dispersão, porém de grande instabilidade, porque considera somente os valores extremos do conjunto. Também é chamada de desvio extremo. H = Xmáx. - Xmín. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 20 Solução: Para o exemplo 1: H = 17 – 10 = 7 Para o exemplo 2: H = 98 – 38 = 60 4.2 Desvio médio [Simbologia: Dm] É a média aritmética dos valores absolutos dos desvios tomados em relação à média ou à mediana. Considera-se o módulo de cada desvio, XXidi −= , evitando-se, com isso, que 0di n 1i =∑ = . Desvio médio para dados não tabelados n di n XXi Dm n 1i n 1i ∑∑ == = − = Desvio médio para dados tabelados O desvio médio é preferido em relação ao desvio padrão, quando esse for indevidamente influenciado pelos desvios extremos. Solução: Para o exemplo 1: 31,1 24 21,1317...21,131121,1310 n XX Dm n 1i i =−++−+−= − = ∑ = Para o exemplo 2; 95,13 50 6,697 50 26,6598...56,654876,6538 n f.XX Dm k 1i ii ==×−++×−+×−= − = ∑ = 4.3 Soma de quadrados [Simbologia: SQ] A soma de quadrados refere-se a soma dos quadrados dos desvios em relação à média: ( ) ( ) ( ) ( )∑ = −++−+−=−= n 1i 2 n 2 2 2 1 2 i XX......XXXXXXSQ n X X 2n 1i in 1i 2 i ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ −= ∑ ∑ = = 4.4 Variância [Simbologia ⎩⎨ ⎧ → →σ amostras população 2 2 ] A variância populacional (σ2) é a soma de quadrados dividida pelo número de observações N: n .fXX Dm k 1i ii∑ = − = Exemplo: Determinar a amplitude H para os dados do Exemplo 1 e 2. Exemplo: Determinar o desvio médio Dm para os dados do Exemplo 1 e 2. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 21 ( ) N N X X N )XX( N SQ n 1i 2n 1i i2 i n 1i 2 i2 ∑ ∑∑ = = = − = − ==σ Quando a variância é calculada a partir de uma amostra para fins de estimação, o denominador passa a ser (n - 1), o que nos fornece uma estimativa imparcial da variância populacional. Variância para dados não-tabelados 1n )X(X s n 1i 2 i 2 − − = ∑ = = 1n n )X( X n 1i n 1i 2 i 2 i − −∑ ∑ = = O denominador (n - 1) é denominado de "graus de liberdade" dessa estimativa. Solução: ( ) ( ) ( ) ( ) ( ) 2,78 124 13,2117...13,211113,211113,2110 1n XX s 2222 n 1i 2 i 2 =− −+−+−+−=− − = ∑ = Propriedades da variância • A variância de uma constante é zero; s2(k) = 0 • A variância da soma ou diferença de uma constante k com uma variável é igual a variância da variável;s2(k + X) = s2(X) • A variância da soma de variáveis independentes é igual a soma das variâncias das variáveis; s2(X + Y) = s2(X) + s2(Y) • A variância do produto de uma constante por uma variável é igual ao produto do quadrado da constante pela variância da variável. s2(k.X) = k2. )X(s2 Variância para dados tabelados s2 = ( ) 1n fXX k 1i i 2 i − −∑ = ou s2 = 1n n fX fX k 1i 2 i k 1i i i 2 i − ⎟⎠ ⎞⎜⎝ ⎛ −∑ ∑ = = Solução: No exemplo 1, ( ) ( ) ( ) ( ) ( ) 78,2 124 1x21,1317...4x21,13123x21,1311121,1310 1n f.XX s 2222 k 1i i 2 i 2 =− −+−+−+×−=− − = ∑ = No exemplo 2, ( ) ( ) ( ) ( ) ( ) 288 150 2x6,6598...9x6,65585x6,65487x6,6538 1n f.XX s 2222 k 1i i 2 i 2 =− −+−+−+−=− − = ∑ = Exemplo: Determinar a variância para os dados do Exemplo 1. Exemplo: Determinar a variância para os dados do Exemplo 1 e 2. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 22 4.5 Desvio padrão [Simbologia ⎩⎨ ⎧ → →σ amostras população ] O desvio padrão é uma das medidas mais úteis da variação de um grupo de dados. A vantagem do desvio padrão sobre a variância, é que este permite uma interpretação direta da variação do grupo, pois o mesmo é expresso na mesma unidade em que estão expressas as medidas observadas. O desvio padrão é a raiz quadrada da variância, então, é calculado por: 2ss = . Para os dados de medição, especialmente em grandes amostras (n ≥ 30), verifica-se que, cerca de 68% das observações estarão entre sX ± ; 95% das observações estarão entre s2X ± e praticamente 100% entre s3X ± . Solução: No exemplo 1, 67,178,2ss 2 === . No exemplo 2, 97,16288ss 2 === . 4.6 Coeficiente de variação [Simbologia: CV ou CV%] O coeficiente de variação é uma medida de dispersão relativa, utilizada quando se deseja comparar a variação de conjuntos de dados que apresentem diferentes unidades de medição e ou tamanhos diferentes, pois o coeficiente de variação independe da unidade de medida dos dados. O coeficiente de variação pode também ser expresso como percentagem da média. X sCV = ou 100 X s%CV ⋅= Solução: No exemplo 1, %62,12100x 21,13 67,1100x X sCV === No exemplo 2, %87,25100x 6,65 97,16100x X sCV === 5 Assimetria e curtose As medidas de assimetria e curtose complementam as medidas de posição e de dispersão no sentido de proporcionar uma descrição e compreensão mais completa das distribuições de freqüências. Estas distribuições não diferem apenas quanto ao valor médio e à variabilidade, mas também quanto a sua forma (assimetria e curtose). 5.1 Assimetria Assimetria é o grau de desvio, afastamento da simetria ou grau de deformação de uma distribuição de freqüências. Se a curva de uma distribuição tem uma "cauda" mais longa à direita da ordenada máxima do que à esquerda, diz-se que a distribuição é desviada para a direita ou que ela tem assimetria positiva. Se ocorrer o inverso, diz-se que ela é desviada para a esquerda ou tem assimetria negativa. Os coeficientes de assimetria servem para medir o “grau” de deformação da distribuição. Exemplo: Determinar o desvio padrão amostral para os dados do Exemplo 1 e 2. Exemplo: Determinar o CV para os dados do Exemplo 1 e 2. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 23 Coeficiente de assimetria de Pearson [Simbologia: C.A.] s MoX.A.C −= Intensidade da assimetria: • Coeficiente < 0,2: simetria; • 0,2 < Coeficiente < 1,0: assimetria fraca; • Coeficiente > 1,0: assimetria forte. Interpretação: • Coeficiente negativo: distribuição assimétrica negativa (à esquerda), sendo X < Md < Mo; • Coeficiente nulo: distribuição simétrica, sendo X = Md = Mo; • Coeficiente positivo: distribuição assimétrica positiva (à direita), sendo X > Md > Mo. Solução: No exemplo 1: 474,0 668,1 1421,13 s MoX.A.C −=−=−= → assimetria fraca. No exemplo 2: 1414,0 97,16 686,65 s MoX.A.C −=−=−= → simetria. 5.2 Curtose É o grau de achatamento (afilamento) de uma curva em relação à curva normal, tomada como padrão. Uma distribuição pode ser classificada quanto à curtose, como segue: • Platicúrtica: a curva é mais achatada do que a normal (σ ou s grandes); • Mesocúrtica: a curva é normal (σ ou s intermediários); • Leptocúrtica: a curva é mais alta do que a normal (σ ou s pequenos). Para medir o grau de curtose de uma distribuição, podem-se usar dois tipos de medidas: Exemplo: Determinar a assimetria para os dados do Exemplo 1 e 2. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 24 Coeficiente centílico de curtose [Simbologia: K] )DD(2 QQ K 19 13 − −= onde: Q1 = o primeiro quartil; Q3 = o terceiro quartil; D1 = o primeiro decil; D9 = o nono decil. Interpretação: • K < 0,263 curva leptocúrtica; • K = 0,263 curva mesocúrtica; • K > 0,263 curva platicúrtica. Solução: No exemplo 1, primeiro se encontra o D1 e D9: PD1 = 1. 10 24 = 2,4 ou seja, o D1 = 11 e PD9 = 9. 10 24 = 21,6 ou seja, o D9 = 15 Após calcula-se o coeficiente centílico de curtose ( ) 25,011152 1214 )DD(2 QQ K 19 13 =− −=− −= , conclui-se então que a curva é leptocúrtica. No exemplo 2, primeiro se encontra o D1 e D9: PD1 = 1 . 10 50 = 5 ou seja, ( ) ( ) 14,40 7 051033 f FcPhLD 1D 1D 11 =−×+=−+= PD9 = 9 . 10 50 = 45 ou seja, ( ) ( ) 88 6 42451083 f FcPhLD 9D 9D 99 =−×+=−+= Após calcula-se o coeficiente centílico de curtose: ( ) 2606,014,40882 56,535,78 )DD(2 QQK 19 13 =− −=− −= , conclui-se então que a curva é leptocúrtica. Exemplo: Determinar a curtose para os dados do Exemplo 1 e 2 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 25 4 – Probabilidade 1 Introdução O trabalho estatístico se desenvolve a partir da observação de determinados fenômenos e emprega dados numéricos relacionados aos mesmos, para tirar conclusões que permitam conhecê-los e explicá-los a ponto de poder, com determinado grau de crença, obter o desenvolvimento teórico do fenômeno. Para tanto é necessário que se formule um modelo que ajude a melhor elucidá-lo. No campo da estatística, os modelos matemáticos utilizados são denominados, modelos não- determinísticos ou probabilísticos, ou seja, que avaliam com que probabilidade os resultados podem ocorrer. 2 Noções de experimento, espaço amostral e eventos 2.1 Experimento aleatório [Simbologia: E] É uma das realizações do fenômeno sob observação. Se o fenômeno seguir um modelo não- determinístico, tem-se um experimento aleatório, com as seguintes características: • O experimento pode ser repetido; • Embora não seja possível afirmar que resultado em particular ocorrerá, é possível descrever o conjunto de todos os resultados possíveis do experimento; • À medida que aumenta o número de repetições aparece uma certa regularidade que torna possível a construção de um modelo matemático. 2.2 Espaço amostral [Simbologia: S] É o conjunto de todos os possíveis resultados de um experimento aleatório. 2.3 Evento [Simbologia: A, B, C, ...] É qualquer subconjunto do espaço amostral de um experimento. Tipos de eventos: 1. Eventos mutuamente exclusivos: dois eventos A e B são denominados mutuamente exclusivos, se eles não puderem ocorrer juntos, isto é, A∩B = ∅; 2. Eventoscomplementares: são os eventos que se completam em relação ao espaço amostral, isto é, A∪A = S, onde A é o evento complementar de A; 3. Eventos impossíveis: são eventos que não possuem elementos no espaço amostral, isto é, A = ∅ e P(A) = 0; 4. Eventos certos: são eventos que possuem todos os elementos do espaço amostral, isto é, A = S e P(A) = 1; 5. Eventos independentes: são eventos que podem ocorrer simultaneamente, isto é, A∩B ≠ ∅ e P(A∩B) = P(A) . P(B) 6. Eventos dependentes: são eventos em que a ocorrência de um deles está condicionada à ocorrência de outro, acontece um evento se o outro já ocorreu, isto é, A∩B ≠ ∅ e P(A∩B) = P(A) . P(B/A), com P(A) ≠ 0. 3 Álgebra de eventos Podem-se combinar os eventos da mesma maneira que se faz com os conjuntos: 1. Se A e B forem dois eventos, A ∩ B significa que A e B ocorrem; 2. Se A e B forem dois eventos, A ∪ B significa que A ou B ocorrem Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 26 Solução: C = coroa e K = cara a) S = {(1,C); (2,C); (3,C); (4,C); (5,C); (6,C); (1,K); (2,K); (3,K); (4,K); (5,K); (6,K)}; b) A = {(2,C); (4,C); (6,C)}; B = {(1,K); (3,K); (5,K)}; C = {(3,C); (6,C); (3,K); (6,K)}. c) i) B = {(1,C); (2,C); (3,C); (4,C); (5,C); (6,C); (2,K); (4,K); (6,K)}; ii) A ∪ B = {(2,C); (4,C); (6,C); (1,K); (3,K); (5,K)}; iii) B ∩ C = {(3,K)}; iv) BA∪ = {(1,C); (3,C); (5,C); (2,K); (4,K); (6,K)}. d) A ∩ B = ∅, são mutuamente exclusivos; A ∩ C = {(6,C)}, não são mutuamente exclusivos; B ∩ C = {(3,K)}, não são mutuamente exclusivos. 4 Conceitos de probabilidade Interpretação como freqüência relativa, definição clássica e definição axiomática. O problema fundamental da probabilidade consiste em: “atribuir um número a cada evento A, o qual avaliará as chances de ocorrência de A quando o experimento for realizado”. 4.1 Conceito empírico É uma interpretação da probabilidade como freqüência relativa. Repetindo-se um experimento E um grande número de vezes e calculando-se a freqüência relativa do evento A, obtém-se um número "p" que pode ser tomado como a probabilidade da ocorrência de A, que nesse caso, poderia ser tomada como: P(A) = n )A(f lim n p ∞→ = 4.2 Definição clássica de probabilidade É válida para espaços amostrais finitos e equiprováveis. Se todos os resultados de um espaço amostral finito forem igualmente prováveis, ou seja, admitindo-se que S possa ser escrito sob a forma S = {a1, a2, .... , ak}, então, a cada evento formado por um resultado simples (ai) associa-se um número "pi", denominado probabilidade de A, que satisfaça as seguintes condições: • pi ≥ 0; • P(S) = p1 + p2 + .... + pk = 1p k 1i i =∑ = ; Exemplo: Lance um dado e uma moeda. a) Construa o espaço amostral b) Enumere os seguintes eventos A = {marcado por número par, coroa} B = {marcado por número ímpar, cara} C = {múltiplos de 3} c) Expresse os eventos i. B ii. A ou B ocorrem iii. B e C ocorrem iv. BA ∪ d) Verifique dois a dois os eventos A, B e C e diga quais são mutuamente exclusivos. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 27 • k 1pi = , já que todos os resultados são igualmente prováveis. Disto decorre que, para qualquer evento A constituído de r resultados simples, tem-se: P(A) = r . 1/k = k r , sendo que: P(A) = nº de casos favoráveis a A pelos quais E pode ocorrer n total de casos pelos quais E pode ocorrerº = r / k Pela definição clássica de probabilidade devida a Laplace: seja E um experimento aleatório que dá origem a k resultados mutuamente excludentes e igualmente possíveis. Seja A um evento constituído por r resultados de E. A probabilidade de ocorrer o evento A é definida como sendo a razão r/k”. 4.3 Definição axiomática Seja E um experimento e S um espaço amostral associado a E. A cada evento A associa-se um número real representado por P(A) e denominado probabilidade de A, que satisfaça aos seguintes axiomas: 1. 0 ≤ P(A) ≤ 1; 2. P(S) = 1; 3. Se A e B forem eventos mutuamente excludentes, então: P(A ∪ B) = P(A) + P(B); 4. Se A1, A2, ... , An,... forem dois a dois eventos mutuamente excludentes, então: P( ∞=∪ 1i Ai) = P(A1) + P(A2) + ... + P(An) + ... Solução: Adotando dl = peça com defeito leve; b = peça boa; dg = peça com defeito grave: a) P( dg ) = P(dl∪b) = P(dl) + P(b) = 10/16 + 4/16 = 14/16; b) P(b) = 10/16; c) P(b∪dg) = 10/16 + 2/16 = 12/16. Teoremas fundamentais: Teorema 1: se ∅ for um evento (conjunto) vazio, então: P(∅) = 0; Teorema 2: se A for um evento complementar de A, então: P( A ) = 1 - P(A); Teorema 3: se A e B forem eventos quaisquer, então: P(A ∪ B) = P(A) + P(B) - P(A ∩ B); Teorema 4: se A e B forem eventos de um espaço amostral S e se A ⊂ B, então: P(A) ≤ P (B). Solução: Adotando os eventos: M = a mulher estar viva daqui há 30 anos; H = o homem estar vivo daqui há 30 anos. a) P( M∩H) = P( M ) x P(H) = 1/4 x 3/5 = 3/20; b) P(M∩H ) = P(M) x P( H ) = 3/4 x 2/5 = 6/20; c) P(H∪M) = P(H) + P(H) – P(H∩M) = 3/5 + 3/4 - 3/5 x 3/4 = 18/20; d) P(M∩H) = P(M) x P(H) = 3/4 x 3/5 = 9/20 5 Probabilidade condicionada Seja A e B dois eventos associados a um experimento E. Denota-se por P(B/A), a probabilidade do evento B, condicionada a ocorrência do evento A. Exemplo: Um lote é formado por 10 peças boas, 4 com defeitos leves e duas com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que: a) ela não tenha defeitos graves; b) ela não tenha defeitos; c) ela seja boa ou tenha defeitos graves. Exemplo: A probabilidade de uma mulher estar viva daqui a 30 anos é 3/4 e de seu marido é 3/5. Calcular a probabilidade de: a) apenas o homem estar vivo; b) somente a mulher estar viva; c) pelo menos um estar vivo; d) ambos estarem vivos. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 28 Sempre que se calcula a P(B/A), se está, essencialmente, calculando P(B) em relação ao espaço reduzido A e utiliza-se a seguinte fórmula, onde P(A) ≠ 0: P(B/A) = )A(P )BA(P ∩ com P(A) ≠ 0, pois A já ocorreu. Pode-se escrever também, através do teorema do produto: P(A∩B) = P(A/B) . P(B) e P(B∩A) = P(B/A) . P(A) Que representa uma alternativa para o cálculo da probabilidade da interseção de dois eventos. Exemplo: Uma urna contém cinco bolas pretas, três vermelhas e duas brancas. Foram extraídas 3 bolas sem reposição. Qual a probabilidade de terem sido duas bolas pretas e uma vermelha? Solução: Sendo os eventos: P = bolas pretas, V = bolas vermelhas e B = bolas brancas; P(P ∩ P ∩ V) + P(P ∩ V ∩ P) + P(V ∩ P ∩ P) = 25,03 720 60 8 4 9 5 10 3 8 4 9 3 10 5 8 3 9 4 10 5 =×=××+××+×× 6 Independência estatística Se a ocorrência ou não do evento A, não afetar a probabilidade de ocorrência do evento B e vice- versa, diz-se que A e B são independentes. É compreensível que os eventos A e B sejam inteiramente não relacionados. Saber que B ocorreu não fornece qualquer informação sobre a ocorrência de A. De fato, o cálculo seguinte mostra isso: Se A e B forem independentes, pode-se escrever: P(A/B) = P(A) e P(B/A) = P(B) Nesse caso, usando-se a expressão anterior para P(A∩B), tem-se: P(A∩B) = P(A/B) . P(B) = P(A) . P(B) P(A∩B) = P(B/A) . P(A) = P(A) . P(B) Chegando-se à condição de independência, na qual A e B serão eventos independentes se e somente se: P(A∩B) = P(A) . P(B) Exemplo: As probabilidades de 3 jogadores marcarem um penalty são respectivamente 2/3 , 4/5 e 7/10. Se cada um “cobrar” uma única vez, qual a probabilidade de:a) todos acertarem; b) apenas uma certar; c) todos errarem. Solução: Considerando A: o jogador 1 acertar, B: o jogador 2 acertar e C: o jogador 3 acertar, temos: a) P(A ∩ B ∩ C) = 3733,0 150 56 10 7 5 4 3 2 ==×× b) P(A CB ∩∩ ) + P( ∩A B C∩ ) + P( ∩∩ BA C) = =××+××+×× 10 7 5 1 3 1 10 3 5 4 3 1 10 3 5 1 3 2 = 1667,0 150 25 150 7126 ==++ c) P( CBA ∩∩ ) = 02,0 150 3 10 3 5 1 3 1 ==×× Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 29 7 Teorema de Bayes P(B1/A) = )A(P )AB(P 1 ∩ , onde: P(A) = P(A/B1) . P(B1) + P(A/B2) . P(B2) + ... + P(A/Bk) . P(Bk) = probabilidade total P(B1/A) = )A(P )B(P).B/A(P 11 P(B1/A) = )B(P)B/A(P)B(P)B/A(P)B(P)B/A(P )B(P).B/A(P 332211 11 ⋅+⋅+⋅ Generalizando-se essa aplicação para Bi: ∑ = ⋅⎟⎠ ⎞⎜⎝ ⎛ ⋅⎟⎠ ⎞⎜⎝ ⎛ = n 1i i i i i i )P(BB AP )P(BB AP /A)P(B Esse resultado é conhecido como teorema de Bayes. É também denominada fórmula da probabilidade das causas ou dos antecedentes. Desde que os Bi`s constituam uma partição do espaço amostral, um e somente um, dos eventos Bi ocorrerá. Portanto, a expressão acima nos dá a probabilidade de um particular Bi dado que o evento A tenha ocorrido. A fim de aplicar esse teorema, deve-se conhecer os valores dos Bi`s, sendo que, se esses valores são desconhecidos, fica impossibilitada a sua aplicação. Exemplo: Três máquinas, A, B e C produzem respectivamente 0,4; 0,5 e 0,1 do total de peças de uma fábrica. As porcentagens de peças defeituosas nas respectivas máquinas são de 3%, 5% e 2%. Uma peça é sorteada ao acaso e verifica-se que é defeituosa. Qual a probabilidade de que a peça tenha vindo da máquina B? Solução: P(A) = 0,4; P(B) = 0,5; P(C) = 0,1; P(def/A) = 0,03; P(def/B) = 0,05; P(def/C) = 0,02; =×+×+× ×=⋅+⋅+⋅= 02,01,005,05,003,04,0 05,05,0 )C defP(P(C))B defP(P(B))def AP(P(A) )B defP(B).P( P(B/def) 0,641 8 Resumo das propriedades do cálculo de probabilidades onde: P(Bi) = probabilidades à priori (conhecidas); P(A/ Bi) = probabilidades condicionais (conhecidas); P(Bi/A) = probabilidades à posteriori. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 30 5 – Variáveis Aleatórias 1 Noções sobre variáveis aleatórias Ao descrever o espaço amostral de um experimento, nem sempre o resultado individual será um número, embora, muitas vezes haja interesse na mensuração de alguma característica e no seu registro numérico. Para que seja possível a utilização dos recursos da estatística descritiva, é necessária uma função, que transforme o espaço amostral não-numérico em um espaço amostral numérico. Sendo assim, considerando-se E um experimento e S o espaço amostral associado ao experimento, a função X, que associa a cada elemento s ∈ S, um número real, X(s) é denominada variável aleatória. Desse modo, tem-se uma função definida no espaço amostral, chamada de variável aleatória. 2 Variáveis aleatórias discretas [Simbologia: VAD] Seja X uma variável aleatória. Se o número de valores possíveis de X, Rx (contra-domínio de X) for finito ou infinito numerável (números naturais ou inteiros), denomina-se X de variável aleatória discreta. As variáveis aleatórias discretas surgem, em geral, de medidas de enumeração ou contagem, como por exemplo, número de pontos obtidos em um teste, número de insetos por planta, número de peças boas, número de pessoas que votam, número de erros em contas, etc. S = { s1, s2, ... , sn } → X RX 2.1 Função de probabilidade [Simbologia: f(X)] É a probabilidade de que a variável aleatória assuma o valor x. Se X é uma variável aleatória, a cada possível valor xi de X (x1, x2, x3, ....), associa-se um número p(xi) = P(X = xi), ou ainda, P(X=x1), P(X=x2), P(X= x3), denominado probabilidade de xi. A função que associa probabilidades não-nulas aos possíveis valores da variável aleatória e zero aos demais valores é denominada função de probabilidade. X x1 x2 x3 ... xn P(X) p(x1 ) p(x2) p(x3) ... p(xn ) Os números p(xi) devem satisfazer as seguintes condições: p(xi) > 0, ∀ i; Σ p(xi) = 1. Representação gráfica: gráfico de bastões P(X) p(x2) p(x1) x1 x2 X p(x3) x3 2.2 Valor esperado ou média de uma variável aleatória discreta [Simbologia: E(X) ou µ(X)] Se X é uma VAD, define-se valor esperado de X, como: E(X) = ∑ = n i 1 ii )p(xx Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 31 2.3 Variância de uma variável aleatória discreta [Simbologia: V(X) ou σ2] Se X é uma VAD, define-se a variância de X, como: V(X) = [ ] )x(p)X(Ex i 2n 1i i∑ = − = [ ]22 )X(E)X(E − onde: E(X2) = ∑ = n 1i i 2 i )x(px Exemplo: Para o lançamento de duas moedas determine a distribuição de probabilidades do número de caras e após encontre a E(X) e V(X). Solução: Fazendo C = cara e K = coroa e sendo x igual ao número de caras obtidas, tem-se: S = {(C,C); (C,K); (K,C); (K,K)}. Associando: x = 0 (nenhuma cara); x = 1 (uma cara) e x = 2 (duas caras), tem-se: x 0 1 2 p(x) 1/4 2/4 = 1/2 1/4 Graficamente E(X) = ∑ = n 1i ii )p(xx = 14 12 2 11 4 10 =×+×+× cara V(X) = [ ]22 )X(E)X(E − = ( ) 5,015,11 4 12 2 11 4 10 2222 =−=−⎟⎠ ⎞⎜⎝ ⎛ ×+×+× cara2 3 Variáveis aleatórias contínuas [Simbologia: VAC] Seja X uma variável aleatória. Suponha que Rx (contradomínio de X), seja um intervalo ou uma coleção de intervalos. Neste caso, diz-se que X é uma variável aleatória contínua. As variáveis aleatórias contínuas, geralmente, surgem de dados de medições, como por exemplo, comprimento, peso, altura, temperatura, etc.. 3.1 Função densidade de probabilidade [Simbologia: f(X)] Seja X uma VAC, a função densidade de probabilidade f(x), é uma função que satisfaz as condições: • f(x) ≥ 0, ∀ x ∈ Rx; • ∫+∞ ∞− dx)x(f = 1. Além disso, para qualquer c < d em RX: P(c < X <d) = ∫d c dx)x(f . Comentários: Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 32 P (c < X < d) representa a área sob a curva da função, f(x) entre X = c e X = d; P(X = k) = ∫ =k k 0dx)x(f ; P(c < X < d) = P (c ≤ X ≤ d) = P (c < X ≤ d) = P (c ≤ X < d). 3.2 Valor esperado ou média de uma variável aleatória contínua [Simbologia: E(X) ou µ(X)] Se X é uma VAC, o valor esperado de X é definido por: E(X) = ∫+∞ ∞− dx)x(fx 3.3 Variância de uma variável aleatória contínua [Simbologia: V(X) ou σ2] Se X é uma VAC, define-se a variância de X, como: V(X) = [ ]22 )X(E)X(E − onde: E(X2) = f(x)dxx 2∫+∞ ∞− Solução: a) 1dxKdx.x 6 1dxKx 6 13 0 3 0 3 0 =+=⎟⎠ ⎞⎜⎝ ⎛ +∫ ∫∫ → [ ] 1x.Kx.61 30 3 0 2 =+⎥⎦ ⎤⎢⎣ ⎡ → 13.K0 2 3 6 1 2 =+⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ + → 12 1K = ; b) ∫ ∫∫ +=+=≤≤ 21 3021 dx121dx.x61121x61)2x1(P = 2 1 2 1 2 x. 12 1 2 x. 6 1 ⎥⎦ ⎤⎢⎣ ⎡+⎥⎦ ⎤⎢⎣ ⎡ = ( )12 12 1 2 1 2 2 6 1 22 −+⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ − = 4 1 c) E(X) = ∫+∞ ∞− dx)x(fx = ∫ ⎟⎠⎞⎜⎝⎛ + 3 0 dx 12 1x 6 1.x = ∫ ⎟⎠⎞⎜⎝⎛ + 3 0 2 dxx 12 1x 6 1 = 3 0 23 2 x 12 1 3 x 6 1 ⎥⎦ ⎤⎢⎣ ⎡ + = 1,875 V(X) = [ ]22 )X(E)X(E − = dx)x(fx 2∫ +∞ ∞− - 1,8752 = dx 12 1x 6 1x 3 0 2 ⎟⎠ ⎞⎜⎝ ⎛ +∫ - 3,516 = 4,12 – 3,516 = 0,604. 4 Modelos probabilísticos para variáveis aleatórias Os valores possíveis de uma variável aleatória e suas respectivas probabilidades determinam a distribuição de probabilidadeda variável aleatória. Algumas, por apresentarem características semelhantes, nos permitem estabelecer um modelo teórico para determinar a solução de certos problemas. Para variáveis aleatórias discretas, os modelos estudados serão: Binomial e Poisson. 4.1 Distribuição binomial → Notação: X ~ b(n, p) A distribuição binomial tem as seguintes características: • São realizadas n repetições independentes e do mesmo tipo do experimento E (n ensaios de Bernoulli); • Cada repetição do experimento E admite apenas 2 resultados: sucesso ou fracasso; • A probabilidade de sucesso em cada repetição do experimento é sempre igual a p. Assim, considerando “n” tentativas independentes de um mesmo experimento aleatório, uma particular amostra aleatória conterá k sucessos e (n-k) fracassos, com probabilidades associadas p e q, respectivamente. A probabilidade total será dada por p + q =1. Exemplo: Seja ⎪⎩ ⎪⎨ ⎧ ≤≤+= casooutroqualquerem0 3x0seKx 6 1 f(x) Pede-se: a) encontrar K; b) encontrar P(1≤ x ≤ 2); c) determinar E(X) e V(X); Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 33 Como qualquer seqüência com k sucessos e (n-k) fracassos terá a mesma probabilidade de ocorrência, resta-nos saber quantas se pode formar. Para isto calcula-se knC , que é o número de seqüências possíveis que podem ocorrer. Definição: A variável aleatória discreta X tem comportamento binomial com “n” repetições de E e probabilidade de sucesso p, cuja função de probabilidade é dada por: onde: )!kn(!k !nCkn −= knkkn qpC)kX(P −== k = 0, 1, 2, ..., n; k! = 1 . 2 . 3 . ... . k. A esperança e a variância são dadas por: E(X) = n.p e VAR(X) = n.p.q Solução: Sabe-se que: n = 8, p = 1/2 e q = 1/2. X = número de caras (sucesso). a) 22,0 2 1 2 1C)5X(P 585 5 8 =⎟⎠ ⎞⎜⎝ ⎛⎟⎠ ⎞⎜⎝ ⎛== − ; b) 996,0 2 1 2 1C1)0X(P1)1X(P 080 0 8 =⎟⎠ ⎞⎜⎝ ⎛⎟⎠ ⎞⎜⎝ ⎛−==−=≥ − c) =⎟⎠ ⎞⎜⎝ ⎛⎟⎠ ⎞⎜⎝ ⎛+⎟⎠ ⎞⎜⎝ ⎛⎟⎠ ⎞⎜⎝ ⎛+⎟⎠ ⎞⎜⎝ ⎛⎟⎠ ⎞⎜⎝ ⎛==+=+==≤ 62 2 8 71 1 8 80 0 8 2 1 2 1C 2 1 2 1C 2 1 2 1C)2X(P)1X(P)0X(P)2X(P 0,14 4.2 Distribuição de Poisson → Notação: X ~ P(λ) Esta distribuição é muito usada quando se deseja contar o número de eventos de um certo tipo, que ocorrem em um intervalo de tempo, superfície ou volume, como por exemplo: número de falhas em um computador em certo dia; número de chamadas telefônicas durante meio dia; número de relatórios de acidentes enviados a uma seguradora em uma semana, etc.. Sua aplicação aparece freqüentemente em problemas de fila de espera, controle de estoques, controle de qualidade, programação de equipamentos, etc.. O modelo foi desenvolvido pelo matemático francês Poisson. Definição: A variável aleatória X tem distribuição de Poisson, com parâmetro λ > 0, se: !k e)kX(P kλ== λ− onde: λ é o número médio de eventos ocorridos no intervalo considerado; k = 0, 1, 2, 3, .......; e ≅ 2,7183; k! = 1 . 2 . 3 . ... . k. A esperança e a variância são dadas por: E(X) = λ e VAR(X) = λ A distribuição binomial pode ser aproximada para a Poisson, fazendo-se λ = n . p, quando o tamanho da amostra é grande (n → ∞ ) e a probabilidade p é pequena (p → 0). Na prática, quando n > 30 e p < 0,05. Exemplo: Em média há 2 chamadas por hora num certo telefone. Calcular: a) a probabilidade de se receber no máximo 3 chamadas em 2 horas; b) a probabilidade de nenhuma chamada em 90 minutos. Solução: λ = 2 chamadas/hora. Exemplo: Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de ocorrer: a) 5 caras; b) pelo menos uma cara; c) no máximo 2 caras. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 34 a) P(X ≤ 3 (2h)) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = ( ) ( ) ( ) ( ) !3 4e !2 4e !1 4e !0 4e 34241404 −−−− +++ = 0,0183 + 0,0732 + 0,1464 + 0,1953 = 0,433. b) P(X = 0 (1,5h)) = ( ) !0 3e 03− = 0,0498. A seguir, são apresentados alguns modelos para variáveis aleatórias contínuas. 4.3 Distribuição normal → Notação: X ~ N (µ, σ2) A distribuição normal também é conhecida como distribuição de Gauss. É um dos mais importantes modelos de probabilidade para variáveis aleatórias contínuas, sendo aplicado em inúmeros fenômenos e muito utilizado no desenvolvimento teórico em na área de inferência estatística. Definição: A variável aleatória contínua X tem distribuição normal, se a função densidade de probabilidade for: 2 2 2 )x( e 2 1)x(f σ µ−− πσ= , ∞<<∞− x onde: µ = média populacional; σ2 = variância populacional. A esperança ou média e a variância são os parâmetros da distribuição normal, dados por: E(X) = µ e VAR(X) = σ2. A distribuição normal tem as seguintes características: • A curva da distribuição tem forma de sino e é simétrica em relação à média µ; • Na medida em que os pontos se afastam da média µ, a curva torna-se assintótica, ou seja, ela se aproxima bastante do eixo horizontal, mas não chega a tocá-lo; • A área total sobre a curva é 1, devido ao fato da mesma ser uma função densidade de probabilidade; • O ponto máximo da função corresponde à média µ. 0 1 2 3 -2 0 2 4 6 8 10 12 14 z = 0 50 %50% Para calcular uma probabilidade associada à distribuição normal faz-se: P (a < X < b) = 2 2 2 )x( b a e 2 1 σ µ−− ∫ πσ dx Para evitar o uso de integrais, os principais valores das probabilidades podem ser encontrados numa tabela da curva normal, construída através de uma padronização. Esta padronização transforma qualquer valor da variável X numa escala Z, sendo que Z representa número de desvios padrões de afastamento em relação à média. A fórmula para a padronização de X em Z é: σ µ−= XZ sendo que os valores de Z e suas respectivas áreas de probabilidade estão tabelados. Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini Departamento de Estatística - UFSM 35 Exemplo: Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio padrão 10. Determine a probabilidade de um indivíduo submetido ao teste ter nota: a) maior que 120; b) maior que 80; c) entre 85 e 115; d) maior que 100; e) entre 110 e 120; f) menor que 75; g) igual a 90. Solução: a) 2 10 100120Z1 =−= → P(X > 120) = P(Z > Z1) = P(Z > 2) = 0,5 – 0,4772 = 0,0228. b) 2 10 10080Z1 −=−= → P(X > 80) = P(Z > Z1) = P(Z > -2) = 0,5 + 0,4772 = 0,9772. c) 5,1 10 10085Z1 −=−= e 5,110 100115Z2 =−= P(75 < X < 115) = P(Z1 < Z < Z2) = P(-1,5 < Z < 1,5) = 0,4332 + 0,4332 = 0,8664. d) 0 10 100100Z1 =−= → P(X > 80) = P(Z > Z1) = P(Z > 0) = 0,5 + 0,0000 = 0,5000. e) 1 10 100110Z1 =−= e 210 100120Z2 =−= P(110 < X < 120) = P(Z1 < Z < Z2) = P(1 < Z < 2) = 0,4772 - 0,3413 = 0,1359. f) 5,2 10 10075 1 −=−=Z → P(X < 75) = P(Z < Z1) = P(Z < -2,5) = 0,5 – 0,4938 = 0,0062. g) Não é possível calcular a área sobre um ponto, portanto a probabilidade é zero. Exemplo: Certo produto tem peso médio de 10g e desvio-padrão 0,5g. É embalado em caixas de 120 unidades que pesam em média 150g e desvio-padrão 8g. Qual a probabilidade de que uma caixa cheia pese mais de 1.370g? Solução: Peso do produto: µp = 10 e σp = 0,5; Peso da caixa: µc = 150 e σc = 8. A média da caixa cheia é µtotal = 120x10 + 150 = 1350g. A variância da caixa cheia é 2totalσ = 120x(0,5)2 + (8)2=140,8. O desvio-padrão será σtotal= 8,140 =11,86g. Então: 69,1 86,11 13501370Z1 =−= → P(X > 1.370) = P (Z > Z1) = P(Z > 1,69) = 0,5 – 0,4545 = 0,0455. 4.4 Distribuição Qui - Quadrado (χ2) Sejam X1, ....., Xn, variáveis aleatórias independentes, normalmente distribuídas,
Compartilhar