Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA Profa.Msc. Lima, Jozete C. Uninorte 2 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima SUMÁRIO 1. PROGRAMA DA DISCIPLINA 1.1. Ementa 1.2. Público Alvo 1.3. Objetivos 1.3.1. Geral 1.3.2. Específicos 1.4. Metodologia 1.5. Avaliações 1.6. Curriculum Resumido dos professores 2. INTRODUÇÃO A ESTATÍSTICA 2.1. Histórico 2.2. Áreas da Estatística 2.3. Definição 2.4. Áreas de atuação 2.5. Linguagem Estatística 2.6. Exercícios 3. SÉRIES ESTÁTICAS 3.1. Tabelas 3.2. Gráficos 3.2.1. Tipos de Gráficos 3.3. Exercícios 4. DISTRIBUIÇÃO DE FREQUÊNCIA 4.1. Distribuição de freqüência sem intervalos de classe: 4.2. Distribuição de freqüência cem intervalos de classe: 4.2.1. Elementos da distribuição de freqüência 4.2.2. Método prático para construção de uma distribuição de freqüência com intervalo 4.3. Tipos de freqüência 4.4. Representação gráfica de uma distribuição 4.5. Exercícios 5. MEDIDAS DE POSIÇÃO 5.1. Média 5.1.1. Dados não-agrupados ou Aritmética 5.1.2. Dados agrupados ou Ponderada 5.1.2.1. Sem Intervalo de Classe 5.1.2.2. Com Intervalo de Classe 5.1.3. Média Geral 5.1.4. Média Geométrica 5 5 5 5 5 5 5 5 5 6 6 6 6 7 7 9 11 11 12 12 16 17 17 17 18 18 19 20 22 23 23 23 23 23 24 25 3 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 5.2. Moda 5.2.1. Dados não-agrupados 5.2.2. Dados agrupados 5.2.2.1. Sem intervalo de classe 5.2.2.2. Com intervalo de classe 5.3. Mediana 5.3.1. Dados não-agrupados 5.3.2. Dados agrupados 5.3.2.1. Sem intervalo de classe 5.3.2.2. Com intervalo de classe 6. SEPARATRIZES 6.1. Quartis 6.1.1. Dados não-agrupados 6.1.2. Dados agrupados 6.1.2.1. Sem intervalo de classe 6.1.2.2. Com intervalo de classe 6.2. Centis 6.2.1. Dados não-agrupados 6.2.2. Dados agrupados 6.2.2.1. Sem intervalo de classe 6.2.2.2. Com intervalo de classe 7. MEDIDAS DE DISPERSÃO 7.1. Amplitude Total 7.2. Intervalo semi interquartílico 7.3. Desvio Médio 7.3.1. Dados Agrupados 7.3.2. Dados não Agrupados 7.3.2.1. Sem intervalo de classe 7.3.2.2. Com intervalo de classe 7.4. Desvio Padrão 7.4.1. Dados Agrupados 7.4.2. Dados não Agrupados 7.4.2.1. Sem intervalo de classe 7.4.2.2. Com intervalo de classe 7.5. Variância 7.6. Coeficiente de Variação 7.7. Exercícios 8. MEDIDAS DE ASSIMETRIA 8.1. Coeficientes de Assimetria 8.1.1. Primeiro Coeficiente de Pearson 25 26 26 26 27 27 27 28 29 29 30 32 32 32 33 33 34 35 35 35 35 36 37 37 37 38 38 38 38 39 40 40 40 40 41 41 42 43 44 44 4 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 8.1.2. Segundo Coeficiente de Pearson 9. MEDIDAS DE CURTOSE 10. INTRODUÇÃO A PROBABILIDADE 10.1. Teoria de Conjuntos 10.2. Conjunto universo ou espaço amostral 10.3. Operação entre conjuntos 10.3.1. União de conjuntos 10.3.2. Intersecção de conjuntos 10.3.3. Complementar de um conjunto 11. NOÇÕES DE PROBABILIDADE 11.1. Definição de probabilidade 11.2. Função de probabilidade 11.3. Experimento aleatório 11.4. Espaço amostral 11.5. Evento 11.6. Probabilidade como relação de conjunto 11.7. Relações de probabilidade 12. VARIAVÉIS ALEATÓRIAS 12.1. Definição 12.2. Variável Aleatória Discreta 12.3. Variável Aleatória Contínua 13. NÚMEROS ÍNDICES 13.1. Conceitos e Aplicações dos Números-Índice 13.2. Introdução a Números Índices 13.3. Relativos: Preço, Quantidade e Valor 13.4. Elos de Relativos (Base móvel) 13.5. Relativos em Cadeia (Base fixa) 13.6. Índices Agregativos 13.7. Índice Agregativo Simples 13.8. Índice Agregativo Ponderado 13.8.1. Índice de Laspeyres 14. EXERCÍCIOS RESOLVIDOS 15. REFERÊNCIAS BIBLIOGRÁFICAS 44 44 46 48 48 48 48 48 49 49 50 50 50 50 50 51 51 51 55 55 55 57 59 59 59 59 60 61 62 62 62 63 65 66 5 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 1. PROGRAMA DA DISCIPLINA 1.1. Ementa Análise Descritiva de Dados, Noções de Probabilidade, Variáveis Aleatórias Discretas e Contínuas, e Números Índices. 1.2. Público Alvo Este curso destina-se aos alunos de graduação em Administração, Contabilidade, Economia, Sistema de Informação, Matemática, etc. 1.3. Objetivos 1.3.1. Geral Espera-se que o aluno seja capaz de adquirir conhecimentos da metodologia estatística para a resolução de problemas tomada de decisões. 1.3.2. Específicos Equacionar problemas referentes à estatística descritiva; Solucionar problemas, não complexos, de probabilidade; Identificar problemas referentes à inferência estatística; 1.4. Metodologia Aulas Expositivas, trabalhos individuais ou em grupos 1.5. Critérios de Avaliações Serão realizados 3 avaliações no decorres da disciplina., sendo duas parciais e uma final, cada uma valendo de 0 a 10 pontos. 1.6. Curriculum Resumido dos professores Jozete Lima Coelho é doutoranda em Engenharia Mecatrônica pela Universidade Federal do Rio de Janeiro (UFRJ), mestre em Engenharia de Produção, graduada em Estatística pela Universidade Federal do Amazonas (UFAM). Sua experiência acadêmica tem como destaque as atuações como professora dos cursos de graduação em Administração, Engenharias, Pedagogia, Economia, Contabilidade, Odontologia, Enfermagem, lecionando Estatística, Probabilidade e Estatística, Bioestatística, Complementos de Matemática e Estatística, Matemática, Engenharia de Produção. Kelen Gomes de Souza é mestranda em Processos e Gestão Ambiental pela Universidade Federal do Pará (UFPA), especialista em Gestão da Qualidade, graduada em Estatística pela Universidade Federal do Amazonas (UFAM). Sua experiência acadêmica tem como destaque as atuações como professora dos cursos de graduação em Administração, Engenharias, Sistema da Informação, Ciência da Computação, Economia, Contabilidade, Pedagogia, Biblioteconomia, Odontologia, Enfermagem, Tecnologia em Petróleo e Gás, lecionando Estatística, Probabilidade e Estatística, Bioestatística, Complementos de Matemática e Estatística, Matemática, Matemática Financeira, Cálculo I e II, Álgebra Linear I e II. 6 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 2. INTRODUÇÃO À ESTATÍSTICA 2.1. Histórico Origem e Evolução da Estatística ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos. Bíblia: Referências do censo dos Hebreus. Devido às inundações do Nilo, se efetuavam anualmente trabalhos cadastrais para a repartição de terras férteis no Egito. Todas as ciências têm suas raízes na história do homem. A matemática, que é considerada “a ciência que une à clareza do raciocínio a síntese da linguagem”, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário, empírico. A estatística, ramo da matemática aplicada, teve origem semelhante. Desde a antiguidade, vários povos já registravam o número de habitantes, de nascimento, de óbitos, faziam estimativas das riquezas individual e social, distribuíam eqüitativamente terras ao povo, cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje, chamaríamos de “estatísticas”. Na idade média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. A partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiros números relativos. No século XVIII, o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramentecientífica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de ESTATÍSTICA, que provém do latim status e significa estado, determinando o seu objetivo e suas relações com as ciências. 2.2. As áreas da Estatística Amostragem e planejamento de experimentos: mecanismo de coleta de dados; Estatística descritiva: organização, apresentação e sintetização de dados; Estatística inferencial: métodos de análise de dados visando à tomada de decisões. Utiliza alguns resultados da teoria das probabilidades (a qual tem por objetivo quantificar a incerteza existente em determinada situação). 2.3. Definição ESTATÍSTICA é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões. 7 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 2.4. Áreas de Atuação "Os campos de aplicação da Estatística são muitos e os mais variados." Estudos de mercado O gerente de uma fábrica de cafeteiras pretende lançar um novo produto, pelo que, encarrega uma empresa especialista em estudos de mercado para "estimar" a percentagem de potenciais compradores desse produto Medicina Pretende-se estudar o efeito de um novo medicamento para curar determinada doença. É selecionado um grupo de 20 doentes, administrando-se o novo medicamento a 10 desses doentes escolhidos ao acaso e o medicamento habitual aos restantes Controle de Qualidade O administrador de uma fábrica de parafusos pretende assegurar-se de que a percentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada encomenda poderia ser rejeitada. Pedagogia Um conjunto de pedagogos desenvolveu uma técnica nova para a aprendizagem da leitura, na escola primária, a qual, segundo dizem, encurtam o tempo de aprendizagem relativamente ao método tradicional. 2.5. Linguagem Estatística Fases do método estatístico: Definição do problema, planejamento, coleta dos dados, apuração, apresentação dos dados, análise e interpretação dos dados. Conjunto de dados: No sentido mais comum, “uma coleção de dados numéricos”. Exemplo: Número de nascimentos e óbitos de uma cidade. População ou Universo: Conjunto de elementos com pelo menos uma característica em comum Amostra: É um subconjunto formados por elementos de uma população. Exemplo: POPULAÇÃO 31 sabores de sorvete em uma confeitaria AMOSTRA 5 sabores testados para saber se a confeitaria vende sorvetes de boa qualidade 8 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Parâmetro: É uma medida numérica que descreve uma característica de uma população. Estatística ou Estimativa: É uma medida numérica que descreve uma característica de uma amostra. Exemplo: Em uma pesquisa com 1.015 pessoas, escolhidas aleatoriamente, somente 269 (26,5%) delas possuem computador. Podemos dizer que o número 26,5% trata-se de uma estatística, pois se baseia em uma amostra e não na população toda. Agora, se a pesquisa for feita com os 27 governadores estaduais dos Brasil onde, 20 (74%) possuem computador, dizemos que o número obtido (74%) é um parâmetro, pois, se baseia em toda a população de governadores. Variável: É, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Ela pode ser qualitativa ou quantitativa. Tipos de Variáveis a. Qualitativa: Quando seus valores são expressos por atributos. Exemplo: Sexo, Cor da pele, Cor do cabelo, Cor dos olhos, Escolaridade, Profissão, etc. Classificação da variável qualitativa: Atribuição de números ou outros símbolos a características de objetos, de acordo com certas regras predefinidas. São quatro escalas principais de medição: Nominal, Ordinal, Intervalar e Razão. NOMINAL: É aquela em que os números servem apenas para nomear, identificar e/ou categorizar dados sobre pessoas, objetos ou fatos. Exemplo: SEXO: 1. Masculino / 2. Feminino ESTADO CIVIL: 1. Solteiro / 2. Casado / 3. Viúvo / 4. Divorciado ORDINAL: É aquela em que os números servem para ordenar, segundo um processo de comparação, as pessoas, objetos ou fatos, em relação à determinada característica Exemplo 1: Queira, por favor, classificar os seguintes aparelhos de fax de 1 a 5, sendo 1 o mais preferido e 5 o menos preferido: - Panasonic ____________ - Toshiba ____________ - Sharp ____________ - Savin ____________ Exemplo 2: O pesquisador designa números para refletir as classificações relativas de uma série de afirmações e depois usa esses números para interpretar a distância relativa. (1) (2) (3) (4) (5) Muito certo Certo Neutro Incerto Muito incerto 9 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima b. Quantitativa: Quando seus valores são expressos em números. Exemplo: Salários dos operários, Idade dos alunos de uma escola, Bibliotecas da cidade de Manaus, Casais residentes em uma cidade, etc. Classificação da variável Quantitativa: DISCRETA OU DESCONTÍNUA: Seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens. Exemplo: Nº de alunos presentes às aulas de introdução à estatística no 1º semestre de 1997: mar = 18 , abr = 30 , mai = 35 , jun = 36 CONTÍNUA: Resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Exemplo: Quando você vai medir a temperatura de seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio, ao dilatar-se, passará por todas as temperaturas intermediárias até chegar na temperatura atual do seu corpo. 2.6. Exercícios 1. Defina o que é Estatística. 2. Defina POPULAÇÃO e AMOSTRA e cite pelo menos 3 exemplos para cada uma. 3. Defina VARIÁVEL, e quais o tipos citando 3 exemplos de cada. 4. Quais as fases do método estatístico? 5. Classifique as variáveis abaixo em Qualitativa(QL) ou Quantitativa (QT) a) Tempo para fazer um teste. b) Número de alunos aprovados por turma. c) Nível sócio-econômico d) QI (Quociente de inteligência). e) Sexo f) Gastos com alimentação. g) Opinião com relação à pena de morte h) Religião i) Valor de um imóvel j) Conceitos em certa disciplina k) Classificação em um concurso. 6. Classifique as variáveis abaixo quanto ao seu tipo (Qualitativa: Nominal (QLN) ou Ordinal (QLO) e Quantitativa: Discreta (QTD) ou Contínua (QTC). 10 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima a) Uma lista de diferentes especialidades médicas b) Classificar o estágio de um câncer de mama Tipo I, II, III e Iv c) Pressão Arterial Diastólica, medida em mmHg d) Raça dos Pacientes e) Números de sessões de diálise realizadas no mês f) Números de crises de hipertensão. g) Números de clientes atendidos diariamente em um supermercado l) Diâmetro da produção de pregos de uma linha de produção 7. Identifique as variáveis e classifique em Qualitativa: Nominal (QLN) ou Ordinal (QLO) e Quantitativa: Discreta (QTD) ou Contínua (QTC). a) Tabela de códigos de declaração de bens e direitos de imóveis: 11 – Apartamento; 12 - Casas; 13 – Terrenos; 14 – Terra nua; 15 – Salas ou lojas; 16 – Construção; 17 – Benfeitorias; 19 – Outras; (Declaração de Ajuste Anual, Instruções de Preenchimento, Imposto de Renda, Pessoa Física, 1999) b) “O euro começa a circular com 13 bilhões de notas em sete valores(5, 10, 20, 50, 100, 200 e 500)...A cunhagem de75 bilhões de moedas de 1 e 2 euros e de 1, 2, 5, 10, 20 e 50 centavos de euro implicará uma troca completa de máquinas e equipamentos de venda de jornais,café e refrigerantes.” (Revista Época, Ano 1, nº 33 , 4/1/1999) c) “Em sete deliciosos sabores: tangerina, Laranja, maracujá, lima-limão, carambola, abacaxi e maçã verde.” ( Anúncio de um preparado sólido artificial para refresco) d) “ A partir de 1999, as declarações de Imposto de Renda dos contribuintes com patrimônio de até R$ 20 mil poderão ser feitas por telefone.” (Revista época, ano 1, nº 33, 4/1/1999) e) Quantidade de sabores de refresco consumida em determinado estabelecimento no fim de semana; f) Em 28 de dezembro de 1998, a Folha de S. Paulo publicou a classificação dos prefeitos de nove capitais brasileiras. As notas, em uma escala de 0 a 10, foram as seguintes: Curitiba 6,7; Recife, 6,5; Porto Alegre, 6,4; Florianópolis, 6,4; Salvador, 6,3; Fortaleza, 5,5; Belo Horizonte, 5,4; Rio de Janeiro, 5,4 e São Paulo,3,4. 11 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 3. SÉRIES ESTATÍSTICAS Série estatística – é a apresentação de um conjunto de dados coletados, numa tabela e gráfico Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir. E isto ela consegue, inicialmente apresentando esses valores em tabelas e gráficos, que fornecerão rápidas e seguras informações das variáveis em estudo. 3.1. Tabela Ë um quadro que resume um conjunto de observações. TABELA SIMPLES TABELA DE DUPLA ENTRADA Composição de uma tabela: (a) Título – informações localizadas no topo da tabela e responde as perguntas o que? Onde? E quando? (b) Cabeçalho – parte superior da tabela que específica o conteúdo das colunas. (c) Coluna indicadora – parte da tabela que específica o conteúdo das linhas. (d) Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo. (e) Rodapé ou fonte – onde são colocados os elementos complementares da tabela principalmente a fonte. a e e a b c d b b c d b 12 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 3.2. Gráficos São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir as tabelas estatísticas. 3.2.1. Tipos de Gráficos Existem vários tipos de gráficos, tais quais descreveremos a seguir: Gráfico de Barras ou Colunas Para a confecção de um gráfico de barras, constrói-se um eixo horizontal ou vertical, e em intervalos apropriados, nesse eixo, colocam-se retângulos sobre o eixo cujas alturas representam, proporcionalmente, as freqüências das características observadas da variável em estudo. Gráfico de Colunas ou Barras Compostas Para comparar dois ou mais grupos (fatores ou tratamentos), podemos construir um só gráfico composto de vários gráficos, um para cada grupo, como no exemplo a seguir: Nº Mat. 0 250 500 750 1000 Escola A Escola B Escola C Escola D Nº Matriculas por ano 0 250 500 750 1000 Escola A Escola B Escola C Escola D 2005 2006 Nº Matriculas por ano 0 250 500 750 1000 Escola A Escola B Escola C Escola D 2005 2006 13 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Gráfico de Colunas ou Barras Superpostas Para totalizar dois ou mais grupos (fatores ou tratamentos), evidenciando a divisão dos grupos, podemos construir um só gráfico composto de vários gráficos, um para cada grupo, como no exemplo a seguir: Gráfico de Linha ou Linear Para analisar o desenvolvimento de uma ou m ais variáveis num determinado período Gráfico de Setores, Circular ou de pizza Para representar dados em termos relativos, ou seja, em percentual (%). Nº Mat. 27% 36% 21% 16% Escola A Escola B Escola C Escola D Nº Mat. Escola A 27% Escola B 36% Escola C 21% Escola D 16% Nº Matriculas por ano 0 500 1000 1500 2000 Escola A Escola B Escola C Escola D 2005 2006 Nº Matriculas por ano 0 500 1000 1500 2000 Escola A Escola B Escola C Escola D 2005 2006 14 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Estereogramas – 3D Gráficos Pictóricos ou Pictogramas São os gráficos que se coloca no lugar de colunas, figuras, com tamanhos proporcionais às porcentagens das categorias da variável em estudo. Nesse caso cada figura representa uma proporção do total , cada figura representaria 100/11=9,09%. Constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. Russia EUA Europa Outros 0 250 500 750 1000 Escola A Escola B Escola C Escola D Nº Mat. 0 100 200 300 400 500 600 700 Escola A Escola B Escola C Escola D Nº Mat. 15 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Cartograma É representação sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com as áreas geográficas ou políticas. 16 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 3.3. Exercícios Exercício 1: De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsito, 27306 casos de vítimas fatais, assim distribuídos: 11712 pedestres, 7116 passageiros e 8478 condutores. Faça uma tabela para apresentar esses dados. Exercício 2: De acordo com o Ministério dos transportes, em 1998, o tamanho das malhas de transporte no Brasil é, assim distribuído: 320480 km de Rodovias (estradas municipais não estão incluídas), 29700 km de Ferrovias (inclui as linhas de trens urbanos) e 40000 km de Hidrovias (desse total, apenas 8000 km estão sendo usados de fato). Faça uma tabela para apresentar esses dados. Exercício 3: De acordo com Ministério da Educação a quantidade e alunos matriculados no ensino de 1º grau no Brasil nos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 – 22.473 – 23.564. Faça uma tabela para apresentar esses dados. Exercício 4: Estabelecimentos de ensino da região norte do Brasil em 1982. A região norte subdivide-se em: Rondônia, Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e 9 estabelecimentos de ensino, respectivamente, segundo o MEC. . Faça uma tabela para apresentar esses dados. Exercício 5: De acordo com o IBGE(1988), a distribuição dos suicídios ocorridos no Brasil em 1986, segundo a causa atribuída, foi a seguinte: 263 por alcoolismo, 198 por dificuldade financeira, 700 por doença mental, 189 por outro tipo de doença, 416 por desilusão amorosa e 217 por outras causas. Apresente essa distribuição em uma tabela. Exercício 6: Muitos sistemas escolares fornecem o acesso a Internet para seus estudantes hoje em dia. Desde 1996, o acesso À Internet foi facilitado a 21.733 escolas elementares, 7.286 escolas do nível médio e 10.682 escolas de nível superior (Statistical Abstract of United States, 1997). Existe nos Estados Unidos um total de 51.745 escolas elementares, 14.012 escolas do nível médio e 17.229 escolas do nível superior. Exercício 7: A chancede uma campanha publicitária atingir sucesso a ponto de ser comentada nas ruas e até incorporada ao vocabulário da população é muito baixa. De acordo com estudos essa probabilidade se altera de acordo com o meio de comunicação utilizado. Numa amostra de 30.000 campanhas publicitárias de Rádio (8mil), TV (10mil) e Rádio+TV (12mil), verificou-se que, das 2800 que atingiram tal sucesso, 1200 foram veiculadas no rádio e na TV e 500 apenas no rádio. 17 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 4. DISTRIBUIÇÃO DE FREQUÊNCIA Distribuição de Frequência: É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores). Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 ROL: É a tabela obtida após a ordenação dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 4.1. Distribuição de freqüência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seu valores. Para um ROL de tamanho razoável esta distribuição de freqüência é inconveniente, já que exige muito espaço. Veja exemplo abaixo: 4.2. Distribuição de freqüência com intervalos de classe: Quando o tamanho da amostra é grande é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. Pesos Frequência 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20 18 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 4.2.1. Elementos da distribuição de freqüência Classes: são os subintervalos do intervalo em estudo, é identificado pela letra (k). Determinado por: Intervalo de classes ou amplitude de classes: é a diferença entre limite superior e limite inferior das classes. É identificado pela sigla (hi).Determinado por: Limites de classes: são os valores dos extremos das classes denominados de: li (limite inferior) e ls ou Li (limite superior) Amplitude Amostral: é a diferença entre o maior valor (Xmáx) e o menor valor (Xmín) observado. É identificado pela sigla (Aa).Determinado por: Ponto médio da classe: é a média aritmética entre os limites da classes, Determinado por: 4.2.2. Método prático para construção de uma distribuição de freqüência com intervalo de classe: Organize os dados brutos em um ROL. Calcule a amplitude amostral Aa. => Aa = 60 – 41 = 19 Calcule o número de classes através da "Regra de Sturges": nk , 20k => k = 4,47 ~ 5 (dist. Freq. Será composta de 5 classes) Classes Freqências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20 19 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Decidido o nº de classes, calcule então a amplitude do intervalo de cada classe k Aa hi => 5 19 hi h = => h = 3,8 ~ 4 Temos então o menor nº da amostra, o nº de classes e a amplitude do intervalo de cada classe. No nosso exemplo: o menor nº da amostra = 41 + h = 45, onde h=4 logo a primeira classe será representada por 41|--- 45. As classes seguintes respeitarão o mesmo procedimento. O primeiro elemento das classes seguintes sempre serão formadas pelo último elemento da classe anterior. Exemplo: São dados os escores brutos obtidos nos testes de desempenho escolar, realizado por 27 participantes de uma pesquisa, que cursavam a 2ª série do ensino fundamental. 4.3. Tipos de freqüências: Freqüências simples ou absolutas (fi): São os valores que realmente representam o número de dados de cada classe. A soma das freqüências simples é igual ao número total dos dados da distribuição. Freqüências relativas simples (fri): São os valores das razões entre as freqüências absolutas de cada classe e a freqüência total da distribuição. A soma das freqüências relativas é igual a 1 (100 %). Freqüência simples acumulada (Fi): É o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. Freqüência relativa acumulada (Fri): É a freqüência acumulada da classe, dividida pela freqüência total da distribuição. Utilizando o exemplo anterior complete a tabela com as demais freqüências e o ponto médio 7 18 11 25 101 85 81 75 100 95 98 108 100 94 34 99 84 90 95 102 96 105 10 107 117 96 17 20 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Escore Bruto Classificação % 86 Inferior 0,33 87 ~ 105 Médio 0,48 106 Superior 0,19 1,00 Com base nos resultados acima, podemos afirmar que: A maioria dos participantes entrevistados possui nível de desempenho escolar MÉDIO, ficando com estimativa de 48%. 4.4. Representação gráfica de uma distribuição Histograma, Polígono de freqüência e Polígono de freqüência acumulada Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe Polígono de freqüência: é um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. fi Fi fri (%) Fri (%) Xi 7 |------- 26 6 6 0,22 0,22 16,50 26 |------- 45 1 7 0,04 0,26 35,50 45 |------- 64 0 7 - 0,26 54,50 64 |------- 83 2 9 0,07 0,33 73,50 83 |------- 102 13 22 0,48 0,81 92,50 102 |------- 121 5 27 0,19 1,00 111,50 27 - 1,00 - 384,00 Classes Total 0 2 4 6 8 10 12 14 7|-------26 26|-------45 45|-------64 64|-------83 83|-------102 102|-------121 0 2 4 6 8 10 12 14 7|-------26 26|-------45 45|-------64 64|-------83 83|-------102 102|-------121 21 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Histograma de freqüência acumulada: é traçado marcando-se as freqüências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. 0 5 10 15 20 25 30 7|-------26 26|-------45 45|-------64 64|-------83 83|-------102 102|-------121 22 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 4.5. Exercício: 1) Abaixo são relacionados os salários semanais (em Reais) de 60 operários de uma fábrica de sapatos. 110 120 125 136 145 150 165 172 180 185 110 120 125 140 145 155 165 172 180 190 115 120 130 140 145 158 168 175 180 190 115 120 130 140 147 158 168 175 180 195 117 120 130 140 150 160 170 175 180 195 117 123 135 142 150 163 170 178 185 198 a) Construir uma distribuição de freqüências adequada. b) Interpretar os valores da terceira classe. 2) Abaixo são relacionados às estaturas e os pesos de 25 alunos de Estatística. Estaturas Pesos Construir uma distribuição de freqüênciasadequada para cada conjunto de dados. 3) Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma certa semana, arredondados para o valor mais próximo e apresentados em ordem crescente: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Construir uma distribuição de freqüências adequada. 4) Complete os dados que faltam na distribuição de freqüência: Classes xi fi Fi Fri(%) 0 |-- 2 1 4 4 2 |-- 4 8 4 |-- 6 5 30 18 7 27 27 8 |-- 10 15 72 10 |-- 12 83 13 10 93 10 14|-- 16 7 1.71 1.80 1.75 1.73 1.81 58 60 60 62 63 1.90 1.80 1.71 1.74 1.77 80 77 70 82 62 1.63 1.80 1.78 1.84 1.81 55 76 83 50 78 1.83 1.80 1.75 1.79 1.65 79 70 60 76 83 1.72 1.88 1.80 1.66 1.89 77 60 65 71 63 23 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 5. MEDIDAS DE POSIÇÃO São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de freqüência. As medidas de posições mais importantes são as medidas de tendência central ou promédias (verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana. Outros promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica e biquadrática. As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis. 5.1. Média ( X ) É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores. n xi X ,onde xi são os valores da variável e n o número de valores. 5.1.1. Média para Dados não-agrupados ou Média Aritmética Quando desejamos conhecer a média dos dados não-agrupados em tabelas de freqüências, determinamos a média aritmética simples. Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kilos, temos, para venda média diária na semana de: kilos n xi X 14 7 98 7 12181615131410 5.1.2. Média para Dados Agrupados ou Média Ponderada 5.1.2.1. Sem intervalos de classe Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por família: Nº de meninos fi 0 2 1 6 2 10 3 12 4 4 total 34 24 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: Fórmula da Média para Dados Agrupados Sem intervalo de classe é dado por: fi fixi X . 3,2 34 78 i X 5.1.2.2. Com intervalos de classes Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: fi fixi X . , onde o xi será o ponto médio de cada classe Exemplo: Calcular a estatura média de bebês conforme a tabela abaixo. Aplicando a fórmula acima temos: 61 40 440.2 X Nº de meninos fi xi.fi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 total 34 78 Estaturas (cm) fi xi xi*fi 50 |-------- 54 4 52 208 54 |-------- 58 9 56 504 58 |-------- 62 11 60 660 62 |-------- 66 8 64 512 66 |-------- 70 5 68 340 70 |-------- 74 3 72 216 Total 40 372 2440 25 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 5.1.3. Média Geral ( ) Sejam as médias aritméticas de k séries e n1, n2, n3, ..., nk , o número de termos destas séries respectivamente. A média geral da séries formada pelos termos das k séries é dada por: ou Exemplo: Sejam as séries: 1) 4, 5, 6, 7, 8 onde n1 = 5 e X1 = 6 2) 1, 2, 3 onde n2 = 3 e X2 = 2 3) 9, 10, 11, 12, 13 onde n3 = 5 e X3 = 11 Então a Média Geral das séries, utilizando a fórmula acima, será: 5.1.4. Média Geométrica (Mg) Sejam x1, x2, x3, ..., xn , valores de X, associados as frequências absolutas F1, F2, F3, ..., Fn , respectivamente. A média geométrica de X é definida por: Onde: Em particular, se F1 = F2 = F3 = ... = Fn = 1, teremos A média geométrica deve ser utilizada quando os dados se desenvolvem segundo uma Progressão Geométrica, como é o caso dos preços num período de inflação galopante. Exemplo: Em um período inflacionário o preço de determinado produto e seu respectivo consumo estão descritos abaixo. Calcule o preço médio por trimestre do artigo durante um ano. Consumo (cxs) Preço (R$) 1º. Trimestre 200 30,00 2º. Trimestre 100 100,00 3º. Trimestre 200 200,00 4º. Trimestre 100 500,00 26 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima - Calculo para a Média Geométrica de uma distribuição. Note que a aplicação direta da definição acarreta um grande número de operações .Nestes casos é conveniente o uso dos logaritmos.Assim, tomando-se o logaritmo de ambos os membros de definição teremos: Log g F 27 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima log x + F₂logx₂ +F₃log x₃ + ............+ Fn log n 5.2. Moda (Mo) É o valor que ocorre com maior freqüência em uma série de valores. Mo é o símbolo da moda. Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica. 5.2.1. Moda p/ dados não agrupados A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10. Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal. Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal. 5.2.2. Moda para dados agrupados 5.2.2.1. Sem intervalos de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. Exemplo: Qual a temperatura mais comum medida no mês abaixo: Resp: 2º C é a temperatura modal, pois é a de maior freqüência. 5.2.2.2. Com intervalos de classe Cálculo da moda pela fórmula de Czuber Temperaturas fi 0 3 1 9 2 12 3 6 total 30 28 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima A classe que apresenta a maior freqüência é denominada classe modal. Aplica-se a seguinte fórmula: Onde: li = limite inferior da classe modal hi = amplitude da classe modal Δ1= diferença entre a freqüência da classe modal e a classe anterior Δ2= diferença entre a freqüência da classe modal e a classe posterior Exemplo: Classes Fi 0 |---- 1 3 1 |---- 2 10 2 |---- 3 17 3 |---- 4 8 5 |---- 5 5 43 A Classe Modal é 2 |---- 3, logo temos que: li = 2 hi = 1 Δ1= 17 – 10 = 7 Δ2= 17– 8 = 9 Portanto: 5.3. Mediana (Md) A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. Símbolo da mediana: Md 5.3.1. Mediana para dados não-agrupados Se a série de dados tiver número ímpar de termos: O valor mediano será o termo de ordem dado pela fórmula: 2 1n 29 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Obs: 2 1n será o termo de ordem e deve ser substituídos pelo valor correspondente da série de dados. Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 } 1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9, logo 2 1n é dado por 2 19 = 5, ou seja, o 5º elemento da série ordenada será a mediana, logo a mediana = 2 Se a série dada tiver número par de termos O valor mediano será o termo de ordem dado pela fórmula : 2 1 22 nn Obs: 2 1 22 nn serão termos de ordem e devem ser substituídos pelo valor correspondente. Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10, logo 2 1 22 nn é dado por 2 65 2 1 2 10 2 10 , será na realidade (5º termo+ 6º termo) / 2 5º termo = 2 6º termo = 3 A mediana será = 5,2 2 5 2 23 ou seja, Md = 2,5 . A mediana no exemplo será a média Aritmética do 5º e 6º termos da série. Notas: 30 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 18 2 36 2 135 • Quando o número de elementos da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série. • Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2 elementos centrais da série. • Em um série a mediana, a média e a moda não têm, necessariamente, o mesmo valor. • A mediana, depende da posição e não dos valores dos elementos na série ordenada. Essa é uma da diferenças marcantes entre mediana e média ( que se deixa influenciar, e muito, pelos valores extremos). Vejamos: Em { 5, 7, 10, 13, 15 } a média = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a média = 20 e a mediana = 10 Isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma. 5.3.2. Mediana para dados agrupados 5.3.2.1. Sem intervalos de classe Neste caso, é o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. Se a série dada tiver número ímpar de termos: O valor mediano será o termo de ordem dado pela fórmula: 2 1fi Exemplo conforme tabela abaixo: Como o somatório das freqüências = 35 a fórmula ficará Logo, o valor que se encontra 18ª posição = 3, Portanto a Md = 3 Se a série dada tiver número par de termos: Variável( xi) fi Fi 0 2 2 1 6 8 2 9 17 3 13 30 4 5 35 total 35 31 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 5,15 2 31 2 1615 2 54 2 1 2 8 2 8 O valor mediano será o termo de ordem dado pela fórmula: 2 1 22 fifi Exemplo conforme tabela abaixo: Como o somatório das freqüências = 8 a fórmula ficará: Portanto a Md = 15,5 5.3.2.2. Com intervalos de classe Neste caso, devemos seguir os seguintes passos: 1º) Determinamos as freqüências acumuladas; 2º) Calculamos: 2 fi 3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à 4º) Calculamos a Mediana pela seguinte fórmula: Onde: li = é o limite inferior da classe mediana. Fi(ant) = é a freqüência acumulada da classe anterior à classe mediana. fi = é a freqüência simples da classe mediana. hi = é a amplitude do intervalo da classe mediana. => hi = Li – li Exemplo conforme tabela abaixo: Variável xi fi Fi 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 tota l 8 fi hiantFi fi liMd *)( 2 32 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima , logo.a classe mediana será 58 |------ 62 li = 58 Fi(ant) = 13 fi = 11 hi = 4 Substituindo esses valores na fórmula, obtemos: Emprego da Mediana • Quando desejamos obter o ponto que divide a distribuição em duas partes iguais. • Quando há valores extremos que afetam de maneira acentuada a média aritmética. • Quando a variável em estudo é salário. 6. SEPARATRIZES classes fi Fi 50 |------------ 54 4 4 54 |------------ 58 9 13 58 |------------ 62 11 24 62 |------------ 66 8 32 66 |------------ 70 5 37 70 |------------ 74 3 40 tota l 40 fi hiantFi fi liMd *)( 2 11 28 58 11 4*7 58 11 4*320 58 Md 55,6055,258 Md 20 2 40 2 fi 33 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua característica de separar a série em duas partes que apresentam o mesmo número de valores. Essas medidas são: os quartis, os decis e os percentis - são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes. 6.1. Quartis Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Assim: 0% 25% 50% 75% 100% Q1 Q2 Q3 Q1 = 1º quartil, deixa 25% dos elementos Q2 = 2º quartil, deixa 50% dos elementos é igual a Mediana Q3 = 3º quartil, deixa 75% dos elementos Por definição temos que: Md = Q2 6.1.1. Para dados não agrupados Se a série dada tiver número ímpar de termos: O valor quartílico será o termo de ordem dado pela fórmula: 4 )1( . n k Onde k é a ordem do quartil desejado, k = 1, 2, 3 Exemplo 1: Calcule os quartis da série: { 5, 2, 6, 9, 10, 13, 15 } O primeiro passo a ser dado é o da ordenação (crescente) da série: { 2, 5, 6, 9, 10, 13, 15 } Q1 => 2 4 8 4 )17( .1 , será o termo que está na 2ª posição logo Q1 = 5 Q3 => 62.3 4 )17( 3 , será o termo que está na 6ª posição logo Q3=13 Q2 => 42.2 4 )17( 2 , será o termo que está na 6ª posição logo Q2=9 Se a série dada tiver número par de termos: 34 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima O valor quartílico será o termo de ordem dado pela fórmula: 2 1 4 . 4 . nknk Onde k é a ordem do quartil desejado, k = 1, 2, 3 Exemplo 2: Calcule os quartis da série: {1, 1, 2, 3, 5, 5, 6, 7, 9, 10, 10, 13} Q1 => 5,2 2 32 2 43 2 1 4 12 4 12 , logo Q1=2,5 Q3 => 9 2 99 2 109 2 1 4 36 4 36 2 1 4 12.3 4 12.3 , logo Q3=9 Q2 => 5,5 2 65 2 76 2 1 4 24 4 24 2 1 4 12.2 4 12.2 , logo Q2=5,5 6.1.2. Para dados agrupados6.1.2.1. Sem intervalo de classe Se a série dada tiver número ímpar de termos: O valor quartílico será o termo de ordem dado pela fórmula: 4 )1( . fi k Onde k é a ordem do quartil desejado, k = 1, 2, 3 Exemplo conforme tabela abaixo: xi fi Fi 0 2 2 1 6 8 2 9 17 3 13 30 4 5 35 35 Q1, 9 4 36 4 )135( , logo Q1=2 Q3, 279.3 4 36 4 )135( .3 , logo Q3=3 35 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Q2=Md , 189.2 4 36 4 )135( .2 , logo Q3=3 Se a série dada tiver número par de termos: O valor quartílico será o termo de ordem dado pela fórmula: 2 1 4 . 4 . fikfik Exemplo conforme tabela abaixo: xi fi Fi 12 2 2 14 6 8 16 9 17 18 13 30 20 6 36 36 Q1, 16 2 1616 2 109 2 1 4 36 4 36 , Logo, Q1=16 Q3, 18 2 1818 2 2827 2 1 4 108 4 108 2 1 4 36.3 4 36.3 , Logo, Q3=18 Q2, 18 2 1818 2 1918 2 1 4 72 4 72 2 1 4 36.2 4 36.2 , Logo, Q2=18 6.1.2.2. Com intervalo de classe Usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, 2 fi , por 4 . fi k , sendo k o número de ordem do quartil, é dada por: fi hiantFi fi k liQk .)( 4 . Exemplo 3: Calcule os quartis da tabela abaixo: Classes fi Fi 4 |--- 9 2 2 9 |--- 14 6 8 14 |--- 19 9 17 19 |--- 24 13 30 30 36 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Q1, 5,7 4 30 .1 , classe Mediana é 9 |--- 14, então: 6,13 6 5.25,7 91 Q Q3 3, 5,22 4 30 .3 , classe Mediana é 19 |--- 24, então: 1,21 13 5.175,22 191 Q Q2=Md, 15 4 30 .2 , classe Mediana é 14 |--- 19, então: 9,17 9 5.815 141 Q 6.2. Percentis ou Centis Denominamos percentis ou centis os valores de uma série que a dividem em 100 partes iguais. Assim: 0% 1% 2% ... 50% ... 98% 99% 100% P1 P2 ... P50 ... P98 P99 P1=Q1 = deixa 25% dos elementos P2=Q2 = deixa 50% dos elementos é igual a Mediana P3=Q3 = deixa 75% dos elementos 6.2.1. Para dados não agrupados Se a série dada tiver número ímpar de termos: O valor quartílico será o termo de ordem dado pela fórmula: 100 )1( . n k Onde k é a ordem do quartil desejado, k = 1, 2, 3, ..., 99 O método mais prático é utilizar o princípio do cálculo da mediana para os centis Se a série dada tiver número par de termos: O valor do centil será o termo de ordem dado pela fórmula: 2 1 100 . 100 . nknk Onde k é a ordem do quartil desejado, k = 1, 2, 3, ..., 99 6.2.2. Para dados agrupados 6.2.2.1. Sem intervalo de classe Se a série dada tiver número ímpar de termos: 37 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima O valor quartílico será o termo de ordem dado pela fórmula: 100 )1( . fi k Onde k é a ordem do quartil desejado, k = 1, 2, 3, ..., 99 Se a série dada tiver número par de termos: O valor do centil será o termo de ordem dado pela fórmula: 2 1 100 . 100 . fikfik Onde k é a ordem do quartil desejado, k = 1, 2, 3, ..., 99 6.2.2.2. Com intervalo de classe Usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, 2 fi , por 100 . fi k ... sendo k o número de ordem do centil. fi hiantFi fi k liPk .)( 100 . 38 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 7. MEDIDAS DE DISPERSÃO OU VARIABILIDADE É a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central ( média ou mediana ) tomado como ponto de comparação. A média - ainda que considerada como um número que tem a faculdade de representar uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z: X = { 70, 70, 70, 70, 70 } Y = { 68, 69, 70 ,71 ,72 } Z = { 5, 15, 50, 120, 160 } Observamos então que os três conjuntos apresentam a mesma média aritmética 70 5 350 X Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média representativa. Concluímos então que o conjunto X apresenta dispersão nula e que o conjunto Y apresenta uma dispersão menor que o conjunto Z. 7.1. Amplitude Total É a diferença entre o maior e o menor valor da série, indicada por: Exemplo: Para a série 10, 12, 22, 25, 33, 38 7.2. Intervalo semi-interquartílico É utilizado para verificar a dispersão em torno da Mediana. É dado por: Exemplo: Foram calculados as seguintes medidas para as notas dos alunos em duas disciplinas: Estatística Q1=3; Q3=6,5; Md=5. Matemática Q1=2; Q3=7,0; Md=5. 39 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Nota-se que, de apesar de as duas distribuições terem a mesma Mediana, as notas de Estatística tiveram uma menor dispersão em relação a ela. 7.3. Desvio Médio (Dm) 7.3.1. Para dados não agrupados É a média aritmética dos valores absolutos dos desvios tomados em relação a uma das seguintes medidas de tendência central: média ou mediana. Exemplo: Calcular o desvio médio do conjunto de números { - 4 , - 3 , - 2 , 3 , 5 } 7.3.2. Para Dados Agrupados 7.3.2.1. Sem intervalo de Classe Se os valores vierem dispostos em uma tabela de freqüências, agrupados em classes, serão usadas as seguintes fórmulas: 40 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Exemplo: xi fi xi.fi |xi - X|.fi 3 2 6 3.4 4 2 8 1.4 5 3 15 0.9 6 3 18 3.9 S 10 47 9.6 Temos que: Portanto de Desvio Médio é: 7.3.2.2. Com intervalo de Classe Se os valores vierem dispostos em uma tabela de freqüências, agrupados em classes, serão usadas as seguintes fórmulas: Exemplo: Classes fi xi Fi xi.fi |xi-X|*fi 2 |--- 4 3 3 3 9 10.71 4 |--- 6 1 5 4 5 1.57 6 |--- 8 6 7 10 42 2.57 8 |--- 10 4 9 14 36 9.71 14 92 24.57 Temos que: Portanto o Desvio Médio é: 41 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 7.4. Desvio Padrão (S ou ) 7.4.1. Para dados não agrupados 1 2 n Xxi S Exemplo: Calcular o desvio padrão representado por { - 4 , - 3 , - 2 , 3 , 5 } 2,0 2,0 5 1 5 53234 X X Tabela Auxiliar: xi (xi - X) 2 -4 14.44 -3 7.84 -2 3.24 3 10.24 5 27.04 -1 62.8 96,37,15 4 8,62 S 7.4.2. Para dados agrupados 7.4.2.1. Sem intervalo de classe Se os valores vierem dispostos em uma tabela de freqüências, agrupados ou não em classes, serão usadas as seguintes fórmulas: 1 . 2 fi fiXxi S Exemplo: xi fi xi.fi (xi - X) 2 .fi 2 1 2 1,78 4 3 12 1,33 6 5 30 35,56 8 2 16 43,56 10 4 40 177,78 30 15 100 260,00 42 Estatística Aplicada Copyrigth © 2016JozeteCoelho de Lima Temos que: 33,3 15 100 X Logo Desvio Padrão é dado por: 31,457,18 14 260 S 7.4.2.2. Com intervalo de classe 1 . 2 fi fiXxi S , onde o xi será o ponto médio de cada classe Exemplo: Classes fi Fi xi xi.fi (xi-X)^2.fi 2|--- 4 3 3 3 9 38.27 4|--- 6 1 4 5 5 2.47 6|--- 8 6 10 7 42 1.10 8|--- 10 4 14 9 36 23.59 14 92 65.43 Temos que: Portanto o Desvio Padrão é: 24,203,5 13 43,65 S 7.5. Variância ( S2) É o desvio padrão elevado ao quadrado. A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras. 1 . 2 2 n Xxi S e 1 . 2 2 fi fiXxi S 43 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 7.6. Coeficiente de Variação de Pearson (CVP) Medidas de Dispersão Relativa Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada de CVP: Coeficiente de Variação de Pearson (é a razão entre o desvio padão e a média referentes a dados de uma mesma série). Coeficiente de Variação de Pearson (CVP) A fórmula do CVP será o resultado neste caso e expresso em percentual, a fórmula é descrita: 100. X S Cvp Exemplo: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos: Variáveis Média Desvio Padrão Estaturas (cm) 175 5 Pesos (kg) 68 2 Qual das medidas (Estatura ou Peso) possui maior homogeneidade ? %85,2100.0285,0100. 175 5 estaturaCvp %94,2100.0294,0100. 68 2 pesoCvp Logo, o grupo como maior homogeneidade é o grupo da variável estatura, pois possui menor varição relativo do que o peso. Diz-se que a distribuição tem grau de variabilidade (dispersão) quando: Cv ≤ 15% Baixa Dispersão 15% < Cv < 30% Média Dispersão Cv ≥ 30% Alta Dispersão 44 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 7.7. Exercícios sobre medidas de posição e dispersão. 1. A amostra abaixo foi retirada de uma população de notas dos alunos de uma classe: 5 8 6 5 5 2 7 Determinar: a) A nota média. (5,4) b) O desvio médio (1,3) c) A variância (3,6) d) O desvio padrão (1,9) e) A moda (5) f) A mediana (5) g) A amplitude (6) h) O coeficiente de variação (35%) 2. Um grupo de candidatos a um emprego foi submetido a um teste de QI. Os resultados estão agrupados abaixo: QI 80 |-- 90 90 |-- 100 100 |-- 110 110 |-- 120 120 |-- 130 No. Candidatos 20 100 120 50 10 Calcular: a) O QI médio. (103) b) O QI mediano. (102,5) c) A moda desses valores. (102) d) Os quartís e classificar os candidatos em: Péssimos, Regulares, Bons e Ótimos. (95,5; 102,5; 108,75) e) A variância. (84,9) f) O desvio padrão (9,2) g) O coeficiente de variação. (8,9%) 3. A amostra abaixo representa uma distribuição salarial. Salários (em mil- hares de R$) 1|--3 3|--5 5|--7 7|--9 9|--11 11|--13 13|--15 N o funcionários 40 80 100 50 30 20 10 Calcular: a) A média salarial. (6,3 ou R$ 6.303,03) b) O salário mediano. (5,90 ou R$ 5.900,00) c) Os quartís e classificar os salários em: baixos, abaixo da mediana, acima da mediana e altos. (4,06 ou R$ R$ 4.062,50; 5,90 ou R$ 5.900,00 e 8,10 ou R$ 8.100,00) d) O salário modal. ( 5,57 ou R$ 5.571,43) e) O desvio médio salarial. (2,34 ou R$ 2.343,43) f) A variância dos salários. (9,03 ou R$2 9.026.434,56) g) O desvio padrão dos salários. (3,00 ou R$ 3.004,40) h) O coeficiente de variação dos salários. ( 48%) 45 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 8. MEDIDAS DE ASSIMETRIA Uma distribuição é dita simétrica quando possui a mesma média, moda e a mediana e os quartis ficam eqüidistantes da mediana, o que não ocorre com numa distribuição assimétrica. Q1 Md=X=Mo Q3 Mo Md X X Md Mo Simétrica Assimétrica Positiva Assimétrica Negativa 8.1. Coeficientes de Assimetria 8.1.1. Primeiro Coeficiente de Pearson Se As = 0, a distribuição é simétrica, pois a X = Md = Mo Se As > 0, a distribuição é simétrica positiva, pois Mo < Md < X Se As = 0, a distribuição é simétrica negativa, pois X < Md < Mo Quando não temos condições de calcular a média e o desvio padrão, utilizamos: 8.1.2. Segundo Coeficiente de Pearson Exemplo: Determinar o coeficiente de assimetria pelos dos processos para a distribuição: Classes 50 |--- 60 60 |--- 70 70 |--- 80 80 |--- 90 90 |--- 100 Fi 15 20 30 20 20 100 1º. Processo: Classes fi xi Fi xi.fi (xi-X)^2*fi 50 |--- 60 15 55 15 825 6000 60 |--- 70 20 65 35 1300 2000 70 |--- 80 30 75 65 2250 0 80 |--- 90 20 85 85 1700 2000 90 |--- 100 15 95 100 1425 6000 100 7500 16000 46 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Calcula-se a Média, a Moda e o Desvio Padrão Logo: Como o As = 0 , a distribuição é Simétrica 2º. Processo: O resultado de As confirma o anterior. 47 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 9. MEDIDAS DE CURTOSE Entende-se por curtose o grau de achatamento de uma distribuição. Com referência ao grau de achatamento, podemos ter: Para medir o grau de curtose utilizaremos o coeficiente: Com referência ao grau de achatamento da curva correspondente à distribuição, podemos ter: Se K < 0.263, corresponde a uma Curva Leptocúrtica, ou seja, alongada. Se K = 0.263, corresponde a uma Curva Mesocúrtica- normal, ou seja, nem achatada nem alongada. Se K > 0.263, corresponde a uma Curva Platicúrtica, ou seja, achatada. Exemplo: Determinar o coeficiente de assimetria pelos dos processos para a distribuição: Classes 3 |--- 8 8 |--- 13 13 |--- 18 18 |--- 23 Fi 5 15 20 10 50 Fi 5 20 40 50 50 Calcula-se o 1º. e 3º. Quartil e os Centis 10º. e 90º: 48 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Portanto, Logo, K > 0,263, portanto a curva é suavemente platicúrtica. 49 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 10. INTRODUÇÃO A PROBABILIDADE 10.1. Teoria de Conjuntos Um conjunto pode ser considerado como uma coleção de elementos ou eventos que desejamos estudar. Simbologia utilizada entre conjuntos =união = está contido = intersecção = não está contido = pertença = vazio = não pertence A’, A c = complementar e A 10.2. Conjunto universo ou espaço amostral É o conjunto de todos os resultados possíveis de um experimento aleatório. A letra que representa o espaço amostral é S ou . Ex. Supomos agora que: O conjunto A representa todas as pessoas entre 20 e 40 anos; O conjunto B representa todas as pessoas entre 30 e 50 anos; Logo os conjuntos A e B estarão contidos em , pois este representa toda a população. 10.3. Operação entre conjuntos 10.3.1. União de conjuntos: É a união ou reunião de dois ou mais conjuntos, é aquele que contém todos os elementos em um ou no outro. Assim, podemos representar graficamente a união dos conjuntos A e B pelo conjunto C, e a notação é: A B 50 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima C = A B Então, C será o conjunto das pessoas com idade de 20 a 50 anos. 10.3.2. Intersecção de conjuntos É a intersecção de dois ou mais conjuntos, é aquele que contém apenas os elementos comuns isto é em um e outro. Assim, podemos representar graficamente a intersecção dos conjuntos A e B pelo conjunto D, e a notação é: D = A B Então, D será o conjunto das pessoas com idade de 30 a 40 anos. 10.3.3. Complementar de um conjunto É o evento que ocorre, se somente se, o outro não ocorrer. Assim, podemos representar graficamente o complementar de um conjunto pelo conjunto A’ ou A c , e a notação é: A’ou A c = - A Então, A’ou A c , será o conjunto das pessoas de todas as idade menos as pessoas com idade de 30 a 40 anos. A’ou A c C D 51 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 11. NOÇÕES DE PROBABILIDADE Sejam algumas definições de probabilidade: 11.1. Definição de probabilidade É a parte da matemática que estuda as chances de ocorrer um determinado acontecimento. 11.2. Função de probabilidade Identificamos como o espaço amostral = {A1, A2, ... , An} de um experimento aleatório, podemos associar a cada elemento A1, A2, ... , An , a sua possibilidade de ocorrência por: P() = {P(a1), P(a2), ... , P(An)} Função de probabilidade é uma função definida no espaço amostral do experimento assumindo valores, com as seguintes propriedades: a) 0 ≤ P(Ai) ≤ 1; para todo i = 1, 2, ... , n b) P(Ai) = 1 11.3. Experimento aleatório São fenômenos que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. O resultado final depende do acaso. Exemplo: Da afirmação "é provável que o meu time ganhe a partida hoje"; O lançamento de uma moeda; O lançamento de um dado; Retirado de uma bola de uma urna, etc. 11.4. Espaço amostral É o conjunto de todos os resultados possíveis de um experimento aleatório. Exemplo: a) O lançamento de um dado = {1, 2, 3, 4, 5, 6} 52 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima b) O lançamento de um a moeda = {C, K} c) Retirada de uma carta de um baralho com 52 cartas = {52 cartas, com 4 naipes constituída de 13 cartas cada naipe} 11.5. Evento No conjunto do espaço amostral, evento será qualquer um de seus subconjuntos. Exemplo: a) O lançamento de um dado, a ocorrência de números pares. = {1, 2, 3, 4, 5, 6} e A = {2, 4, 6} b) O lançamento de uma moeda, a ocorrência de face cara. = {C, K} e B = {C} Repare que tanto nos dois exemplos os eventos formados são subconjuntos do espaço amostral. 11.6. Probabilidade como relação de conjunto Se considerarmos como o conjunto do N resultados possíveis e A o conjunto de n eventos nos quais A ocorre, então a probabilidade de A é dada por: N n AP )( , onde n = número de casos favoráveis ao evento N = número total de casos possíveis Exemplo: Em uma urna existem 4 bolas brancas e 6 bolas pretas, qual a probabilidade de sair bola branca quando retiramos uma bola da urna? = { 10 bolas, sendo 4 BB e 6 BP} Logo: 4,0 10 4 )( BolaBrancaP ou 40% 11.7. Relações de probabilidade a) Propriedade Aditiva ou Teorema da Soma Para Eventos Disjuntos 53 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Se A1, A2, ... , An , são eventos disjuntos então vale: P(A B) = P(A) + P(B) O conceito de disjuntos deve ser entendido como conjuntos mutuamente exclusivos, ou seja, o que ocorre em um, nos outros não podem ocorrer. Exemplo: No lançamento de um dado, a ocorrência de números pares ou o número 3. = {1, 2, 3, 4, 5, 6} A: Sair nº par, A = {2, 4, 6} e B: Sair nº três, B = {3} Temos então que: 5,0 6 3 )( AP e 6 1 )( BP Nota-se que A e B são eventos exclusivos, o que ocorre em A não ocorre em B, logo eles são eventos disjuntos, então vale: 667,0 6 4 6 1 6 3 )()()()( BAPBPAPBAP Para Eventos Não Disjuntos Se A1, A2, ... , An , são eventos não disjuntos então vale: P(A B) = P(A) + P(B) – P(A B) O conceito de não disjuntos deve ser entendido como conjuntos não exclusivos, ou seja, o que ocorre em um, nos outros ocorre pelo menos um. Exemplo: Supomos agora, no lançamento de um dado, a ocorrência de números pares ou múltiplo 3. = {1, 2, 3, 4, 5, 6} A: Sair nº par, A = {2, 4, 6} e B: Sair múltiplo três, B = {3, 6} Temos então que: 5,0 6 3 )( AP e 6 2 )( BP 54 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Nota-se que A e B são eventos não exclusivos, o que ocorre em A ocorre também B pelo menos um, logo eles são eventos não disjuntos, então vale: 667,0 6 4 6 1 6 2 6 3 )()()()()( BAPBAPBPAPBAP b) Teorema do Produto Para Eventos Independentes Se A e B são eventos independentes de um mesmo espaço amostral, a condição dos dois ocorrerem é: P(A B) = P(A) . P(B) Exemplo: Em uma urna existem 4 bolas brancas e 6 bolas pretas, é feito duas retiradas com reposição, qual a probabilidade de nas duas retiradas ter saído bola branca? = { 10 bolas, sendo 4 BB e 6 BP} 10 4 )ª1( BrancaP e 10 4 )ª2( BrancaP Logo: O a 1ª retirada independente da 2ª retirada então vale: 16,0 25 4 100 16 10 4 . 10 4 )( BrancaBrancaP Para Eventos Dependentes ou Probabilidade Condicional Se A e B são eventos dependentes de um mesmo espaço amostral, a condição dos dois ocorrerem é: P(A B) = P(A) . P(B/A) Exemplo: Em uma urna existem 4 bolas brancas e 6 bolas pretas, é feito duas retiradas sem reposição, qual a probabilidade de nas duas retiradas ter saído bola branca? = { 10 bolas, sendo 4 BB e 6 BP} 10 4 )ª1( BrancaP e 9 3 )ª2( BrancaP 55 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Logo: O a 2ª retirada dependente da 1ª retirada então vale: 13,0 15 2 90 12 9 3 . 10 4 )( BrancaBrancaP 56 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 12. VARIÁVEIS ALEATÓRIAS 12.1. Definição É a função que associa um número real a cada elemento do espaço amostral. Onde S → espaço amostral s → elemento do espaço amostral S 12.2. Variáveis Aleatórias Discreta Na prática é, muitas vezes, mais interessante associarmos um número a um eventoaleatório e calcularmos a probabilidade de ocorrência desse número, do que a probabilidade de todo o evento. Podemos dizer que a variável aleatória para ser discreta deve assumir valores em um conjunto finito ou um conjunto infinito, porém enumerável. Suponha o experimento em que consiste lançar 3 moedas. Seja X o número de ocorrências de faces caras. Determine a distribuição de probabilidade de X. Temos E → jogar três moeda S = {(ccc), (kcc), (ckc), (cck), (kkk), (kkc), (kck), (ckk)} Se X é o número de caras, X assume o valores 0, 1, 2, 3. Podemos associar esses números eventos que correspondam a ocorrência de nenhuma, uma, duas ou três caras respectivamente, como segue: x = 0 {(kkk)} x = 1 {(kkc)(kck)(ckk)} x = 2 {(kcc)(ckc)(cck)} x = 3 {(ccc)} Logo teremos a seguinte distribuição de probabilidade xi P(xi) 0 1/8 1 3/8 2 3/8 3 1/8 8/8 57 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima Graficamente temos: Exemplo: Duas bolas são retiradas sucessivamente, sem reposição, de uma caixa que contém 4 bolas vermelhas e 3pretas. Seja X a variável aleatória “número de bolas vermelhas retiradas no experimento” Quais os valores assumidos por “X” ? Solução: S = {vv, vp, pv, pp} Então: x = {2, 1, 1, 0} ou seja, x = 0, 1, 2 Notação: X = x Onde: X → variável aleatória x → valores assumidos pela variável aleatória Logo teremos a seguinte distribuição de probabilidade xi P(xi) 0 1/4 1 2/4 2 1/4 4/4 Exercício de Aplicação Lançam-se 2 dados. Seja X a soma das faces. Determinar a distribuição de probabilidade de X. E → jogar dois dados 58 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima S = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} Se X é a soma das faces, X assume o valores 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 e 12 . Podemos associar esses números eventos que correspondam as seguintes ocorrências: x = 2 {(1, 1)} x = 3 {(1, 2) (2, 1)} x = 4 {(1, 3) (2, 2) (3, 1)} x = 5 {(1, 4) (2, 3) (3, 2) (4, 1)} x = 6 {(1, 5) (2, 4) (3, 3) (4, 2) (5, 1)} x = 7 {(1, 6) (2, 5) (3, 4) (4, 3) (5, 2) (6, 1)} x = 8 {(2, 6) (3, 5) (4, 6) (5, 3) (6, 2)} x = 9 {(3, 6) (4, 5) (5, 4) (6, 3)} x = 10{(4, 6) (5, 5) (6, 4)} x = 11{(5, 6) (6, 5)} x = 12{(6, 6)} Logo teremos a seguinte distribuição de probabilidade: 12.3. Variáveis Aleatórias Contínuas Uma variável aleatória X é contínua em R se existir uma função f(x), tal que: a) f(x) = 0 (não negativa) b) xi P(xi) 2 1/36 3 2/36 4 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 36/36 59 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima A função f(x) é chamada de função densidade de probabilidade (f.d.p.) Observemos que: Corresponde a área delimitada pela função f(x), eixo dos X e pelas retas X = a e X = b. Se X é uma variável aleatória contínua, então: Definição: A esperança ou a média pode ser entendida como um “centro de distribuição de probabilidades”. 60 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima 13. REFERÊNCIAS BIBLIOGRÁFICAS ANDERSON, D. R. Estatística Aplicada a Administração e Economia. São Paulo: Editora Pioneira Thompson Learning, 2002. ARA, Amilton B. Introdução a Estatística. São Paulo: Editora Edgard Blucher, 1999. BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica. São Paulo: Editora Saraiva, 2010. COSTA, J. J. da Serra. Elementos de Estatística. Rio de Janeiro: Editora Campus, 1981. CRESPO, Antônio A. Estatística Fácil. São Paulo: Editora Saraiva, 2008. FONSECA, Jairo S.; MARTINS, Gilberto A. Curso de Estatística. Editora Atlas. São Paulo, 2009. FONSECA, Jairo S.; MARTINS, Gilberto A.; TOLEDO, Geraldo L. Estatística Aplicada. São Paulo: Editora Atlas. 1995. HOFFMAN, RONALDO.; VIEIRA, Sônia. Elementos de Estatística. São Paulo: Editora Atlas, 1998. LAPPONI, Juan Carlos. Estatística usando Excel 5 e 7. São Paulo: Editora Lapponi, 1997. LEVIN, Jack; FOX, James A. Estatística para Ciências Humanas. São Paulo: Editora Pearson, 2004. MONTGOMERY, Douglas C.; HUBELE, Norma Faris; RUNGER, George C. Estatística Aplicada a Engenharia. Editora LTC, 2004. MONTGOMERY, Douglas C.; RUNGER, George C. Estatística aplicada e probabilidade para engenheiros. Rio de Janeiro: Editora LTC, 2003. MORETTIN, Luiz Gonzaga. Estatística básica: Probabilidade. São Paulo: Editora Makron Books, 1994. PEREIRA, Paulo H. Noções de Estatística.São Paulo: Editora Papirus, 2004. SOUZA, Andre M. S.; GESSER, Kiliano; DALPIAZ, Márcia V. A. D. Estatística – Caderno de Estudos. Santa Catarina: Editora Uniasselvi, 2011. SPIEGEL, Murray R.; SCHILLER, Jonh; SRINIVASAN, R. Alu. Probabilidade e Estatística-Coleção Schaum. São Paulo: Editora Bookman, 2004. DONAIRE, Denis; MARTINS, Gilberto A. Princípios de Estatística. São Paulo: Editora Atlas, 2006. 61 Estatística Aplicada Copyrigth © 2016Jozete Coelho de Lima VIEIRA, Sônia. Princípios de Estatística. São Paulo: Editora Cengage Learning, 2000.
Compartilhar