Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística e Probabilidade Alexandre Antunes CONTEÚDO DESTA AULA - Conceitos Básicos - Coleta de Dados - Medidas de Tendência Central - Separatrizes Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE Variável é uma característica da unidade experimental. Vamos estudar dois tipos de variáveis: quantitativas e qualitativas. Variáveis quantitativas são aquelas cujas respostas da variável são expressas por números (quantidades). Variáveis qualitativas são aquelas cujas respostas são expressas por um atributo. V A R I Á V E I s Variáveis quantitativas contínuas são aquelas que podem assumir, teoricamente, infinitos valores entre dois limites (num intervalo), ou seja, podem assumir valores não inteiros. Por exemplo: altura (em metros) de alunos de uma determinada faixa etária, peso (em kg), salário, etc. Variáveis quantitativas discretas são aquelas que só podem assumir valores inteiros. Por exemplo: número de filhos por casal, número de livros em uma biblioteca, número de carros vendidos, etc. Variáveis qualitativas nominais definem-se como aquelas em que as respostas são expressas por um atributo (nome) e esse atributo não pode ser ordenado. Por exemplo: tipo sanguíneo, religião, estado civil, etc. Variáveis qualitativas ordinais têm suas respostas expressas por um atributo (nome) e esse atributo pode ser ordenado. Por exemplo: grau de instrução, classe social, etc. Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Conceitos Básicos a) cor dos olhos b) número de peças produzidas por hora c) diâmetro externo d) número de pontos em uma partida de futebol e) produção de algodão f) salários dos executivos de uma empresa g) número de ações negociadas na bolsa de valores h) sexo dos filhos i) tamanho de pregos produzidos por uma máquina j) quantidade de água consumida por uma família em um mês k) grau de escolaridade l) nível social m) tipo sanguíneo n) estado civil Exercício 1: Classifique as variáveis abaixo em quantitativas (discretas ou contínuas) ou qualitativas (nominal ou ordinal). Estatística e Probabilidade Respostas a) qualitativa nominal b) quantitativa discreta c) quantitativa contínua d) quantitativa discreta e) quantitativa contínua f) quantitativa contínua g) quantitativa discreta h) qualitativa nominal i) quantitativa contínua j) quantitativa contínua k) qualitativa ordinal l) qualitativa ordinal m) qualitativa nominal n) qualitativa nominal ESTATÍSTICA E PROBABILIDADE - Conceitos Básicos a) cor dos olhos b) número de peças produzidas por hora c) diâmetro externo d) número de pontos em uma partida de futebol e) produção de algodão f) salários dos executivos de uma empresa g) número de ações negociadas na bolsa de valores h) sexo dos filhos i) tamanho de pregos produzidos por uma máquina j) quantidade de água consumida por uma família em um mês k) grau de escolaridade l) nível social m) tipo sanguíneo n) estado civil Exercício 1: Classifique as variáveis abaixo em quantitativas (discretas ou contínuas) ou qualitativas (nominal ou ordinal). Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Conceitos Básicos Exercício 2: Os institutos de pesquisa de opinião regularmente fazem pesquisas para determinar o índice de popularidade do presidente em exercício. Suponha que uma pesquisa será conduzida com 2.500 indivíduos, que serão questionados se o presidente está fazendo um bom ou um mau governo. Os 2.500 indivíduos serão selecionados por números de telefone aleatórios e serão entrevistados por telefone. a) Qual a população relevante? b) Qual a variável de interesse? É qualitativa ou quantitativa? c) Qual é a amostra? d) Qual é o interesse da inferência para o pesquisador? e) Qual é o método de coleta de dados que foi empregado? f) A amostra em estudo é representativa? Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Conceitos Básicos Exercício 2: Os institutos de pesquisa de opinião regularmente fazem pesquisas para determinar o índice de popularidade do presidente em exercício. Suponha que uma pesquisa será conduzida com 2.500 indivíduos, que serão questionados se o presidente está fazendo um bom ou um mau governo. Os 2.500 indivíduos serão selecionados por números de telefone aleatórios e serão entrevistados por telefone. a) Qual a população relevante? R: Todos os cidadãos brasileiros. b) Qual a variável de interesse? É qualitativa ou quantitativa? R: Avaliação do trabalho do presidente (bom ou mau); qualitativa. c) Qual é a amostra? R: 2.500 indivíduos sorteados. Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Conceitos Básicos Exercício 2: Os institutos de pesquisa de opinião regularmente fazem pesquisas para determinar o índice de popularidade do presidente em exercício. Suponha que uma pesquisa será conduzida com 2.500 indivíduos, que serão questionados se o presidente está fazendo um bom ou um mau governo. Os 2.500 indivíduos serão selecionados por números de telefone aleatórios e serão entrevistados por telefone. a) Qual a população relevante? R: Todos os cidadãos brasileiros. b) Qual a variável de interesse? É qualitativa ou quantitativa? R: Avaliação do trabalho do presidente (bom ou mau); qualitativa. c) Qual é a amostra? R: 2.500 indivíduos sorteados. Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Conceitos Básicos Exercício 2: Os institutos de pesquisa de opinião regularmente fazem pesquisas para determinar o índice de popularidade do presidente em exercício. Suponha que uma pesquisa será conduzida com 2.500 indivíduos, que serão questionados se o presidente está fazendo um bom ou um mau governo. Os 2.500 indivíduos serão selecionados por números de telefone aleatórios e serão entrevistados por telefone. a) Qual a população relevante? R: Todos os cidadãos brasileiros. b) Qual a variável de interesse? É qualitativa ou quantitativa? R: Avaliação do trabalho do presidente (bom ou mau); qualitativa. c) Qual é a amostra? R: 2.500 indivíduos sorteados. Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Conceitos Básicos Exercício 2: Os institutos de pesquisa de opinião regularmente fazem pesquisas para determinar o índice de popularidade do presidente em exercício. Suponha que uma pesquisa será conduzida com 2.500 indivíduos, que serão questionados se o presidente está fazendo um bom ou um mau governo. Os 2.500 indivíduos serão selecionados por números de telefone aleatórios e serão entrevistados por telefone. d) Qual é o interesse da inferência para o pesquisador? R: Estimar a proporção de todos os cidadãos que acreditam que o presidente está fazendo um bom trabalho. e) Qual é o método de coleta de dados que foi empregado? R: Pesquisa f) A amostra em estudo é representativa? R: A amostra em estudo não é representativa, pois foram entrevistadas somente pessoas que possuem telefone. Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Conceitos Básicos Exercício 2: Os institutos de pesquisa de opinião regularmente fazem pesquisas para determinar o índice de popularidade do presidente em exercício. Suponha que uma pesquisa será conduzida com 2.500 indivíduos, que serão questionados se o presidente está fazendo um bom ou um mau governo. Os 2.500 indivíduos serão selecionados por números de telefone aleatórios e serão entrevistados por telefone. d) Qual é o interesse da inferência para o pesquisador?R: Estimar a proporção de todos os cidadãos que acreditam que o presidente está fazendo um bom trabalho. e) Qual é o método de coleta de dados que foi empregado? R: Pesquisa f) A amostra em estudo é representativa? R: A amostra em estudo não é representativa, pois foram entrevistadas somente pessoas que possuem telefone. Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Conceitos Básicos Exercício 2: Os institutos de pesquisa de opinião regularmente fazem pesquisas para determinar o índice de popularidade do presidente em exercício. Suponha que uma pesquisa será conduzida com 2.500 indivíduos, que serão questionados se o presidente está fazendo um bom ou um mau governo. Os 2.500 indivíduos serão selecionados por números de telefone aleatórios e serão entrevistados por telefone. d) Qual é o interesse da inferência para o pesquisador? R: Estimar a proporção de todos os cidadãos que acreditam que o presidente está fazendo um bom trabalho. e) Qual é o método de coleta de dados que foi empregado? R: Pesquisa f) A amostra em estudo é representativa? R: A amostra em estudo não é representativa, pois foram entrevistadas somente pessoas que possuem telefone. Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Coleta de Dados Exercício 3: Definida a população, é preciso estabelecer a técnica de amostragem, isto é, o procedimento que será adotado para escolher os elementos que irão compor a amostra, conforme a técnica utilizada tem-se um tipo de amostra. Entende-se como sendo amostra sistemática: A) quando é composta por elementos, retirados ao acaso, da população. Então, todo elemento da população tem igual probabilidade de ser escolhido para a amostra. B) quando os elementos são escolhidos não por acaso, mas por um sistema. C) quando é composta por elementos provenientes de todos os estratos da população. D) quando é formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Coleta de Dados Exercício 3: Definida a população, é preciso estabelecer a técnica de amostragem, isto é, o procedimento que será adotado para escolher os elementos que irão compor a amostra, conforme a técnica utilizada tem-se um tipo de amostra. Entende-se como sendo amostra sistemática: A) quando é composta por elementos, retirados ao acaso, da população. Então, todo elemento da população tem igual probabilidade de ser escolhido para a amostra. B) quando os elementos são escolhidos não por acaso, mas por um sistema. C) quando é composta por elementos provenientes de todos os estratos da população. D) quando é formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Coleta de Dados Exercício 4: Suponha que duas amostras da produção da peça X, colhidas da mesma ordem de produção, sendo uma amostra com 100 exemplares e outra amostra com 200 exemplares. A amostra maior é mais representativa da população? Justifique sua resposta. Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Coleta de Dados Exercício 4: Suponha que duas amostras da produção da peça X, colhidas da mesma ordem de produção, sendo uma amostra com 100 exemplares e outra amostra com 200 exemplares. A amostra maior é mais representativa da população? Justifique sua resposta. Resposta: Não. Para decidir qual amostra é mais representativa, é necessário conhecer na íntegra os procedimentos utilizados para a coleta das duas amostras, pois estes influenciam na qualidade da amostra. Uma amostra de 100 elementos que representam significativamente a população é melhor que uma amostra de 200 elementos selecionada sem o emprego de procedimentos adequados. Estatística e Probabilidade As medidas de posição, também chamadas de medidas de tendência central, têm o objetivo de apresentar um ponto central em torno do qual os dados se distribuem. As mais conhecidas são: a média, a mediana e a moda. Média: 𝑋 = 𝑥𝑖 𝑛 𝑖=1 𝑛 Mediana 𝑛 𝑓𝑜𝑟 𝑖𝑚𝑝𝑎𝑟,𝑀𝑑 = 𝑥 𝑛+1 2 𝑛 𝑓𝑜𝑟 𝑝𝑎𝑟,𝑀𝑑 = 𝑥 𝑛 2 + 𝑥 𝑛 2+1 2 A Moda de um conjunto de dados é o valor (ou valores) que ocorre com maior frequência. Para os dados não tabulados, ou seja, quando os dados não estiverem na forma de distribuição de frequência. ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Exercício 4: (ENADE/2011) Os preços em reais (R$) para uma amostra de equipamentos de som estão indicados na tabela abaixo. Com base na amostra, o valor CORRETO da mediana é igual a: a) 𝑅$ 440,00. b) 𝑅$ 470,00. c) 𝑅$ 512,00. d) 𝑅$ 627,00. Estatística e Probabilidade Exercício 4: (ENADE/2011) Os preços em reais (R$) para uma amostra de equipamentos de som estão indicados na tabela abaixo. Com base na amostra, o valor CORRETO da mediana é igual a: a) 𝑅$ 440,00. b) 𝑅$ 470,00. c) 𝑅$ 512,00. d) 𝑅$ 627,00. 420,00 440,00 440,00 470,00 480,00 500,00 834,00 ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade Exercício 4: (ENADE/2011) Os preços em reais (R$) para uma amostra de equipamentos de som estão indicados na tabela abaixo. Com base na amostra, o valor CORRETO da mediana é igual a: a) 𝑅$ 440,00. b) 𝑅$ 470,00. c) 𝑅$ 512,00. d) 𝑅$ 627,00. 420,00 440,00 440,00 470,00 480,00 500,00 834,00 Mediana ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade Exercício 4: (ENADE/2011) Os preços em reais (R$) para uma amostra de equipamentos de som estão indicados na tabela abaixo. Com base na amostra, o valor CORRETO da mediana é igual a: a) 𝑅$ 440,00. b) 𝑅$ 470,00. c) 𝑅$ 512,00. d) 𝑅$ 627,00. 420,00 440,00 440,00 470,00 480,00 500,00 834,00 Mediana 𝑀é𝑑𝑖𝑎 = 420,00 + 440,00 + 440,00 + 470,00 + 480,00 + 500,00 + 834,00 7 = 3584 7 = 512,00 𝑀𝑜𝑑𝑎 = 440,00 (Bimodal) ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade RELAÇÃO ENTRE A MÉDIA, A MEDIANA E A MODA Como o próprio nome sugere, o valor da Mediana (que ocupa a posição central numa distribuição de frequência), deve estar em algum ponto entre o valor da Média e o valor da Moda, mas pode também ser igual à Moda e à Média. Três casos podem ocorrer: 𝟏𝒐 Caso: 𝑴é𝒅𝒊𝒂 = 𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝑴𝒐𝒅𝒂 a curva da distribuição é SIMÉTRICA 𝟐𝒐 Caso: 𝑴é𝒅𝒊𝒂 < 𝑴𝒆𝒅𝒊𝒂𝒏𝒂 < 𝑴𝒐𝒅𝒂 a curva da distribuição tem ASSIMETRIA NEGATIVA 𝟑𝒐 Caso: 𝑴é𝒅𝒊𝒂 > 𝑴𝒆𝒅𝒊𝒂𝒏𝒂 > 𝑴𝒐𝒅𝒂 a curva da distribuição tem ASSIMETRIA POSITIVA Assimetria Positiva, podemos dizer que a distribuição é Assimétrica à Direita (da curva); Assimetria Negativa, podemos dizer que a distribuição é Assimétrica à Esquerda (da curva); ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade Exercício 4: (ENADE/2011) Os preços em reais (R$) para uma amostra de equipamentos de som estão indicados na tabela abaixo. Com base na amostra, o valor CORRETO da mediana é igual a: a) 𝑅$ 440,00. b) 𝑅$ 470,00. c) 𝑅$ 512,00. d) 𝑅$ 627,00. 420,00 440,00 440,00 470,00 480,00 500,00 834,00 Mediana 𝑀é𝑑𝑖𝑎 = 420,00 + 440,00 + 440,00 + 470,00 + 480,00 + 500,00 + 834,00 7 = 3584 7 = 512,00 𝑀𝑜𝑑𝑎 = 440,00 (Bimodal) 𝑀é𝑑𝑖𝑎 > 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 > 𝑀𝑜𝑑𝑎 a curva da distribuição tem ASSIMETRIAPOSITIVA, ou seja, é Assimétrica à Direita (da curva) ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade Para os dados não tabulados, ou seja, quando os dados não estiverem na forma de distribuição de frequência. Com base na amostra, o valor CORRETO da mediana é igual a: a) 𝑅$ 440,00. b) 𝑅$ 470,00. c) 𝑅$ 512,00. d) 𝑅$ 627,00. ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade Exercício 5: Em um determinado mês, foi computado o número de faltas ao trabalho, por motivos de saúde, que cada funcionário de uma determinada empresa teve. Os dados estão apresentados na tabela a seguir. Número de Faltas 𝑓 0 31 1 20 2 8 3 2 4 0 5 1 6 1 Total 63 𝑋 = 𝑥𝑖. 𝑓𝑖 𝑛 𝑖=1 𝑓𝑖 𝑛 𝑖=1 = = 0 ∙ 31 + 1 ∙ 20 + 2 ∙ 8 + 3 ∙ 2 + 4 ∙ 0 + 5 ∙ 1 + 6 ∙ 1 63 = 53 63 ≅ 0,84 ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Exercício 5: Em um determinado mês, foi computado o número de faltas ao trabalho, por motivos de saúde, que cada funcionário de uma determinada empresa teve. Os dados estão apresentados na tabela a seguir. Número de Faltas 𝑓 0 31 1 20 2 8 3 2 4 0 5 1 6 1 Total 63 𝑋 = 𝑥𝑖. 𝑓𝑖 𝑛 𝑖=1 𝑓𝑖 𝑛 𝑖=1 = = 0 ∙ 31 + 1 ∙ 20 + 2 ∙ 8 + 3 ∙ 2 + 4 ∙ 0 + 5 ∙ 1 + 6 ∙ 1 63 = 53 63 ≅ 0,84 Moda: 𝑀𝑜 = 0 Estatística e Probabilidade Exercício 5: Em um determinado mês, foi computado o número de faltas ao trabalho, por motivos de saúde, que cada funcionário de uma determinada empresa teve. Os dados estão apresentados na tabela a seguir. Número de Faltas 𝑓 0 31 1 20 2 8 3 2 4 0 5 1 6 1 Total 63 𝑋 = 𝑥𝑖. 𝑓𝑖 𝑛 𝑖=1 𝑓𝑖 𝑛 𝑖=1 = = 0 ∙ 31 + 1 ∙ 20 + 2 ∙ 8 + 3 ∙ 2 + 4 ∙ 0 + 5 ∙ 1 + 6 ∙ 1 63 = 53 63 ≅ 0,84 Mediana: 𝑀𝑒 = 1 𝑓𝑎 31 51 59 61 61 62 63 Moda: 𝑀𝑜 = 0 ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade Exercício 6: A tabela abaixo apresenta a distribuição de frequências do tempo de vida de 60 componentes eletrônicos (medido em dias) submetidos à experimentação num laboratório especializado. Calcular as medidas de posição. Tempo de Vida (dias) 𝑓 3 |--- 18 3 18 |--- 33 4 33 |--- 48 4 48 |--- 63 8 63 |--- 78 10 78 |--- 93 28 93 |--- 108 2 108 |--- 123 1 Total 60 ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade Exercício 6: A tabela abaixo apresenta a distribuição de frequências do tempo de vida de 60 componentes eletrônicos (medido em dias) submetidos à experimentação num laboratório especializado. Calcular as medidas de posição. Tempo de Vida (dias) 𝑓 𝑋𝑖 3 |--- 18 3 10,5 18 |--- 33 4 25,5 33 |--- 48 4 40,5 48 |--- 63 8 55,5 63 |--- 78 10 70,5 78 |--- 93 28 85,5 93 |--- 108 2 100,5 108 |--- 123 1 115,5 Total 60 𝑋 = 𝑥𝑖. 𝑓𝑖 𝑛 𝑖=1 𝑓𝑖 𝑛 𝑖=1 = = 10,5 ∙ 3 + 25,5 ∙ 4 + 40,5 ∙ 4 + 55,5 ∙ 8 + 70,5 ∙ 10 + 85,5 ∙ 28 + 100,5 ∙ 2 + 115,5 ∙ 1 60 = 4155 60 = 69,25 𝑋 = 69 𝑑𝑖𝑎𝑠 ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade Exercício 6: A tabela abaixo apresenta a distribuição de frequências do tempo de vida de 60 componentes eletrônicos (medido em dias) submetidos à experimentação num laboratório especializado. Calcular as medidas de posição. Tempo de Vida (dias) 𝑓 𝑋𝑖 3 |--- 18 3 10,5 18 |--- 33 4 25,5 33 |--- 48 4 40,5 48 |--- 63 8 55,5 63 |--- 78 10 70,5 78 |--- 93 28 85,5 93 |--- 108 2 100,5 108 |--- 123 1 115,5 Total 60 𝑀𝑒 = 𝑋𝑒 + ℎ ∙ (𝑋𝑚 − 𝐹𝑖𝑎𝑎) 𝐹𝑖 onde 𝑋𝑒 o limite inferior da classe que contém a mediana; 𝑋𝑚: metade do valor da frequência total; 𝐹𝑖𝑎𝑎: frequência acumulada da classe anterior à classe que contém a mediana; 𝐹𝑖: número de observações na classe que contém a mediana; ℎ: amplitude da classe que contém a mediana. 𝑀𝑒 = 78 + 15 ∙ (30 − 29) 28 = 78 + 15 28 ≅ 78 + 0,5357 ≅ ≅ 78,5 ∴ 𝑀𝑒 = 79 𝑑𝑖𝑎𝑠 ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade Exercício 6: A tabela abaixo apresenta a distribuição de frequências do tempo de vida de 60 componentes eletrônicos (medido em dias) submetidos à experimentação num laboratório especializado. Calcular as medidas de posição. Tempo de Vida (dias) 𝑓 𝑋𝑖 3 |--- 18 3 10,5 18 |--- 33 4 25,5 33 |--- 48 4 40,5 48 |--- 63 8 55,5 63 |--- 78 10 70,5 78 |--- 93 28 85,5 93 |--- 108 2 100,5 108 |--- 123 1 115,5 Total 60 𝑀𝑜 = 𝑋𝑜 + ℎ ∙ (𝐹𝑚 − 𝐹𝑎) 2 ∙ 𝐹𝑚 − (𝐹𝑎 + 𝐹𝑝) Onde 𝑋𝑜 o limite inferior da classe que contém a moda; 𝐹𝑚: frequência máxima; 𝐹𝑎: frequência anterior à frequência máxima; 𝐹𝑝: frequência posterior à frequência máxima; ℎ: amplitude da classe que contém a moda. 𝑀𝑜 = 78+ 15 ∙ (28 − 10) 2 ∙ 28 − (10 + 2) = 78 + 15 ∙ 18 56 − 12 = 78 + 270 44 ≅ ≅ 78 + 6,13636… ≅ 84,1 ∴ 𝑀𝑜 = 84 𝑑𝑖𝑎𝑠 ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade 𝑪𝑶𝑴𝑷𝑨𝑹𝑨ÇÃ𝑶 𝑬𝑵𝑻𝑹𝑬 𝑨 𝑴É𝑫𝑰𝑨,𝑨 𝑴𝑬𝑫𝑰𝑨𝑵𝑨 𝑬 𝑨 𝑴𝑶𝑫𝑨 MEDIDA DE POSIÇÃO VANTAGENS DESVANTAGENS MÉDIA Reflete cada valor observado na distribuição É influenciada por valores extremos MEDIANA Menos sensível a valores extremos do que a Média Difícil de determinar para grande quantidade de dados MODA Maior quantidade de valores concentrados neste ponto Não se presta à análise matemática ESTATÍSTICA E PROBABILIDADE - Medidas de Tendência Central Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Separatrizes Na análise da distribuição de uma variável, há grande interesse de determinarmos qual o valor que divide a distribuição em duas partes iguais, quatro partes iguais, dez partes iguais e cem partes iguais. A estes valores (separatrizes) chamaremos respectivamente de: Mediana: é o valor que divide a distribuição em duas partes iguais. 𝑀𝑒 = 𝑋𝑒 + ℎ ∙ (𝑋𝑚 − 𝐹𝑖𝑎𝑎) 𝐹𝑖 Quartis: dividem a distribuição em quatro partes iguais. 𝑄𝑖 = 𝑋𝑞𝑖 + ℎ 𝑋𝑚𝑖 – 𝐹𝑖𝑎𝑎 𝐹𝑖 Decis: é qualquer um dos nove valores que dividem os dados ordenados de uma variável em dez partes iguais, de modo que cada parte representa 1/10 da amostra ou população Percentis: são medidas que dividem a amostra ordenada (por ordem crescente dos dados) em 100 partes. Estatística e Probabilidade 𝑄𝑖 = 𝑋𝑞𝑖 + ℎ 𝑋𝑚𝑖 – 𝐹𝑖𝑎𝑎 𝐹𝑖 𝑄𝑖 - primeiro, segundo e terceiro quartil ( 𝑖 = 1, 2 𝑒 3) 𝑋𝑞𝑖 - ponto inicial da classe à qual pertence 𝑋𝑚𝑖 . 𝑋𝑚𝑖 - valor proporcional da frequência total. 25% para o 1º quartil; 50% para o 2º quartil; e 75% para o 3º quartil. ℎ - intervalo de classe. 𝐹𝑖𝑎𝑎 - frequência acumulada imediatamente anterior à classe a qual pertence 𝑋𝑚. 𝐹𝑖 - frequência simples da classe à qual pertence 𝑋𝑚. 𝑄3 = 78 + 15 45 – 29 28 = Tempo de Vida (dias) 𝑓 𝑋𝑖 3 |--- 18 3 10,5 18 |--- 33 4 25,5 33 |--- 48 4 40,5 48 |--- 63 8 55,5 63 |--- 78 10 70,5 78 |--- 93 28 85,5 93 |--- 108 2 100,5 108 |--- 123 1 115,5 Total 60 = 78 + 15 ∙ 16 28 = 78 + 240 28 𝑄3 ≅ 78 + 8,5714 ≅ 86,57 𝑄3 = 86,6 𝑋𝑚𝑖 = 75% 𝑑𝑒 60 = 45 ESTATÍSTICAE PROBABILIDADE - Separatrizes Exercício 7: Vamos utilizar os dados do Exercício anterior (Exercício 6) para encontrar o terceiro quartil, o quinto decil e o décimo quinto percentil Estatística e Probabilidade 𝑄𝑖 = 𝑋𝑞𝑖 + ℎ 𝑋𝑚𝑖 – 𝐹𝑖𝑎𝑎 𝐹𝑖 𝑄𝑖 - primeiro, segundo e terceiro quartil ( 𝑖 = 1, 2 𝑒 3) 𝑋𝑞𝑖 - ponto inicial da classe à qual pertence 𝑋𝑚𝑖 . 𝑋𝑚𝑖 - valor proporcional da frequência total. 25% para o 1º quartil; 50% para o 2º quartil; e 75% para o 3º quartil. ℎ - intervalo de classe. 𝐹𝑖𝑎𝑎 - frequência acumulada imediatamente anterior à classe a qual pertence 𝑋𝑚. 𝐹𝑖 - frequência simples da classe à qual pertence 𝑋𝑚. 𝐷5 = 78 + 15 30 – 29 28 = Tempo de Vida (dias) 𝑓 𝑋𝑖 3 |--- 18 3 10,5 18 |--- 33 4 25,5 33 |--- 48 4 40,5 48 |--- 63 8 55,5 63 |--- 78 10 70,5 78 |--- 93 28 85,5 93 |--- 108 2 100,5 108 |--- 123 1 115,5 Total 60 = 78 + 15 ∙ 1 28 = 78 + 15 28 𝐷5 ≅ 78 + 0,5357 ≅ 78,53 𝐷5 = 78,5 Note que 𝐷5 = 𝑀𝑒 = 𝑄2 𝑋𝑚𝑖 = 50% 𝑑𝑒 60 = 30 ESTATÍSTICA E PROBABILIDADE - Separatrizes Exercício 7: Vamos utilizar os dados do Exercício anterior (Exercício 6) para encontrar o terceiro quartil, o quinto decil e o décimo quinto percentil Estatística e Probabilidade Exercício 7: Vamos utilizar os dados do Exercício anterior (Exercício 6) para encontrar o terceiro quartil, o quinto decil e o décimo quinto percentil 𝑄𝑖 = 𝑋𝑞𝑖 + ℎ 𝑋𝑚𝑖 – 𝐹𝑖𝑎𝑎 𝐹𝑖 𝑄𝑖 - primeiro, segundo e terceiro quartil ( 𝑖 = 1, 2 𝑒 3) 𝑋𝑞𝑖 - ponto inicial da classe à qual pertence 𝑋𝑚𝑖 . 𝑋𝑚𝑖 - valor proporcional da frequência total. 25% para o 1º quartil; 50% para o 2º quartil; e 75% para o 3º quartil. ℎ - intervalo de classe. 𝐹𝑖𝑎𝑎 - frequência acumulada imediatamente anterior à classe a qual pertence 𝑋𝑚. 𝐹𝑖 - frequência simples da classe à qual pertence 𝑋𝑚. 𝑃15 = 33 + 15 9 – 7 4 = Tempo de Vida (dias) 𝑓 𝑋𝑖 3 |--- 18 3 10,5 18 |--- 33 4 25,5 33 |--- 48 4 40,5 48 |--- 63 8 55,5 63 |--- 78 10 70,5 78 |--- 93 28 85,5 93 |--- 108 2 100,5 108 |--- 123 1 115,5 Total 60 = 33 + 15 ∙ 2 4 = 78 + 15 2 𝑃15 = 33 + 7,5 = 40,5 𝑃15 = 40,5 𝑋𝑚𝑖 = 15% 𝑑𝑒 60 = 9 ESTATÍSTICA E PROBABILIDADE - Separatrizes Estatística e Probabilidade ÍNDICES DE PERSON Os índices de Pearson são muito úteis ao estudo e descrição de uma variável discreta. Os índices de Assimetria e Curtose, ditos de Pearson, mostra a relação entre dominantes, separatrizes e médias relações entre desvio padrão de distribuição simétricas. Para maiores detalhes, sugerimos complementar essa atividade com uma visita ao site: http://estatisticax.blogspot.com.br/2008/03/medidas-de-assimetria-e-de-achatamento.html ESTATÍSTICA E PROBABILIDADE - Separatrizes Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Separatrizes ÍNDICES DE PERSON Índice de Assimetria: As medidas de assimetria permitem distinguir as distribuições simétricas (Média = Moda = Mediana) das assimétricas. No caso das distribuições assimétricas estas podem ter assimetria positiva (Moda <= Mediana <= Média) ou assimetria negativa (Média <= Mediana <= Moda). 𝑇 = 𝑄3 + 𝑄1 − 2 ∙ 𝑀𝑒 𝑄3 − 𝑄1 Sendo: 𝑇 = 0 : simétrica; 𝑇 < 0 : assimétrica negativa; 𝑇 > 0 : assimétrica positiva • Uma distribuição simétrica resultará num valor igual a 0 (zero); • Se a distribuição for assimétrica positiva resultará num valor superior a 0 (zero); • Se a distribuição for assimétrica negativa resultará num valor inferior a 0 (zero). Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Separatrizes ÍNDICES DE PERSON Índice de Curtose: AS medidas de achatamento (ou curtose) indicam a intensidade das frequências na vizinhança dos valores centrais. A classificação da distribuição de frequência, relativamente ao seu achatamento, pode ser feita através do cálculo do coeficiente percentílico de curtose: K = 𝑄3 – 𝑄1 2 ∙ (P90 − P10) 𝐾 < 0,263 leptocúrtica; 𝐾 = 0,263 mesocúrtica; 𝐾 > 0,263 Platicúrtica Fonte: http://4.bp.blogspot.com/_HqjPVvZ1cRI/R-v7u8hreYI/AAAAAAAABNw/M1oM2cFIXFk/s1600-h/curtose.gif Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Separatrizes 𝑇 = 𝑄3 + 𝑄1 − 2 ∙ 𝑀𝑒 𝑄3 − 𝑄1 K = 𝑄3 – 𝑄1 2 ∙ (P90 − P10) 𝑄1 = ? 𝑄3 = 86,6 𝑀𝑒 = 78,5 P10 = ? P90 = ? Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Separatrizes 𝑇 = 𝑄3 + 𝑄1 − 2 ∙ 𝑀𝑒 𝑄3 − 𝑄1 K = 𝑄3 – 𝑄1 2 ∙ (P90 − P10) 𝑄1 = 55,5 𝑄3 = 86,6 𝑀𝑒 = 78,5 P10 = 29,3 P90 = 91,4 𝑄1 = 48 + 15 15 –11 8 = 48 + 15 ∙ 4 8 = 48 + 15 2 = 48 + 7,5 = 55,5 Tempo de Vida (dias) 𝑓 𝑋𝑖 3 |--- 18 3 10,5 18 |--- 33 4 25,5 33 |--- 48 4 40,5 48 |--- 63 8 55,5 63 |--- 78 10 70,5 78 |--- 93 28 85,5 93 |--- 108 2 100,5 108 |--- 123 1 115,5 Total 60 𝑃10 = 18 + 15 6 –3 4 = 18 + 15 ∙ 3 4 = 18 + 11,25 = 29,25 𝑃90 = 78 + 15 54 – 29 28 = 78 + 15 ∙ 25 28 = 78 + 13,39 = 91,39 Estatística e Probabilidade ESTATÍSTICA E PROBABILIDADE - Separatrizes 𝑇 = 𝑄3 + 𝑄1 − 2 ∙ 𝑀𝑒 𝑄3 − 𝑄1 K = 𝑄3 – 𝑄1 2 ∙ (P90 − P10) 𝑄1 = 55,5 𝑄3 = 86,6 𝑀𝑒 = 78,5 P10 = 29,3 P90 = 91,4 Tempo de Vida (dias) 𝑓 𝑋𝑖 3 |--- 18 3 10,5 18 |--- 33 4 25,5 33 |--- 48 4 40,5 48 |--- 63 8 55,5 63 |--- 78 10 70,5 78 |--- 93 28 85,5 93 |--- 108 2 100,5 108 |--- 123 1 115,5 Total 60 𝑇 = 86,6 + 55,5 − 2 ∙ 78,5 86,6 − 55,5 = 142,1 − 157 31,1 = −14,9 31,1 ≅ −0,47 𝑇 < 0 : assimétrica negativa (Média <= Mediana <= Moda) 𝑋 = 69 𝑑𝑖𝑎𝑠 𝑀𝑒 = 79 𝑑𝑖𝑎𝑠 𝑀𝑜 = 84 𝑑𝑖𝑎𝑠 K = 𝑄3 – 𝑄1 2 ∙ (P90 − P10) = 86,6 – 55,5 2 ∙ (91,4 − 29,3) = 31,1 2 ∙ 62,1 = 31,1 124,2 = 0,250 𝐾 = 0,250 < 0,263 leptocúrtica Estatística e Probabilidade
Compartilhar