Baixe o app para aproveitar ainda mais
Prévia do material em texto
Profa. Maria Laura UNIDADE I Estatística Definição. Utilizações Práticas. Tomadas de Decisão: Incertezas e Riscos. Campos da Estatística. Áreas de Atuação da Estatística. Processo Estatístico. Estatística – Princípios Número de filhos por família Número de famílias amostradas 0 28 1 34 2 65 3 41 4 12 5 9 Mais de 5 2 12 10 8 6 4 2 0 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 Idades Fonte: Livro-texto. Distribuição de idades Populações: é a coleção de todos os resultados, respostas, medições ou contagens que são de interesse, que possuem pelo menos uma característica comum. Amostra: é o subconjunto ou parte da população. Variáveis estatísticas: é o conjunto de resultados possíveis de um fenômeno (dados). Qualitativas: seus valores são expressos por atributos ou qualidades. Nominais (nomes, rótulos) Ordinais (ordem ou posição) Quantitativas: consistem em medidas numéricas Discretas (contagem) Contínuas (medições) Processo Estatístico Relações entre amostras e populações. Predição. Valores Reais e Prováveis. Amostragem Fonte: Livro-texto. Gênero Mulheres Homens 52,3% 47,7% Idade (dada em anos) 16 a 20 21 a 34 35 a 44 45 a 59 + de 60 7,0% 30,7% 20,3% 24,0% 18,0% Nível socioeconô mico Classe A Classe B Classe C Classe D Classe E 4,1% Nível de escolaridade Superior 17,5% Localização geográfica Zona norte 26,25 Gênero Mulheres Homens 1.046 954 Idade (dada em anos) 16 a 20 21 a 34 35 a 44 45 a 59 + de 60 140 614 406 480 360 Nível socioeconô- mico Classe A Classe B Classe C Classe D Classe E 82 188 332 436 962 Nível de escolaridade Superior Médio Fundamental Pré-Fund. 350 628 250 572 Localização geográfica Zona norte Zona sul Zona leste Zona Oeste 524 410 496 570 Um laboratório farmacêutico deseja lançar um novo medicamento (uma vacina, por exemplo) no mercado e para tanto precisa da aprovação dos órgãos competentes. Nessas condições, o laboratório deve: a) Aplicar o medicamento em todos os pacientes potenciais e tabular os resultados. b) Aplicar o medicamento em um pequeno grupo de pacientes potenciais e verificar os resultados. c) Aplicar o medicamento em três grupos: um grupo recebendo o medicamento, outro grupo recebendo um placebo e um terceiro não recebendo nada, para funcionar como controle. d) Aplicar o medicamento no maior grupo de pessoas durante a maior parte do tempo e aí verificar os resultados obtidos. e) Não é possível nenhuma providência prévia. O tempo dirá se o medicamento deve ser aprovado. (Observação: Placebo: preparação neutra ministrada em substituição de um medicamento, com a finalidade de suscitar ou controlar as reações psicológicas). Interatividade Um laboratório farmacêutico deseja lançar um novo medicamento (uma vacina, por exemplo) no mercado e para tanto precisa da aprovação dos órgãos competentes. Nessas condições, o laboratório deve: a) Aplicar o medicamento em todos os pacientes potenciais e tabular os resultados. b) Aplicar o medicamento em um pequeno grupo de pacientes potenciais e verificar os resultados. c) Aplicar o medicamento em três grupos: um grupo recebendo o medicamento; outro grupo recebendo um placebo e um terceiro não recebendo nada, para funcionar como controle. d) Aplicar o medicamento no maior grupo de pessoas durante a maior parte do tempo e aí verificar os resultados obtidos. e) Não é possível nenhuma providência prévia. O tempo dirá se o medicamento deve ser aprovado. (Observação: Placebo: preparação neutra ministrada em substituição de um medicamento, com a finalidade de suscitar ou controlar as reações psicológicas). Resposta Coleta de Dados. Tabela de dados brutos. Definições de Frequência para Dados Isolados Dados Agrupados Estatística Descritiva – Fundamentos Dados brutos coletados em um campus universitário O rd e m N o m e E s ta d o C iv il C u rs o m a tr ic u la d o Q u a li d a d e a tr ib u íd a à in s ti tu iç ã o G ê n e ro Id a d e e m a n o s R e n d a fa m il ia r m e n s a l e m R $ Q u a n ti d a d e d e d e p e n d ê n c ia s 1 Arnaldo Solteiro Contabil idade Regular M 26 R$ 6.352 4 2 Marilia Solteiro Adminis tração Péssi ma F 24 R$ 4.231 2 3 Neiva Solteiro Adminis tração Boa F 27 R$ 1.289 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 L. Paulo Solteiro Jornalis mo Boa M 22 R$ 3.654 2 71 Thayna Casado Adminis tração Ótima F 21 R$ 956 1 72 Thiago Divorcia do Direito Regular M 29 R$ 1.350 3 Fonte: Livro-texto. Frequências Simples. Frequência Total. Frequências Relativas. d Frequências Acumuladas. Frequências – Dados Isolados Valor (Número de DPs) Frequência Simples Frequência Relativa (decimal) Frequência Relativa (percentual) 0 20 0,278 27,8% 1 13 0,181 18,1% 2 14 0,194 19,4% 3 10 0,139 13,9% 4 7 0,097 9,7% 5 6 0,083 8,3% 6 1 0,014 1,4% 7 0 0 0,0% 8 1 0,014 1,4% Frequência Total 72 1 100% Fonte: Autoria própria. Frequências Acumuladas. Absolutas. (Percentuais). Frequências – Dados Isolados Valor (Número de DPs) Frequência Simples Frequência Acumulada Crescente Frequência Acumulada Decrescente 0 20 20 72 1 13 33 52 2 14 47 39 3 10 57 25 4 7 64 15 5 6 70 8 6 1 71 2 7 0 71 1 8 1 72 1 Frequência Total 72 Fonte: Autoria própria. Frequências Acumuladas. (Absolutas). Percentuais. Frequências – Dados Isolados Valor (Número de DPs) Frequência Simples Frequência Acumulada Crescente Frequência Acumulada Decrescente 0 27,8% 27,8% 100,0% 1 18,1% 45,9% 72,2% 2 19,4% 65,3% 54,1% 3 13,9% 79,2% 34,7% 4 9,7% 88,9% 20,8% 5 8,3% 97,2% 11,1% 6 1,4% 98,6% 2,8% 7 0,0% 98,6% 2,8% 8 1,4% 100,0% 1,4% Frequência Total 100,0% Fonte: Autoria própria. Variáveis quantitativas contínuas. Determinação do número de classes: Limites: . . Amplitude Total. Frequências – Dados Agrupados Fonte: Autoria própria. Amplitude Total: Amplitude de Classe: Amplitude de Classe: . . Frequências – Dados Agrupados Classe Limite Inferior |----- Limite Superior A 700,00 |----- 1.850,00 Fonte: Autoria própria. Amplitude Total: Amplitude de Classe: Amplitude de Classe: . . Frequências – Dados Agrupados Classe Limite Inferior |----- Limite Superior A 700,00 |----- 1.850,00 B 1.850,00 |----- 3.000,00 Fonte: Autoria própria. Frequências – Dados Agrupados Classe Limite Inferior |----- Limite Superior A 700,00 |----- 1.850,00 B 1.850,00 |----- 3.000,00 C 3.000,00 |----- 4.150,00 D 4.150,00 |----- 5.300,00 E 5.300,00 |----- 6.450,00 F 6.450,00 |----- 7.600,00 G 7.600,00 |----- 8.750,00 H 8.750,00 |----- 9.900,00 Fonte: Autoria própria. Determinação da frequência Simples. Frequências – Dados Agrupados Classe Limite Inferior |----- Limite Superior Contagem Frequência Simples A 700,00 |----- 1.850,00 ||||| | 6 B 1.850,00 |----- 3.000,00 ||||| ||||| ||||| || 17 C 3.000,00 |----- 4.150,00 ||||| ||||| ||||| ||||| | 21 D 4.150,00 |----- 5.300,00 ||||| ||||| ||||| ||||| ||||| |||| 29 E 5.300,00 |----- 6.450,00 ||||| ||||| ||||| ||||| ||||| ||||| ||| 33 F 6.450,00 |----- 7.600,00 ||||| ||||| ||||| ||||| ||||| ||||| 30 G 7.600,00 |----- 8.750,00 ||||| ||||| ||||| ||||| ||||| ||||| 30 H 8.750,00 |----- 9.900,00 ||||| ||||| ||||| | 16 Fonte: Autoria própria. Conceito de ponto médio de Classe: Frequências – Dados Agrupados Classe Limite Inferior |----- Limite Superior Frequência Simples Ponto Médio de Classe A 700,00 |----- 1.850,00 6 1.275,00 B 1.850,00 |----- 3.000,00 17 2.425,00 C 3.000,00 |----- 4.150,00 21 3.575,00 D 4.150,00 |----- 5.300,00 29 4.725,00 E 5.300,00 |----- 6.450,00 33 5.875,00 F 6.450,00 |----- 7.600,00 30 7.025,00 G 7.600,00 |----- 8.750,00 30 8.175,00 H 8.750,00 |-----9.900,00 16 9.325,00 Fonte: Autoria própria. Representação visual das informações das tabelas de frequências. Três grandes grupos de representações. Ferramental digital: Excel. Representações Gráficas Fonte: Microsoft Excel. Representação das Frequências Simples. Representações gráficas – Histogramas Classe Limite Inferior |----- Limite Superior Frequência Simples A 700,00 |----- 1.850,00 6 B 1.850,00 |----- 3.000,00 17 C 3.000,00 |----- 4.150,00 21 D 4.150,00 |----- 5.300,00 29 E 5.300,00 |----- 6.450,00 33 F 6.450,00 |----- 7.600,00 30 G 7.600,00 |----- 8.750,00 30 H 8.750,00 |----- 9.900,00 16 Fonte: Autoria própria. Fonte: Autoria própria. Representação das Frequências Relativas. Representações gráficas – Setogramas Classe Limite Inferior |----- Limite Superior Frequência Simples A 700,00 |----- 1.850,00 3% B 1.850,00 |----- 3.000,00 9% C 3.000,00 |----- 4.150,00 12% D 4.150,00 |----- 5.300,00 16% E 5.300,00 |----- 6.450,00 18% F 6.450,00 |----- 7.600,00 17% G 7.600,00 |----- 8.750,00 16% H 8.750,00 |----- 9.900,00 9% Fonte: Autoria própria. Fonte: Autoria própria. Representação das Frequências Acumuladas. Representações gráficas – Ogivas de Galton Classe Ponto Médio de Classe Frequência Acumulada Crescente Frequência Acumulada Decrescente A 1.275,00 6 182 B 2.425,00 23 176 C 3.575,00 44 159 D 4.725,00 73 138 E 5.875,00 106 109 F 7.025,00 136 76 G 8.175,00 166 46 H 9.325,00 182 16 Fonte: Autoria própria. Fonte: Autoria própria. 200 180 160 140 120 100 80 60 40 20 0 1 .2 7 5 ,0 0 2 .4 2 5 ,0 0 3 .5 7 5 ,0 0 4 .7 2 5 ,0 0 5 .8 7 5 ,0 0 7 .0 2 5 ,0 0 8 .1 7 5 ,0 0 9 .3 2 5 ,0 0 Crescente Decrescente F re q u ê n c ia s A c u m u la d a s O gráfico abaixo representa as vendas acumuladas em unidade do produto comercializado por uma empresa ao longo do ano passado. Quanto essa empresa vendeu em setembro do ano passado? a) 600. b) 800. c) 1000. d) 1200. e) 1400. Interatividade Fonte: Autoria própria. 7000 6000 5000 4000 3000 2000 1000 0 Jan. Fev. Mar. Abr. Maio Jun. Jul. Ago. Set. Out. Nov. Dez. O gráfico abaixo representa as vendas acumuladas em unidade do produto comercializado por uma empresa ao longo do ano passado. Quanto essa empresa vendeu em setembro do ano passado? a) 600. b) 800. (4200-3400) c) 1000. d) 1200. e) 1400. Resposta Fonte: Autoria própria. 4200 3400 7000 6000 5000 4000 3000 2000 1000 0 Jan. Fev. Mar. Abr. Maio Jun. Jul. Ago. Set. Out. Nov. Dez. Definição e uso. Medidas Estatísticas de Posição (ou tendência central) Médias Separatrizes (Medianas) Modas Medidas Estatísticas de Dispersão (ou variabilidade) Absolutas Relativas Medidas Estatísticas Definição: As medidas de posição ou medidas de tendência central são calculadas quando desejamos representar um conjunto de dados por um valor único. Tipos de médias: Média Simples. Exemplo: {200; 240; 180; 210; 320} Medidas Estatísticas de Posição – Médias Média Ponderada. Exemplo 1: Em média cada aluno tem duas dependências. Média Ponderada Valor (Número de DPs) Frequência Simples Frequência Simples multiplicada pelo valor 0 20 0 1 13 13 2 14 28 3 10 30 4 7 28 5 6 30 6 1 6 7 0 0 8 1 8 Frequência Total 72 143 Fonte: Autoria própria. Exemplo 2: Em média cada conta a pagar tem o valor de R$ 5.824,45 Média Ponderada Classe Limite Inferior |---- Limite Superior Frequência Simples Ponto Médio de Classe Ponto Médio Multiplicado pela frequência simples A 700,00 |---- 1.850,00 6 1.275,00 7.650,00 B 1.850,00 |---- 3.000,00 17 2.425,00 41.225,00 C 3.000,00 |---- 4.150,00 21 3.575,00 75.075,00 D 4.150,00 |---- 5.300,00 29 4.725,00 137.025,00 E 5.300,00 |---- 6.450,00 33 5.875,00 193.875,00 F 6.450,00 |---- 7.600,00 30 7.025,00 210.750,00 G 7.600,00 |---- 8.750,00 30 8.175,00 245.250,00 H 8.750,00 |---- 9.900,00 16 9.325,00 149.200,00 Somatórios 182 1.060.050,00 Fonte: Autoria própria. Definição geral: As separatrizes dividem a amostra em subconjuntos de mesma quantidade de elementos. Tipos: Mediana Quartis Percentis Definição de Mediana: é o valor que ocupa posição central de um conjunto de dados ordenados, dividindo-o em duas partes com quantidades iguais de valores. Exemplo 1: {200; 240; 180; 210; 320} Exemplo 2: {7; 4; 9; 2; 10;4} Separatrizes Exemplo 3: 36º corresponde a 2 37º corresponde a 2 Logo, Mediana Valor (Número de DPs) Frequência Simples Frequência Acumulada crescente 0 20 20 1 13 33 2 14 47 3 10 57 4 7 64 5 6 70 6 1 71 7 0 71 8 1 72 Fonte: Autoria própria. 36,5º Exemplo 4. Classe Mediana: E Mediana: . . Mediana Classe Limite Inferior |---- Limite Superior Frequência Simples Frequência Acumulada Crescente A 700,00 |---- 1.850,00 6 6 B 1.850,00 |---- 3.000,00 17 23 C 3.000,00 |---- 4.150,00 21 44 D 4.150,00 |---- 5.300,00 29 73 E 5.300,00 |---- 6.450,00 33 106 F 6.450,00 |---- 7.600,00 30 136 G 7.600,00 |---- 8.750,00 30 166 H 8.750,00 |---- 9.900,00 16 182 Fonte: Autoria própria. Definição. Exemplos. {25;32;32;45;45;45;45;63;63;72} Mo = {2;2;3;3;3;4;4;5;5;5;6;6} Mo = {1000;1050;1200;1300;1500;2000} Mo = Modas Valor (Número de DPs) Frequência Simples 0 20 1 13 2 14 3 10 4 7 5 6 6 1 7 0 8 1 Fonte: Autoria própria. Mo = 45 - unimodal 3 e 5 - bimodal amodal 0 - unimodal Três critérios: King Czuber Pearson Exemplo. Método de Czuber Classe Modal: E Modas Classe Limite Inferior |---- Limite Superior Frequência Simples A 700,00 |---- 1.850,00 6 B 1.850,00 |---- 3.000,00 17 C 3.000,00 |---- 4.150,00 21 D 4.150,00 |---- 5.300,00 29 E 5.300,00 |---- 6.450,00 33 F 6.450,00 |---- 7.600,00 30 G 7.600,00 |---- 8.750,00 30 H 8.750,00 |---- 9.900,00 16 Somatórios 182 Fonte: Autoria própria. Definição. Conceito. Medidas mais usadas. Desvio médio Desvio Padrão Variância Importante: Os desvios são tomados sempre em módulo, ou seja, sem sinal. Não interessa se o desvio é positivo ou negativo, interessa apenas o valor numérico dele. Medidas de Dispersão ou Variabilidade Absolutas Fonte: Livro-texto. 14 12 10 8 6 4 2 0 1º 2º 3º 4º 5º elementos d1 d2 d3 d4 d5 Definição: É o maior ou menor afastamento ou o desvio dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação. Exemplo 1: {200; 240; 180; 210; 320) Média: 230 Desvios em módulo: {30; 10; 50; 20; 90} Desvio Padrão Exemplo 2. Média: 2,0 Desvio Padrão Valor (Número de DPs) Frequência Simples Desvio ao quadrado multiplicado pela frequência 0 20 80 1 13 13 2 14 0 3 10 10 4 7 28 5 6 54 6 1 16 7 0 0 8 1 36 Frequência Total 72 237 Fonte: Autoria própria. Exemplo 3. Média: 5.824,45 Desvio Padrão Fonte: Autoria própria. Classe Frequência Simples Ponto Médio de Classe Desvio ao quadrado multiplicado pela frequência A 6 1.275,00 124.184.972 B 17 2.425,00 196.456.425 C 21 3.575,00 106.260.531 D 29 4.725,00 35.054.919 E 33 5.875,00 84.325 F 30 7.025,00 43.239.609 G 30 8.175,00 165.752.559 H 16 9.325,00 196.061.605 ∑ 182 867.094.945 Cálculo relativo à Classe A: Veremos mais adiante no curso que aproximadamente 70% dos elementos de uma amostra têm seu valor compreendido entre a média menos uma vez o desvio padrão e a média mais uma vez o desvio padrão. Sabendo disso e que os produtos comercializados por uma empresa aumentaram de preço em média 20% no último ano, com desvio padrão de 5%, não podemos afirmar que: a) Cerca de 70% desses produtos aumentaram de preço entre 15% e 25%. b) Cerca de 30% desses produtos aumentaram mais de 25% ou menos de 15%. c) Cerca de 15% desses produtos aumentaram de preço em menos de 15%. d) Cerca de 25% desses produtosaumentaram de preço em mais de 25%. e) As informações são sujeitas a tolerâncias, visto que em Estatística sempre ocorrem incertezas. Interatividade Veremos mais adiante no curso que aproximadamente 70% dos elementos de uma amostra têm seu valor compreendido entre a média menos uma vez o desvio padrão e a média mais uma vez o desvio padrão. Sabendo disso e que os produtos comercializados por uma empresa aumentaram de preço em média 20% no último ano, com desvio padrão de 5%, não podemos afirmar que: a) Cerca de 70% desses produtos aumentaram de preço entre 15% e 25%. b) Cerca de 30% desses produtos aumentaram mais de 25% ou menos de 15%. c) Cerca de 15% desses produtos aumentaram de preço em menos de 15%. d) Cerca de 25% desses produtos aumentaram de preço em mais de 25%. e) As informações são sujeitas a tolerâncias, visto que em Estatística sempre ocorrem incertezas. Resposta Definição e uso. Comparação entre amostras. Primeira estimativa da qualidade da amostragem. Conceito. Mais usadas – Coeficiente de variação. Exemplo de aplicação: O quadro mostra três possíveis aplicações financeiras oferecidas por determinada instituição, com suas rentabilidades médias e variações dessas rentabilidades. Com base nos dados fornecidos, pede-se: a) Qual o melhor investimento do ponto de vista estatístico e o que significa essa resposta? b) As amostras apresentadas são de boa qualidade para fins de previsão? Medidas de dispersão ou variabilidade relativas Investimento Rentabilidade média Variação da Rentabilidade A 24,0% 6,5% B 28,0% 7,0% C 32,0% 8,5% Fonte: Autoria própria. Portanto: a) Do ponto de vista estatístico, o melhor investimento é o B (menor coeficiente de risco). b) As amostras apresentam uma qualidade de estimativa apenas razoável (entre 15% e 30%). Medidas de dispersão relativas Investimento Rentabilidade média Variação da Rentabilidade Coeficiente de Variação A 24,0% 6,5% 27,1% B 28,0% 7,0% 25,0% C 32,0% 8,5% 26,6% Fonte: Autoria própria. Comportamento esperado. Deformações reais. Motivos. Assimetria. Curtose. Comportamento das distribuições de frequências 40 35 30 25 20 10 5 0 15 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 Peso em quilos F re q u ê n c ia s im p le s Fonte: Livro-texto. Deformação horizontal. Coeficiente de Assimetria: Assimetria Fonte: Livro-texto. Curva simétrica e mesocúrtica X - S X + S X = Me = Mo Assimetria Se As for nulo, a curva será simétrica. Se As for negativo, a assimetria será negativa, ou seja, se desloca para a esquerda (direita do leitor). Se As for positivo, a assimetria será positiva, ou seja, a curva se desloca para a direita (esquerda do leitor). Fonte: Livro-texto. Assimétrica Positiva Simétrica Assimétrica Negativa X = Me = MoX > Me > Mo X < Me < Mo Deformação Vertical Coeficiente de Curtose Curtose Fonte: Livro-texto. Curva simétrica e mesocúrtica X - S X + S X = Me = Mo Curtose Caso K = 0, a distribuição é mesocúrtica. Caso K > 0, a distribuição é leptocúrtica. Caso K < 0, a distribuição é platicúrtica. Fonte: Livro-texto. Leptocúrtica Mesocúrtica Platicúrtica X + SX - S X - S X + S X - S X + S Uma empresa fez um estudo de desempenho do seu departamento de pós-vendas com uma amostra de consumidores que deveriam atribuir notas ao atendimento que receberam. Com as respostas montou a seguinte tabela de frequências. Analisar a distribuição de frequências do seu desempenho e esboçar a curva correspondente. Assimetria e Curtose – Exemplo Desempenho Notas entre Quantidade de Consumidores Péssimo 0 |---- 2 8 Ruim 3 |---- 5 20 Bom 6 |---- 8 50 Ótimo 9 |---- 10 40 Fonte: Autoria própria. Análise da Assimetria Fonte: Autoria própria. Desempenho Notas entre Quantidade de Consumidores Pontos médios de classe Valor multiplicado pela frequência simples P 0 |---- 2 8 1 8 R 3 |---- 5 20 4 80 B 6 |---- 8 50 7 350 O 9 |---- 10 40 9,5 380 Somatório 118 818 Classe mediana: B (bom) Análise da Assimetria Desempenho Notas entre Quantidade de Consumidores Frequência Acumulada Crescente P 0 |---- 2 8 8 R 3 |---- 5 20 28 B 6 |---- 8 50 78 O 9 |---- 10 40 118 Somatório 118 Fonte: Autoria própria. Análise da Assimetria Desempenho Pontos médios de classe Frequências Simples Desvios Desvios ao quadrado multiplicados pela frequência P 1 8 6 288 R 4 20 3 180 B 7 50 0 0 O 9,5 40 2,5 250 Somatório 118 717,6 Fonte: Autoria própria. Assimetria negativa fraca Curva Leptocúrtica Análise da Curtose Desem- penho Pontos médios de classe Frequências Simples Desvios Desvios à quarta multiplicados pela frequência P 1 8 6 10.368,00 R 4 20 3 1.620,00 B 7 50 0 0 O 9,5 40 2,5 1.562,50 Somatório 118 13.550,50 Fonte: Autoria própria. Curva Platicúrtica Visão gráfica da distribuição Fonte: Autoria própria. Uma distribuição apresentou os seguintes coeficientes: Qual dos gráficos a seguir, em relação à curva padrão, corresponde à distribuição? Interatividade Fonte: Autoria própria. Uma distribuição apresentou os seguintes coeficientes: Qual dos gráficos a seguir, em relação à curva padrão, corresponde à distribuição? Resposta Fonte: Autoria própria. ATÉ A PRÓXIMA!
Compartilhar