Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula IntrodutóriaAula Introdutória Autoria de Prof. Carlos Alberto (Caio) Dantas FORMATAÇÃO & DESIGN Cléber da Costa Figueiredo figuecl@usp.br Thiago Rodrigo Alves Carneiro thiagorodrigo@ime.usp.br •A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. •A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística. O Que é Estatística?O Que é Estatística? EstatísticaEstatística População Características Amostra Informações contidas nos dados Conclusões sobre as características da população Técnicas de amostragem Análise descritiva Inferência estatística AmostragemAmostragem É a area da Estatística que trata da obtenção de amostras que sejam representativas da população Exemplos de utilização: Pesquisa de Mercado, Pesquisa de opinião pública, Ensaios de medicamentos e em praticamente todo experimento. EstatísticaEstatística DescritivaDescritiva A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou esta área da Estatística. Inferência EstatísticaInferência Estatística A inferência estatística procura com base nos dados amostrais tirar conclusões sobre a população. ProbabilidadeProbabilidade A inferência estatística baseia- se na Teoria das Probabilidades que constrói modelos para os fenômenos aleatórios, isto é , aqueles em que está presente a incerteza. Exemplo: Intenção deExemplo: Intenção de voto voto Numa pesquisa eleitoral, um Instituto de Pesquisa procura, com base nos resultados de um levantamento aplicado a uma amostra da população, prever o resultado da eleição. Considere o Candidato “A”Considere o Candidato “A” Denomine por a proporção de pessoas que votarão em “A” na eleição. Denomine por a proporção de pessoas no levantamento de opinião (amostra) que expressam intenção de voto em “A”. p^ p AmostraAmostra POPULAÇÃO é o conjunto de elementos que nos interessa estudar. AMOSTRA é qualquer subconjunto da população. clique aqui para voltar População e AmostraPopulação e Amostra Podemos usar o valor dePodemos usar o valor de para estimar a proporçãopara estimar a proporção da população.da população. p^ p EstimaçãoEstimação Evolução da intenção de voto para prefeito de São Paulo Evolução da intenção de voto para prefeito de São Paulo realizada entre os dias 29 e 30 de outubro de 2004 (2º Turno).realizada entre os dias 29 e 30 de outubro de 2004 (2º Turno). Pesquisa contratada pela TV Globo, em % do total de votos.Pesquisa contratada pela TV Globo, em % do total de votos. A pesquisa ouviu 2.000 eleitores - Margem de erro de 2 % com A pesquisa ouviu 2.000 eleitores - Margem de erro de 2 % com 95% de confiança.95% de confiança. Estatística DescritivaEstatística Descritiva Etapa inicial da análise utilizada para descrever e resumir os dados ExemploExemplo Arquivo Arquivo PulsePulse do Minitab do Minitab Refere-se a um experimento feito por alunos. Cada aluno registrou sua altura, peso, sexo, hábito de fumar, nível de atividade física usual e pulsação em repouso. Então todos eles jogaram moedas e aqueles que tiraram cara fizeram corrida estacionária por um minuto. Depois disso todos os alunos mediram novamente sua pulsação. Informações do arquivo Informações do arquivo PulsePulse Information of the worksheetInformation of the worksheet Column Count Column Count Name Name C1 92 Pulse1C1 92 Pulse1 C2 92 Pulse2C2 92 Pulse2 C3 92 Ran (1:correu, 2:não correu)C3 92 Ran (1:correu, 2:não correu) C4 92 Smokes (1:fumante, 2:não fumante)C4 92 Smokes (1:fumante, 2:não fumante) C5 92 Sex (1:masculino, 2:feminino)C5 92 Sex (1:masculino, 2:feminino) C6 92 HeightC6 92 Height C7 92 WeightC7 92 Weight C8 92 Activity (1:leve, 2:moderada, 3:forte)C8 92 Activity (1:leve, 2:moderada, 3:forte) (Pulsação antes de correr)(Pulsação antes de correr) (Pulsação depois de correr)(Pulsação depois de correr) MTB > INFOMTB > INFO Pulse1 Pulse2 Ran Smokes Sex Height Weight ActivityPulse1 Pulse2 Ran Smokes Sex Height Weight Activity 64 88 1 2 1 66.00 140 264 88 1 2 1 66.00 140 2 58 70 1 2 1 72.00 145 258 70 1 2 1 72.00 145 2 62 76 1 1 1 73.50 160 362 76 1 1 1 73.50 160 3 66 78 1 1 1 73.00 190 166 78 1 1 1 73.00 190 1 64 80 1 2 1 69.00 155 264 80 1 2 1 69.00 155 2 74 84 1 2 1 73.00 165 174 84 1 2 1 73.00 165 1 84 84 1 2 1 72.00 150 384 84 1 2 1 72.00 150 3 68 72 1 2 1 74.00 190 268 72 1 2 1 74.00 190 2 62 75 1 2 1 72.00 195 262 75 1 2 1 72.00 195 2 ............ Informações do arquivo PulseInformações do arquivo Pulse DiâmetroDiâmetro AlturaAltura VolumeVolume 8,3 70 10,3 12,9 85 33,8 8,6 65 10,3 13,3 86 27,4 8,8 63 10,2 13,7 71 25,7 10,5 72 16,4 13,8 64 24,9 10,7 81 18,8 14,0 78 34,5 10,8 83 19,7 14,2 80 31,7 11,0 66 15,6 14,5 74 36,3 11,0 75 18,2 16,0 72 38,3 11,1 80 22,6 16,3 77 42,6 11,2 75 19,9 17,3 81 55,4 11,3 79 24,2 17,5 82 55,7 11,4 76 21,0 17,9 80 58,3 11,4 76 21,4 18,0 80 51,5 11,7 69 21,3 18,0 80 51,0 12,0 75 19,1 20,6 87 77,0 12,9 74 22,2 Arquivo “Trees” do MinitabArquivo “Trees” do Minitab ClassificaçãoClassificação NOMINALNOMINALNOMINALNOMINAL ORDINALORDINALORDINALORDINAL QUALITATIVAQUALITATIVAQUALITATIVAQUALITATIVA QUANTITATIVAQUANTITATIVAQUANTITATIVAQUANTITATIVA CONTÍNUACONTÍNUACONTÍNUACONTÍNUA DISCRETADISCRETADISCRETADISCRETA peso, altura número de filhos, número de carros sexo, cor dos olhos classe social, grau de instrução VariávelVariável Qualquer característica associada a uma população. Variáveis QuantitativasVariáveis Quantitativas Mínimo, Máximo, Moda, Média, Mediana, Quartis Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação MEDIDAS DE POSIÇÃO: MEDIDAS DE DISPERSÃO: Máximo (max):Máximo (max): a maior observação a maior observação Mínimo (min):Mínimo (min): a menor observação a menor observação Moda (mo):Moda (mo): é o valor (ou atributo) que é o valor (ou atributo) que ocorre com maior frequência.ocorre com maior frequência. Medidas de PosiçãoMedidas de Posição Ex.: 4, 5, 4, 6, 5, 8, 4Ex.: 4, 5, 4, 6, 5, 8, 4 mo = 4mo = 4max = 8max = 8 min = 4min = 4 Ex: 2, 5, 3, 7, 8 2+5+3+7+8 5 = 5 n x n xxxxx n i i n ∑ = = ++++ = 1321 ... MédiaMédia -X = Valor que deixa Valor que deixa 50%50% das observações à sua esquerda das observações à sua esquerda Ex(A): 2, 5, 3, 7, 8 Dados ordenados: 2, 3, 5, 7, 8 Md = 5 Ex(B): 3, 5, 2, 1, 8, 6 Dados ordenados: 1, 2, 3, 5, 6, 8 Md = (3 + 5) / 2 = 4 Mediana (Md)Mediana (Md) A mediana pode ser obtida ordenando-se os dados e A mediana pode ser obtida ordenando-se os dados eencontrando-se o valor que corresponde a posição encontrando-se o valor que corresponde a posição (n+1)/2, se (n+1)/2, se nn for ímpar. for ímpar. SeSe n n for par, a mediana corresponde a média for par, a mediana corresponde a média aritmética dos valores da posição anterior e posterior aritmética dos valores da posição anterior e posterior a (n+1)/2.a (n+1)/2. Primeiro Quartil (Q1):Primeiro Quartil (Q1): valor que deixa 25% valor que deixa 25% das observações à sua esquerda.das observações à sua esquerda. Terceiro Quartil (Q3):Terceiro Quartil (Q3): valor que deixa 75% valor que deixa 75% das observações à sua esquerda.das observações à sua esquerda. Ex(A): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 Md = 3,05 Q1 = 2,05 Q3 = 4,9 Ex(B): 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 Md = 5,3 Q1 = 1,7 Q3 = 12,9 1º e 3º Quartil1º e 3º Quartil Posição de Q1Posição de Q1 Como encontrar Q1Como encontrar Q1 4 1nP1 += Valor de Q1Valor de Q1 a)a) Se P1 for um número inteiro, entãoSe P1 for um número inteiro, então Q1 = yQ1 = yP1P1 onde yonde y11,y,y22,…,y,…,ynn são os dados ordenados são os dados ordenados b) Se P1 não for inteiro, sejam P1b) Se P1 não for inteiro, sejam P1- - e P1e P1++ os inteiros imediatamente abaixo e os inteiros imediatamente abaixo e acima de P1, respectivamente. Entãoacima de P1, respectivamente. Então 2 y y Q1 P1 P1- + + = clique aqui para voltar Posição de Q3Posição de Q3 Como encontrar Q3Como encontrar Q3 4 1)3(nP3 += Valor de Q3Valor de Q3 a)a) Se P3 for um número inteiro, entãoSe P3 for um número inteiro, então Q3 = yQ3 = yP3 P3 b) Seb) Se pp33 não for inteiro, então com a não for inteiro, então com a mesma notação do caso anteriormesma notação do caso anterior 2 y y Q3 P3 P3- + + = clique aqui para voltar Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5 Temos: x1 = x2 = x3 = 5 md1= md2= md3 = 5 Exemplo: Considere as notas de um teste de Exemplo: Considere as notas de um teste de 3 grupos de alunos3 grupos de alunos G 1 100 * * * * * G 2 0 10 * * * * * G 3 0 10 * * * * * Amplitude (A): máximo - mínimo [máx - min]Amplitude (A): máximo - mínimo [máx - min] Medidas de DispersãoMedidas de Dispersão Finalidade: encontrar um valor que resuma a Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dadosvariabilidade de um conjunto de dados Para os grupos anteriores, temos:Para os grupos anteriores, temos: Grupo 1, A = 4Grupo 1, A = 4 Grupo 2, A = 8Grupo 2, A = 8 Grupo 3, A = 0Grupo 3, A = 0 É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, Q3 - Q1 Ex.(A): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 Q1 = 2,05 e Q3= 4,9 Q3 - Q1 = 4,9 - 2,05 = 2,85 Intervalo-InterquartilIntervalo-Interquartil n xx n xxxxxx n i i n ∑ = − = −++−+− = 1 2 22 2 2 12 )( )(...)()( σ VariânciaãoDesvioPadr = Variância e Desvio PadrãoVariância e Desvio Padrão ( ) ( ) ( ) ( ) ( )[ ] ( ) ( ) ( ) ( ) ( )[ ] [ ] 0,2 5 1041014 5 1 21012- 5 1 5756555453 5 1 22222 222222 1 ==++++= +++−+= −+−+−+−+−=σ ( ) ( ) ( ) ( ) ( )[ ] [ ] 8 5 406140461 5 1 5957555351 5 1 222222 2 ==++++= −+−+−+−+−=σ Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5 Temos: x1 = x2 = x3 = 5 md1= md2= md3 = 5 Exemplo: Considere as notas de um teste de Exemplo: Considere as notas de um teste de 3 grupos de alunos3 grupos de alunos G 1 100 * * * * * G 2 0 10 * * * * * G 3 0 10 * * * * * Variância para os Grupos 1, 2 e 3Variância para os Grupos 1, 2 e 3 G1: σ2= 2,0 σ = 1, 41 G2: σ2 = 8 σ = 2,83 G3: σ2 = 0 σ = 0 Fórmulas AlternativasFórmulas Alternativas ( ) − = − = ∑∑ ∑ == = 2n 1i i n 1i 2 i 2 n 1i 2 i 2 x n 1x n 1 xnx n 1 σ Exemplo: Considere o grupo G1 ( )[ ] [ ] 0,2 5 10125135 5 155135 5 1 135493625169 76543 22 22222 1 2 ==−=×−= =++++= =++++=∑ = σ n i ix •é uma medida de dispersão relativaé uma medida de dispersão relativa •elimina o efeito da magnitude dos dadoselimina o efeito da magnitude dos dados •exprime a variabilidade em relação à médiaexprime a variabilidade em relação à média %100×= x CV σ Coeficiente de Variação (CV)Coeficiente de Variação (CV) Exemplo 1Exemplo 1 Altura e peso de alunos Altura 1,143m 0,063m 5,5% Peso 50 kg 6kg 12% Média DesvioPadrão Coef. de Variação Conclusão: Os alunos são duas vezes mais dispersos quanto ao peso do que quanto à altura Exemplo 2Exemplo 2 Alturas de meninos e homens adultos de uma população. Conclusão: Em relação às médias, as alturas dos homens e dos meninos apresentam variabilidade quase iguais. Desvio Padrão Coef. De Variação Média Meninos 50 6 12% Homens 160 16 10% Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34 Slide 35 Slide 36 Slide 37 Slide 38
Compartilhar