Aula IntrodutóriaAula Introdutória Autoria de Prof. Carlos Alberto (Caio) Dantas FORMATAÇÃO & DESIGN Cléber da Costa Figueiredo figuecl@usp.br Thiago Rodrigo Alves Carneiro thiagorodrigo@ime.usp.br •A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. •A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística. O Que é Estatística?O Que é Estatística? EstatísticaEstatística População Características Amostra Informações contidas nos dados Conclusões sobre as características da população Técnicas de amostragem Análise descritiva Inferência estatística AmostragemAmostragem É a area da Estatística que trata da obtenção de amostras que sejam representativas da população Exemplos de utilização: Pesquisa de Mercado, Pesquisa de opinião pública, Ensaios de medicamentos e em praticamente todo experimento. EstatísticaEstatística DescritivaDescritiva A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou esta área da Estatística. Inferência EstatísticaInferência Estatística A inferência estatística procura com base nos dados amostrais tirar conclusões sobre a população. ProbabilidadeProbabilidade A inferência estatística baseia- se na Teoria das Probabilidades que constrói modelos para os fenômenos aleatórios, isto é , aqueles em que está presente a incerteza. Exemplo: Intenção deExemplo: Intenção de voto voto Numa pesquisa eleitoral, um Instituto de Pesquisa procura, com base nos resultados de um levantamento aplicado a uma amostra da população, prever o resultado da eleição. Considere o Candidato “A”Considere o Candidato “A” Denomine por a proporção de pessoas que votarão em “A” na eleição. Denomine por a proporção de pessoas no levantamento de opinião (amostra) que expressam intenção de voto em “A”. p^ p AmostraAmostra POPULAÇÃO é o conjunto de elementos que nos interessa estudar. AMOSTRA é qualquer subconjunto da população. clique aqui para voltar População e AmostraPopulação e Amostra Podemos usar o valor dePodemos usar o valor de para estimar a proporçãopara estimar a proporção da população.da população. p^ p EstimaçãoEstimação Evolução da intenção de voto para prefeito de São Paulo Evolução da intenção de voto para prefeito de São Paulo realizada entre os dias 29 e 30 de outubro de 2004 (2º Turno).realizada entre os dias 29 e 30 de outubro de 2004 (2º Turno). Pesquisa contratada pela TV Globo, em % do total de votos.Pesquisa contratada pela TV Globo, em % do total de votos. A pesquisa ouviu 2.000 eleitores - Margem de erro de 2 % com A pesquisa ouviu 2.000 eleitores - Margem de erro de 2 % com 95% de confiança.95% de confiança. Estatística DescritivaEstatística Descritiva Etapa inicial da análise utilizada para descrever e resumir os dados ExemploExemplo Arquivo Arquivo PulsePulse do Minitab do Minitab Refere-se a um experimento feito por alunos. Cada aluno registrou sua altura, peso, sexo, hábito de fumar, nível de atividade física usual e pulsação em repouso. Então todos eles jogaram moedas e aqueles que tiraram cara fizeram corrida estacionária por um minuto. Depois disso todos os alunos mediram novamente sua pulsação. Informações do arquivo Informações do arquivo PulsePulse Information of the worksheetInformation of the worksheet Column Count Column Count Name Name C1 92 Pulse1C1 92 Pulse1 C2 92 Pulse2C2 92 Pulse2 C3 92 Ran (1:correu, 2:não correu)C3 92 Ran (1:correu, 2:não correu) C4 92 Smokes (1:fumante, 2:não fumante)C4 92 Smokes (1:fumante, 2:não fumante) C5 92 Sex (1:masculino, 2:feminino)C5 92 Sex (1:masculino, 2:feminino) C6 92 HeightC6 92 Height C7 92 WeightC7 92 Weight C8 92 Activity (1:leve, 2:moderada, 3:forte)C8 92 Activity (1:leve, 2:moderada, 3:forte) (Pulsação antes de correr)(Pulsação antes de correr) (Pulsação depois de correr)(Pulsação depois de correr) MTB > INFOMTB > INFO Pulse1 Pulse2 Ran Smokes Sex Height Weight ActivityPulse1 Pulse2 Ran Smokes Sex Height Weight Activity 64 88 1 2 1 66.00 140 264 88 1 2 1 66.00 140 2 58 70 1 2 1 72.00 145 258 70 1 2 1 72.00 145 2 62 76 1 1 1 73.50 160 362 76 1 1 1 73.50 160 3 66 78 1 1 1 73.00 190 166 78 1 1 1 73.00 190 1 64 80 1 2 1 69.00 155 264 80 1 2 1 69.00 155 2 74 84 1 2 1 73.00 165 174 84 1 2 1 73.00 165 1 84 84 1 2 1 72.00 150 384 84 1 2 1 72.00 150 3 68 72 1 2 1 74.00 190 268 72 1 2 1 74.00 190 2 62 75 1 2 1 72.00 195 262 75 1 2 1 72.00 195 2 ............ Informações do arquivo PulseInformações do arquivo Pulse DiâmetroDiâmetro AlturaAltura VolumeVolume 8,3 70 10,3 12,9 85 33,8 8,6 65 10,3 13,3 86 27,4 8,8 63 10,2 13,7 71 25,7 10,5 72 16,4 13,8 64 24,9 10,7 81 18,8 14,0 78 34,5 10,8 83 19,7 14,2 80 31,7 11,0 66 15,6 14,5 74 36,3 11,0 75 18,2 16,0 72 38,3 11,1 80 22,6 16,3 77 42,6 11,2 75 19,9 17,3 81 55,4 11,3 79 24,2 17,5 82 55,7 11,4 76 21,0 17,9 80 58,3 11,4 76 21,4 18,0 80 51,5 11,7 69 21,3 18,0 80 51,0 12,0 75 19,1 20,6 87 77,0 12,9 74 22,2 Arquivo “Trees” do MinitabArquivo “Trees” do Minitab ClassificaçãoClassificação NOMINALNOMINALNOMINALNOMINAL ORDINALORDINALORDINALORDINAL QUALITATIVAQUALITATIVAQUALITATIVAQUALITATIVA QUANTITATIVAQUANTITATIVAQUANTITATIVAQUANTITATIVA CONTÍNUACONTÍNUACONTÍNUACONTÍNUA DISCRETADISCRETADISCRETADISCRETA peso, altura número de filhos, número de carros sexo, cor dos olhos classe social, grau de instrução VariávelVariável Qualquer característica associada a uma população. Variáveis QuantitativasVariáveis Quantitativas Mínimo, Máximo, Moda, Média, Mediana, Quartis Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação MEDIDAS DE POSIÇÃO: MEDIDAS DE DISPERSÃO: Máximo (max):Máximo (max): a maior observação a maior observação Mínimo (min):Mínimo (min): a menor observação a menor observação Moda (mo):Moda (mo): é o valor (ou atributo) que é o valor (ou atributo) que ocorre com maior frequência.ocorre com maior frequência. Medidas de PosiçãoMedidas de Posição Ex.: 4, 5, 4, 6, 5, 8, 4Ex.: 4, 5, 4, 6, 5, 8, 4 mo = 4mo = 4max = 8max = 8 min = 4min = 4 Ex: 2, 5, 3, 7, 8 2+5+3+7+8 5 = 5 n x n xxxxx n i i n ∑ = = ++++ = 1321 ... MédiaMédia -X = Valor que deixa Valor que deixa 50%50% das observações à sua esquerda das observações à sua esquerda Ex(A): 2, 5, 3, 7, 8 Dados ordenados: 2, 3, 5, 7, 8 Md = 5 Ex(B): 3, 5, 2, 1, 8, 6 Dados ordenados: 1, 2, 3, 5, 6, 8 Md = (3 + 5) / 2 = 4 Mediana (Md)Mediana (Md) A mediana pode ser obtida ordenando-se os dados e A mediana pode ser obtida ordenando-se os dados e