Baixe o app para aproveitar ainda mais
Prévia do material em texto
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais Sexta EdiçãoSexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 1 Cap. 1 –– IntroduçãoIntrodução PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. EstatísticaEstatística • Problema de estudo • Coleta dos dados • Dados • Análise descritiva dos dados • Análise exploratória dos dados • Inferências • Interpretação dos resultados à luz do problema PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estatística descritiva e análise exploratória de dadosEstatística descritiva e análise exploratória de dados • Distribuição de freqüências; • Tabelas e gráficos • Medidas-resumo PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. DadosDados • Pesquisa em uma amostra de famílias de um bairro de Florianópolis núm. local p.a.p instr. tam. renda 1 1 0 3 4 10,3 2 1 0 3 4 15,4 3 1 1 2 4 9,6 4 1 0 2 5 5,5 5 1 1 3 4 9 6 1 1 1 1 2,4 7 1 0 3 2 4,1 8 1 1 3 3 8,4 9 1 1 3 6 10,3 10 1 1 2 4 4,6 11 1 0 2 6 18,6 12 1 1 1 4 7,1 13 1 0 2 4 12,9 14 1 0 2 6 8,4 15 1 0 3 3 19,3 16 1 0 2 5 10,4 17 1 1 3 3 8,9 18 1 0 3 4 12,9 ... ... ... ... ... ... RÓTULOS local 1=Monte Verde, 2=Parque da Figueira, 3= encosta do morro p.a.p (programa de alimentação popular) 0=não usa 1=usa instr. (grau de instrução do chefe da casa) 1=nenhum 2=fundamental 3=médio tam. número de moradores renda renda familiar em salários mínimos Que informações têm nos dados ? PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüênciasDistribuição de freqüências • A distribuição de freqüências compreende a organização dos dados de acordo com as ocorrências dos diferentes resultados observados. • Exemplos: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüênciasDistribuição de freqüências Nível de instrução do chefe da casa 32% 32% 36% nenhum fundamental médio Figura 1.1 Distribuição de freqüências do nível de instrução do chefe da casa. Amostra de 120 famílias do bairro Saco Grande II, Florianópolis-SC, 1988. Que informações você extrai do gráfico? PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüênciasDistribuição de freqüências Distribuição da renda familiar. Amostra de 120 famílias do bairro Saco Grande II, Florianópolis-SC, 1988. Renda (em sal. mín.) Fr eq üê nc ia Que informações você extrai do gráfico? E se você quisesse informações por localidade? PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. MedidasMedidas--resumoresumo • Exemplo: Local Num. Média Mediana Desvio padrão Monte Verde 40 8,09 7,7 4,28 Pq. da Figueira 42 5,83 5,5 2,57 Morro 37 5,02 3,9 4,52 Medidas descritivas da renda familiar (em sal. mín.), por localidade PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ConceitosConceitos • População é o conjunto de elementos para os quais desejamos que as nossas conclusões sejam válidas – o universo de nosso estudo. Uma parte desses elementos é dita uma amostra. • Um parâmetro é uma medida que descreve certa característica dos elementos da população. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Inferência: EstimaçãoInferência: Estimação • Conhecer aproximadamente (estimar) uma característica da população (parâmetro) através dos resultados de uma amostra. • Exemplos: pesquisas de mercado, pesquisas eleitorais, pesquisas do IBGE. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. AMOSTRAPOPULAÇÃO π = ? π = p ± erro amostral Exemplo: Pesquisa eleitoralExemplo: Pesquisa eleitoral X1 X2 X3 ...Voto do eleitor: p Parâmetro Estatística PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Inferência: Testes de HipótesesInferência: Testes de Hipóteses • Analisar a admissibilidade de uma certa hipótese sobre alguma característica populacional, usando como base de decisão os dados amostrais. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Testes de HipótesesTestes de Hipóteses • Exemplo: Qual sistema computacional é melhor para a Empresa? – Sistema 1 ou Sistema 2 ? • Hipótese: Um dos sistemas, em média, funciona melhor. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Pesquisa experimental para comparação de dois Pesquisa experimental para comparação de dois sistemas computacionaissistemas computacionais sistema 1 sistema 2 Cargas de trabalho (1) (2) ... (n) x11 x12 x1n... x21 x22 x2n... Cargas de trabalho (1) (2) ... (n) Observação do desempenho (dados): PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Inferência estatística:Inferência estatística: Estimação e Testes de HipótesesEstimação e Testes de Hipóteses universo do estudo (população) dados observados O raciocínio indutivo da estimação e dos testes estatísticos PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ProbabilidadeProbabilidade • Mensuração da chance de ocorrência de fenômenos aleatórios, mostrando como poderão ocorrer os fatos. • Base teórica para a inferência estatística (Estimação de parâmetros ou Teste de hipóteses). PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ProbabilidadeProbabilidade Universo do estudo (população) Hipóteses, conjeturas, ... Resultados ou dados observados O raciocínio dedutivo da probabilidade PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. O processo iterativo da evolução do O processo iterativo da evolução do conhecimento. conhecimento. dados informações novos conhecimentos, novas hipóteses. pesquisa PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • Como planejar adequadamente a coleta dos dados • Como alguns conceitos básicos da Estatística podem auxiliar no planejamento da pesquisa • Capítulos 2 e 3 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais Sexta EdiçãoSexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 2 Cap. 2 –– Pesquisas e DadosPesquisas e Dados Este capítulo teve a participação da Profa SÍLVIA MODESTO NASSAR (INE – CTC – UFSC) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Pesquisa, dados e estatísticaPesquisa, dados e estatística Metolo- -logia estatís- tica Tema, definição do problema, objetivos, ... Planejamento da pesquisa Dados Análise dos dados Resultados Conclusões Execução da pesquisaExecução da pesquisa Metodo- -logia da área em estudo PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Tipos de Pesquisa quantitativaTipos de Pesquisa quantitativa • DE LEVANTAMENTO Características de interesse de uma população são levantadas (observadas ou medidas), mas sem manipulação. • EXPERIMENTAL Grupos de indivíduos (ou animais, ou objetos) são manipulados para se avaliar o efeito de diferentes tratamentos. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Pesquisa de levantamento ou Pesquisa de levantamento ou observacionalobservacional POPULAÇÃO: todos os funcionários da empresa AMOSTRA: parte dos funcionáriosda empresa Plano de amostragem Aplicação de um questionário Conjunto de dados observados • Exemplo 2.1: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Pesquisa experimentalPesquisa experimental • Exemplo 2.2: Grupo 1 de funcionários Grupo 2 de funcionários Amostra 1 de valores de produtividade Amostra 2 de valores de produtividade Método padrão Método novo PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. PesquisaPesquisa • Quem? – os elementos a serem pesquisados POPULAÇÃO • O quê? – características a serem observadas VARIÁVEIS • Como? – o instrumento de coleta de dados QUESTIONÁRIO / ENTREVISTA ESTRUTURADA PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. POPULAÇÃOPOPULAÇÃO (Quem?)(Quem?) • População é o conjunto de elementos (p. ex., indivíduos) que queremos abranger em nosso estudo e que são passíveis de serem observados, com respeito às características (variáveis) que pretendemos levantar. – Muitas vezes vamos chamar de população a todo o conjunto de observações da variável de interesse. Abrangência da pesquisa Toda a população Censo Parte da população Amostragem PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. VARIÁVEISVARIÁVEIS (O quê?)(O quê?) • Variáveis são as características que podem ser observadas (ou medidas) em cada elemento da população, sob as mesmas condições. – A variável deve estar definida de tal forma que cada elemento observado tenha um – e apenas um – resultado (valor ou atributo) associado a essa variável. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Dados e variáveisDados e variáveis • Ex: Alunos da turma Variáveis Dados ............ 8,000masc.10 5,406masc.9 7,304fem.8 7,002fem.7 4,909fem.6 6,300fem.5 10,000masc.4 8,505fem.3 9,001masc.2 9,202masc.1 NotaFaltasSexoAluno Casos (elementos observados da população) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Dados e variáveisDados e variáveis Variável qualitativa ou categórica quantitativa dados qualitativos ou categorizados dados quantitativos PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Instrumentos de coleta de dadosInstrumentos de coleta de dados (Como?)(Como?) • Questionários • Entrevistas • Instrumentos da Web PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo de questionárioExemplo de questionário 1) Qual é o curso que você está realizando na UFSC? _____________. 2) Qual é a fase predominante em que você se encontra? __________. 3) Dê uma nota de 1 (um) a 5 (cinco), sendo 1 o nível mínimo e 5 o nível máximo, para as seguintes características relacionadas com você e seu curso. a) Didática dos professores de seu curso ( 1 2 3 4 5 ) b) Nível de conhecimento dos professores ( 1 2 3 4 5 ) c) Bibliografia disponível ( 1 2 3 4 5 ) d) Laboratórios e outros recursos materiais ( 1 2 3 4 5 ) e) Conteúdo dos programas das disciplinas oferecidas( 1 2 3 4 5 ) f) Encadeamento das disciplinas ( 1 2 3 4 5 ) g) Satisfação com o curso, num sentido geral ( 1 2 3 4 5 ) 4) Apresente o principal ponto positivo e negativo de seu curso. POSITIVO:________________________________________________. NEGATIVO:_______________________________________________. 5) Anote o seu Índice de Aproveitamento Acumulado _____________ (ver tabela com o aplicador). PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Dados da pesquisaDados da pesquisa no do 3(a) 3(b) 3(c) 3(d) 3(e) 3(f) 3(g) 4(a) 4(b) 5 quest. didat. conhec. bibl. labor. disc. curric. satisf. posit. negat. desemp. 1 2 4 2 1 2 2 2 1 2 1,95 2 2 3 2 1 2 3 3 9 1 1,72 3 3 2 1 1 3 2 3 3 3 2,39 4 2 2 3 1 4 4 3 3 5 2,57 5 3 3 4 3 3 4 2 3 1 2,51 ... .... ... ... ... ... ... ... ... ... ... Item do questionário PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais Sexta EdiçãoSexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 3 Cap. 3 –– Técnicas de Técnicas de amostragemamostragem Este capítulo teve a participação da Profa SÍLVIA MODESTO NASSAR (INE – CTC – UFSC) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. POPULAÇÃO X1 X2 X3 ...Característica X observável: População e a variável a ser observadaPopulação e a variável a ser observada PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. AMOSTRA: uma parte dos eleitores X1 X2 X3Voto do eleitor: POPULAÇÃO: eleitores brasileiros Pesquisa eleitoral: um exemplo dePesquisa eleitoral: um exemplo de levantamento por amostragemlevantamento por amostragem PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostragem e Inferência estatísticaAmostragem e Inferência estatística Universo do estudo (população) Dados observados (amostra) Amostrageminferência PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. PopulaçãoPopulação • População: é o conjunto de elementos para os quais desejamos que as conclusões da pesquisa sejam válidas, com a restrição de que esses elementos possam ser observados ou mensurados sob as mesmas condições. – Muitas vezes vamos chamar de população a todo o conjunto de observações da variável de interesse. – Parâmetro é uma medida que descreve certa característica dos elementos da população (uma média, uma proporção,... da variável de interesse). PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostra e amostragemAmostra e amostragem • Amostra: parte dos elementos de uma população. – Muitas vezes vamos se referir à amostra como uma parte das possíveis observações de uma variável de interesse. • Amostragem: o processo de seleção da amostra. – Estimativa: valor calculado com base na amostra, e usado com a finalidade de avaliar aproximadamente um parâmetro. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. AMOSTRAPOPULAÇÃO π = ? π = p ± erro amostral Exemplo: Pesquisa eleitoralExemplo: Pesquisa eleitoral X1 X2 X3 ...Voto do eleitor: p Parâmetro Estatística Amostragem Resultado estatístico: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • Censo: Estudo através da observação de todos os elementos da população. • Amostragem: Estudo por meio da observação de uma amostra. Censo x AmostragemCenso x Amostragem PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Por que fazer amostragem?Por que fazer amostragem? • Economia • Menor tempo • Maior qualidade nos dados levantados • População infinita • Mais fácil, com resultados satisfatórios. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Quando fazer censo?Quando fazer censo? • População pequena (tamanho da amostra grande em relação ao da população). • Quando se exige o resultado exato. • Quando já se dispõe dos dados da população. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. N n Amostra representativa: 10% da população Tamanho da amostra Tamanho da amostra (n)(n) ee tamanho da população tamanho da população (N)(N) 100 1.000 10 100 A relação não é linear PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. N n IMPORTANTE: forma de seleção da amostra Tamanho da amostra (n)Tamanho da amostra (n) ee tamanho da população (N)tamanho da população (N) 10 10 10.000 Bem menos que 10.000PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostragem Amostragem • O processo de seleção da amostra PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Técnicas de Amostragem Técnicas de Amostragem • Amostragem probabilística (aleatória) - a probabilidade de um elemento da população ser escolhido é conhecida. – Usa alguma forma de sorteio - aleatoriedade • Amostragem não-probabilística (não-aleatória) - Não se conhece, a priori, a probabilidade de um elemento da população vir a pertencer à amostra. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostragem ProbabilísticaAmostragem Probabilística • Amostragem aleatória simples • Amostragem sistemática • Amostragem estratificada • Amostragem por conglomerados PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostragem Aleatória Amostragem Aleatória Simples (Simples (AASAAS)) • Faz-se uma lista da população e sorteiam-se os elementos que farão parte da amostra. • Pode-se utilizar uma tabela de números aleatórios. • Propriedade básica: cada subconjunto da população com o mesmo nº de elementos tem a mesma chance de ser incluído na amostra. Em particular, cada elemento da população tem probabilidade p = n/N de pertencer à amostra. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo 05. Bernardino 10. Hercílio 15. Fabrício 20. João da Silva 25. José de Souza 30. Mauro 04. Bartolomeu 09. Ermílio 14. Felício 19. Hiraldo 24. José da Silva 29. Ma Cristina 03. Arnaldo 08. Cláudio 13. Francisco 18. Getúlio 23. Joaquina 28. Maria José 02. Anastácia 07. Carlito 12. Endevaldo 17. Gabriel 22. Joaquim 27. Josefina 32. Paulo César 01. Aristóteles 06. Cardoso 11. Ernestino 16. Geraldo 21. Joana 26. Josefa 31. Paula População: Selecionar uma amostra de n = 5 elementos. Números aleatórios: 59 58 48 36 47 92 85 05 38 65 47 49 10 41 05 10 75 59 75 99 17 28 97 99 75 53 26 21 50 21 37 93 85 52 86 86 22 75 34 37 69 85 25 03 78 50 26 18 25 10 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 59 58 48 36 47 92 85 05 08 65 47 49 10 41 05 10 75 59 75 99 17 28 97 99 75 53 26 21 50 21 37 93 85 52 86 86 22 75 34 37 69 85 25 03 78 50 26 18 25 10 ExemploExemplo 05. Bernardino 10. Hercílio 15. Fabrício 20. João da Silva 25. José de Souza 30. Mauro 04. Bartolomeu 09. Ermílio 14. Felício 19. Hiraldo 24. José da Silva 29. Ma Cristina 03. Arnaldo 08. Cláudio 13. Francisco 18. Getúlio 23. Joaquina 28. Maria José 02. Anastácia 07. Carlito 12. Endevaldo 17. Gabriel 22. Joaquim 27. Josefina 32. Paulo César 01. Aristóteles 06. Cardoso 11. Ernestino 16. Geraldo 21. Joana 26. Josefa 31. Paula População e amostra: Números aleatórios: Obs. Há um erro no livro (6 ed.): foi pulado o número 08, associado ao Cláudio. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostragem SistemáticaAmostragem Sistemática • Os elementos da população apresentam-se ordenados e são retirados periodicamente (de cada k elementos, um é escolhido) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostragem EstratificadaAmostragem Estratificada • Usada quando a população pode ser dividida em subgrupos (estratos) relativamente homogêneos. • A seleção em cada estrato deve ser aleatória PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. POPULAÇÃO: comunidade da escola 20% 60% 20% professor servidor aluno AMOSTRA: parte da comunidade da escola 20% 20% 60% Ilustração de uma amostragem estratificada proporcional PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostragem Estratificada. Amostragem Estratificada. ExemplosExemplos • Pesquisas de mercado: – homens e mulheres; – faixas etárias. • Pesquisas eleitorais: – região demográfica; – cidades pequenas médias e grandes; – área urbana e rural. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostragem por ConglomeradosAmostragem por Conglomerados • Usada quando a população pode ser naturalmente dividida em vários subgrupos (conglomerados). – Ao contrário dos estratos, espera-se que os conglomerados sejam quase tão heterogêneos quanto à população toda. • Num primeiro estágio, a amostragem é feita sobre os conglomerados, e não mais sobre os indivíduos da população. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ☺☺☺ 2° ESTÁGIO: seleção aleatória de elementos ☺ ☺ ☺ ☺☺☺☺☺ ☺☺☺ ☺☺☺ ☺☺ 1° ESTÁGIO: seleção aleatória de conglomerados Amostragem por ConglomeradosAmostragem por Conglomerados Amostra: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Tamanho da amostraTamanho da amostra • Supondo amostragem aleatória simples. • Supondo que o objetivo é estimar determinadas proporções. • Quantos elementos da população devemos pesquisar? – Digamos que não queremos errar em mais que E0, com alto nível de confiança (digamos 95%). Ou seja, a proporção a ser calculada na amostra não deve diferir da verdadeira proporção (na população) em mais que E0 unidades, com 95% de probabilidade. – E0 = limite superior provável para o erro amostral. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Tamanho da amostraTamanho da amostra • Uma expressão genérica (mais detalhes no Cap. 9 ) : E 1 = n 0 20 0n =n se N é muito grande ou desconhecido n+ N n.N =n 0 0 se N não for muito grande e for conhecido n = n0 de elementos da amostra N = n0 de elementos da população Exemplos 3.8 e 3.9: ler e discutir. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. N n Tamanho da amostra (n)Tamanho da amostra (n) ee tamanho da população (N)tamanho da população (N) 10 10 10.000 Bem menos que 10.000 Considerando a relação acima, pense como ficam as inferências sobre subgrupos de uma população. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Fazer Exercício 8Fazer Exercício 8 Numeração dos domicílios: Número de cômodos (variável X de estudo) : PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 40 50 60 70 80 90 100 Taxa de alfabetização 0 2 4 6 8 10 12 Fr eq ü ên ci a de m u n ic íp io s Avaliação Bom 45% Regular 35% Ruim 20% Informação Dados Pesquisa Conhecimento Novas hipóteses PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • Como extrair informações dos dados. • Como construir, apresentar e interpretar tabelas, gráficos e medidas descritivas. • Capítulos 4, 5 e 6 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais Sexta EdiçãoSexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 4 Cap. 4 –– Dados categorizadosDados categorizados PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Dados (ver Anexo do Cap. 4)Dados (ver Anexo do Cap. 4) .................. 7,14nenhumusaMonte Verde12 18,66fundamentalnão usaMonte Verde11 4,64fundamentalusaMonte Verde10 10,36médiousaMonte Verde9 8,43médiousaMonte Verde8 4,12médionão usaMonte Verde7 2,41nenhumusaMonte Verde6 94médiousaMonte Verde5 5,55fundamentalnão usaMonte Verde4 9,64fundamentalusaMonte Verde3 15,44médionão usaMonte Verde2 10,34médionão usaMonte Verde1 RendaTam.InstruçãoP.A.P.Local Família PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Classificação simplesClassificação simples• Distribuição de Freqüências: organização dos dados de acordo com as ocorrências dos diferentes resultados observados. Pode ser apresentada: em tabela ou em gráfico; com freqüências absolutas ou relativas. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Variável:Variável: Nível de instruçãoNível de instrução Nível de instrução do chefe da casa, numa amostra de 40 famílias do Conj. Resid. Monte Verde, Florianópolis, SC, 1988. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de FreqüênciasDistribuição de Freqüências • Formas gráficas. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 0 4 8 12 16 20 24 Gráfico de BarrasGráfico de Barras nenhum nível fundam. nível médio Número de famílias Nível de Instrução do Chefe da Casa PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Cuidados na Construção de GráficosCuidados na Construção de Gráficos • O gráfico deve ser ressaltado. Linhas auxiliares e eixos devem ser “discretos”. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Gráfico de BarrasGráfico de Barras 0 4 8 12 16 20 24 nenhum nível fundam. nível médio número de famílias Nível de Instrução do Chefe da Casa PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • A escala das freqüências deve iniciar no zero. Cuidados na Construção de GráficosCuidados na Construção de Gráficos PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 4 8 12 16 20 24 Gráfico de BarrasGráfico de Barras nenhum nível fundam. nível médio número de famílias Nível de Instrução do Chefe da Casa PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Gráfico em colunasGráfico em colunas Nível de instrução do chefe da casa 0 5 10 15 20 25 nenhum fundam. médio nú m er o de fa m ília s PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Gráfico de SetoresGráfico de Setores Nível de Instrução do Chefe da Casa nenhum (15,0 %) nível fundam. (27,5 %) nível médio (57,5 %) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. GráficosGráficos • Que tipo de gráfico usar? – Ver comentários no livro (final da seção 4.2) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de FreqüênciasDistribuição de Freqüências MúltiplaMúltipla LocalidadeNível de Instr ução nenhum médio fundam. Total Pq. da Figue ira 14 (32,6) 14 (32,6) 15 (34,8) 43 (100,0) Encosta do Mo rro 18 (48,7) 13 (35,1) 6 (16,2) 37 (100,0) Monte Verde 6 (15,0) 11 (27,5) 23 (57,5) 40 (100,0) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de Freqüências MúltiplaDistribuição de Freqüências Múltipla Nível de Instrução do Chefe da Casa 0 10 20 30 40 50 60 70 Morro Pq. da Figueira Monte Verde Porcentagem de famílias nenhum fundamental médio PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Dupla classificaçãoDupla classificação • Permite verificar se os dados de duas variáveis indicam alguma associação. • A associação entre duas ou mais variáveis implica que o conhecimento de uma altera a probabilidade de algum resultado da outra. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Dupla classificaçãoDupla classificação 1 3 0 Dados família Nível de instrução uso de programas 2 3 0 3 2 1 / / 4 2 0 5 3 1 / / . . . . . . . . . construção da tabela uso de Nível de instrução programas 1 2 3 1 0 / PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição ConjuntaDistribuição Conjunta Uso de Nível de Instrução do Chefe da Casa programas nenhum fundam. médio Total sim 31 22 25 78 não 7 16 19 42 Total 38 38 44 120 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Uso de Nível de Instrução do Chefe da Casa programas nenhum fundam. médio Total sim 31 (81,6) 22 (57,9) 25 (56,8) 78 (65,0) não 7 (18,4) 16 (42,1) 19 (43,2) 42 (35,0) Total 38 (100,0) 38 (100,0) 44 (100,0) 120 (100,0) Perfil ColunaPerfil Coluna Interpretar PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Uso de Nível de Instrução do Chefe da Casa programas nenhum fundam. médio Total sim 31 (39,7) 22 (28,2) 25 (32,1) 78 (100,0) não 7 (16,7) 16 (38,1) 19 (45,2) 42 (100,0) Total 38 (31,7) 38 (31,7) 44 (36,7) 120 (100,0) Perfil LinhaPerfil Linha Interpretar PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais Sexta EdiçãoSexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 5 Cap. 5 –– Dados quantitativosDados quantitativos Análise descritiva e exploratória de variáveis quantitativas PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Variáveis quantitativasVariáveis quantitativas • O resultado é um número numa escala determinada • Ex. – número de filhos, – renda, – tempo de resposta de um sistema. Discreta Contínua Variável quantitativa PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis discretasdiscretas • Exemplo (Tabela de freqüências): Distribuição de freqüências do número de pessoas residentes no domicílio, numa amostra de quarenta residências do Conjunto Residencial Monte Verde, Florianópolis – SC, 1988. Freqüência Porcentagem de residências de residências 1 1 2,5 2 3 7,5 3 6 15 4 13 32,5 5 11 27,5 6 4 10 7 0 0 8 2 5 Número de pessoas PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis discretasdiscretas • Exemplo (Gráfico de freqüências): Distribuição de freqüências do número de pessoas residentes no domicílio, numa amostra de quarenta residências do Conjunto Residencial Monte Verde, Florianópolis – SC, 1988. 0 2 4 6 8 10 12 14 1 2 3 4 5 6 7 8 Número de pessoas residentes Fr eq ü ên ci a de r es id ên ci as PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis discretasdiscretas 0 2 4 6 8 10 12 14 1 2 3 4 5 6 7 8 Número de pessoas residentes Fr eq ü ên ci a d e re si dê n ci as • Exemplo (Gráfico de freqüências): Distribuição de freqüências do número de pessoas residentes no domicílio, numa amostra de quarenta residências do Conjunto Residencial Monte Verde, Florianópolis – SC, 1988. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis contínuascontínuas • Diagrama de pontos: quando se tem poucas observações PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis contínuascontínuas • Exemplo (Diagrama de pontos): Índice de Desenvolvimento Humano (IDH) de duas amostras aleatórias de quatorze municípios: uma da Região Sul e outra da Região Norte. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis contínuascontínuas• Exemplo: Valores da taxa de alfabetização, relativos a uma amostra aleatória de municípios brasileiros, ano 2000. 57,25 76,85 92,90 89,07 75,49 84,33 65,28 94,59 71,20 82,30 72,81 66,01 90,52 87,94 58,88 86,34 45,37 81,15 94,83 81,42 54,70 67,95 69,91 95,02 77,62 57,14 91,22 64,65 85,70 81,34 59,07 68,04 73,22 95,34 88,40 83,52 64,19 64,17 95,34 84,66 classes contagem freqüência 40 |— 50 | 1 50 |— 60 ||||| 5 60 |— 70 ||||| ||| 8 70 |— 80 ||||| | 6 80 |— 90 ||||| ||||| || 12 90 |— 100 ||||| ||| 8 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis contínuascontínuas • Exemplo (Tabela de freqüências): Freqüência Porcentagem de de municípios municípios 40 |— 50 45 1 2,5 50 |— 60 55 5 12,5 60 |— 70 65 8 20 70 |— 80 75 6 15 80 |— 90 85 12 30 90 |— 100 95 8 20 Classes da taxa de alfabetização Ponto médio PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis contínuascontínuas • Exemplo (Histograma de freqüências): 40 50 60 70 80 90 100 Taxa de alfabetização 0 2 4 6 8 10 12 Fr eq ü ên ci a de m u n ic íp io s PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,1 5,5 6,2 4,9 5,7 6,3 5,1 8,4 6,2 8,9 7,3 5,4 4,8 5,6 6,8 5,0 6,7 8,2 7,1 4,9 5,0 8,2 9,9 5,4 5,6 5,7 6,2 4,9 5,1 6,0 4,7 18,1 5,3 4,9 5,0 5,7 6,3 6,0 6,8 7,3 6,9 6,5 5,9 Salários (em quantidade de salários mínimos) dos Salários (em quantidade de salários mínimos) dos 50 funcionários da Empresa AAA:50 funcionários da Empresa AAA: ExemploExemplo PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. DADOS: 4,7 18,1 4 195 6 7 ... 5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,1 5,5 6,2 4,9 5,7 6,3 5,1 8,4 6,2 8,9 7,3 5,4 4,8 5,6 6,8 5,0 6,7 8,2 7,1 4,9 5,0 8,2 9,9 5,4 5,6 5,7 6,2 4,9 5,1 6,0 4,7 18,1 5,3 4,9 5,0 5,7 6,3 6,0 6,8 7,3 6,9 6,5 5,9 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,1 5,5 6,2 4,9 5,7 6,3 5,1 8,4 6,2 8,9 7,3 5,4 4,8 5,6 6,8 5,0 6,7 8,2 7,1 4,9 5,0 8,2 9,9 5,4 5,6 5,7 6,2 4,9 5,1 6,0 4,7 18,1 5,3 4,9 5,0 5,7 6,3 6,0 6,8 7,3 6,9 6,5 5,9 DADOS: 4 195 6 7 ...8 9 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. salário nú m er o de fu nc io ná rio s 0 2 4 6 8 10 12 14 16 18 20 4 6 8 10 12 14 16 18 HistogramaHistograma dos salários dos funcionários da dos salários dos funcionários da Empresa AAA:Empresa AAA: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. salário nú m er o de fu nc io ná rio s 0 2 4 6 8 10 12 14 16 18 20 4 6 8 10 12 14 16 18 Polígono de freqüênciasPolígono de freqüências dos salários dos dos salários dos funcionários da Empresa AAA:funcionários da Empresa AAA: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Polígonos de freqüências: Polígonos de freqüências: distribuição de renda distribuição de renda em duas localidadesem duas localidades 0 8 16 24 32 40 48 0 5 10 15 20 25 30 Renda familiar (em salários mínimos) P or ce nt ag em d e fa m íli as Monte Verde Encosta do Morro PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Formas de uma distribuição de freqüênciasFormas de uma distribuição de freqüências (b) Distribuições diferentes quanto à dispersão (a) Distribuições diferentes em termos da posição central (c) Distribuição simétrica (d) Distribuição assimétrica PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. RamoRamo--ee--folhasfolhas 57 76 92 89 75 84 65 94 71 82 72 66 90 87 58 86 45 81 94 81 54 67 69 95 77 57 91 64 85 81 59 68 73 95 88 83 64 64 95 84 4 5 5 78479 6 56794844 7 651273 8 942761151834 9 24045155 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. RamoRamo--ee--folhasfolhas 57 76 92 89 75 84 65 94 71 82 72 66 90 87 58 86 45 81 94 81 54 67 69 95 77 57 91 64 85 81 59 68 73 95 88 83 64 64 95 84 4 5 5 78479 6 56794844 7 651273 8 942761151834 9 24045155 4 5 5 47789 6 44456789 7 123567 8 111234456789 9 1244555 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais Sexta EdiçãoSexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 6 Cap. 6 –– Medidas descritivasMedidas descritivas Análise descritiva e exploratória de variáveis quantitativas PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Medidas DescritivasMedidas Descritivas • Descrevem características importantes de distribuições de valores • Exemplo: Famílias Renda média Local observadas (sal. mín.) Monte Verde 40 8,1 Pq. Da Figueira 42 5,8 Encosta do Morro 37 5,0 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo • Notas finais dos alunos de três turmas Turma Notas dos alunos A 4 5 5 6 6 7 7 8 B 1 2 4 6 6 9 10 10 C 0 6 7 7 7 7,5 7,5 • Qual turma teve melhor desempenho? – Vamos calcular as médias n X X ∑= PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo • Notas finais dos alunos de três turmas • A média é uma medida-resumo (não fornece todas as informações dos dados) n X X ∑= Turma Notas dos alunos Média da turma A 4 5 5 6 6 7 7 8 6,00 B 1 2 4 6 6 9 10 10 6,00 C 0 6 7 7 7 7,5 7,5 6,00 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Diagrama de PontosDiagrama de Pontos A: 4 5 5 6 6 7 7 8 4 Média 5 6 7 8 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Diagrama de pontos das três turmas e Diagrama de pontos das três turmas e indicação das respectivas médiasindicação das respectivas médias 0 2 4 6 8 10 12 notas Turma A Turma B Turma C PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Como medira dispersão?Como medira dispersão? Exemplo: Turma A (4 5 5 6 6 7 7 8) 4 5 6 7 8 Distância (desvio) de um valor em relação à média PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Desvios quadráticos e a variânciaDesvios quadráticos e a variância Descrição Notação Resultados numéricos Soma Valores (notas dos alunos) X 4 5 5 6 6 7 7 8 48 Média 6 Desvios -2 -1 -1 0 0 1 1 2 0 Desvios quadráticos 4 1 1 0 0 1 1 4 12 X XX − ( )2XX − ( ) 1 2 2 − − = ∑ n XX S S2 = (4 + 1 + 1 + 0 + 0 + 1 + 1 + 4) / 7 = 12 / 7 = 1,71 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Desvio Padrão: SDesvio Padrão: S • O desvio padrão (S) é a raiz quadrada da variância. • Ex: 31,171,1 ==S PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Comparação das três turmas pela média e Comparação das três turmas pela média e desvio padrãodesvio padrão turma notas X S A 4 5 5 6 6 7 7 8 6 1,31 B 1 2 4 6 6 9 10 10 6 3,51 C 0 6 7 7 7 7,5 7,5 6 2,69 Interpretar PEDROA. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Cálculo de Cálculo de SS X: 4 5 5 6 6 7 7 8 X2: 16 25 25 36 36 49 49 64 6=X ∑ =3002X 1 22 − −∑ = n XnXS PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Cálculo de Cálculo de SS 6=X ∑ =3002X 1,31 = 7 12 = 7 288 300 = 7 )8.(6 300 = S 2 −− 1 22 − −∑ = n XnXS PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. TABELA Medidas descritivas das notas finais dos alunos de três turmas Turma Número de alunos Média Desvio padrão A B C 20 40 30 6,0 8,0 9,0 3,3 1,5 2,6 Outro exemploOutro exemplo Interpretar PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 25% 25% 25% 25% Medidas baseadas na ordenação dos dados QI Quartil inferior Md mediana QS Quartil superior PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 0 10 20 30 40 50 60 70 Md = 22,5 X = 24,7 50% dos valores 50% dos valores Média e mediana PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 50%50% média = mediana (a) Distribuição simétrica 50% 50% mediana média (b) Distribuição assimétrica Média e mediana PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Cálculo da mediana • Conjunto de notas da Turma C: {0; 6; 7; 7; 7; 7,5 7,5} • Posição da mediana com os dados ordenados: (n+1)/2 posição: (7+1)/2 = 4 Md = 7. • E se n for par, fazendo com que (n+1)/2 seja fracionário? PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Dados: {2, 0, 5, 7, 9, 1, 3, 4, 6, 8} Md = (4+5)/2 = 4,5 0 1 2 3 4 5 6 7 8 9 Cálculo da mediana n = 10 “Posição da mediana” : (n + 1) / 2 = 5,5 Ordenando os dados: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Qi = 2 Qs = 7 0 1 2 3 4 5 6 7 8 9 Md = 4,5 Cálculo dos quartis Ei = 0 Es = 9 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Qi = 2,5 Qs = 7,5 Exercício: Cálculo dos quartis Ei = 0 Md = 5 0 1 2 3 4 5 6 7 8 9 100 Es = 100 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Diagrama em caixasDiagrama em caixas 25% 25% 25% 25% 25% 25% 25% 25% PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Diagrama em caixasDiagrama em caixas QS + 1,5(QS – QI) QI Md QS ES EI PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Diagrama em caixasDiagrama em caixas 3 8 13 18 23 28 Monte Verde Encosta do Morro Renda familiar (sal. mín.) Interpretar PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Análise exploratória de dadosAnálise exploratória de dados Análise univariada Variável qualitativa Variável quantitativa Distribuição de freqüências Percentagens Tabela Gráfico de barras, colunas ou setores Distribuição de freqüências Medidas descritivas (média, desvio padrão, mediana etc.) Histograma Ramo-e-folhas PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Análise exploratória de dadosAnálise exploratória de dados Análise biivariada Uma variável quantitativa e outra qualitativa Duas variáveis qualitativas Duas variáveis quantitativas Medidas descritivas da variável quantitativa em cada categoria da qualitativa Diagrama em caixas múltiplo Tabela de contingência Diagrama de dispersão Coeficiente de correlação PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • Como usar modelos de probabilidade para entender melhor os fenômenos aleatórios • Capítulos 7 e 8. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais Sexta EdiçãoSexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 7 Cap. 7 –– Modelos de Modelos de probabilidadeprobabilidade PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ProbabilidadeProbabilidade Universo do estudo (população) Hipóteses, conjeturas, ... Resultados ou dados observados O raciocínio dedutivo da probabilidade PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Modelos de probabilidadeModelos de probabilidade • Os modelos probabilísticos são construídos a partir de certas hipóteses ou conjeturas sobre o problema em questão e constituem-se de duas partes: 1) dos possíveis resultados – o espaço amostral e 2) de uma certa lei que nos diz quão provável é cada resultado (ou grupos de resultados) – as probabilidades. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo de um Exemplo de um experimento aleatórioexperimento aleatório • Selecionar uma pessoa ao acaso e observar se é homem ou mulher. • Resultados possíveis: homem, mulher • Espaço amostral = {homem, mulher} PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Probabilidade de um resultadoProbabilidade de um resultado • Qual a probabilidade de homem e de mulher? • P(homem) = 0,5 • P(mulher) = 0,5 • A probabilidade é um número entre 0 e 1, sendo que a soma das probabilidades de todos os resultados possíveis deve ser 1. 50% homens 50% mulheres PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Modelo de probabilidadesModelo de probabilidades 20% 30% 50% bom/ótimo regular ruim/péssimo POPULAÇÃO Opinião a respeito do governo AMOSTRA: uma pessoa observada ao acaso Resultado Probab. bom/ótimo 0,20 regular 0,30 ruim/péssimo 0,50 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo • Lançar um dado e observar a face voltada para cima. Suponha que o dado seja perfeitamente equilibrado e o lançamento imparcial. • Espaço amostral = {1, 2, 3, 4, 5, 6} • Probabilidades: P(1) = P(2) = ... = P(6) = 1/6 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. EventoEvento • Evento = um conjunto de resultados (um subconjunto do espaço amostral) Ex. • Espaço amostral = {1, 2, 3, 4, 5, 6} • Probabilidades: P(1) = P(2) = ... = P(6) = 1/6 • Eventos: A = número par, B = núm. menor que 3 • A = {2, 4, 6} B = {1, 2} • P(A) = 1/2, P(B) = 2/6 = 1/3 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Variável aleatóriaVariável aleatória • Variável aleatória = característica numérica dos resultados de um experimento • Ex. X = número de caras em 2 lançamentos de uma moeda; Y = percentagem de intenções de voto do candidato AAA numa amostra de 2.000 eleitores a ser extraída aleatoriamente em Santa Catarina. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo de distribuição de probabilidadesExemplo de distribuição de probabilidades X = número de caras em dois lançamentos de uma moeda; x p(x) 0 0,25 1 0,5 2 0,25 0 0,25 0,5 1 2 3 x p(x) 0 1 2 0 0,25 0,5 1 2 3 x p(x) 0 1 2 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Construção de distribuições de probabilidades. Construção de distribuições de probabilidades. Ex:Ex: Sortear n = 2 bolas com reposição X = número de bolas pretas na amostra PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 3/5 2/5 3/5 2/5 3/5 2/5X = número de bolas pretas na amostra x p(x) 0 9/25 (0,36) 1 12/25 (0,48) 2 4/25 (0,16) (10) (20) Sortear n = 2 bolas com reposição Exemplo:Exemplo: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 3/5 2/5 2/4 2/4 3/4 1/4 X = número de bolas pretas na amostra x p(x) 0 6/20 (0,30) 1 12/20 (0,60) 2 2/20 (0,10) (10) (20) Sortear n = 2 bolas sem reposição Exemplo:Exemplo: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. X = número de bolas pretas na amostra x p(x) 0 0,30 1 0,60 2 0,10 Distrib. de X sem reposição Distrib. de X com reposição x p(x) 0 0,36 1 0,48 2 0,16 independência Sortear n = 2 bolas PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. IndependênciaIndependência • Dois eventos são independentes quando a ocorrência de um deles não altera a probabilidade da ocorrência do outro. • Tem-se independência: – em amostragens aleatórias com reposição; – em amostragens aleatórias sem reposição, mas quando a população for muito maior que a amostra (p. ex., N > 20n). PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Experimento binomialExperimento binomial • consiste de n ensaios; • cada ensaio tem somente dois resultados: sim / não; • os ensaios são independentes, com P(sim) = π (0 < π < 1 constante ao longo dos ensaios). X = número de sim nos n ensaios PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distrib. de X x p(x) 0 0,36 1 0,48 2 0,16 binomial com n = 2 e π = 0,40 Ver Tabela 2 (apêndice) Sortear n = 2 bolas com reposição X = número de bolas pretas na amostra Exemplo:Exemplo: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 70% 30% favorável contrário POPULAÇÃO Opinião a respeito do governo AMOSTRA: 10 pessoas observadas ao acaso X = núm. de favoráveis na amostra binomial com n = 10 e π = 0,7 Experimento binomial (Exemplo)Experimento binomial (Exemplo) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Experimento binomial (exemplo)Experimento binomial (exemplo) • Qual a probabilidade de exatamente sete indivíduos da amostra serem favoráveis? • (X é binomial n = 10 π = 0,7) • P(X = 7) = p(7) = 0,2668 n x π = 0,70 10 0 0,0000 1 0,0001 2 0,0014 3 0,0090 4 0,0368 5 0,1029 6 0,2001 7 0,2668 8 0,2335 9 0,1211 10 0,0282 Tabela da binomial PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Experimento binomial (exemplo)Experimento binomial (exemplo) • Qual a probabilidade de a maioria da amostra ser de favoráveis? • (X é binomial n = 10 π = 0,7) • P(X > 5) = = p(6) + p(7) + p(8) + p(9) + p(10) n x 0,70 10 0 0,0000 1 0,0001 2 0,0014 3 0,0090 4 0,0368 5 0,1029 6 0,2001 7 0,2668 8 0,2335 9 0,1211 10 0,0282 Tabela da binomial = 0,8497 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 0 1 2 3 4 5 6 7 8 9 10 0,1 0,2 0,3 x p(x) X > 5 X é binomial com n = 10 π = 0,7 P(X > 5) = 0,8497 (Tabela 2) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Média e variânciaMédia e variância • X: variável aleatória • possíveis valores: X1, X2, ... Xk • probabilidades: p1, p2, ... pk • Média: • Variância: ∑=µ i iipX ( ){ }∑ µ−=σ i i 2 i 2 p X PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Média e variânciaMédia e variância na na distribdistrib. binomial. binomial • X: binomial n, π. Então: – Média: µ = nπ – Variância: σ2 = nπ(1 - π) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais Sexta EdiçãoSexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 8 Cap. 8 –– Distribuições contínuas Distribuições contínuas e modelo normale modelo normal PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Variável aleatóriaVariável aleatória variável aleatória discreta os possíveis resultados estão contidos em um conjunto finito ou enumerável contínua os possíveis resultados abrangem todo um intervalo de números reais 0 1 2 3 4 ... 0 Número de filhos Ex. Ex. Altura de um indivíduo PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo (Exemplo (com variável discreta)com variável discreta) • Um jogo de azar é realizado da seguinte forma: toma-se um círculo e divide-se-o em quatro partes iguais, 1 a 4. Sobre o centro do círculo, é fixado um ponteiro, o qual é girado e anota-se o número do setor onde a ponta do ponteiro parou. 00 43 2 1 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. x p(x) 1 0,25 2 0,25 3 0,25 4 0,25 Total 1 Distribuição de probabilidadesDistribuição de probabilidades 1 2 3 4 0,25 0,25 0,25 0,25 x p(x) 0,25 0 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.1: com variável aleatória Exemplo 8.1: com variável aleatória contínuacontínua • Sobre o centro de um círculo, é fixado um ponteiro, o qual é girado. Anota-se o ângulo formado pelo ponteiro com o eixo horizontal, como na figura a seguir. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.1Exemplo 8.1 • Construir a distribuição de probabilidades para o ângulo (α) obtido neste experimento. α PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. f(x) 0o 360o x Área = 1 1 360 X = variável aleatória que indica o ângulo formado Exemplo 8.1Exemplo 8.1 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.1Exemplo 8.1 • Qual é a probabilidade de se obter um ângulo entre 30o e 60o? PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.1Exemplo 8.1 f(x) 0o 360o x 1 360 = área = 0,0833 P(30o < X < 60o) 30o 60o PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.2Exemplo 8.2 • Selecionar, aleatoriamente, de uma certa universidade, um estudante do sexo masculino. Seja X a sua altura, em centímetros. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.2Exemplo 8.2 130 140 150 160 170 180 190 200 210 x f(x) altura (em cm.) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição normalDistribuição normal µ + σµµ -σ x σ σ f(x) área total = 1 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.2Exemplo 8.2 Representar: • o evento: “o estudante selecionado ter 180 cm ou mais” (X ≥ 180) e • a probabilidade deste evento: P(X ≥ 180) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.2Exemplo 8.2 130 140 150 160 170 180 190 200 210 x f(x) altura (em cm.) X ≥ 180 P(X ≥ 180) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • Identificada pela média (µ) e pelo desvio padrão (σ) . xµ σ Distribuição normalDistribuição normal PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Média e Desvio PadrãoMédia e Desvio Padrão xµ1 Mesmo σ e diferentes µ µ2 (µ2 > µ1) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.Média e Desvio PadrãoMédia e Desvio Padrão µ σ1 σ2 x Mesmo µ e diferentes σ (σ2 > σ 1) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • Simetria em relação à média. xµ 50% Distribuição normalDistribuição normal xµ µ+aµ−a a a Áreas iguais PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • O valor z (valor padronizado) é uma medida relativa. Mede o quanto x se afasta da média (µ), em unidade de desvio padrão (σ). Valor padronizadoValor padronizado σ x - µz = xµ σ x PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.2Exemplo 8.2 • Se a altura de um indivíduo for x = 190 cm, então qual é o escore padronizado z correspondente? 2 10 170190 = − = − = σ µxz PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.2Exemplo 8.2 2 z0 190 µ = 170 σ = 10 x 170 180 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.2Exemplo 8.2 -1 1-3 32-2 z0 160 180140 200190150 µ = 170 σ = 10 x 170 σ PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição normalDistribuição normal µ+σµ-σ µ x z 10-1 área = 68,3% PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição normalDistribuição normal µ+2σµ-2σ µ x z20-2 área = 95,4% PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição normalDistribuição normal µ+3σµ-3σ µ x z30-3 área = 99,7% PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição normal padrãoDistribuição normal padrão P(X > 180) = P(Z > 1) 1 10 170180 = − = − = σ µxz Distribuição de Z: normal padrão Distribuição de X: normal com µ = 170 e σ = 10 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Tabela da distribuição normal padrãoTabela da distribuição normal padrão (área na cauda superior ) 0,4168 0,0 0,1 0,2 ... 9...210z segunda decimal de z (pela tabela) Ex. Qual é a área acima de z = 0,21? PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exercício: uso da tabelaExercício: uso da tabela Com base na tabela da normal padronizada, calcular: a) P(Z > 1) z0 +1 0,1587 (tabela) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExercícioExercício Com base na tabela da normal padronizada, calcular: b) P(Z > 1,23) z0 1,23 0,1093 (tabela) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExercícioExercício c) P(-2 < Z < 2) z0 2-2 0,0228 (tabela) P(-2 < Z < 2) = 1 - 2.(0,0228) = 0,9544 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExercícioExercício • Selecionar, aleatoriamente, de uma certa universidade, um estudante do sexo masculino. Seja X o valor de sua altura, em centímetros. Admitindo que nesta universidade os estudantes têm altura média de 170 cm com desvio padrão de 10 cm, qual a probabilidade do estudante sorteado ter altura superior a 185 cm? PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. RespostaResposta • x = 185 cm (µ = 170, σ = 10) z = ? 5,1 10 170185 = − = σ µ− = xz PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Resposta:Resposta: P(X > 185) = P(Z > 1,5) = z0 1,5 0,0668 (tabela) Então, P(X > 185) = P(Z > 1,5) = 0,0668 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Aproximação da binomial pela normalAproximação da binomial pela normal x0 1 2 3 4 5 6 7 8 9 10 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Aproximação da binomialAproximação da binomial pela normalpela normal • Quando o número de ensaios (n) da binomial é grande, a distribuição binomial pode ser aproximada por uma distribuição normal com: – média – desvio padrão: )1( ππ -nσ = πµ = n PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuições binomiais para diferentes valores de Distribuições binomiais para diferentes valores de nn e e ππ. . 0 0,1 0,2 0,3 0,4 0,5 0 1 2 p(x ) x 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0 1 2 p(x ) x n = 2 π = 0,5 π = 0,2 n = 2 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuições binomiais para diferentes valores de Distribuições binomiais para diferentes valores de nn e e ππ. . n = 10 π = 0,5 π = 0,2 n = 10 0 0,1 0,2 0,3 0 1 2 3 4 5 6 7 8 9 10 p(x ) x 0 0,1 0,2 0,3 0 1 2 3 4 5 6 7 8 9 10 p(x ) x PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuições binomiais para diferentes valores de Distribuições binomiais para diferentes valores de nn e e ππ. . n = 50 π = 0,5 π = 0,2 n = 50 0 0,05 0,1 5 15 25 35 45 p(x ) x 0 0,05 0,1 0,15 0 10 20 30 p(x ) x PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuições binomiais para diferentes valores de Distribuições binomiais para diferentes valores de nn e e ππ. . 0 0,1 0,2 0,3 0,4 0,5 0 1 2 p(x ) x 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0 1 2 p(x ) x 0 0,1 0,2 0,3 0 1 2 3 4 5 6 7 8 9 10 p(x ) x 0 0,1 0,2 0,3 0 1 2 3 4 5 6 7 8 9 10 p(x ) x 0 0,05 0,1 5 15 25 35 45 p(x ) x 0 0,05 0,1 0,15 0 10 20 30 p(x ) x n = 50 n = 10 n = 2 π = 0,2π = 0,5 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Aproximação da binomial pela normalAproximação da binomial pela normal • Em geral, a distribuição binomial pode ser aproximada por uma normal quando: nπ ≥ 5 e n(1-π) ≥ 5 • Nesse caso, )1( ππ -nσ = πµ = n PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Exemplo 8.9Exemplo 8.9 • Seja Y o número de caras em 10 lançamentos de uma moeda perfeitamente equilibrada. – Então, Y é binomial com n = 10 e π = 0,5. • Calcular a probabilidade de ocorrer exatamente 4 caras. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Cálculo pela normal e pela binomialCálculo pela normal e pela binomial 0 0,1 0,2 0 1 2 3 4 5 6 7 8 9 10 f(x ) x P(Y = 4 ) = 0 ,2051 pela b inom ial (Tabela 2 ) P(3,5 < X < 4 ,5 ) = área sob a curva de um a norm al 3 ,5 4 ,5 Exercício: fazer o cálculo pela normal (ver solução no livro) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo • Em dez lançamentos de uma moeda “honesta”, qual é a probabilidade de ocorrer mais de 6 caras? • Pela binomial: • P(Y > 6) = P(7) + P(8) + P(9) + P(10) = 0,117 + 0,044 + 0,010 + 0,001 = 0,172 • E pela normal? PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo 0,001 0,01 0,246 0,01 0,001 0,117 0,0440,044 0,205 0,117 0,205 -1 0 1 2 3 4 5 6 7 8 9 10 11 P(Y > 6) = 0,172 Observe que em termos de área devemos considerar acima de 6,5 (correção de continuidade) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo x0 1 2 3 4 5 6 7 8 9 10 P(X>6,5) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo x5 6,5 P(X>6,5) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo z = x - µ σ 6,5 - 5 1,581139 = = 0,95 µ = 5 σ = 1,581139 x = 6,5 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo z0 0,95 0,1711 Lembrando:a probab. exata (pela binomial) é de 0,1720 POPULAÇÃO: eleitores brasileiros AMOSTRA: uma parte dos eleitores brasileiros amostragem PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • Como generalizar resultados de uma amostra para a população de onde ela foi extraída – estimação de parâmetros (Cap. 9). • Como testar hipóteses com base em amostras – testes de hipóteses (Cap. 10).. inferência Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais Sexta EdiçãoSexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 9 Cap. 9 –– Estimação de Estimação de PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Cap. 9 Cap. 9 –– Estimação de Estimação de parâmetrosparâmetros Estimação de ParâmetrosEstimação de Parâmetros POPULAÇÃO (universo do estudo) Parâmetros: π = ? µ = ? Estimação de parâmetros PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. O raciocínio indutivo da estimação de parâmetros AMOSTRA (dados observados) AMOSTRA POPULAÇÃO ππππ = ? Estimação de ParâmetrosEstimação de Parâmetros PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. X1 X2 X3 ...Observações: p ππππ = p ± erro amostral Estimação de ParâmetrosEstimação de Parâmetros População Amostra σ 2 µ X −−−− PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. π σ 2 S 2 P Parâmetros Estatísticas (estimadores) Amostra −−−− População Estimação de Parâmetros. Objetivo:Estimação de Parâmetros. Objetivo: • Com base em uma amostra, estimar os parâmetros populacionais. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. S2 X −−−− P π = ? σ2 = ? µ = ? Estimação de uma proporção Estimação de uma proporção ππ • Estimador: proporção amostral, P • Relação entre o parâmetro π e a estatística P ���� base para calcular o erro amostral PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • Considerar-se-á que a amostragem será (ou foi) aleatória simples. Relação entre Relação entre ππ e P. Uma ilustraçãoe P. Uma ilustração População 30% contrários Amostra aleatória com n = 400 indivíduos PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 70% favoráveis n = 400 indivíduos Calcula-se P Simulou-se 100 amostras desta forma Histograma dos resultados das 100 amostras Histograma dos resultados das 100 amostras simuladassimuladas 0 5 10 15 20 F re q ü ê n c ia PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Em geral, erro amostral < 0,05 Em geral, o intervalo P ± 0,05 contém π 0 0,64 0,66 0,68 0,7 0,72 0,74 0,76 Valor calculado de P 0,70 0,05 0,05 Estimação de parâmetrosEstimação de parâmetros • Na prática, examinamos apenas uma amostra, resultando em um único valor para a estatística – uma estimativa. Porém, o conhecimento da distribuição amostral da estatística permite avaliarmos um limite superior para o erro amostral (margem de erro), com certo nível de confiança. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. erro), com certo nível de confiança. • A distribuição amostral de uma estatística é a distribuição dos possíveis valores dessa estatística, se examinássemos todas as possíveis amostras de tamanho n, extraídas aleatoriamente de uma população. • Desde que a amostra seja aleatória e razoavelmente grande (n > 30, na maioria dos casos), tem-se: – Os possíveis valores de P seguem uma distribuição (aproximada) normal com média e desvio padrão dados por: Distribuição amostral de uma proporção PDistribuição amostral de uma proporção P PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. n ).(1 = P π−π σ πµ = P Distribuição de PDistribuição de P ≈≈≈≈ 95% ππππ PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ππππ ±±±± 1,96σσσσp ππππ • O desvio padrão da distribuição amostral de uma estatística é comumente chamado de erro padrão da estatística. Erro padrão da proporçãoErro padrão da proporção Na prática, estima-se o erro padrão da proporção por: n )p.(1p = SP − PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. n ( ) 1 1 − − ⋅ −⋅ N nN n PP = S p Se o tamanho da população, N, for conhecido e não muito grande (N < 20n), então estima-se o erro padrão da proporção por: Intervalo de confiança para Intervalo de confiança para ππ, , nível de confiança de 95%:nível de confiança de 95%: P P + (1,96)⋅SP – (1,96)⋅S Intervalo de 95% de confiança para π PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. P P + (1,96)⋅SpP – (1,96)⋅Sp E = margem de erro para 95% de confiança Ver Exemplo 9.1 0 z -z Área = = n íve l de con fiança desejado Intervalo de confiança para Intervalo de confiança para ππ, , nível de confiança de 95%:nível de confiança de 95%: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Área 0,800 0,900 0,950 0,980 0,990 0.995 0,998 z 1,282 1,645 1,960 2,326 2,576 2,807 3,090 0 z -z PSzE ⋅= EP ±Intervalo de confiança para ππππ: Margem de erro: Resultados do Exemplo 9.1:Resultados do Exemplo 9.1: Intervalo de 95% de confiança para π Intervalo de 99% de confiança para π (60,0 ± 6,3%) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 60,0% Intervalo de 95% de confiança para π (60,0 ± 4,8%) 55,2%53,7% 64,8% 66,2% Distribuição da média amostralDistribuição da média amostral População dos salários dos empregados de certo setor da economia (N =1.000) Distribuição de freqüências de médias de amostras de tamanho n = 100 µ=)(XE 1 )( − − = N nN n XDP σ µ=)(XE σ=)(XDP Distribuição da média amostralDistribuição da média amostral Intervalo que abrange, aproximadamente, 95% das médias amostrais de tamanho = 100 da população de N = 1.000 saláriossalários PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estimação de uma média Estimação de uma média µµ • Estimador: média amostral, • Estimativa do erro padrão: n X X ∑ = S =S PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • Se o tamanho da população, N, for conhecido e não muito grande (N < 20n), então estima-se o erro padrão da média por: n =SX 1− − ⋅= N nN n S S X Margem de erro na estimação de uma médiaMargem de erro na estimação de uma média • Se a amostra for grande (n > 30): � onde z vem da distribuição normal padrão • Se a amostra for pequena (n < 30): X SzE ⋅= StE ⋅= PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • Se a amostra for pequena (n < 30): � onde t vem da distribuição t com gl = n – 1 NOTA: Para n > 30, t ≅ z, assim, pode-se sempre usar t. X StE ⋅= A distribuição A distribuição tt de Studentde Student t com gl = ∞ (normal padrão) t com gl = 3 f(x) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. t com gl = 1 x0 A distribuição A distribuição t t dede StudentStudent Como usar a Tabela Como usar a Tabela tt (Tabela 5 do Apêndice)(Tabela 5 do Apêndice) • Ilustração com gl = 9 e nível de confiança de 95%. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo • Encontrar o valor de t para: a) nível de confiança de 99%, com 19 graus de liberdade (amostra com 20 elementos) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Resp. t = 2,861Ver exemplos 9.2 e 9.3 Exemplo 9.3Exemplo 9.3 • Para verificar a eficácia de um programa de prevenção de acidentes de trabalho, foi realizado um estudo experimental, implementando esse programa em dez empresas da construção civil, escolhidas ao acaso, numa certa região. Os dados abaixo se referem aos percentuais de redução de acidentes de trabalho, nas dez empresas observadas. • Estimar o parâmetro: µ = média da redução percentual de acidentes de trabalho, em todas as empresas da construção civil da região, que venham a trabalho, em todas as empresas da construção civil da região, que venham a serem submetidas ao programa preventivo. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostra Estatísticas 20 15 23 11 29 5 20 22 18 17 Média: X = 18 Desvio padrão: S = 6,65 Tamanho de AmostrasTamanho de Amostras • No planejamento de uma pesquisa, uma pergunta natural é: – Qual é o tamanho da amostra necessário? (n = ?) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. • No que segue, considerar-se-á que a amostragem será aleatória simples. Tamanho de amostraTamanho de amostra • No caso de estimação de µ, podemos exigir erro amostral menor que um dado E0, isto é: 0EX ≤− µ PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. 0E n z ≤ σ E z n 0 2 22 σ ≥ ou: ou: Tamanho de amostraTamanho de amostra • No caso de estimação de π: 4 1 )1.(2 ≤−= ππσ σσσσ 2 = ππππ(1-ππππ ) 1 ⁄4 Assim: PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ππππ 0 1 ⁄2 1 E ππz n 0 2 2 )1( − ≥ Ver discussão no livro. E z n 4 0 2 2 = Então, tomamos: RESUMO: tamanho mínimo de uma amostra aleatória RESUMO: tamanho mínimo de uma amostra aleatória simplessimples Parâmetro de interesse Valor inicial do tamanho da amostra uma média (µµµµ): uma proporção (ππππ): E z = n 0 2 22 0 σ ( ) E z = n 0 2 2 0 1 ππ − z2 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. várias proporções (ππππ 1, ππππ 2, ...): Tamanho da amostra População muito grande (N >20n): População de tamanho N: E0 E z = n 4 0 2 2 0 0nn = nN + nN. n = 0 0 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais Sexta EdiçãoSexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 10 Cap. 10 –– Testes estatísticos de Testes estatísticos de hipóteseshipóteses PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Teste de hipótesesTeste de hipóteses População / Universo de estudo Hipóteses que se quer colocar à prova Amostra Dados que servirão de base para aceitar ou rejeitar uma hipótese Amostragem Decisão do teste estatístico PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Problema e hipóteses Problema e hipóteses –– um exemploum exemplo • Problema: Na região em estudo, a propensão de fumar nos homens é diferente do que das mulheres? • Hipótese nula, H0: A proporção de homens fumantes é igual à proporção de mulheres fumantes, na população em estudo. • Hipótese alternativa, H1: A proporção de homens fumantes é diferente da proporção de mulheres fumantes, na população em estudo. Discutir os conceitos PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. ExemploExemplo • Suspeita-se que uma moeda não seja perfeitamente equilibrada (probab. de cara ≠ probab. de coroa ≠ 0,5). • Parâmetro: π = probab. de cara H0: π = 0,5 H1: π ≠ 0,5 PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Amostragem para o exemplo da moedaAmostragem para o exemplo da moeda • Amostragem: n = 10 lançamentos da moeda. • Estatística do teste: Y = número total de caras nos n = 10 lançamentos. • Amostra (após realizado os 10 lançamentos): 7 caras (3 coroas) • Qual deve ser a decisão do teste? (Aceita H0 ou rejeita H0 em favor de H1?) PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de referênciaDistribuição de referência • O que pode ocorrer na amostra de n = 10 lançamentos, se H0 for verdadeira (moeda honesta)? – Y tem distribuição binomial com n = 10 e π = 0,5. • A idéia é comparar o resultado observado (7 caras) com essa distribuição de referência. – Se o resultado for muito “estranho” para essa distribuição, o teste rejeita H0. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Distribuição de referênciaDistribuição de referência • Distribuição da estatística Y = número de caras em 10 lançamentos da moeda, sob H0 (binomial com n = 10 e π = 0,5) 0 1 2 3 4 5 6 7 8 9 1 0 0 ,0 0 1 0 ,0 1 0 0 ,1 1 7 0 ,2 0 5 0 ,0 4 4 0 ,2 4 6 0 ,2 0 5 0 ,1 1 7 0 ,0 4 4 0 ,0 1 0 0 ,0 0 1 y p (y ) µ PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Valor pValor p • O valor p aponta o quão estranho foi o resultado da amostra (no exemplo, 7 caras), se supusermos H0 a hipótese verdadeira (moeda honesta). • O valor p é calculado com base na distribuição de referência. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Valor pValor p 0 1 2 3 4 5 6 7 8 9 1 0 0 ,0 0 1 0 ,0 1 0 0 ,1 1 7 0 ,2 0 5 0 ,0 4 4 0 ,2 4 6 0 ,2 0 5 0 ,1 1 7 0 ,0 4 4 0 ,0 1 0 0 ,0 0 1 y p (y ) µ p = p(0) + p(1) + p(2) + p(3) + p(7) + p(8) + p(9) + p(10) = = 0,001 + 0,010 + 0,044 + 0,117 + 0,117 + 0,044 + 0,010 + 0,001 = = 0,344 (ou, 34,4%) Valor p: O teste deve rejeitar H0? PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Nível de significância do teste (Nível de significância do teste (αα )) • É a probabilidade de o teste rejeitar H0, quando H0 for verdadeira (uma decisão errada!). • É comum usar α = 0,05 (α é arbitrado pelo pesquisador). PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Regra de decisão baseada no Regra de decisão baseada no valor pvalor p p ≤ α rejeita H0 (prova-se H1) (os dados mostram evidência que ...) p > α aceita H0 (não se prova H1) (os dados não mostram evidência que ...) Discutir sobre a probabilidade de erro em cada uma dessas decisões. PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Realidade Ho verdadeira Ho falsa Tipos de erros num teste estatísticoTipos de erros num teste estatístico PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Realidade Ho verdadeira Ho falsa Aceitar Ho Rejeitar Ho D e c i s ã o Tipos de erros num teste estatísticoTipos de erros num teste estatístico PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Realidade Ho verdadeira Ho falsa Aceitar Ho Rejeitar Ho D e c i s ã o O K O K Tipos de erros num teste estatísticoTipos de erros num teste estatístico PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Realidade Ho verdadeira Ho falsa Aceitar Ho Rejeitar Ho D e c i s ã o O K E r r o T i p o I (α ) O K Tipos de erros num teste estatísticoTipos de erros num teste estatístico PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Realidade Ho verdadeira Ho falsa Aceitar Ho Rejeitar Ho D e c i s ã o O K E r r o T i p o I (α ) O K E r r o T i p o II ( )β Tipos de erros num teste estatísticoTipos de erros num teste estatístico PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006. Testes
Compartilhar