Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE DO ESTADO DO AMAZONAS ANÁLISE E PESQUISA QUANTITATIVA MYRIAN ABECASSIS FABER ROSANA DE CASTRO ALBUQUERQUE 1 Myrian Abecassis Faber; Rosana de Castro Albuquerque P L A N O D E C U R S O MÓDULO DISCIPLINA: PESQUISA EM PRÁTICA(ANÁLISE QUANTITATIVA) PROFESSORES: MYRIAN ABECASSIS FABER, ROSANA DE CASTRO ALBUQUERQUE PERÍODO: 13 A 28 DE ABRIL CARGA HORÁRIA: 45 HORAS EMENTA Os delineamentos da pesquisa. Os tipos de amostra. Instrumentos estruturados de coleta de dados. A escolha, aplicação e interpretação de diferentes procedimentos estatísticos, bem como o processamento dos dados em programas computacionais específicos. Discussão de informações obtidas estatisticamente na área de Educação Física. OBJETIVOS GERAL Objetivo Geral: Proporcionar aos acadêmicos a vivência das etapas de uma pesquisa na área da Educação Física, conhecendo os delineamentos das pesquisas, os diferentes instrumentos de coleta de dados e os diferentes procedimentos estatísticos aplicados aos resultados. Objetivos Específicos: Conhecer as etapas na condução da pesquisa em Educação Física. Identificar os tipos de amostragens usadas em análise quantitativa. Demonstrar medidas precisas e confiáveis que permitam uma análise estatística. Iinterpretar diferentes procedimentos estatísticos CONTEÚDO 1) CONCEITOS BÁSICOS Introdução à estatística Conceitos fundamentais • População e amostra • Processos estatísticos de abordagem • Dados estatísticos • Estatística descritiva 2) SÉRIES ESTATÍSTICAS • Apresentação de dados estatísticos • Distribuição de frequência – variável discreta • Distribuição de frequência – variável contínua • Construção da variável discreta • Construção da variável contínua • Distribuição das 2 Myrian Abecassis Faber; Rosana de Castro Albuquerque frequências – variável discreta e contínua • Representação gráfica de séries estatísticas 3) MEDIDAS DE TENDÊNCIA EVENTUAL • Médias • Média aritmética simples e ponderada • Mediana • Moda 4) MEDIDAS DE DISPERSÃO • Desvio médio simples – cálculo • Variância e desvio padrão – cálculo • Interpretação do desvio padrão 5) PROBABILIDADES • Conceitos básicos • Experimento aleatório • Espaço amostral • Evento • Avaliação • Regras do cálculo de probabilidades • Exemplos de aplicação das regras METODOLOGIA Estudo, análise e discussão sobre a abordagem quantitativa, articulando-a com aplicabilidade na área da Educação Física Escolar. O curso irá privilegiar exercícios de elaboração e aplicação de instrumentos estruturados de coleta de dados Serão utilizados recursos variados, de acordo com os conteúdos trabalhados e as possibilidades existentes. AVALIAÇÃO No entendimento que a avaliação é etapa fundamental do processo ensino-aprendizagem se pretende que seja realizada no decorrer dos módulos, combinando momentos de expressão individual e grupal. As avaliações individuais e de grupo serão realizadas ao longo do período, por meio de trabalhos escritos, à luz dos seguintes critérios: - Consistência e coerência teórica metodológica; - Pertinência das aplicações e contribuições dos resultados dos dados; -Apresentação de gráficos e explicação de tabelas; - Apresentação de resultados contextualizados com a Educação Física Escolar; BIBLIOGRAFIA 3 Myrian Abecassis Faber; Rosana de Castro Albuquerque ANDERSON et al. (2007) Estatística Aplicada à Administração e Economia. 2a ed. São Paulo: Cengage Learning. ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. ABNT NBR 14724:2005. Informação e documentação. Trabalhos acadêmicos. Apresentação. Rio de Janeiro: ABNT, 2005. CORREA, Sonia Maria Barros Barbosa ( 2003) Probabilidade e estatística. 2ª ed. - Belo Horizonte: PUC Minas Virtual CRESPO, A. A. (2009) Estatística Fácil. 19a ed. São Paulo: Saraiva. MAGALHÃES, M. N. & LIMA, A. C. P. (2009) Noções de Probabilidade e Estatística. 7a ed. São Paulo: Edusp. MARTINS, Gilberto de Andrade & DOMINGUES, Osmar. (2011) Estatística Geral e Aplicada. 4a ed. São Paulo: Atlas. MEDEIROS, Valeria Zuma (2008). MÉTODOS QUANTITATIVOS COM EXCEL Cengage Learning https://www.google.com.br/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF- 8#q=metodos+quantitativos+exercicios+resolvidos&revid=835221597 http://www.bertolo.pro.br/FinEst/Estatistica/DistribuicaoProbabilidades/binomial.htm 4 Myrian Abecassis Faber; Rosana de Castro Albuquerque SUMÁRIO Sumário Pesquisa Quantitativa....................................................................................................................5 Metodologia da Pesquisa. ......................................................................................................... 7 Comparação de Procedimentos em métodos ...................................................................... 7 Técnicas de coleta de dados ......................................................................................................... 8 Elementos de comparação entre os métodos .......................................................................... 8 Finalidade da Estatística ........................................................................................................ 9 Delineamento da Amostra..........................................................................................................10 Tamanho da Amostra.....................................................................................................11 Amostragem Estratificada..............................................................................................12 Dimensão da Amostra....................................................................................................13 Métodos de Coleta de dados......................................................................................................14 Variáveis.........................................................................................................................15 Planejamento dos Questionários...................................................................................15 Amostragem...................................................................................................................18 Variância.........................................................................................................................20 Desvio-Padrão.............................................................................................................................23 Dispersão relativa e Coeficiente de variação..............................................................................24 Média Amostral, Experimento....................................................................................................25 Teoria dos Conjuntos..................................................................................................................27 Distribuição Normal....................................................................................................................30 Métodos Contínuos de Probabilidade? Variável aleatória contínua..............................34 Propriedades dos modelos contínuos............................................................................34 Probabilidades...............................................................................................................34 Intervalo de Confiança...................................................................................................36 Estimativas: Erro de estimativa......................................................................................37 Estimativas de proporções.............................................................................................39Distribuição de Frequência..........................................................................................................43 Mediana, Moda...........................................................................................................................46 Exercícios Resolvidos de Distribuição..........................................................................................48 Distribuição Normal no Excell.....................................................................................................48 5 Myrian Abecassis Faber; Rosana de Castro Albuquerque 1. PESQUISA QUANTITATIVA Pesquisa Quantitativa é um estudo estatístico que se destina a descrever as características de uma determinada situação, medindo numericamente as hipóteses levantadas a respeito de um problema de pesquisa. • As informações colhidas nesta metodologia de pesquisa se dão por meio de um questionário estruturado com perguntas claras e objetivas. Isto garante a uniformidade de entendimento dos entrevistados. É especialmente projetada para gerar medidas precisas e confiáveis que permitam uma análise estatística. • As questões devem ser diretas e facilmente quantificáveis e a amostra deve ser grande o suficiente para possibilitar uma análise estatística confiável. • Na pesquisa quantitativa, os resultados podem ser quantificados e como as amostras geralmente são grandes e consideradas representativas da população, os resultados são tomados como se constituíssem um retrato real de toda a população alvo da pesquisa. A pesquisa quantitativa se centra na objetividade. Influenciada pelo positivismo, considera que a realidade só pode ser compreendida com base na análise de dados brutos, recolhidos com o auxílio de instrumentos padronizados e neutros. A pesquisa quantitativa recorre à linguagem matemática para descrever as causas de um fenômeno, as relações entre variáveis, etc. A utilização conjunta da pesquisa qualitativa e quantitativa permite recolher mais informações do que se poderia conseguir isoladamente. A análise de dados quantitativos e dos cruzamentos entre as diversas informações coletadas vão produzir algo Qualitativo. Os quadros 1 e 2 a seguir, apresentam os principais aspectos da pesquisa qualitativa e da pesquisa quantitativa. 6 Myrian Abecassis Faber; Rosana de Castro Albuquerque 7 Myrian Abecassis Faber; Rosana de Castro Albuquerque 8 Myrian Abecassis Faber; Rosana de Castro Albuquerque Finalidade da Estatística ▪ a) Desenvolver métodos e técnicas p/ coleta, organização, análise e interpretação de dados; b) Fornecer métodos para inferir conclusões sobre um universo maior a partir das observações de um fenômeno particular. c) Para inferir conclusões – devem-se fazer observações repetidas sobre um dado fenômeno, mantendo-se as mesmas condições. d) Grau de Incerteza - Como não é possível controlar todos os fatores que influem a observação de um fenômeno estatístico há sempre um grau de incerteza na avaliação dos resultados. • Teoria da Probabilidade – Estatística é uma teoria sobre a incerteza. Por isso se baseia inteiramente na Teoria da Probabilidade (de ocorrência de um fenômeno). • Probabilidade Estatística – são afirmações sobre a possibilidade ou a probabilidade de ocorrência de um fenômeno, desde que satisfeitas um conjunto de condições teóricas. • Fenômenos aleatórios – são o objeto de estudo da estatística, e se referem a todos os fenômenos observáveis na natureza. ESTATÍSTICA DESCRITIVA-DEDUTIVA: descreve e analisa os dados observados, não pretende tirar conclusões de caráter mais genérico Exemplo: Se os testes feitos em seis carros pequenos, importados em 2006, mostraram que eles podem acelerar de 0 a 60 milhas por hora (mph) em: {18,7 19,2 16,2 12,3 17,5 13,9} segundos, e afirmamos que metade deles acelera de 0 a 60 mph em menos de 17,0 segundos, nosso trabalho pertence ao domínio da estatística descritiva. Este seria também o caso se afirmássemos que esses carros aceleram em média 16,3 segundos a partir do cálculo da aceleração de cada um dos seis carros: Assim, concluímos que todos os carros importados naquele ano poderiam acelerar de 0 a 60 mph em menos de 17,0 segundos. ESTATÍSTICA INDUTIVA/INFERÊNCIA: Obtém e generaliza conclusões para a população a partir de uma amostra, através do cálculo da probabilidade. (Inferência estatística). É a parte da estatística que, baseando-se em resultados obtidos na análise de uma amostra, procura inferir, induzir ou tirar conclusões para o comportamento da população, fundamentando-se na teoria das probabilidades. Tal método torna-se necessários, por exemplo, para prever a duração média da vida útil de uma lâmpada (com base no desempenho de muitas dessas lâmpadas); comparar a eficiência de duas dietas para reduzir o peso (com base nas perdas de pesos de pessoas que se submeteram às dietas); determinar a dosagem ideal de um novo medicamento (com base em testes 9 Myrian Abecassis Faber; Rosana de Castro Albuquerque feitos em pacientes voluntários de hospitais selecionados aleatoriamente); ou prever o fluxo de tráfego em uma rodovia ainda em construção (com base no tráfego observado em rodovias alternativas). ESTATÍSTICA DESCRITIVA - permite a) A obtenção dos dados estatísticos. b) A organização dos dados. c) A redução dos dados d) A representação dos dados. e) A obtenção de algumas informações que auxiliam a descrição do fenômeno observado. ESTATÍSTICA DESCRITIVA oportuniza a) A obtenção ou coleta dos dados: Questionário ou observação de dados de uma população ou amostra. b) A organização dos dados: ordenação e crítica quanto à correção dos valores, falhas humanas, omissões, abandono de dados duvidosos… c) A redução dos dados: entender e compreender grande quantidade de dados por uma simples leitura de seus valores (Variável discreta e continua) d) A representação dos dados: representação gráfica permite a visualização instantânea de todos os dados. e) Informações que auxiliam a descrição do fenômeno: Médias, proporções, dispersões, tendências, índices, taxas, coeficientes. A META DE TODO ESTUDO ESTATÍSTICO É COLETAR DADOS E ENTÃO USÁ-LOS PARA UMA TOMADA DE DECISÃO. PARA ISSO É IMPORTANTE UM BOM PLANEJAMENTO, OU SEJA: Identificar a variável de interesse e a população que forem objetos de estudo. Desenvolver um plano para a coleta de dados. Se for usar uma amostra, assegure-se de que ela é representativa da população. Coletar os dados. Descrever os dados fazendo o uso das técnicas da estatística descritiva. Interpretar os dados e tomar decisões acerca da população usando a inferência estatística. Identificar todos os possíveis erros. COLETA DE DADOS 10 Myrian Abecassis Faber; Rosana de Castro Albuquerque Há várias maneiras de coletar dados. Apresentaremos aqui um resumo de 4 métodos: Censo, Amostra, Simulação e Experimento. Censo: Um censo é a contagem de toda uma população. Fornece informações completas, mas é difícil de ser realizado. Amostra: É uma contagem ou medição de parte de uma população. O uso da amostra é mais prático do que a realização de um censo. Simulação: É o uso de um modelo matemático ou físico para reproduzir as condições de uma situação ou de um processo. Permite estudar situações que seria pouco prático ou perigoso. Por exemplo: fabricantes de automóveis usam simulações com bonecos para estudar os efeitos que as colisões têm em seres humanos. Experimento: É aplicado um tratamento a uma parte da população e observadas as respostas. DELINEAMENTO DA AMOSTRA: O que é Amostra? A amostraé uma parcela conveniente selecionada do universo (população); é um subconjunto do universo. É um conjunto constituído de indivíduos (famílias ou outras organizações), acontecimentos ou outros objetos de estudo que o investigador pretende descrever ou para os quais pretende generalizar as suas conclusões ou resultados. Como se dimensiona uma Amostra? A dimensão da amostra é significativamente inferior à dimensão da população, de forma a justificar a constituição da amostra. Amostras com pequeno número de observações são menos representativas da população do que amostras com maiores observações. Os Motivos para se trabalhar com uma amostra: • A população é infinita, ou considerada como tal, não podendo, portanto ser analisada na íntegra; • Custo excessivo do processo de recolha e tratamento dos dados, como resultado da grande dimensão da população ou da complexidade do processo de caracterização de todos os elementos da população; 11 Myrian Abecassis Faber; Rosana de Castro Albuquerque • Tempo excessivo do processo de recolha e tratamento dos dados, conduzindo à obtenção de informação desatualizada; • As populações são dinâmicas, de onde resulta que os elementos ou objetos da população estão em constante renovação, de onde resulta a impossibilidade de analisar todos os elementos desta população; • Recolha de informação através de processos destrutivos (que, se aplicada exaustivamente, conduziria à completa destruição da população); • Inacessibilidade a alguns elementos da população, por diversas causas. • Se a constituição da amostra obedecer a determinadas condições, a análise das características da amostra pode servir para se fazerem inferências sobre a população. O Tamanho da Amostra Depende da margem de erro exigida, da confiança que se quer ter no resultado final. Algumas fontes potenciais de erro são: Amostragem: é uma técnica de seleção de uma amostra que possibilita o estudo das características de uma população. Erro Amostral: é o erro que ocorre na utilização de uma amostra. Existem dois métodos para composição de uma amostra: probabilístico e não probabilístico. Métodos Probabilísticos: Cada elemento da população tem a mesma chance de ser selecionado. Trata-se do método que garante cientificamente a aplicação de técnicas estatísticas. Somente com base em amostragens probabilísticas é que se podem realizar inferências ou induções sobre a população a partir do conhecimento de uma amostra. Existem alguns tipos de amostragens probabilísticas que garantem a imparcialidade acima discutida: Amostragem Aleatória Simples: todos os elementos da população têm a mesma chance de serem selecionados. Atribui-se a cada elemento da população um número distinto. Efetuam-se sucessivos sorteios até completar o tamanho da amostra n. Para realizar o sorteio, utilizar a tábua de números aleatórios (anexo) que consistem em tabelas que apresentam dígitos de 0 à 9 distribuídos aleatoriamente. 1. Se estivermos interessados na altura dos alunos basta numerar a sala, sortear e anotar as estaturas dos alunos sorteados. Exemplo: 12 Myrian Abecassis Faber; Rosana de Castro Albuquerque Número sorteado Aluno Estatura 16 Antonio Rezende 140 09 Flavio Teixeira 167 13 Humberto Rodrigues 150 Amostragem Sistemática: Conveniente quando a população está ordenada segundo algum critério como fichas, lista telefônica. Exemplo 1: Em uma produção diária de peças automotivas, podemos, a cada 20 peças produzidas, retirar uma para pertencer a uma amostra da produção de um dia. Exemplo 2: Se N = 5.000 é o tamanho da população e precisamos de uma amostra de n = 250, dividimos N/n = 20. Selecionamos ao acaso um número de 1 à 20. Suponha que saiu o número 7: 1. 1a unidade a ser selecionada 7a 2. 2a unidade a ser selecionada 20 + 7 = 27a 3. 3a unidade a ser selecionada 27 + 20 = 47a 4. 67a, 87a,..., 4987a dando um total de 250 unidades. Amostragem Estratificada: No caso da população em que se podem distinguir subpopulações mais ou menos homogêneas denominadas estratos. Após a determinação dos estratos, seleciona-se uma amostra aleatória simples de cada estrato. As varáveis de estratificação mais comuns são: classe social, idade, sexo, profissão. Amostragem Estratificada Proporcional: A proporcionalidade do tamanho de cada estrato da população é mantida na amostra. Exemplo: Se um estrato abrange 20% da população, ele também deve abranger 20% da amostra. Amostragem Estratificada Uniforme: Selecionamos o mesmo número de elementos em cada estrato. É o processo usual quando se deseja comparar os diversos extratos. 13 Myrian Abecassis Faber; Rosana de Castro Albuquerque Exemplo: Número de pessoas que vivem nos domicílios de Ribeirão Preto. Dividir os domicílios em níveis socioeconômicos e depois selecionar domicílios em cada nível aleatoriamente (Renda baixa, média, alta). Amostragem por conglomerados: Há subdivisão da área a ser pesquisada por bairros, quarteirões, domicílios, famílias que serão sorteados para composição dos elementos da amostra e a pesquisa será realizada de forma sistemática ou simples. Métodos Não - Probabilísticos: São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados da pesquisa para a população, pois as amostras não probabilísticas não garantem a representatividade da população. Amostragem Acidental: Os entrevistados são acidentalmente escolhidos. Exemplo: Parar pessoas no supermercado e colher opiniões; Programa de TV ao vivo, registrando automaticamente opiniões contra ou favor de uma situação. Amostragem Intencional: O investigador se dirige intencionalmente a um grupo de elementos dos quais deseja saber opinião. Exemplo: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um salão de beleza e entrevista as pessoas que ali se encontram. Amostragem por Quotas: Amplamente utilizada em pesquisa de mercado e em pesquisa de opinião política em que tempo e dinheiro são escassos. Exemplo: Admita-se que se deseja pesquisar o “trabalho das mulheres”. A primeira tarefa é descobrir uma proporção de características na população. Imagine que haja 47% de homens e 53% de mulheres na população. Logo uma amostra de 50 pessoas deverá ter 23 homens e 27 mulheres. Então o pesquisador receberá uma quota para entrevistar 27 mulheres. A dimensão da Amostra: Está sujeita à margem de erro, ao nível de confiança que se deseja encontrar no resultado final. Certas fontes possíveis de erro são: 14 Myrian Abecassis Faber; Rosana de Castro Albuquerque 1. Erro de amostragem: Esse erro diminui quando o tamanho da amostra aumenta. 2. Erro de Resposta: Diferença entre a resposta verdadeira e a resposta dada. 3. Erro de falta de resposta: Entrevistados recusam a responder. 4. Erro de delineamento: Maneira de selecionar a amostra à torna não representativa da população. MÉTODO DE COLETA DE DADOS: Dados Secundários: Estatísticas Oficiais( dados coletados e compilados por órgão do governo) e Estatísticas Não-Oficiais( Organizações semi-governamentais e privada que ocupam espaço no mercado de informação). Dados Primários: Observação ( Ex: Sexo de um consumidor de uma loja, quadros que atraem mais atenção em um museu), Experimentação (Ex: Registrar a qualidade dos itens produzidos em determinado dia por uma máquina) e questionários. Existem vários métodos para fazer um questionário tais como entrevistas feitas pessoalmente, por telefone, por correio, ou pelo método de autopreenchimento ou por combinação destes. São fatores determinantes da escolha: Custo: Correio e telefonesão mais baratos que entrevista Rapidez: Telefonemas são mais rápidos Ajuda: É mais fácil ajudar para responder às questões em entrevistas feitas pessoalmente e pelo método de auto preenchimento. Corroboração e Assistência: Não são possíveis por carta ou telefone; nas entrevistas feitas pessoalmente é possível dar assistência física – por exemplo, que cor de brinquedo você prefere (mostrar três tipos de brinquedo). Entrevistas feitas pessoalmente também permitem corroboração; por exemplo, dão ideia sobre renda e estilo de vida. 15 Myrian Abecassis Faber; Rosana de Castro Albuquerque VARIÁVEIS PLANEJAMENTO DO QUESTIONÁRIO: 1. Pesquisa-piloto 2. Questões podem ser abertas ou fechadas, depende da proposta de estudo Diretrizes: Escreva uma carta explicativa para acompanhar o questionário (ou fale pessoalmente), expondo de forma clara e breve por que e para quem a pesquisa está sendo conduzida, mostre a importância, garanta a confidencialidade. O objetivo é diminuir a falta de resposta. Questionários longos correm risco de alta falta de resposta. USO DE COMPUTADORES E ANÁLISE EXPLORATÓRIA: Os dados depois de coletados são codificados e digitados em computador. Essa padronização e codificação das respostas de uma pesquisa chamam-se tabulação. É a maneira ordenada de dispor os resultados numéricos para que a leitura e análise sejam facilitadas. A análise exploratória expõe a análise descritiva dos dados tais como gráficos, medidas centrais e de variabilidade e probabilidades. APRESENTAÇÃO: Ao final fazer um relatório declarando: Objetivos e Propostas Configuração da População Delineamento da amostra e tamanho da amostra Método de coleta de dados Questionário Análise descritiva dos dados junto com uma breve conclusão de cada gráfico ou cada medida 16 Myrian Abecassis Faber; Rosana de Castro Albuquerque Conclusões gerais Tarefa 1: Introdução 1. Defina Estatística. 2. Defina população e amostra. 3. Diferencie Estatística Indutiva de Estatística Descritiva. 4. Conforme visto em Estatística Descritiva, escreva três medidas de tendência central. 5. Conforme visto em Estatística Descritiva, escreva três medidas de dispersão. 6. Exercícios 1) Assinale as alternativas que traduzem a Meta de Todo Estudo Estatístico a) É coletar dados e então usá-los para uma tomada de decisão. b) É importante um bom planejamento, ou seja: c) Identificar a variável de interesse e a população que forem objetos de estudo; d) Desenvolver um plano para a coleta de dados. e) Se for usar uma amostra, assegure-se de que ela é representativa da população; f) Coletar os dados. g) Descrever os dados fazendo o uso das técnicas da estatística descritiva. h) Interpretar os dados e tomar decisões acerca da população usando a inferência estatística. i) Identificar todos os possíveis erros. 2) Se N = 2.500 é o tamanho da população atletas a competir em um torneio e precisamos de uma amostra de n = 250, dividimos N/n = ?. Selecionamos ao acaso um número de 1 a 20. Suponha que saiu o número 10: a. N/n = b. 1a unidade a ser selecionada .................. c. 2a unidade a ser selecionada é............................... d. 3a unidade a ser selecionada é........................ e. 10 a unidade a ser selecionada é................................... f. 20 a unidade a ser selecionada é.................................. 3) No último Congresso Mundial de Educação Física, vários minicursos de capacitação foram ministrados. O número de profissionais inscritos nos Cursos foi: 226 em Ginástica de Academia, 215 em Hidroginástica e 159 em Esportes 17 Myrian Abecassis Faber; Rosana de Castro Albuquerque da Natureza. Obtenha uma amostra proporcional estratificada de 80 profissionais da Educação Física. Cursos Profissionais % Amostra Ginástica de Academia 226 Hidroginástica 215 Esportes da Natureza 159 Total 600 4) O Curso de Educação Física apresenta a seguinte distribuição de acadêmicos para os municípios Apuí, Borba, Coari, Fonte Boa, Beruri, Humaitá, Itacoatiara, Itapiranga, Manacapuru, Novo Airão, Novo Aripuanã, P. Figueiredo, S. G. Cachoeira, S. P. de Olivença, Tabatinga e Tonantins. Obtenha uma amostra proporcional estratificada para 20% do Curso. Municípios Acadêmicos Amostra Masculino Feminino %M % F M F 1 Borba 11 17 2 Coari 15 14 3 Apuí 9 19 4 Fonte Boa 10 17 5 Beruri 16 17 6 Humaitá 17 15 7 Itacoatiara 14 16 8 Itapiranga 15 14 9 Manacapuru 8 21 10 Novo Airão 11 21 11 Novo Aripuanã 16 14 12 P. Figueiredo 9 20 13 S. G. Cachoeira 16 15 14 S. P. de Olivença 18 14 15 Tabatinga 20 9 16 Tonantins 16 14 Total 5) Em Manaus, o Curso de Educação Física apresenta a seguinte distribuição de acadêmicos. Obtenha uma amostra proporcional estratificada de 12 estudantes acadêmicos Manaus Acadêmicos % Amostra Masculino 21 Feminino 14 Total 35 18 Myrian Abecassis Faber; Rosana de Castro Albuquerque Tarefa 2: Amostragem 1. Defina Amostragem. 2. Quais são os tipos de amostragens probabilísticas? 3. Por que a amostra deve ser representativa da população? 4. Calcule a média e o desvio padrão da amostra: 12, 15, 16, 18, 20, 22, 24, 25. 5. Uma amostra apresentou a seguinte distribuição de frequências: Classes Frequências 2 --- 6 7 6 ---10 5 10 --- 14 10 14 --- 18 8 18 --- 22 4 22 --- 26 6 Calcule a média e a variância Amostragem O que é amostragem? É um conjunto de procedimentos através dos quais se seleciona uma amostra de uma população. As técnicas de amostragem podem ser divididas em vários tipos: a) Amostragem probabilística - procedimento em que todos os elementos da população têm uma probabilidade conhecida e superior a zero de integrar a amostra; b) Amostragem não probabilística: c) Amostragem não probabilística: 19 Myrian Abecassis Faber; Rosana de Castro Albuquerque Este tipo de Amostragem intencional é uma amostragem não probabilística subordinada a objetivos específicos do investigador. Já a Amostragem não intencional é a amostragem não probabilística regida por critérios de conveniência e/ou de disponibilidade dos inquiridos. Métodos de elaboração de uma amostra mais utilizados a) Amostragem aleatória – todos os indivíduos da população têm uma mesma probabilidade de serem selecionados. b) Amostragem estratificada – selecionam-se aleatoriamente os grupos em vez dos indivíduos. c) Amostragem sistemática – a seleção é feita por uma regra ou um teste padrão aplicado à população. d) A Amostragem Estratificada Uniforme Seleciona-se o mesmo número de elementos em cada estrato. É o processo usual quando se deseja comparar os diversos extratos. A amostragem estratificada uniforme será recomendável se os estratos da população forem pelo menos aproximadamente do mesmo tamanho. Caso em contrario será preferível à estratificação proporcional pelo fato de fornecer uma amostra mais representativa da população. Exemplo de Amostragem Estratificada Uniforme Número de pessoas que vivem nos domicílios de Ribeirão Preto. Dividir os domicílios em níveis socioeconômicos e depois selecionar domicílios em cada nível aleatoriamente (Renda baixa, média, alta). Amostragem por conglomerados Conglomerados são unidades de amostragem que contém vários elementos. Há subdivisão da área a serem pesquisada por bairros, quarteirões, domicílios, famílias que serão sorteados para composição dos elementos da amostrae a pesquisa serão realizados de forma sistemática ou simples. Amostragem por conglomerados 20 Myrian Abecassis Faber; Rosana de Castro Albuquerque N = número total potencial de conglomerados na população; M = número de subunidades do conglomerado; n = número de conglomerados amostrados; Xij = variável de interesse. Média da população por subunidade Fórmula para encontrar a média das subunidades por conglomerado VARIÂNCIA Variância de uma variável aleatória é a medida de dispersão em torno dos possíveis valores dessa variável aleatória. O conceito de variância também pode ser usado para descrever um conjunto de observações. Estudaremos a • s2: variância amostral. • σ2: variância populacional. Variância amostral A variância de uma amostra {x1,...,xn} de n elementos é definida como a soma ao quadrado dos desvios dos elementos em relação à sua média dividido por (n-1). Ou seja, a variância amostral é dada por: O que a medida faz é simplesmente elevar ao quadrado o valor de cada desvio em relação à média e depois somar todos os resultados (numerador da fórmula). Por fim, o valor da soma é dividido por N-1, que corresponde ao número total de escores menos 1 S= símbolo usado para a variância. =Desvio padrão N= número de observações i= 1 21 Myrian Abecassis Faber; Rosana de Castro Albuquerque Variância populacional A variância de uma população {x1,...,xN} de N elementos é a medida de dispersão definida como a média do quadrado dos desvios dos elementos em relação à média populacional μ. Ou seja, a variância populacional é dada por: Para calcular-se a Variância da população por subunidade utiliza-se a seguinte fórmula A Variância nos Conglomerados Na amostragem por conglomerados é possível dividir a variância total em dois componentes de variação (ENTRE e DENTRO) dos conglomerados. Pode-se realizar uma análise de variância para obter estimativas isoladas destes dois componentes da variância. Assim, através da análise de variância pode-se dizer que: Variância nos Conglomerados Assim, a estimativa da variância total resulta: Como calcular o Coeficiente de correlação intraconglomerados O coeficiente de correlação intraconglomerados é definido como o Onde: = variância entre os conglomerados; = variância dentro dos conglomerados, ou entre as subunidades. 22 Myrian Abecassis Faber; Rosana de Castro Albuquerque grau de similaridade entre subunidades dentro dos conglomerados. Esta similaridade por ser facilmente percebida, pelo fato de que quanto mais próximas estiverem as subunidades em um conglomerado, tanto mais correlatas serão entre si e vice-versa. Pode assumir valores entre 0 e 1. Será igual a zero quando não existir variância entre os conglomerados, sendo a variância total explicada apenas pela variância dentro dos conglomerados. Exercícios 1. Explique como você faria para coletar dados primários para uma amostragem estratificada nas aulas de Educação Física para o Ensino Fundamental I. 2. Considere a tabela CAMPEONATO, mostrada na Figura 1. Esta tabela mostra as infrações cometidas por diversos jogadores que foram expulsos em um campeonato de futebol. As colunas JUIZ_A e JUIZ_B mostram as punições que foram atribuídas por dois juízes do “tribunal de esporte” para cada infração (cada punição é dada em número de jogos). A média é de 3 jogos tanto para o juiz A como para o juiz B. Assim sendo, calcule os desvios para cada escore das variáveis Juiz_A e Juiz_B (pena atribuída pelos juízes A e B) e a variância Figura 1: Campeonato Juiz_A Desvio Pena 1: ( ) Desvio Pena 2: ( ) Desvio Pena 3: ( ) Desvio Pena 4: ( ) Desvio Pena 5: ( ) Desvio Pena 6: ( ) Desvio Pena 7: ( ) Cálculo da Variância - Juiz A Cálculo da Variância - Juiz B SOMA = VAR (Juiz_A) = / = √........ SOMA = VAR (Juiz_B) = / = √........ Juiz_B Desvio Pena1: ( ) Desvio Pena 2: ( ) Desvio Pena 3: ( ) Desvio Pena 4: ( ) Desvio Pena 5: ( ) Desvio Pena 6: ( ) Desvio Pena 7: ( ) 23 Myrian Abecassis Faber; Rosana de Castro Albuquerque DESVIO PADRÃO O Desvio Padrão calcula o padrão de dispersão dos pontos em relação a média (para mais ou para menos). Serve para estimar risco de investimento, probabilidade de erro, entre outros. População Amostra 2σσ 2SS Propriedades do Desvio 1. O desvio padrão pode ser definido por N )ax( σ 2 i onde a é uma medida qualquer. O desvio padrão é mínimo quando a=. 2. Para as distribuições normais, temos que: (a) 68,27% dos casos estão entre - e + . (b) 95,45% dos casos estão entre - 2 e + 2. (c) 99,73% dos casos estão entre - 3 e + 3. Desvio Padrão Exercício: Baseado na cotação de uma ação das últimas duas semanas, diga qual a estimação de risco para esta ação através do método do desvio padrão? {R$4,50; R$5,50; R$7,30; R$8,90; R$6,30; R$5,60; R$4,00; R$6,00; R$7,20; R$6,80} Exercícios Qual o desvio padrão para os seguintes conjuntos de números: {1,2,3,4,5,6,7,8,9,10}; {1,3,5,7,9,9,7,5,3,1}; {12,11,13,12,14,12,13,15,12} 24 Myrian Abecassis Faber; Rosana de Castro Albuquerque 3. Suponha que dois conjuntos tenham N1 e N2 números de observações, variâncias σ e σ 22 2 1 , respectivamente, e a mesma média . Então, a variância conjunta de ambas as distribuições é dada por: 21 2 22 2 112 NN σNσN σ 4. Somando-se ou subtraindo-se uma constante a cada valor de um conjunto de dados, o desvio padrão não se altera. Multiplicando-se ou dividindo-se por uma constante cada valor de um conjunto, o desvio padrão também fica multiplicado ou dividido, respectivamente, pela constante. Dispersão relativa e Coeficiente de Variação A variação determinada por qualquer medida de dispersão é denominada dispersão absoluta. Entretanto, uma variação igual em duas distribuições com médias diferentes, pode ser inteiramente diferente. Para compararmos estes dois conjuntos, utilizamos a dispersão relativa, definida por: Média absoluta Dispersão relativa Dispersão Se a dispersão absoluta é o desvio padrão e a média é a aritmética, a dispersão relativa é denominada coeficiente de variação, e é dado por μ σ γ e pode ser expresso em percentagem. Para a amostra, o coeficiente é dado por X S g Média Amostral Exemplo prático: média de idade dos alunos da sala. x1+x2+x3............. n ═ 25 Myrian Abecassis Faber; Rosana de Castro Albuquerque Média Amostral Encontre: a) A média de alunos do Curso; b) A média por sexo no Curso; c) A média por sexo em cada município. d) Qual o desvio-padrão para seguintes municípios {Borba, Coari, Apui}; {Fonte Boa, Beruri, Humaitá}; {Itacoatiara, Itapiranga, Manacapuru}; {Novo Airão, Novo Aripuanã, P. Figueiredo}. Municípios Acadêmicos Média Masculino Feminino M F 1 Borba 11 17 2 Coari 15 14 3 Apuí 9 19 4 Fonte Boa 10 17 5 Beruri 16 17 6 Humaitá 17 15 7 Itacoatiara 14 16 8 Itapiranga 15 14 9 Manacapuru 8 21 10 Novo Airão 11 21 11 Novo Aripuanã 16 14 12 P. Figueiredo 9 20 13 S. G. Cachoeira 16 15 14 S. P. de Olivença 18 14 15 Tabatinga20 9 16 Tonantins 16 14 Total Experimento: Experimento (de experiência) significa observar ou fazer alguma coisa sob determinada "condição", o que resultará em um resultado ou estado final de acontecimentos que não são previsíveis. 26 Myrian Abecassis Faber; Rosana de Castro Albuquerque Experimento Os experimentos envolvem eventualidade. E como não podem ser preditos (por serem aleatórios), resultam em um conjunto de resultados denominado "espaço amostral" onde estará envolvido o conhecimento da probabilidade, que indicará a frequência - maior ou menor - em que o conjunto de resultados ocorre. Exemplos de Experimento a) Lançamento de uma moeda honesta; b) Lançamento de um dado. c) Os resultados de um jogo de futebol em tempo normal de jogo d) Horários de chegada de um funcionário no seu local de trabalho Exemplos de Experimento a) O Lançamento de uma moeda honesta = S1 b) O Lançamento de um dado= S2 c) Os resultados de um jogo de futebol em tempo normal de jogo = S3 d) Em relação aos horários de chegada de um funcionário no seu local de trabalho= S4. Espaço Amostral Espaço Amostral são todos os possíveis resultados de um experimento Nomenclatura S ou (Neste caso, será usado o S). Espaço Amostral a) O Lançamento de uma moeda honesta = S1 S1={ cara, coroa} b) O Lançamento de um dado não viciado = S2 S2={ 1,2,3,4,5,6} c) Os resultados de um jogo de futebol em tempo normal de jogo= S3. S3= {ganha, perder, empatar}. d) Em relação aos horários de trabalho, o tempo de chegada de um funcionário = S4. S4= {pontual, cedo (antes do horário), atrasado}. Evento Ex.1: Seja o experimento um Lançamento de um dado não viciado; Sejam os eventos: A é igual aos números pares; B os números ímpares e C é igual aos números maiores que 3. Então: A= {2,4,6} ; B= {1,3,5} ; C= {4,5,6} 27 Myrian Abecassis Faber; Rosana de Castro Albuquerque Teoria dos Conjuntos Símbolos : pertence : existe : não pertence : não existe : está contido : para todo (ou qualquer que seja) : não está contido : conjunto vazio : contém N: conjunto dos números naturais : não contém Z : conjunto dos números inteiros / : tal que Q: conjunto dos números racionais : implica que Q'= I: conjunto dos números irracionais : se, e somente se R: conjunto dos números reais Teoria dos Conjuntos Símbolos das operações : A intersecção B : A união B a - b: diferença de A com B a < b: a menor que b : a menor ou igual a b a > b: a maior que b : a maior ou igual a b : a e b : a ou b 28 Myrian Abecassis Faber; Rosana de Castro Albuquerque Operações com eventos aleatórios. Consideraremos um espaço amostral finito S = { e1, e2, e3,..., en }. União: A ∪ B = {ei ∈ S / ei ∈ A ou ei ∈ B}, i =1,2 ,.., n. O evento união é formado pelos pontos pertencentes a pelo menos um dos eventos. Conjunto vazio É um conjunto que não possui elementos. O conjunto vazio é representado por { } ou . Subconjuntos Quando todos os elementos de um conjunto A qualquer pertencem a um outro conjunto B, diz-se, então, que A é um subconjunto de B, ou seja A B. Observações: Todo o conjunto A é subconjunto dele próprio, ou seja, ; União de Conjuntos: Dados os conjuntos A e B, define-se como união dos conjuntos A e B ao conjunto representado por , formado por todos os elementos pertencentes a A ou B, ou seja: Intersecção de Conjuntos Dados os conjuntos A e B, define-se como intersecção dos conjuntos A e B ao conjunto representado por , formado por todos os elementos pertencentes a A e B, simultaneamente, ou seja: 29 Myrian Abecassis Faber; Rosana de Castro Albuquerque Diferença de Conjuntos Dados os conjuntos A e B, define-se como diferença entre A e B (nesta ordem) ao conjunto representado por A-B, formado por todos os elementos pertencentes a A, mas que não pertencem a B, ou seja Exercícios U = conjunto de acadêmicos do Curso de Educação Física da UEA. Z = { x U | altura de x 1,80 } W = { x U | altura de x 1,60 } ( W Z ) Z ∪ W = ? Representação da união do conjunto Z e W Notação: Z ∪ W = Z Desse fato tiramos a seguinte propriedade 30 Myrian Abecassis Faber; Rosana de Castro Albuquerque DISTRIBUIÇÃO NORMAL • A distribuição normal conhecida é a mais importante distribuição contínua. • Sua importância se deve a vários fatores, entre eles podemos citar o teorema central do limite, o qual é um resultado fundamental em aplicações práticas e teóricas, pois ele garante que mesmo que os dados não sejam distribuídos segundo uma normal a média dos dados converge para uma distribuição normal conforme o número de dados aumenta. Distribuição Normal • Utilizada para descrever uma série de fenômenos físicos e financeiros, possui grande uso na estatística inferencial. • É descrita por seus parâmetros de média e desvio padrão, ou seja, conhecendo-se estes valores consegue-se determinar qualquer probabilidade em uma distribuição Normal. • A Distribuição Normal serve de aproximação para o cálculo de outras distribuições quando o número de observações fica grande. Exemplo de Distribuição Normal • Diversos estudos práticos tem como resultado uma distribuição normal. • Exemplo: a altura de uma determinada população em geral segue uma distribuição normal. Entre outras características físicas e sociais tem um comportamento gaussiano, ou seja, segue uma distribuição normal. Exemplo Observamos o peso, em kg, de 1500 pessoas adultas selecionadas ao acaso em uma população. Vamos definir a variável aleatória A curva contínua da figura denomina-se curva Normal. Como se distribuem os valores da variável aleatória X, isto é, qual a distribuição de probabilidades de X ? 31 Myrian Abecassis Faber; Rosana de Castro Albuquerque Exemplo A distribuição dos valores A distribuição dos valores é aproximadamente simétrica em torno de 70kg; A análise do histograma indica que: - a maioria dos valores (88%) encontra-se no intervalo (55;85); - existe uma pequena proporção de valores abaixo de 48kg (1,2%) e acima de 92kg (1%). A curva contínua da figura denomina-se curva Normal. A distribuição normal Uma variável aleatória contínua tem uma distribuição normal se sua distribuição é: Simétrica apresenta (num gráfico) forma de um sino A distribuição normal • É uma das mais importantes distribuições contínuas de probabilidade pois: • Muitos fenômenos aleatórios comportam-se de forma próxima a essa distribuição. Exemplos: 1. Altura; 2. Pressão sanguínea; 3. Peso. • Pode ser utilizada para calcular, de forma aproximada, probabilidades para outras distribuições como, por exemplo, para a distribuição binomial. Nem todos os fenômenos se ajustam à distribuição Normal. • Exemplo: • Y: Duração, em horas, de uma lâmpada de certa marca. A experiência sugere que esta distribuição deve ser assimétrica grande proporção de valores entre 0 e 500 horas e pequena proporção de valores acima de 1500 horas. 32 Myrian Abecassis Faber; Rosana de Castro Albuquerque Exemplos Modelos Contínuos de Probabilidade/Variável Aleatória Contínua: Associamos probabilidades a intervalos de valores da variável. Assume valores num intervalo de números reais. Não é possível listar, individualmente, todos os possíveis valores de uma variável aleatória contínua. Quando uma distribuição é contínua,o gráfico de distribuição é uma linha contínua. Propriedades dos Modelos Contínuos Uma variável aleatória contínua X é caracterizada por sua função densidade de probabilidade f(x) com as propriedades: (i) A área sob a curva de densidade é 1; (ii) P(a ≤ X ≤ b) = área sob a curva da densidade f(x) e acima do eixo x, entre os pontos a e b; (iii) f(x) ≥ 0, para todo x; (iv) P(X = x0) = 0, para x0 fixo. (v) Assim, P(a < X < b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b). A Distribuição Normal Note que a distribuição normal é especificada por dois parâmetros: μ representa a média populacional, e σ representa o desvio-padrão populacional Distribuição Normal Um dos principais modelos de distribuição contínua é a curva normal ou de Gauss. Sua importância para a Estatística (prática) reside no fato que muitas variáveis encontradas na natureza se distribuem de acordo com o modelo normal. 33 Myrian Abecassis Faber; Rosana de Castro Albuquerque 𝑓(𝑥) = 1 𝜎√2𝜋 𝑒− 1 2 ( 𝑥 − 𝜇 𝜎 ) 2 , −∞ < 𝑥 < ∞ Onde µ= média da distribuição σ = desvio-padrão π= 3,1416... e=2,7... Distribuição Normal Padronizada Para calcularmos; Usaremos a tabela da normal Padronizada, pois há uma tabela de probabilidades. 𝑍 = 𝑥−𝜇 𝜎 Onde ; x = é uma variável normal de média µ e desvio padrão σ. Propriedades da Distribuição Normal. 1ª Propriedade “f(x) é simétrica em relação à origem x = µ, ou φ(z) é simétrica em relação à origem Z=0.” 2 ª Propriedade “f(x) possui um máximo para x = µ , ou φ(z) possui um máximo para Z=0 , e neste caso sua ordenada vale 0,39.” 0 34 Myrian Abecassis Faber; Rosana de Castro Albuquerque 3ª Propriedade f(x) tende a zero quando x tende para + ∞ ou - ∞, o mesmo acontecendo com φ(z) quando Z→± ∞. 4ª Propriedade “f(x) tem dois pontos de inflexão cujas abscissas valem µ + σ e µ - σ ou φ(z) tem dois pontos de inflexão cujas as abscissas valem + 1 e -1”. A tabela oferece a área entre 0 e Z0 ou P (0 ≤ z ≤ z0) As probabilidades: a) P ( 0 ≤ z ≤ 1) b) P (-2,55 ≤ z ≤ 1,2) c) P (z ≥ 1,93) Para se obter a probabilidade, basta entrar com a probabilidade 1,0 (na primeira coluna) e 0,00 (na primeira linha) da tabela. Assim; a) P(0 ≤ z ≤ 1) = 0,3413 35 Myrian Abecassis Faber; Rosana de Castro Albuquerque Caso b) b)P (-2,55 ≤ z ≤ 1,2)= 0,3849+0,4946 = 0,8795 Caso P( z ≥ 1,93) P (z ≥ 1,93)= 0,5000-0,4732 = 0,0268 A distribuição Normal é utilizada para variáveis continua que utilizam medidas. Grandezas Sistema de Unidades Comprimento Metro(m) Massa Quilograma (kg) Tempo Segundo(s) Aplicações A média da altura de um grupo de alunos tem uma distribuição normal com média igual a 1,66 cm e variância 9. A) a probabilidade de que as alturas se situem entre os 160 e 172 cm; 𝑍1 = 1,60−1,66 3 = −0,02 (ver na tabela) 𝑍2 = 1,72−1,66 3 = 0,02(ver na tabela) Z1 valor tabelado Z2 valor tabelado 1,60 1,72 36 Myrian Abecassis Faber; Rosana de Castro Albuquerque Área = 0,0080+0080 = 0,016 Conclui-se então que a probabilidade da altura está entre 1,60cm e 1,72cm é de 0,016 ou 1,6% dado em percentual . B) a probabilidade de que as alturas não sejam inferiores a 175 cm; 𝑍1 = 1,75−1,66 3 = 0,03 (ver na tabela). 0,5 + 0,0120= 0,5120. Conclusão: Então a probabilidade da altura ser menos que 1,75cm é de 0,5120 ou 51,20% dos estudantes tem menos de 1,75cm . C) a probabilidade de que as alturas sejam inferiores a 183 cm; 𝑍1 = 1,83−1,66 3 = 0,0567 Valor encontrado 0,0199 Área = 0,5 + 0,0199=0,5199. Conclui-se então que a probabilidade da altura será menos que 1,75cm é de 0,5199 ou 52,00% dos estudantes tem menos de 1,75 cm . O Intervalo de Confiança para Média Um intervalo de confiança (IC) é um intervalo estimado de um parâmetro de interesse de uma população. Em vez de estimar o parâmetro por um único valor, é dado um intervalo de estimativas prováveis. Quando usar? Usamos para Grandes Amostras (n≥30) No Caso de populações infinitas, a variável padronizada de �̅� 𝑍 = �̅� − 𝜇 𝜎 √𝑛 37 Myrian Abecassis Faber; Rosana de Castro Albuquerque Faz-se necessário a fixação de um nível de confiança 1 – α tem se : A Probabilidade é representada por; 𝑃 = (−𝑍 𝛼 2 ≤ 𝑍 ≤ 𝑍 𝛼 2 ) = 1 − 𝛼 𝑃 = (−𝑍 𝛼 2 ≤ �̅� − 𝜇 𝜎 √𝑛 ≤ 𝑍 𝛼 2 ) = 1 − 𝛼 𝑃 = (�̅� − 𝑍 𝛼 2 𝜎 √𝑛 ≤ 𝜇 ≤ �̅� + 𝑍 𝛼 2 𝜎 √𝑛 ) = 1 − 𝛼 𝜇 = 𝑥 ̅ ± 𝑍 𝛼 2 𝜎 √𝑛 Logo; Erro de estimativa E= 𝑍 𝛼 2 𝜎 √𝑛 ( esse resultado é aplicado quando n≥30 Este intervalo é chamado de intervalo de confiança e suas extremidades são os limites de confiança, e (1-α)100% é chamado de grau de confiança. Os graus de confiança mais utilizados para a Área de Saúde e Biológicas são 95% e 99%. Esses resultados obtidos através dos intervalos de confiança são chamados de estimativas intervalares. Grau de confiança Valor tabelado. 90% 1,64 95% 1,96 99% 2,57 Graus de confiança mais utilizados em relação ao valor tabelado na distribuição normal padronizada. 38 Myrian Abecassis Faber; Rosana de Castro Albuquerque Para 95% de confiança (1- α). Para 99% de confiança (1- α). Exemplo de Estimativa de médias O ex-jogador da seleção brasileira de futebol Roberto Carlos tinha características impressionantes, a velocidade média de chute a gol é considera uma variável aproximadamente normal, a média da velocidade o chute a gol desse jogador era de 118,68 k/h em 56 chutes a gol, a variância de 25 k/h. Em 136 jogos apoiou a equipe pelas laterais de campo a seleção Brasileira foi campeã nas Copas Coreia e Japão, amostra é de 56 chutes a gol. Vamos calcular para o intervalo da estimativa da média para 95% e 99 % de confiança. Estatísticas dadas Valor tabelado. Média da velocidade 118,88 k/h Variância 25 k/h 95% 1,96 N 56 Utilizaremos: 𝜎 = √𝜎2 ; √𝑛 𝜎 = √25 = 5 ; 𝜎 = √56 = 7,48 Para o Cálculo do Intervalo para a média para 95% de confiança Aplicando, temos; 𝜇 = 118,88 ± 1,96. 5 7,48 𝜇 = 118,88 ± 1,31 𝜇′ = 118,88 − 1,31 ; 𝜇′′ = 118,88 + 1,31 𝜇′ = 117,57 ; 𝜇′′ = 120,19 Então o intervalo para a média da velocidade do chute é de [117,57; 120,194] com 95% de confiança. Para realizarmos o Cálculo do Intervalo para a média para 99% de confiança 𝜇 = 118,88 ± 2,57. 5 7,48 𝜇 = 118,88 ± 1,71 𝜇′ = 118,88 − 1,71 ; 𝜇′′ = 118,88 + 1,71 𝜇′ = 117,17 ; 𝜇′′ = 120,59 99% 0,5% 0,5% 39 Myrian Abecassis Faber; Rosana de Castro Albuquerque Então o intervalo para a média da velocidade do chute é de [117,17; 120,59] com 99% de confiança. Estimativa de proporções Erro de padrão de uma proporção Em geral para fazermos essa estimativa da proporção precisamos de percentual ou probabilidade populacional. E= √ 𝑝(1−𝑝) 𝑛 Intervalo de Confiança para proporção 𝑝 − 𝑧 𝛼 2⁄ √ 𝑝(1 − 𝑝) 𝑛 < �̂� < 𝑝 + 𝑧 𝛼 2⁄ √ 𝑝(1 − 𝑝) 𝑛 �̂� = 𝑝 ± 𝑧 𝛼 2⁄ √ 𝑝(1−𝑝) 𝑛 Onde; �̂� = A proporção a ser estimada. p=proporção amostral n= tamanho da amostra. Exemplo: Em uma turma de 40 alunos no curso de educação física, 12 alunos são os praticantes de natação. X= númerode alunos que praticam natação nessa turma n = total de alunos matriculados no curso de educação física. p = a probabilidade (proporção amostral) p= 𝑥 𝑛 ∴ 𝑝 = 12 40 𝑝 = 0,30 ou 30% são praticantes de natação nessa turma. Podemos utilizar o intervalo para calcular os limites da verdadeira proporção de alunos praticante de natação para 95% de confiança. �̂� = 0,30 ± 1,96√ 0,30(1 − 0,30) 40 �̂� = 0,30 ± 1,96√ 0,21 40 �̂� = 0,30 ± 1,96√0,0053 �̂� = 0,30 ± 0,14 �̂�′ = 0,16; �̂�′ = 0,44 40 Myrian Abecassis Faber; Rosana de Castro Albuquerque Então os limites da proporção serão [0,16; 0,44] com 95% de confiança ou os limites da proporção de alunos praticantes de natação estão entre 16% até 44% com 95% de confiança. APLICAÇÕES Na Copa do Mundo de 2015, nas quartas de finais, no jogo do Brasil e Colômbia, o jogador Davi Luiz deu um chute com a velocidade média de 80,3 km / h, o que garantiu a vitória do Brasil sobre a Colômbia. Suponhamos que em 40 chutes (amostra) o desvio padrão seja de 15 k/h e que a média seja 80,3 km/h. Então qual será o intervalo de confiança para a média, com 95% de confiança. Estatísticas dadas Valor tabelado. Média da velocidade 80,3 k/h Desvio-padrão 15 k/h 95% 1,96 N 40 √𝑛 ; 𝜎 = √40 = 6,32 Para realizar o cálculo do Intervalo para a média para 95% de confiança Aplicando, temos; 𝜇 = 80,33 ± 1,96. 15 6,32 𝜇 = 80,3 ± 4,65 𝜇′ = 80,3 − 4,65 ; 𝜇′′ = 80,3 + 4,65 𝜇′ = 75,65 ; 𝜇′′ = 84,95 O intervalo para a média da velocidade do chute é do jogador Davi Luiz é [75,65; 84,95] com 95% de confiança. Exemplo No campeonato paulista o time do Corinthians fez 38 jogos, teve 18 vitórias, 12 empates e 7 derrotas. Então, quais os limites da proporção de vitórias do Corinthians com 95 % de confiança. Consideraremos apenas as vitórias. 41 Myrian Abecassis Faber; Rosana de Castro Albuquerque Estatísticas dadas Valor tabelado. n= nº de jogos 38 x= nº de vitórias 18 95% 1,96 p= 𝑥 𝑛 ∴ 𝑝 = 18 38 𝑝 = 0,47 ou 47% vitórias do Corinthians . �̂� = 0,47 ± 1,96√ 0,47(1−0,47) 38 �̂� = 0,47 ± 1,96√ 0,47 𝑥 0,53 38 �̂� = 0,47 ± 1,96√ 0,24 38 �̂� = 0,47 ± 1,96√0,0066 �̂� = 0,47 ± 1,96 𝑥 0,0795 �̂� = 0,47 ± 0,1558 𝑝′̂ = 0,47 + 0,1558 ; 𝑝′̂ = 0,62 𝑝′′̂ = 0,47 − 0,1558 ; 𝑝′′̂ = 0,31 O limite da proporção de vitórias do Corinthians está em [0,31; 0,62] com 95% de confiança. Problema Faça os cálculos para estimar os limites da proporção de derrotas com 95% de confiança. Temos que considerar apenas derrotas e esquecer os empates. Pois, nesse caso apenas levamos em consideração vitórias ou derrotas (estatisticamente, falando sucesso ou fracasso). Conceitos Fundamentais • Estatística – é um conjunto de técnicas que permitem, de forma sistemática , organizar , descrever, analisar e interpretar dados provenientes de estudos ou experimentos realizados em qualquer área do conhecimento. • Estatística Descritiva são métodos tabulares, gráficos e numéricos usados para sintetizar os dados. • População – É conjunto formado por indivíduos objetos que têm pelo ao menos uma variável comum e observável. • Amostra – Fixada uma população, qualquer subconjunto formado exclusivamente por seus elementos é denominada amostra dessa população. 42 Myrian Abecassis Faber; Rosana de Castro Albuquerque • Variáveis - nos estudos estatísticos são os valores que assumem determinadas características dentro de uma pesquisa e podem ser classificadas em qualitativas ou quantitativas. Tipos de Variáveis Variáveis Qualitativas Não podem ser expressas numericamente, pois relacionam situações como a cor da pele, cor dos olhos, marca de refrigerante, marca de automóvel, preferência musical entre outras. Elas podem ser divididas em ordinais e nominais. Essas variáveis assumem valores por atributos e/ou qualidades. Variáveis Qualitativas Ordinais Apesar de não serem numéricas, obedecem a uma relação de ordem. Exemplo: conceitos como ótimo, bom, regular e ruim, classe social, grau de instrução, pequeno, médio, grande etc. Variáveis Qualitativas Nominais Não estão relacionadas à ordem, elas são identificadas apenas por nomes, Exemplo; as cores: vermelho, amarelo, preto, azul, rosa, verde, etc. Exemplo: as marcas de carros, nome de bebidas, local de nascimento entre outros. Variáveis Quantitativas São características que podem ser descritas por números; utilizam a representação numérica. São classificadas entre contínuas e discretas. Variável Qualitativas Quantitativas Nominal Ordinal Discretas Contínuas 43 Myrian Abecassis Faber; Rosana de Castro Albuquerque Variáveis Quantitativas Discretas Acontecem relacionadas a situações limitadas. Essas variáveis são avaliadas em números que são resultados de contagens e, por isso, somente fazem sentido números inteiros. Exemplo: número de revistas vendidas, quantidade de consultas médicas, número de filhos de um casal. Variáveis Quantitativas Contínuas Nas variáveis quantitativas contínuas, a abrangência pertence a um intervalo que se caracteriza por infinitos valores. Essa variável é avaliada em números que são resultados de medições e, por isso, podem assumir valores com casas decimais e devem ser medidas por meio de algum instrumento. Exemplo: o peso de um produto, altura dos alunos de uma escola, velocidade de objetos, entre outras situações. A Importância do conhecimento sobre as variáveis • Conhecer a classificação da variável estudada é uma das premissas básicas para a escolha do melhor teste estatístico a ser utilizado na análise dos dados. • É possível encontrar, por exemplo, trabalhos científicos em que a análise de uma variável quantitativa contínua é realizada com testes de comparação de médias, como o Teste t ou o Teste Tukey, quando na verdade o mais adequado para se estudar o efeito de um tratamento em uma variável quantitativa contínua seria uma análise de regressão. Classificação dos dados - Dados Não Agrupados Distribuição de Frequências É uma tabela na qual se encontram os possíveis valores de uma variável aleatória, agrupados em classes ou não, com as respectivas frequências observadas. Distribuição de frequências por ponto: Tabela... : Título 44 Myrian Abecassis Faber; Rosana de Castro Albuquerque Nº de filhos Nº de casais 0 14 1 18 2 9 3 6 4 3 Total 50 Fonte: ... Distribuição de frequências por intervalo: Tabela... : Título Tempo (min) Nº de alunos 0 | 20 4 20 | 40 9 40 | 60 15 60 | 80 17 80 | 100 5 Total 50 Fonte: ... Representação Gráfica: Histograma de frequências: Gráfico de Linhas: Gráfico de Setores (Pizza): 0,0 0,5 1,0 1,5 2,0 2,5 12/98 02/99 04/99 06/99 08/99 V a lo r d o d ó la r Data Evolução do preço do dólar comercial 0,00 0,10 0,20 0,30 0,40 0 ----| 10 10 ----| 20 20 ----| 30 30 ----| 40 40 ----| 50 50 ----| 60 Consumo de água. em m³, de 75 contas da CORSAN 26% 36% 16% 22% Conceito dos alunos de uma turma de Estatística A B C D 45 Myrian Abecassis Faber; Rosana de Castro Albuquerque Gráfico de Colunas: Número de cópias de jornal que circulam diariamente 72.047 58.24730.000 25.467 23.848 18.343 8.941 6.551 6.281 5.697 0 10.000 20.000 30.000 40.000 50.000 60.000 70.000 80.000 Jap ão EUA Rú ssi a Ale ma nh a Índi a Ingl ate rra Fra nça Brasil Itáli a Pol ôni a País Mil har es de exe mp lar es Medidas de Tendência Central Determinam o centro da distribuição. Porém o conjunto de valores pode ser interpretado de várias maneiras pelas medidas de tendência central. Média aritmética simples A média aritmética simples, para uma população, é dada por 84.14= 14 84 Dados não agrupados Dados agrupados N x N 1i i N x.f k 1i ii onde xi: valores observados ou ponto médio fi: frequência absoluta N: tamanho da população k: nº de valores ou intervalos Para uma amostra, a média aritmética simples é calculada por Dados não agrupados Dados agrupados n x X n 1i i n x.f X k 1i ii 46 Myrian Abecassis Faber; Rosana de Castro Albuquerque onde xi: valores observados ou ponto médio fi: frequência absoluta n: tamanho da amostra k : nº de valores ou intervalos Propriedades 1. A média de um conjunto de números sempre pode ser calculada. 2. Para um dado conjunto de números, a média é única. 3. Somando-se ou subtraindo-se uma constante a cada valor de um conjunto, a média ficará, respectivamente, somada ou subtraída do valor da constante. Analogamente, multiplicando-se ou dividindo-se por uma constante cada valor de um conjunto, a média ficará multiplicada ou dividida, respectivamente, pela constante. 4. A soma dos desvios dos números de um conjunto em relação à média é zero, isto é, 0)μx( i 5. A média é sensível a todos os valores de um conjunto. Assim, se um valor se modifica, a média também se modifica. Mediana É a medida que ocupa a posição central num conjunto de dados ordenados, isto é, 2 1NxMed OBS: Se N é par, a mediana é a média aritmética simples dos dois valores centrais. Para dados agrupados numa distribuição de frequência, localizamos a posição central através da frequência acumulada. Para distribuição de frequências por intervalo, aplicamos a fórmula abaixo para calcular o valor aproximado da mediana. i i 1i i h.f F2 N LIMed Moda A moda é a observação mais frequente. Caso não haja observação mais frequente, a distribuição é amodal. Podemos ter um conjunto unimodal (com uma moda), bimodal (com duas modas) ou multimodal (com três ou mais modas). Para dados agrupados numa distribuição de frequências por ponto, localizamos a moda pela maior frequência absoluta. Para dados agrupados por intervalo, utilizamos 47 Myrian Abecassis Faber; Rosana de Castro Albuquerque i 1i1i 1i i h.ff f LIModa Moda Bruta: É o ponto médio do intervalo de maior frequência. Medidas de Variabilidade Amplitude Total É a diferença entre o maior e o menor valor observado. Variância - A variância, se os dados forem populacionais, é dada por Dados não agrupados Dados agrupados N μx σ N 1i 2 i 2 N xf k 1i 2 ii 2 onde xi: valores observados ou ponto médio fi: frequência absoluta N: tamanho da população : média populacional k: nº de valores ou intervalos Se o conjunto observado for uma amostra, então a variância é dada por Dados não agrupados Dados agrupados 1n Xx S n 1i 2 i 2 1n Xxf S k 1i 2 ii 2 onde xi: valores observados ou ponto médio fi: frequência absoluta n: tamanho da amostra X : média amostral k : nº de valores ou intervalos Fórmulas abreviadas Dados não agrupados Dados agrupados 48 Myrian Abecassis Faber; Rosana de Castro Albuquerque População 2 N 1i 2 i 2 μ N x σ 2 k 1i 2 ii 2 μ N xf σ Amostra 1n Xnx S n 1i 22 i 2 1n Xnxf S k 1i 22 ii 2 Exercícios Resolvidos de Distribuição Para a distribuição normal com µ = 200 e σ = 50, determinar os valores de X tais que se tenha a probabilidade α = P(|x≥X|) = 0,05 (5%). Resposta: Deseja-se, em outras palavras, determinar um par de valores para X, simétricos em relação à média, de modo a se ter P = 1 - α = 0,90 (figura 4). Os dois termos, em módulo, são iguais, cada um, a 0,50 – 0,05 = 0,45. Examinando a Tabela 1, encontra-se, para A = 0,4505 (o valor mais próximo de 0,45), z = 1,65. Como x = µ ± zσ, fica: X = 200 ± Distribuição Normal no Excell 49 Myrian Abecassis Faber; Rosana de Castro Albuquerque
Compartilhar