Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Estatística Agronomia Prof. Nádia Giaretta Biase Conceitos Básicos e Fases do Método Estatístico 2 ESTATÍSTICA ? PRA QUÊ ? É importante saber estatística? Queira ou não, estamos expostos a certas formas de estatística grande parte de nossas vidas. Ex: Pesquisas de opiniões; Precipitação; Meteorologia; Custos de produção; Porcentagem de alimentos contaminados; Taxa de mortalidade da gripe; Nos esportes e noticiários de tempo estamos familiarizados com conceitos de médias, porcentagens e probabilidades; nas diversas áreas do conhecimento como a medicina, biologia, agronomia, engenharia, ciências sociais, etc. 5 A IMPORTÂNCIA DA ESTATÍSTICA A Estatística é aplicada como auxílio nas tomadas de decisão diante de incertezas para justificar cientificamente as decisões. ◦ Onde utilizar a estatística??? 6 Planejamento ApresentaçãoAnálise de dados Delineamento do estudo Interpretação dos resultados Publicação Cálculo da amostra Protocolo de pesquisa ESTATÍSTICA desempenha um papel crucial nas diversas fases da pesquisa científica e trabalho Artigo científico Monografia Tese de mestrado e doutorado... Relatório 7 Definição de Estatística “Estatística é a ciência de obter conclusões a partir de dados”. A Estatística permitirá: garantir que os dados coletados para testar as hipóteses sejam válidos; verificar se as eventuais discrepâncias entre os resultados previstos e os dados coletados são suficientes para justificar uma modificação nas hipóteses. Sem Métodos Estatísticos, sem validade científica! 8 Amostra e População O foco da Estatística é tirar conclusões de populações. Amostra = conjunto de observações extraída de uma população. População (universo) = conjunto de todos os possíveis valores de uma variável ou característica. Finita: Ex: número de alunos matriculados na disciplina de Estatística. Infinita: Ex: número de microorganismos presentes em uma sala. 9 Variável é o conjunto de resultados possíveis de um fenômeno. é a característica ou propriedade da população que está sendo medida. Ex.: População: Fungicida utilizado para combater os fungos na produção de soja; Variável: Volume de fungicida por hectare. População: alunos da graduação em Estatística Variável: sexo As hipóteses de pesquisa são formuladas para as variáveis: Definem-se os valores que as variáveis podem assumir. Definem-se os relacionamentos que as variáveis devem apresentar entre si. 10 Classificação por nível de mensuração: quantidade de informação que a variável apresenta. Sexo Classe social Número de filhos Temperatura Naturalidade Classificação produto Número de acidentes Velocidade Variáveis qualitativas: Você tem diabetes? (Sim ou Não) Você é fumante? (Sim, Não, Já fui, Pretendo ser) Qual sua escolaridade (Ensino médio, graduação ou pós graduação) Qual é o seu tipo sanguíneo? (A, B, AB, O, Não sei) Qual a gravidade da doença (Fase I, II, III, IV) Variáveis quantitativas: contagens ou medidas Discretas Número de batimentos cardíacos; Número de moradores de uma residência; Número de cigarros fumados por dia; Contínuas Altura; Peso; Produção de uma cultura; 13 Arranjo dos dados numa planilha eletrônica Nome Idade Sexo Peso (kg) Raquel 26 F 55 Paulo 37 M 71 Afonso 28 M 94 Mirian 38 F 66 Luciano 38 M 78 Adriana 39 F 70 Lais 24 F 53 Gabriela 18 F 61 Maria Clara 32 F 75 Apresentação dos dados: A organização, a sumarização dos dados podem ser feitas por meio dos métodos tabulares e gráficos Distribuição de Freqüências: 14 Distribuição de Freqüências: É um sumário tabular dos dados que mostra o número (frequência) de itens em cada uma das categorias ou classes não sobrepostas. 15 Distribuições de Frequências Coleta e organização dos dados Dados brutos Dados elaborados => ordenação Frequência absoluta => = número de vezes que o indivíduo aparece na amostra Frequência relativa => Frequência percentual => f a f r f a fp fr .1 0 0 fa 16 Variáveis qualitativas Arroz Feijão Soja Milho Feijão Soja Milho Soja Soja Soja Arroz Soja Milho Feijão Milho Exemplo: Uma pesquisa foi realizada em relação aos tipos de cultura cultivadas nas lavouras brasileiras: Vamos construir a distribuição de frequências para esses dados. 17 Distribuição de freqüências - variáveis quantitativas Nível de mensuração da variável quantitativa: DISCRETA: semelhante às variáveis qualitativas. CONTÍNUA: necessário agrupar os dados para possibilitar o resumo do conjunto e melhor visualização. 18 Distribuição de Freqüências A distribuições de freqüências de dados resultantes de variáveis discretas, quando não houver grande quantidade de diferentes valores observados, consiste em organizar e agrupar os dados numa tabela. Para uma melhor compreensão vamos tomar um exemplo. Exemplo: Vamos construir uma tabela de freqüências para os dados da variável número de pacientes internados com pneumonia, considerando uma amostra de 40 hospitais do Triângulo Mineiro. 19 DADOS 4 4 4 5 4 1 2 3 6 4 6 4 4 6 3 5 3 4 4 4 5 5 5 4 8 4 5 3 4 5 5 2 5 2 6 8 3 5 5 3 Nº de pacientes internados Freqüência de hospitais Freqüência percentual Freqüência acumulada 1 2 3 4 5 6 7 8 Total Tabela de freqüências do número de pacientes internados com pneumonia, considerando uma amostra de 40 hospitais do Triângulo Mineiro. 20 Representação Gráfica 0 2 4 6 8 10 12 14 F re q u ê n c ia d e h o s p it a is 1 2 3 4 5 6 7 8 Nº de pacientes internados Se as colunas estiverem justapostas o gráfico recebe o nome de Histograma . 21 Representação Gráfica 0 2 4 6 8 10 12 14 1 2 3 4 5 6 7 8 Nº de pacientes internados F re q u ê n c ia d e h o s p it a is Polígono de frequências 22 Tabela de frequências para dados agrupados Recomendável para grande conjuntos de variáveis QUANTITATIVAS. Na realidade trata-se de uma recodificação: os valores das variáveis são registrados agora em classes mutuamente exclusivas: ao invés de registrar renda igual a 4,35 salários mínimos, registra-se renda na faixa entre 3 e 5 salários mínimos. PERDE-SE informação sobre o conjunto original para obter sua compactação. 23 Construção de uma distribuição de frequências Organizar a amostra de tamanho n em ordem crescente; Calcular a amplitude total (A = diferença entre o maior e menor valor da amostra) Determinar o número de classes k (aproximar inteiro mais próximo) Calcular amplitude das classes Calcular o limite inferior da primeira classe Li1 = menor valor – c/2 Montar as classes e frequências c A k 1 24 Variáveis quantitativas 41 46 51 57 41 46 51 58 42 50 52 58 44 50 52 60 45 50 54 60 Tabela 2. Quantidades de pragas por metro quadrado em uma plantação hortaliça no Triângulo Mineiro. 25 Construção de uma distribuição de frequências Organizar os dados Calcular a amplitude total (A = 60 - 41= 19) Determinar o número de classes (aproximar inteiro mais próximo) Calcular amplitude das classes Calcular o limite inferior da primeira classe Li1 = menor valor – c/2=41-2,5=38,5 Montar as classes e frequências k n = 20 = 4,47 c A k 1 c 19 5 1 4 75 5, 26 Classes Frequências absolutas 38,5 43,5 3 43,5 48,5 4 48,5 53,5 7 53,5 58,5 4 58,5 63,5 2 Total 20 Distribuição de frequências da quantidades de pragas por metro quadrado em uma plantação hortaliça no Triângulo Mineiro. 27 Exercício: Durante o período de um mês, observou-se o preço, em reais, pago nas refeições por quilo de 25 pessoas nos restaurantes próximos a UFU. Os resultados desse estudo são apresentados a seguir: a) Construir a distribuição de frequências; b) Construir o histrograma e o polígono de frequencias; 28 Outros tiposde gráficos Distribuição de frequências do tempo gasto (segundos) para realizar uma determinada operação. 29 Histogramas 2 10 9 7 1 1 0 2 4 6 8 10 12 340 360 380 400 420 440 460 Figura 1- Figura 1- Histograma do tempo gasto (segundos) para realizar uma determinada operação 30 Polígono de frequência Figura 2: Polígono de Freqüências do tempo gasto (segundos) para realizar uma determinada operação. 31 Ogivas Figura 3: Ogiva crescente e ogiva decrescente tempo gasto (segundos) para realizar uma determinada operação. 32 Pictogramas Ramos e Folhas Idade, em anos, de um conjunto de indivíduos que vivem na zona rural. 34 Box Plot 35 Box-Plot S u d e s te N o r d e s te S u l C e n t r o - o e s te N o r te 0 5 0 0 0 1 0 0 0 0 1 5 0 0 0 R e g i õ e s C o n su m o d e e n e rg ia e lé tr ic a (E m G W h ) Linhas 37 INTERPRETAÇÃO GRÁFICA a) O fígado tem menos colesterol que a carne de Porco. b) A menor quantidade de colesterol é no camarão. c) A maior quantidade de gordura é no fígado.e) O fígado possui 218mg de colesterol a mais que a lula . d) O frango possui mais colesterol que a carne de porco. 27 56 20 48 32 80 25 372 20 80 40 154 0 50 100 150 200 250 300 350 400 Bife magro Camarão Carne de porco Fígado Frango Lula Perfil dos alimentos para cada 100g Gordura saturada, em decigramas Colesterol, em miligramas 38 Num tanque, as variações na população de espécies de peixes A , B e C são descritas, no período de 10 meses, pelo gráfico: 0 1 2 3 4 5 6 7 8 9 10 200 400 600 800 1000 1200 1400 1600 1800 2000 Meses População A B C a) No período de 0 a 2 meses, a população B manteve-se menor que a C b) No quinto mês, havia menos de 3500 peixes nesse tanque. c) A população C atingiu o seu máximo no terceiro mês . d) No período de 3 a 7 meses, a população B manteve-se maior que a A . e) No período de 0 a 5 meses, as populações B e C mantiveram-se crescentes.
Compartilhar