Baixe o app para aproveitar ainda mais
Prévia do material em texto
Núcleo de Educação a Distância – NEAD/AEDB Av. Cel. Prof. Antonio Esteves, nº 01 Campo de Aviação – Resende, RJ CEP: 27.523-000 Tel.: (24) 3383 -9020 http://www.ead.aedb.br/ead/ Núcleo de Educação a Distância – NEAD/AEDB 2 Prezado(a) Aluno(a), Seja bem-vindo a Disciplina online Bioestatística. Meu nome é Nilo Sampaio e acompanharei você como Professor Tutor durante este ano letivo. Em Bioestatística objetivamos apresentar os conhecimentos devidamente fundamentados quanto a metodologia necessária para que o Aluno saiba aplicá-los nos casos concretos do seu dia a dia. Buscamos, simultaneamente, oferecer um treinamento prático, por meio de exemplos, simulado e uma série de exercícios. O conteúdo da disciplina foi estruturado em vários módulos, os quais se encontram no link "conteúdo da disciplina". Clique nesse link para conhecer os diferentes módulos e iniciar seus estudos. Não se esqueça de acessar o calendário da disciplina (link calendário de atividades da disciplina) para acompanhar nossas atividades programadas (trabalhos, provas etc.). Finalmente, sempre que você tiver qualquer dúvida pode entrar em contato comigo via e-mail, fórum ou chats disponibilizados nesta plataforma de EaD. Abraço, Nilo Sampaio Professor Tutor. Núcleo de Educação a Distância – NEAD/AEDB 3 Conteúdo Programático 3. Inferência Estatística 4. A população e a escolha da amostra 4.1 Introdução 4.2 Diferentes Formas de Amostragem Núcleo de Educação a Distância – NEAD/AEDB 4 3. - INFERÊNCIA ESTATÍSTICA 3.1 - Inferência Estatística Inferência estatística é um ramo da Estatística cujo objetivo é fazer afirmações a partir de um conjunto de valores representativo (amostra) sobre um universo. Tal tipo de afirmação deve sempre vir acompanhado de uma medida de precisão sobre sua veracidade. Para realizar este trabalho a estatística coleta informações de dois tipos, experimentais (as amostras) e aquelas que obtêm na literatura. As duas principais escolas de inferência são a inferência frequente (ou clássica) e a inferência bayesiana. A inferência estatística é geralmente distinta da estatística descritiva. A descrição estatística pode ser vista como a simples apresentação dos fatos, nos quais o modelo de decisões feito pelo analista tem pouca influência. É natural que análises estatísticas avancem indo da descrição para a inferência de padrões. Essa última tarefa depende do modelo usado e/ou criado pelo analista dos dados. A Estatística envolve métodos para o planejamento e condução de um estudo, descrição dos dados coletados e para tomada de decisões, predições ou inferências sobre os fenômenos representados pelos dados. A qualidade dos resultados de um estudo depende basicamente do planejamento e condução do estudo e da análise dos dados. O s métodos estatísticos para análise de dados podem ser classificados como métodos descritivos - Estatística Descritiva - já vistos no início do curso e métodos inferenciais - Inferência Estatística. A Inferência Estatística consiste de procedimentos para fazer generalizações sobre as características de uma população a partir da informação contida na amostra. Exemplo: Suponha que sementes geneticamente similares sejam selecionadas ao acaso e cultivadas em um ambiente enriquecido (tratamento) ou sob condições padrão (controle). Após determinado período de tempo, as plantas são cortadas, secas e pesadas. Os resultados, expressos como o peso seco em gramas, para amostras de 10 plantas em cada ambiente são dadas abaixo: Neste exemplo podemos identificar duas populações e duas amostras: Núcleo de Educação a Distância – NEAD/AEDB 5 População 1: Todas as possíveis plantas crescendo sob as mesmas condições do grupo tratamento. População 2: Todas as possíveis plantas crescendo sob as mesmas condições do grupo controle. Amostra 1: As 10 plantas cultivadas no ambiente enriquecido. Amostra 2: As 10 plantas cultivadas no ambiente padrão. Interessa ao pesquisador verificar se existe efeito de tratamento e qual a magnitude deste efeito. Esta pergunta será respondida com base na informação amostral. O pesquisador deseja saber qual o melhor tratamento para a população, e não saber apenas o que aconteceu em suas amostras. Ele deseja generalizar, fazer inferências para a população. Com este objetivo introduziremos dois procedimentos inferenciais a partir deste capítulo: Estimação e Testes de hipóteses. Atividades Propostas Volte para seu curso e participe do Fórum "Inferência Estatística" e no Bloco Fóruns de Discussões – Lembro-lhe que sua participação significativa vale ponto. Anotações: Núcleo de Educação a Distância – NEAD/AEDB 6 4. - A POPULAÇÃO E A ESCOLHA DA AMOSTRA 4.1 - Introdução Muitas vezes, é impraticável para o pesquisador observar todos os elementos do grupo que pretende estudar. É preciso, então, recorrer à pesquisa com uma parte desse todo. População – todos os elementos do grupo a serem estudados. Ex.: 800 pessoas – população Se escolhermos dois desse conjunto – conclusões erradas Amostra – 10 % do total de elementos da população Critérios de seleção: métodos de escolha da amostra. Atividades Propostas Volte para seu curso e participe do Fórum "Inferência Estatística" e no Bloco Fóruns de Discussões – Lembro-lhe que sua participação significativa vale ponto. Anotações: Núcleo de Educação a Distância – NEAD/AEDB 7 4. - A POPULAÇÃO E A ESCOLHA DA AMOSTRA 4.2 - Diferentes Formas de Amostragem AMOSTRAGEM ALEATÓRIA SIMPLES Faz-se uma lista com os nomes numerados. Ex.: lista com 800 nomes, numerados de 01 a 800, colocados numa urna, para serem sorteados. Bolas ou cartões, também numerados de 01 a 800, colocados numa urna, para serem sorteados. Com grandes populações – numeração de 0 a 9, sorteando-os por meio de blocos de três algarismos, tomando o cuidado para repor na urna todo algarismo retirado dela. Sempre que um bloco de algarismos indicar um elemento já selecionado, ele será descartado. AMOSTRAGEM SISTEMÁTICA Sorteando-se um número de 01 a 10, ao acaso. Suponhamos que tenha sido obtido o número 6. Ele será o primeiro elemento da amostra, e os demais serão determinados em intervalos de 10 unidades. 6 – 16 – 26 – 36 – 46 – 56 – 66 – 76 – 86 – 96 – 106 ... 796. Acarreta economia de tempo e dinheiro; Elaborar uma lista de nomes, numerando-os; Sortear uma quantia referente a 10 % do valor. AMOSTRAGEM ESTRATIFICADA PROPORCIONAL Recomendada quando existe uma divisão natural da população em grupos com n.º de elementos diversos. Ex.: Escola com 100 crianças, na faixa de 7 anos de idade, estejam distribuídas em cinco classes, com quantidades diferentes dos alunos. 1ª A - 20 1ª B – 15 1ª C – 35 1ª D – 30 1ª E – 20 Sortear os nomes em quantidades proporcionais ao n.º de crianças com 7 anos de cada classe, considerando as porcentagens em relação ao conjunto total (120 elementos). CLASSE POPULAÇÃO % AMOSTRA A 2016,7 2 B 15 12,5 2 C 35 29,1 3 D 30 25 3 E 20 16,7 2 Núcleo de Educação a Distância – NEAD/AEDB 8 Amostragem Aleatória Simples A amostragem aleatória simples é o tipo de amostragem probabilística mais utilizada. Dá exatidão e eficácia à amostragem, além de ser o procedimento mais fácil de ser aplicado – todos os elementos da população têm a mesma probabilidade de pertencerem à amostra. É bastante preciso e apresenta todos os elementos da população com probabilidade conhecida de serem escolhidos para fazer parte da amostra. O processo consiste em selecionar uma amostra “n” a partir de uma população “N”. Geralmente a seleção é feita sem reposição e cada amostra é feita unidade a unidade até que se atinja o número pré-determinado. As duas maneiras mais utilizadas de obter a amostra “n” são o método de sorteio, no qual são escolhidos um a um até que esteja completa a amostragem e a tabela de números aleatórios, na qual serão sorteados até que seja satisfeita a solicitação da amostra. Amostragem por sorteio Neste método, o que se tem que fazer primeiro é elaborar uma lista dos elementos da população, numerados de acordo com a quantidade de elementos, para então serem sorteados. Todo o número tem a mesma probabilidade de ser sorteado e não há repetição. EXEMPLO Uma cidade turística tem 30 hotéis de três estrelas. Pretende-se conhecer o custo médio da diária para apartamento de casal. Os valores populacionais consistem nos seguintes preços diários (em dólares): 25, 20, 35, 21, 22, 24, 25, 30, 38, 24, 20, 20, 25, 20, 19, 25, 23, 24, 28, 24, 24, 22, 28, 26, 23, 25, 22, 27, 25, 23. Extraia uma amostra aleatória simples de tamanho 10 desta população por sorteio. R: Escrevemos os valores em papéis, então os colocamos em uma urna, misturamos e sorteamos a amostra de n=10. Resultado obtido: n= (20, 24, 22, 28, 23, 24, 21, 20, 25, 27) Esse processo não é muito prático para grandes populações, nesse caso é preferível utilizar uma tabela de números aleatórios. Pelo uso da tabela de números aleatórios: Utilizando o exemplo anterior. 1º passo: Elaborar a relação dos dados brutos da população, ordenando os números com uma numeração aleatória. Como dispomos de um conjunto de elementos de 30 números começaremos pelo 00 até o 29, usando dois dígitos, Núcleo de Educação a Distância – NEAD/AEDB 9 caso tivéssemos 1000 elementos, iniciaríamos pelo 000 até o 999, e assim sucessivamente, usando então três dígitos. . N.º Hotel Custo N.º Hotel Custo N.º Hotel Custo N.º Hotel Custo N.º Hotel Custo 00 - $25 01 - $20 02 - $35 03 - $21 04 - $22 05 - $24 06 - $25 07 - $30 08 - $38 09 - $24 10 - $20 11 - $25 12 - $20 13 - $19 14 - $25 15 - $23 16 - $20 17 - $24 18 - $28 19 - $24 20 - $24 21 - $22 22 - $28 23 - $26 24 - $23 25 - $25 26 - $22 27 - $27 28 - $25 29 - $23 2º Passo: Agora iremos sortear o valor de n, aqui num tamanho igual a 10, utilizando a tabela de números aleatórios. Utilizaremos a tabela agrupando 2 em 2 números pois nossa amostra é de dois dígitos, começando de qualquer ponto na vertical ou na horizontal, até conseguirmos sortear o tamanho de n existente. 3º Passo: Acima estão os números sorteados, os que não têm na amostra são descartados, e no nosso caso como não utilizaremos as repetições, pois queremos um sorteio sem reposição, então também serão descartadas as repetições. Nossa Amostra então será: (24, 25, 20, 25, 19, 24, 22, 25, 24,28) Importante: Núcleo de Educação a Distância – NEAD/AEDB 10 Nosso espaço amostral era de n (A) = 100 números de 2 dígitos (00 a 99). A probabilidade de sortear um hotel, seguindo a tabela de números seria de 30/100 ou 0,3. Tivemos que percorrer um espaço amostral, na tabela com n (A) = 36 (n.ºs de 2 dígitos) para que pudéssemos encontrar um conjunto evento com. N (E) = 10 hotéis + 2 repets. = 12, então a probabilidade foi de 12/36 = 0,33. Como 0,30 e 0,33 não estão muitos distantes, podemos afirmar que os números da tabela de números aleatórios, usados, são EQUIPROVÁVEIS. Atividades Propostas Volte para seu curso e participe do Fórum "Inferência Estatística"" e no Bloco Fóruns de Discussões – Lembro-lhe que sua participação significativa vale ponto. Anotações
Compartilhar