Baixe o app para aproveitar ainda mais
Prévia do material em texto
PROFA. CAROLINA ABREU 13 E 20 DE AGOSTO DE 2018 Livro Texto: 2 Capítulo 1 Exposição à Estatística: 3 o “[Mulheres] que fumaram de um a 14 cigarros por dia tinham, aproximadamente, o dobro de risco de morte cardíaca repentina do que as não fumantes.” (Fonte: American Heart Association.) o “O desperdício de alimentos [nos Estados Unidos], em relação ao suprimento disponível, tem aumentado progressivamente de aproximadamente 30% em 1974 para quase 40% em anos recentes.” (Fonte: National Institute of Diabetes and Digestive and Kidney Diseases.) o “O percentual de estudantes de Detroit que alcançaram nível igual ou acima de proficiência [em leitura] foi de 7% [em um ano recente].” (Fonte: U.S. Department of Education.) Exposição à Estatística: 4 o Para o Censo de 2010 o Census Bureau enviou questionários curtos a cada domicílio, com perguntas a todos os membros residentes, tais como: gênero, idade, raça e etnia. o Anteriormente, um questionário maior, que cobria tópicos adicionais, era enviado a cerca de 17% da população. Porém, pela primeira vez desde 1940, o questionário longo foi substituído pela Pesquisa da Comunidade Americana, a qual pesquisará cerca de 3 milhões de domicílios por ano ao longo da década. Esses 3 milhões de domicílios formarão uma amostra. Exposição à Estatística: 5 o A informação na figura é baseada em uma coleta de dados. Definição de Estatística: 6 o O uso de dados estatísticos remonta aos censos realizados na antiga Babilônia, Egito e, mais tarde, no Império Romano, quando os dados coletados eram sobre assuntos relacionados ao Estado, tais como nascimentos e óbitos. Na verdade, a palavra estatística é derivada da palavra latina status, que significa “estado”. Conjunto de Dados: 7 o Há dois tipos de conjuntos de dados usados em estatística. Esses conjuntos são chamados de população e amostra. o Uma amostra deve ser representativa de uma população de modo que seus dados possam ser usados para tirar conclusões sobre aquela população. o Os dados amostrais devem ser coletados usando-se um método apropriado, tal como a amostragem aleatória. o Quando os dados amostrais são coletados usando-se um método inapropriado, eles não podem ser usados para tirar conclusões sobra a população. Um censo consiste em obter os dados de interesse de uma população inteira. Mas, a menos que a população seja pequena, é normalmente impraticável obter todos os dados da população. Na maioria dos estudos, as informações devem ser obtidas de uma amostra aleatória. Exemplo 1: 8 Solução: Exemplo 2: 9 Outros termos estatísticos: 10 Exemplo 3: 11 Solução: Exemplo 4: 12 Ramos da Estatística 13 o O estudo de estatística tem dois ramos principais: estatística descritiva e estatística inferencial. Exemplo 5: 14 Solução: Exemplo 5: 15 Solução: Exemplo 6: 16 Exercício: 17 Solução: 6. Verdadeiro. 8. Falso. A estatística inferencial envolve o uso de uma amostra para chegar a conclusões sobre a população correspondente. 10. Falso. a estatística muda de valor de acordo com a distribuição determinada a partir daquela que controla a amostra aleatória. Classificação dos Dados 18 o Quando realizamos um estudo, é importante saber o tipo de dado envolvido. A natureza dos dados com os quais estamos trabalhando determinará qual procedimento estatístico pode ser usado. o A classificação dos dados é feita por tipo e nível de mensuração. o Os conjuntos de dados consistem em dois tipos: qualitativo e quantitativo. Tipos de dados Exemplo 7: 19 Solução: Exemplo 8: 20 Classificação dos Dados 21 o Outra característica dos dados é o nível de mensuração. o O nível de mensuração determina quais operações estatísticas são apropriadas. o Os quatro níveis de medida, em ordem do mais baixo para o mais alto, são: nominal, ordinal, intervalar e de razão. Níveis de Mensuração Exemplo 9: 22 Solução: Classificação dos Dados 23 o Os dois níveis mais altos de mensuração consistem somente em dados quantitativos. Níveis de Mensuração Um zero natural é um zero que significa “nenhum”. Por exemplo, a quantia de dinheiro que você tem em uma conta de poupança pode ser de zero real. Nesse caso, o zero representa nenhum dinheiro; é um zero natural. Por outro lado, a temperatura de 0 ºC não representa uma condição na qual não há calor. A temperatura de 0 ºC é simplesmente uma posição na escala Celsius; não é um zero natural. Os quatro níveis de medida, em ordem do mais baixo para o mais alto, são: nominal, ordinal, intervalar e de razão. Exemplo 10: 24 Solução: Classificação dos Dados 25 Os quatro níveis de medida, em ordem do mais baixo para o mais alto, são: nominal, ordinal, intervalar e de razão. Classificação dos Dados 26 Os quatro níveis de medida, em ordem do mais baixo para o mais alto, são: nominal, ordinal, intervalar e de razão. Classificação dos Dados 27 Os quatro níveis de medida, em ordem do mais baixo para o mais alto, são: nominal, ordinal, intervalar e de razão. Coleta de Dados e Planejamento de Experimentos 28 o O objetivo de todo estudo estatístico é coletar dados e então usá-los para tomar uma decisão. o Qualquer decisão que seja tomada usando os resultados de um estudo estatístico será tão boa quanto o processo utilizado para obtenção desses dados. o Quando o processo é falho, a decisão resultante é questionável. Planejamento de um estudo estatístico Coleta de Dados e Planejamento de Experimentos 29 o Um estudo estatístico pode, geralmente, ser categorizado como um estudo observacional ou experimental. o Em um estudo observacional, um pesquisador não influencia as respostas. o Em um experimento, um pesquisador, deliberadamente, aplica um tratamento antes de observar as respostas. Planejamento de um estudo estatístico Em um estudo observacional, um pesquisador observa e mede as características de interesse de parte de uma população, mas não muda as condições existentes. Por exemplo, foi realizado um estudo observacional no qual os pesquisadores observaram e registraram o comportamento oral de crianças acima de 3 anos de idade com objetos não alimentícios. (Fonte: Pediatrics Magazine.) Coleta de Dados e Planejamento de Experimentos 30 o Um estudo estatístico pode, geralmente, ser categorizado como um estudo observacional ou experimental. Planejamento de um estudo estatístico Ao realizar um experimento, um tratamento é aplicado em uma parte da população, chamada de grupo de tratamento, e as respostas são observadas. Outra parte da população pode ser usada como um grupo controle, no qual nenhum tratamento é aplicado. (Os indivíduos nos grupos de tratamento e controle são chamados de unidades experimentais.) Em muitos casos, os indivíduos no grupo controle recebem um placebo, que é um tratamento falso, inofensivo, feito para parecer o tratamento real. As respostas do grupo de tratamento e do grupo controle podem ser comparadas e estudadas. Na maioria dos casos, é uma boa ideia usar o mesmo número de indivíduos em cada grupo. Por exemplo, foi realizado um experimento no qual diabéticos tomaram extrato de canela diariamente enquanto o grupo controle não tomou nada. Depois de 40 dias, os diabéticos que tomaram o extrato de canela reduziram seu risco de problemas cardíacos, enquanto o grupo controle não sofreu mudanças. (Fonte: Diabetes Care.) Exemplo 11: 31 Solução: Coleta de Dados e Planejamento de Experimentos 32 o Há várias maneiras de se coletarem dados. Frequentemente, o foco do estudo determina a melhor maneira de fazer a coleta. Coleta de Dados Uma simulação é o uso de um modelo matemáticoou físico para reproduzir as condições de uma situação ou processo. A coleta de dados frequentemente envolve o uso de computadores. As simulações permitem que você estude situações que são impraticáveis ou mesmo perigosas para serem criadas na vida real, e frequentemente economizam tempo e dinheiro. Por exemplo, os fabricantes de automóveis usam simulações com bonecos para estudar os efeitos das colisões em humanos. Coleta de Dados e Planejamento de Experimentos 33 o Há várias maneiras de se coletarem dados. Frequentemente, o foco do estudo determina a melhor maneira de fazer a coleta. Coleta de Dados Uma pesquisa é uma investigação de uma ou mais características de uma população. Mais frequentemente, as pesquisas são conduzidas com pessoas, por meio de perguntas. Os tipos mais comuns de pesquisas são realizados por meio de entrevistas, internet, telefone ou correio. Ao planejar uma pesquisa, é importante escolher bem as perguntas para não obter resultados tendenciosos, que não são representativos de uma população. Por exemplo, uma pesquisa é conduzida em uma amostra de médicas para determinar se o argumento principal para a escolha profissional é a estabilidade financeira. Ao planejar a pesquisa, seria aceitável fazer uma lista de razões e pedir a cada indivíduo na amostra para selecionar sua principal razão. Coleta de Dados e Planejamento de Experimentos 34 o Para produzir resultados significativos e não tendenciosos, os experimentos devem ser cuidadosamente planejados e executados. É importante saber quais passos devem ser realizados para que os resultados sejam válidos. o Três elementos-chave de um experimento bem planejado são controle, aleatorização e replicação. o Em razão de os resultados poderem ser arruinados por uma variedade de fatores, a capacidade de controlá-los é importante. Um desses fatores é uma variável de confusão. Planejamento Experimental Coleta de Dados e Planejamento de Experimentos 35 o Por exemplo, para atrair mais consumidores, o dono de uma cafeteria realiza um experimento ao pintar sua loja usando cores vibrantes. Ao mesmo tempo, um shopping center da região realiza sua grande inauguração. Se os negócios aumentarem na cafeteria, não podemos determinar se isso ocorreu por causa das novas cores ou do novo shopping. Os efeitos das cores e do shopping center se confundem. Planejamento Experimental Coleta de Dados e Planejamento de Experimentos 36 o Outro fator que pode afetar os resultados experimentais é o efeito placebo. O efeito placebo ocorre quando um indivíduo reage favoravelmente a um tratamento quando, na verdade, ele(a) recebeu um placebo. Para ajudar a controlar ou minimizar o efeito placebo, uma técnica chamada cegamento pode ser usada. Planejamento Experimental Coleta de Dados e Planejamento de Experimentos 37 o Outro elemento de um experimento bem planejado é a aleatorização. o Em um planejamento completamente aleatorizado, os indivíduos são designados para diferentes grupos de tratamento por meio de seleção aleatória. Planejamento Experimental 38 o Em alguns experimentos, pode ser necessário usar blocos, que são grupos de indivíduos com características similares. o Um planejamento experimental comumente usado é o planejamento em blocos aleatorizados. o Para usá-lo, o pesquisador separa os indivíduos com características similares em blocos e, então, dentro de cada bloco, designa-os aleatoriamente para os grupos. o Por exemplo, um pesquisador que está testando os efeitos de uma nova bebida para perda de peso pode, primeiro, dividir os indivíduos por faixa etária, tal como 30 a 39 anos, 40 a 49 anos e acima de 50 anos. Então, dentro de cada faixa, designar aleatoriamente os indivíduos ou para o grupo de tratamento ou para o grupo controle (veja a Figura 1.6). Planejamento Experimental Coleta de Dados e Planejamento de Experimentos 39 o Outro tipo de planejamento experimental é o planejamento de pares combinados, no qual os indivíduos são colocados em pares de acordo com a similaridade. o o Um indivíduo em cada par é selecionado aleatoriamente para receber um tratamento enquanto o outro indivíduo recebe um tratamento diferente. o Por exemplo, dois indivíduos podem ser colocados em pares por causa da idade, de uma localização geográfica ou de uma característica física em particular. Planejamento Experimental Coleta de Dados e Planejamento de Experimentos 40 o O tamanho da amostra, que é o número de indivíduos em um estudo, é outra parte importante do planejamento experimental. o Para melhorar a validade dos resultados experimentais, a replicação é necessária. Planejamento Experimental Coleta de Dados e Planejamento de Experimentos Por exemplo, suponha que um experimento seja planejado para testar uma vacina contra gripe. No experimento, 10.000 pessoas recebem a vacina e outras 10.000 recebem um placebo. Por conta do tamanho da amostra, a eficácia da vacina seria provavelmente observada. Mas, se os indivíduos no experimento não forem selecionados de modo que ambos os grupos sejam similares (de acordo com gênero e idade), os resultados serão de menor valor. Exemplo 12: 41 Solução: Exemplo 12: 42 Solução: 43 o Um censo é uma contagem ou medição de toda a população. o A realização de um censo fornece informações completas, mas é frequentemente caro e difícil de realizar. o Uma amostragem é uma contagem ou medição de parte de uma população e é mais comumente usada nos estudos estatísticos. o Para coletar dados não viesados, um pesquisador deve assegurar que a amostra é representativa da população. o Técnicas de amostragem apropriadas devem ser utilizadas para garantir que as inferências sobre a população sejam válidas. o Lembre-se de que, quando um estudo é realizado com dados falhos, os resultados são questionáveis. Mesmo com os melhores métodos de amostragem, um erro de amostragem pode acontecer. o Um erro de amostragem é a diferença entre os resultados da amostra e os da população. Quando aprendemos sobre estatística inferencial, também aprendemos técnicas para controlar esses erros de amostragem. Técnicas de Amostragem Coleta de Dados e Planejamento de Experimentos 44 o Uma amostragem aleatória é aquela na qual todos os elementos de uma população têm chances iguais de serem selecionados. o Uma amostragem aleatória simples é aquela na qual cada amostra possível de mesmo tamanho tem a mesma chance de ser selecionada. o Uma maneira de coletar uma amostra aleatória simples é designar um número diferente para cada membro da população e então usar uma tabela de números aleatórios, como a Tabela B.1 do Apêndice B, aqui representada pela Tabela 1.10. o As respostas, contagens ou medições provenientes de elementos da população cujos números correspondem àqueles gerados com o uso da tabela farão parte da amostra. o Calculadoras e programas de computador também são utilizados para gerar números aleatórios. Técnicas de Amostragem Coleta de Dados e Planejamento Exemplo 13: 45 Solução: 46 o Quando você escolhe os elementos de uma amostra, você deve decidir se é aceitável ter o mesmo elemento da população mais de uma vez. Se for aceitável, então o processo amostral é com reposição. Se não for aceitável, o processo é sem reposição. Técnicas de Amostragem Coleta de Dados Amostragem estratificada: Quando é importante que uma amostra tenha elementos de cada segmento da população, devemos usar uma amostra estratificada. Dependendo do foco do estudo, elementos de uma população são divididos em dois ou mais subconjuntos, chamados de estratos, que compartilham uma característica similar como idade, sexo, grupo étnico ou até mesmo preferência política. Uma amostra é então selecionada aleatoriamente de cada um dos estratos. O uso de uma amostraestratificada assegura que cada segmento da população está representado. Por exemplo, para coletar uma amostra estratificada do número de pessoas que moram no Condado de West Ridge, você poderia dividir os domicílios em níveis socioeconômicos e, então, selecionar aleatoriamente residências de cada nível (veja a Figura 1.7). Ao usar uma amostragem estratificada, alguns cuidados devem ser tomados, de modo a assegurar que todos os estratos forneçam amostras proporcionais às suas reais porcentagens de ocorrência na população. Por exemplo, se 40% das pessoas no Condado de West Ridge pertencem ao grupo de renda mais baixa, então a amostra (amostragem estratificada proporcional) deve ter uma proporção de 40% desse grupo. 47 Técnicas de Amostragem Coleta de Dados Amostragem por conglomerado: Quando a população recai em subgrupos que ocorrem naturalmente, cada um tendo características similares, uma amostragem por conglomerado pode ser a mais apropriada. Para selecionar uma amostragem em tal procedimento, divida a população em grupos, chamados conglomerados, e selecione todos os elementos em um ou mais (mas não em todos) conglomerados sorteados. Tipos de conglomerados poderiam ser seções diferentes do mesmo curso ou diferentes filiais de um banco. Por exemplo, para coletar uma amostra por conglomerado do número de pessoas que moram nos domicílios do Condado de West Ridge, divida os domicílios em grupos de acordo com os códigos postais, então, selecione todas as residências em um ou mais, mas não todos, códigos postais e conte o número de pessoas que vivem em cada domicílio (veja a Figura 1.8). Ao usar uma amostragem por conglomerado, devemos ter cuidado para assegurar que todos tenham características similares. Por exemplo, se um dos grupos de código postal tem uma proporção maior de pessoas de alta renda, os dados podem não ser representativos da população. 48 Técnicas de Amostragem Coleta de Dados Amostragem sistemática: Uma amostragem sistemática é aquela na qual é atribuído um número a cada elemento da população ordenada. Essa ordenação é dividida segundo o número de elementos definidos para a amostra, gerando grupos. Um número é selecionado aleatoriamente no primeiro grupo, e, então, os demais elementos da amostra são selecionados em intervalos regulares a partir do número inicial. (Isto é, cada 3o, 5o ou 100o membro é selecionado.) Por exemplo, para coletar uma amostra sistemática do número de pessoas que moram em West Ridge, poderíamos designar um número diferente para cada domicílio, escolher aleatoriamente um número no primeiro grupo (por exemplo, domicílios de 1 a 100, sorteando o número 80) e, a partir dele, selecionar a cada 100o domicílio (80, 180, 280 e assim por diante) e contar o número de pessoas vivendo em cada um (veja a Figura 1.9). Uma vantagem da amostragem sistemática é que ela é fácil de ser usada. Contudo, caso ocorra qualquer padrão de regularidade nos dados, esse tipo de amostragem deve ser evitado. 49 Técnicas de Amostragem Coleta de Dados Um tipo de amostragem que frequentemente leva a estudos tendenciosos (portanto, não é recomendada) é a amostragem por conveniência. Uma amostra por conveniência consiste somente em membros da população que são fáceis de contatar. Exemplo 13: 50 Solução:
Compartilhar