Baixe o app para aproveitar ainda mais
Prévia do material em texto
- 1 - DISCIPLINA: Estatística Aplicada - AULA 02 - Prof. Vander 1) Classificação de Dados (ou Variáveis) Os dados podem ser classificados em dados qualitativos e quantitativos. Dados qualitativos: consistem em atributos, classificações ou registros não- numéricos. Dados quantitativos: consistem em medidas ou contagens numéricas. Para ilustrar o que segue, consideremos o seguinte exemplo: Um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socioeconômicos dos empregados da Companhia MB. Usando informações obtidas no Departamento Pessoal, ele elaborou a tabela abaixo: Variável Representação Estado civil X Grau de instrução Y Número de filhos Z Salário S Idade U Região de procedência V De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou mais de um) resultado correspondendo à realização de uma característica (ou características). No exemplo em questão, considerando-se a característica (variável) estado civil, para cada empregado pode-se associar uma das realizações, solteiro ou casado (note que poderia haver outras possibilidades, como separado, divorciado, mas somente as duas mencionadas foram consideradas no estudo). Podemos atribuir uma letra, digamos X, para representar tal variável. Observamos que o pesquisador colheu informações sobre seis variáveis. Algumas variáveis, como sexo, educação, estado civil, apresentam como possíveis realizações uma qualidade (ou atributo) do indivíduo pesquisado, ao passo que - 2 - outras, como número de filhos, salário, idade, apresentam como possíveis realizações números resultantes de uma contagem ou mensuração. As variáveis do primeiro tipo são chamadas qualitativas, as do segundo, quantitativas. Dentre as variáveis qualitativas, ainda podemos fazer uma distinção entre dois tipos: variável qualitativa nominal, para a qual não existe nenhuma ordenação nas possíveis realizações, e variável qualitativa ordinal, para qual existe uma ordem nos seus resultados. A região de procedência dos funcionários, por exemplo, é um caso de variável nominal, enquanto que o grau de instrução é um exemplo de variável ordinal, pois ensinos fundamental, médio e superior correspondem a uma ordenação baseada no número de anos de escolaridade completos. A variável qualitativa classe social, com possíveis realizações alta, média e baixa, é outro exemplo de variável ordinal. De modo análogo, as variáveis quantitativas podem sofrer uma classificação dicotômica: variáveis quantitativas discretas, cujos possíveis valores formam um conjunto finito ou enumerável de números, e que resultam, frequentemente, de uma contagem, como por exemplo o número de filhos (0, 1, 2...) e as variáveis quantitativas contínuas, cujos possíveis valores pertencem a um intervalo de números reais e que resultam de uma mensuração, como por exemplo a altura e o peso de um indivíduo. - 3 - Cabe uma observação sobre variáveis qualitativas: em algumas situações podem- se atribuir valores numéricos às várias qualidades ou atributos (ou, ainda, classes) de uma variável qualitativa e depois proceder-se a análise como se esta fosse quantitativa, desde que o procedimento seja passível de interpretação. Existe um tipo de variável qualitativa para a qual essa quantificação é muito útil: a chamada variável dicotômica. Para esta variável só podem ocorrer duas realizações, usualmente chamadas sucesso e fracasso. A variável estado civil no exemplo anterior estaria nesta situação. 2) Coleta de dados: há várias maneiras de coletar dados. Frequentemente o foco do estudo determina a melhor maneira de coletá-los. A seguir, apresentamos um breve resumo de quatro métodos de coleta de dados: - Fazendo um censo: um censo é a contagem ou medição de toda uma população. Um censo fornece informações completas, mas é frequentemente dispendioso e difícil de ser realizado. - Usando uma amostra: uma amostra é uma contagem ou medição de parte de uma população. As estatísticas calculadas a partir da amostra são usadas para predizer vários parâmetros populacionais. Por exemplo, todo ano o Census Bureau dos EUA tira amostras da sua população para atualizar os dados dos censos recentes. O uso da amostra é frequentemente mais prático do que a realização de um censo. - Usando uma simulação: uma simulação é o uso de um modelo matemático ou físico para reproduzir as condições de uma situação ou de um processo. A coleta de dados frequentemente compreende o uso de computadores. As simulações permitem estudar situações que seria pouco prático ou até mesmo perigoso criar na vida real, além de frequentemente poupar tempo e dinheiro. Por exemplo, fabricantes de automóveis usam bonecos para simular os efeitos que as colisões têm nos seres humanos. - Realizando um experimento: ao se realizar um experimento, é aplicado um tratamento a uma parte da população e são observadas as respostas. Uma segunda parte da população é, em geral, usada como um grupo de controle. - 4 - Esse grupo não recebe tratamento algum, ou então recebe um placebo. Após serem observadas as respostas dos dois grupos, os resultados são comparados. Por exemplo, para testar o efeito de impor uma nova estratégia de mercado, pode-se realizar um experimento usando uma nova estratégia de mercado em uma determinada região. Cada unidade experimental é chamada de bloco. Deve- se tomar o cuidado para garantir que os blocos sejam similares. Uma vez determinado qual método será usado para coletar dados, você pode chegar à conclusão de que um levantamento irá ajudá-lo. Levantamentos podem ser usados para fazer um censo ou selecionar uma amostra. Um levantamento é uma investigação feita a respeito de uma ou mais características de uma população. Muito frequentemente levantamentos são feitos com pessoas, fazendo-se perguntas a elas. Uma desvantagem do uso do levantamento para a coleta de dados é a de que a formulação das questões pode levar a resultados tendenciosos. 3) Técnicas de amostragem: pera coletar dados não tendenciosos é importante que a amostra seja representativa da população. Técnicas de amostragem apropriadas devem ser usadas para garantir que as inferências sobre a população sejam válidas. Lembre-se de que quando um estudo é feito com dados imprecisos, os resultados são questionáveis. - Amostra aleatória: é aquela na qual todos os membros da população têm chances iguais de serem selecionados. Uma amostra aleatória simples é aquela na qual toda amostra possíveis de mesmo tamanho tem a mesma chance de ser selecionada. Uma maneira de coletar uma amostra aleatória simples é atribuir um número diferente para cada membro da população e usar algum método para gerar números aleatórios para “sortear” os elementos que farão parte da amostra. - Amostra estratificada: quando for importante que uma amostra tenha membros de cada segmento, você deve usar uma amostra estratificada. Dependendo do foco do estudo, os membros da população serão divididos em dois ou mais subconjuntos diferentes, chamados estratos, que compartilham uma característica similar, como idade, gênero, etnia ou até mesmo a - 5 - preferência política. Então, uma amostra é selecionada aleatoriamente a partir de cada estrato. O emprego de uma amostra estratificada nos assegura que cada segmento da população está representado. Por exemplo, para coletar uma amostra estratificada do número de pessoas que vivem nos domicílios de Joinville, você pode dividir os domicílios em níveis socioeconômicos e depois selecionar domicílios em cada nível, aleatoriamente. - Amostra por agrupamento: quando a população apresenta a ocorrência natural de subgrupos, cada um deles com características similares, pode ser mais apropriada uma amostra por agrupamento. Para selecionar uma amostra por agrupamento, divida a população emgrupos, chamados de agrupamentos, e selecione todos os membros de um ou mais agrupamentos (mas não todos). Exemplos de agrupamentos podem ser os diferentes CEPs de uma cidade ou os diferentes departamentos de um banco. - Amostra sistemática: uma amostra sistemática é aquela na qual é atribuído um número a cada membro da população. Os membros da população são então ordenados de alguma maneira, o número inicial é selecionado aleatoriamente e depois os membros da amostra são selecionados segundo intervalos regulares que ocorrem a partir do número inicial. (Por exemplo, cada terceiro, quinto ou centésimo membro é selecionado). Uma das vantagens da amostra sistemática é a sua facilidade de uso. Entretanto, no caso de ocorrer regularmente um padrão nos dados, esse tipo de amostragem deve ser evitado. - Amostra de conveniência: consiste somente de pessoas disponíveis e leva frequentemente a estudos tendenciosos e, portanto, não é recomendável. EXERCÍCIOS: 1) Você está fazendo um estudo para determinar a opinião dos estudantes de sua escola com respeito ao controle de porte de armas. Identifique a técnica de amostragem que você irá utilizar se selecionar uma das amostras relacionadas abaixo: a) Selecione aleatoriamente uma classe e faça perguntas a cada estudante; b) Divida a população estudantil com relação aos cursos, realize uma seleção aleatória e faça perguntas a alguns estudantes de cada curso; - 6 - c) Atribua um número a cada estudante e escolha números aleatórios. Você então irá questionar cada estudante cujo número for selecionado ao acaso; d) Selecione os estudantes que fazem parte do seu curso; e) Atribua um número a cada estudante da escola e, após escolher o número inicial, faça perguntas para um estudante a cada 5. 2) Nos itens abaixo, determine se a afirmação é verdadeira ou falsa. Se for falsa, reescreva-a em sua forma verdadeira: a) O uso de uma amostra sistemática garante que os membros de cada grupo existente em uma população serão amostrados ( F ); O uso de uma amostra estratificada garante que os membros de cada grupo existente em uma população serão amostrados b) Para selecionar uma amostra estratificada, uma população é ordenada de alguma maneira e, depois, os membros dessa população são selecionados segundo intervalos regulares ( F ). Para selecionar uma amostra Sistemática, uma população é ordenada de alguma maneira e, depois, os membros dessa população são selecionados segundo intervalos regulares. 3) Nos itens abaixo, decida qual é o método de coleta de dados que você usaria: a) Um estudo do efeito que a batata frita feita com um substituto da gordura tem sobre o sistema digestivo humano; Experimento b) Um estudo sobre a rapidez com que um vírus se espalha em uma área metropolitana. Simulação 4) Nos itens abaixo, determine se a questão do levantamento é tendenciosa. Se for, sugira uma melhor maneira de formulá-la: a) Por que beber suco de frutas é bom pra você? Tendenciosa O que você pensa sobre beber suco de frutas? b) Por que os motoristas que mudam de faixa repetidas vezes são perigosos? Tendenciosa O que você acha da ação de alguns motoristas mudarem de faixa repetidas vezes? 5) Nos itens abaixo, identifique a técnica de amostragem usada e indique as fontes de tendenciosidade potencial, se houver: a) Usando-se a discagem ao acaso, 1.599 pessoas foram chamadas e indagadas sobre que obstáculo as impediam de se exercitar; Amostra aleatória Fonte de tendenciosidade: a indagação do obstáculo que as impedia de se exercitar - 7 - b) Questionando estudantes que saiam da biblioteca da universidade, um pesquisador indagou 358 alunos sobre seus hábitos de beber; Amostra de conveniência Fonte de tendenciosidade: pessoas que frequentam bibliotecas configuram um grupo específico de pessoas c) Escolhidos ao acaso, 1.819 pacientes que haviam recebido alta em hospitais foram contatados e indagados sobre sua opinião a respeito dos cuidados que receberam; Amostra aleatória Fonte de tendenciosidade: não há d) A soja é plantada num campo de 48 acres de área. O campo está dividido em regiões de um acre. Uma amostra de planta é coletada em cada sub-região a fim de se estimar a colheita; Amostra por agrupamento Fonte de tendenciosidade: não há e) Uma lista de administradores é compilada e ordenada. Após se escolher aleatoriamente um número inicial, todo vigésimo nome é selecionado até se atingir a quantidade de mil administradores. Os mesmos são questionados a respeito do uso de mídias digitais. Amostra sistemática Fonte de tendenciosidade: Não há. 6) Nos itens abaixo, determine se a afirmação é verdadeira ou falsa. Se for falsa, reescreva-a em sua forma verdadeira: a) Dados que estão no nível nominal são somente qualitativos ( V ); b) Dados que estão no nível ordinal são somente quantitativos ( F ); QUALITATIVOS c) Dados considerados discretos são somente qualitativos ( F ); QUANTITATIVOS d) Dados considerados contínuos são somente quantitativos ( V ). 7) Nos itens abaixo, determine se os dados são qualitativos ou quantitativos: a) Os números de telefone de uma lista telefônica; QUALITATIVOS b) A temperatura diária mais alta para o mês de janeiro; QUANTITATIVO c) A porcentagem de notas acima de 7,0 de uma classe em um exame; QUANTITATIVO d) Os números dos jogadores em um time de futebol. QUALITATIVO - 8 - 8) Indique se as variáveis abaixo são qualitativas nominais ou ordinais ou então quantitativas discretas ou contínuas. a) Os mecânicos devem dizer se a troca de velas em um novo modelo de carro é muito difícil, difícil, fácil ou muito fácil; QUALITATIVA ORDINAL b) A religião de pessoas que tentam o suicídio é codificada como 1, 2, 3, 4 ou 5, representando Protestante, Católico, Judeu, Outras ou Nenhuma; QUALITATIVA NOMINAL c) Os consumidores devem dizer se preferem a marca A à marca B, se não têm preferência, ou se preferem a marca B à marca A; QUALITATIVA NOMINAL d) Altitudes acima do nível do mar. QUANTITATIVA CONTÍNUA e) Respostas à pergunta se as condições de vida na zona central de uma grande cidade estão "ficando muito piores", "ficando um pouco piores", "inalteradas", "ficando um pouco melhores", ou "ficando muito melhores". QUALITATIVA ORDINAL f) Idades de carros de segunda mão. QUANTITATIVA DISCRETA g) Respostas sobre a cor dos olhos de motoristas de ônibus escolares. QUALITATIVA NOMINAL 9) Classifique as seguintes variáveis em: (QN) Qualitativa nominal, (QO) Qualitativa ordinal (QC) Quantitativa contínua, (QD) Quantitativa discreta ( QN ) Cor dos olhos ( QD ) Número de filhos de um casal ( QC ) Peso de um indivíduo ( QC ) Altura de um indivíduo ( QD ) Número de alunos de uma escola ( QN ) Tipo sanguíneo ( QO ) Posicionamento das empresas no mercado ( QN ) Fator RH ( QN ) Sexo ( QC ) Comprimento de um segmento de reta ( QC ) Área de um círculo ( QN ) Raça ( QD ) Quantidade de livros de uma biblioteca ( QO ) Escolaridade dos funcionários de uma empresa ( QN ) Religião ( QC ) Salário dos empregados de uma empresa ( QC ) Comprimento dos parafusos produzidos em uma fábrica ( QN ) Estado civil ( QO ) O nível socioeconômico dos residentes em um bairro de Ipatinga ( QC ) Tempo de vida de uma lâmpada ( QN ) Profissão ( QD ) Número de ações negociadas diariamente na bolsa de valores ( QC ) Volume de água contida numa piscina ( QO ) A classificação dos alunos no último vestibular - 9 - 10) Uma enquete, realizada em março de 2010, perguntava aos internautas se eles acreditavam que as atividades humanas provocam o aquecimento global. Eram três alternativas possíveis e 279 internautas responderam à enquete, como mostra o gráfico. Analisando os dados do gráfico, quantos internautas responderam “Não” à enquete? a) Menos de 23. b)Mais de 23 e menos de 25. c) Mais de 50 e menos de 75. (69,75) d) Mais de 100 e menos de 190. e) Mais de 200. 11) O gráfico expõe alguns números da gripe A-H1N1. Entre as categorias que estão em processo de imunização, uma já está completamente imunizada, a dos trabalhadores da saúde. De acordo com o gráfico, entre as demais categorias, a que está mais exposta ao vírus da gripe A-H1N1 é a categoria de a) indígenas. b) gestantes. c) doentes crônicos. d) adultos entre 20 e 29 anos. e) crianças de 6 meses a 2 anos. - 10 - 12) A escolaridade dos jogadores de futebol nos grandes centros é maior do que se imagina, como mostra a pesquisa a seguir, realizada com os jogadores profissionais dos quatro principais clubes de futebol do Rio de Janeiro. De acordo com esses dados, o percentual dos jogadores dos quatro clubes que concluíram o Ensino Médio é de aproximadamente: a) 14%. b) 48%. c) 54%. d) 60%. e) 68%. 13) A Amazônia Legal, com área de aproximadamente 5 215 000 Km2, compreende os estados do Acre, Amapá, Amazonas, Mato Grosso, Pará, Rondônia, Roraima e Tocantins, e parte do estado do Maranhão. Um sistema de monitoramento e controle mensal do desmatamento da Amazônia utilizado pelo INPE (Instituto Nacional de Pesquisas Espaciais) é o Deter (Detecção de Desmatamento em Tempo Real). O gráfico apresenta dados apontados pelo Deter referentes ao desmatamento na Amazônia Legal, por estado, no período de 1.º de julho de 2007 a 30 de junho de 2008, totalizando 8 848 km2 de área desmatada. Com base nos dados apresentados, podemos afirmar: - 11 - a) o estado onde ocorreu a maior quantidade de km2 desmatados foi o do Pará. b) a área total de desmatamento corresponde a menos de 0,1% da área da Amazônia Legal. c) somando-se a quantidade de áreas desmatadas nos estados de Roraima e Tocantins, obtemos um terço da quantidade de área desmatada em Rondônia. d) o estado do Mato Grosso foi responsável por mais de 50% do desmatamento total detectado nesse período. (54%) e) as quantidades de áreas desmatadas no Acre, Maranhão e Amazonas formam, nessa ordem, uma progressão geométrica. 14) A distribuição das idades dos alunos de uma classe é dada pelo seguinte gráfico: Qual das alternativas representa melhor a média de idades dos alunos? a) 16 anos e 10 meses. b) 17 anos e 1 mês. c) 17 anos e 5 meses. d) 18 anos e 6 meses. e) 19 anos e 2 meses. 15) A eficiência do fogão de cozinha pode ser analisada em relação ao tipo de energia que ele utiliza. O gráfico abaixo mostra a eficiência de diferentes tipos de fogão. - 12 - Pode-se verificar que a eficiência dos fogões aumenta a) à medida que diminui o custo dos combustíveis. b) à medida que passam a empregar combustíveis renováveis. c) cerca de duas vezes, quando se substitui fogão a lenha por fogão a gás. d) cerca de duas vezes, quando se substitui fogão a gás por fogão elétrico. e) quando são utilizados combustíveis sólidos.
Compartilhar