Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Aplicada Autor: Ivonete Melo de Carvalho Tema 01 Introdução à Estatística e Estatística Descritiva. Parte I: Levantamento e Apresentação de Dados seç ões Tema 01 Introdução à Estatística e Estatística Descritiva. Parte I: Levantamento e Apresentação de Dados Como citar este material: CARVALHO, Ivonete Melo de. Estatística Aplicada: Introdução à Estatística e Estatística Descritiva. Parte I: Levantamento e Apresentação de Dados. Caderno de Atividades. Valinhos: Anhanguera Educacional, 2014. SeçõesSeções Tema 01 Introdução à Estatística e Estatística Descritiva. Parte I: Levantamento e Apresentação de Dados 5 Conteúdo Nessa aula você estudará: • Uma visão geral da Estatística. • Distribuição de frequências. • Classificação de dados e variáveis. • Construção de gráficos. conteúdosEhabilidades 6 Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • O que é e para que serve a estatística? • Como obter, tabular, representar e realizar análise numérica de dados? • O que são e para que servem as variáveis qualitativas? • O que são e para que servem as variáveis quantitativas? conteúdosEhabilidades leituraobrIgATórIA Introdução à Estatística e Estatística Descritiva. Parte I: Levantamento e Apresentação de Dados A estatística é a arte ou a ciência que se ocupa em levantar, tabular e analisar dados. Para compreendê-la, você precisa adaptar-se a algumas definições. Os termos apresentados precisam ser incorporados por você. Definições: População = conjunto formado por todos os elementos cuja característica o investigador deseja conhecer. Amostra = subconjunto da população. Variável = a característica que se pretende conhecer. Dado = informação (característica) a ser tratada. 7 leituraobrIgATórIA Um exemplo: a professora Ivonete deseja conhecer a faixa etária de seus alunos EAD. Aqui, a população é formada por todos os alunos de Ivonete; a variável (característica) a ser estudada é a faixa etária dos alunos. Seguindo com o exemplo: Ivonete possui vinte mil alunos. “20.000” é um número muito grande de pessoas a ser analisado. A demanda de tempo seria imensa. Para resolver essa questão, em vez de estudar toda a população, uma amostra dela (parte da população) poderá ser determinada. Veja como: Cálculo do tamanho da amostra: Considerando uma população de tamanho N e uma margem de erro e (em porcentagem) deve-se calcular o número índice n1: 2 1 e 1n = Conhecido o número índice, o tamanho da amostra n será dado por: 1 1 nN n*Nn + = No exemplo, se Ivonete admitir um erro de 2% sobre uma população de 20 mil alunos, ela terá: 500.20 5 2 0,0 11 2 22 1 == = = e n 2,222.2 500,22 000.000.0 5 500.2000.0 2 500.2*000.0 2* 1 1 == + = + = nN nN n ,isto é, n = 2.223. Em bom português, Ivonete precisa obter 2.223 respostas à questão “qual sua idade?” para que sua investigação não apresente erro superior a 2%. Importante: o tamanho de uma amostra será sempre dado por um número inteiro e positivo. Existem outras formas de determinar o tamanho de uma amostra. Uma delas é calcular 10% do tamanho da população. Outra diz que para populações pequenas não é necessário determinar amostra. Outro conceito será apresentado a você depois de estudar probabilidade. 8 De volta ao exemplo, o problema de Ivonete agora é obter a amostra. Para isso, ela poderá utilizar diferentes meios para coletar as respostas, mas, antes disso, será necessário determinar o tipo de amostra. Os principais tipos de amostragem utilizados são os probabilísticos (todos os indivíduos da população têm a mesma chance de serem selecionados). Os métodos mais comuns de amostragem probabilística são: • Amostragem aleatória simples: os elementos de uma população são escolhidos de tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar uma tabela de números aleatórios ou um programa de geração de números aleatórios [veja como no Livro-Texto]. • Amostragem estratificada: subdivide-se a população em, no mínimo, dois estratos (subpopulações) que compartilham a mesma característica e em seguida escolhe-se uma amostra de cada. Exemplo: homens e mulheres. • Amostragem sistemática: escolhe-se um ponto de partida e então, sistematicamente, selecionam-se os outros. Por exemplo: o [5°, 15°, 25°, 35°] (etc.) indivíduos. • Amostragem por conglomerados: divide-se a população em conglomerados (áreas), em seguida sorteiam-se algumas áreas e analisam-se todos os elementos dos conglomerados escolhidos. Por exemplo: bairros [de uma cidade]. (GIACOMELLO, 2012, p. 2, grifos nossos). Bem, agora que você entendeu esses elementos essenciais, certamente vai compreender porque seguirei com exemplos que apresentam números menores (para simplificação de cálculos). Para dar sequência ao estudo, suponha que o tamanho da amostra calculada por Ivonete fosse n = 40. Para obter as respostas (dados) necessárias para conhecer a variável idade (em anos) de seus alunos, Ivonete postou a pergunta na área acadêmica e colheu as 50 primeiras respostas válidas. As idades estão apresentadas no quadro a seguir: leituraobrIgATórIA 9 18 23 25 30 22 32 44 35 23 41 30 28 32 23 44 37 44 27 32 30 32 30 30 18 35 23 25 28 25 30 30 30 26 25 25 23 32 44 23 30 Os dados coletados são quantitativos porque se referem a uma medida. Dados quantitativos podem ser contínuos (por exemplo: quanto dinheiro você tem na carteira) ou discretos (o número de filhos que você tem). Caso Ivonete tivesse perguntado: “sexo – feminino ou masculino?”, as respostas não seriam uma medida, mas sim uma característica. Variáveis desse tipo são chamadas de qualitativas. Uma variável qualitativa pode ser nominal (feminino, masculino) ou ordinal (classe social). Suponha que, entre as respostas coletadas, Ivonete tivesse obtido 24 respostas “masculino” e 16 respostas “feminino”. Veja bem, você tem dois exemplos de variáveis para analisar: qualitativas e quantitativas. Qualquer estudo estatístico (qualitativo ou quantitativo) deve começar pela construção de uma tabela. No caso da variável “sexo”, organizarei a tabela em ordem alfabética, ou seja, construindo um ROL. As opções “feminino” e “masculino” são chamadas de categorias. Variável: sexo Feminino 16 Masculino 24 Total: 40 A tabela de coleta de dados pode ser transformada em uma tabela de frequências (frequência é o número de vezes que uma determinada resposta é obtida). leituraobrIgATórIA 10 A tabela de frequências apresenta: frequência simples – f – (número absoluto); frequência relativa – fr – (na forma decimal) e frequência percentual – f%. Em estatística, trabalhar com porcentagens é essencial. Veja como fica a tabela de frequências da variável “sexo”. Sexo f fr f% Feminino 16 0,4 40% Masculino 24 0,6 60% Total: 40 1,0 100% Elaborada a tabela, podem-se representar os dados graficamente. No caso das variáveis qualitativas os tipos de gráficos mais comumente utilizados são: colunas, barras, setores circulares (formato de pizza) e pictóricos (figuras). Veja as ilustrações na figura a seguir: Figura 1.1: Tipos de gráficos para variáveis qualitativas Barras Colunas Setores Circulares Pictóricos 0 5 10 15 20 25 30 F M 0 5 10 15 20 25 30 F M Feminino Masculino Fonte: Elaboração da autora. Agora, você aprenderá a tratar dados quantitativos. Assim como nos dados qualitativos, a primeira providência é colocar os elementos em ordem (em rol). Como são medidas, devem ser colocadas em ordem numérica crescente. leituraobrIgATórIA 11 A lista de dados obtidos era assim:18 23 25 30 22 32 44 35 23 41 30 28 32 23 44 37 44 27 32 30 32 30 30 18 35 23 25 28 25 30 30 30 26 25 25 23 32 46 23 30 Ordenando os dados do menor para o maior, a tabela ficará assim: 18 23 25 27 30 30 32 41 18 23 25 28 30 30 32 44 22 23 25 28 30 32 35 44 23 23 25 30 30 32 35 44 23 25 26 30 30 32 37 46 Na tabela ordenada, é fácil verificar que algumas idades se repetem e outras não. Assim que obter o rol (quando estiver trabalhando com dados quantitativos), o próximo passo é determinar a amplitude total dos dados em estudo. Não se assuste, é fácil. Para calcular a amplitude total basta subtrair, do maior valor obtido, o menor valor. No exemplo, você deverá fazer: AT = 46 - 18 = 28 Depois da amplitude, você deverá calcular o número de classes (categorias) que comporá a tabela. Para determinar o número de classes é preciso estar atento ao tamanho da amostra. Para amostras com até 50 elementos, o número de classes é dado por: nk = . Para amostras com mais de 50 elementos, você deverá utilizar a regra de Sturges: )nlog(*3,31k += . No exemplo, a amostra n = 40 deverá conter 73,60 4 ≅≅=k classes (o número de classes é sempre inteiro e positivo). leituraobrIgATórIA 12 Isso feito, você deverá calcular a amplitude das classes. A amplitude das classes é dada por: K TAkA = . No exemplo: 4 7 8 2 =⇒= kAkA . Depois disso, chega o momento de construir a tabela de frequências. No caso de variável quantitativa, além de calcular frequência simples – f; frequência relativa – fr – e frequência percentual – f%; também será preciso calcular a frequência acumulada – F; a frequência acumulada relativa – Fr – e a frequência acumulada percentual – F%. Contudo, antes de contar as frequências, você deverá construir as classes. A primeira classe começa com o menor valor obtido entre os dados tabelados; a esse valor adiciona-se a amplitude da classe: 18 + 4 = 22. A segunda classe começará no 22 e terminará no 26 e assim por diante até chegar na sétima classe que começará na 42 e terminará em 46. Veja como fica a tabela de frequências da variável idade. Idade f fr f% F Fr F% 18 |— 22 02 0,050 05,0 02 0,050 05,0 22 |— 26 12 0,300 30,0 14 0,350 35,0 26 |— 30 04 0,100 10,0 18 0,450 45,0 30 |— 34 14 0,350 35,0 32 0,800 80,0 34 |— 38 03 0,075 7,50 35 0,875 87,5 38 |— 42 01 0,025 2,50 36 0,900 90,0 42 |—| 46 04 0,100 10,0 40 1,000 100,0 Total: 40 1,000 100,0 O símbolo “ι—“ significa que o início do intervalo faz parte dele e o final somente o limita (em linguagem matemática: intervalo fechado à esquerda e aberto à direita). Para obter a frequência de cada classe é preciso contar quantos elementos fazem parte dela. Por exemplo, na primeira classe estariam os números 18, 19, 20 e 21 No nosso exemplo, aparece somente o 18, duas vezes. Na segunda classe, deveriam aparecer os números 22, 23, 24 e 25 que aparecem 1 vez, 6 vezes, nenhuma vez e 5 vezes, respectivamente, portanto, a frequência simples é 12. Confira os demais valores tabelados. leituraobrIgATórIA 13 A ideia de acumular frequências também é simples. A primeira frequência acumulada (relativa ou percentual) é sempre igual à primeira frequência simples (relativa ou percentual). Da segunda frequência acumulada em diante, basta que você adicione o valor da frequência simples da próxima classe ao valor acumulado: 2 + 12 = 14. Para representar graficamente dados quantitativos, os gráficos utilizados são o histograma, o polígono de frequências (simples) e a ogiva (frequências acumuladas). Vejas os gráficos na figura seguinte: Figura 1.2: Tipos de gráficos para variáveis quantitativas Histograma Polígono de frequências Ogiva 0 2 4 6 8 10 12 14 18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 46 0 5 10 15 20 25 30 35 40 45 18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 46 0 5 10 15 20 25 30 35 40 45 18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 46 Fonte: Elaboração da autora. Comentários: Histograma é bem parecido com o gráfico de colunas, contudo, suas colunas são colaterais com todas as bases com a mesma dimensão. O polígono de frequências é obtido considerando-se os valores médios de cada classe e a frequência relativa à classe estudada. A ogiva também considera os pontos médios de cada classe em correspondência ao valor nela acumulado. Leia no Livro-Texto, se possível, como tratar dados agrupados. leituraobrIgATórIA 14 linksIMPorTAnTEs Quer saber mais sobre o assunto? Então: Sites Teste os seus conhecimentos: faça exercícios sobre estatística e veja a resolução comentada. Acesse o site “Exercícios – Brasil Escola”. Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada. Acesse o site “Portal Action”. Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada. Acesse o site “Exercícios – Professor Cardy”. Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições desses exames e consultar a resolução comentada. 15 linksIMPorTAnTEs Acesse o site “Matematiquês”. Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada. Vídeos Assista aos vídeos com exercícios comentados. Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/ Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio- padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014. Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o ENEM. 16 Instruções: Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema. Questão 1: Foi encomendado um estudo para ava- liação do curso “A” em uma Instituição de Ensino Superior. Para isso, aplicou-se um questionário e obtiveram-se respostas de 110 alunos. Indique: a) A variável em estudo. b) A população em estudo. c) A amostra escolhida. Questão 2: A variável “salário” é classificada como: a) Qualitativa nominal. b) Qualitativa ordinal. c) Quantitativa contínua. d) Quantitativa discreta. e) Quantitativa ordinal. Questão 3: Uma população cuja característica deseja- se estudar apresenta 50 mil elementos. A margem de erro admitida pelo pesquisador é de 1%. Nessas condições, o tamanho da amostra será: agoraéasuAvez 17 a) n = 50.000. b) n = 10.000. c) n = 8.334. d) n = 5.000. e) n = 500. Questão 4: Para tabelar uma amostra de dados quan- titativos de tamanho n = 100 elementos, o examinador deverá elaborar: a) 10 classes. b) 8 classes. c) 7 classes. d) 5 classes. e) 4 classes. Questão 5: Chama-se questão aberta àquela cujares- posta é livre. Uma questão é de múltipla escolha quando o investigador oferece as respostas a serem escolhidas pelo elemen- to pesquisado. Indique, entre as alternati- vas apresentadas, aquela cuja resposta deve ser obrigatoriamente livre: a) Quantos livros você leu no último ano? b) Quantos filhos você tem? c) O bairro onde você mora é considerado um lugar tranquilo? d) A que classe social você pertence? e) Qual o título do último livro que você leu? Texto para as questões de 6 a 10: Considere os dados quantitativos representados na tabela. Com base nas orientações do item “Leitura Obrigatória” responda ao que se pede em seguida. 6 157 223 98 189 119 142 99 75 241 128 137 172 22 167 115 29 217 29 142 134 38 32 36 230 Questão 6: Elabore uma tabela de frequências con- siderando cinco classes assim definidas: 0 ι— 50; 51 ι— 100; 101 ι— 150; 151 ι— 200; 201 ι— 250 Questão 7: Elabore o histograma dos dados estudados. Questão 8: Elabore o polígono de frequência dos da- dos estudados. agoraéasuAvez 18 Questão 9: Elabore a ogiva dos dados estudados. Questão 10: Que informação você extrai ao analisar a ogiva? agoraéasuAvez Neste tema, você conheceu as definições iniciais da estatística e sua utilidade. Aprendeu como obter e classificar dados; construir tabelas e gráficos. Aprendeu, principalmente, que a estatística permite ao investigador conhecer qualquer elemento que componha sua área de atuação. Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! finalizando CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009. CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, Porto Alegre 16, 1997. FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996. FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998. referências 19 referências GIACOMELLO, C. P. Probabilidade e estatística. Centro de Ciências Exatas, da Natureza e de Tecnologia, Universidade de Caxias do Sul. Rio Grande do Sul, 2012. KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con- trole. São Paulo: Atlas, 1996. LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998. LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136. MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996. ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro- posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, RJ. p.124. SLACK, N. Administração da produção. São Paulo: Atlas, 1997. Amostra: subconjunto da população. Dado: informação (característica) a ser tratada. População: conjunto formado por todos os elementos cuja característica o investigador deseja conhecer. Respostas válidas: são aquelas que não se desviam da pergunta elaborada. Exemplo: se, ao se perguntar “qual sua cor preferida?”, a resposta for “verde”, esta será válida. Variável: a característica que se pretende conhecer. glossário 20 Questão 1 Resposta: Observando os detalhes do texto, as respostas serão: (a) qualidade de ensino; (b) Instituição de Ensino Superior; (c) 110 alunos. Questão 2 Resposta: Alternativa C. Questão 3 Resposta: Alternativa C. Questão 4 Resposta: Alternativa B. Questão 5 Resposta: Alternativa E. Questão 6 Resposta: Após elaborar o rol, e com o auxílio de uma calculadora, você deverá obter: Classes f fr f% F Fr F% 0 ι— 50 7 0,28 28 7 0,28 28 51 ι— 100 3 0,12 12 10 0,40 40 101 ι— 150 7 0,28 28 17 0,68 68 151 ι— 200 4 0,16 16 21 0,84 84 201 ι— 250 4 0,16 16 25 1,00 100 total 25 1,00 100 gabarito 21 Questão 7 Resposta: Considerando as frequências simples: 0 1 2 3 4 5 6 7 8 0 ι— 50 51 ι— 100 101 ι— 150 151 ι— 200 201 ι— 250 Questão 8 Resposta: Considerando as frequências simples: 0 1 2 3 4 5 6 7 8 0 ι— 50 51 ι— 100 101 ι— 150 151 ι— 200 201 ι— 250 classes fre qu ên ci as gabarito 22 Questão 9 Resposta: Considerando as frequências acumuladas: 0 5 10 15 20 25 30 0 ι— 50 51 ι— 100 101 ι— 150 151 ι— 200 201 ι— 250 classes fre qu ên ci as Questão 10 Resposta: Falando aproximadamente, metade dos valores acima do valor médio e metade dos valores abaixo do valor médio. gabarito
Compartilhar