Baixe o app para aproveitar ainda mais
Prévia do material em texto
LICENCIATURA EM BIO- LOGIA Instituto Federal de Educação, Ciências e Tecnologia de Alagoas Departamento de Educação a Distância Universidade Aberta do Brasil Unidades Unidade 1 - Conceitos prévios em Estatística Introdução Histórica: O que é a estatística População e Amostra Censo x Amostragem Dado e Variável Atividades Unidade 2 - Ferramentas necessárias ao Estudo de Estatística Números Aproximados e Arredondamento de dados Fração Porcentagem Somatórios Atividades Unidade 3 - Obtenção de Dados Etapas do Método Estatístico Apresentação Tabular Análise e avaliação dos resultados obtidos Tomada de Decisão Aplicação do método estatístico através de um projeto de pesquisa Elaboração de um questionário Um aplicação de questionário Codificação dos dados Unidade 4 - Técnicas de Amostragem Técnicas estatísticas de abordagem Amostragem Casual ou Aleatória Simples Amostragem Proporcional Estratificada Amostragem de Conglomerados Amostragem Sistemática Atividades Unidade 5 - Séries Estatísticas Série Temporal ou Cronológica Série Geográfica ou Territorial Série Específica ou Qualitativa Série Mista, Conjugada ou Composta Série de Distribuição de Freqüências Atividades Unidade 6 - Distribuição de Frequências Definições Básicas Tipos de Freqüências Distribuição de Freqüência para dados agrupados em intervalos de classe Atividades Unidade 7 - Gráficos Estatísticos Gráficos de Linha Gráficos de colunas ou em barras Gráficos de colunas ou em barras múltiplas Gráfico de colunas comparativas Gráficos de setores Gráfico Pictorial - Pictograma Gráfico polar Cartograma Atividades Unidade 8 - Medidas de Posição Média Aritmética Simples (dados não agrupados) Média Aritmética Ponderada (dados agrupados) Mediana Moda Emprego das medidas de posição Atividades Unidade 9 - Medidas de Variabilidade Amplitude total Desvio Desvio Médio Variância e Desvio Padrão Interpretação do Desvio Padrão Coeficiente de variação Atividades Unidade 10 - Introdução a Probabilidade Métodos de Contagem Conceitos Básicos Regras básicas de probabilidade Regras Básicas do Calculo das Probabilidades Distribuição de Probabilidades Atividades Unidade 11 - Correlação e Regressão Correlação Linear Coeficiente de correlação de Pearson Regressão – Reta de Regressão Atividades Introdução 1.1 Introdução Histórica As idéias fundamentais de estudos estatísticos como: contagem, enumeração, re- gistros de dados, número de nascimentos e de óbitos, estimativas de estoques e recen- seamentos, já se encontravam presentes nas civilizações antigas. Além da finalidade so- cial e econômica, existia também a bélica. Por meio da estatística , o Estado sabia quan- tos bens possuía, como estavam distribuídos e conhecia também sua população. Essas informações auxiliavam a cobrança de impostos e também o recrutamento militar, pois, com guerras constantes, era de suma importância avaliar o armamento , saber de quan- tos jovens o Estado podia contar para treinamento. A partir do século XVI, foi que surgiram as primeiras informações registradas e or- ganizadas de fatos sociais em tabuas, isto é, batizados, casamentos, nascimentos, etc.. O termo estatística surge da expressão em latim statisticum collegium palestra sobre os assuntos do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de estado", ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de Lena e adotada pelo acadêmico alemão Godofredo Achenwall. Aparece como vocabulário na Enciclopédia Britânica em 1797, e adquiriu um significado de coleta e classificação de dados, no início do século 19. De acordo com a Revista do Instituto Internacional de Estatística, "Cinco homens, Hermann Conring,Gottfried Achenwall, Johann Peter Süssmilch, John Graunt e William Petty já receberam a honra de serem chamados de fundadores da estatística, por diferentes autores. Alguns autores dizem que é comum encontrar como marco inicial da estatística a publicação do "Observations on the Bills of Mortality" (1662) de John Graunt. As primeiras aplicações do pensamento estatístico estavam voltadas para as necessidades de Estado, na formulação de políticas públicas, fornecendo dados demográficos e econômicos. A abrangência da estatística aumentou no começo do século XIX para incluir a acumulação e análise de dados de maneira geral. Hoje, a estatística é largamente aplicada nas ciências naturais, e sociais, inclusive na administração pública e privada. O primeiro levantamento estatístico de que se tem conhecimento se deve a Heró- doto e se refere a um estudo da riqueza da população do Egito, cuja finalidade era averi- guar quais eram os recursos humanos e econômicos disponíveis para a construção das pirâmides, isso no ano de 3050 a. C. No ano de 2238 a. C., o Imperador Chinês Yao orde- nou a realização de uma Estatística com fins industriais e comerciais. No ano de 1400 a. C., o famoso faraó egípcio Ramsés II ordenou um levantamento das terras do Egito. Exis- tem ainda, outros casos de Estatísticas no período antigo da civilização. Estatística é a ciência que trata do delineamento, coleta, organização, sumarização, apresentação e análise de dados, bem como, na obtenção de conclusões válidas e toma- das de decisões em diversos campos, a saber, engenharias, campo da saúde, biologia, farmácia, biofísica etc. Algumas dessas ciências usam a estatística aplicada tão extensivamente que elas têm uma terminologia especializada: Bioestatística; Contabilometria; Controle de qualidade; Estatística comercial; Estatística econômica; Estatística engenharia; Estatística física; Estatística populacional; Estatística psicológica; Estatística social (para todas as ciências sociais); Física quântica; Pesquisa operacional; Análise de processo e quimiometria (para análise de dados da química analítica e da engenharia química). Estatística forma uma ferramenta chave nos negócios e na industrialização como um todo. É utilizada a fim de entender sistemas variáveis, controle de processos (chamado de "controle estatístico de processo" ou CEP), custos financeiros (contábil) e de qualidade e para sumarização de dados e também tomada de decisão baseada em dados. Em nessas funções ela é uma ferramenta chave, e é a única ferramenta segura. O crescimento rápido e sustentados no poder de processamento dos computadores a partir da segunda metade do século XX teve um forte impacto na prática da estatística. Os modelos estatísticos mais antigos eram quase sempre lineares, mas os computadores modernos junto com algoritmos numéricos apropriados, causaram um aumento do interesse nos modelos não-lineares (especialmente redes neurais e árvores de decisão) assim como na criação de novos tipos, como o modelo linear generalizado e o modelo multi-nível. O aumentona capacidade de computação também tem levado à popularização de métodos que demandam muitos cálculos baseados em resampling, como testes de permutação e bootstrap, enquanto técnicas como o sampling de Gibbs tem feito com que os métodos de Bayes fiquem mais fáceis. A revolução informática também tem levado a um aumento na ênfase na estatística "experimental" e "empírica". Um grande número de softwares estatísticos, de uso tanto geral como específico estão disponíveis no mercado. Na medida em que nossa sociedade se tornou muito mais diversificada, o que comprova a grande importancia dessa ciencia antiga. Há um século, H. G. Wells dizia: “Raciocinar estatisticamente será um dia tão neces- sário quanto à habilidade de ler e escrever”. Hoje, problema não é de escassez de infor- mação, mas como utilizar essas informações abundantes disponíveis para tomar as me- lhores decisões. Segundo Fisher (R. A. Fisher) Estatística é o estudo das populações, das variações e dos métodos de redução de dados A Estatística desempenha duas grandes funções: Descritiva e Indutiva ou Inferenci- al. a) Descritiva – descreve um conjunto de dados variáveis, reduzindo-os a um peque- no número de medidas que contém toda a informação relevante. Utiliza número para descrever fatos. Somente descreve e avalia certo grupo (amostra), sem tirar quaisquer conclusões ou inferências sobre um grupo maior (população). b) Indutiva ou Inferencial – diz respeito à análise e interpretação de dados amos- trais. Consiste me obter e generalizar conclusões sobre a população a partir de uma amostra. Utiliza-se da estimação de parâmetros e verificação de hipóteses, esta por meio, da aplicação dos testes de significância. Auxilia no delineamento de experimentos e levantamento para, dentro de uma precisão estipulada, obter- se a informação desejada livre da influência de fatores perturbadores. A Estatística fornece os preceitos da casualização, repetição, controle local, os deline- amentos experimentais e os métodos de amostragem, ou seja, normas lógicas que garan- tam a validez das comparações entre tratamentos e aumentem a precisão dessas compa- rações. 1.2 População x Amostra População (N): Conjunto de todos os elementos relativos a um determinado fenô- meno que possuem pelo menos uma característica em comum, a população é o conjunto Universo, podendo ser finita ou infinita. População (universo) é a totalida- de dos itens considerados no estudo 1. Finita - apresenta um número limitado de observações, que é passível de conta- gem. 2. Infinita - apresenta um número ilimitado de observações que é impossível de contar e geralmente esta associada a processos.. Uma população pode, mediante processos operacionais, ser considerada infinita, pois a mesma irá depender do tamanho da amostra. Se a freqüência relativa en- tre amostra e população for menor do que 5% ela é considerada infinita, se a fre- qüência relativa for maior do que 5% ela é considerada finita. Amostra (n): É um subconjunto da população e deverá ser considerada finita, a amostra deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as características da população como se fosse uma fotografia desta. Amostra é a parte da população selecionada para análise Parâmetros: são medidas populacionais quando se investiga a população em sua totali- dade, neste caso é impossível fazer inferências, pois toda a população já foi investigada. Estatísticas ou Estimadores são medidas calculada para descrever uma característica de apenas uma amostra da população, torna-se possível neste caso utilizarmos as teorias de inferências para que possamos fazer conclusões sobre a população Amostra População ^ 22 pProporção PadrãoDesvio Variância Média estimados) valores( Estimador )reai valores( Parâmetros S S X s Exemplos: 1. Níveis de glicose no sangue de um grupo de 20 pacientes (amostra) selecionados aleatoriamente de uma lista de pacientes diabéticos de um hospital Público (po- pulação). 2. Tempos de resposta a um estímulo de um grupo de 30 ratos tipo rato-de-telhado (Rattus rattus) (amostra) que, por suposição, representam todos os ratos tipo ra- to-de-telhado (Rattus rattus) existentes (população). 3. Números de horas semanais dedicadas ao estudo de um grupo de 32 estudantes de graduação do IFAL (amostra) escolhidos aleatoriamente do conjunto total de estudantes de graduação do IFAL (população). População Amostra Parâmetros para estimar atitudes Estatísticas ou Estimado- res para estimar atitudes Conclusões sobre a População a partir da Amostra 1.3 Censo x Amostragem Pesquisa Estatística: É qualquer informação retirada de uma população ou amostra, podendo ser através de Censo ou Amostragem. Censo: É a coleta exaustiva de informações das "N" unidades populacionais. Amostragem: São o processo de retirada de informações dos "n" elementos amos- trais, no qual deve seguir um método criterioso e adequado (tipos de amostragem). 1.4 Dados e Variáveis Dados estatísticos: é qualquer característica que possa ser observada ou medida de al- guma maneira. As matérias-primas da estatística são os dados observáveis. Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão, geral- mente as variáveis para estudo são selecionadas por processos de amostragem. Os sím- bolos utilizados para representar as variáveis são as letras maiúsculas do alfabeto, tais como X, Y, Z, ... que pode assumir qualquer valor de um conjunto de dados. As variáveis podem ser classificadas dos seguintes modos: Deste modo, é fundamental estabelecer- mos o tipo de Variável, pois a sua identificação determinará o tipo de estatística utilizada Tipos de Variáveis Qualitativas (ou atributos): São características de uma população que não pode ser medida. Nominal: são utilizados símbolos, ou números, para representar determinado tipo de dados, mostrando, assim, a qual grupo ou categoria eles pertencem. Ordinal ou por postos: quando uma classificação for dividida em categorias ordena- das em graus convencionados, havendo uma relação entre as categorias do tipo “maior do que”, “menor do que”, “igual a”, os dados por postos consistem de valores relativos atribuídos para denotar a ordem de primeiro, segundo, terceiro e, assim, su- cessivamente. Exemplos: a) A cor dos olhos de estudantes de um curso de biologia – variável qualitativa nominal. b) Coleção de livros de biologia – variável qualitativa nominal. c) Sexo dos estudantes de uma instituição, isto é, masculino ou feminino - variá- vel qualitativa nominal. d) Grau de instrução de pessoas que trabalham em um hospital – variável quali- tativa ordinal. e) Relação de classificados em um concurso público – variável qualitativa ordinal. Quantitativas: São características populacionais que podem ser quantificadas, sendo classificadas em discretas e contínuas. Discretas: são aquelas variáveis que pode assumir somente valores inteiros num con- junto de valores. É gerada pelo processo de contagem, como o número de veículos que passa em um posto de gasolina, o número de estudantes nesta sala de aula. Exemplo: a) Número de filhos por casal – variável quantitativa discreta. b) Número de pontos feitos em um paciente de um hospital – variável quantita- tiva discreta. c) Número de equipamentos em um laboratório - variável quantitativa discreta. d) Número de estudantesque cursam Licenciatura em Biologia - variável quanti- tativa discreta. Contínuas: são aquelas variáveis que podem assumir um valor dentro de um intervalo de valores. É gerada pelo processo de medição. Neste caso serve como exemplo o vo- lume de água em um reservatório ou o peso de um pacote de cereal. Exemplo: a) Número de alimentos, em quilogramas, ingerida por estudantes num restau- rante do IFAL, Campus Maceió - variável quantitativa continua. b) Quantidade de dinheiro gasto por turistas em Maragogi – variável quantitativa continua. c) Volume de refrigerante, em ml, contido em um copo - variável quantitativa contínua. Atividade 1. Uma Empresa tem 3.500 clientes cadastrados. Para melhor atendê-los, foi pesquisada a preferência em relação ao tempo de duração da viagem, ao preço dos pacotes, ao número de acompanhantes, ao número de passeios e à qualidade dos serviços pres- tados em uma viagem. Foram consultadas, de modo imparcial, 600 pessoas. a) Qual a população pesquisada? b) Quantas pessoas tem a população estatística envolvida nessa pesquisa? c) A amostra pesquisada foi de quantas pessoas? d) Quais foram às variáveis qualitativas pesquisadas? e) Quais foram às variáveis quantitativas pesquisadas? Classifique-as como discreta ou contínua. 2. Classifique a variável como qualitativa, quantitativa discreta ou quantitativa contínua. a) População: estudantes do IFAL. Variável: cor dos cabelos b) População: funcionários do IFAL. Variável: idade c) População: computadores produzidos por uma indústria de informática. Variável: número de peças usadas na fabricação d) População: pacientes de um hospital de Alagoas Variável: número de leitos ocupados e) População: jogadores de basquete de um clube brasileiro Variável: massa dos jogadores f) População: usuários de internet no Brasil Variável: provedor usado 3. Para pesquisar o refrigerante preferido dos estudantes de um dos Campi do IFAL com 2.100 alunos, foram selecionados, de modo imparcial, 650 estudantes. Com base nes- sas informações, responda: a) Qual a população dessa pesquisa? b) Quantas pessoas têm a população dessa pesquisa? c) A amostra dessa pesquisa é formada de quantas pessoas? d) Qual variável foi estudada nessa pesquisa? 4. Bernadete é dona de uma loja de brinquedos. Para ampliar a qualidade da loja, Ber- nadete resolveu pesquisar o perfil dos clientes em relação à renda mensal, ao modelo de brinquedo preferido, ao número de brinquedos que cada cliente compra e à quali- dade dos serviços prestados pela loja. Dos 2.000 clientes cadastrados nessa loja, 1.200 foram entrevistados: a) Qual a população dessa pesquisa? b) Quantas pessoas tem a população dessa pesquisa? c) A amostra pesquisada foi de quantas pessoas? d) Determine as variáveis pesquisadas e classifique-as como qualitativa, quantitativa contínua ou quantitativa discreta. Ferramentas necessárias ao Estudo de Estatística Apresentaremos alguns cálculos básicos que serão de extrema importância no es- tudo da Estatística. 2.1 Números Aproximados e Arredondamento de dados A norma NBR 5891 da Associação Brasileira de Normas Técnicas (ABNT) estabelece as regras fixas de arredondamento na numeração decimal, em uso na atualidade. Essas re- gras estão de acordo com a Resolução 886/1966 do IBGE. Sinais convencionais utilizados: 0,00 Dado numérico igual a zero resultante de arredondamento de dado numéri- co originalmente positivo. - 0,00 Dado numérico igual a zero resultante de arredondamento de dado numé- rico originalmente negativo. O arredondamento dos dados numéricos deve respeitar as diferenças significativas (absolutas e relativas) existentes entre eles. No arredondamento do dado numérico, quando o primeiro algarismo a ser abando- nado for 0, 1, 2, 3 ou 4, deve ficar inalterado o último algarismo a permanecer. Exemplos: 9,2377 (arredondado para número inteiro resulta 9); 9,2377 (arredondado para número com uma casa decimal resulta 9,2); 21,0509 (arredondado para número com duas casas decimais resulta 21,05). No arredondamento do dado numérico, quando o primeiro algarismo a ser abando- nado for 6, 7, 8 ou 9, deve-se aumentar de uma unidade o último algarismo a per- manecer. Exemplos: 399,85 (arredondado para número inteiro resulta 400); 399,86 (arredondado para número com uma casa decimal resulta 399,9); 9,2377 (arredondado para número com duas casas decimais resulta 9,24). Quando o primeiro algarismo a ser abandonado no arredondamento é 5, há dois pro- cedimentos: Se após o algarismo 5 seguir em qualquer casa um número diferente de zero (0), aumenta-se em uma unidade o algarismo que antecede o 5; Exemplos: 237,85001 (arredondado para número com uma casa decimal resulta 237,9); 5,5256 (arredondado para número com duas casas decimais resulta 5,53) Se após o algarismo 5 não seguir, em qualquer casa um número diferente de zero (0), ao algarismo que antecede o 5 será acrescentada uma unidade, se for impar, e permanecerá como está, se for par. Exemplos: 246,35 (arredondado para número com uma casa decimal resulta 246,4, pois o número que antecede o 5 é impar); 246,85 (arredondado para número com uma casa decimal resulta 246,8, pois o número que antecede o 5 é par, desta forma, ele fica inalterado); 12,1250 (arredondado para número com duas casas decimais resulta 12,12, pois o número que antecede o 5 é par); Observação: Nos softwares de computadores (como a planilha Excel) e calculado- ras cientificas, porém, não é aplicado o critério indicado neste item. Nesse caso, se o primeiro algarismo a ser abandonado for 5, o arredondamento será feito com o aumento de uma unidade ao algarismo que antecede o 5. Exemplos: 246,35 (arredondado para número com uma casa decimal resulta 246,4); 246,85 (arredondado para número com uma casa decimal resulta 246,9); 12,1250 (arredondado para número com duas casas decimais resulta 12,13); 2.2 Fração É uma parte do todo ou seja um par ordenado onde o segundo número é diferen- te de zero. b a , com a Є IN e b Є IN*. (a pertence ao conjunto dos números naturais e b pertence ao conjunto dos números naturais não nulos (com exclusão do zero). Fração Própria – é aquela onde o numerador é menor que o denominador como por exemplo: 17 13 , 7 2 , 5 3 , etc. Fração imprópria é aquela onde o numerador é igual ou maior que o denominador. Exemplo: 4 12 , 4 4 , 2 7 , etc. Fração aparente é a fração onde o numerado é múltiplo do denominador. Exemplo: 4 12 representa o número 3 pois 12:4 = 3; se o numerador é zero , a fração apresenta o número zero. Assim 0 4 0 . Todo número natural pode ser apresentado por uma fração com denominador 1. Assim 7 pode ser apresentado por 1 7 . Frações Equivalentes – duas frações são equivalentes quando os produtos do nume- rador de um pelo denominador da outra são iguais. Exemplo: para 2 1 e 4 2 onde temos: 1 x 4 = 2 x 2 Simplificação de frações - Basta dividir ambos os termos por um divisor comum. Exemplo: 2 1 36 33 6 3 Fração irredutível é aquela que os números são primos entre si (isto é , não possui outro divisor comum a não ser o número 1). Exemplo: 17 7 é uma fração irredutível, pois 7 e 17 são números primos entre si. Comparação de frações - Para compararmosduas ou mais frações deverão reduzi-la ao mesmo denominador e lembrar que, de duas frações com o mesmo denomina- dor, a maior é aquela que contém o maior numerador. Operações com frações Adição e subtração a) Frações homogêneas – conserva-se o denominador e adicionam-se ou subtraem os numeradores. Exemplo: 5 9 5 7 5 2 ou 3 5 3 2 3 7 b) Frações heterogêneas – reduzem-se as frações ao mesmo denominador, obtendo-se dessa forma frações homogêneas. Exemplo: 15 22 15 10 15 12 15 52 15 34 3 2 5 4 4/ Reduzindo ao mesmo denominador – para isso, vamos calcular o mínimo múlti- plo comum dos denominadores como no exemplo acima: mmc de 3 e 5, isto é, mmc(3,5)=15 3 5 3 1 5 5 1 1 3x5 Logo m.m.c de 3 e 5 é 3x5 =15 Observe que reduzimos ao mesmo denominador 3 e 5 para 15. Multiplicação de frações - Produto de numeradores por numeradores e denomi- nadores por denominadores. Exemplo: 21 12 37 43 3 4 7 3 , isto é, 3 x 4 = 12 e 7 x 3 = 21 o que resulta em 21 12 . O processo da multiplicação pode ser facilitado usando a simplificação pelo cancela- mento dos fatores comuns dos numeradores e dos denominadores. Exemplo: 5 3 3 2 , nesse caso é possível simplificar 3 por 3 ou seja 3:3 =1 ficando dessa forma 2 X 1 = 2 e 1 X 5 = 5 o que resulta em 5 2 . Divisão de frações - Produto da primeira pelo inverso da segunda. Exemplo: 6 7 32 71 3 7 2 1 7 3 2 1 Potenciação de Frações - Devemos elevar o numerador e o denominador a esse expoente. Exemplo: 25 4 5 2 5 2 2 22 . Nota: Sempre que possível simplificar o resultados como vimos no tópico de simplifica- ção de frações. 2.3 Porcentagem ou Percentagem O calculo da porcentagem é uma operação das mais antigas, em termos de cálculos comerciais e financeiros. A expressão por cento é indicada geralmente por meio do sinal %, quando efetuamos um cálculo de porcentagem, na verdade estamos efetuando um simples calculo de proporção. Podemos dizer também que são razões que consistem em considerar um total qualquer igual a 100% e, através de uma regra de três simples, esta- belecemos qualquer relação com as parcelas que compõem o total. Uma forma de cálculo é a seguinte: 100 PercentualxValor mPorcentage Denominamos razões percentuais as razões cujos conseqüentes (ou denominador) sejam iguais a 100. Representação: Em fração; 100 30 (trinta por cem ou vinte sobre cem); 100 20 (vinte por cem ou vinte sobre cem), Em forma unitária: 0,30 ( zero virgula trinta ou zero virgula três); 0,20 (zero vírgula vinte ou zero virgula dois). Em forma percentual: 100 30 corresponde a 30% (trinta por cento); 100 20 corresponde a 20% (vinte por cento). Exemplos: 1) Em uma classe de 30 estudantes, 15 foram aprovados. Qual a taxa percentual de aprovação? Valor Percentual 30 ------- 100% 15 ------ X (%) onde: 30X = 100 x 15 30X = 1500 X = 1500/30 = 50% Logo, foram aprovados 50% dos estudantes. 2) Ao comprar um livro , obtive um desconto de R$3,00. Qual o preço do livro saben- do que a taxa de desconto foi de 5%? Valor Percentual 3 ------- 5% X ------ 100(%) 5X = 300 X = 300/5 = 60, isto é, o preço do livro foi R$60,00. 2.4 Somatórios Muitas vezes necessitamos escrever expressões que envolvam somas com muitos termos ou elementos, ou cujos termos ou elementos obedecem a certa lei de formação. Por exemplo: 1 + 2 + 3 + 4 +....+ 50 Simbolizaremos por 1x o primeiro termo, 2x o segundo termo, 3x o terceiro termo, 50x o qüinquagésimo termo. Assim, poderemos representar ix como sendo o i- ésimo termo da soma. Chamaremos de n o número de termos da soma. Desta forma, na ilustração, n=50. A soma de n termos pode ser simbolicamente representada por n i ix 1 No caso do exemplo anterior termos 50 termos, então n=50 e a soma desses cin- qüenta termos ou números será representada por 50 1i ix Vejamos as partes do símbolo do somatório O símbolo é a letra grega sigma maiúscula. A instrução para somar O primeiro elemento dos termos a serem somados O n é o último termo ou ele- mento a ser somado x é o nome dos termos ou elementos a serem somados i é uma observação individual ou índice para cada termo n i ix 1 Lê-se: “Somatório de ix , para i variado de 1 até n” ou “soma de ix , para i va- riado de 1 a n” Exemplo: Sendo 1;2;8;3;7 54321 xxxxx , calcule 5 1i ix . Solução: 21 ,éisto,211283754321 5 1 i i i x xxxxxx Propriedades: I Se cada elemento da soma for multiplicado por um número (ou uma constante), os elementos da soma podem ser somados, e depois a soma será multiplicada pe- lo número (ou constante). ii xccx ii xx 22 II A soma de um número (ou constante) sobre n termos é igual a n vezes o número (ou constante). ncc 202102 10 1 x i III O somatório da soma (ou diferença) é igual à soma (ou diferença) de somatórios. iiii yxyx )( IV O somatório de 2 ix 22 3 2 2 2 1 2 ni xxxxx Observação: 2 2 )( ii xx Quando não houver possibilidades de dúvida, podemos eliminar os índices. As- sim: n i i n i i xxxx 1 2 1 2 ,deinvesaousados,serão, Atividade 1. Qual o resultado de 3/4 + 4/5: a. 31/20 b. 30/20 c. 22/20 d. 1/4 2. Quanto é 6/12 X 2/9: a) 1/9 b) 2/3 c) 3/5 d) 1/25 3. Eu uma classe de 50 estudantes faltaram 15. Qual a quantidade de estudantes presentes em porcentagem? a) 30% b) 70% c) 25% d) 35% 4. Por quanto devo vender um objeto que me custou R$ 150, para ter um lucro de 20% sobre o custo? a) R$ 170,00 b) R$ 180,00 c) R$ 185,00 d) R$ 190,00 5. Calcule: a) 2% de 458,94 b) 33% de 280 c) 100,4% de 110 d) 0,5% de 238 10 Sendo 1;2;8;3;7: 54321 xxxxxX 2;6;1;1;3: 54321 yyyyyY Calcular: a) ix b) iy c) )( ii yx d) ii yx e) )1( ix f) 2 i x g) 2 iy Obtenção de Dados A polêmica em torno de dados estatísticos é comum. Basta que seja divulgado os resultados de uma pesquisa de intenção de votos, por exemplo, para que alguns candida- tos envolvidos saiam contestando sua validade. A Estatística é um instrumento eficiente para a compreensão e interpretação das realidades e não deve ser subestimada. Realmente, existem pesquisas feitas de forma incorreta e que, por isso, não são confiáveis. Mas, em geral, quando um estudo estatístico é feito com bastante critério, seus resultados permitem obter conclusões e prever tendências sobre fatos e fenômenos estudados. Entretanto, um estudo bem feito não elimina o erro, mas limita-o a uma margem de erro, procurando torná-lo o menor possível. 3.1 Etapas do Método Estatístico Vamos discutir nesta unidade a importância de cada etapa do métodoestatístico e como falhas na sua execução poderá levar a resultados enganosos Quando buscamos tomar decisões do nosso dia a dia estamos direta ou indiretamente fazendo um levantamento de dados observados. A informação obtida de cada elemento da população (ou da amostra) é gravada ou arquivada e apresentada na ordem em que as entrevistas ou medidas são realizadas. Ao decidir, por exemplo, pela compra de um determinado bem, procuramos veirificar se esse bem satisfaz as nossas espectativas, se o seu preço é compativel com o nosso orçamento, além de outras situações ou caracteristicas. Para um estudo estatístico confiável depende do planejamento e da correta execu- ção das etapas da pesquisa. Desde a mais simples até a mais complexa pesquisa de mercado deve ser planejada para evitar falhas de todos os tipos, desde a escolha incorreta do método a ser usado até a importância das informações obtidas para o processo decisório. 3.1.1 O que devemos pesquisar – primeiramente, é preciso definir com clareza quais os objetivos da pesquisa que queremos realizar, ou seja, o que se pretende apurar, que tipo de problema está se buscando detectar. Objetivo – quais perguntas a pesquisa vai responder. EXEMPLO: Objetivo Geral: conhecer o perfil de trabalho dos funcionários de um de- terminado hotel, para orientar políticas de gestão de pessoas. Para podermos dar seqüência a esta pesquisa, precisamos especificar melhor o que queremos conhecer da população de funcionários desse hotel, ou seja, os objetivos específicos. Alguns destes objetivos específicos poderiam ser: Conhecer o tempo médio de serviço dos funcionários neste hotel. Conhecer a distribuição do grau de instrução dos funcionários. Verificar o interesse dos funcionários em participar de programas de treinamento. Avaliar o grau de satisfação dos funcionários com o trabalho que exercem no ho- tel. Verificar se existe associação entre o grau de satisfação do funcionário com a sua produtividade. A elaboração dos objetivos específicos deve ser feita, de tal maneira, que forneça uma primeira indicação das características que precisamos observar. Por exemplo, para atingir aos objetivos do problema em questão, precisamos levantar as seguintes caracte- rísticas de cada funcionário: tempo de serviço, grau de instrução, interesse em participar de treinamento, grau de satisfação com o trabalho e produtividade, etc. 3.1.2 Qual o Público-alvo? Chamamos de publico alvo ou população alvo ao conjunto de elementos que quere- mos abranger em nossa pesquisa. São os elementos para os quais desejamos que as con- clusões vindas da pesquisa sejam válidas. No exemplo anterior, a população alvo que será definida são todos os funcionários do hotel. Entretanto, se a coleta de dados for feita no próprio local de trabalho e no período de uma semana, os funcionários que neste período estão de férias ou de licença ficam de fora do levantamento. Desta forma, as conclusões baseadas nesses dados não valem, necessariamente, para todos os funcionários do hotel. Assim, definimos como população acessível, ou simplesmente como população, o conjunto de elementos que queremos abranger em nossa pesquisa e que são passiveis de serem observados, com respeito às características que pretendemos levantar. Reali- zando adequadamente a pesquisa, podemos garantir que os resultados serão validos para este conjunto de elementos. 3.1.3 Como desenvolveremos o plano de pesquisa Vejamos algumas questões importantes a. Qual método de pesquisa será usado b. Qual o Universo da Pesquisa c. Qual a Amostra d. Já existem pesquisas anteriores sobre o tema? Elas servem de referencia para as pesquisas futuras? Que aspectos devem ser aprimorados ou modificados na nova pesquisa? e. De quanto tempo se dispõe para fazer a pesquisa? Que grau de precisão ele exi- ge? f. Quais os fatores relacionados ao objeto de estudo, ou que variáveis estão envol- vidas no problema em questão? 3.1.4 Como a pesquisa será feita – è necessário elaborar uma estratégia para fazer o levantamento de dados. 3.1.4.1 Quais os dados significativos para a pesquisa? 3.1.4.2 Existem dados disponíveis em algum órgão especializado, como por exemplo IBGE ou outros? 3.1.4.3 Se não, como os dados serão obtidos? Diretamente, por exemplo, por meio de questionários ou de entrevistas? 3.1.4.4 A coleta abrangerá toda a população pesquisada ou será parcial, isto é, será feita a partir de uma amostra da população? 3.1.4.5 Deve-se considera que a escolha da amostra é fator muito importante para o sucesso da pesquisa. Ela precisa retratar da melhor forma possível a popula- ção pesquisada. 3.1.4.6 Em muitas pesquisas, os dados são obtidos por meio de entrevistas e questio- nários. Alguns cuidados devem ser tomados na elaboração das perguntas. Neste contexto, deve-se evitar questões abertas do tipo: “Qual sua opinião sobre a situação econômica brasileira?” È mais conveniente limitar as respostas. Por exemplo: Na sua opinião a situação econômica brasileira: ( ) vai melhorar ( ) vai piorar ( ) não sabe/não respondeu As vezes é interessante apresentar uma questão filtro, para que não se pergun- tem coisas que o individuo não tenha condição de responder. Por exemplo: Você lê jornal? ( ) sim ( ) não Veja que a resposta dessa questão determina o rumo da entrevista, pois se for sim, pode-se perguntar: Quais jornais? Com que freqüência você lê? Etc. Se for não, pode-se perguntar: Por quê? Etc. As perguntas devem ser claras e simples, a fim de não criar constrangimentos ao entrevistado. A entrevista precisa ser curta, para não deixar o entrevistado ente- diado. Evita questões do tipo: o Você toma banho todos os dias? o Qual a sua renda mensal? Informações pessoais podem ser obtidas de forma indireta, com questões do tipo: o Tem casa própria? Automóvel? Eletrodomésticos? o Quanto gasta com energia? E com água? 3.1.5 Organização e apresentação dos dados – Os dados coletados devem ser organi- zados em tabelas que facilitem a visualização e o cálculo de medidas estatísticas (médias, desvios e amplitude da amostra, etc.). As tabelas podem ser representadas por meio de gráficos que permitem um exame ainda mais rápido e fácil dos resultados da pesquisa 3.2 Apresentação tabular Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A elaboração de tabelas obedece à Resolução nº 886, de 26 de outubro de 1966, do Con- selho Nacional de Estatística. As normas de apresentação são editadas pela Fundação Brasileira de Geografia e Estatística (IBGE). IBGE. Centro de Documentação e Dissemina- ção de Informações. Normas de apresentação tabular. 3. ed. Rio de Janeiro: IBGE, 1993. Tabela é a forma não discursiva de apresentar informações, das quais o dado numérico se destaca como informação central. 3.2.1 Representação esquemática Recomendações gerais – Recomenda-se que: uma tabela seja elaborada de forma a ser apresentada em uma única página o número de células com dado numérico seja superior ao número de células com sinal convencional a classificação outros ou outras quando existir, indique um dado numérico pro- porcionalmente inferior aos dados numéricos indicados pelas demais classifica- ções existentes as tabelas de uma publicação apresentam uniformidade gráfica como, por exem- plo, nos corpos e tipos de letras e números, no uso de maiúsculas e minúsculas e nos sinais gráficos utilizados. 3.2.2 Elaboração geral 3.2.2.1 Topo ou Título– identificação da tabela. O título deve responderas se- guintes questões: - O que? (Assunto a ser representado (Fato)); - Onde? (O lugar onde ocorreu o fenômeno (local)); - Quando? (A época em que se verificou o fenômeno (tempo)). 3.2.2.2 Número – toda a tabela deve ter número, inscrito no topo, sempre que um documento apresentar duas ou mais tabelas, facilitando a identifica- ção e localização. A numeração deve ser arábica e seqüencial. Tabela 1 – Tabela 2 – 3.2.2.3 Moldura – elemento fundamental para estruturar a tabela. É composta apenas de traços horizontais; o primeiro separa o topo, o segundo para separar o espaço do cabeçalho e o terceiro para separar o rodapé. A moldura não deve conter traços verticais que a delimitem à esquerda e à direita. 3.2.2.4 Cabeçalho – elemento obrigatório para identificação do conteúdo das colunas. Recomenda-se que a identificação com palavras seja feita por extenso, sem abreviações. O cabeçalho, que é a apresentação do que ta tabela está procurando representar, deve conter o suficiente para que sejam respondidas as seguintes questões: O quê? (referente ao fato, Onde? (referente ao lugar), Quando? (referente ao tempo). 3.2.2.5 Indicador de linha – a identificação do conteúdo das linhas deve ser fei- ta de forma concisa e clara. Recomenda-se que a identificação com pala- vras seja feita por extenso, sem abreviações. 3.2.2.6 Corpo: parte da tabela composta por linhas e colunas. Linhas: parte do corpo que contém uma seqüência horizontal de infor- mações. Colunas: parte do corpo que contém uma seqüência vertical de informa- ções. Coluna Indicadora: coluna que contém as discriminações corresponden- tes aos valores distribuídos pelas colunas numéricas. 3.2.2.7 Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna. 3.2.2.8 Unidade de medida – deve aparecer inscrita no espaço do cabeçalho ou nas colunas indicadoras. A indicação da expressão quantitativa ou me- trológica dos dados numéricos deve ser feita com símbolos ou palavras entre parênteses. (m) ou (metro) (t) ou (tonelada) (R$) ou (real) Quando uma tabela contiver dados numéricos divididos por uma constante, esta deve ser indicada por algarismos arábicos, símbolos ou palavras, entre parênteses, precedendo a unidade de medida quando for o caso. (1 000 t) ou (1000t) = indica dados numéricos em toneladas que foram divididos por mil (R$1.000) ou (R$ 1.000) = dados em real que foram divididos por mil (%) ou (percentual) = dados numéricos proporcionais a cem (%o) ou (por mil) = dados numéricos proporcionais a mil (1 / 1000) = dados numéricos que foram multiplicados por mil 3.2.2.9 Sinal convencional – a substituição de um dado numérico deve ser feita, sempre que necessário por um dos sinais abaixo: - Dado numérico igual a zero não resultante de arredondamento .. Não se aplica dado numérico ... Dado numérico não disponível x Dado numérico omitido a fim de evitar a individualização da informação 0 0,0 Dado numérico igual a zero resultante de arredondamento de um dado numérico originalmente positivo 0,00 etc. -0 -0,0 Dado numérico igual a zero resultante de arredondamento de um dado numérico originalmente negativo -0,00 etc. 3.2.2.10 Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas de natureza informativa (fonte, notas e chama- das). 3.2.2.11 Chamada – uma tabela deve ter chamada, inscrita em qualquer um de seus espaços, sempre que houver necessidade de se remeter algum de seus elementos a uma nota específica. Notas: Sinais convencionais utilizados: ... Dado numérico não disponível. .. Não se aplica dado numérico. A remissiva atribuída a algum dos elementos de uma tabela deve ser feita com al- garismos arábicos em destaque: entre parênteses, entre colchetes, exponencial. (1) Percentual de pessoas de 15 anos ou mais de idade procurando trabalho, em relação às pessoas de 15 anos ou mais de idade economicamente ativas, na semana de referência. 3.2.2.12 Fonte – toda a tabela deve ter fonte, inscrita na primeira linha do seu rodapé, para identificar o responsável (pessoas física ou jurídica) ou res- ponsáveis pelos dados numéricos (Fonte ou Fontes). A identificação deve ser feita por extenso. Quando todas as tabelas forem retiradas de uma única fonte, já identificada na própria publicação, é dispensável aparecer em cada uma das tabelas. Recomenda-se que, em tabelas com dados numéricos extraídos de um documento, a identificação da fonte indique a referência bibliográfica do documento Exemplo Fonte: Pesquisa Industrial – 1982-1984. Dados gerais, Brasil. Rio de Janeiro: IBGE, v.9, 410p. 3.2.2.13 Nota geral – uma tabela deve ter nota geral, inscrita no seu rodapé, logo após a fonte, sempre que houver necessidade de se esclarecer o seu conteúdo geral (Nota ou Notas). Notas: Sinal convencional utilizado: - Dado numérico igual a zero não resultante de arredondamento. 3.2.2.14 Nota específica – a nota específica (quando esta existir) deve aparecer logo após a nota geral. Quando houver mais de uma, estas devem ser distribuídas obedecendo à ordem de numeração da chamada. 3.2.3 Apresentação de tempo – toda a série temporal consecutiva deve ser apre- sentada, em uma tabela, por seus pontos, inicial e final, ligados por hífen ( - ). Quando uma tabela contiver dados numéricos de um período temporal dife- rente do ano civil, isto deve ser indicado no título, em nota geral ou nota específica. 1981-1985 = indica dados numéricos para os anos de 1981, 1982, 1983 ,1984 e 1985. OUT 1991-MAR 1992 = indica dados numéricos para os meses de outubro, no- vembro e dezembro de 1991 e janeiro, fevereiro e março de 1992. 30.05.1991-06.06.1991 = indica dados numéricos para os dias 30 e 31 de maio de 1991 e 1, 2, 3, 4, 5 e 6 de junho de 1991. 1981/1985 = apresenta dados numéricos para os anos de 1981 e 1985, não sendo apresentados dados numéricos de pelo menos um dos anos desta série temporal. 1988, 1990, 1991 = apresentam dados numéricos para os anos de 1998, 1990 e 1991. Safra 91/92 = apresenta dados numéricos de uma safra iniciada em 1991 e termi- nada em 1992. 3.2.4 Apresentação de classe de freqüência – deve ser apresentada em uma tabela sem ambigüidade, por extenso ou com notação. W a menos de Z w|---- z. = 15 a menos de 30 bovinos por km². Mais de W a Z w----| z. = Mais de ¼ a ½. W|----| z. = 40 a 49 anos. Arredondamento numérico – os dados numéricos devem ser arredondados, em uma tabela, sempre que houver necessidade de apresentá-los com um menor número de algarismos. Isto deve ser indicado em nota geral ou nota específica. Notas – Dados numéricos arredondados. Sinais convencionais utilizados: 0,00 Dado numérico igual a zero resultante de arredondamento de dado nu- mérico originalmente positivo. O arredondamento dos dados numéricos deve respeitar as diferenças signi- ficativas (absolutas e relativas) existentes entre eles. 9,2377 = arredondado para número inteiro resulta 9 9,2377 = arredondado para número com uma casa decimal resulta 9,2 9,2377 = arredondado para número com duas casas decimais resulta 9,24 399,85 = arredondado para número inteiro resulta 400 399,85 = arredondado para número com uma casa decimal resulta 399,9 Quando houver divergência entre a soma das parcelas arredondadas e o total arredondado, pode-se incluir uma nota geral esclarecendo a divergência. 3.2.5 Arredondamentode dado numérico – os dados numéricos devem ser arre- dondados, em uma tabela, sempre que houver necessidade de apresentá-los com um menor número de algarismos. Isto deve ser indicado em nota geral ou nota específica. Exemplo Nota: Dados numéricos arredondados. O arredondamento dos dados numéricos deve respeitar as diferenças significati- vas (absolutas e relativas) existentes entre eles. No arredondamento do dado numérico, quando o primeiro algarismo a ser arre- dondado for 0, 1, 2, 3 ou 4, deve ficar inalterado o último algarismo a permane- cer. Exemplo 9,2377 – arredondado para o número inteiro = 9 9,2377 - arredondado para número com casa decimal = 9,2 21,0509 - arredondamento para número com duas casas decimais = 21,05 No arredondamento do dado numérico, quando o primeiro algarismo a ser aban- donado for 5, 6, 7, 8 ou 9, deve-se aumentar de uma unidade o último algarismo a permanecer Exemplo 399,85 – arredondado para o número inteiro = 400 399,85 - arredondado para número com casa decimal = 399,9 9,2377 - arredondamento para número com duas casas decimais = 9,24 Quando em uma tabela, depois de feito o arredondamento dos dados numéricos, houver divergência entre a soma das parcelas arredondadas e o total arredonda- do, deve ser adotado um dos seguintes procedimentos · Inclusão de uma nota geral esclarecendo a divergência Exemplo Nota: As diferenças entre a soma das parcelas e respectivos totais são proveni- entes do critério de arredondamento. · Correção na parcela (ou parcelas) em que for menor o valor absoluto da razão entre a diferença de arredondamento (dado numérico original menos dado nu- mérico corrigido) e o dado numérico original. Exemplo: Dado numérico original Dado numérico arredondado 7,6 7,6 11,6 11,6 20,2 20,2 --------- ---------- 39,4 39 · Porém: 8 + 12 + 20 = 40 3.2.6 Diagramação da tabela – toda a tabela que ultrapassar as dimensões da pági- na deve obedecer a: cada página deve ter o conteúdo do topo e o cabeçalho da tabela ou o cabeçalho da parte cada página deve ter uma das seguintes indicações: continua para a primeira; conclusão para a última e continuação para as demais cada página deve ter colunas indicadoras e seus respectivos cabeçalhos o traço horizontal da moldura que separa o rodapé deve ser apresentado somen- te em cada página que contenha a última linha da tabela o conteúdo do rodapé só deve ser apresentado na página de conclusão. Quando a tabela ultrapassar a dimensão da página em número de linhas e tiver pou- cas colunas, pode-se ter o centro apresentado em duas ou mais partes, lado a lado, na mesma página, separando-se as partes por um traço vertical duplo e repetindo-se o ca- beçalho. Quando for grande o número de colunas e poucas linhas pode-se ter o centro apre- sentado em duas ou mais partes, uma em baixo da outra, na mesma página, repetindo-se o cabeçalho das colunas indicadoras e os indicadores de linha. 3.3 Análise e avaliação dos resultados obtidos Depois de feitas a coleta e a apresentação dos dados, parte-se agora para a análise dos resultados. Esta é a fase mais importante do projeto de pesquisa: obter conclusões a partir da pesquisa, para: 1. Encaminhar soluções para os problemas detectados. Por exemplo: - o número de acidentes de trabalho num hotel é maior em determinados setores. 2. Verificar a validade de hipóteses. Por exemplo: - um produto será bem aceito pelos hospedes? 3. Estabelecer parâmetros para a população como concentração de renda, nível de emprego, condições de moradia, saúde, educação, etc. 3.4 Tomar as decisões Uma das etapas mais difíceis de um trabalho de pesquisa, por isso requer que to- dos os passos anteriores sejam bem aplicados e analisados. 3.5 Aplicação do método estatístico através de um projeto de pesquisa Nesta seção apresentaremos um exemplo de um projeto de pesquisa relativa- mente bem simples, desenvolvido co a participação de launos da disciplina de Estatística do Curso de Gestão Ambiental do IFAL, semestre 2009-2, com finalidade puramente a- cadêmicas: O problema de pesquisa: a relação de um estudante do IFAL e o curso que está fazendo. Objetivo geral: Num curso do IFAL, conhecer melhor a relação entre o estudante e o cur- so que esta fazendo. Em particular, no Curso de Gestão Ambiental do IFAL. Objetivos específicos: I. Avaliar o grau de satisfação do estudante com o curso que está realizando. II. Verificar se existe associação entre o grau de satisfação do estudante com o seu desempenho no curso. III. Levantar os aspectos positivos e negativosdo curso, na visão do estudante. População: Estudantes que estavam cursando as três últimas fases do Curso de Gestão Ambiental do IFAL, semestre 2009-2. Amostra: Optamos por um processo rápido e fácil para a seleção da amostra. Tomamos três disciplinas obrigatórias das três últimas fases e aplicamos o questionário em sala de aula. A amostra foi, então, formada pelos estudantes presentes nos dia de aplicação dos questionários. Forma de mensuração das variáveis1 Satisfação com o curso: uma avaliação numérica numa escala de 1 (um) a 5 (cin- co), de acordo com o grau que o estudante julgar que melhor se adapte à sua satisfação com o curso em questão, complementando com avaliações de aspectos específicos do curso, como seu corpo docente, recursos materiais disponíveis e sue conteúdo curricular. Desempenho do estudante: Índice de aproveitamento acumulado, calculado pela instituição, em função dos conceitos (ou notas) obtidos pelo estudante nas disciplinas 1 Estatiistica Aplicada as Ciências Sociais. Pedro Alberto Barbetta, pagina 29 cursadas. Então, os dados relativos a esta variável são dados secundários, isto é, devem ser solicitados da instituição. Aspectos positivos e negativos do Curso: serão observados de duas maneiras: I. Avaliações numéricas, numa escala de um (1) a cinco (5, de acordo com o grau que o estudante julgar que lhe melhor se adapte a sua concordância com alguns aspectos do curso. II. Deixar o estudante descrever livremente o principal aspecto positivo e negativo do curso. Nesta segunda situação, as categorias destas duas variáveis serão cria- das após a realização de uma analise das repostas dos questionários, isto é, as respostas similares serão agrupadas numa única categoria. Técnicas de Amostragem Neste capitulo apresentaremos as técnicas de amostragem mais utilizadas no cotidiano de estatistica. A amostragem é bastante usada em nossa vida diaria, por exemplo, para verificar o temprero de um alimento em preparação, podemos provar (observar) uma pequena porção deste alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo (população) uma parte (amostra), com o proposito de avaliarmos (inferirmos) sobre a qualidade de tempero de todo o alimento. Num aeroporto internaciona, a escolha dos passageiros, para a revista da bagagem, é feita por amostragem. Nas pesquisas cientificas, em que se quer conhecer algumas caracteristicas de uma população, também é muito comum se observar apenas uma maostra de seus elementos e, a partir dos resultadosdessa amostra, obter valores aproximados, ou estimativas, para as caracteristicas populacionais de interesse. Este tipo de pesquisa é usualmente cahmado de levantamento por amostragem. Existem técnicas adequadas para recolher amostras, de forma a garantir (tanto quanto possivel) o sucesso da pesquisa que ser quer realizar e dos resultados esperados. Num levantamento por amostragem, a seleção dos elementos que serão efetivamente observados, deve ser feita sob uma metodologia bem adequada, de tral forma que os resultados da amostra sejam informativos para avaliar caracteristicas de toda a população pesquisada. Exemplos: 1. Numa pesquisa sobre lincenciados em biologia no Estado de Alagoas, a população pode ser definida como todas as pessoas que se formaram em biologia no estado, no momento da pesquisa. O principal pârametro a ser avaliado deve ser a percentagem de pessoas que atuam no Estado. 2. Numa pesquisa eleitoral, a três dias de uma eleição municipal, a população pode ser definida como todos eleitores com domicilio eleitoral no municipio. Os principais parâmetros devem ser as percentagens de votos de cada candidato à prefeitura, no momento da pesquisa. 3. Para planejar politicas de recursos humanos em empresas, com milhares de funcionarios, podemos realizar uma pesquisa para avaliar alguns parâmetros da população de funcionarios destas empresas, tais como: tempo médio de serviço dos funcionários na empresa, percentagem de funcionários com nível de instruçãosuperior, percentagem de funcionários com interesse num certo programa de treinamento, etc.. Nos exemplos acima podemos perceber a dificuldade em pesquisar toda a população. São situações típicas em que se recomenda utilizar amostragem. Observe a figura abaixo. FIG – Ilustração de um levantamento por amostragem – exemplo 3 O termo inferencia estatistica refe-se ao uso apropriado dos dados da amostra para se ter algum conhecimento sobre os parâmetros da população. Os valores calculados a partir dos dados da amostra, com o objetivo de avaliar parâmetros desconhecidos, são chamados de estimativas desses parâmetros. Por que devemos estudar técnicas de amostragem? Economia – O levantamento de dados sobre uma parte da população é mais econômico que o levantamento de dados sobre toda a população. Tempo – O levantamento de dados sobre uma parte da população é mais rápido que o levantamento de dados sobre toda a população. Confiabilidade dos dados – Quando se pesquisa um número reduzido de elementos, pode-se dar mais atenção aos casos individuais, evitando erros nas rspostas Operacionalidade – É muito mais fácil realizar operações de pequena escala. Um dos problemas típicos nos grandes censos é o controle dos entrevistadores. Um problema fundamental da amostragem é garantir que as unidades escolhidas representem a população. Por exemplo, se a população em foco são os turistas que viajam ao exterior, um critério de seleção que exclua pessoas com mais de 50 anos pode produzir informações não representativas, principalmente se a caracteristica em foco for algo como a renda ou o consumo potencial do entrevistado ou de sua familia. Estimativa de parâmetros populacionais Tempo de serviço no hotel Percentagem de funcionários com nivel de instrução superior, etc. A inferência estatística O processo de amostragem POPULAÇÃO: Todos os funcionários dos hotéis AMOSTRA: Alguns funcionários do hotel Evidentemente, há várias maneiras se se extrair uma maotra de n unidades de um apopulação de N elementos ou objetos. No entanto, os vários modos de seleção das possíveis unidades de analise são agrupadas em dois processos básicos: o aleatório e o não-aleatório (também denominados respectivamente de probabilistico e não- probabilistico). Obviamente cada um deles tem suas vantagens e usos especificos. Deve-se haver critério para a seleção desses elementos; cada elemento da população deve ter a amesma chance de ser escolhido para garantir à amostra o caráter de represenatividade. As técnicas para a determinação da amostragem são: Amostragem casula ou aleatória simples; Amostragem proporcional estratificada; Amostragem sistemática. 4.1 Amostragem Casual ou Aleatória Simples Para a seleção de uma amostra casual ou aleatória simples precisamos ter uma lista completa dos elementos da população (ou de unidades de amostragem apropriadas). Este tipo de amostragem consiste em selecionar a amostra através de um sorteio, sem restrição. É sempre recomendavel que a amostra contenha no mínimo 10% da população pesquisada. Inicialmente, devemos listar ou numerar de 1 a N a população a ser analisada, e posteriormente selecionar uma amostra de n elementos da população mediante um sorteio. Para evitar o desconforto de se escrever os números em pedaços de papel (todos iguais), dobrá-los (todos iguais), colocá-los em uma urna e retirá-los um a um, podemos utilizar tabelas para esse fim; são as chamadas tabelas de números aleatórios. A amostargem aleatória simples tem a seguintes propriedade: qualquer subconjunto da população, com o mesmo número de elemntos, tem a mesma probabilidade de fazer parte da amostra. Em aprticular, temos que cada elemento da população tem a mesma probabilidade de pesrtencer à amostra.2 2 Estas propriedades podem ser verificadas através do cálculo de probabilidade. A probabilidade de um elemento particular da população pertencer à amostra e é dada por n/N. As tabelas de números aleatórios facilitam o processo de seleção de uma amostra aleatória.Estas tabelas são formadas por sucessivos sorteios de algarismos do conjunto {0, 1, 2, 3, 4, ..., 9}. A leitura da tabela pode ser da direita para esquerda ou vice-versa, de cima para baixo ou vice-versa, na diogonal, ou formando um caminho qualquer. O caminho sempre dever ser definido com antecedência. Exemplo: Com o objetivo de estudar algumas caracteristicas dos funcionários de uma escola, vamos extratir uma amostra aleatória simples de tamanho cinco. A listagem dos funcionários da escola é apresentado a seguir.3 Aristoteles Anastacia Arnaldo Bartolomeu Bernardo Cardoso Carlito Claudia Emilio Ercilio Ernesto Endevaldo Francisco Felicio Fabricio Geraldo Gabriel Getulio Heraldo João da Silva Joana Joaquim Joaquina José da Silva José de Souza Josefa Josefina Maria José Maria Cristina Mauro Paula Paulo Cezar Para utilizar uma tabela de números aleatória, precisamos associar cada elemnto da população a um número. Vejamos (1) Aristoteles (2) Anastacia (3) Arnaldo (4) Bartolomeu (5) Bernardo (6) Cardoso (7) Carlito (8) Claudia (9) Emilio (10) Ercilio (11) Ernesto (12) Endevaldo (13) Francisco (14) Felicio (15) Fabricio (16) Geraldo (17) Gabriel (18) Getulio (19) Heraldo (20) João da Silva (21) Joana (22) Joaquim (23) Joaquina (24) José da Silva (25) José de Souza (26) Josefa (27) Josefina (28) Maria José (29) Maria Cristina (30) Mauro (31) Paula (32) Paulo Cezar Para extrairmos uma amostra alaeatória simples de tamanho n=5, basta tomar cinco números aleatórios do conjunto {1, 2, ..., 32}. Números aleatórios extraídos da tabela 8, 30, 16, 2, 9 Amostra da população de funcionários (Claudia, Mauro, Geraldo, Anastacia,Emilio). 3 Para facilitar a exemplificação das técnicas de amostragem, usaremos populações pequenas. Contudo, não se costuma usar amostragem aleatória em população muito pequena Na realidade, estamos interessados na observação de certas variáveis associadasaos elemntos da amostra. No exmplo, poderiamos estar interessados na variável tempo de serviço no hotel, em anos completos. Denominaremos esta variável de X. Para cada funcionário da amostra, temos um valor para a variável X. O conjunto desse valores, observado na amostra de funcionários, é chamada de amostra aleatória simples da variável X. Amostra aleatória simples de funcionários: {Claudia, Mauro, Geraldo, Anastacia, Emilio} Amostra aleatória simples da variável X },,,,{ 54321 XXXXX etc. Mauro, do serviço de tempo oéX Claudia, da serviço de tempoo é 21X 4.2 Amostragem Proporcional Estratificada A amostragem prporcional estratificada considera a população dividida em subconjuntos, em que cada subconjunto recebe o nome de estrato. Cada subconjunto (chamado estrato) tem uma caracteristica comum entre seus elementos. Estes estratos devem ser internamente mais homogêneos do que a população toda, com respeito às variáveis em estudo. Por exemplo, para estudar o interesse dos funcionários, de uma grande empresa, em realizar um programa de treinamento, podemos estratificar esta população por nivel de instrução ou pelo nivel hierárquico, ou ainda, por setor de trabalho. Exemplo: Suponha uma escola com 84 funcionário, em que 25 pessoas são do sexo feminino e as 59 restantes são do sexo masculino. A população é constituida de pelo menos 84 funcionários: N=84 (100%). Um dos estratos é constituído pelos funcionários do sexo masculino: %)70(591 N , o outro estrato é constituido pelos funcionários de sexo feminino: %)30(251 N . A composição dos elementos da amostra deve manter a mesma proporcionalidade dos estratos, do estrato 1N serão retirados 70% dos elementos da amostra e o estrato 2N serão retirados 30% dos elementos da amostra. Desta forma, tomaremos n=9. Assim, Estrato Proporção da população Sugrupo da amostra Homens 59/84=0,70 (ou 70%) 6970,01 xn Mulheres 25/84=0,30 (ou 30%) 3930,01 xn Sendo dos nove elementos da amostra : 6 homens e 3 mulheres. 4.3 Amostragem de Conglomerados Conglomerados são divisões populacionais tendo em conta a proximidade física dos elementos. Por exemplo, a população brasileira pode ser conglomerada em Estados (Alagoas, Bahia, Ceará, etc.); a alagoana pode ser conglomerada em cidades de Alagaos (Maceió, Arapiraca, Maragogi e outras); a cidade de Maceio, em bairros (Tabuleiro, Pajuçara, Ponta Verde, etc.); os bairros são conglomeráveis em quarteirões etc. A vantagem dos conglomerados é a proximidade fisica dos individuos, fato que facilita a coleta de dados (não se precisa ter uma listagem completa da população). Observe-se que estratificar e conglomerar são etapas facilitadoras da amostragem. Definidos os estratos ou conglomerados, os elementos a inspecionar serão mais representativos se escolhidos mediante os critérios estabelecidos para a amostragem aleatória. Exemplo: Considere o problema de selecionar uma amostra de domicilios de uma cidade. Podemos tomar as ruas como conglomerados, como indicado no quadro abaixo, onde A1 representa o primeiro domicilio da rua A, A2 o segundo, e assim por diante. 4 Grupos foram escolhidos. Ruas Domicilios A A1, A2, A3, A4, A5, A6 B B1, B2, B3, B4, B5, B6, B7, B8, B9, B10, B11, B12, B13, B14 C C1, C2, C3, C4, C5, C6, C7, C8, C9, C10 D D1, D2, D3, D4 E E1, E2, E3, E4, E5, E6, E7, E8 Selecionar uma amostragem de conglomerados, selecionando três ruas (primeiro estagio) e, nas ruas selecionadas, uma fração de amostragem de 50% de domicilios (segundo estagio). 4.4 Amostragem Sistemática A amostragem sistemática toma por base de seleção algum critério de escolha dos elemntos. Exemplos que podem ser citados desta amostragem: os prédios de uma rua, os funcionários de um hotel, as linhas de produção, etc.. A amostragem sistematica é adequada a situações em que os individuos tendem a se suceder no tempo, como clientes em filas de banco, espectadores em bilheterias de teatros e eleitores aguardando sua vez de votar. Exemplo: Uma empresa matém um arquivo contendo os registros de antigos parceiros. Entre um total de 10.000 fichas, podemos tirar de forma sistemática uma ficha a cada 10, totalizando uma amostragem de 1.000 fichas. Para garantir a mesma probabilidade para cada ficha da amostra, deverá ser feito um sorteio da primeira ficha entre as 10 primeiras. Intervalo de seleção: N/n Nesse exemplo, o intervalo de seleção é 10, de acordo com o cálculo 10.000/1.000 = 10. Supondo que a primeira ficha sorteada foi a de número 4, as fichas que compõem a amostra são: {4, 14, 24, 34, 54, 64, ...., 9.984, 9.994} Atividade 1. Uma escola de ensino fundamental tem 1.000 alunos matriculados, sendo 200 na 1ª série, 150 na 2ª série, 150 na 3ª série, 120 na 4ª série, 110 na 5ª série, 100 na 6ª sé- rie, 90 na 7ª série e 80 na 8ªsérie. Obtenha uma amostra proporcional estratificada de 60%. 2. Em uma academia há 450 pessoas matriculadas, sendo 220 no período da manhã, 180 à tarde e 50 à noite. Obtenha uma amostra proporcional estratificada de 65%. Séries Estatísticas Uma série estatística é um conjunto de dados ordenados segundo uma característica comum, as quais servirão posteriormente para se fazer análises e inferências. 6.1 Série Temporal ou Cronológica: É a série cujos dados estão dispostos em correspon- dência com o tempo, ou seja, varia o tempo e permanece constante o fato e o local. Produção de Petróleo Bruto no Brasil de 1976 a 1980 Anos Produção (1000 m³) 1976 9 702 1977 9 332 1978 9 304 1979 9 608 1980 10 562 Fonte: Conjuntura Econômica (fev. 1983) 6.2 Série Geográfica ou Territorial: É a série cujos dados estão dispostos em correspon- dência com o local, ou seja, varia o local e permanece constante a época e o fato. População Urbana do Brasil em 1980 Região População(x 1000) Norte 3 037 Nordeste 17 568 Sudeste 42 810 Sul 11 878 Centro-Oeste 5 115 Total 80 408 Fonte: Anuário Estatístico (1984 6.3 Série Específica ou Qualitativa: É a série cujos dados estão dispostos em correspon- dência com a espécie ou qualidade, ou seja, varia o fato e permanece constante a é- poca e o local. População Urbana e Rural do Brasil em 1980 (x 1000) Localização População Urbana 80 408 Rural 38 566 Total 118 974 Fonte: Anuário Estatístico (1984) Número de passageiros de cruzeiros que partiram do Cabo Canaveral – Flórida, 1998 Cruzeiro Total de Passageiros Canaveral 152.240 Carnival 480.924 Disney 73.504 Premier 270.361 Royal Caribbean 106.161 Sun Cruz Cassinos 453.806 Sterling Cruises 15.782 Topaz Internacional Ship- ping 28.280 Fonte: McClave, 2001, p.61. 6.4 Série Mista ou Composta: A combinação de duas ou mais séries estatísticas constitu- em novas séries denominadas compostas e apresentadas em tabelas de dupla entra- da. O nome da série mista surge de acordo com a combinação de pelo menos dois e- lementos Local + Época = Série Geográfica Temporal Local + Especifica = Série Geográfica Especifica População Urbana do Brasil por Região de 1940 a 1980 (x 1000) Anos R E G I Õ E S N NE SE S CO 1940 406 3 381 7 232 1 591 271 1950 581 4 745 10 721 2 313 424 1960 958 7 517 17 461 4 361 1007 1970 1 624 11 753 28 965 7 303 2 437 1980 3 037 17 567 42 810 11 878 5 115 Fonte: Anuário Estatístico (1984) Número de Quartos e de Hotéis em Cidades dos EUA-1995 Cidade Quartos Hotéis Las Vegas 93.719 231 Orlando 84.982 311 Los Angeles 78.597 617 Chicago 68.793 378 Washington D.C. 66.505 351 Nova York 61.512 230 Atlanta 58.445 370 São Diego 44.655 352 Anahein –Santa Ana 44.374 351 São Francisco 42.531 294 Fonte: McClave, 2001, p.64. 6.5 Série de Distribuição de Freqüências: A Quarta e última espécie de série estatística é, de longe, a mais importante e a mais utilizada em estatística. Na distribuição de freqüência, os dados são ordenados segundo um critério de magnitude, em classes ou intervalos, permanecendo fixos o fato, o local e a época. Isto é, embora o fenô- meno estudado seja único, este poderá sofrer uma subdivisão em classes Exemplo: Altura dos estudantes do Curso de Gestão Ambiental – 2009 Altura (m) N° de alunos 1,50 |--- 1,60 14 1,60 |--- 1,70 29 1,70 |--- 1,80 37 1,80 |--- 1,90 18 1,90 |--- 2,00 2 A quantidade de vezes que um determinado dado ou valor é repetido na amostra é chamada de freqüência absoluta ou freqüência simples e será indicada por fi. Atividade Pesquise na internet ou em revistas séries estatísticas e classifique cada uma. Distribuição de Frequências Distribuição de Freqüências Para que uma variável estudada seja observada mais adequadamente, podemos dispor ordenadamente seus valores em uma tabela. Essa tabela é chamada de distribui- ção de freqüências ou tabela de freqüências. 6.1 Definições básicas Freqüência absoluta ou freqüência (𝑓𝑖 ): é a quantidade de vezes que um determinado dado ou valor é repetido na amostra. Dados brutos: são valores ou os dados originais ainda não numericamente organi- zados após a coleta ou digitação. Rol: é a ordenação dos valores ou dados obtidos (dados brutos) em ordem cres- cente ou decrescente de grandeza numérica ou qualitativa. Distribuição de Freqüência é uma série estatística onde os dados se encontram dispostos em categorias ou classes juntamente com as respectivas freqüências. Dessa forma, podemos dividir as distribuições de freqüências em dois tipos: distribuição de fre- qüência de dados agrupados sem intervalo de classes e distribuição de freqüências de dados agrupados em intervalos de classe. Exemplo 6.1: Construir a distribuição de freqüências para as idades, em anos, de um grupo de amigos do IFAL. Tabela 6.1 – Idades de 20 amigos do IFAL- dados brutos 14 15 16 16 16 14 14 15 17 14 15 16 17 17 16 15 14 15 15 15 Colocando em ordem crescente (rol) as idades, temos Tabela 6.2 – Idades de 20 amigos do IFAL - rol 14 14 14 14 14 15 15 15 15 15 15 15 16 16 16 16 16 17 17 17 Tabela 6.3 - Distribuição de idade de 20 amigos do IFAL Idade (em anos) Freqüência (fi) 14 5 15 7 16 5 17 3 Observação: De acordo com os dados organizados podemos ver facilmente que: O grupo de amigos pesquisados é formado de 20 pessoas; A pessoa mais velha tem 17 anos e a mais nova tem 14 anos; A maioria tem 15 anos (7 pessoas); A minoria tem 17 anos (3 pessoas). 6.2 Tipos de freqüências 6.2.1 Freqüência relativa O quociente obtido entre a freqüência absoluta (𝑓𝑖 ) e o número de elementos (n) da amostra é chamado de freqüência relativa: 𝑓𝑟 = 𝑓𝑖 𝑛 Para que a interpretação dos dados se torne mais clara, a frequência relativa, geralmente, é apresentada na forma de percentagem e é indicada por (𝑓𝑟 ) (%). Exemplo 2: Os dados abaixo referem-se ao número de horas trabalhados por uma equipe de enfermeiros em um hospital durante 2 fins de semana. Construir a tabela de distribuição de freqüências com freqüências relativas em percentagem correspondente aos dados fornecidos. Tabela 6.4 – Número de horas trabalhadas por uma equipe de 30 enfermeiros 6 8 2 7 10 5 6 7 2 10 6 8 7 7 6 5 2 7 8 10 8 7 7 7 6 10 5 5 5 5 Colocando os dados em ordem crescente, temos: Tabela 6.5 – Número de horas trabalhadas por uma equipe de 30 enfermeiros - Rol 2 2 2 5 5 5 5 5 5 6 6 6 6 6 7 7 7 7 7 7 7 7 8 8 8 8 10 10 10 10 Tabela 6.6 – Distribuição de frequencias em horas trabalhadas (de 30 enfermeiros de um hospital) Tempo (em horas) Freqüência (𝑓𝑖 ) Freqüência Relativa (𝑓𝑟 ) (%) 2 3 𝑓𝑟 = 3 30 = 0,10 → 10% 5 6 𝑓𝑟 = 6 30 = 0,20 → 20% 6 5 𝑓𝑟 = 5 30 = 0,1667 → 16,67% 7 8 𝑓𝑟 = 8 30 = 0,2667 → 26,67% 8 4 𝑓𝑟 = 4 30 = 0,1333 → 13,33% 10 4 𝑓𝑟 = 4 30 = 0,1333 → 13,33% Total (n) 30 O que diferencia a freqüência absoluta (𝑓𝑖 ) da freqüência relativa (𝑓𝑟 ) é o fato de que, na absoluta, trabalhamos com o número de elementos, enquanto que, na relativa, trabalhamos com percentual de elementos. 6.2.2 Freqüências Acumuladas A soma da freqüência absoluta do elemento considerado com todos os anteriores é chamada de freqüência absoluta acumulada e pode ser indicada por 𝐹𝑎𝑐 ou 𝐹𝑖 . A soma da freqüência relativa do elemento considerado com todos os anteriores é chamada de freqüência relativa acumulada e pode ser indicada por 𝐹𝑎𝑟 ou 𝐹𝑟 . As freqüências acumuladas tanto absolutas quanto relativas contribuem para a interpretação dos dados organizados em uma tabela de distribuição de freqüências. É a soma da freqüência simples deste elemento com as freqüências simples ante- riores da série. i21i fffF È a divisão da freqüência acumulada deste elemento, pelo número total de ele- mentos da série. n iFF iR Observe que a soma das freqüências é: 𝑛 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 + 𝑓5 + 𝑓6 𝑛 = 3 + 6 + 5 + 8 + 4 + 4 = 30 𝑛𝑒𝑠𝑠𝑒 𝑐𝑎𝑠𝑠𝑜 𝑛 = 30 Vejamos com o exemplo anterior. A tabela abaixo referem-se ao número de horas trabalhados por uma equipe de enfermeiros em um hotel durante 2 fins de semana. Construir a tabela de distribuição de freqüências acumuladas, tanto absoluta quanto relativa. Tabela 6.7 – Distribuição de frequencia acumulada (de horas trabalhadas por uma equipe de 30 enfermeiros) Tempo (em horas) Freqüência (𝑓𝑖 ) 𝐹𝑖 (Freqüência acumulada) 2 3 3 5 6 9 (=3+6) 6 5 14 (=3+6+5 ou =9+5) 7 8 22 (=3+6+5+8 ou =14+8) 8 4 26 (=3+6+5+8+4 ou =22+4) 10 4 30 (=3+6+5+8+4+4 ou =26+4) Total n=30 Tabela 6.8 – Distribuição de frequencias relativas (de horas trabalhadas por uma equipe de 30 enfermeiros) Tempo (em horas) Freqüência Relativa (𝑓𝑟 ) (%) 𝐹𝑟 (%) (Freqüência Relativa acumulada) 2 10 10 (=à primeira 𝑓𝑟) 5 20 30 (=10+20) 6 16,67 46,67 (=10+20+16,67) ou (=30+16,67) 7 26,67 73,34 (=10+20+16,67+26,67) ou (=46,67+26,67) 8 13,33 86,67 (=10+20+16,67+26,67+13,33) ou (=73,34+13,33) 10 13,33 100 (=10+20+16,67+26,67+13,33+13,33) ou (=86,67+13,33) Total 100% Observando os dados das tabelas, podemos concluir que: A freqüência acumulada 14 poderá ser encontrada fazendo a soma da freqüência acumulada anterior (9) com a freqüência correspondente à linha que queremos encontrar (5). A maior freqüência relativa apresentada é 26,67%, que corresponde a 8 enfermei- ros que trabalharam 7 horas. A menor freqüência relativa apresentada é 10%, que corresponde a 3 enfermeiros que trabalharam 2 horas.
Compartilhar