Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade 1 Livro Didático Digital Adauto José Valentim Neto e Dayanna Costa Estatística Básica Diretor Executivo DAVID LIRA STEPHEN BARROS Gerente Editorial CRISTIANE SILVEIRA CESAR DE OLIVEIRA Projeto Gráfico TIAGO DA ROCHA Autor ADAUTO JOSÉ VALENTIM NETO E DAYANNA COSTA OS AUTORES Adauto José Valentim Neto e Dayanna Costa Olá. Somos Adauto José Valentim Neto e Dayanna Costa. Eu, Adauto, sou formado em Administração, Comércio Exterior e Business Administration, além de bacharelando em Direito, com uma experiência técnico-profissional na área de Administração de Empresas. Passei por empresas da área de educação superior, nas quais lecionei, e sou apaixonado pelo que faço e adoro transmitir minha experiência de vida àqueles que estão iniciando em suas profissões. Eu, Dayanna, sou formada em Administração pela Universidade Federal de Campina Grande (UFCG) e tenho Mestrado acadêmico nessa mesma área de conhecimento, com ênfase em Estratégia e Inovação, pela Universidade Federal da Paraíba. Também possuo mestrado acadêmico em Gestão de Recursos Naturais (UFCG) com ênfase de pesquisa em Estratégia Ambiental focada em modelos e ferramentas de gestão na empresa, tendo experiência técnico-profissional no ensino da Administração ao ministrar disciplinas como Marketing, Planejamento Estratégico, Cultura organizacional e liderança e Administração de Recursos Materiais e Patrimoniais a níveis de graduação e pós-graduação. Eu sou apaixonada por Gestão de Atendimento ao Cliente, e lecionar esse conteúdo, para mim, consiste em emergir, junto dos discentes, em um universo de possibilidades de gestão, técnicas e práticas dentro do contexto de atuação dos futuros profissionais em formação. Adoro transmitir meus conhecimentos e minha experiência de vida àqueles que estão iniciando em suas profissões. Por isso, fomos convidados pela Editora Telesapiens a integrar seu elenco de autores independentes. Estamos muito felizes em poder ajudar você nesta fase de muito estudo e trabalho. Conte conosco! ICONOGRÁFICOS Olá. Esses ícones irão aparecer em sua trilha de aprendizagem toda vez que: INTRODUÇÃO: para o início do desenvolvimento de uma nova compe- tência; DEFINIÇÃO: houver necessidade de se apresentar um novo conceito; NOTA: quando forem necessários obser- vações ou comple- mentações para o seu conhecimento; IMPORTANTE: as observações escritas tiveram que ser priorizadas para você; EXPLICANDO MELHOR: algo precisa ser melhor explicado ou detalhado; VOCÊ SABIA? curiosidades e indagações lúdicas sobre o tema em estudo, se forem necessárias; SAIBA MAIS: textos, referências bibliográficas e links para aprofundamen- to do seu conheci- mento; REFLITA: se houver a neces- sidade de chamar a atenção sobre algo a ser refletido ou dis- cutido sobre; ACESSE: se for preciso aces- sar um ou mais sites para fazer download, assistir vídeos, ler textos, ouvir podcast; RESUMINDO: quando for preciso se fazer um resumo acumulativo das últi- mas abordagens; ATIVIDADES: quando alguma atividade de au- toaprendizagem for aplicada; TESTANDO: quando o desen- volvimento de uma competência for concluído e questões forem explicadas; SUMÁRIO Compreender as fases dos métodos estatísticos .........................12 Os tipos de métodos estatísticos ........................................................................................ 12 Coletando os dados ...................................................................................................................... 14 Aplicação dos métodos estatísticos ................................................................................. 17 Aplicação das variáveis ............................................................................19 Entendendo as variáveis ............................................................................................................ 19 Variáveis qualitativas .....................................................................................................................22 Variáveis quantitativas .................................................................................................................23 Compreendendo a população e a amostra ..................................... 26 População e amostra ...................................................................................................................26 População ..........................................................................................................................29 Amostra .............................................................................................................................. 30 Executando a Amostragem .....................................................................33 Amostragem .......................................................................................................................................33 Amostragem casual ou aleatória simples .................................................35 Amostragem proporcional estratificada ..................................................... 36 Amostragem sistemática ........................................................................................37 Amostragem de conveniência (não probabilística) .......................... 38 Extensão da amostragem ........................................................................................................ 39 7 UNIDADE 01 Estatística Básica 8 INTRODUÇÃO Você sabia que a área estatística é uma das mais demandas no mercado e é responsável pela geração de muitas informações utilizadas para tomadas de decisões nas diversas áreas do conhecimento? Isso mesmo. A área da estatística faz parte da área da matemática que estuda o comportamento dos elementos que compõem o nosso cotidiano. Para isso, vamos estudar as fases dos métodos estatísticos, compreendendo como são feitos o planejamento, a coleta, a organização, a apresentação e a interpretação dos dados coletados nas pesquisas. Além disso, estudaremos como se comportam as variáveis categóricas e numéricas e suas ramificações. Não obstante, vamos entender como conhecemos a população e a amostra dos dados, conhecendo suas particularidades e suas aplicações práticas. Por fim e não menos importante, vamos estudar as amostragens, sejam elas probabilísticas, sejam não probabilísticas, de acordo com o tipo de amostra a ser coletada. Assim, sua principal responsabilidade é compreender os aspectos básicos e introdutórios da estatística. Entendeu? Ao longo desta unidade letiva, você vai mergulhar nesse universo! Estatística Básica 9 OBJETIVOS Olá. Seja muito bem-vindo à Unidade 01. Nosso objetivo é auxiliar você no desenvolvimento das seguintes competências profissionais até o término desta etapa de estudos: 1. Compreender as fases dos métodos estatísticos; 2. Entender sobre a aplicação das variáveis; 3. Compreender a população e a amostra; 4. Aplicar a execução da amostragem. Avante! Estatística Básica 10 Compreender as fases dos métodos estatísticos INTRODUÇÃO: Ao término deste capítulo, você será capaz de entender como funcionam as fases dos métodos estatísticos, e isso é fundamental para o exercício de sua profissão. As pessoas que tentaram executar as técnicas estatísticas sem a devida instrução tiveram problemas ao determinar os dados a serem utilizados no cotidiano. E então? Motivado para desenvolver essa competência? Então, vamos lá. Avante! Os tipos de métodos estatísticos Ao expressarmos numericamente as observações sobre elementos que têm pelo menos uma característica comum (por exemplo, pessoas do sexo feminino de uma comunidade), obtemos os chamados dados envolvendo esses elementos. DEFINIÇÃO: A estatística faz parte da matemática aplicada e fornece métodos para coletar, organizar, descrever, analisar, interpretar dados e usá-los para a tomada de decisões (CRESPO,2009). Normalmente, quando as pessoas se referem ao termo estatística, automaticamente, relacionam o termo à organização e descrição de dados, como as estatísticas do Ministério da Educação, dos acidentes de trânsito, entre outros, sem compreender que a essência da estatística é fornecer métodos de inferência cujas conclusões podem ir além dos dados inicialmente obtidos. As fases do método estatístico são importantes para que os dados possam ser organizados e atender a sua proposta. Estatística Básica 11 Tabela 1 – Fases do método estatístico Fase Método Estatístico Fase 1 Definição do problema. Fase 2 Planejamento. Fase 3 Coleta de dados. Fase 4 Apuração dos dados. Fase 5 Apresentação dos dados. Fase 6 Análise e interpretação dos dados. Fonte: Elaborada pelos autores. Cada fase é fundamental para entendimento do que se pretende explorar e apresentar. Em uma análise, os métodos estatísticos podem ser aplicados por completo ou podem ser compilados às fases, a critério de quem as executar. Nesse sentido, faz-se necessário o entendimento de cada fase do método estatístico, com o objetivo de compreendermos como cada uma dessas etapas vai nos acompanhar durante os estudos. A primeira fase consiste na definição do problema. Nessa fase, é importante saber exatamente o que estudar e definir o problema de forma correta. Na segunda fase, será desenvolvido o planejamento. Nela, serão questionados alguns pontos fundamentais para o desenvolvimento das análises, como: como coletar informações? Que dados devem ser obtidos? Qual pesquisa usar? Qual é a programação do evento? Quais os custos envolvidos? Entre outros questionamentos que forem pertinentes. A terceira fase é a coleta de dados. Essa fase se caracteriza por ser mais operacional, em que o indivíduo efetua o registro sistemático de dados, de acordo com o objetivo determinado. Na quarta fase, serão apurados os dados. Assim, eles serão resumidos, contados e agrupados, ou seja, tabulados. Trata-se da etapa de agregar e processar os dados obtidos por meio de padrões de classificação, os quais podem ser desenvolvidos de forma manual ou eletrônico (planilhas eletrônicas, sistemas etc.). Estatística Básica 12 A quinta fase consiste na apresentação dos dados. Nessa fase, os dados podem ser apresentados de duas formas: em primeiro lugar, os dados podem ser apresentados de forma tabular, ou seja, apresentar-se de forma numérica, constituindo-se de linhas e colunas distribuídas de modo ordenado, segundo regras práticas; em seguida, os dados ainda podem ser apresentados de forma gráfica, a partir dos dados numéricos, assim, esse tipo de apresentação se constitui de forma geométrica, que permite uma visão rápida e clara do fenômeno analisado. Por fim, a sexta fase se refere à análise e à interpretação dos dados. Esta última fase do trabalho estatístico é a mais importante e a mais delicada, pois está essencialmente relacionada com o cálculo de métricas e coeficientes e tem como objetivo principal a descrição de fenômenos estudados. Dessa forma, a análise e a interpretação de dados estatísticos permitem um diagnóstico de empresas, como uma escola, e a compreensão dos seus problemas, como as condições de funcionamento e produtividade, para que possam formular soluções adequadas e planear ações de forma mais objetiva. Coletando os dados A partir de agora, definido o problema que será analisado e o processo na determinação das características que serão mensuradas na pesquisa, faz-se necessário estudar a coleta dos dados para construção e descrição do fenômeno analisado. Nesse sentido, podemos classificar a coleta de dados de forma direta (primária) e indireta (secundária). Assim, consiste na coleta de dados de forma direta a coleta que se baseia em elementos de informações de registro obrigatório, como os registros de nascimentos, de casamentos e de óbitos, importação e exportação de mercadorias, preferência dos consumidores por um determinado produto, entre outros. Ainda, na coleta de dados direta, os próprios pesquisadores podem coletar dados por meio de pesquisas, utilizando-se questionários, registros de verificação e inspeção, censo, etc. Estatística Básica 13 Nessa mesma linha de raciocínio, esse tipo de coleta, de forma direta, ainda pode ser classificado considerando-se o fator tempo, como: contínuo, periódico e ocasional. A coleta de dados de forma contínua indica uma busca por dados executada continuamente, como foram os exemplos citados anteriormente, como os registros de nascimentos e óbitos. Além disso, outros tipos de coletas de dados podem advir dessa classificação, é o exemplo do registro de frequência dos alunos às aulas, entre outros. A coleta realizada de forma periódica acontece quando realizada em intervalos regulares, como o censo, que é realizado a cada 10 anos, e as avaliações aplicadas de forma mensal aos alunos de uma escola. Já a coleta de dados ocasional consiste na coleta de informações em situação temporária, como em resposta a uma situação de emergência, como uma epidemia ou pandemia que assola toda a população. Ainda, no que diz respeito à coleta de forma direta (primária), existem alguns métodos para ela que são importantes para se garantir a devida execução estatística, uma vez que há o risco de que os resultados coletados tornem-se tendenciosos. Dessa forma, temos a observação e o levantamento. Na observação, o pesquisador executa a observação do fenômeno e não questiona ou pergunta. Por exemplo: uma pesquisa observacional, que consiste em diagnosticar as necessidades de transporte público de uma cidade. O levantamento, que é o método mais comum de se coletar dados, consiste na aplicação de um instrumento, como um questionário estruturado ou até mesmo um roteiro com perguntas, em que o entrevistado fique à vontade para responder sobre cada tema da pesquisa. Nesse método, percebe-se que o pesquisador se envolve na pesquisa, perguntando e questionando. Assim, o levantamento pode ser feito de várias formas; entre elas, pode-se utilizar a entrevista pessoal, o telefone, as ferramentas da internet (formulários on-line e videoconferências) e até mesmo postais, e-mails e fax, que podem ser considerados mais lentos ou mais rápidos, a depender da forma de aplicação e até mesmo do público objeto da análise. Estatística Básica 14 Ademais, no que diz respeito à coleta de dados de forma indireta, também chamada secundária, ocorre quando é inferida de elementos conhecidos, mesmo quando foram coletados diretamente, ou é do conhecimento de outros fatos relacionados ao fenômeno em estudo. Desse modo, a fonte é advinda da coleta direta. Podemos citar como exemplo a mortalidade infantil, da qual é medida a partir de dados diretos (os registros de nascimentos). Por outro lado, a coleta de dados indireta advém de um fenômeno anteriormente analisado, mas dando uma nova característica e informação à pesquisa que será realizada. Além disso, vale destacarmos que a coleta de forma direta, ou seja, de forma primária, consiste na mais segura forma de levantamento de dados, pois os dados secundários ou indiretos trazem consigo um grande risco de erros em sua transcrição. • Críticas: existem críticas que devem ser aplicadas a coletas de dados a fim de que nenhum defeito ou imperfeição cause erros graves ou afete os resultados de forma significativa. Nesse sentido, a crítica é aplicada de forma exterior, quando podem ser identificados erros cometidos pelo informante e que podem ter sido causados por distração ou incompreensão da questão levantada, assim, quando os erros são identificados de forma interna, compreende-se que tais erros originaram dos dados coletados. Figura 1 – Coleta de dados Fonte: Elaborada pelos autores. Estatística Básica 15 Aplicação dos métodos estatísticos Todos nós podemos perceber quea estatística está inserida em nosso cotidiano; por exemplo: quando assistimos à TV, lemos um jornal e até mesmo quando recebemos notícias por meio de telefonemas e conversas rotineiras. A estatística pode ser utilizada nas mais diversas áreas do conhecimento. Quem utiliza métodos estatísticos está mais bem preparado para organizar e analisar dados em suas atividades profissionais e informações diárias veiculadas à área de interesse e de comunicação. Dessa forma, aprender estatística é muito importante, uma vez que muitas decisões que são tomadas em nossas vidas são baseadas em estatísticas. As pessoas podem até não perceber isso, mas as estatísticas permeiam a maioria das decisões que tomamos todos os dias. Basicamente, todos têm uma compreensão intuitiva dos princípios estatísticos, mas faz-se importante a compreensão de como a estatística está envolvida nas demais áreas do conhecimento. Nas ciências humanas e sociais, podem ser realizadas pesquisas de opinião para se saber se os clientes da empresa estão satisfeitos com modo como os serviços são prestados, a opinião da população de um município sobre as prioridades de investimento público ou para monitoramento do valor das cestas básicas em determinado período. Na área das ciências da saúde, podem ser realizadas pesquisas para se descobrir a prevalência da diabetes na população ou encontrar o tratamento mais eficaz para a hipertensão. Já no campo das ciências biológicas, podem ser executadas com a intenção de se prever a população de certas espécies em locais específicos. No campo da ciência agrícola, as pesquisas podem ser conduzidas para se determinar o conteúdo adequado de fertilizantes em plantações. Na engenharia, por sua vez, pode-se investigar a resistência dos pilares de concreto, por exemplo. Nas ciências políticas, é possível pesquisar as intenções de voto e a magnitude do erro advindas das notícias. Nesse caso, o método estatístico pode prever qual candidato tem maior probabilidade de vencer e em qual localidade. Estatística Básica 16 Na área financeira, a partir de informações estatísticas, as pesquisas podem ajudar a prever a economia e as vantagens e desvantagens das empresas no mercado acionário, bem como avaliar se um investimento é mais vantajoso em uma empresa em detrimento de outra por meio de dados estatísticos de previsão e avaliação. Assim, muitas vezes, utilizamos o conhecimento de métodos estatísticos para melhor compreendermos os dados disponíveis na mídia, como TMI (Mortalidade Infantil), INPC (Índice Nacional de Preços ao Consumidor), pesquisa de satisfação, entre outros. Dessa forma, podemos afirmar que a estatística está inserida no dia a dia das pessoas de forma constante, transformando fenômenos em informações que podem auxiliar o individuo nas decisões rotineiras. RESUMINDO: E então? Você gostou do que mostramos? Apreendeu tudo? Agora, só para nos certificarmos de que você realmente entendeu o tema de estudo deste capítulo, vamos resumir tudo o que vimos. Você deve ter aprendido que as fases do método estatístico consistem na determinação do problema a ser pesquisado, no planejamento das características da pesquisa, na coleta de dados que podem ser de forma direta (primária) e indireta (secundária); na apuração e apresentação dos dados, que podem ser tabular e de forma gráfica; e, por fim, na análise e interpretação dos dados, transformando-os em informações. Vale, ainda, considerarmos que estudamos as formas de coleta de dados de forma mais detalhada, em que a coleta realizada de forma direta (primária) pode ser observada em sua perspectiva temporal (contínua, periódica e ocasional) e cujos métodos consistem na observação e no levantamento de dados; já a coleta de dados de forma secundária (indireta) advém das informações já observadas pela coleta direta. Finalmente, estudamos a aplicação da estatística nas diversas áreas do conhecimento e como ela pode ser aplicada em nosso cotidiano. Estatística Básica 17 Aplicação das variáveis INTRODUÇÃO: Ao término deste capítulo, você será capaz de entender como funciona a aplicação das variáveis, logo, este conteúdo é importante para o seu conhecimento dos dados que serão analisados e apresentados por você no desenvolvimento da sua profissão. Motivado para desenvolver essa competência? Então, vamos lá. Avante! Entendendo as variáveis Variável é uma caraterística ou uma condição utilizada para se descrever um objeto, uma pessoa, um animal, um lugar e até mesmo uma ideia, bem como assume diferentes valores, por ser variável, em diferentes circunstâncias ou unidades. Nessa mesma linha de raciocínio, podemos exemplificar as variáveis como profissões, número de pessoas em algum lugar, nacionalidade, peso, altura, entre outros. DEFINIÇÃO: Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Em relação ao fenômeno, este corresponde a cada número de resultados possíveis quando consideradas as variáveis. Podemos exemplificar da seguinte forma: se o fenômeno estudado considerar o “sexo”, logo, podemos observar dois possíveis resultados, masculino e feminino. Entretanto, se o fenômeno a ser avaliado considerar o número de filhos, ou estatura, existirá um número possível de resultados, como: 0, 1, 2, 3, ..., n, ou seja, existem infinitos resultados possíveis para esse tipo de fenômeno estudado. Estatística Básica 18 Contudo, podemos, ainda, classificar as variáveis de duas formas distintas: categóricas (qualitativas) e numéricas (quantitativas). Figura 2 – Classificação das variáveis Fonte: Elaborada pelos autores. Dessa forma, as variáveis classificadas como categóricas ou qualitativas possuem características que não têm valor quantitativo, mas são definidas por várias categorias, ou seja, representam a classificação dos indivíduos, e ainda podem ser divididas em nominais ou ordinais. Assim, consideramos variáveis categóricas quando seus valores podem ser expressos por atributos, como o sexo: masculino ou feminino, a cor da pele: branca, preta, amarela, parda, etc. Assim, as variáveis consideradas nominais não possuem ordem entre as categorias, por exemplo: cor dos olhos, fumante e não fumante, doente ou sadio, entre outros. Já as variáveis ordinais possuem uma ordem entre suas categorias, por exemplo: escolaridade, mês de análise, estágio da doença, entre outros. No que tange às variáveis numéricas ou quantitativas, representam as características que podem ser medidas quantitativamente, ou seja, fornecem valores significativos. Assim, tais variáveis são expressas em números, por exemplo: salários dos trabalhadores, filhos em idade escolar, entre outros. Essas variáveis também podem ser divididas em contínuas ou discretas. Estatística Básica 19 Em teoria, uma variável quando quantitativa pode assumir qualquer valor entre os dois limites, sendo denominada variável contínua. Entretanto, se uma variável só puder pertencer a um conjunto enumerável de valores, será chamada, então, de variável discreta. Figura 3 – Estrutura das variáveis Fonte: Elaborada pelos autores. Do mesmo modo, quando os resultados forem observados e, consequentemente, estiverem disponíveis, a próxima etapa será extrair as informações contidas nesses resultados. Para isso, será necessário definir claramente quais são as características de interesse do pesquisador, as quais deverão ser verificadas. Contudo, se “n” elementos forem considerados fisicamente em um determinado estudo, esses elementos fornecerão “n” valores relacionados a um determinado interesse. Dessa forma, sempre serão utilizados os valores de certas variáveis de interesse em vez dos elementos inicialmente considerados. Finalmente, precisamos estudar como cada uma dessas variáveis se comportam. Lembrando que as variáveis tipificadas de categóricas podem ser nominais e ordinais, enquantoas variáveis numéricas são contínuas e discretas, como vamos estudar a seguir. Estatística Básica 20 Variáveis qualitativas Como já observado anteriormente, as variáveis consideradas categóricas ou qualitativas não podem ser representadas por números, pois estão relacionadas a situações como a cor da pele, a cor dos olhos, a marca de refrigerante, a marca de carro, a marca de roupas, a preferência musical etc. Sua classificação em ordinal e nominal expressa uma relação sequencial ou não sequencial de dados. Assim, embora as variáveis qualitativas classificadas como ordinais não sejam expressas de forma numérica, estão sujeitas a relações sequenciais. Podemos exemplificar essa forma sequencial como: ótimo, bom, regular e ruim, classe social, nível de escolaridade e outros conceitos. As variáveis qualitativas definidas como nominais nada têm a ver com uma ordem sequencial, pois são apenas identificadas por meio de nomes. Por exemplo: as cores (vermelho, amarelo, preto, azul, rosa, verde etc.), a marca do carro, o nome da bebida, o local de nascimento, entre outros. Dessa forma, percebemos que as respostas obtidas a partir das variáveis categóricas ou qualitativas são expressas por meio de “palavras”. Tabela 2 – Variáveis categóricas (qualitativas) Variável Classificação Descrição Categórica (qualitativa) Ordinais Nível de satisfação (ótimo, bom, ruim), classe social, nível de escolaridade etc. Categórica (qualitativa) Nominais Cores (vermelho, amarelo, azul, verde etc.), marca do carro, nome da bebida, etc. Fonte: Elaborada pelos autores. Estatística Básica 21 Variáveis quantitativas Para avaliarmos as variáveis numéricas ou quantitativas, utilizamos a representação numérica. Elas, por sua vez, podem ser divididas em discretas e contínuas, a depender de suas limitações numéricas. Assim, as variáveis quantitativas classificadas como discretas serão relacionadas a circunstâncias limitadas, como o número de revistas vendidas, o número de visitas e o número de filhos em um casal. Logo, esses valores representam um conjunto de números limitados ou contáveis, como o número de filhos (0,1,2, ...n). Podemos considerar, ainda, que as variáveis discretas são aquelas que só podem assumir valores inteiros em pontos de uma linha reta, ou seja, pode enumerar todos os valores possíveis de uma variável. No caso das variáveis quantitativas contínuas, as características pertencem a uma faixa qualificada pelo infinito, como o peso do produto, a altura de alguém, a velocidade de um carro ou moto, entre outros. Nessa linha de raciocínio, as variáveis contínuas podem ser medidas qualitativamente, ou seja, representam valores significativos. Assim, podem assumir um valor qualquer em um determinado intervalo, considerado contínuo, em uma linha sólida. Essas variáveis geralmente surgem por meio de medições, como a altura de um grupo de pessoas, que serão classificadas como uma variável contínua, pois, teoricamente, um indivíduo pode possuir altura igual a 1,70 m, 1,71 m, 1,711 m, 1,712 m, bem como 72 kg, 72,5 kg, 72,54 kg etc., dependendo esse valor da precisão da medida. Dessa forma, as variáveis numéricas (quantitativas), independente- mente de sua classificação (discreta ou contínua), serão obtidas a partir de respostas expressas em “valores numéricos”. Estatística Básica 22 Tabela 3 – Variáveis numéricas (quantitativas) Variável Classificação Descrição Numéricas (quantitativa) Discretas Número de revistas ven- didas, número de filhos de um casal etc. Numéricas (quantitativa) Contínuas Peso de alguém ou pro- duto, altura, velocidade de um carro ou moto etc. Fonte: Elaborada pelos autores. Conhecidas as classificações que envolvem as variáveis, vamos, por meio de um exemplo prático, observar tais categorizações. Vamos supor que estamos realizando uma pesquisa cujo objetivo é estudar aspectos socioeconômicos dos atletas de uma escola. Dessa forma, foram coletados dados do departamento de esportes da instituição e expostas as seguintes informações: Tabela 4 – Variáveis Variável Informações Estado civil Solteiro, casado, divorciado Grau de escolaridade Ensino Fundamental, Médio, superior Número de Filhos 0, 1, 2, 3, 4, 5, 6... Idade 12, 13, 14, ... 18, 19, ... Peso 48 kg, 48,5 kg, 50 kg, 51,2 kg, ... Classe Social Alta, média, baixa Fonte: Elaborada pelos autores. A partir dessas informações, que foram coletadas na escola em análise, podemos assumir as seguintes classificações: estado civil é uma variável categórica classificada como nominal, pois percebemos uma categorização não sequencial, ou seja, os respondentes podem ser solteiros, casados, divorciados, entre outros. Já as informações sobre o grau de escolaridade, são consideradas variáveis categóricas, classificadas como ordinais, pois estão sujeitas a relações sequenciais, no caso, Ensino Fundamental, Médio ou superior. No que tange aos dados sobre o número de filhos e idade, consideramos tais informações Estatística Básica 23 como variáveis numéricas e discretas, pois representam um conjunto de números limitados ou contáveis, como o número de filhos (0, 1, 2, 3, 4, 5, 6.) e idade (12, 13, 14 [...] 18, 19). O peso dos alunos também pode ser categorizado como variável numérica contínua, pois assume um valor qualquer em um determinado intervalo, como 48 kg, 48,5 kg, 50 kg, 51,2 kg). Por fim, a classe social coletada dos participantes nos mostra uma variável categórica classificada como ordinal, pois, como já estudamos, também estão sujeitas a relações sequenciais, como alta, média e baixa. Podemos ainda, observar que as variáveis consideradas numéricas podem ser coletadas de maneira categórica. Por exemplo: a variável relacionada à idade do indivíduo avaliada ao longo do ano é considerada quantitativa de forma contínua, entretanto, se avaliarmos a idade a partir da faixa etária, ou seja, de 0 a 5 anos, por exemplo, tal variável será considerada categórica ordinai, pois existirá uma relação sequencial a partir de então. Desse modo, as variáveis e suas classificações dependem de como são feitas as coletas dos dados. RESUMINDO: E então? Apreendeu todo o conteúdo? Agora, para termos a certeza de que realmente entendeu o tema de estudo deste capítulo, vamos resumir o que vimos. Você deve ter aprendido que existem duas principais divisões em relação às variáveis, que são categóricas, também denominadas qualitativas, e numéricas, que são quantitativas. Tais divisões, também geram classificações, por exemplo: as variáveis categóricas podem ser classificadas como nominais e ordinais. As nominais não demonstram qualquer forma sequencial, enquanto as variáveis ordinais apresentam a forma sequenciada dos dados. Já as variáveis consideradas numéricas podem ser classificadas como discretas e contínuas. Discretas quando os dados se apresentam de forma finita e contável, enquanto as contínuas representam informações por meio de intervalos de números reais. Dessa forma, aprendemos, ainda, que as formas de classificação e apresentação dos resultados dependem muito da pesquisa, pois sua forma de coleta de dados descreverá sua apresentação. Estatística Básica 24 Compreendendo a população e a amostra INTRODUÇÃO: Ao término deste capítulo, você será capaz de entender como são determinadas a população e a amostra de uma pesquisa. Este conteúdo é relevante, pois o seu trabalho dependerá da definição que fizer do universo de seus estudos e da amostra que será retirada dele. E então? Você está motivado para desenvolver essa competência? Vamos lá. Avante! População e amostra No estudo da população e da amostra, um grupo de entidades com pelo menos uma característica em comum será denominado população estatística ou universo estatístico. Nesse sentido, podemos exemplificar da seguinte forma: os alunos de uma determinada escola constituem um grupo, pois apresentam ao menos uma característicaem comum, que é a aprendizagem. Assim, como em qualquer pesquisa estatística, é preciso estudar uma ou mais características de certos elementos gerais, portanto, essa característica deve ser perfeitamente definida. Figura 4 – Aluno estudando Fonte: Freepik (2020). Estatística Básica 25 Nessa mesma linha de raciocínio, ao considerarmos qualquer elemento, afirmamos inequivocamente que ele pertence à totalidade. Portanto, é necessário estabelecer um padrão de composição populacional que seja válido para qualquer pessoa no tempo ou no espaço. Não obstante, para todas as análises estatísticas, o mais básico para sua compreensão é a relação entre a população e a amostra. Na verdade, todas as técnicas estudadas aqui incluem métodos para se obter informações gerais a partir das informações obtidas da amostra geral. Por isso, quando pretendemos fazer pesquisas com alunos do ensino fundamental, precisamos definir quem são os alunos que compõem todo o universo: apenas os que estão na carteira ou mesmo os que já cursaram a escola? De forma clara, percebemos que a solução do problema dependerá de cada caso específico. Na maioria dos casos, devido à inviabilidade ou inviabilidade econômica ou temporal, limitamos as observações relacionadas a um estudo específico a apenas uma parte da população, chamada de amostra. DEFINIÇÃO: População, é uma coleção de tudo que você deseja analisar. Uma amostra é um subconjunto finito de uma população, ou seja, uma parte da população a qual se deseja analisar. Figura 5 – População e amostra Fonte: Elaborada pelos autores. Estatística Básica 26 Para que as inferências sejam corretas, é necessário garantir que a amostra representa a população, ou seja, em termos do fenômeno que se deseja estudar, a amostra deve ter as características básicas da população. Portanto, é necessário obter a amostra a ser utilizada por um método adequado. Em alguns casos, como pesquisas sociais, econômicas e de opinião pública, as questões de amostragem são muito complexas, mas em alguns casos, o problema de amostragem é muito mais fácil. Por exemplo, podemos citar a amostragem para controle de qualidade de produtos ou materiais em uma indústria específica. Para facilitar o nosso entendimento, vamos a alguns exemplos: I. Pesquisa de opinião pública: a população é o conjunto de pessoas (habitantes) da cidade, estado ou país que fará parte da pesquisa. A amostra, por sua vez, é um grupo retirado dessa população, ou seja, uma parte dela que será analisada. II. Pesquisa sobre intenção eleitoral: a população, neste caso, será os eleitores da região em análise; já a amostra será um número de pessoas (eleitores) escolhido para participar da pesquisa. Existem algumas vantagens para se utilizar uma amostra em detrimento da população. Em primeiro lugar, pelo tamanho da população, que faz com que a análise, em sua totalidade, seja inviável ou impraticável; em seguida, seus custos para realização, que podem torná-la impossível; por fim, as limitações técnicas sobre os membros de uma população. Nesse sentido, podemos afirmar que uma amostra, em si, não possui interesse em geral, o interesse que sonda a amostra incide sobre o que ela revela da população. Enfim, podemos afirmar que toda pesquisa estatística precisa atender ao público-alvo, pois é a partir dessa população que são coletados e analisados os dados com base em princípios de pesquisa. Esse público-alvo é denominado população, que é um grupo de pessoas com características próprias, tais como: usuários de planos de saúde, integrantes de times de futebol, empregados de empresas, eleitores de municípios, estados ou países, regiões, alunos de escolas, sindicalistas, membros da família e diversas situações envolvendo elementos gerais. Estatística Básica 27 Dessa forma, a população também pode estar relacionada a um grupo de objetos ou informações. Nas estatísticas, podemos, ainda, classificar a população como finita e infinita. População Como já estudamos, a população pode ser dividida ou classificada em dois principais grupos: a população considerada finita e a população infinita. Figura 6 – Classificação da população Fonte: Elaborada pelos autores. Na população denominada finita, o número de elementos de um grupo não é muito grande, logo, a entrevista e a análise das informações devem ser dirigidas a todos do grupo. Por exemplo: a situação das escolas particulares de uma cidade qualquer – se observarmos esse grupo específico, concluímos que há um número limitado de escolas na cidade. Entretanto, quando a população é classificada como infinita, o número de elementos é tão grande que é considerado infinito, como a população de uma cidade, uma vez que não podemos saber com exatidão, em termos numéricos, a quantidade de pessoas que vivem em uma cidade. Nessa perspectiva, como em qualquer pesquisa estatística, o objetivo da população é estudar uma ou mais características de certos elementos globais, que devem ser perfeitamente definidos. Ao considerarmos qualquer elemento, podemos afirmar, de forma inequívoca, se o elemento pertence à totalidade (GUIMARÃES, 2008). Estatística Básica 28 Para se ter uma definição clara das unidades que compõem a população, é necessário especificar três elementos principais: características comuns, localização temporal e localização geográfica. Por exemplo: suponha que uma pesquisa objetiva analisa os salários dos professores no estado Y Tabela 5 – Elementos para análise Elementos Descrição Características comuns Profissionais professores Tempo Salários pagos em maio de 2010 Localização geográfica Escolas de todo estado Y Fonte: Elaborada pelos autores. Na maioria dos casos, devido à inviabilidade econômica ou temporal, limitamos as observações relacionadas a uma pesquisa específica que representa apenas uma parte da população. Quando isso acontece, estudamos/analisamos parte da população da pesquisa, denominada amostra, que será estudada a seguir. Amostra Uma amostra se refere a uma população, uma parte ou um subconjunto de uma parte. Em alguns casos, é impossível entrevistar todos os elementos da população, pois leva muito tempo para concluir o trabalho e nem mesmo é viável economicamente, portanto, o número de respondentes corresponde a um determinado número de elementos do conjunto amostral. Nessa linha de raciocínio, a amostra é qualquer subconjunto possível da população. Em outras palavras, é um subconjunto limitado da população, ou seja, cada amostra é uma coleção retirada do todo. Diante disso, é necessário garantir que a amostra ou as amostras utilizadas sejam obtidas por meio de um processo adequado. Se determinado erro é cometido ao se selecionar os elementos da amostra, todo o trabalho é afetado e, consequentemente, os resultados finais Estatística Básica 29 poderão variar muito. Portanto, devemos prestar muita atenção aos critérios que serão usados na seleção das amostras. Não obstante, é necessária a garantia de que uma amostra está representando a população. Por sua vez, isso significa que, além das pequenas diferenças inerentes à amostragem de variáveis aleatórias, mais ou menos no processo de amostragem, a amostra deve ter as mesmas características básicas gerais das variáveis que serão pesquisadas (GUIMARÃES, 2008). Existem alguns questionamentos para entendermos o porquê de estudarmos amostras em vez da população. Como já estudamos anteriormente, diversos são os fatores, mas se a amostra selecionada não for representativa de todos, serão feitas previsões imprecisas ao se tentar estimar as características da população com base na amostra. No entanto, existem vários motivos para se estudar a amostra em vez da população, e os mais comuns são o alto custo e a dificuldade de se levantar/coletar todas as informações de uma população. Vamos exemplificar da seguinte forma:Suponha que, em sua pesquisa, você deseja saber os hábitos alimentares das mulheres com 40 anos em certo país. Logo, você deverá extrair uma amostra das mulheres de 40 anos de uma cidade para ser analisada. Nessa situação específica, você vai obter: População As mulheres de 40 anos do país. Amostra As mulheres de 40 anos da cidade. Desse modo, você pode fazer suas conclusões a partir dos elementos da cidade, ou seja, da amostra, e ainda usar do julgamento pessoal para extrapolar os resultados obtidos para a população-alvo, sendo cauteloso e reservado. Além disso, lembre-se de que a generalização dos resultados pode trazer contradições à pesquisa realizada, visto que se refere a uma parcela e não ao todo. Estatística Básica 30 RESUMINDO: E então? Você gostou do que apresentamos? Apreendeu tudo? Agora, só para termos a certeza de que você realmente entendeu o tema de estudo deste capítulo, vamos resumir tudo o que vimos. Você deve ter aprendido que um grupo de entidades com pelo menos uma característica em comum é denominado população estatística ou universo estatístico, e que uma amostra é um subconjunto finito de uma população. Ademais, para que o grupo estatístico estudado seja verossímil quanto à representação, é necessário que a amostra tenha as características básicas da população. Por população, estudamos vários exemplos e os classificamos de forma finita e infinita. No que se refere à amostra, estudamos que, para que os resultados sejam adequados, é necessária a devida definição de sua população e a correta coleta daqueles que serão considerados na amostra. Assim, nas análises, é possível a interferência e a interpretação do pesquisador, que deverá ter cuidado na generalização. Nesse aspecto, garantir a aleatoriedade é um elemento importante à qualidade da amostra, que pode ser garantido pela técnica de amostragem. Estatística Básica 31 Executando a Amostragem INTRODUÇÃO: Ao término deste capítulo, você será capaz de entender e executar as técnicas de amostragem. Este conteúdo é fundamental para o seu desempenho profissional, pois, a partir dele, você compreenderá como classificar as amostras levantadas em seu trabalho. E então? Motivado para desenvolver essa competência? Então, vamos lá! Amostragem Como já estudamos, o objetivo da seleção da amostra é obter as informações que representam uma população. O método mais simples é escolher uma amostra aleatória, de modo que todos os membros da população tenham a mesma probabilidade de aparecer em qualquer amostra. DEFINIÇÃO: É um método de levantamento de uma pequena parte da população por meio da mesma amostra. Os principais tipos de amostragem são: amostragem probabilística e amostragem por cotas. Por exemplo, se quisermos uma amostra de 5 alunos de uma população composta por todos os alunos de uma sala de aula, podemos numerar todos os alunos, de 1 a N, e usar uma urna contendo N bolas iguais, numeradas de 1 a N, de forma que cada bola represente um aluno. De forma prática, a seleção da amostra não deve ser feita com uma urna com bolinhas, mas com uma tabela de números aleatórios ou, se possível, por meio de um sistema computadorizado que auxilie na geração dos números aleatórios. Existe uma técnica especial de amostragem que pode garantir a chance de seleção ao máximo quanto à aleatoriedade na escolha. Estatística Básica 32 Portanto, todos os membros da população têm a mesma chance de ser selecionado, o que garante que a amostra seja representativa, o que é muito importante, pois, como vimos, as conclusões sobre a população serão baseadas nos resultados obtidos juntamente à população, ou seja, uma amostra dessa população. Existem dois principais tipos de amostragem: a probabilística e a não probabilística. Se todos os elementos da população tiverem uma probabilidade conhecida diferente de zero e pertencerem à amostra, então, a amostragem será probabilística. Entretanto, se a amostragem for não probabilística, ocorre que o acesso à informação não será tão simples ou os recursos serão limitados, então, os pesquisadores usarão uma gama mais ampla de dados, que é chamada de amostragem por conveniência (GUIMARÃES, 2008). Nos nossos estudos, forneceremos três técnicas de amostragem probabilística, como: casual ou aleatória simples, proporcional estratificada e sistemática. Figura 6 – Técnicas de amostragem probabilística Fonte: Elaborada pelos autores. Quando se realiza uma inspeção por amostragem, ou seja, ao checar parte da população, essa análise se torna mais econômica, mais rápida, um vez que reduz a quantidade de dados inconvenientes e promove resultados mais confiáveis. Estatística Básica 33 Geralmente, o uso de amostragem pode levar o pesquisador a economizar tempo e custo, mas é preciso utilizar padrões para completá- la, a fim de que sejam realizadas análises estatísticas adequadas para se obter conclusões satisfatórias sobre toda a população. Assim, existem várias técnicas de amostragem, cada uma com suas vantagens e desvantagens, e a escolha deverá ser feita pelo pesquisador com base nos objetivos propostos de sua pesquisa. Com isso, o principal modelo de amostragem é o probabilístico, que consiste na amostragem aleatória simples, na amostragem proporcional de estratificação e na amostragem sistemática, que serão estudadas a seguir. Amostragem casual ou aleatória simples A técnica de amostragem denominada casual ou aleatória simples é equivalente a uma loteria. Na prática, essa técnica de amostragem pode ser realizada numerando-se a população de 1 a n e, em seguida, extraindo k números, que correspondem aos elementos pertencentes à amostra de forma sequenciada e com a ajuda de qualquer dispositivo aleatório. Assim, para escolhermos uma amostra aleatória simples, precisamos de uma lista completa de elementos da população ou de unidades de amostragem que sejam apropriadas para o estudo. Esse tipo de amostragem inclui amostras de seleção, como sorteios. Para simplificar, vamos imaginar da seguinte forma: suponha uma multidão com N elementos. Uma forma de extrair uma amostra aleatória simples de tamanho n, ou seja, n ser menor que N (representado por: n<N) é identificar os elementos da população em pequenos pedaços de papel e começar a remover aleatoriamente n pedaços. Dessa forma, conseguiremos extrair a quantidade desejada de forma aleatória. A amostragem aleatória simples ou casual possui algumas propriedades, entre elas, a de entender que qualquer subconjunto da população com o mesmo número de elementos faz parte da amostra na mesma probabilidade, principalmente se observamos que cada elemento da população tem a mesma probabilidade (representada por ) de pertencimento. Estatística Básica 34 Amostragem proporcional estratificada Como já estudamos, a população geralmente é dividida em subgrupos ou até mesmo em classes. Em termos das principais variáveis que foram estudadas, os dados devem ser mais uniformes internamente do que toda a população. Podemos exemplificar da seguinte forma: para estudarmos o interesse dos funcionários de uma grande empresa em implementar um programa de treinamento, podemos estratificar a população por nível de escolaridade, nível de hierarquia ou setor de trabalho. Em relação ao que está sendo estudado, devemos escolher um padrão de estratificação que forneça um nível bastante uniforme. Portanto, o conhecimento prévio sobre a população a ser pesquisada é fundamental para o desenvolvimento da pesquisa. Uma vez que as variáveis em estudo podem apresentar compor- tamentos heterogêneos entre as várias camadas e ter comportamentos homogêneos em cada camada, é adequado desenharmos elementos de amostra considerando essa camada. DEFINIÇÃO: A estrutura de dados homogênea armazena o mesmo tipo de dados, já a estrutura heterogênea armazena diferentes tipos de dados. Assim, é justamenteo que se faz quando se utiliza a amostragem proporcional estratificada, pois, além de considerar a existência de estratificação, a amostragem estratificada também obtém elementos amostrais proporcionais ao número de elementos da amostra. Sobre os diversos estratos da população, são realizadas seleções aleatórias, de forma independente. A amostra é obtida por meio da agregação das amostras de cada dado. Estatística Básica 35 Figura 7 – Amostra estratificada Fonte: elaborado pelos autores. Amostragem sistemática Esse tipo de amostragem se dá quando os elementos gerais são organizados e não existe a necessidade de se construir um sistema de referência, como os registros médicos de um determinado hospital, os edifícios na rua, umas linhas de produção etc. Nesses casos, os elementos que compõem a amostra podem ser selecionados por meio de um sistema imposto pelo pesquisador. Dessa forma, serão denominados, nesse tipo de amostragem, a amostragem sistemática. Assim, na amostragem sistemática, a unidade amostral é selecionada por meio de um plano sistemático preestabelecido, que visa a abranger toda a população e obter um modelo unificado. Portanto, podemos dizer que a técnica de amostragem sistemática das unidades amostrais não se baseia na teoria da amostragem probabilística como as demais estudadas, pois tal técnica seleciona aleatoriamente uma unidade amostral. Logo, quando uma amostra é selecionada sistematicamente, a probabilidade de seleção de todas as outras unidades de amostra que não são integradas é zero, enquanto a probabilidade de seleção dessas unidades de amostra que são integradas é 1, ou seja, muitas unidades de amostra serão escolhidas. Caso elas sejam rejeitadas, isso se dará em razão da oposição ao princípio básico da escolha. Assim sendo, como exemplo, no caso de uma linha de produção, o supervisor pode tirar uma amostra da produção diária para cada dez Estatística Básica 36 itens produzidos. Nesse caso, definimos o tamanho da amostra em 10% da população. Amostragem de conveniência (não probabilística) A amostra de conveniência, classificada como uma amostra não probabilística, é composta por elementos reunidos pelo pesquisador simplesmente pelo fato de que ele possuía esses elementos. Por exemplo, se um professor aceita como amostra os alunos da classe, a população é toda a escola, logo, estará usando a amostra de conveniência. Nas pesquisas estatísticas existem algumas limitações quanto ao uso das amostras convenientes, mesmo assim, as amostras de conveniência ainda são comuns em algumas áreas do conhecimento, como é o caso da área da saúde, em que são estudados pacientes de uma única clínica ou hospital. Além disso, as amostras de conveniência costumam ser a única maneira de estudar o problema, por isso, muitos pesquisadores ainda utilizam esse tipo de amostragem. Para tanto, os pesquisadores que usam amostras de conveniência precisam ter conhecimento crítico sobre os elementos em análise, pois os dados podem se tornar tendenciosos. Exemplificamos da seguinte forma: suponha que você precisa estimar a probabilidade de morte por desidratação e que os dados de um hospital não podem ser usados, uma vez que apenas pacientes gravemente enfermos são hospitalizados e a taxa de mortalidade de pacientes internados pode ser maior do que a de não internados. Nesse exemplo, a amostra de conveniência composta por pacientes hospitalizados é enviesada. Por fim, é importante atentarmos ao fato de que os pesquisadores que estudam amostras sempre querem fazer inferências, ou seja, estender os resultados da amostra a toda a população; para tanto, é muito importante caracterizarem bem a amostra e estender os resultados obtidos apenas para a população de onde ela veio. Estatística Básica 37 Extensão da amostragem Como já estudamos anteriormente, um dos questionamentos mais frequentes quando se estuda estatística é: “qual deve ser o tamanho de minha amostra?” Para que as amostras representem fielmente o universo, é necessário agrupar casos suficientes. Mas para isso, é necessário que esse número dependa de alguns dos seguintes fatores, como: amplitude do universo, o nível de confiança estabelecido, o erro máximo permitido e a percentagem com que o fenômeno se verifica. Para determinação da amplitude do universo, é importante entender que a expansão da amostra está relacionada à expansão do universo, então, ele pode ser dividido em finito e infinito. No que se refere ao nível de confiança, entende-se como sendo a distância entre um ponto e a média. Na curva normal, o lado direito da média inclui o desvio padrão e o lado esquerdo inclui o desvio padrão, que representa 68% do total. Da mesma forma, se considerarmos dois desvios padrão, que correspondem a 95,5%, e três desvios padrão, que correspondem a 99,7%, isso significa que, ao selecionarmos uma amostra, se dois desvios padrão forem considerados, nosso nível de confiança será de 95,5%. Quando os resultados obtidos na amostra e no universo do qual os resultados são extraídos não são totalmente precisos, deparamo- nos com o denominado “erro”. O erro de medição do resultado diminui à medida que a amostra aumenta, dessa forma, o erro de medição está considerando a tolerância de amostras normais. Por fim, a estimativa do percentual de ocorrência do fenômeno é muito importante para se definir o tamanho da amostra, pois determina a parte da população que foi analisada e o impacto que tais resultados podem exercer sobre o todo. Estatística Básica 38 RESUMINDO: E então? Você gostou do que apresentamos? Conseguiu apreender tudo? Agora, só para termos a certeza de que você realmente entendeu o tema de estudo deste capítulo, vamos resumir tudo o que vimos. Você deve ter aprendido que as técnicas de amostragem consistem na determinação ou no levantamento de dados de uma parte da população. Essa técnica pode ser dividida em probabilística e não probabilística. Aprendemos que a amostragem será probabilística quando os elementos da população tiverem uma probabilidade conhecida e diferente de zero, assim, podem ser classificadas em: casual ou aleatória simples, proporcional estratificada e sistemática. Já a amostragem não probabilística ocorre quando o acesso à informação não é tão simples ou os recursos são limitados, levando o pesquisador a utilizar uma gama mais ampla de dados, denominada de amostragem por conveniência. Tal amostragem ainda é amplamente utilizada nas pesquisas, principalmente na área da saúde. Por fim, estudamos as extensões que envolvem a amostragem, que devem conter: a amplitude do universo, o nível de confiança estabelecido, o erro máximo permitido e a percentagem com que o fenômeno se verifica. Estatística Básica 39 REFERÊNCIAS CRESPO, A. A. Estatística fácil. 19. ed. São Paulo: Saraiva, 2009. GUIMARÃES, P. R. B. Métodos quantitativos estatísticos. Curitiba: IESDE Brasil, 2008. Estatística Básica Adauto José Valentim Neto e Dayanna Costa Estatística Básica _GoBack Compreender as fases dos métodos estatísticos Os tipos de métodos estatísticos Coletando os dados Aplicação dos métodos estatísticos Aplicação das variáveis Entendendo as variáveis Variáveis qualitativas Variáveis quantitativas Compreendendo a população e a amostra População e amostra População Amostra Executando a Amostragem Amostragem Amostragem casual ou aleatória simples Amostragem proporcional estratificada Amostragem sistemática Amostragem de conveniência (não probabilística) Extensão da amostragem
Compartilhar