Prévia do material em texto
ESTATÍSTICA BÁSICA ADAUTO JOSÉ VALENTIM NETO e DAYANNA COSTA U N I D A D E 1 Estudaremos como se comportam as variáveis categóricas e numéricas e suas ramificações, bem como a amostra dos dados, conhecendo suas particularidades e suas aplicações práticas. Por fim, vamos estudar as amostragens, sejam elas probabilísticas, sejam não probabilísticas, de acordo com o tipo de amostra a ser coletada. UNIDADE 1 | INTRODUÇÃO 1.Compreender as fases dos métodos estatísticos; 2.Entender a aplicação das variáveis; 3.Compreender a população e a amostra; 4.Aplicar a execução da amostragem. UNIDADE 1 | OBJETIVOS Consiste na coleta de dados de forma direta, baseando-se em elementos de informações de registro obrigatório, como os registros de nascimentos, de casamentos e de óbitos, importação e exportação de mercadorias, preferência dos consumidores por um determinado produto, entre outros. Coletando os Dados • Normalmente, quando as pessoas se referem ao termo estatística, automaticamente, relacionam o termo à organização e descrição de dados, como as estatísticas do Ministério da Educação, dos acidentes de trânsito, entre outros, sem compreender que a essência da estatística é fornecer métodos de inferência cujas conclusões podem ir além dos dados inicialmente obtidos. • As fases do método estatístico são importantes para que os dados possam ser organizados. • A primeira fase consiste na definição do problema, logo, é importante saber exatamente o que estudar e definir o problema de forma correta. • Na segunda fase, será desenvolvido o planejamento. Nela, serão questionados alguns pontos fundamentais para o desenvolvimento das análises. • A terceira fase é a coleta de dados. Essa fase se caracteriza por ser mais operacional, em que o indivíduo efetua o registro sistemático de dados, de acordo com o objetivo determinado. • Na quarta fase, serão apurados os dados, logo, eles serão resumidos, contados e agrupados, ou seja, tabulados. • A quinta fase consiste na apresentação dos dados. Nessa fase, os dados podem ser apresentados de duas formas: de forma tabular, ou seja, apresentar-se de forma numérica; e de forma gráfica, a partir dos dados numéricos. • Por fim, a sexta fase se refere à análise e à interpretação dos dados. Esta última fase está essencialmente relacionada ao cálculo de métricas e coeficientes, tendo como objetivo principal a descrição de fenômenos estudados. A estatística faz parte da matemática aplicada e fornece métodos para coletar, organizar, descrever, analisar e interpretar dados, bem como usá-los para a tomada de decisões (CRESPO, 2009). Coletando os Dados • Ainda, na coleta de dados direta, os próprios pesquisadores podem coletar dados por meio de pesquisas, utilizando-se questionários, registros de verificação e inspeção, censo etc. • Nessa mesma linha de raciocínio, esse tipo de coleta ainda pode ser classificado considerando-se o fator tempo, como: contínuo, periódico e ocasional. • A coleta de dados de forma secundária (indireta) advém das informações já observadas pela coleta direta. Variável é uma caraterística ou uma condição utilizada para descrever um objeto, uma pessoa, um animal, um lugar e até mesmo uma ideia. As variáveis assumem diferentes valores por serem variáveis em diferentes circunstâncias ou unidades. Aplicação das variáveis • Contudo, podemos, ainda, classificar as variáveis de duas formas distintas: categóricas (qualitativas) e numéricas (quantitativas). • Dessa forma, as variáveis classificadas como categóricas ou qualitativas possuem características que não têm valor quantitativo, mas são definidas por várias categorias, ou seja, representam a classificação dos indivíduos e ainda podem ser divididas em nominais ou ordinais. • Assim, as variáveis consideradas nominais não possuem ordem entre as categorias; por exemplo: cor dos olhos, fumantes e não fumantes, doente ou sadio, entre outros. • Já as variáveis ordinais possuem uma ordem entre suas categorias; por exemplo: escolaridade, mês de análise, estágio da doença, entre outros. • No que tange às variáveis numéricas ou quantitativas, estas representam as características que podem ser medidas quantitativamente, ou seja, fornecem valores significativos. Assim, tais variáveis são expressas em números, por exemplo: salário dos trabalhadores, filhos em idade escolar, entre outros. • Essas variáveis também podem ser divididas em contínuas ou discretas. • As variáveis consideradas categóricas ou qualitativas não podem ser representadas por números, pois estão relacionadas a situações como a cor da pele, a cor dos olhos, a marca de refrigerante, a marca de carro, a marca de roupas, a preferência musical etc. • Sua classificação em ordinais e nominais expressão uma relação sequencial ou não sequencial de dados. Variáveis Qualitativas • Assim, embora as variáveis qualitativas classificadas como ordinais não sejam expressas de forma numérica, estão sujeitas a relações sequenciais. Podemos exemplificar essa forma sequencial como: ótimo, bom, regular e ruim, classe social, nível de escolaridade e outros conceitos. • As variáveis qualitativas definidas como nominais nada têm a ver com uma ordem sequencial, pois são apenas identificadas por meio de nomes. Por exemplo: as cores (vermelho, amarelo, preto, azul, rosa, verde etc.), a marca do carro, o nome da bebida, o local de nascimento, entre outros. • Para avaliarmos as variáveis numéricas ou quantitativas, utilizamos a representação numérica. Elas, por sua vez, podem ser divididas em discretas e contínuas, a depender de suas limitações numéricas. • Assim, as variáveis quantitativas classificadas como discretas serão relacionadas a circunstâncias limitadas, como o número de revistas vendidas, o número de visitas e o número de filhos de um casal. No estudo da população e da amostra, um grupo de entidades com pelo menos uma característica em comum será denominado população estatística ou universo estatístico. Compreendendo a população e a amostra • Nesse sentido, podemos exemplificar da seguinte forma: os alunos de uma determinada escola constituem um grupo, pois apresentam pelo menos uma característica em comum, que é a aprendizagem. Assim, como em qualquer pesquisa estatística, é preciso estudar uma ou mais características de certos elementos gerais, portanto, essa característica deve ser perfeitamente definida. • Nessa mesma linha de raciocínio, ao considerarmos qualquer elemento, afirmamos inequivocamente que esse elemento pertence à totalidade. Portanto, é necessário estabelecermos um padrão de composição populacional que seja válido para qualquer pessoa no tempo ou no espaço. Não obstante, para todas as análises estatísticas, o mais básico para sua compreensão é a relação entre a população e a amostra. • Para que as inferências sejam corretas, é necessário garantir que a amostra representa a população, ou seja, em termos do fenômeno que se deseja estudar, a amostra deve ter as características básicas da população. Portanto, é necessário obter a amostra a ser utilizada por um método adequado. Em alguns casos, como pesquisas sociais, econômicas e de opinião pública, as questões de amostragem são muito complexas. Podemos afirmar que toda pesquisa estatística precisa atender ao público-alvo, pois é a partir dele que se coleta e analisa dados com base em princípios de pesquisa. Esse público-alvo é denominado população, que é um grupo de pessoas com características próprias. População e amostra • Na população denominada finita, o número de elementos de um grupo não é muito grande, logo, a entrevista e a análise das informações devem ser dirigidas a todos. Por exemplo: a situação das escolas particulares de uma cidade qualquer – se observarmos esse grupo específico, concluímos que há um número limitado de escolas na cidade. • Entretanto, quando a população é classificada como infinita, o número de elementos é tão grande que é considerado infinito, como a população de uma cidade, pois não podemossaber com exatidão, em termos numéricos, a quantidade de pessoas que vivem em uma cidade. • Nessa perspectiva, como em qualquer pesquisa estatística, o objetivo da população é estudar uma ou mais características de certos elementos globais, que devem ser perfeitamente definidos. Ao considerarmos qualquer elemento, podemos afirmar, de forma inequívoca, se o elemento pertence à totalidade (GUIMARÃES, 2008). • Uma amostra se refere a uma população, uma parte ou um subconjunto de uma parte. Em alguns casos, é impossível entrevistar todos os elementos da população, pois leva muito tempo para concluir o trabalho e nem mesmo é viável economicamente, portanto, o número de respondentes corresponde a um determinado número de elementos do conjunto amostral. • É necessário garantir que uma amostra está representando a população. Por sua vez, isso significa que, além das pequenas diferenças inerentes à amostragem de variáveis aleatórias, mais ou menos no processo de amostragem, a amostra deve ter as mesmas características básicas gerais da variável que será pesquisada (GUIMARÃES, 2008). O objetivo da seleção da amostra é obter as informações que representam uma população. O método mais simples é escolher uma amostra aleatória, de modo que todos os membros da população tenham a mesma probabilidade de aparecer em qualquer amostra. Executando a amostragem • Os principais tipos de amostragem são: amostragem probabilística e amostragem por cotas. • Existe uma técnica especial de amostragem que pode garantir, ao máximo, a chance de seleção quanto à aleatoriedade na escolha. Portanto, todos os membros da população têm a mesma chance de ser selecionado, o que garante que a amostra seja representativa, o que é muito importante, pois as conclusões sobre a população serão baseadas nos resultados obtidos juntamente à população. • Existem dois principais tipos de amostragem: a probabilística e a não probabilística. • Se todos os elementos da população tiverem uma probabilidade conhecida diferente de zero e pertencerem à amostra, então, a amostragem será probabilística. Entretanto, se a amostragem for não probabilística, o acesso à informação não será tão simples ou os recursos serão limitados, logo, os pesquisadores usarão uma gama mais ampla de dados, chamada de amostragem por conveniência (GUIMARÃES, 2008). Para a determinação da amplitude do universo, é importante entender que a expansão da amostra está relacionada à expansão do universo, então, o universo pode ser dividido em finito e infinito. Extensão da amostragem • Quando os resultados obtidos na amostra e no universo do qual os resultados extraídos não são totalmente precisos, deparamo-nos com o denominado “erro”. O erro de medição do resultado diminui à medida que a amostra aumenta, dessa forma, o erro de medição está considerando a tolerância de amostras normais. • Por fim, a estimativa do percentual de ocorrência do fenômeno é muito importante para se definir o tamanho da amostra, pois determina a parte da população que foi analisada e o impacto que tais resultados podem exercer sobre o todo. OBRIGADO!