Prévia do material em texto
T001 APRESENTAÇÃO DE DADOS E CONCEITOS BÁSICOS Prof. Simone Soares Echeveste Nesta unidade temática, você vai aprender • A importância da Estatística na construção do conhecimento e na tomada de decisões; • Principais conceitos básicos de Estatística; • A realizar a apresentação de dados através da construção de tabelas; • Principais gráficos estatísticos. A Estatística hoje se configura como uma das ciências que mais vem crescendo em termos de utilização e importância. A importância do conhecimento das ferramentas de análise de dados é destacada pelos seguintes aspectos: • ◦ Em uma pesquisa, muitas vezes, são realizados estudos experimentais ou observacionais que culminam em uma coleção de dados numéricos que devem ser organizados e resumidos. ◦ O padrão de variação nos dados faz com que a resposta não seja óbvia, ou seja, somente tratando os dados adequadamente é que poderemos verificar o comportamento das variáveis de estudo. ◦ Uma análise estatística é composta por métodos para coleta e descrição dos dados, viabilizando a verificação da força da evidência nos dados pró ou contra as hipóteses de pesquisa. A presença de uma variação não previsível nos dados faz disso, muitas vezes, uma tarefa pouco trivial. O grande avanço tecnológico das últimas décadas gerou a necessidade de formação de profissionais capazes de acompanhar esse desenvolvimento com habilidades para gerar e analisar dados, produzindo informação útil a ser utilizada na resolução de problemas. Nesse contexto, as ferramentas estatísticas são imprescindíveis, e o conhecimento das mesmas torna-se necessário para qualquer profissional. O estudo da Estatística tem por objetivos: propiciar ao aluno o estudo da estatística com vistas à análise de dados experimentais, cálculo e interpretação das medidas descritivas, utilização de testes estatísticos como ferramenta de análise de comparação e relação de dados no contexto das pesquisas realizadas na sua área de conhecimento. APRESENTAÇÃO DE DADOS E CONCEITOS BÁSICOS DE ESTATÍSTICA CONCEITOS BÁSICOS DE ESTATÍSTICA Encontramos vários conceitos e definições para a Estatística, alguns autores a definem como um ramo da matemática, já outros defendem a ideia de que a Estatística representa por si só uma área única da ciência desconsiderando ser esta uma subdivisão da matemática. Rao (1999) define estatística como: A estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação da quantidade de incerteza existente na resposta para um determinado problema; a tomada de decisões sob condições de incerteza, sob o menor risco possível. Finalmente, a estatística tem sido utilizada na pesquisa científica, para a otimização de recursos econômicos, para o aumento da qualidade e produtividade, na otimização em análise de decisões. Este conceito apresenta de forma clara e concisa todos os aspectos que envolvem as diversas formas de utilização da Estatística: levantamento de dados, processamento, análise e auxílio na tomada de decisões. Ao iniciar uma análise estatística, deve-se também considerar alguns elementos relacionados à metodologia do estudo realizada, como as definições de População e Amostra da pesquisa: Uma população (N) é conjunto de elementos de interesse em um determinado estudo, que podem ser pessoas ou resultados experimentais, com uma ou mais características comuns, que se pretendem estudar. Uma amostra (n) é um subconjunto da população usada para obter informação acerca do todo. Obtemos uma amostra para fazer inferências de uma população. Nossas inferências são válidas somente se a amostra é representativa da população. Para ilustrar esses conceitos através de um exemplo, considere a seguinte situação de pesquisa: T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 1 of 13 22/05/2022 07:01 “Uma empresa operadora de T.V. a cabo deseja realizar uma pesquisa com seus clientes da cidade de Porto Alegre referente ao grau de satisfação dos mesmos com o serviço prestado. Ao todo, essa operadora possui, nessa cidade, 217.193 assinantes dos quais foram selecionados 620 para participarem dessa pesquisa.” Para essa situação, teremos: • População: 217.193 assinantes da operadora de T.V. a cabo de Porto Alegre. • Amostra: 620 assinantes da operadora de T.V. a cabo de Porto Alegre que participaram da pesquisa. Outro conceito muito importante é o da Variável, que vem a ser a matéria prima de qualquer pesquisa, ou seja, quando se termina uma coleta de dados, em um primeiro momento, dispomos de um conjunto de valores ou ainda respostas pertinentes às nossas variáveis de pesquisa. Uma variável (x) é uma característica dos elementos investigados que difere de um elemento para outro e do qual temos interesse em estudar. Cada unidade (elemento) da população que é escolhido como parte de uma amostra fornece uma medida de uma ou mais variáveis, também chamadas observações. As variáveis podem ser classificadas em: Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos/quantidades. Podem ser contínuas ou discretas. • Discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Exemplos: números de carros vendidos, número de filhos, número de reclamações recebidas por dia, etc. • Contínuas: características mensuráveis que assumem valores em uma escala para as quais valores fracionais fazem sentido. Exemplos: renda mensal, tempo de entrega da mercadoria, tamanho do imóvel em m2, etc. T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 2 of 13 22/05/2022 07:01 Variáveis Qualitativas: são as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos elementos. Podem ser nominais ou ordinais. • ◦ Nominais: não existe ordenação dentre as categorias. Exemplos: marca do carro, tipo de fornecedor, profissão, etc. ◦ Ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (Fundamental, Médio ou Superior), grau de importância (nenhuma, pouca, razoável, muito), etc. Figura 1: Classificação das variáveis. Outros dois conceitos importantes são pertinentes à divisão da Estatística em duas áreas: Estatística Descritiva e Estatística Inferencial. A área descritiva é mais simples, contemplando ferramentas de organização de dados e síntese de informação, fazem parte dela as tabelas, gráficos, medidas de tendência central e medidas de variabilidade. A área Inferencial, por sua vez, permite ao pesquisador projetar resultados amostrais para populações, bem como testar hipóteses concernentes a parâmetros populacionais. Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. A Estatística Inferencial está baseada em dois pilares fundamentais: a Amostragem e a Probabilidade. APRESENTAÇÃO DE DADOS: TABELAS DE FREQUÊNCIA O primeiro contato do pesquisador com os seus dados é feito através da construção das tabelas de frequência, podemos dizer que neste momento os dados recebem o seu primeiro tratamento. Nessa etapa de análise, o pesquisador identifica as possíveis respostas a uma determinada variável e o comportamento das mesmas no que se refere a sua frequência. A tabela de frequência tem por objetivo apresentar os resultados de cada variável de uma forma organizada e resumida. Nessa tabela, encontramos o número de repetições de cada categoria de resposta de uma variável bem como o seu percentual no grupo investigado. De acordo com as normas da ABNT (Associação Brasileira de Normas Técnicas) e do IBGE (Instituto Brasileiro de Geografia e Estatística) as tabelas de frequência devem considerar os seguintes elementos: • Título: deve conter as informações necessárias para que se compreenda“o que” está sendo apresentado na tabela, “onde” os dados foram obtidos e “quando” esses dados foram coletados. • Cabeçalho: indica a natureza do conteúdo de cada coluna da tabela. • Corpo da Tabela: é a parte composta por linhas e colunas com as informações observadas. • Rodapé: espaço logo abaixo da tabela que pode ser utilizado para a apresentação de notas ou observações de natureza informativa. • Fonte: refere-se à entidade que organizou ou forneceu os dados apresentados na tabela. T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 3 of 13 22/05/2022 07:01 https://drive.google.com/file/d/1F1QDLkNlFHh2oFJaVzwWeBguf0eznGvh/view?usp=sharing https://drive.google.com/file/d/1F1QDLkNlFHh2oFJaVzwWeBguf0eznGvh/view?usp=sharing https://drive.google.com/file/d/1F1QDLkNlFHh2oFJaVzwWeBguf0eznGvh/view?usp=sharing https://drive.google.com/file/d/1F1QDLkNlFHh2oFJaVzwWeBguf0eznGvh/view?usp=sharing Considere uma pesquisa realizada com uma amostra de 20 clientes que compraram em um site de compras na Internet com o objetivo de investigar o tempo de atraso na entrega (em dias) das mercadorias adquiridas nesse site. Os dados observados foram: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Para esses dados, podemos destacar as seguintes informações: • Variável de pesquisa (x): Tempo de atraso na entrega das mercadorias; • Amostra investigada (n): 20 clientes. Para a construção da tabela, precisamos das seguintes informações: • ◦ Valores da variável que surgiram: correspondem aos tempos de atraso observados. Nesse caso, encontramos 0, 1, 2, 3 e 4 dias. ◦ Frequência (f) de cada valor da variável: corresponde ao número de vezes que cada valor se repetiu. Para o exemplo, podemos observar que 0 dias de atraso se repetiu em 7 clientes: T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 4 of 13 22/05/2022 07:01 Na sequência, 1 dia de atraso se repetiu em 5 clientes: Já 2 dias de atraso se repetiu em 3 clientes: Para 3 dias de atraso observamos uma ocorrência em 3 clientes: Por fim, para 4 dias de atraso observamos uma ocorrência em 2 clientes: Agora, organizamos essa informação através da estrutura de uma tabela de frequência, considerando todos os seus elementos: Como calculamos a porcentagem da tabela de frequência? T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 5 of 13 22/05/2022 07:01 https://drive.google.com/file/d/1_LO7DeUrr28-aRjL_UK0tc9dgyqnU3mM/view?usp=sharing https://drive.google.com/file/d/1_LO7DeUrr28-aRjL_UK0tc9dgyqnU3mM/view?usp=sharing https://drive.google.com/file/d/1_LO7DeUrr28-aRjL_UK0tc9dgyqnU3mM/view?usp=sharing https://drive.google.com/file/d/1_LO7DeUrr28-aRjL_UK0tc9dgyqnU3mM/view?usp=sharing https://drive.google.com/file/d/1ZBwUWXjNWB7XyaxiFqMcJ4rUYmFBbBj3/view?usp=sharing https://drive.google.com/file/d/1ZBwUWXjNWB7XyaxiFqMcJ4rUYmFBbBj3/view?usp=sharing Para a tabela construída do exemplo, temos: De acordo com as normas, as tabelas de frequência não podem ser fechadas dos lados e nem ter linhas dividindo as categorias da variável. As únicas linhas permitidas são as que delimitam o cabeçalho e as que delimitam o total; no centro da tabela, é opcional colocar ou não o traço divisório das colunas. A utilização de gráficos como forma de apresentação de dados pode ser justificada através de um ditado popular de que "uma imagem vale mais que 1000 palavras". Técnicas gráficas são geralmente utilizadas, em vez de tabelas, para descrever um conjunto de dados através de um "desenho". Um gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de reproduzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo. (CRESPO, 2009) A representação gráfica deve ser utilizada levando-se em conta algumas qualidades essenciais básicas para a construção destes conforme nos mostra a Figura 2. T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 6 of 13 22/05/2022 07:01 https://drive.google.com/file/d/1diFwEpI-NDRghcFkuN4plB4ombSqzrfT/view?usp=sharing https://drive.google.com/file/d/1diFwEpI-NDRghcFkuN4plB4ombSqzrfT/view?usp=sharing Figura 2: Qualidade de um bom gráfico. Em uma apresentação dos resultados de uma pesquisa, ou ainda, na divulgação de uma informação na mídia, podemos observar que algumas pessoas parecem não dar tanta atenção às informações estatísticas em forma de tabelas, porém elas podem aumentar a sua atenção e o seu interesse com as mesmas informações apresentadas em forma gráfica. Vejamos agora alguns dos gráficos estatísticos mais utilizados. O gráfico de setores, também conhecido como gráfico pizza, torta, queijo ou bolacha é um dos mais simples recursos gráficos, sua construção é baseada no fato de que o círculo possui 360º, sendo que esse círculo é dividido em fatias de acordo com o percentual em cada categoria. É um gráfico útil para representar variáveis nominais ou apresentadas em categorias de respostas. T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 7 of 13 22/05/2022 07:01 https://drive.google.com/file/d/1XYsIJkKAp74xUBuC_EPlASs7kvlAti87/view?usp=sharing https://drive.google.com/file/d/1XYsIJkKAp74xUBuC_EPlASs7kvlAti87/view?usp=sharing https://drive.google.com/file/d/1XYsIJkKAp74xUBuC_EPlASs7kvlAti87/view?usp=sharing https://drive.google.com/file/d/1XYsIJkKAp74xUBuC_EPlASs7kvlAti87/view?usp=sharing Figura 3: Exemplo de gráfico de setores. T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 8 of 13 22/05/2022 07:01 https://drive.google.com/file/d/1vCv0q9vz91tFgZdEY4LvbqbiUiarh3Ii/view?usp=sharing https://drive.google.com/file/d/1vCv0q9vz91tFgZdEY4LvbqbiUiarh3Ii/view?usp=sharing https://drive.google.com/file/d/1vCv0q9vz91tFgZdEY4LvbqbiUiarh3Ii/view?usp=sharing https://drive.google.com/file/d/1vCv0q9vz91tFgZdEY4LvbqbiUiarh3Ii/view?usp=sharing É recomendável a utilização desse gráfico para representar variáveis qualitativas e que tenham poucas categorias de resposta distintas, pois para uma variável com muitas opções de resposta este ficará visualmente “poluído”. O gráfico de colunas é um dos gráficos mais utilizados para representar um conjunto de dados, sendo a representação de uma série de dados através de retângulos dispostos verticalmente. A altura desses retângulos é proporcional às suas respectivas frequências ou porcentagens. Esse gráfico pode ser utilizado para representar qualquer tipo de variável em qualquer nível de mensuração, por esse fato, é um recurso extremamente utilizado em pesquisas. T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 9 of 13 22/05/2022 07:01 https://drive.google.com/file/d/1LP8Wre1ScLaahOEj-eeeWnEbT63cmTTq/view?usp=sharing https://drive.google.com/file/d/1LP8Wre1ScLaahOEj-eeeWnEbT63cmTTq/view?usp=sharing Figura 4: Exemplo de gráfico de colunas. O gráfico de colunas é um gráfico que não possui restrições, pode ser utilizado para representar variáveis qualitativas e quantitativas. Quando o número de categorias for muito extenso, podemos utilizar legendas com cores distintas para a identificação das categorias. O gráfico de barras é uma representação de uma série de dados através de retângulos dispostos horizontalmente. Os comprimentos desses retângulos são proporcionais às suas respectivas frequências. Esse gráfico é semelhante ao gráfico de colunas, contudo, a posição da escala e da frequência é trocada, ou seja, na linha horizontal, temos a frequência ou percentual de casos observados e na linha vertical temos os valores ou as categorias da variável de estudo. T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 10 of 13 22/05/2022 07:01 https://drive.google.com/file/d/1LP8Wre1ScLaahOEj-eeeWnEbT63cmTTq/view?usp=sharing https://drive.google.com/file/d/1LP8Wre1ScLaahOEj-eeeWnEbT63cmTTq/view?usp=sharing Figura 5: Exemplo de gráfico de barras. T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 11 of 13 22/05/2022 07:01 https://drive.google.com/file/d/1zM4aJ8VdBJvwoTXPmyi76Grcx2hMoUyd/view?usp=sharing https://drive.google.com/file/d/1zM4aJ8VdBJvwoTXPmyi76Grcx2hMoUyd/view?usp=sharinghttps://drive.google.com/file/d/1zM4aJ8VdBJvwoTXPmyi76Grcx2hMoUyd/view?usp=sharing https://drive.google.com/file/d/1zM4aJ8VdBJvwoTXPmyi76Grcx2hMoUyd/view?usp=sharing O gráfico de barras é um gráfico que não possui restrições, pode ser utilizado para representar variáveis qualitativas e quantitativas. Quando o número de categorias for muito extenso, podemos utilizar legendas com cores distintas para a identificação das categorias. É um excelente gráfico para os casos em que as categorias das variáveis são expressas através de frases ou palavras muito extensas. Este gráfico utiliza-se de uma linha para representar uma série estatística. Seu principal objetivo é evidenciar a tendência ou a forma como o fenômeno está crescendo ou decrescendo através de um período de tempo. Seu traçado deve ser realizado considerando o eixo "x" (horizontal) a escala de tempo e o eixo "y" (vertical) frequência observada dos valores. T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 12 of 13 22/05/2022 07:01 https://drive.google.com/file/d/1AumbwkVLiSAUDlwoeMwmTUublt3TJOiA/view?usp=sharing https://drive.google.com/file/d/1AumbwkVLiSAUDlwoeMwmTUublt3TJOiA/view?usp=sharing Figura 6: Exemplo de gráfico de linhas. O gráfico de linhas é o gráfico mais específico de todos, ou seja, sua utilização é limitada para situações em que a variável a ser representada for quantitativa, e os seus valores estão registrados ao longo de um período de tempo. RAO, C. R. Statistics: a technology for the millennium Internal. J. Math. & Statist. Sci, v. 8, n. 1, 1999. CRESPO, Antônio Arnot. Estatística fácil. 19. ed. atual. ed. São Paulo: Saraiva S.A. Livreiros Editores, 2009. Coordenação e Revisão Pedagógica: Claudiane Ramos Furtado Design Instrucional: Gabriela Rossa Diagramação: Marcelo Ferreira Ilustrações: Marcelo Germano Revisão ortográfica: Igor Campos Dutra T001 https://www.sites.google.com/ulbra.br/G000302GS001/t001 13 of 13 22/05/2022 07:01 https://drive.google.com/file/d/1AumbwkVLiSAUDlwoeMwmTUublt3TJOiA/view?usp=sharing https://drive.google.com/file/d/1AumbwkVLiSAUDlwoeMwmTUublt3TJOiA/view?usp=sharing