Buscar

Estatística em Pedagogia

Prévia do material em texto

Universidade Paulista
Pedagogia
Walter
24A8 ESTATÍSTICA
Santana do Parnaíba – SP
2019
Introdução
 Este trabalho visa compensar as faltas na disciplina dissertando sobre algumas áreas da estatística
Estatística descritiva, variáveis, séries, rol, dados brutos, frequência absoluta e relativa 
Construção de tabelas e gráficos
Dados agrupados e não agrupados
Medidas de tendência central
Conceitos Fundamentais e Definições
 A estatística trabalha com dados, os quais podem ser obtidos por meio de uma população ou de uma amostra, definida como: 
População: conjunto de elementos que tem pelo menos uma característica em comum. Esta característica deve delimitar corretamente quais são os elementos da população que podem ser animados ou inanimados. 
Amostra: subconjunto de elementos de uma população. Este subconjunto deve ter dimensão menor que o da população e seus elementos devem ser representativos da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhecimento que se tem da população e da quantidade de recursos disponíveis. A estatística inferencial é a área que trata e apresenta a metodologia de amostragem. 
Em se tratando de conjuntos-subconjuntos, estes podem ser: 
Finitos: possuem um número limitado de elementos.
Infinitos: possuem um número ilimitado de elementos.
 Segundo Medronho e colaboradores (2003), elemento significa cada uma das unidades observadas no estudo. Após a determinação dos elementos pergunta-se: o que fazer com estes? Pode-se medi-los, observá-los, contá-los surgindo um conjunto de respostas que receberá a denominação de variável. Variável: é a característica que vai ser observada, medida ou contada nos elementos da população ou da amostra e que pode variar, ou seja, assumir um valor diferente de elemento para elemento. Não basta identificar a variável a ser trabalhada, é necessário fazer-se distinção entre os tipos de variáveis: 
Variável qualitativa: é uma variável que assume como possíveis valores, atributos ou qualidades. Também são denominadas variáveis categóricas.
 Variável quantitativa: é uma variável que assume como possíveis valores, números. 
Cada uma dessas variáveis pode ser subclassificada em: 
Variável qualitativa nominal: é uma variável que assume como possíveis valores, atributos ou qualidades e estes não apresentam uma ordem natural de ocorrência. 
Exemplo 01: meios de informação utilizados pelos alunos da disciplina Inferência Estatística do curso de Estatística da UEM: televisão, revista, internet, jornal. 
Variável qualitativa ordinal: é uma variável que assume como possíveis valores atributos ou qualidades e estes apresentam uma ordem natural de ocorrência. 
Exemplo 02: estado civil dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM: solteiro, casado, separado. 
Variável quantitativa discreta: é uma variável que assume como possíveis valores números, em geral inteiros, formando um conjunto finito ou enumerável. 
Exemplo 03: número de reprovas, por disciplina, dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM: 0, 1, 2, .....
 Variável quantitativa contínua: é uma variável que assume como possíveis valores números, em intervalos da reta real e, em geral, resultantes de mensurações.
 Exemplo 04: peso (quilogramas) dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM: 58, 59, 63.....
Estatística
 Durante o século XX, segundo Salsburg (2009), a Estatística revolucionou a ciência através do fornecimento de modelos úteis que sofisticaram o processo de pesquisa na direção de melhores parâmetros de investigação, permitindo orientar a tomada de decisões nas políticas socioeconômicas. Para Stigler (1986), os métodos estatísticos foram desenvolvidos como uma mistura de ciência, tecnologia e lógica para a solução e investigação de problemas em várias áreas do conhecimento humano.
 A estatística é definida como um conjunto de métodos e técnicas que envolve todas as etapas de uma pesquisa, desde o planejamento, coordenação, levantamento de dados por meio de amostragem ou censo, aplicação de questionários, entrevistas e medições com a máxima quantidade de informação possível para um dado custo, a consistência, o processamento, a organização, a análise e interpretação dos dados para explicar fenômenos socioeconômicos, a inferência, o cálculo do nível de confiança e do erro existente na resposta para uma determinada variável e a disseminação das informações (Ignácio, 2010).
 
Estatística Descritiva
 É a parte da Estatística que procura somente descrever e avaliar um certo grupo, sem tirar quaisquer conclusões ou inferências sobre um grupo maior. A Estatística Descritiva pode ser resumida nas seguintes etapas:
Definição do problema
Planejamento
Coleta dos dados
 Crítica dos dados
Apresentação dos dados (tabelas e gráficos)
Descrição dos dados
 Em estatística descritiva dois métodos podem ser utilizados para apresentação de dados: Método Gráfico (envolvendo apresentação gráfica e/ou tabular) e métodos numéricos (envolvendo apresentações de medidas de posição e/ou dispersão. (Peternelli, 2014)
Representação Gráfica e Tabular
 Os gráficos constituem uma das formas mais eficientes de apresentação de dados. Um gráfico é, essencialmente, uma figura constituída à partir de uma tabela, pois é quase sempre possível locar um dado tabulado num gráfico.
 Enquanto as tabelas fornecem uma ideia mais precisa e possibilitam uma inspeção mais rigorosa aos dados, os gráficos são mais indicados em situações que objetivam dar uma visão mais rápida e fácil a respeito das variáveis às quais se referem os dados. Embora a confecção de gráficos dependa muito da habilidade individual, algumas regras gerais são importantes. O leitor deve ficar atento e procurar saber sobre tais regras antes de se envolver na confecção de gráficos. Existem vários tipos de gráficos que podem ser utilizados com o objetivo de descrever um conjunto de dados resumidamente (Peternelli, 2014).
Tabela
 Toda tabela deve ser simples, clara, objetiva e autoexplicativa. Segundo Milone (2004, p.25), 
os elementos fundamentais da tabela são: título, cabeçalho, coluna indicadora e corpo. O título aponta o fenômeno, época e local de ocorrência; o cabeçalho explica o conteúdo das colunas; a coluna indicadora detalha as linhas; o corpo mostra os dados. Complementarmente, tem-se: fonte, notas e chamadas. A fonte cita o informante (caracterizando a confiabilidade dos dados); as notas esclarecem o conteúdo e indicam a metodologia adotada na obtenção ou elaboração da informação; as chamadas clarificam pontos específicos da tabela.
Tabela Simples
 Uma tabela simples contém as diferentes categorias observadas de uma variável qualitativa e suas respectivas contagens, denominadas frequências absolutas. A contagem refere-se ao número de ocorrências de cada categoria e é realizada utilizando-se, por exemplo, a Tabela 01 ou o banco de dados. Quanto à classificação, uma tabela simples pode ser temporal quando as observações são feitas levando-se em consideração o tempo; geográfica quando os dados se referem ao local de ocorrência; específica (ou categórica) quando tempo e local são fixos; e comparativa quando a tabela resume informações de duas ou mais variáveis. A tabela comparativa é também denominada tabela cruzada ou de dupla ou mais entradas. Os nomes da coluna indicadora e cabeçalho podem ser escritos iniciando-se com letras maiúsculas. Também é prática comum justificar à esquerda as diferentes categorias da variável qualitativa que se apresentam no conteúdo das linhas, iniciando-se com letras maiúsculas e podem ser dispostas na ordem em que aparecem nos questionários, ordem alfabética ou ordem decrescente de frequência absoluta.
Distribuição da Frequência
 Dependendodo volume de dados, torna-se difícil ou impraticável tirar conclusões a respeito do comportamento das variáveis e, em particular, de variáveis quantitativas. Pode-se, no entanto, colocar os dados brutos de cada uma das variáveis quantitativas em uma ordem crescente ou decrescente, denominado rol. A visualização de algum padrão ou comportamento continua sendo de difícil observação ou até mesmo cansativa, mas torna-se rápido identificar maiores e menores valores ou concentrações de valores no caso de variáveis quantitativas. Estes números (menor e maior valor observado) servem de ponto de partida para a construção de tabelas para estas variáveis. Vale destacar que para as variáveis qualitativas, pode-se também construir um rol em ordem temporal ou alfabética, por exemplo.
Distribuição da frequência pontual
 A construção de uma distribuição de frequência pontual é equivalente à construção de uma tabela simples, onde se listam os diferentes valores observados da variável, com suas frequências absolutas, denotadas por Fi, onde o índice i corresponde ao número de linhas da tabela, como é mostrado na Tabela 2
Tabela 2 . Número de irmãos dos alunos da disciplina Inferência Estatística do curso de Estatística da Universidade Estadual de Maringá, 21/03/2005.
 Observa-se que esta variável foi resumida em 5 linhas. Assim, i = 1,...,5, e, portanto, tem-se 5 valores para as frequências absolutas. A frequência absoluta da segunda linha, F2 = 6, por exemplo, indica que seis alunos têm um irmão, enquanto apenas um afirmou ter seis irmãos. A soma de todas as frequências absolutas deve ser igual ao número total de observações da variável, neste caso, 22. A segunda coluna desta tabela é uma coluna opcional em distribuições de frequências. Ainda, como colunas complementares em uma distribuição de frequências e considerando i, a ordem da linha na tabela, tem-se:
a freqüência relativa, denotada por fi, e já definida anteriormente como:
onde n é o tamanho da amostra, devendo ser substituída por N se os dados forem populacionais. A soma das freqüências relativas de todas as categorias é igual a 1;
a freqüência relativa em percentual, denotada por fi%, e definida como:
representando o percentual de observações que pertencem àquela categoria. A soma das freqüências deve, agora, ser igual a 100%;
a freqüência absoluta acumulada, denotada por iaF. Estas freqüências são obtidas somando-se a freqüência absoluta do valor considerado, às freqüências absolutas anteriores a este mesmo valor.
a freqüência acumulada relativa, denotada por iaf% e definida como:
Uma tabela contendo todas estas freqüências é dita uma distribuição de freqüências completa. Desta forma, a Tabela 3 pode ser apresentada como:
Tabela 3. Número de irmãos dos alunos da disciplina Inferência Estatística do curso de Estatística da Universidade Estadual de Maringá, 21/03/2005.
Gráfico
 Gráfico é um recurso visual da Estatística utilizado para representar um fenômeno. Sua utilização em larga escala nos meios de comunicação social, técnica e científica, devem-se tanto à sua capacidade de refletir padrões gerais e particulares do conjunto de dados em observação, como à facilidade de interpretação e a eficiência com que resume informações dos mesmos. Embora os gráficos forneçam menor grau de detalhes que as tabelas, estes apresentam um ganho na compreensão global dos dados, permitindo que se aperceba imediatamente da sua forma geral sem deixar de evidenciar alguns aspectos particulares que sejam de interesse do pesquisador. Uma representação gráfica coloca em evidência as tendências, as ocorrências ocasionais, os valores mínimos e máximos e as ordens de grandezas dos fenômenos que estão sendo observados.
 Ao incluir um gráfico em um trabalho, sua identificação deve aparecer na parte inferior, precedido pela palavra Gráfico seguida de seu número de ordem de ocorrência no texto (algarismos arábicos), de seu respectivo título e/ou legenda explicativa de maneira breve e clara (dispensando a leitura do texto) e da fonte de onde se extraiu os dados. Uma regra básica para a elaboração adequada do título de qualquer gráfico, é verificar se o mesmo responde a três exigências: o quê, onde e quando.
Gráficos para variáveis qualitativas
Gráfico de Barras
 É um gráfico formado por retângulos horizontais de larguras iguais, onde cada um deles representa a intensidade de uma modalidade ou atributo. O objetivo deste gráfico é de comparar grandezas e é recomendável para variáveis cujas categorias tenham designações extensas.
Gráfico 1. Relação trabalho e curso dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM, 21/03/2005.
Gráfico de Colunas
 É o gráfico mais utilizado para representar variáveis qualitativas. Difere do gráfico de barras por serem seus retângulos dispostos verticalmente ao eixo das abscissas sendo mais indicado quando as designações das categorias são breves. Também para este tipo de gráfico deve ser preservada a distância entre cada retângulo de, aproximadamente, 2/3 da largura da base de cada coluna. O número de colunas ou barras do gráfico não deve ser superior a 12 (doze).
Gráfico 2. Meios de informação utilizados pelos alunos da disciplina Inferência Estatística, curso de Estatística da UEM, 21/03/2005.
Gráfico de Setores
 Tipo de gráfico onde a variável em estudo é projetada num círculo, de raio arbitrário, dividido em setores com áreas proporcionais às frequências das suas categorias. São indicados quando se deseja comparar cada valor da série com o total. Recomenda-se seu uso para o caso em que o número de categorias não é grande e não obedecem a alguma ordem específica.
Gráfico 3. Município de procedência dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM, 21/03/2005.
Gráfico de Linhas
 Sua aplicação é mais indicada para representações de séries temporais sendo por tal razão, conhecidos também como gráficos de séries cronológicas. Sua construção é feita colocando-se no eixo vertical (y) a mensuração da variável em estudo e na abscissa (x), as unidades da variável numa ordem crescente. Este tipo de gráfico permite representar séries longas, o que auxilia detectar suas flutuações tanto quanto analisar tendências. Também podem ser representadas várias séries em um mesmo gráfico.
Gráfico 4. Número de matrículas anuais na disciplina Probabilidade do curso de Estatística da UEM, 21/03/2005.
Gráfico de variáveis quantitativas discretas
Gráfico de Bastões
 Este gráfico é formado por segmentos de retas perpendiculares ao eixo horizontal (eixo da variável), cujo comprimento corresponde à frequência absoluta ou relativa de cada elemento da distribuição. Suas coordenadas não podem ser unidas porque a leitura do gráfico deve tornar claro que não há continuidade entre os valores individuais assumidos pela variável em estudo.
Gráfico 5. Número de irmãos dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM, 21/03/2005.
Gráfico de Frequência Acumulada
 O Gráfico 6 mostra o gráfico para frequência acumulada de uma variável quantitativa discreta. Na abscissa são alocados os valores assumidos pela variável número de irmãos e no eixo das ordenadas suas frequências acumuladas. Observa-se que a leitura do gráfico exige alguns cuidados básicos: caso o valor da variável esteja ou não incluído, sua frequência acumulada difere. Se for de interesse saber quantos alunos tem dois ou menos irmãos (inclui-se dois irmãos), a frequência acumulada é de 19 alunos. Caso se queira apenas saber quantos alunos têm menos de dois irmãos (portanto o número dois não está incluso), sua frequência acumulada é de 7 alunos.
Gráfico 6. Número acumulado de irmãos dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM, 21/03/2005.
Gráfico para variáveis quantitativas contínuas
Histograma
 É um gráfico de colunas justapostas que representa uma distribuiçãode frequência para dados contínuos ou uma variável discreta quando esta apresentar muitos valores distintos. No eixo horizontal são dispostos os limites das classes segundo as quais os dados foram agrupados enquanto que o eixo vertical corresponde às frequências absolutas ou relativas das mesmas.
Gráfico 7. Idade dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM, 21/03/2005.
Medidas Descritivas
 Uma outra maneira de se resumir os dados de uma variável quantitativa, além de tabelas e gráficos, é apresentá-los na forma de valores numéricos, denominados medidas descritivas. Estas medidas, se calculadas a partir de dados populacionais, são denominadas parâmetros e se calculadas a partir de dados amostrais são denominadas estimadores ou estatísticas. As medidas descritivas auxiliam a análise do comportamento dos dados. Tais dados são provenientes de uma população ou de uma amostra, o que exige uma notação específica para cada caso, conforme mostra o Quadro 01.
 Classificam-se as medidas descritivas como: medidas posição (tendência central e separatrizes), medidas de dispersão, medidas de assimetria e de curtose. 
Medidas de Tendência Central
 As medidas de tendência central são assim denominadas por indicarem um ponto em torno do qual se concentram os dados. Este ponto tende a ser o centro da distribuição dos dados. Reis (1998), afirma que:
 o valor a escolher depende das características dos dados. Por exemplo, num estudo agrícola sobre a produção de trigo por hectare de terra arável podemos estar interessados em conhecer o valor mais elevado da produtividade do solo agrícola das várias explorações analisadas. Num outro estudo sobre os resultados de uma turma de estudantes universitários talvez seja mais interessante conhecer o resultado médio obtido por 50% dos estudantes. Num outro estudo sobre os rendimentos per capta dos países da CEE, a comparação entre países será facilitada se calcularmos os rendimentos médios de cada país.
A seguir, são definidas as principais medidas de tendência central: média, mediana e moda.
Média Aritmética
 A média aritmética (X) é a soma de todos os valores observados da variável dividida pelo número total de observações. Sob uma visão geométrica a média de uma distribuição é o centro de gravidade, representa o ponto de equilíbrio de um conjunto de dados. É a medida de tendência central mais utilizada para representar a massa de dados.
Moda
 A moda (Mo) é o valor que apresenta a maior frequência da variável entre os valores observados. Para o caso de valores individuais, a moda pode ser determinada imediatamente observando-se o rol ou a frequência absoluta dos dados. Por outro lado, em se tratando de uma distribuição de frequência de valores agrupados em classes, primeiramente é necessário identificar a classe modal, aquela que apresenta a maior frequência, e a seguir a moda é calculada aplicando-se a fórmula:
 O uso da moda é mais indicado quando se deseja obter, rapidamente, uma medida de tendência central. Um outro aspecto que favorece a utilização da moda é que seu valor não é afetado pelos valores extremos do conjunto de dados analisado.
Mediana
 A mediana (Md) é o valor que ocupa a posição central da série de observações de uma variável, em rol, dividindo o conjunto em duas partes iguais, ou seja, a quantidade de valores inferiores à mediana é igual à quantidade de valores superiores a mesma.
Considerações Finais
 A Estatística é uma ciência cujo campo de aplicação estende-se a muitas áreas do
conhecimento humano. Entretanto, um equívoco comum que deparamos nos dias atuais é que, em função da facilidade que o advento dos computadores nos proporciona, permitindo desenvolver cálculos avançados e aplicações de processos sofisticados com razoável eficiência e rapidez, muitos pesquisadores consideram-se aptos a fazerem análises e inferências estatísticas sem um conhecimento mais aprofundado dos conceitos e teorias. Tal prática, em geral, culmina em interpretações equivocadas e muitas vezes errôneas...
 Em sua essência, a Estatística é a ciência que apresenta processos próprios para coletar, apresentar e interpretar adequadamente conjuntos de dados, sejam eles numéricos ou não. Pode-se dizer que seu objetivo é o de apresentar informações sobre dados em análise para que se tenha maior compreensão dos fatos que os mesmos representam. A Estatística subdivide-se em três áreas: descritiva, probabilística e inferencial. A estatística descritiva, como o próprio nome já diz, se preocupa em descrever os dados. A estatística inferencial, fundamentada na teoria das probabilidades, se preocupa com a análise destes dados e sua interpretação.
 A palavra estatística tem mais de um sentido. No singular se refere à teoria estatística e ao método pelo qual os dados são analisados enquanto que, no plural, se refere às estatísticas descritivas que são medidas obtidas de dados selecionados. A estatística descritiva, cujo objetivo básico é o de sintetizar uma série de valores de mesma natureza, permitindo dessa forma que se tenha uma visão global da variação desses valores, organiza e descreve os dados de três maneiras: por meio de tabelas, de gráficos e de medidas descritivas.
 A tabela é um quadro que resume um conjunto de observações, enquanto os gráficos são formas de apresentação dos dados, cujo objetivo é o de produzir uma impressão mais rápida e viva do fenômeno em estudo. Para ressaltar as tendências características observadas nas tabelas, isoladamente, ou em comparação com outras, é necessário expressar tais tendências através de números ou estatísticas. Estes números ou estatísticas são divididos em duas categorias: medidas de posição e medidas de dispersão.
Anexo
Exemplo de exercício em Sala
Referências Bibliograficas
Guedes, T. A.; Acorsi, C. R. L.; Martins, A. B. T.; Janeiro, V. Projeto de Ensino. Aprender Fazendo Estatística. UEM. 2005
Ignácio, S. A. Importância da estatística para o processo de conhecimento e tomada de decisão. Nota Técnica Ipardes nº6. Curitiba, 2010
Mwdronho, R. A., Carvalho, D.M.de, Bloch K.V., Luiz, R.R. E Werneck, G.L.
Epidemiologia. São Paulo: Editora Atheneu, 2003.
Peternelli, L. A. Introdução à Estatística (Aula). Departamento de Informática, Universidade Federal de Viçosa. Minas Gerais, 2014.
Reis, E. Estatística descritiva. Lisboa: Silabo, ed. 4, 1998. 
Salsburg, D. Uma senhora toma chá...: como a estatística revolucionou a ciência no século XX. Trad. de José Maurício Gradel, revisão técnica Suzana Herculano-Houzel. Rio de Janeiro: Jorge Zahar, 2009. 286p
Stigler, S. M. The history of statistics: the measurement of uncertainty before 1900.Cambridge, USA: The Belknap Press of Harvard University Press, 1986.

Continue navegando