Estatistica

Ariel Perote

26/04/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 47 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Elementos Estáticos

10 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

License-511420-28046-0-0
ESTATÍSTICA
Introdução à Estatística
Olá! Boas-vindas a esta unidade de aprendizagem! Aqui, vamos
entender um pouco a origem e evolução da estatística.
Você já parou para pensar em como a estatística pode ser
antiga? Desde muito tempo, nossos antepassados já contavam e
classificavam informações a respeito, por exemplo, da quantidade
de pessoas que viviam em determinado local.
Claro, é importante saber que os métodos e as ferramentas
disponíveis antigamente eram muito diferentes das que temos
hoje. Mas, afinal, então, como definir o que é estatística? Em que
situações podemos aplicá-la?
Para entender como a estatística funciona, você precisa saber
um pouco mais sobre ela. Além da sua história e evolução, você
vai aprender algumas definições básicas e saber quais são os
tipos de variáveis e como classificá-los.
Bons estudos!
License-511420-28096-0-4
ESTATÍSTICA
Histórico, evolução, aplicabilidade
e definições básicas da estatística:
população, amostra e variáveis
Não se sabe ao certo desde quando os conhecimentos e
conceitos estatísticos são aplicados. A única certeza é de que
o pensamento estatístico é bem antigo. Vamos ver como ele
surgiu e evoluiu ao longo da história?
Histórico, evolução, aplicabilidade
Há registros do uso de levantamento de dados com mais de
2.000 anos na China. Você deve imaginar, entretanto, que essa
atividade mudou bastante ao longo do tempo. A estatística como
conhecemos hoje é fruto de anos de dedicação de inúmeros
pesquisadores e profissionais de diferentes áreas. Uma delas
é Florence Nightingale, que, no século XIX, através de estudos
estatísticos, descobriu que a alta mortalidade dos soldados
era causada por más condições de saneamento (CONSELHO
FEDERAL DE ENFERMAGEM, 2012).
Em uma pesquisa na internet, você
pode encontrar muitos outros
profissionais que contribuíram para a
evolução da estatística.
A partir da década de 1980, a estatística avançou rapidamente.
Segundo Triola (2008), com os computadores, a estatística
se tornou acessível e ágil. E no que podemos usá-la? Sua
aplicabilidade é ilimitada: educação, saúde, jogos etc., pois todo
dado coletável pode ser tratado estatisticamente.
Definições básicas da estatística:
população e amostra
Para Magalhães e Lima (2015), estatística é um conjunto de
técnicas que permite organizar, descrever, analisar e interpretar
dados e é agrupada em três áreas: estatística descritiva,
probabilidade e estatística inferencial. Cada uma será estudada
License-511420-28096-0-4
ESTATÍSTICA
mais profundamente em unidades posteriores. O que você deve
saber agora é que só é possível fazer estudos estatísticos se
conhecer bem dois conceitos: população e amostra.
De acordo com Triola (2008), população é a coleção completa
de dados que desejamos entender. Dela, parte a amostra, que é
um subconjunto de elementos populacionais. Dê uma olhada na
imagem a seguir.
Fonte: Shutterstock, 2017.
Perceba que o conjunto de todas as peças do quebra-cabeça
forma a população, e a peça destacada em vermelho é uma
possível amostra dela.
Fique atento às diferenças entre
população e amostra, pois nas
próximas unidades você estudará os
cálculos para cada situação.
Você já ouviu falar em censo, correto? Ele só pode ser feito
quando temos acesso a todos os dados da característica de
interesse. Assim, não há necessidade de extrapolar os dados,
basta quantificar e apresentá-los. Quando o censo não é possível,
seja por qualquer razão (tempo, acesso etc.), utilizamos a técnica
de coleta de amostras, denominada amostragem, selecionando
sob certos critérios alguns elementos da população para coleta
de dados.
License-511420-28096-0-4
ESTATÍSTICA
Definições básicas da estatística: variáveis
Na estatística, tratamos dados como variáveis.
Variáveis
ContínuasDiscretasOrdinaisNominais
Qualitativas Quantitativas
Fonte: TRIOLA, 2008 (Adaptado).
Para classificar as variáveis, o primeiro passo é descobrir se são
numéricas ou não. Caso não sejam numéricas, são classificadas
como qualitativas e retratam qualidades das variáveis. Veja a
foto a seguir. Quais tipos de variáveis você conseguiria detectar?
Fonte: Shutterstock, 2017.
License-511420-28096-0-4
ESTATÍSTICA
Agora, volte ao diagrama e note que essas variáveis ainda podem
ser classificadas em mais dois tipos: as ordinais e nominais, cuja
ordem influencia ou não, respectivamente, o tratamento das
informações. Tome como exemplo de variável qualitativa ordinal
a posição em uma fila (1º, 2º e assim por diante) e de variável
qualitativa nominal a cor de cabelo (loiro, castanho etc.).
E as variáveis numéricas? Estas são chamadas de quantitativas,
já que expressam quantidades, e também podem ser de dois
tipos: discretas e contínuas. As discretas são aquelas cuja medida
é finita ou enumerável, normalmente valores inteiros, oriundos
de contagens. Uma forma fácil de identificar sua natureza é
verificar se é possível agrupar dados iguais. Por exemplo, as
idades em anos e o peso em quilos.
Quando as variáveis assumem valores nos números reais,
tidas como infinitas ou não enumeráveis, são classificadas de
quantitativas contínuas. Segundo Triola (2008), elas resultam
de infinitos valores possíveis que correspondem a alguma
escala continua que cobre um intervalo de valores sem vazios,
interrupções ou saltos.
Fonte: Shutterstock, 2017.
License-511420-28096-0-4
ESTATÍSTICA
O peso pode assumir infinitos valores em um certo intervalo.
Considere uma balança de alta precisão, onde uma pessoa
pesa 98,5347 kg. Perceba que dificilmente outra pessoa terá
exatamente o mesmo peso, com essa precisão.
Percebeu que uma mesma variável pode ser discreta ou contínua?
Isso depende da sua forma de apresentação. Por exemplo, a
idade apresentada em anos é classificada como quantitativa
discreta, mas, se forem considerados os dias, podem surgir
valores como 32,4 ou 25,7, tornando-a quantitativa contínua. É o
mesmo que ocorre com o peso: considerando apenas os quilos, é
uma variável discreta, mas, ao contar também os gramas, torna-
se contínua.
Para interpretar resultados obtidos de
análises, a natureza da variável deve
sempre ser considerada.
Na próxima unidade, você aprofundará seus conhecimentos
sobre acesso e coleta de dados, considerando fontes disponíveis
e confiáveis e a forma correta de coletar amostras.
License-510259-28128-0-0
ESTATÍSTICA
Tipos de dados
Introdução
Olá estudante! Lembra o que vimos na unidade anterior?
Entendemos um pouco da história da estatística e os conceitos
fundamentais para nosso estudo. Percebeu que, quando
desejamos conhecer alguma característica populacional, mas o
acesso a todos os seus indivíduos é difícil ou impossível, podemos
usar a coleta de dados por amostra?
Lidar com dados não é uma tarefa difícil, mas, sim, refinada, que
exige certos cuidados que nos ajudam a atingir a qualidade dos
resultados que serão gerados.
Nesta unidade, você verá novamente alguns conceitos
apresentados na anterior e também conhecerá novos conceitos
acerca da forma de apresentação dos dados e a forma
adequada de coletar dados amostrais que representem bem a
população de origem.
Não se esqueça de que os conhecimentos que você obterá
aqui estão diretamente ligados às próximas unidades que você
estudará. Então, tenha muita atenção e dedicação na leitura.
Vamos começar?
License-510259-28478-0-5
ESTATÍSTICA
Classificações, fontes de dados e
tipos de coletas
Você já conhece o conceito de amostra, certo? Vamos expandi-lo
um pouco. Independente da forma como ela é coletada, precisa
representar bem a diversidade encontrada na população. Vamos
investigar mais as características atreladas aos conceitos de
população e amostra?
Classificações
Inicialmente, vamos recapitular os conceitos de população e
amostra apresentados na primeira unidade. De acordo com Triola
(2008), população é o nome dado à coleção completa de todos
os elementos a serem estudados,e amostra é um subconjunto
de elementos da população.
O autor apresenta dois outros conceitos importantes para o
trabalho com dados: parâmetro e estatística. O termo parâmetro é
empregado à medida numérica que descreve uma característica
populacional, ao passo que estatística é o termo usado para a
medida que descreve uma característica amostral.
Esses termos serão utilizados ao longo
das unidades e ajudam a identificar a
origem do conjunto de dados.
As características que um parâmetro ou estatística descrevem
podem ser, por exemplo, a média, o desvio padrão ou a variância,
conceitos que serão trabalhados com mais profundidade em
unidades posteriores.
Agora, vamos contextualizar os conceitos em um caso prático
hipotético para que você os compreenda melhor. Primeiro,
observe a figura a seguir.
License-510259-28478-0-5
ESTATÍSTICA
Fonte: egd, shutterstock, 2017.
Suponha que um pesquisador verificou que, em um trecho de
rodovia, transitaram entre as 16 e 20 horas uma média de 3000
carros durante todo o ano de 2015. Em 2016, ele quis verificar
a média de carros no mesmo local e horários, porém, somente
para o mês de dezembro. Durante a pesquisa, verificou que a
média dessa amostra de tempo era de 2237 carros.
Considerando esse caso, qual dado é o parâmetro e qual é a
estatística? A média verificada em 2015 é um parâmetro, pois se
trata de toda a informação populacional. Já a média verificada
em 2016 é uma estatística, pois é uma parte da informação
coletada em apenas uma parte do período, isto é, uma amostra.
Fontes de dados
Coletar uma amostra exige certos cuidados para não tomarmos
decisões equivocadas. Quer entender o porquê? Vamos considerar
dois exemplos para identificar a ideia de representatividade
populacional na amostra. Bolfarine e Bussab (2005) citam um
exemplo simples do cotidiano: uma sopa.
License-510259-28478-0-5
ESTATÍSTICA
Fonte: Liv friis-larsen, Shutterstock, 2017.
Quando cozinhamos uma sopa e desejamos testar seu tempero
ou temperatura, não precisamos tomar tudo, basta uma
colher. Além disso, devemos mexer a sopa antes de prová-la,
ou poderemos tirar conclusões equivocadas. Como? Veja: se
pegarmos uma colher da borda do prato, onde a sopa está mais
fria, podemos julgar que toda ela está em uma temperatura
agradável, entretanto, no centro, está quente demais para ser
consumida.
Agora, considere outro exemplo. Uma operadora de TV por
assinatura quer realizar uma pesquisa de opinião sobre a
qualidade do serviço. É provável que, mesmo tendo muitos
recursos, seja inviável contatar todos os seus clientes. Inúmeras
razões podem levar a essa falta de informação, como a
dificuldade de encontrar os clientes no horário comercial, a
disponibilidade deles e até mesmo seu interesse em responder a
pesquisa. Assim, é mais adequado trabalhar com uma amostra.
License-510259-28478-0-5
ESTATÍSTICA
O processo de trabalhar com a coleta
de dados amostrais é denominado
amostragem.
Após optar pela amostragem, a empresa deve decidir qual
é o método mais adequado à pesquisa e à natureza da
população. Trataremos dos métodos de amostragem em
unidades posteriores, mas já é importante citar algumas
possíveis características da população que podem influenciar
os resultados da pesquisa por amostragem. Para tanto, veja a
figura a seguir.
Fonte: Ollyy, Shutterstock, 2017.
Você consegue identificar 25 pessoas de diferentes etnias, gêneros,
idades, cortes de cabelo, que utilizam ou não óculos, com e sem
cabelos longos etc. Que outras características você consegue
identificar? Considerando que há uma diversidade de variáveis,
License-510259-28478-0-5
ESTATÍSTICA
imagine o que pode acontecer ao não considerá-las na pesquisa.
Vamos exercitar melhor essas considerações em unidades
posteriores, quando vamos tratar dos tipos de amostragem.
Diante disso, podemos afirmar que as coletas de dados assumem
critérios que as tornam tendenciosas ou não tendenciosas.
Perceba que uma amostra tendenciosa não representa a
população a qual pertence e, por essa razão, é considerada uma
amostra ruim (TRIOLA, 2008).
Ainda de acordo com Triola (2008), há duas fontes distintas de
dados: estudos observacionais, quando coletamos informações,
mas não interferimos no sujeito do estudo, ou estudos
experimentais, quando aplicamos tratamentos e observamos
seus efeitos no sujeito de estudo. Na próxima unidade,
aprofundaremos esses conceitos.
Clique na figura para assistir ao vídeo
License-510259-28478-0-5
ESTATÍSTICA
Tipos de coleta de dados
Os dados podem ser coletados de diferentes formas e com
propósitos variados. Bolfarine e Bussab (2005) destacam a
importância do instrumento de coleta de dados utilizado, bem
como a forma como o aplicador se comunica na abordagem
da pesquisa. Por exemplo, um questionário aplicado por meio
de uma entrevista oral é uma forma de coleta de dados com
comunicação verbal, e a entrevista é o seu instrumento.
Telefone E-mail Coleta em campo
Fonte: Tachjang; studiostock; Sergey Nivens, Shutterstock.com
Você pode utilizar um instrumento de
outro pesquisador, quando atender às
suas necessidades de sua pesquisa, ou
criar um próprio.
Além da aplicação de questionários, é possível utilizar acesso
a bases de dados de instituições, registros como prontuários,
entre outros. São inúmeras as formas de coletas de dados, e a
mais adequada ao seu estudo depende do tipo de pesquisa e
da forma com que o estudo é delineado. Na próxima unidade,
você aprofundará seus conhecimentos sobre planejamento
experimental e técnicas de amostragem e verá a importância
de conduzir de forma correta seus experimentos.
License-523747-28188-0-0
ESTATÍSTICA
Planejamento de experimentos
Introdução
Você se lembra dos conceitos de população e amostra vistos nas
unidades anteriores? Sabe como aplicá-los? Pois bem, depois
de toda essa fundamentação teórica, está na hora de entender
como trabalhar com amostras.
Um exemplo de aplicação da amostragem são as pesquisas
de opinião. Você já participou de alguma? Para selecionar os
participantes, o responsável pelo planejamento amostral deve
fazer várias considerações, aplicando as técnicas aprendidas
nesta disciplina de forma adequada.
Está preparado(a) para conhecer as ferramentas que podem
sanar possíveis problemas de amostragem? Os conhecimentos
apresentados nesta unidade vão exigir um pouco mais de
atenção, pois sua aplicabilidade depende das necessidades da
pesquisa e do tipo de dados disponíveis. Então, siga a leitura
atentamente!
License-523747-28484-0-5
ESTATÍSTICA
Conceitos gerais da experimentação
e tipos de amostragem
Dependendo das questões que pesquisaremos e do público
disponível e acessível para uma pesquisa, uma série de
considerações devem ser feitas para decidir qual método de
amostragem usar. Vamos investigar esse assunto!
Conceitos gerais da experimentação
Como definir quais elementos da população vão compor uma
amostra? Bolfarine e Bussab (2005) alertam que precisamos
pesquisar, planejar, executar, corrigir e analisar de forma
adequada o procedimento proposto e usado de coleta de dados.
A forma de planejar um experimento não é fechada como uma
receita de bolo, pois depende dos objetivos de pesquisa e dos
resultados que pretendemos obter com ela, do conhecimento
acerca da população etc.
Vamos voltar aos tipos de estudos abordados na unidade
anterior para explorá-los um pouco mais e observar suas formas
de condução.
Os conhecimentos que você obteve em
unidades anteriores sobre classificação
de variáveis e tipos de estudos vão
ajudá-lo a delinear seus experimentos
de forma mais clara.
Critérios para determinação de experimento
Você se lembra dos conceitos de estudos observacionais e
experimentais? O que os difere é que, nos experimentais, há
interferência no sujeito objeto do estudo, diferentemente dos
observacionais.
Vamos aprofundar um pouco esse tema. Dentro dos estudos
experimentais, há algumas variações,de acordo com os
seguintes critérios apresentados por Triola (2008): controle de
efeito, réplica e aleatorização.
License-523747-28484-0-5
ESTATÍSTICA
O controle de efeito se refere às formas de contornar possíveis
efeitos que não são necessariamente provocados pela variável
de estudo. Para contorná-los, Triola (2008) sugere os seguintes
experimentos: cegos, nos quais o sujeito submetido ao estudo não
sabe se está recebendo um tratamento ou placebo (tratamento
sem efeito), e em blocos, em que grupos de participantes são
submetidos a diferentes tratamentos.
Em experimentos com unidades de experimento vivas, como
testes com vacinas e medicamentos em humanos, a pesquisa
pode contar aplicadores, isto é, pessoas designadas apenas para
administração dos tratamentos que compõem o experimento.
Quando esses aplicadores não são os próprios pesquisadores,
é possível executar o experimento duplo-cego, uma vez que
o pesquisador tem a informação de qual tratamento será
administrado, mas não a repassa nem aos aplicadores nem aos
sujeitos do estudo. Porém, quando o tratamento é aplicado ao
sujeito pelo próprio pesquisador, esse recurso do duplo cego
fica inviável.
Quando tanto o sujeito da pesquisa
quanto o aplicador não sabem qual é
o tratamento usado, temos um estudo
duplo-cego.
Triola (2008) cita como exemplo o estudo de eficácia da vacina
Salk, contra a poliomielite. Segundo Campos, Nascimento e
Maranhão (2003), ela era produzida a partir do vírus morto e
começou a ser utilizada no Brasil a partir de 1955. A partir da
década de 1960, foi substituída pela vacina Sabin. Como você
lidaria com os possíveis efeitos em um experimento similar?
Existem várias formas, como mostra o diagrama a seguir.
• Somente os pacientes não sabem se estão recebendo tratamento ou placebo.
Experimento cego
Experimento duplo-cego
• Nem os médicos que aplicam as vacinas nem os pacientes sabem se a aplicação da
vacina é um placebo ou um tratamento.
Experimento em blocos
• Mais tratamentos podem ser testados ao mesmo tempo, possibilitando verificar
melhores formulações ou marcas.
Fonte: Baseado em Triola (2008).
License-523747-28484-0-5
ESTATÍSTICA
Compreendeu o controle de efeito? A próxima questão abordada
por Triola (2008) é a réplica, que se refere à repetição de grupos
de elementos no experimento para aumentar o tamanho amostral
e para que os resultados possam ser confirmados ou verificados.
Imagine um trecho de terra, dividido em vários quadrantes.
Nele, um pretendemos testar diferentes tipos de adubos. Para
ter certeza de que os resultados obtidos não vêm de uma porção
de terra muito irrigada do quadrante ou que tenha sido exposta
a mais sol que as demais, podemos cultivar várias mudinhas em
um mesmo quadrante, apenas variando o local do plantio. Assim,
colocamos algumas plantas mais na borda, outras no centro do
quadrante. Cada uma dessas mudas de um quadrante específico
é uma réplica do mesmo tratamento.
Por fim, a aleatorização diz respeito à forma como os dados
são coletados, para que não haja viés na coleta. Segundo Triola
(2008), a amostra aleatória é aquela em que os elementos são
selecionados da população, com a mesma probabilidade. Vamos
supor um caso clássico: o sorteio de bolas numeradas em uma
urna. Para um sorteio justo, todas as bolas devem ter condições
iguais de serem sorteadas: mesmo peso, formato e volume.
Dessa forma, se tivermos seis bolas nessa urna, numeradas de
1 a 6, a chance de sortear qualquer uma necessariamente é
de 1/6 ou cerca de 0,167. Entretanto, em certas situações, por
exemplo, pesquisas com doenças raras, a aleatorização e a
réplica ficam inviáveis.
Tipos de amostras
Bolfarine e Bussab (2005) citam dois tipos de amostras: as não
probabilísticas e as probabilísticas. Você consegue imaginar as
diferenças entre elas?
Conforme Triola (2008), as não probabilísticas são aquelas
que proporcionam fácil acesso aos dados, sem qualquer outra
preocupação. Já as probabilísticas são aquelas em que cada
sujeito tem chance conhecida (mas não necessariamente
igual) de ser selecionado. Além disso, esse tipo de amostra nos
possibilita tirar conclusões acerca da população, desde que seja
executada com todo rigor necessário.
License-523747-28484-0-5
ESTATÍSTICA
Bolfarine e Bussab (2005) dividem em dois tipos as amostras
não probabilísticas. O primeiro é a amostra criteriosa, quando
utilizamos algum critério de seleção, mas que não chega a tornar
a pesquisa probabilística. Um exemplo é a seleção de alunos da
3ª série do Ensino Médio para participar de uma pesquisa sobre
a qualidade da escola. Podemos selecionar apenas aqueles com
75% de presença e que, portanto, usufruem mais dos espaços e
serviços da escola do que os demais. Ainda assim, essa amostra
não seria coletada de forma aleatória, por isso, não é considerada
probabilística.
O segundo é a amostra intencional, quando a seleção dos
participantes é feita pela identificação ao gosto do pesquisador,
muito mais que a criteriosa. Podemos citar como exemplo a
seleção dos maiores especialistas em determinada doença para
a validação de um instrumento de pesquisa.
Quanto às amostras probabilísticas, podemos dividi-las em
quatro tipos, conforme o quadro a seguir.
Amostra Descrição
Aleatória simples Uma amostra de n sujeitos é coletada aleatoriamente.
Sistemática
Escolhe-se um ponto inicial e, a seguir, é selecionado cada k-ésimo
elemento da população.
Estratificada
A amostra tem estratos condizentes com os populacionais, por exemplo,
gênero e faixa etária.
Por conglomerado
A população é dividida em seções e, após o sorteio de n seções, todos os
sujeitos das seções serão pesquisados.
Fonte: Elaborado pela autora, baseado em Triola (2008).
Quer entender melhor? Observe as figuras a seguir, que
representam as ideias das amostras probabilísticas.
Fonte: Ajay Kumar Singh, Shutterstock, 2017. Fonte: flydragon, Shutterstock, 2017. (Adaptado). Fonte: ESB Professional, Shutterstock. (Adaptado).
License-523747-28484-0-5
ESTATÍSTICA
Na urna, idealmente cada objeto possui a mesma chance de ser
sorteado, representado a amostragem aleatória simples. Já as
fichas representadas na segunda imagem podem, por exemplo,
representar a lista de moradores dos bairros de uma cidade, da
qual escolhemos alguns dos bairros para fazer uma pesquisa
representando uma amostragem por conglomerado. Além disso,
assumindo que a lista seja de elementos de uma população, a
seleção do k-ésimo elemento a partir de um ponto de partida é
também a representação de amostragem sistemática. Por fim, o
exemplo ilustrado na terceira figura representa uma amostragem
estratificada a ser executada a fim de mensurarmos, por exemplo,
a opinião de funcionários sobre o plano de saúde oferecido como
benefício de uma determinada empresa, mantendo a mesma
proporção de homens e mulheres.
Independentemente do tipo de amostragem probabilística com
a qual trabalhamos, Triola (2008) aponta um conceito muito
importante: o erro amostral, que é a diferença entre o resultado
amostral e o verdadeiro resultado populacional.
As diferenças que encontraremos entre os resultados gerados
a partir do experimento com amostras são erro amostral, já
equívocos no planejamento e na execução do experimento,
na manipulação da base de dados e qualquer outra situação
causada pelo pesquisador causam erro não amostral.
Erros não amostrais são originados
quando uma ou mais das etapas
de pesquisa são feitas de forma
inadequada.
Chegamos ao fim de mais uma unidade! Caso tenha ficado
curioso sobre os tipos de amostragem, não deixe de conferir a
bibliografia da disciplina. Até a próxima!
License-523747-28484-0-5
ESTATÍSTICA
License-397702-28192-0-0
ESTATÍSTICA
Análise descritiva dos dados
Introdução
Você estudou na aula passada os conceitos gerais da
experimentação e os tipos de amostragem e ainda viu a
importância de um bom planejamento experimental para atingir
resultados precisos. Agora,imagine que você tem em mãos os
dados numéricos resultantes de um estudo estatístico de uma
população ou amostra. Como analisar e representá-los?
É aí que entra a análise descritiva dos dados, que pressupõe
organizar esses dados em tabelas e gráficos. As tabelas são
recursos utilizados pela estatística para organizar e facilitar a
visualização e comparação dos dados. Já os gráficos trazem as
mesmas informações das tabelas de forma visual, permitindo
melhor compreensão das principais características dos dados.
Ao longo desta aula, você compreenderá melhor como utilizar
esses recursos. Vamos lá?
License-397702-28480-0-7
ESTATÍSTICA
Análise descritiva de dados
A estatística descritiva nos possibilita organizar e descrever
um conjunto de dados por meio de tabelas e gráficos, que você
conhecerá ao longo desta aula. Vamos começar entendendo o
que são as tabelas.
Tabelas estatísticas
Você sabe no que podemos utilizar as tabelas? Em artigos
científicos, órgãos governamentais, empresas, jornais, entre
outros, justamente por transmitirem informações rápidas aos
leitores e possibilitarem comparações.
Segundo Triola (2008), quando trabalhamos com grandes
conjuntos de dados, muitas vezes é útil organizar e resumi-los
com a construção de uma tabela que liste os seus diferentes
possíveis valores (individualmente ou em grupos), juntamente
com suas frequências correspondentes (ou contagens). Para a
sua construção, algumas regulamentações devem ser seguidas.
Fonte: karelnoppe, Shutterstock, 2017.
License-397702-28480-0-7
ESTATÍSTICA
Segundo Tiboni (2010), a tabela é um conjunto de observações
sobre um determinado assunto, organizadas e distribuídas num
quadro que apresenta a seguinte estrutura: o título, que explica
o que a tabela contém, o cabeçalho, que especifica o conteúdo
de cada coluna, e o rodapé, que traz demais informações sobre
a tabela e a fonte dos seus dados. Veja um exemplo a seguir.
Ano População Total
1980 119.002.706
1991 146.825.475
1996 157.070.163
2000 169.799.170
2010 190.755.799
Fonte: INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA, 2017. (Adaptado).
A tabela é um quadro que representa
de forma sintética um conjunto de
dados numéricos para facilitar seu
entendimento e leitura.
Tipos de gráficos
Conseguiu compreender o que é uma tabela? Mas ela não é a
única forma de representação de dados numéricos. Conforme
Magalhães e Lima (2015), muitas vezes, a informação contida
nas tabelas pode ser mais facilmente visualizada em gráficos.
De acordo com Tiboni (2010), os principais tipos de gráficos são
os seguintes.
Gráfico de linhas: representa séries cronológicas de um período
grande, por exemplo, comparativos de temperaturas, série
histórica do número de habitantes de determinado local ao
longo de vários anos e consumo de energia elétrica.
License-397702-28480-0-7
ESTATÍSTICA
Gráfico de colunas ou barras: faz correspondências entre
elementos de uma série estatística e a figura geométrica de um
retângulo, que pode ser vertical (colunas) ou horizontal (barras).
Usado para representar a taxa de fecundidade de uma mulher
(número médio de filhos), a população de um local em vários
anos etc.
Gráfico de setores ou pizza: é representado por um círculo
dividido em setores para comparar o valor de cada setor com
o total. Usado, por exemplo, para ilustrar escolaridade, sexo,
receita municipal, produção pecuária, entre outros.
Fonte: RomanR, Shutterstock, 2017. (Adaptado).
Histograma: ilustra uma distribuição de frequência por meio de
retângulos justapostos, cada um relacionado a uma classe da
distribuição de frequências. Como exemplos, estão a distribuição
do número de filhos por famílias e a espessura de peças
produzidas por uma empresa em um determinado mês.
License-397702-28480-0-7
ESTATÍSTICA
30
25
20
15
10
5
0
Fr
eq
uê
nc
ia
Polígono de frequências: gráfico de configuração linear obtido
quando calculamos o ponto médio de cada intervalo de classe
e o marcamos na parte superior do retângulo do histograma. Ao
unirmos todos os pontos médios, obtemos a linha do polígono
de frequências. Um exemplo é o polígono de frequência da
distribuição do número de filhos por famílias.
30
25
20
15
10
5
0
Fr
eq
uê
nc
ia
Ogiva: gráfico que representa a frequência acumulada, útil para
determinar valores que estão abaixo de outro, por exemplo, o
polígono de frequência acumulada da distribuição do número de
filhos por famílias.
License-397702-28480-0-7
ESTATÍSTICA
120
100
80
60
40
20
0
Fr
eq
uê
nc
ia
a
cu
m
ul
ad
a
Diagrama de dispersão: é representado pelos eixos cartesianos
x e y, cada um correspondendo às variáveis que poderão estar
correlacionadas no estudo. No eixo vertical, temos y, a variável
dependente, e no das abcissas, x, a variável independente. Você
verá o assunto com mais profundidade em outras aulas.
Clique na figura para assistir ao vídeo
License-397702-28480-0-7
ESTATÍSTICA
Va
riá
ve
l D
ep
en
de
nt
e
Variável Independente
Os gráficos estatísticos são
representações visuais que possibilitam
uma análise mais rápida dos dados
estatísticos.
Tipos de séries e séries estatísticas do IBGE
Você já ouviu falar em séries estatísticas? Elas são muito
úteis para representar dados como a expectativa de vida das
mulheres e as taxas de desemprego, de alfabetização, de juros,
entre muitos outros exemplos. Mas o que são?
A distribuição de um conjunto de dados
em função da época, espécie e local é
chamada série estatística.
De acordo com Tiboni (2010), as séries estatísticas são
tabelas representadas por um conjunto de dados estatísticos,
classificadas nos tipos a seguir.
License-397702-28480-0-7
ESTATÍSTICA
Temporal: também chamada de cronológica, histórica ou evolutiva, é a série na qual os dados
são observados segundo a época de ocorrência. Por exemplo, o consumo de energia elétrica
durante o ano em determinada cidade de 1970 a 2010.
Geográfica: também chamada de espacial, territorial ou de localização, é a série na qual os
dados são observados segundo a localidade da ocorrência. Um exemplo é o número de empresas
fiscalizadas em determinado ano por estado.
Específica: também chamada de categórica, é a série na qual os dados são observados segundo
a modalidade de ocorrência, como ao mostrar o número de matrículas no Ensino Superior
realizadas por área de ensino em 2016.
Distribuição de frequências: é a série estatística na qual os dados são agrupados com suas
respectivas frequências absolutas. Alguns exemplos são: o número de acidentes por dia na Rua
X em julho de 2017 e a altura dos alunos da classe escolar x em março de 2017.
Quando ordenadas em um determinado intervalo, as informações
constituem as séries estatísticas históricas, que nos permitem
verificar mudanças em indicadores como saúde, educação,
habitação, trabalho, demografia e economia e aprimorar a
metodologia para coleta dos dados.
Você sabe onde visualizar algumas séries estatísticas? Uma
fonte importante é o Instituto Brasileiro de Geografia e
Estatística (IBGE). O IBGE tem como principal objetivo divulgar
para os diversos públicos, como a área acadêmica, órgãos
governamentais e setores privados, informações provenientes
de suas pesquisas, demonstrando a realidade socioeconômica
e demográfica do país, úteis como ferramentas para tomada de
decisões e para agregar conhecimentos.
O gráfico a seguir mostra um exemplo de série histórica com
dados do IBGE. Nela, verificamos o comportamento da taxa de
analfabetismo de pessoas com 10 anos ou mais de 1992 a 2011 no
Brasil.
License-397702-28480-0-7
ESTATÍSTICA
17
16
15
14
13
12
11
10
9
8
7
1992 1995 1998 1999 2001 2002 2003 2004 2005 2006 2007 2009 2009 2011
Fonte: INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA, 2011. (Adaptado).
Você chegou ao final desta aula, que o ajudou a reconhecer
a importância das tabelas, gráficos e séries estatísticas.
Posteriormente, você verá os recursos tecnológicos quepodem
ser aproveitados para a análise estatística em sua construção.
License-393926-28196-0-0
ESTATÍSTICA
Recursos tecnológicos para a análise
estatística
Introdução
Você já aprendeu um pouco sobre tabelas, gráficos e séries
históricas. Lembra que as tabelas apresentam de forma resumida
resultados rápidos sobre algum assunto em estudo? O mesmo
ocorre com os gráficos, que fornecem características dos dados
e possibilitam comparações.
Utilizar ferramentas tecnológicas como facilitadoras na análise
de dados estatísticos nessas tabelas e gráficos pode tornar
nosso trabalho muito mais prático.
Agora, você conhecerá alguns recursos tecnológicos utilizados
em análises estatísticas e ferramentas computacionais para
a análise de dados estatísticos. Um programa que podemos
utilizar para a análise estatística é o Microsoft Excel, por exemplo.
Você será apresentado a algumas funções dele ao longo desta
unidade. Vamos começar?
License-393926-28482-0-4
ESTATÍSTICA
Ferramentas computacionais para a
análise estatística
Ao longo das unidades anteriores, você conseguiu perceber
como a estatística está presente em muitas áreas, não é mesmo?
A informática também. Por isso, várias ferramentas tecnológicas
têm sido desenvolvidas para utilização em diversos segmentos,
seja por empresas públicas ou privadas e pelo público acadêmico.
Tratam-se dos chamados softwares estatísticos, que auxiliam
a análise estatística dos dados nas tomadas de decisão e nas
pesquisas científicas.
Fonte: jannoon028, Shutterstock, 2017.
A estatística e a tecnologia
Você já sabe que a estatística é uma ciência exata que nos
fornece recursos para coletar, resumir, organizar, analisar e
interpretar dados, correto? Agora, você verá como a tecnologia
nos auxilia a interpretar e analisar informações por meio de
tabelas e gráficos.
License-393926-28482-0-4
ESTATÍSTICA
Segundo Lapponi (2005), a estatística é mais do que trabalhar
com números porque, mesmo com toda a praticidade dos
programas estatísticos, que fornecem resultados rápidos na
organização dos dados e construção de gráficos, os analistas
devem saber interpretar os resultados.
Na prática, o que isso significa? Perceba que, mesmo com
ferramentas cada vez mais práticas para a análise de dados
estatísticos, devemos ser prudentes ao utilizá-las, não agindo de
forma mecanizada, mas, sim, sabendo interpretar os resultados
obtidos. Suponha uma pesquisa, com a amostra já coletada. A
partir dela, já podemos realizar a análise exploratória dos dados,
fazer gráficos e inferências, inclusive por meios tecnológicos.
Imagine agora, que, nessa mesma amostra, existem dados
discrepantes (os chamados outliers), que não são retirados do
conjunto de dados na hora de fazer a análise. Assim, possivelmente
teremos resultados que não condizem com a realidade e faremos
conclusões erradas sobre o estudo em questão.
Dessa forma, apesar de toda a facilidade que as ferramentas
tecnológicas proporcionam, devemos sempre estar baseados na
teoria para identificar possíveis incoerências.
Os recursos tecnológicos facilitam
a coleta, organização, análise e
interpretação de dados estatísticos.
A seguir, você conhecerá alguns softwares estatísticos.
Softwares estatísticos
Muitos softwares ou programas estatísticos são compostos por
ferramentas criadas para pessoas que possuem conhecimento
na área da estatística.
License-393926-28482-0-4
ESTATÍSTICA
Fonte: Scanrail1, Shutterstock, 2017.
Esses softwares funcionam em computadores comuns, porém
são capazes de rodar também em computadores e servidores
de alta performance, ampliando sua capacidade de manipulação
de dados para milhões de registros de informações.
Triola (2008) cita os seguintes exemplos.
Statdisk: desempenha várias funções e testes estatísticos e
pode gerar histogramas e diagramas de dispersão. Não é um
software livre.
Minitab: possui um ambiente completo para a análise de dados,
por exemplo, estatística descritiva, análise das séries temporais,
correlação, regressão, controle estatístico de processo,
planejamento de experimentos, análise de sobrevivência, entre
outros. O Minitab possui boa parte dos principais métodos
estatísticos em uma interface gráfica bem organizada e pode
gerar todos os tipos de gráficos estudados na unidade 4. Não é
um software livre.
Excel: é o software de planilha eletrônica mais conhecido e
utilizado. Possui ferramentas que possibilitam muitas análises
estatísticas, como cálculo de estatísticas descritivas, testes
estatísticos, a juste de regressão linear, correlações, distribuições
License-393926-28482-0-4
ESTATÍSTICA
de probabilidade, entre outros. Pode gerar histogramas,
polígonos de frequência, gráficos de colunas, linhas, setores ou
pizza e diagramas de dispersão. Não é um software livre, mas seu
valor é mais acessível se comparado a outros softwares pagos
mencionados nesta Unidade. Além disso, temos o Libre Office,
que traz uma planilha de cálculos similar e é livre.
Clique na figura para assistir ao vídeo
Outros softwares também amplamente conhecidos são listados
a seguir.
SPSS: um dos softwares mais utilizados na área acadêmica e por
pesquisadores das ciências sociais, é bastante completo para a
análise de dados. Não é um software livre.
BioEstat: utilizado nas diversas áreas de conhecimento por
estudantes e pesquisadores, mas com maior frequência na área
de ciências biológicas. É prático e de fácil manuseio, além de ter
licença gratuita para utilização.
O avanço tecnológico de hardwares
e softwares possibilita o constante
crescimento das análises estatísticas
em uma velocidade e volume de dados
cada vez maior.
License-393926-28482-0-4
ESTATÍSTICA
Você já utilizou ou ao menos ouviu falar em quais desses
softwares? Exploraremos mais o Excel, por ser mais acessível e
de fácil utilização. Vamos começar?
Utilizando o Excel
Você já explorou ao menos um pouco o Excel? Que tal aprofundar
um pouco seus conhecimentos?
Com um pouco de conhecimento e
prática, o Excel é uma ferramenta
extremamente útil para análises
estatísticas e manipulação da
base de dados.
Esse software dispõe de várias funções úteis para o manuseio
e a análise de dados: planilhas, tabelas, gráficos e ferramentas
estatísticas para análise exploratória dos dados.
As planilhas são organizadas em linhas numeradas e colunas
identificáveis por letras (A, B, C, D etc.). Cada um dos espaços
é chamado de célula ou casela. Veja um exemplo na figura a
seguir. Note as colunas A, B, C e D,... e as linhas numeradas em
ordem crescente.
Fonte: Peter Sobolev, Shutterstock, 2017.
Nessas planilhas, inserimos os bancos de dados provenientes
das pesquisas realizadas e, a partir deles, realizamos consultas,
cálculos estatísticos, gráficos, entre outras atividades.
A partir de agora, você aprenderá como utilizar esse software.
License-213524-28200-0-0
ESTATÍSTICA
Tipos de variáveis e distribuição de
frequências de variáveis discretas
Introdução
Você conheceu em unidades anteriores alguns conceitos básicos
de estatística e os recursos tecnológicos que nos auxiliam nas
análises estatísticas. Você se lembra de alguma das ferramentas
computacionais que você estudou? A principal e mais acessível
delas é o Excel. Conseguiu testá-lo um pouco?
Agora, você vai se aprofundar nos conceitos da estatística,
aprendendo mais sobre variáveis qualitativas e quantitativas.
Também verá as definições de dados brutos, rol de dados,
frequências e distribuições de frequência de variáveis discretas.
O objetivo é identificar as variáveis qualitativas e quantitativas
em uma população ou amostra e organizá-las por meio de
frequências e gráficos. Vamos em frente!
License-213524-28776-0-4
ESTATÍSTICA
Variáveis qualitativas e quantitativas
Segundo Triola (2008), a pesquisa é uma das muitas ferramentas
que podemos usar para a coleta dos dados que compõem uma
população ou amostra. Esses dados podem ser quantitativos ou
qualitativos.Vamos nos aprofundar nesse tema?
Variáveis
Vamos relembrar o conceito de variável? Conforme Tiboni (2010),
as variáveis são características que podem ser observadas ou
medidas em cada elemento da população. Em outras palavras, é
um conjunto de resultados possíveis de um fenômeno.
Temos uma variável quando conseguimos observar pelo menos
uma característica nos elementos de uma população, por
exemplo: sexo (masculino ou feminino), número de filhos (0,1, 2,
3,..., n), entre outras.
Você lembra que as variáveis podem ser classificadas em
quantitativas e qualitativas? Vamos compreender melhor a
seguir.
Clique na figura para assistir ao vídeo
License-213524-28776-0-4
ESTATÍSTICA
As variáveis são observações ou
medidas de cada elemento da
população e podem ser qualitativas ou
quantitativas.
Variáveis quantitativas
As variáveis quantitativas são aquelas que podem ser medidas
em uma escala quantitativa, ou seja, seus valores são expressos
por números. Consegue citar alguns exemplos? Idade, salários,
comprimentos, notas avaliativas, peso, níveis de colesterol, taxa
de glicose etc.
Fonte: Elena Abrazhevich, Shutterstock, 2017.
Essas variáveis podem ser discretas ou contínuas. Conforme
Tiboni (2010), as variáveis discretas assumem os valores de
um conjunto enumerável, ou seja, apenas valores inteiros. Por
exemplo: número de filhos, de carros em um estacionamento, de
televisores em uma residência, entre outros.
License-213524-28776-0-4
ESTATÍSTICA
Já as variáveis contínuas assumem infinitos valores numéricos
entre dois limites. Triola (2008) explica que elas resultam
de infinitos valores possíveis que correspondem a alguma
escala contínua que cobre um intervalo de valores sem vazios,
interrupções ou saltos. Por exemplo: peso, altura, volume, idade,
áreas, perímetros, diâmetros etc.
Fonte: TaLaNoVa, Shutterstock, 2017.
As variáveis quantitativas podem ser
contínuas ou discretas.
Variáveis qualitativas ou categóricas
Se as variáveis quantitativas expressam números, o que as
variáveis qualitativas mostram? Segundo Tiboni (2010), as
variáveis qualitativas, também conhecidas como categóricas,
não possuem dados quantitativos, mas, sim, expressam uma
qualidade ou atributo. São definidas por várias categorias ou,
ainda, representam uma classificação do indivíduo. Assim,
usamos esse tipo de variável para definir sexo, raça, cor da pele,
estado civil, grau de instrução, cidade natal etc.
License-213524-28776-0-4
ESTATÍSTICA
Elas podem ser nominais e ordinais. Temos variáveis nominais
quando não existe ordenação entre as categorias. É o caso do
sexo, cor dos olhos, tipo sanguíneo ou a classificação das pessoas
em doente/sadio e fumante/não fumante, por exemplo.
Por sua vez, as variáveis ordinais pressupõem ordenação natural
entre as categorias. Por exemplo: estágio de uma doença (1º, 2º
e 3º graus), mês de observação (janeiro, fevereiro e assim por
diante), classificação em concursos, altura classificada como
baixa, média e alta e temperatura (fria, morna e quente).
As variáveis qualitativas podem ser
nominais ou ordinais.
Conseguiu entender as diferenças entre os tipos de variável? Que
tal exercitar sua compreensão por meio de alguns exemplos?
Vamos lá!
Primeiro, classifique as variáveis a seguir em qualitativas,
quantitativas discretas ou quantitativas contínuas.
A Diâmetro: quantitativa contínua.
B Salários: quantitativa contínua.
C Religião: qualitativa.
D Quantidade de pacientes em um hospital: quantitativa discreta.
E Cargos de uma empresa: qualitativa.
F Preço: quantitativa contínua.
G Nome de bairros: qualitativa.
H Velocidade: quantitativa discreta.
I Marcas de perfume: qualitativa.
J Consumo de energia elétrica: quantitativa contínua.
K Grau de instrução: qualitativa.
License-213524-28776-0-4
ESTATÍSTICA
Agora, listamos cinco casos. Consegue dizer qual é a variável
de cada um e qual seu tipo? Pense um pouco antes de ler as
respostas!
A
Nível de satisfação dos clientes.
Variável: nível de satisfação. Classificação: variável qualitativa ordinal.
B
Horário de partida dos aviões.
Variável: horário. Classificação: variável quantitativa contínua.
C
Variação mensal do índice Bovespa.
Variável: índice Bovespa. Classificação: variável quantitativa contínua.
D
Cor dos olhos dos funcionários de um banco.
Variável: cor dos olhos. Classificação: variável qualitativa nominal.
E
Pessoas da terceira idade em uma fila de banco durante uma semana.
Variável: pessoas da terceira idade. Classificação: variável quantitativa discreta.
Quantas você acertou? Vamos treinar mais um pouco? Suponha
que o gerente de um supermercado pesquisou a preferência dos
clientes na compra de frutas. Na amostra de 50 clientes, a fruta
preferida foi a goiaba. Com base nesse contexto, especifique
a população, o número de elementos da amostra e o tipo de
variável.
Conseguiu achar a solução? Vamos à resposta. A população é
o conjunto de todos os clientes do supermercado. O número de
elementos da amostra é 50, e a variável é qualitativa nominal.
Até agora, você estudou as variáveis e seus tipos e viu exemplos
práticos. A seguir, você será apresentado a outras definições
importantes para a estatística: dados brutos, rol de dados e os
tipos de frequências.
License-507522-36260-0-0
ESTATÍSTICA
Distribuição de frequências de
variáveis contínuas
Introdução
Você aprendeu em unidades anteriores a coletar dados e
identificar variáveis quantitativas e qualitativas. Mas, como
analisar todos esses dados sem precisar olhar indivíduo por
indivíduo? Para responder a essas perguntas, vamos ver como
sintetizar as informações para visualizar o comportamento das
variáveis.
Imagine que você tenha realizado uma pesquisa eleitoral em
um determinado município, com o intuito de verificar se a faixa
etária dos eleitores interfere na escolha de seu candidato a
prefeito. Você entrevistou pessoas de diferentes idades, podendo
agrupá-las por faixa etária, descobrindo, por exemplo, o número
de eleitores entre 16 a 24 anos ou qual candidato obteve mais
intenções de votos em cada faixa.
Nesta unidade, você aprenderá a lidar com situações como a
exemplificada acima, utilizando distribuições de frequências e
gráficos. Vamos lá?
License-507522-29120-0-4
ESTATÍSTICA
Distribuição de frequências de
variáveis contínuas: conceito e
cálculo de intervalos e classes
Para iniciarmos o estudo das distribuições de frequências, é
importante que você conheça alguns conceitos fundamentais.
Vamos a eles?
Conceitos
Primeiro, observe a tabela a seguir.
Salários Número de empregados
R$ 1.000,00 -| R$ 2.200,00 2
R$ 2.200,00 -| R$ 3.400,00 4
R$ 3.400,00 -| R$ 4.600,00 5
R$ 4.600,00 -| R$ 5.800,00 3
R$ 5.800,00 -| R$ 7.000,00 1
Total 15
Segundo Triola (2008), essa é uma tabela de frequências, ou
tabela de distribuição de frequências, por ser constituída de
classes ou categorias de valores em conjunto com a frequência
(contagem) de cada classe.
Chamamos cada linha da primeira coluna (Salários) de classe,
que mostra seus limites inferiores e superiores. Perceba, por
exemplo, que, na primeira classe, dois empregados recebem
entre R$ 1.000,00 até aproximadamente R$ 2.200,00.
As classes são divididas em intervalos, podendo ser abertos e/ou
fechados. Vamos retomar a primeira classe do nosso exemplo.
O sinal -| quer dizer que a classe compreende os valores entre
R$ 1.000,01 e R$ 2.200,00, excluindo R$ 1.000,00.
License-507522-29120-0-4
ESTATÍSTICA
Podemos usar outros símbolos dependendo do intervalo. Observe
alguns exemplos:
R$ 1.000,00 |- R$ 2.200,00: a classe compreende os valores entre R$ 1.000,00 e R$ 2.199,99,
excluindo R$ 2.200,00;
R$ 1.000,00 |-| R$ 2.200,00: a classe compreende exatamente os valores entre R$ 1.000,00 e R$
2.200,00;
R$ 1.000,00 - R$ 2.200,00: a classe compreende os valores entre R$ 1.000,01 e R$ 2.199,99,
excluindo R$ 1.000,00 e R$ 2.200,00.
Perceba que podemos deixar o
intervalo aberto na primeira classe(menor que R$ 2.200,00) ou fechado
na última (maior que R$ 5.800,00).
Tipos de frequência: absoluta ou simples e relativa
Você se lembra dos tipos de frequência? Vamos relembrá-las. A
frequência absoluta ou simples (fi) é a contagem de observações
de cada classe. Ao somar todas, obtemos a frequência total, que
é quantidade da amostra ou população do estudo.
Para obtermos a frequência relativa (fri), por sua vez, devemos
dividir a frequência simples absoluta pelo total e multiplicar o
resultado por 100.
Vamos retomar a nossa tabela com os salários? Consegue dizer
qual o tipo de frequência que ela mostra? No caso, é frequência
simples absoluta, pois conta em valores absolutos a quantidade
de empregados que recebem salários em uma empresa. Como
podemos, então, descobrir a frequência relativa? Para a primeira
classe, efetuamos a seguinte operação:
%i
f 2
×100= ×100=13,33
Total 15
Isso significa que 13,33% dos empregados ganham entre
aproximadamente R$ 1.000,00 até R$ 2.200,00. Vamos efetuar
os cálculos para as outras classes?
License-507522-29120-0-4
ESTATÍSTICA
Segunda classe:
%
4
×100=26,67
15
Terceira classe:
%
5
×100=33,33
15
Quarta classe:
%
3
×100=20,00
15
Quinta classe:
%
1
×100=6,67
15
Essas frequências são as mais usuais,
pois a absoluta é a primeira que
obtemos, e a relativa é a porcentagem
de interesse de cada classe.
Tipos de frequência: frequência absoluta acumulada
(F
aa
) e frequência relativa acumulada (Fr
ac
)
Agora, vamos relembrar as frequências acumuladas. A frequência
absoluta acumulada (Faa) é a soma das frequências absolutas
de uma determinada classe com as anteriores. Para entender
melhor, veja de novo a tabela com os salários. Qual é a frequência
absoluta acumulada da primeira classe? Perceba que, antes
dela, não há uma classe anterior. Portanto, a resposta é 2, que é
justamente o número de empregados na classe.
Entretanto, na segunda classe, existe uma anterior, não é mesmo?
Por isso, para descobrir a frequência absoluta acumulada,
devemos somar o valor da frequência absoluta da primeira
classe (2) com o da segunda (4), logo:
2 + 4 = 6
License-507522-29120-0-4
ESTATÍSTICA
Isso explica que 6 empregados ganham aproximadamente de
R$ 1.000,00 até R$ 3.400,00, pois agora juntamos o limite inferior
da primeira classe com o da segunda.
A frequência absoluta acumulada da terceira classe considera a
soma da frequência anterior (6) com a frequência absoluta da
terceira classe (5), então:
6 + 5 = 11
Fazendo o mesmo procedimento para a quarta classe, temos:
11 + 3 = 14
Por último, a quinta classe deve resultar no total:
14 + 1 = 15
E a frequência relativa acumulada (Fra)? Para descobri-la,
devemos acumular os valores da frequência relativa e representá-
los por porcentagens. Quer compreender melhor?
Você se lembra que a frequência relativa da primeira classe é
13,33%, correto? A frequência relativa acumulada permanece o
mesmo valor, afinal, não há uma classe anterior. Já na segunda
classe, devemos somar o valor da frequência relativa da primeira
classe (13,33%) com o da segunda (26,67%), resultando em:
13,33% + 26,67% = 40,00%
Na prática, o que esse resultado significa? Que 40% dos
empregados ganham aproximadamente de R$ 1.000,00 até R$
3.400,00.
Agora, você já sabe como proceder nas demais classes, não
é mesmo? A frequência relativa acumulada da terceira classe
soma a frequência relativa anterior (39,70%) com a da própria
terceira classe (33,33%), logo:
40,00% + 13,33% = 73,33%
License-507522-29120-0-4
ESTATÍSTICA
Realizando o procedimento para a quarta classe, temos:
73,33% + 20,00% = 93,33%
Por último, na quinta classe, o resultado deve novamente ser o
total:
93,33% + 6,67% = 100%
Também podemos dividir a frequência acumulada pelo total de
elementos, evitando erros de arredondamento. Veja a quarta
classe, por exemplo: %14×100=93,33
15
.
Agora, podemos representar em uma tabela todas as frequências
obtidas.
Salários fi fri (%) Fac Frac (%)
R$ 1.000,00 -| R$ 2.200,00 2 13,33 2 13,33
R$ 2.200,00 -| R$ 3.400,00 4 26,67 2 + 4 = 6 13,33 + 26,67 = 40
R$ 3.400,00 -| R$ 4.600,00 5 33,33 6 + 5 = 11 40 + 33,33 = 73,33
R$ 4.600,00 -| R$ 5.800,00 3 20,00 11 + 3 = 14 73,33 + 20 = 93,33
R$ 5.800,00 -| R$ 7.000,00 1 6,67 14 + 1 = 15 93,33 + 6,67 = 100
Total 15 100
A distribuição de frequências resume
uma quantidade grande de informação,
representando-a em intervalos de
classe para uma melhor visualização
dos dados.