Buscar

Slide 1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 74 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 74 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 74 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Prof. Dr. Giovani Peres
UNIDADE I
Bioestatística Aplicada 
à Biomedicina
 Estatística e Biomedicina.
Introdução à Estatística
Fonte: Pete Ellis. Disponível em: <https://www.nature.com/articles/492180a>.
Objetivo:
 Fornecer ferramentas descritivas e de análise de dados que permitam uma melhor 
compreensão de eventos e estimação de probabilidades, para que sejam tomadas 
decisões a partir disso.
Introdução à Estatística
Objetivo:
 Fornecer ferramentas descritivas e de análise de dados que permitam uma melhor 
compreensão de eventos e estimação de probabilidades, para que sejam tomadas 
decisões a partir disso.
 A estatística é a ciência que tem por objetivos planejar e 
otimizar experimentos; orientar sua condução; coletar, 
descrever e analisar suas respostas, retirando o maior 
número possível das informações nelas contidas.
Introdução à Estatística
 A estatística traz ordem ao caos.
É uma ciência que se preocupa com:
 Organização;
 Descrição;
 Análises;
 Interpretações.
Introdução à Estatística
Estatística Descritiva
Estatística Indutiva
]
]
 A estatística traz ordem ao caos.
Introdução à Estatística
Tabela 1 – Número de casos prováveis e casos confirmados de dengue 
em 2017, por unidade da Federação, organizados de forma aleatória
Fonte: BRASIL. Ministério da Saúde. Monitoramento dos 
casos de dengue, febre de chikungunya e febre pelo vírus Zika 
até a Semana Epidemiológica 52, 2017. Boletim 
epidemiológico, Brasília, v. 49, n. 2, 2018.
Unidade da Federação Casos prováveis Casos confirmados 
Rio de Janeiro 10.592 83 
São Paulo 13.211 82 
Rio Grande do Sul 227 1 
Santa Catarina 256 0 
Amapá 886 11 
Amazonas 3.984 16 
Ceará 40.604 119 
Paraíba 3.837 19 
Paraná 4.195 10 
Bahia 9.819 17 
Roraima 316 1 
Minas Gerais 28.779 140 
Piauí 5.184 11 
Sergipe 609 2 
Alagoas 2.930 15 
Rondônia 2.460 5 
Rio Grande do Norte 7.311 20 
Mato Grosso do Sul 2.112 36 
Pará 7.813 9 
Espírito Santo 7.019 115 
Maranhão 7.049 53 
Pernambuco 9.043 52 
Distrito Federal 4.210 103 
Mato Grosso 8.977 18 
Tocantins 5.077 102 
Acre 2.124 1 
Goiás 63.430 1.820 
 
 A estatística traz ordem ao caos.
Introdução à Estatística
Tabela 2 – Número de casos prováveis e casos confirmados de dengue 
em 2017, por unidade da Federação, em ordem alfabética
Fonte: BRASIL. Ministério da Saúde. Monitoramento dos 
casos de dengue, febre de chikungunya e febre pelo vírus Zika 
até a Semana Epidemiológica 52, 2017. Boletim 
epidemiológico, Brasília, v. 49, n. 2, 2018.
Unidade da Federação Casos prováveis Casos confirmados 
Acre 2.124 1 
Alagoas 2.930 15 
Amapá 886 11 
Amazonas 3.984 16 
Bahia 9.819 17 
Ceará 40.604 119 
Distrito Federal 4.210 103 
Espírito Santo 7.019 115 
Goiás 63.430 1.820 
Maranhão 7.049 53 
Mato Grosso 8.977 18 
Mato Grosso do Sul 2.112 36 
Minas Gerais 28.779 140 
Pará 7.813 9 
Paraíba 3.837 19 
Paraná 4.195 10 
Pernambuco 9.043 52 
Piauí 5.184 11 
Rio de Janeiro 10.592 83 
Rio Grande do Norte 7.311 20 
Rio Grande do Sul 227 1 
Rondônia 2.460 5 
Roraima 316 1 
Santa Catarina 256 0 
São Paulo 13.211 82 
Sergipe 609 2 
Tocantins 5.077 102 
 
 A estatística traz ordem ao caos.
Introdução à Estatística
Tabela 3 – Número de casos prováveis e casos confirmados de dengue em 
2017, por unidade da Federação, em ordem decrescente de casos confirmados
Fonte: BRASIL. Ministério da Saúde. Monitoramento dos 
casos de dengue, febre de chikungunya e febre pelo vírus Zika 
até a Semana Epidemiológica 52, 2017. Boletim 
epidemiológico, Brasília, v. 49, n. 2, 2018.
Unidade da Federação Casos prováveis Casos confirmados 
Goiás 63.430 1.820 
Minas Gerais 28.779 140 
Ceará 40.604 119 
Espírito Santo 7.019 115 
Distrito Federal 4.210 103 
Tocantins 5.077 102 
Rio de Janeiro 10.592 83 
São Paulo 13.211 82 
Maranhão 7.049 53 
Pernambuco 9.043 52 
Mato Grosso do Sul 2.112 36 
Rio Grande do Norte 7.311 20 
Paraíba 3.837 19 
Mato Grosso 8.977 18 
Bahia 9.819 17 
Amazonas 3.984 16 
Alagoas 2.930 15 
Amapá 886 11 
Piauí 5.184 11 
Paraná 4.195 10 
Pará 7.813 9 
Rondônia 2.460 5 
Sergipe 609 2 
Acre 2.124 1 
Rio Grande do Sul 227 1 
Roraima 316 1 
Santa Catarina 256 0 
 
 Processo de pesquisa
Introdução à Estatística
Dados
Identificação 
das variáveis
Mensuração 
das variáveis
Gráficos
Modelos
Observação inicial
(pergunta de pesquisa)
Geração de uma teoria
Geração de hipóteses
Coleta de dados para 
testar a teoria
Análise dos dados
Fonte: FIELD, A. Discovering statistics using IBM SPSS statistics. 
4. ed. Thousand Oaks: Sage, 2013. Adaptada.
 Processo de pesquisa
Introdução à Estatística
Dados
Identificação 
das variáveis
Mensuração 
das variáveis
Gráficos
Modelos
Observação inicial
(pergunta de pesquisa)
Geração de uma teoria
Geração de hipóteses
Coleta de dados para 
testar a teoria
Análise dos dados
Fonte: FIELD, A. Discovering statistics using IBM SPSS statistics. 
4. ed. Thousand Oaks: Sage, 2013. Adaptada.
Fonte: <http://www.supercoloring.com>
 Processo de pesquisa
Pergunta de pesquisa:
 Objetividade versus subjetividade.
Introdução à Estatística
Dados
Identificação 
das variáveis
Mensuração 
das variáveis
Gráficos
Modelos
Observação inicial
(pergunta de pesquisa)
Geração de uma teoria
Geração de hipóteses
Coleta de dados para 
testar a teoria
Análise dos dados
Fonte: FIELD, A. Discovering statistics using IBM SPSS statistics. 
4. ed. Thousand Oaks: Sage, 2013. Adaptada.
 Processo de pesquisa
Pergunta de pesquisa:
 Objetividade versus subjetividade.
 São os Beatles a melhor banda de todos os tempos?
 São os Beatles a banda que mais vendeu discos/emplacou sucessos?
Introdução à Estatística
Fonte: <http://www.supercoloring.com>
 Variáveis
Qualitativas (ou categóricas)
 Nominais.
 Ordinais.
Quantitativas (ou numéricas)
 Discretas.
 Contínuas.
Introdução à Estatística
Fonte: <https://pixabay.com/illustrations/birth-cow-cattle-
animals-calf-1472656/>
Relacione as variáveis de uma pesquisa estatística, apresentadas à esquerda, com 
as características de uma população, apresentadas à direita:
1. Qualitativa nominal ( ) Temperatura corporal (ºC)
2. Qualitativa ordinal ( ) Número de portadores de esquizofrenia
3. Quantitativa discreta ( ) Sexo
4. Quantitativa contínua ( ) Intensidade da perda de peso em atletas
(leve, moderada ou forte)
a) 3, 4, 2, 1.
b) 2, 3, 1, 4.
c) 4, 3, 1, 2.
d) 2, 1, 4, 3.
e) 4, 1, 3, 2.
Interatividade
Relacione as variáveis de uma pesquisa estatística, apresentadas à esquerda, com 
as características de uma população, apresentadas à direita:
1. Qualitativa nominal ( ) Temperatura corporal (ºC)
2. Qualitativa ordinal ( ) Número de portadores de esquizofrenia
3. Quantitativa discreta ( ) Sexo
4. Quantitativa contínua ( ) Intensidade da perda de peso em atletas
(leve, moderada ou forte)
a) 3, 4, 2, 1.
b) 2, 3, 1, 4.
c) 4, 3, 1, 2.
d) 2, 1, 4, 3.
e) 4, 1, 3, 2.
Resposta
 Erro
 Em medição, é a discrepância entre o valor real do que se mede e os números 
utilizados para representar essa medição. 
Exemplo hemocitômetro:
 Suspensão contendo exatamente 
8,0x104 células/mL.
 Contagens independentes: 7,5x104,
7,0x104, 9,0x104 e 8,5x104.
Conceitos importantes
Fonte: 
<https://bitesizebio.com/13687/c
ell-counting-with-a-
hemocytometer-easy-as-1-2-3/>
Erro
 Uma forma de assegurar que o erro de medição seja mínimo é determinar 
propriedades daquela medição que nos dê confiança no registro.
 Validade e confiabilidade.
 Repetição.
Conceitos importantes
Fonte: 
<http://www.unityinstrumentos.com.br/
voce-conhece-a-diferenca-entre-
precisao-e-exatidao/>
População
 conjunto de todos os elementos ou 
resultados sob investigação.
Amostra
 qualquer subconjunto da população.
Conceitos importantes
Fonte: CORTY, E. W. Using and Interpreting Statistics. 
3. ed. New York: Worth Publishers, 2016. Adaptada.
 Quandofor possível estudar todos os
membros da população, estamos
diante de um censo.
Dificuldades:
 alto custo;
 tempo;
 levantamento de dados.
Conceitos importantes
Fonte: CORTY, E. W. Using and Interpreting Statistics. 
3. ed. New York: Worth Publishers, 2016. Adaptada.
Amostragem
 aleatória (probabilística);
 determinística (não probabilística).
Técnicas de amostragem
A escolha da técnica de amostragem:
 o objetivo da pesquisa;
 o erro aceitável nos resultados;
 a acessibilidade aos elementos da população;
 a representatividade desejada;
 o tempo despendido; 
 a disponibilidade de recursos.
Técnicas de amostragem
Fonte: FÁVERO, L. P.; BELFIORE, P. 
Manual de análise de dados. 1. ed. 
Rio de Janeiro: Elsevier, 2017. 
Adaptada.
Técnicas de 
amostragem
Aleatória Determinística
Simples
Sistemática
Estratificada
Por 
conglomerados
Por 
conveniência
Por julgamento
Por quotas
Bola de neve
Vantagens:
 critérios de seleção rigorosamente definidos;
 evita subjetividade;
 possibilidade de determinar o tamanho da amostra matematicamente.
Desvantagens:
 dificuldade em obter listagens atuais e completas da população;
 aleatoriedade pode gerar uma amostra muito dispersa.
 As amostras aleatórias apresentam condições ideais para 
o tratamento estatístico, o que nem sempre é viável com 
amostras determinísticas.
Amostragem aleatória
Vantagens:
 menor custo;
 menor tempo de estudo;
 menor necessidade de pessoal.
Desvantagens:
 existem unidades que não têm possibilidade de serem escolhidas;
 pode haver um viés de opinião pessoal;
 não se sabe grau de confiança que as conclusões 
podem ser inferidas.
 Portanto, há de se ter cuidado ao optar pela utilização 
desse tipo de amostragem, uma vez que ela é subjetiva.
Amostragem não aleatória
Amostragem aleatória
Probabilística (ou aleatória)
Simples EstratificadaSistemática Conglomerado
 Sorteio aleatório de elementos provenientes da população, até que o tamanho 
desejado da amostra seja atendido. 
 Quando um elemento sorteado for removido antes do próximo sorteio, estamos 
diante de uma amostra aleatória simples sem reposição. 
 Caso seja permitido o sorteio de um mesmo elemento mais de uma vez, estamos 
diante de uma amostra aleatória simples com reposição.
Amostragem aleatória simples
Exemplo:
 Quantas amostras de 6 números diferentes podem ser extraídas de um total de 60 
números?
Amostragem aleatória simples
Fonte: <https://pt.wikipedia.org/wiki/Mega-Sena>
Amostragem aleatória
Probabilística (ou aleatória)
Simples EstratificadaSistemática Conglomerado
 Quando os elementos da população estiverem ordenados e forem retirados 
periodicamente, teremos uma amostragem sistemática.
 Primeiramente, deve-se selecionar o intervalo da amostra (k) obtido pelo quociente 
entre o tamanho da população e o tamanho da amostra.
 Escolher um elemento a cada k-ésimo elemento da lista de forma sucessiva, até 
atingir o tamanho da amostra (n).
Amostragem aleatória sistemática
Exemplo:
 Em uma fábrica de reagentes químicos, 500 frascos de 1 kg de NaCl, grau de 
pureza analítico, foram produzidos na última hora. Um funcionário responsável 
pelo controle de qualidade necessita retirar uma amostra com 20 elementos dessa 
população para avaliar se a massa dos frascos está dentro dos valores aceitáveis 
de erro. Selecione 20 frascos com base no procedimento de amostragem 
sistemática.
Amostragem aleatória sistemática
Amostragem aleatória
Probabilística (ou aleatória)
Simples EstratificadaSistemática Conglomerado
 A população é dividida (ou estratificada) em certo número de subpopulações que 
não se superpõem, chamadas estratos ou camadas e, em cada estrato, uma 
amostra é definida.
 Essa técnica é bastante aplicada para populações com grupos bastante 
homogêneos internamente, mas cujas características variam muito entre si. 
Amostragem aleatória estratificada
Exemplo:
 Deseja-se realizar uma pesquisa sobre “dieta e saúde” com mulheres da cidade de 
São Paulo. Para isso, a população é dividida em categorias de idade (5-14, 15-24, 
25-34, 35-44, 45-54, 55-64, 65-74) e, para cada intervalo, 5% da população será 
entrevistada, ou seja, haverá um respeito à proporção de cada faixa etária na 
população total. Tem-se portanto, um exemplo de amostragem estratificada.
Amostragem aleatória estratificada
Amostragem aleatória
Probabilística (ou aleatória)
Simples EstratificadaSistemática Conglomerado
 Se a população for subdividida em grupos e a amostragem for realizada a partir 
dos grupos e não dos indivíduos da população, estamos diante de uma 
amostragem por conglomerados (grupos).
 Dentro de cada conglomerado, podem-se selecionar todos os elementos ou 
apenas parte deles. 
Amostragem aleatória por conglomerado
Exemplo:
 Deseja-se estudar a renda da população da cidade de São Paulo e, para isso, a 
população foi dividida em bairros. Alguns bairros (10% deles) foram selecionados 
aleatoriamente e, para cada bairro, selecionou-se, de forma aleatória, 10% do total 
de moradores. Tem-se, portanto, um exemplo de amostragem por conglomerados 
em dois estágios.
Amostragem aleatória por conglomerado
Quantas amostras de 3 pacientes diferentes podem ser extraídas de um total de 10?
a) 720.
b) 240.
c) 120.
d) 10.
e) 3.
Interatividade
Quantas amostras de 3 pacientes diferentes podem ser extraídas de um total de 10?
a) 720.
b) 240.
c) 120.
d) 10.
e) 3.
Resposta
 A organização e a apresentação de dados não são independentes da classificação 
das variáveis em quantitativas ou qualitativas. 
 Uma distribuição de frequência é uma forma intuitiva de organizar e sumariar os 
resultados, para se ter uma ideia global sobre eles.
Tabelas de distribuição de frequência: 
 de forma não agrupada;
 contagem de quão frequente é cada valor de uma variável em um conjunto 
de dados;
 agrupada. 
 Contagem se refere a valores de grupos ou intervalos
da variável.
Organização e apresentação de dados
 Tabelas de distribuição de frequência para dados não agrupados, geralmente, são 
utilizadas quando os valores que uma variável pode assumir são limitados.
Imaginemos que 31 indivíduos responderam à pergunta “quantas crianças existem 
em sua família?”, sendo que:
 9 entrevistados disseram haver apenas 1 criança;
 14 disseram haver 2;
 5 disseram haver 3;
 2 responderam 4;
 e apenas 1 respondeu 6.
Organização e apresentação de dados
 Note:
 Frequência observada.
 Existe um título. 
 As colunas possuem nomes.
 Uma linha do total.
 Não houve nenhuma
observação para cinco crianças.
Organização e apresentação de dados
Número de crianças na família Frequência (ni) 
1 9 
2 14 
3 5 
4 2 
5 0 
6 1 
Total 31 
 
Tabela 4 – Distribuição de frequência dos 31 
entrevistados por número de crianças na família
Fonte: livro-texto
A tabela a seguir traz algumas informações a mais: 
Organização e apresentação de dados
Tabela 5 – Distribuição de frequência e porcentagens dos 31 entrevistados 
por número de crianças na família
Número de 
crianças 
na família 
Frequência 
(n) 
Frequência 
acumulada 
Porcentagem 
(%) 
Porcentagem 
acumulada (%) 
1 9 9 29,03 29,03 
2 14 23 45,16 74,19 
3 5 28 16,13 90,32 
4 2 30 6,45 96,77 
5 0 30 0,00 96,77 
6 1 31 3,23 100,00 
Total 31 - 100 - 
 
Fonte: livro-texto
Para transformar um valor em porcentagem, basta dividir a frequência pelo total de 
elementos do conjunto e, em seguida, multiplicar por 100. Por exemplo, na 
terceira linha:
Organização e apresentação de dados
Número de 
crianças 
na família 
Frequência 
(n) 
Frequência 
acumulada 
Porcentagem 
(%) 
Porcentagem 
acumulada (%) 
1 9 9 29,03 29,03 
2 14 23 45,16 74,19 
3 5 28 16,13 90,32 
4 2 30 6,45 96,77 
5 0 30 0,00 96,77 
6 1 31 3,23 100,00 
Total 31 - 100 - 
 
Fonte: livro-texto
 Quando lidamos com uma variável que possui uma grande amplitudecom muitas 
possibilidades de respostas, uma distribuição de frequência para dados agrupados 
faz mais sentido.
Organização e apresentação de dados
 Casos com alterações no crescimento e
no desenvolvimento possivelmente 
relacionadas à infecção pelo vírus Zika.
Organização e apresentação de dados
Unidade da 
Federação 
Casos suspeitos 
notificados 
Casos 
confirmados 
Bahia 2.657 549 
Pernambuco 2.779 465 
Rio de Janeiro 1.177 290 
Paraíba 1.174 203 
Maranhão 501 187 
São Paulo 1.637 169 
Ceará 835 162 
Rio Grande do Norte 633 151 
Sergipe 317 138 
Goiás 506 126 
Minas Gerais 976 123 
Piauí 301 119 
Alagoas 708 105 
Mato Grosso 447 79 
Amazonas 140 73 
Espírito Santo 435 71 
Rio Grande do Sul 404 44 
Distrito Federal 248 33 
Rondônia 132 33 
Mato Grosso do Sul 74 31 
Tocantins 397 30 
Pará 157 22 
Santa Catarina 48 21 
Roraima 49 18 
Amapá 37 17 
Paraná 70 10 
Acre 61 10 
 
Fonte: BRASIL. Ministério da Saúde. Monitoramento 
integrado de alterações no crescimento e 
desenvolvimento relacionadas à infecção pelo vírus 
Zika e outras etiologias infecciosas, até a Semana 
Epidemiológica 45 de 2018. Boletim epidemiológico, 
Brasília, v. 49, n. 54, 2018. 
 Não existe um número fixo de intervalos sempre possíveis, mas uma regra prática 
habitualmente utilizada é de 7±2, ou seja, de cinco a nove intervalos. 
 Note que essa é uma regra prática – se for melhor usar menos de cinco ou mais 
de nove intervalos para a comunicação da mensagem desejada, que assim seja.
 Usemos seis intervalos (0 a 99, 100 a 199, 200 a 299, 300 a 399, 400 a 499 e 500 
a 599) nesse exemplo.
Organização e apresentação de dados
Organização e apresentação de dados
Número de 
casos 
confirmados 
Frequência 
(n) 
Frequência 
acumulada 
Porcentagem 
(%) 
Porcentagem 
acumulada 
(%) 
0-99 14 14 51,85 51,85 
100-199 9 23 33,33 85,19 
200-299 2 25 7,41 92,59 
300-399 0 25 0,00 92,59 
400-499 1 26 3,70 96,30 
500-599 1 27 3,70 100,00 
Total 27 - 100 - 
 
Tabela 7 – Distribuição de frequência para dados agrupados e porcentagens 
referentes ao número de casos confirmados de alterações no crescimento e no 
desenvolvimento possivelmente relacionadas à infecção pelo vírus Zika e outras 
etiologias infecciosas, entre as semanas epidemiológicas 45/2015 e 45/2018
Fonte: BRASIL. Ministério da Saúde. 
Boletim epidemiológico, Brasília, v. 
49, n. 54, 2018. Adaptado.
 Gráficos podem ser utilizados para apresentar informações referentes a conjuntos 
de dados e suas distribuições de frequência. 
Vamos destacar, inicialmente, três gráficos diferentes que apresentam frequências:
 gráfico de barras (ou de colunas);
 histograma;
 polígono de frequência. 
Organização e apresentação de dados
 Gráfico de barras
Organização e apresentação de dados
Sexo Frequência (n) Porcentagem (%) 
Masculino 12 26,67 
Feminino 33 73,33 
Total 45 100 
 
0
5
10
15
20
25
30
35
Masculino Feminino
F
re
q
u
ê
n
c
ia
Sexo
Tabela 8 – Distribuição de frequência da variável 
sexo em uma amostra hipotética de 45 estudantes
Figura 1 – Gráfico de barras mostrando a frequência 
da variável sexo em uma amostra hipotética de 45 
estudantes. As barras não se encostam uma na outra, 
pois a variável categórica nominal representada no 
eixo x assume valores discretos
Fonte: livro-texto
Histograma e polígono de frequências:
Organização e apresentação de dados
0
5
10
15
20
25
30
35
40
22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91
F
re
q
u
ê
n
c
ia
Umidade (%)
0
5
10
15
20
25
30
35
40
22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91
F
re
q
u
ê
n
c
ia
Umidade (%)
Histograma e polígono de frequências para a média diária do percentual de 
umidade na cidade de Goiânia, entre 26/01/2018 e 25/01/2019. Intervalos 
correspondem a variações de 3 pontos percentuais.
Fonte: livro-texto
 Conhecendo o formato da distribuição dos dados com os quais se trabalha, é 
possível avaliar se certos cálculos podem ou não ser empregados.
 Curva normal. 
 Modelo fundamental
em probabilidades e inferências
estatísticas.
Formatos das distribuições de frequência
F
re
q
u
ê
n
c
ia
Variável numérica
Fonte: livro-texto
Aspectos utilizados para descrever o formato de uma distribuição:
 Modalidade.
 Assimetria.
 Curtose.
Formatos das distribuições de frequência
Aspectos utilizados para descrever o formato de uma distribuição:
 Modalidade.
 Assimetria.
 Curtose.
Formatos das distribuições de frequência
F
re
q
u
ê
n
c
ia
Variável numérica
F
re
q
u
ê
n
c
ia
Variável numérica
Fonte: livro-texto
Aspectos utilizados para descrever o formato de uma distribuição:
 Modalidade.
 Assimetria.
 Curtose.
Formatos das distribuições de frequência
Fonte: adaptado de: BUSSAB, W. O.; 
MORETTIN, P. A. Estatística básica. 
8. ed. São Paulo: Saraiva, 2013.
Assimétrica à direita
Assimétrica à esquerda
Aspectos utilizados para descrever o formato de uma distribuição:
 Modalidade.
 Assimetria.
 Curtose.
Formatos das distribuições de frequência
Fonte: FÁVERO, L. P.; BELFIORE, P. Análise 
de dados. Rio de Janeiro: Elsevier, 2009
Figura 3.5: Curva mesocúrtica
Figura 3.6: Curva platicúrtica
Figura 3.6: Curva leptocúrtica
Imaginemos que um grupo de estudantes solicitou uma porção de batatas fritas e, 
com auxílio de uma régua, mediu o comprimento de cada batata (n = 99), 
aproximando o valor para o milímetro mais próximo. Visando a inspecionar o formato 
da distribuição de frequências dessa variável, o que poderia ser feito?
a) Construir um gráfico de barras.
b) Construir um histograma.
c) Organizar os dados em uma tabela de distribuição de frequência para dados 
não agrupados.
d) Organizar os dados em uma tabela de distribuição de 
frequência para dados agrupados.
e) Ordenar os dados em ordem crescente.
Interatividade
Imaginemos que um grupo de estudantes solicitou uma porção de batatas fritas e, 
com auxílio de uma régua, mediu o comprimento de cada batata (n = 99), 
aproximando o valor para o milímetro mais próximo. Visando a inspecionar o formato 
da distribuição de frequências dessa variável, o que poderia ser feito?
a) Construir um gráfico de barras.
b) Construir um histograma.
c) Organizar os dados em uma tabela de distribuição de frequência para dados 
não agrupados.
d) Organizar os dados em uma tabela de distribuição de 
frequência para dados agrupados.
e) Ordenar os dados em ordem crescente.
Resposta
 Vimos que o resumo de dados por meio de tabelas de frequências e gráficos 
fornece muito mais informações sobre o comportamento de uma variável do que a 
própria tabela original de dados. 
 Veremos aqui que é possível resumir ainda mais esses dados, apresentando um 
ou alguns valores que sejam representativos de toda a série.
 Os estatísticos chamam esses valores de medidas de posição (ou localização) 
central e, usualmente, emprega-se a média aritmética, a mediana ou a moda.
Medidas resumo
 A média aritmética é um conceito familiar a todos e corresponde ao somatório 
das observações dividido pelo número delas. 
Sendo
 M = a média amostral
 σ𝑋= o somatório dos valores da variável X 
 n = o número de observações da amostra
Medidas resumo
Exemplo:
 Supondo que um estudante deseje avaliar a média de altura de cinco colegas. A 
altura em centímetros dos cinco indivíduos aleatoriamente selecionados em sua 
classe foi de: 157, 165, 167, 175 e 185. Aplicando-se a equação anterior, tem-se: 
Medidas resumo
 A mediana é o valor que ocupa a posição central de um conjunto ordenado de 
dados. Em outras palavras, ela é o número que separa os valores de um conjunto 
em duas metades.
Medidas resumo
Posição Altura (cm) 
1 157 
2 165 
3 167 
4 175 
5 185 
 Fonte: livro-texto
 A terceira medida de posição central chama-se moda e corresponde ao valor que 
ocorre com a maior frequência em um conjunto de dados. Para o conjunto hipotético utilizado até então (variável altura), não há moda, pois 
todos os valores ocorrem com a mesma frequência (apenas uma vez cada).
Medidas resumo
 O resumo de um conjunto de dados por uma única medida representativa da 
posição central esconde toda a informação sobre a variabilidade desse conjunto.
 Variabilidade: grau de
espalhamento dos dados em
um conjunto.
 Medidas de variabilidade
(ou de dispersão).
Medidas resumo
0 50 100 150 200
F
re
q
u
ê
n
c
ia
Variável numérica hipotética
Fonte: livro-texto
 Medidas de variabilidade (ou de dispersão).
 A medida de variabilidade mais simples é a amplitude, a variação entre o maior e 
o menor valor de um conjunto.
 157, 165, 167, 175 e 185.
Medidas resumo
 Medidas de variabilidade (ou de dispersão).
 Existe um problema com o uso da amplitude: ela depende apenas do maior e do 
menor valor para ser calculada, de tal forma, ignorando a maior parte dos dados e 
sofrendo efeito de valores extremos (outliers).
 Uma solução consiste em retirar do total do conjunto os 
25% que estiverem na porção inferior e os 25% que 
estiverem na porção superior do conjunto ordenado. 
Dessa forma, a amplitude será calculada entre os 50% 
centrais do conjunto. Essa medida é conhecida como 
amplitude interquartílica.
Medidas resumo
 Medidas de variabilidade (ou de dispersão).
 A amplitude interquartílica é assim chamada pois os dados são divididos em 
quatro partes iguais (quartis). Cada quartil contém 25% das observações 
de um conjunto.
Medidas resumo
Fonte: livro-texto
 Medidas de variabilidade (ou de dispersão).
Considere os seguintes valores de idade (anos) de 20 indivíduos em uma amostra: 
 16, 17, 18, 21, 22 23, 24, 25, 26, 29 32, 34, 34, 35, 36 42, 43, 46, 46, 49.
Medidas resumo
ll l
Média
Erros 
negativos
Erros 
positivos
 Medidas de variabilidade (ou de dispersão).
 Erro ou desvio: a média também é útil, pois é possível avaliar o quanto um valor 
individual se distancia dela. 
 Erros positivos indicam que os valores
observados estão acima da média, já erros
negativos indicam que estão abaixo.
Medidas resumo
Fonte: livro-texto
 Medidas de variabilidade (ou de dispersão).
Medidas resumo
Altura Desvio (X - M) 
157 -12,8 
165 -4,8 
167 -2,8 
175 5,2 
185 15,2 
 σ = 0,0 
 
- 20,4
20,4
Fonte: livro-texto
 Medidas de variabilidade (ou de dispersão).
Medidas resumo
Altura Desvio (X - M) Desvios quadrados (X - M)2 
157 -12,8 163,84 
165 -4,8 23,04 
167 -2,8 7,84 
175 5,2 27,04 
185 15,2 231,04 
 σ = 0,0 σ = 452,80 
 Fonte: livro-texto
Altura Desvio (X - M) Desvios quadrados (X - M)2 
157 -12,8 163,84 
165 -4,8 23,04 
167 -2,8 7,84 
175 5,2 27,04 
185 15,2 231,04 
 σ = 0,0 σ = 452,80 
 
 Medidas de variabilidade (ou de dispersão).
Variância amostral:
 A interpretação da 
variância pode ser confusa,
uma vez que ela é dada 
em unidades quadráticas.
Medidas resumo
Fonte: livro-texto
 Medidas de variabilidade (ou de dispersão).
 Uma simples solução é tirar a raiz quadrada da variância, transformando a medida 
de volta para sua unidade original. Essa medida é conhecida como desvio 
padrão, uma das medidas de variabilidade mais comumente empregadas.
 Para a amostra de cinco estudantes, descreveríamos que 
o conjunto possui uma média de 169,80 cm, com desvio 
padrão de 10,64 cm. 
Medidas resumo
Cinco alunos em uma aula prática cronometraram o tempo necessário para cumprir 
todas as etapas de preparo de uma amostra para dosagem espectrofotométrica. Os 
tempos gastos, em minutos, foram 15, 12, 10, 17 e 16. A média aritmética e a 
mediana são, respectivamente:
a) 10 e 70.
b) 70 e 10.
c) 15 e 14.
Interatividade
d) 14 e 15.
e) 70 e 15.
Cinco alunos em uma aula prática cronometraram o tempo necessário para cumprir 
todas as etapas de preparo de uma amostra para dosagem espectrofotométrica. Os 
tempos gastos, em minutos, foram 15, 12, 10, 17 e 16. A média aritmética e a 
mediana são, respectivamente:
a) 10 e 70.
b) 70 e 10.
c) 15 e 14.
Resposta
d) 14 e 15.
e) 70 e 15.
ATÉ A PRÓXIMA!

Outros materiais