Buscar

Lista01

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 22 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
1 
A estatística é a ciência de coletar, organizar e interpretar fatos numéricos chamados de 
dados. O objetivo da estatística é obter compreensão a partir dos dados (MOORE, et al, 
2006). 
 
“Estatística é a ciência que fornece os princípios e os métodos para coleta, 
organização, resumo, análise e interpretação de dados” (Vieira, 2008). 
 
“A Estatística ocupa-se tanto dos métodos e procedimentos, para coletar, 
classificar, resumir, achar regularidades e analisar os dados, sempre e quando a 
variação e a incerteza forem causa intrínseca destes, como de realizar inferências 
a partir deles, com a finalidade de auxiliar na tomada de decisões e, neste caso, 
formular predições. (Díaz & López, 2007) 
 
Estatística Descritiva: descreve, analisa e representa um grupo de dados, 
utilizando métodos numéricos e gráficos que resumem e apresentam a informação 
contida neles. (Neste caso os resultados de análise não pretendem ultrapassar o 
conjunto de dados) 
 
Estatística Inferencial: apoiando-se no cálculo de probabilidades e nos dados de 
amostras, efetua estimativas, decisões, preferências ou outras generalidades 
sobre um conjunto maior de dados. (Neste caso o objetivo do estudo é estender 
as conclusões obtidas a um conjunto de dados mais amplo). 
 
O conjunto de dados contém informações a respeito de certo grupo de indivíduos. 
Chamam-se indivíduos os objetos descritos por um conjunto de dados. Podem ser 
pessoas, animais, plantas, mas também podem ser empresas, ações da bolsa de valores 
ou outros objetos. 
 
População e amostra 
 
População ou universo é o conjunto de todos os elementos (pessoas, animais, plantas ou 
objetos) cujas propriedades o pesquisador está interessado em estudar. Os elementos de 
uma população têm pelo menos uma característica comum. 
 
Quando é feito um levantamento completo sobre uma determinada população, ou seja, 
contemplando cada um dos seus elementos, temos o que se chama de um censo. 
 
Se uma população é infinita, ou finita mais muito grande, torna-se impossível ou 
impraticável a realização do censo. Em tais casos, em vez disso, examina-se somente 
uma pequena parte da população que chamamos de amostra. 
 
Uma amostra é dita representativa da população se a partir de sua análise podem ser 
obtidas conclusões válidas sobre a população. Para tanto é necessário que a amostra 
seja extraída de acordo com regras bem definidas. 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
2 
Chamam-se variável qualquer característica de um indivíduo, podendo assumir diferentes 
valores, de acordo com o indivíduo que estiver se referindo. 
 
As variáveis podem ser classificadas em categóricas (atributos) ou quantitativas (os dados 
podem ser contados ou mensurados por um instrumento de medida). 
 
Classificação das variáveis: 
 
Variável qualitativa nominal ou categórica – seus valores possíveis são diferentes 
categorias não ordenadas, em que cada observação pode ser classificada. Exemplos: 
cultivar, área de atividade, cor da pelagem. 
 
Variável qualitativa ordinal – seus valores possíveis são diferentes categorias 
ordenadas, em que cada observação pode ser classificada. Exemplos: classe social, 
conceitos finais, nível de instrução, grau de infestação (baixo, moderado, alto). 
 
Variável quantitativa discreta – seus valores possíveis são em geral resultantes de um 
processo de contagem. Exemplos: nº de haltes, nº de insetos por m2, nº de carrapatos por 
animal, nº de ovos por ninho. 
 
Variável quantitativa contínua – seus valores possíveis podem ser expressos através de 
nºs reais e varrem uma escala continuada de medição. Exemplos: renda mensal, peso, 
altura, espaçamento (distância). 
 
Resumo 
 
Tipologia das variáveis 
Qualitativas ou categóricas Quantitativas 
Nominal 
 
Ordinal 
 
Discreta 
 
Contínua 
 
Dados distribuídos 
em categorias 
mutuamente 
exclusivas. 
Dados distribuídos 
em categorias 
mutuamente 
exclusivas, mas 
tem ordenação 
natural. 
Contagem. 
 Pode assumir 
alguns valores 
dentro de um 
intervalo. 
Mensuração. 
Pode assumir 
qualquer valor 
dentro de um 
intervalo. 
Raça Gravidade de uma 
doença (leve, 
moderada, severa) 
Nº de filhotes Peso 
Sexo Grau de 
recuperação: 
nada, pouco, 
moderado, bom, 
muito bom. 
Nº de dentes Altura 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
3 
Nível de mensuração das variáveis 
 
Escala nominal 
 
 O nível de mensuração envolve simplesmente o ato de nomear, rotular ou classificar um 
objeto, pessoa ou alguma característica, por meio de números ou outros símbolos. Nesse 
nível a variável pode assumir duas ou mais categorias. As categorias não têm ordem ou 
hierarquia. 
Exemplos: gênero, raça, cor dos olhos, cultivar, métodos de pagamento (à vista, com 
cheque, com cartão de crédito). 
 
Escala ordinal 
 
Essas escalas admitem uma ordenação numérica de suas categorias, estabelecendo uma 
relação de ordem entre elas. Contudo não é possível medir a magnitude das diferenças 
entre as categorias. Assim uma dada variável com nível de mensuração nominal em que 
a relação > (maior do que) vale para todos os pares da classe, terá então uma escala 
ordinal. A relação > poderá incluir mais alto do que, mais pesado do que, mais difícil do 
que, mais importante do que, preferível a etc. 
Exemplos: classe social, grau de escolaridade, faixa de idade, faixa de renda, estado de 
saúde de um animal (muito ruim, fraco, nem ruim nem bom, bom, muito bom), tamanho 
(pequeno, médio, grande). 
 
Escala de intervalos 
 
Essas escalas têm a característica de uma escala ordinal em que um valor numérico mais 
elevado na escala indica uma quantidade maior da variável medida. As diferenças entre 
valores numéricos adjacentes na escala indicam diferenças iguais na quantidade medida. 
O valor zero da escala é arbitrário e não indica ausência total da variável pela escala. 
Exemplo clássico - as escalas que medem, por exemplo, temperatura. 
 
Escala de razão 
 
A escala de razão é a mesma que a intervalar exceto que existe um ponto zero, ou seja, 
um valor que possa indicar a ausência de distância entre os valores, como caso de 
medidas físicas. Nesta escala a razão de dois pontos quaisquer independe da unidade de 
mensuração. 
Exemplo: vendas anuais da produção, número de leitões nascidos por parto, teor de ferro 
no sangue de cavalos, altura dos pés de milho, diâmetro altura do peito dos eucaliptos, nº 
de sementes por cova, peso, expresso em gramas, de matéria seca, contagem de plantas 
ou animais (infectados ou não infectados), teores de N (%) na cana de açúcar. 
 
 
 
BANCO DE DADOS – planilhas eletrônicas 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
4 
Cada linha representa um individuo ou caso e cada coluna uma variável. 
O banco de dados a seguir representa um conjunto de dados brutos de uma pesquisa 
antropométrica realizada com mulheres cujas idades estão acima de 60 anos. 
 
Neste exemplo cada observação (ou indivíduo) é uma mulher acima de 60 anos e as 
variáveis (ou características) são: 
 
- Categoria, sendo A = ativa e S = sedentária 
- Idade, em anos 
- Peso, medido em Kg 
- Altura, medida em cm 
- Índice de Massa Corporal (IMC), que é a seguinte razão: peso/(altura em metros)2 
- Classe segundo o IMC: normal ou sobrepeso 
- Circunferência da cintura, medidaem cm 
- Circunferência do quadril, medida em cm 
- Relação cintura/quadril (RCQ), adimencional 
- Classe segundo a RCQ, sendo PR = pequeno risco, MR = médio risco e GR = grande 
risco. 
 
Exemplo: Banco de dado 1 
 
A primeira coluna mostra apenas um código de identificação de cada idosa. 
 
 
Exemplo Banco de Dados 2. Arquivo ddt.xls, disponível no ambiente virtual de 
aprendizagem Moodle. 
 
Indústrias ou fábricas de produtos químicos algumas vezes se desfazem de lixo tóxico, 
como o DDT, em rios e cursos de d’água próximos. Estas toxinas podem afetar 
negativamente plantas e animais que habitam o rio e suas margens. O U.S. Army Corps 
of Enginners conduziu um estudo dos peixes do rio Tennessee (no Alabama) e em seus 
três afluentes: Flint Creek, Limestone e Spring Creek. Um total de 144 peixes foram 
capturados e submetidos à medição das seguintes variáveis: 
 1) rio/riacho onde cada peixe foi capturado, 
 2) espécie (bagre-de-canal, black bass ou smallmouth buffalo), 
3) comprimento (cm), 
4) peso (gramas), 
5) concentração de DDT (partes por milhão). 
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
5 
 
Ident. Categ. Idade Peso Altura IMC ClasseIMC Cintura Quadril RCQ ClasseRCQ 
ID1 A 61 58.2 154.0 24.5 NORMAL 87 109 0.80 MR 
ID2 S 69 63.0 152.0 27.3 SOBREPESO 89 104 0.86 GR 
ID3 S 61 70.1 158.0 28.1 SOBREPESO 106 123 0.86 GR 
ID4 S 71 73.2 156.0 30.1 SOBREPESO 110 122 0.90 GR 
ID5 A 63 58.6 152.0 25.4 SOBREPESO 99 121 0.82 MR 
ID6 S 71 77.0 160.0 30.1 SOBREPESO 125 132 0.95 GR 
ID7 S 72 76.2 165.0 28.0 SOBREPESO 115 125 0.92 GR 
ID8 S 68 59.8 160.0 23.4 NORMAL 85 103 0.83 MR 
ID9 A 66 64.3 155.0 26.8 SOBREPESO 100 120 0.83 MR 
ID10 S 69 52.1 151.0 22.8 NORMAL 74 83 0.89 GR 
ID11 S 72 62.0 156.0 25.5 SOBREPESO 90 111 0.81 MR 
ID12 S 67 52.1 151.0 22.8 NORMAL 76 90 0.84 MR 
ID13 S 63 58.0 157.0 23.5 NORMAL 80 102 0.78 MR 
ID14 S 66 55.0 154.0 23.2 NORMAL 78 96 0.81 MR 
ID15 S 53 50.1 157.0 20.3 NORMAL 72 81 0.89 GR 
ID16 A 63 57.9 160.0 22.6 NORMAL 78 90 0.87 GR 
ID17 A 60 58.2 156.0 23.9 NORMAL 80 108 0.74 PR 
ID18 A 67 56.2 152.0 24.3 NORMAL 76 95 0.80 MR 
ID19 A 71 68.6 159.0 27.1 SOBREPESO 106 117 0.91 GR 
ID20 A 63 51.0 150.0 22.7 NORMAL 71 83 0.86 GR 
ID21 A 60 53.4 150.0 23.7 NORMAL 76 89 0.85 MR 
ID22 A 69 61.3 154.0 25.8 SOBREPESO 89 106 0.84 MR 
ID23 A 64 53.2 158.0 21.3 NORMAL 73 86 0.85 MR 
ID24 A 63 54.6 150.0 24.3 NORMAL 80 108 0.74 PR 
ID25 A 66 56.2 152.0 24.3 NORMAL 84 110 0.76 PR 
ID26 A 71 60.3 156.0 24.8 NORMAL 82 99 0.83 MR 
ID27 A 64 54.7 158.0 21.9 NORMAL 76 95 0.80 MR 
ID28 A 70 60.0 160.0 23.4 NORMAL 81 104 0.78 MR 
ID29 A 63 51.3 154.0 21.6 NORMAL 76 89 0.85 MR 
ID30 A 66 50.0 153.0 21.4 NORMAL 76 87 0.87 GR 
ID31 A 64 49.8 150.0 22.1 NORMAL 72 106 0.68 PR 
ID32 A 69 55.2 156.0 22.7 NORMAL 81 98 0.83 MR 
ID33 A 69 58.2 160.0 22.7 NORMAL 78 90 0.87 GR 
ID34 S 64 51.6 156.5 21.1 NORMAL 76 87 0.87 GR 
ID35 S 63 62.7 153.0 26.8 SOBREPESO 90 103 0.87 GR 
ID36 S 72 75.6 165.0 27.8 SOBREPESO 98 110 0.89 GR 
ID37 S 73 65.2 154.0 27.5 SOBREPESO 96 110 0.87 GR 
ID38 S 68 61.8 152.0 26.7 SOBREPESO 82 93 0.88 GR 
ID39 S 71 64.3 150.0 28.6 SOBREPESO 78 89 0.88 GR 
ID40 S 72 59.2 153.0 25.3 SOBREPESO 73 82 0.89 GR 
ID41 A 69 63.4 163.0 23.9 NORMAL 93 120 0.78 MR 
ID42 S 68 66.0 160.0 25.8 SOBREPESO 90 117 0.77 PR 
ID43 S 68 61.7 158.0 24.7 NORMAL 90 116 0.78 MR 
ID44 S 73 68.2 155.0 28.4 SOBREPESO 107 120 0.89 GR 
ID45 S 79 60.1 160.0 23.5 NORMAL 92 110 0.84 MR 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
6 
 
RIVER MILE SPECIES LENGTH WEIGHT DDT 
FCM 5 CCATFISH 42.5 732 10 
FCM 5 CCATFISH 44 795 16 
FCM 5 CCATFISH 41.5 547 23 
FCM 5 CCATFISH 39 465 21 
FCM 5 CCATFISH 50.5 1252 50 
FCM 5 CCATFISH 52 1255 150 
LCM 3 CCATFISH 40.5 741 28 
LCM 3 CCATFISH 48 1151 7.7 
LCM 3 CCATFISH 48 1186 2 
LCM 3 CCATFISH 43.5 754 19 
LCM 3 CCATFISH 40.5 679 16 
LCM 3 CCATFISH 47.5 985 5.4 
SCM 1 CCATFISH 44.5 1133 2.6 
SCM 1 CCATFISH 46 1139 3.1 
SCM 1 CCATFISH 48 1186 3.5 
SCM 1 CCATFISH 45 984 9.1 
SCM 1 CCATFISH 43 965 7.8 
SCM 1 CCATFISH 45 1084 4.1 
TRM 275 CCATFISH 48 986 8.4 
TRM 275 CCATFISH 45 1023 15 
TRM 275 CCATFISH 49 1266 25 
TRM 275 CCATFISH 50 1086 5.6 
TRM 275 CCATFISH 46 1044 4.6 
TRM 275 CCATFISH 52 1770 8.2 
TRM 280 CCATFISH 48 1048 6.1 
TRM 280 CCATFISH 51 1641 13 
TRM 280 CCATFISH 48.5 1331 6 
TRM 280 CCATFISH 51 1728 6.6 
TRM 280 CCATFISH 44 917 5.5 
TRM 280 CCATFISH 51 1398 11 
TRM 280 SMBUFFALO 49 1763 4.5 
TRM 280 SMBUFFALO 46 1459 4.2 
... ... .... .... .... ..... 
 
 
 
a) Identifique a população de interesse. 
b) Complete o quadro a seguir: 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
7 
 
Variável Classificação - tipologia Escala: nível de mensuração 
Rio (riacho) 
Espécie 
Comprimento 
Peso 
Concentração de DDT 
 
 
 
 
APRESENTAÇÃO DE DADOS 
 
 
Tabelas 
 
Relação cintura / quadril 
Classe Freqüência 
Grande risco 20 
Médio risco 20 
Pequeno risco 5 
Fonte: Pinheiro, J.I. et al, 2009 
 
 
Distribuição de freqüências 
 
ClasseRCQ
20 44.4 44.4 44.4
20 44.4 44.4 88.9
5 11.1 11.1 100.0
45 100.0 100.0
GR
MR
PR
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
 
 
 
Gráficos de colunas, barras e gráficos de setores (torta ou pizza) para variáveis 
qualitativas. 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
8 
5
20 20
0
2
4
6
8
10
12
14
16
18
20
Pequeno risco Médio risco Grande risco
Classe RCQ
 
 
 
 
 
5
20
20
0 5 10 15 20
Pequeno risco
Médio risco
Grande risco
Classe RCQ
 
 
Classe RCQ
Pequeno risco
11%
Médio risco
45%
Grande risco
44%
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
9 
Segundo Pinheiro at al (2009) o gráfico de setores, por não implicar uma ordenação de 
categorias é mais apropriado para as variáveis nominais. Enquanto o gráfico de colunas 
ou de barras é mais apropriado para as variáveis ordinais. 
 
Para representar a distribuição de freqüências de uma variável por meio de um gráfico de 
setores é importante que a variável não possua muitas categorias, pois isto dificulta a 
visualização das proporções. 
 
Gráficos temporais - preço da laranja de 1991-2000 
Ano
200020001999199919981998199819971997199619961996199519951994199419931993199319921992199119911991
Preç
oLa
ran
ja
450,0
400,0
350,0
300,0
250,0
200,0
150,0
 
Sequence number
63615957555351494745434139373533312927252321191715131197531
Ven
das
 
de C
D
2000000
1500000
1000000
500000
0
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
10
 
Para variável quantitativa discreta com um pequeno número de valores possíveis (por 
exemplo, número de filhos) a construção de uma tabela de freqüências segue os mesmos 
moldes do que foi visto para variáveis qualitativas. 
Quando trabalhamos com uma variável quantitativa discreta com um grande número de 
valores possíveis ou com uma variável quantitativa contínua, para avaliarmos sua 
distribuição através de uma tabela de freqüências, antes de qualquer coisa, é preciso 
dividir o seuintervalo de variação em vários subintervalos. 
Idade
2 4.4 4.4 4.4
2 4.4 4.4 8.9
8 17.8 17.8 26.7
4 8.9 8.9 35.6
4 8.9 8.9 44.4
2 4.4 4.4 48.9
4 8.9 8.9 57.8
6 13.3 13.3 71.1
1 2.2 2.2 73.3
5 11.1 11.1 84.4
4 8.9 8.9 93.3
2 4.4 4.4 97.8
1 2.2 2.2 100.0
45 100.0 100.0
60
61
63
64
66
67
68
69
70
71
72
73
79
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
11
Idade
79737271706968676664636160
Co
un
t
8
6
4
2
0
 
 
Rio
6 4.2 4.2 4.2
6 4.2 4.2 8.3
6 4.2 4.2 12.5
126 87.5 87.5 100.0
144 100.0 100.0
FCM
LCM
SCM
TRM
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
 
 
 
Espécie
96 66.7 66.7 66.7
12 8.3 8.3 75.0
36 25.0 25.0 100.0
144 100.0 100.0
CCATFISH
LMBASS
SMBUFFALO
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
 
 
 
 
 
 
Análise exploratória de dados 
 
 
Boxplot 
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
12
Idade
80
75
70
65
60
 
 
Software Statdisk (free – download na Internet) 
 
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
13
 
Peixes - DDT 
Statistics
144 144 144
0 0 0
17.5 173 0
52.0 2302 1100
40.500 804.50 3.33
45.000 1000.00 7.15
47.500 1263.25 13.00
Valid
Missing
N
Minimum
Maximum
25
50
75
Percentiles
Comprimento Peso DDT
 
 
 
 Peso 
 
 Frequency Percent Valid Percent 
Cumulative 
Percent 
Valid 173 1 .7 .7 .7 
 353 1 .7 .7 1.4 
 .... 
..... ...... ..... ...... 
 2006 1 .7 .7 98.6 
 2061 1 .7 .7 99.3 
 2302 1 .7 .7 100.0 
 Total 144 100.0 100.0 
 
 
 
 
 
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
14
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
15
 
 
 
 
 
 
 
Informações apenas dos peixes capturados no rio Tennessee (no Alabama). 
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
16
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
17
Análise exploratória de dados 
 
Dados do arquivo DDT 
Variável de interesse: comprimento dos peixes capturados no rio Tennessee 
 
 
 
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
18
 
Estatística descritiva: Medidas de tendência central e medidas de variabilidade 
Saídas computacionais dos softwares: SPSS e Statdisk 
Statistics
126 126 126
0 0 0
42.508 1064.49 24.83
45.000 1015.00 6.70
46.0 886 12
Valid
Missing
N
Mean
Median
Mode
Comprimento Peso DDT
 
Statistics
126 126 126
0 0 0
7.1908 389.925 104.450
51.708 152041.4 10909.730
34.5 2129 1100
17.5 173 0
52.0 2302 1100
Valid
Missing
N
Std. Deviation
Variance
Range
Minimum
Maximum
Comprimento Peso DDT
 
Variável Comprimento 
Sample Size, n: 126 
Mean: 42.50794; Median: 45; Variance, s^2: 51.70794; St Dev, s: 7.190823; 
 Range: 34.5 ; Coeff. Of Var. 16.92% ; Minimum: 17.5; 1st Quartile: 38.5; 2nd Quartile: 45; 3rd 
Quartile: 47.5; Maximum: 52; Sum: 5356; Sum Sq: 234136 
Variável peso 
Sample Size, n: 126 
Mean: 1064.492; Median: 1015; Variance, s^2: 152041.4; St Dev, s: 389.9248; 
Range: 2129 ; Coeff. Of Var. 36.63%; Minimum: 173; 1st Quartile: 826; 2nd Quartile: 1015; 3rd 
Quartile: 1300; Maximum: 2302; Sum: 134126; Sum Sq: 1.617812e+8 
Variável DDT 
Sample Size, n: 126; Mean: 24.83333; Median: 7; Midrange: 550; Variance, s^2: 10909.88; 
St Dev, s: 104.4504; Range: 1100; Coeff. Of Var. 420.61%; Minimum: 0; 1st Quartile: 3; 2nd 
Quartile: 7; 3rd Quartile: 13; Maximum: 1100 
Sum: 3129; Sum Sq: 1.441439e+6 
Exercícios 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
19
01) Peso, em gramas, de ratos machos Wistar segundo a idade, em dias. 
 
 Idade 
Nº do rato 30 34 38 42 46 
1 76 95 99 122 134 
2 81 90 101 125 136 
3 50 60 62 72 85 
4 47 50 57 72 84 
5 63 79 82 94 110 
6 65 75 79 88 98 
7 63 74 79 88 100 
8 64 74 62 96 98 
 
a) Determine as medidas de tendência central e de variabilidade dos pesos de 
grupos, segundo a idade em dias. 
b) Em qual das idades os pesos foram mais heterogêneos? 
 
02) Os dados seguintes representam o comprimento (em cm) de 60 trutas marinhas 
pescadas por uma traineira comercial na baía de Delaware, na costa leste dos Estados 
Unidos: 
16,6 17,0 17,3 18,1 18,2 18,3 18,3 18,4 18,5 18,6 18,6 18,9 19,0 19,0 19,2 
19,3 19,3 19,4 19,4 19,4 19,4 19,5 19,5 19,5 19,5 19,5 19,6 19,6 19,7 19,7 
19,8 19,8 19,8 19,9 20,1 20,1 20,2 20,2 20,3 20,3 20,4 20,4 20,4 20,5 20,6 
20,7 20,7 20,8 20,9 21,0 21,1 21,4 21,5 21,5 21,7 21,8 21,9 22,7 22,9 23,5 
Statistics
comp
60
0
19.8867
19.7500
19.50
1.34511
1.809
6.90
16.60
23.50
19.2250
19.7500
20.6750
Valid
Missing
N
Mean
Median
Mode
Std. Deviation
Variance
Range
Minimum
Maximum
25
50
75
Percentiles
 
comp
24,00
22,00
20,00
18,00
16,00
60
59
2
1
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
20
 
 
 
 
 
 
 
 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
21
03) Os seguintes dados representam o tempo de vida, em segundos, de 50 moscas 
drosófilas, submetidas a um novo spray em um experimento de laboratório controlado. 
 
 
 
 
 
 
a) Qual foi o tipo de gráfico utilizado para representar o tempo de sobrevivência das 
moscas? Justifique o uso do tipo de gráfico. 
b) O boxplot apresenta um valor outlier. 
b1) Justifique a sua existência por meio de cálculos. 
b2) Apresente uma razão de ordem prática que justifique a ocorrência deste valor. 
 
04) O tubarão branco, Carcharodon carcharias, é um grande predador no oceano e está 
no topo da cadeia alimentar. O comprimento corporal, em pés, de 44 tubarões brancos 
adultos forneceu os seguintes dados: 9,4; 12,1; 12, 2;...; 19,1; 19,7 e 22,8. 
 
 
 
a) Existe algum valor atípico (outlier)? Justifique. 
b) Determine o comprimento médio dos tubarões, em pés. 
c) Interprete a mediana. 
d) Determine a variância amostral. 
 
 
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO 
GRANDE DO SUL 
FACULDADEDE MATEMÁTICA - DEPARTAMENTO DE 
ESTATÍSTICA- Bioestatística A – Material 01- Estatística 
Descritiva 
 
 
 
Prof. João Feliz Moraes 
 
22
e) A unidade de medida padrão internacionalmente é o metro. Um pé equivale a 
30,48 centímetros. Essa medida é amplamente usada na aviação. Transformando 
o peso dos tubarões em cm, calcule o coeficiente de variação. Apresente os 
cálculos. 
 
05) Resumo. OPALINSKI, Michelly et al. Adição de complexo enzimático e da granulometria 
da soja integral desativada melhora desempenho de frangos de corte. Cienc. Rural [online]. 
2010, vol.40, n.3, pp. 628-632. Epub 26-Fev-2010. ISSN 0103-8478. doi: 10.1590/S0103-
84782010005000017. 
O experimento foi conduzido com objetivo de avaliar o efeito da adição de complexo 
enzimático e da granulometria da soja integral desativada sobre o desempenho de 
frangos no período de um a 42 dias de idade. Foram utilizados 480 pintos machos da 
linhagem Ross, distribuídos em um delineamento inteiramente casualizado, em esquema 
fatorial 2x2 (enzima x granulometria). As rações experimentais foram formuladas à base 
de milho, farelo de soja e soja integral desativada (±1,5mm), soja integral desativada 
(±1,5mm) + enzima, soja integral desativada (±4,0mm) e soja integral desativada 
(±4,0mm) + enzima. O complexo enzimático (xilanase, β-glucanase, mannase, pectinase 
e protease) foi adicionado na dosagem de 50g t-1 de ração. A adição do complexo 
enzimático aumentou (P=0,053) em 4% o consumo de ração e 2,8% o ganho de peso no 
período final de criação. O consumo de ração foi aumentado em 3% no período final e 
(P=0,048) 2% no período total em aves que ingeriram ração com granulometria 1,5mm. 
No período inicial, as aves que ingeriram ração com granulometria 4,0mm tiveram 
aumento de 5% no ganho de peso e obtiveram os melhores índices de conversão 
alimentar. A adição do complexo enzimático em dietas à base de soja integral melhora o 
desempenho de frangos. Não é recomendada a utilização da soja com granulometria 
 
Responda o que se pede a partir do resumo dado acima. 
a) Identifique a população do estudo. 
b) Identifique a amostra do estudo. 
c) Identifique a variável de interesse da pesquisa. Classifique-a quanto a sua 
tipologia. 
d) Qual foi o nível de mensuração dos resultados obtidos para a variável de 
interesse?

Continue navegando