Buscar

Aula+3.+Representação+gráfica+e+tabular+da+distribuição+dos+dados+e+medidas+resumo

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
*
Representação gráfica e tabular da distribuição dos dados
e
Medidas resumo
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
Tópicos abordados na última aula
Definição e classificação de variáveis;
Codificação de dados;
Armazenamento dos dados (Exemplo de banco de dados);
Construção de tabelas de frequências (Variáveis qualitativas).
	
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
Tópicos abordados nessa aula
Construção e interpretação de gráficos para cada tipo de variável;
Definição e Cálculo das medidas de posição: Média, Mediana, Quartis e Moda;
Medidas de dispersão.
	
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
Conjunto de técnicas que resumem e descrevem os dados simplificando as informações para torná-las mais rapidamente compreensíveis.
Etapa inicial da análise dos dados
Tabelas
Gráficos
Medidas resumo
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Estatística descritiva - Definição
*
*
Representação gráfica para Variáveis qualitativas (categóricas) ou quantitativas discretas
GRÁFICO DE BARRAS / COLUNAS: É utilizado para apresentar variáveis categóricas ou numéricas discretas. Em geral, no eixo das abscissas encontram-se as categorias e a altura das colunas correspondem às freqüências (simples ou relativas) das categorias. 
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Exemplo de gráfico de colunas para variáveis quantitativas discretas:
*
*
Exemplo de gráfico de colunas para variáveis qualitativas:
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Exemplo de gráfico de barras para variáveis qualitativas:
*
*
Cruzamentos: Variáveis categóricas x Variáveis categóricas
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Cruzamentos: Variáveis categóricas x Variáveis categóricas
(Continuação)
*
*
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Cruzamentos: Variáveis categóricas x Variáveis categóricas
(Outro exemplo)
*
*
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Cruzamentos: Variáveis categóricas x Variáveis categóricas
(Outro exemplo – Continuação)
*
*
Representação gráfica para variáveis qualitativas (categóricas)
	GRÁFICO DE SETORES (PIZZA): Cada “fatia” corresponde à porcentagem de ocorrências em cada categoria de resposta da variável. É indicado para variáveis qualitativas (preferencialmente nominais). Neste tipo de gráfico, todas as observações da amostra estão classificadas em uma das categorias, ou seja, a soma das porcentagens deve ser igual a 100%.
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Exemplo de gráfico de setores (pizza) para variáveis qualitativas:
*
*
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Exemplo de gráfico de setores (pizza) para variáveis qualitativas:
*
*
Histograma: Gráfico de barras justapostas em que no eixo horizontal está a variável de interesse, dividida em classes geralmente de mesmo tamanho. No eixo vertical, constrói-se uma barra para cada classe com altura igual à freqüência absoluta ou relativa correspondente. A barra é centrada no ponto médio da classe.
Polígono de Freqüências: Construído a partir do histograma, onde se une através de segmentos de reta as ordenadas correspondentes aos pontos médios de cada classe.
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Representação gráfica para Variáveis quantitativas contínuas
*
*
Exemplo de histograma: Dados de registro pediátrico da concentração de chumbo na urina de 140 crianças de uma determinada região.
Paula Strassmann
PGS Medical Statistics
MAIO/2010
*
*
Construção do Histograma para os dados da Tabela 1
Tabela 1. Ácido úrico sérico em homens sadios (Finn et al. (1966)).
MAIO/2010
Paula Strassmann
PGS Medical Statistics
		Ácido úrico (mg/dl)
		Freqüência absoluta
		Freqüência relativa
		Porcentagem (%)
		3,0 |( 3,5
		2
		0,008
		0,8
		3,5 |( 4,0
		15
		0,056
		5,6
		4,0 |( 4,5
		33
		0,124
		12,4
		4,5 |( 5,0
		40
		0,150
		15,0
		5,0 |( 5,5
		54
		0,202
		20,2
		5,5 |( 6,0
		47
		0,176
		17,6
		6,0 |( 6,5
		38
		0,142
		14,2
		6,5 |( 7,0
		16
		0,060
		6,0
		7,0 |( 7,5
		15
		0,056
		5,6
		7,5 |( 8,0
		3
		0,011
		1,1
		8,0 |( 8,5
		1
		0,004
		0,4
		8,5 |( 9,0
		3
		0,011
		1,1
		Total
		267
		1,000
		100,0
*
*
Histograma para os dados da Tabela 1
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Polígono de frequência para os dados da Tabela 1
*
*
Estatística descritiva – Análise exploratória dos dados
Como resumir VARIÁVEIS NUMÉRICAS? 
	 Medidas de posição ou Medidas de tendência central
Moda
Média
Mediana
Quartis, percentis
	 Medidas de dispersão
Amplitude 
Variância
Desvio padrão
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
 Valor que ocorre com maior freqüência. Exemplo: As idades dos alunos de uma classe são: 19, 19, 20, 20, 20, 21, 22. Nesse caso, Moda = 20 anos;
 Pode existir mais de uma moda. Distribuição é bimodal, trimodal, ...
Exemplo: As idades dos alunos de uma classe são: 19, 19, 19, 20, 20, 20, 21, 22. Nesse caso, Moda = 19 e 20 anos (bimodal);
 Pode não existir moda (não ter um valor mais freqüente). Exemplo: As idades dos alunos de uma classe são: 18, 19, 20, 21, 22. Nesse caso, Não existe Moda.
Medidas de posição – Moda
Paula Strassmann
PGS Medical Statistics
MAIO/2010
*
*
É a medida de tendência central mais utilizada;
 Leva em conta todos os valores da variável;
 É afetada por valores extremos;
 É o “ponto de equilíbrio” da distribuição dos dados.
Média 2
(Dados ordenados)
Média 1
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de posição – Média
*
*
Exemplo: Um estudante fez 5 provas e obteve notas 75, 90, 83, 77 e 92. Então sua nota média é:
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de posição – Cálculo da Média
*
*
 Divide os dados ordenados ao meio;
 Medida resistente: pouco afetada por mudanças de valores discrepantes (extremos).
mediana
50%
50%
(Dados ordenados)
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de posição – Mediana
*
*
 Ordenam-se os dados;
 Seleciona-se a observação central.
 
 n ímpar: valor da observação central 
 n par: média das duas observações centrais
Posição da mediana = 3
Mediana = 83
Posição da mediana = 3,4
Mediana = (83 + 90)/2 = 86,5
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de posição – Cálculo da Mediana
		Dados ordenados
		75
		77
		83
		90
		92
		97
		posição
		1
		2
		3
		4
		5
		6
		Dados ordenados
		75
		77
		83
		90
		92
		posição
		1
		2
		3
		4
		5
*
*
Medidas de posição central
 São valores únicos representativos dos dados. Os mais usados são média aritmética, moda e mediana.
Exemplo:
Mediana = 49 anos (posição central)
Moda = 39 anos (idade mais freqüente)
Média = (575/11) = 52,3 anos 
Paula Strassmann
PGS Medical Statistics
MAIO/2010
*
*
Concluindo:
Média: É o “ponto de equilíbrio” da distribuição dos dados.
Moda: É o valor que ocorre com mais frequência.
Mediana: Divide os dados ordenados
ao meio.
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
Exercício 1: 
Com base nos dados da tabela abaixo, calcule:
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Resolução do Exercício 1: 
Peso médio: 
	
	
	Portanto, peso médio = 77,55 kg.
b) 	Moda para a Idade: Observando todas as idades da tabela, vemos que a idade que mais aparece é 24 anos (3 alunos têm 24 anos). As demais idades aparecem uma única vez. Portanto, Moda = 24 anos. 
*
*
MAIO/2010
Paula Strassmann
PGS Medical Statistics
Resolução do Exercício 1 (Continuação): 
Altura mediana:
	Ordenação dos dados: 1,55; 1,59; 1,6; 1,65; 1,66; 1,7; 1,71; 1,72; 1,78; 1,82.
	Nesse caso, n = 10 (número par de elementos) e então a mediana é a média entre os 2 valores centrais. Posição da mediana: 5, 6.
	Mediana =
	Portanto, a altura mediana é 1,68 metros.
*
*
Q1
Q2
Q3
Dados em ordem crescente
 Dividem os dados ordenados em 4 partes iguais:
	 25% dos dados estão abaixo do 1º quartil (Q1)
 50% dos dados estão abaixo do 2º quartil (Q2 ou mediana)
 75% dos dados estão abaixo do 3º quartil (Q3)
	Dados Resistentes
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de posição – Quartis
		25%
		25%
		25%
		25%
*
*
3o quartil (Q3)
Mediana
1o quartil (Q1)
Ponto discrepante
Box-plot
Valor máximo entre
 os não discrepantes
Valor mínimo entre
 os não discrepantes
Paula Strassmann
PGS Medical Statistics
MAIO/2010
*
*
Exemplo: Gráfico de Box-Plot comparando dois tratamentos
Paula Strassmann
PGS Medical Statistics
MAIO/2010
*
*
 Distância entre os valores máximo e mínimo;
 Amplitude = valor máximo – valor mínimo;
 Ignora a distribuição dos dados;
Exemplo:
amplitude = 10 – 7 = 3
amplitude = 10 – 7 = 3
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de dispersão – Amplitude
*
*
	Exemplo 1: Duas amostras de 20 indivíduos.
	Amostra 1: Estatura mínima: 140 cm	e Estatura máxima: 180 cm
	Amostra 2: Estatura mínima: 150 cm	e Estatura máxima: 175 cm
	Em qual das duas amostras os indivíduos variam mais em relação à estatura ?
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de dispersão – Cálculo da Amplitude
*
*
Resolução do Exemplo 1:
Amostra 1: Estatura mínima: 140 cm
 Estatura máxima: 180 cm
Amostra 2: Estatura mínima: 150 cm
 Estatura máxima: 175 cm
Máx – mín =
180 cm – 140 cm= 
40 cm
Máx – mín =
175 cm – 150 cm= 
25 cm
Os cálculos sugerem
 que a Amostra 1 contém mais 
estaturas diferentes, pois
abrange uma faixa maior 
de valores
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de dispersão – Cálculo da Amplitude (Continuação)
*
*
	Exemplo 2: Duas amostras de estatura (cm) de 6 indivíduos.
	Amostra 1: 150, 151, 153, 155, 158, 160
	Amostra 2: 150, 155, 155, 155, 155, 160
	A amplitude é a mesma nas duas amostras.
	Em qual das duas amostras os indivíduos variam mais em relação à estatura ?
	Observando os valores um a um, percebemos que a Amostra 1 varia mais.
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de dispersão – Cálculo da Amplitude (Continuação)
*
*
 No exemplo, vimos que amostras com a mesma média podem ter variabilidades muito diferentes.
Como medir a variabilidade de um conjunto de dados?
 A forma mais comum de medir a variabilidade é quantificá-la pelas distâncias das observações com relação á média.
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de dispersão (Continuação)
*
*
Medidas de Dispersão – Variância amostral
Paula Strassmann
PGS Medical Statistics
MAIO/2010
A variância quantifica a variabilidade ou espalhamento ao redor da média das medidas. Tende a ser um número grande e o seu valor sai dos limites dos valores observados em um conjunto de dados. Além disso, sua unidade de medida corresponde a unidade de medida da média elevada ao quadrado. 
*
*
Paula Strassmann
PGS Medical Statistics
MAIO/2010
Medidas de Dispersão – Desvio padrão amostral
O desvio padrão, que é a raiz quadrada da variância, tem a mesma unidade de medida da média e pode ser usado para descrever a quantidade de dispersão na distribuição da freqüência.
*
*
 O desvio padrão por si só não nos diz muita coisa. Um desvio padrão de 2 unidades pode ser considerado pequeno para um conjunto de dados cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar dois ou mais conjuntos de dados, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos ao seu valor médio, medida essa denominada coeficiente de variação (CV).
Medidas de Dispersão (Continuação)
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
Paula Strassmann
PGS Medical Statistics
MAIO/2010
 Indica a dispersão em relação à média;
 É uma medida de variabilidade relativa, definida como a razão entre o desvio padrão e a média, sendo uma medida adimensional expressa em percentual.
 Pode ser usado para comparar a dispersão de dois conjuntos de dados, sem que eles estejam necessariamente na mesma unidade de medida.
 
 
Medidas de Dispersão – Coeficiente de correlação
*
*
Coeficiente de variação – Exemplo 1
Como 13 representa 
18% de 72, então
o CV é de 18%
Por exemplo, em uma amostra de 
pacientes para determinação do 
clearance de creatinina, 
constatou-se que a média era 
de 72 ml/min e o desvio-
padrão, de 13.
Paula Strassmann
PGS Medical Statistics
MAIO/2010
*
*
	Medidas as estaturas de 1017 indivíduos, obtivemos = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos indivíduos é 58 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
 Coeficiente de variação para as estaturas:
 Coeficiente de variação para o peso: 
CV = 8,01 = 0,0494 = 4,94%;
 162,2
Coeficiente de variação – Exemplo 2
CV = 2,3 = 0,0397 = 3,97%.
 58,0
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
 Bibliografias recomendadas 
PAGANO, Marcello (1945) – Princípios de bioestatística / Marcello Pagano, Kimberlee Gauvreau; tradução Luiz Sérgio de Castro Paiva; revisão técnica Lúcia Pereira Barroso. – São Paulo: Pioneira Thomson Learning, 2004. (paginas 304-317). Titulo original: Principles of bioestatistics 
Bussab, W.O. e Morettin, P.A. (2005) - Estatística Básica. 5ª Edição. São Paulo: Saraiva. 526p.
Dawson-Saunders, Beth e Trapp, Robert G. (1994) - Basic & Clinical Biostatistics – A Lange medical book. Second Edition – Prentice-Hall Internationl Inc. 344p.
Riffenburgh, Robert H. (2006) – Statistics in Medicine – Second Edition – San Diego, Caifornia – Elsevier Academic Press – 622p.
Del Giglio, Auro (2008) – Conselhos para um jovem médico – 1ª Ed. – Editora Manole Ltda. – 118 p.
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
 PGS Medical Statistics
Paula G. Strassmann
pstrass@pgs.com.br
MAIO/2010
Paula Strassmann
PGS Medical Statistics
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais