Buscar

AULA ESTATISTICA BASICA 14 FEV 2011

Prévia do material em texto

ESTATÍSTICA BÁSICA
MÓDULO I: COLETA E ORGANIZAÇÃO DOS DADOS
A estatística pode ser considerada a ciência que se preocupa com a coleta, organização, descrição, análise e interpretação de dados experimentais. 
Conceitos fundamentais:
População ou Universo: quaisquer conjuntos de informações que tenham entre si uma característica comum que delimite quais elementos pertencem a ela. Ex: uma população de pesos de todos os habitantes de uma cidade.
�A = População B = Amostra
Média populacional = 
 Média amostral = 
Desvio Padrão populacional =
 Desvio padrão amostral = s
Amostras: são subconjuntos representativos de uma dada população da qual foi extraída, devendo ser parecida com ela (qualitativa e quantitativamente), suficientemente grande, além de seus constituintes serem selecionados ao acaso. Na maioria das situações trabalha-se com amostras pela impossibilidade da obtenção dos dados de toda a população.
Exemplo: Peso dos alunos de uma escola pública de São Paulo (população) e peso dos alunos da mesma escola do primeiro ano (amostra).
Elemento: é cada uma das unidades observadas no estudo e corresponde a cada indivíduo ou objeto estudado. Exemplo: paciente RN de Maria.
Variável: é uma característica de interesse que se pode medir. Por exemplo: idade, sexo, peso, pressão arterial.
Observação: é a informação sobre a variável para um elemento específico. Exemplo: peso de 1500 para o Elemento RN de Maria.
Caso: é o conjunto de observações de um elemento determinado. Exempo: peso de 1550g, sexo masculino, idade 3 dias para o RN de Maria.
Parâmetros: São valores singulares que existem na população e que servem para caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. Ex: Os alunos de Estatística do Brasil têm em média 1,70 metros de estatura.
Estimativa: é um valor aproximado do parâmetro e é calculado com o uso da amostra.
Atributo: quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo
Dado estatístico: é um dado numérico e é considerado a matéria-prima sobre a qual iremos aplicar os métodos estatísticos.
Variável Dependente: é aquela que mede o fenômeno que se estuda. 
Ex: Produção mensal de peças (quantitativa discreta: número de peças que cada funcionário da empresa produz por mês; qualitativa ordinal: menos que 300, entre 300 e 500, mais que 500).
Variável Independente: é aquela candidata a explicar a dependente. 
Ex: Sexo (se a maioria das funcionárias produz mais que 500 peças por mês e a maioria dos funcionários produz menos que 300 peças por mês pode-se “suspeitar” que sexo e produção estão intimamente relacionados, ou seja, que mulheres são mais competentes/rápidas que homens na mesma função). 
Escalas de Medição (Tipos de Dados ou Variáveis):
Dados nominais ou categóricos: são aqueles distribuídos em categorias nominais, sem qualquer ordem que descrevem atributos ou qualidades dos dados. Ex: sexo, raça, evolução. 
Podem ser codificados. Exemplo: sexo feminino 0 e masculino 1. 
Descrição: em geral através de nº. absoluto, porcentagens e proporções.
Apresentação: gráficos de barras, pizzas e tabelas de contingência.
Exemplos: 
 Cor Raça Tamanho
 
Dados ordinais: são aqueles que se distribuem por categoria e que tem uma ordem. Cada observação faz a associação do indivíduo medido a uma determinada classe, sem no entanto quantificar a magnitude da diferença face aos outros indivíduos. Exemplo: Escalão social, escalão salarial, escalas usadas na medida de opiniões, Escala de Apgar, de Glasgow, graus de retinopatia. 
Podem ser codificados. Exemplo: HIV grau I, HIV grau II, HIC grau III e HIC grau IV; Pressão arterial normal (0), Hipertensão leve (1), Hipertensão moderada (2) e Hipertensão grave (3). 
Descrição: em geral através de nº. absoluto, porcentagens e proporções e permitem operações que envolvem ordenação (menor/maior).
Apresentação: gráficos de barras, pizzas e tabelas de contingência.
Exemplos: Classe social
Escala métrica - Para além de ser possível ordenar os indivíduos, é também feita uma quantificação das diferenças entre eles. As escalas métricas dividem-se em dois subtipos: 
A) Escala intervalar: Um caso particular (e não muito frequente) das escalas métricas em que é possível quantificar as distâncias entre as medições mas onde não há um ponto nulo natural e uma unidade natural. Exemplo clássico são as escalas das temperaturas, onde o valor nulo não corresponde à ausência da característica medida, existe um zero arbitrário. Ex: o 0º grau não significa ausência de temperatura, mas o valor 0º grau da escala Celsius (ponto de nulidade) e não se pode dizer que a temperatura X é o dobro da temperatura Y.
B) Escala de razão: A escala onde não só é possível quantificar as diferenças entre as medições como também estão garantidas certas condições matemáticas vantajosas, como um ponto de nulidade. Isto permite o quociente de duas medições, independentemente da unidade de medida. É possível fazer diferenças e quocientes e logo a conversão (de kms em milhas, por exemplo). Exemplos de escalas de razão são a idade, salário, preço, volume de vendas, distâncias. O zero corresponde à ausência da característica medida. Ex: massa corporal, idade, tempo, pressão arterial. Nesta escala é válido dizer que uma pessoa de 70 kg possui duas vezes o peso de outra de 35 kg.
Variáveis Quantitativas Discretas e Contínuas
Dados quantitativos discretos: apresentam somente valores inteiros. Ex: nº. de leitos, nº. de casos de determinadas doenças, nº. de filhos.
Exemplos: 
Nº. de gatos Nº. de pássaros Nº. de cães
Dados quantitativos contínuos: são aqueles em que os números são significantes, podendo existir valores intermediários. Ex: peso, estatura, perímetro cefálico. 
Descrição: em geral através de média, mediana, moda, valores mínimos e máximos, amplitude, quartis.
Apresentação: gráficos de barras, Boxplot e tabelas de contingência.
Exemplos: 
Peso Altura
 
Normas para apresentação de Tabelas:
Devem ser auto-explicativas;
Fechadas no alto e em baixo por linhas horizontais, não sendo fechadas à direita nem à esquerda por linhas verticais;
Enumerar as tabelas conforme a ordem de aparecimento;
O título deve conter a descrição básica do conteúdo, local e época da coleta dos dados;
Manter a uniformidade quanto ao nº. de casas decimais (duas).
Tabela 1: Dados de 8 recém-nascidos do Hospital X no período de 01/01/2010 a 31/01/2010
	N
	Pré-natal
	Peso
	Sexo
	Permanência
	Tipo de Alta
	1
	1
	1500
	0
	30
	0
	2
	1
	2000
	0
	7
	0
	3
	1
	3000
	1
	4
	0
	4
	0
	1200
	1
	40
	1
	5
	0
	1600
	0
	15
	0
	6
	1
	2000
	0
	9
	0
	7
	1
	1800
	1
	12
	0
	8
	0
	2000
	1
	6
	0
Códigos: Pré-natal: 0=não; 1=sim
 Sexo: 0= fem; 1= masculino
 Tipo de alta: 0= vivo; 1= óbito
EXERCÍCIOS
Explique seis conceitos fundamentais que devem reger o início da coleta e organização dos dados. 
	1) 
	
	2) 
	
	3) 
	
	4) 
	
	5)
	 
	6)
	 
O que são dados nominais e dados quantitativos
	1) 
	
	2) 
	
Encontre a correspondência entre as variáveis e o seu grupo classificatório, preencha a coluna.
	Dados
	
	Tipos de dados
	1
	Sexo
	
	
	Variável categórica ordinal
	2
	Peso
	
	
	Variável numérica discreta
	3
	Raça
	
	
	Variável categórica ordinal
	4
	Idade
	
	
	Variável categórica não ordinal
	5
	Nº filhos
	
	
	Variável categórica não ordinal
	6
	Classe social
	
	
	Variável numérica contínua
	7
	EscolaridadeVariável numérica contínua
Cite as normas para a tabulação de dados.
	1)
	2)
	3)
	4)
	5)
	
Dê dois exemplos de cada variável:
Variável quantitativa numérica : ___________________
 ___________________
Variável quantitativa contínua: ___________________
 ___________________
Variável categórica (não ordinal) : _________________
 ___________________
Variável categórica ordinal: ___________________
 ___________________
Você está realizando um estudo e precisa elaborar uma tabela, construa abaixo conforme as normas aprendidas.
Escolha cinco variáveis
Codifique conforme a sua classificação.
	N
	
	
	
	
	
	1
	
	
	
	
	
	2
	
	
	
	
	
	3
	
	
	
	
	
	4
	
	
	
	
	
	5
	
	
	
	
	
	6
	
	
	
	
	
	7
	
	
	
	
	
	8
	
	
	
	
	
ANÁLISE DESCRITIVA OU EXPLORATÓRIA DOS DADOS
Variáveis categóricas nominais:
Distribuição de freqüências, freqüência acumulada representação gráfica nº. classes.
Frequência absoluta simples (n): é a quantidade de observações encontradas em uma dada categoria. É uma simples contagem. A soma das freqüências absolutas é igual ao número total de observações de cada variável.
Frequência relativa simples (fr): indica a proporção de elementos do conjunto total que pertence a uma dada categoria. A soma das freqüências relativas de todas as categorias é igual a 1.
�� EMBED Equation.3 
Frequência percentual simples (fp): indica o percentual de observações que pertence a uma dada categoria. De modo análogo, a soma das freqüências relativas de todas as categorias é igual a 100%. 
 
Frequência percentual acumulada (Fp): indica a soma da freqüência percentual de uma classe com as freqüências percentuais das classes anteriores. A última freqüência acumulada deve ser igual a 100%. 
Distribuição das freqüências em classes
É apropriada para apresentar dados quantitativos contínuos ou discretos com um número elevado de possíveis valores. Na construção da tabela não são apresentados valores individualizados, mas agrupados em um determinado número de classes. 
Regras básicas:
As classes devem abranger todas as observações;
O extremo superior de uma classe é o extremo inferior da classe seguinte;
Cada valor deve enquadrar-se em apenas uma classe;
A quantidade de classes, em geral, não deve ser inferior a 5 ou superior a 25.
Exemplo: Supondo que o peso máximo de um RN seja 2000g e o menor seja de 500g. Regras práticas:
A amplitude total (máximo – mínimo) seria de 1500g. Pode-se escolher o número de classes igual a 5 (divisor de 1500g) para que os intervalos de classe apresentem valores inteiros e sejam mais facilmente analisados. Assim, a amplitude da classe seria a amplitude total dividida pelo nº. de classes. Neste caso, 1500/5 que é igual a 300g. Teríamos os intervalos: 500 a 800g; 800 a 1100g; 1100 a 1400g; 1400 a 1700g e 1700 a 2000g. 
Para não incluir o mesmo valor em duas classes, convencionou-se organizar os limites de classe de modo que um valor seja incluído numa classe caso ele seja maior ou igual ao limite inferior e menor que o limite superior desta classe. Utilizando-se o símbolo |--- entre os limites das classes, significando a barra vertical que o limite inferior está incluído no intervalo e o superior, não. 
O ponto médio de cada classe é o valor do limite superior somado ao limite inferior dividido por dois.
Exemplos:1) Distribuição do sexo dos colaboradores de acordo com o setor de trabalho.
2) Distribuição da idade materna dos pacientes internados em janeiro de 2009.
	Idade mães
	N
	fp (%)
	Fpa (%)
	10 |-------- 17
	3
	2,50
	2,50
	17 |-------- 25
	7
	5,83
	8,33
	 25 |-------- 33
	70
	58,33
	66,67
	 33 |-------- 41
	25
	20,83
	87,50
	 41 |--------- 50
	15
	12,50
	100,00
	Total
	120
	100,00
	
3) Distribuição dos pesos de nascimento dos pacientes internados em janeiro de 2009.
	Classes de pesos
	ponto médio (pm)
	ni
	fpi
	Fpi
	500 |---- 800g
	650
	20
	2,22
	2,22
	800 |---- 1100g
	950
	30
	3,33
	5,55
	1100 |---- 1400g
	1250
	100
	11,11
	16,66
	1400 |---- 1700g
	1550
	300
	33,33
	50,00
	1700 |---- 2000g
	1850
	450
	50,00
	100
	Total
	
	900
	100
	
Medidas de Tendência Central
Média aritmética: definida como a soma dos valores observados dividida pelo número de observações. 
Exemplo: n=7
X = x1 + x2 + x3 + x4 + x5 + x6 + x7 = 50+70+80+80+90+100+800 = 181,42
 7 7
Mediana: é aquele valor que, uma vez ordenados todos os resultados, deixa igual o número de resultados de cada lado. 
ordenar os dados em ordem crescente: 50, 70, 80, 80, 90, 100, 200
se o n = ímpar, a mediana será o valor da posição central, caso seja par, some os dois centrais e divida o resultado por dois.
Exemplo: n = 7 (ímpar) 
 
 50 70 80 80 90 100 200
 50% 100%
assim, a mediana = 80, ou seja, metade dos valores estão abaixo e metade acima deste valor central.
 n = 6 (par) 
 
 50 70 70 80 90 100 
 Sendo n=6 (par) somar os valores centrais (70 + 80) e
 dividir por dois= 75.
 50, 70, 70, 80, 90, 100, assim, a mediana = 75, ou seja, 
 metade dos valores estão abaixo e metade acima deste valor central.
Moda: é definida como o valor mais freqüente e é usada primariamente para descrever distribuições bimodais.
Exemplo: 50, 70, 80, 80, 90, 100, 800
A moda é 80!
Medidas de Dispersão ou Variabilidade
Grande variabilidade ...
 
Pouca variabilidade ...
 
Variância: quanto mais próximos da média estiverem os valores, mais homogêneo será o conjunto, assim, é interessante conhecer o quanto os valores obtidos se afastam da média. Obtendo-se a diferença de cada valor em relação à média, elevando-se estes valores ao quadrado, somando os quadrados obtidos e dividindo pelo total da população, temos a variância.
 n= 10-1 = 9
Exemplo 1: Altura da equipe de neonatologia 
 n= 10 -1 = 9
Soma da diferença entre os valores individuais e a média elevada ao quadrado = 750. 
Variância = 750 = 83,33
 9 
Desvio-padrão: raiz quadrada da variância. É um modo de representar a dispersão dos dados ao redor da média. Se os dados obedecerem a uma distribuição normal, todos estarão compreendidos por uma curva em forma de sino.
 Desvio-padrão = raiz da variância = 9,129
Exemplo 2: Altura da equipe de neonatologia da Promatre
O desvio-padrão pequeno é desejado, por exemplo, nas fábricas de peças para automóveis onde os tamanhos devem variar o mínimo possível. 
Um exemplo de grande desvio-padrão é encontrado em uma amostra de salários dos colaboradores de uma empresa, que divergem de acordo com as diferentes funções.
Coeficiente de variação (CV):
O desvio-padrão reflete o valor da sua unidade de medida, assim, uma medida de peso em gramas terá um desvio-padrão menor do que a medida do peso em kilogramas. O CV expressa o desvio-padrão como porcentagem da média eliminando a unidade de medida. Um CV igual a 100% indica que o desvio-padrão é igual à média; quanto menor ele for, mais homogênea será a amostra.
Coeficiente de variação = Desvio-padrão x 100
 |média|
EXEMPLO: PESO (A) X IDADE GESTACIONAL (B) 
20 RN : 
PESO ENTRE 2000 E 2500GIG ENTRE 25 E 35 SEMANAS
 
MÉDIA A = 2236 DP= 503 
CV A = 22
MEDIA B = 29 DP= 7 
CV B = 25
Interpretação: O Desvio Padrão da variável peso é maior que o da IG pela diferença da grandeza da variável (unidade de medida gramas é maior que a semana), mas o coeficiente de variação é maior na IG, mostrando que existe maior variabilidade nesta variável. 
Amplitude total ou intervalo de variação:
É a diferença entre o valor máximo e o mínimo =180-150= 30. 
Percentil: é obtido dividindo-se a população, organizada em ordem crescente, em 100 partes iguais. Indica a porcentagem do total de observações que são iguais ou se situam abaixo de um determinado valor. 
Por exemplo: Uma escola quer conhecer o percentil das notas de 50 alunos. Qual nota corresponde aos percentis 10, 50 70 e 100?
Para encontrar o percentil 10:
Multiplique o 10 por 50 e divida por 100 = 5. 
O 5º elemento corresponde à nota 6. 
Para encontrar o percentil 50:
Multiplique o 50 por 50 e divida por 100 = 25. 
O 25º elemento corresponde à nota 8.
Para encontrar o percentil 70:
Multiplique o 70 por 50 e divida por 100 = 35. 
O 35º elemento corresponde à nota 9. 
Para encontrar o percentil 100:
Multiplique o 100 por 50 e divida por 100 = 50. 
O 50º elemento corresponde à nota 10. 
Exemplo 3: Notas de 50 alunos de uma Escola Pública
Quartil: é obtido dividindo-se a população, organizada em ordem crescente, em quatro partes iguais. O primeiro quartil inclui 25% dos valores mais baixos e o segundo quartil corresponde ao percentil 50 e à mediana, já o terceiro quartil exclui 25% dos valores mais altos. 
EXERCÍCIOS
Dê exemplos de como você faria a descrição dos dados qualitativos e quantitativos. 
	Quatlitativos:
	1)
	2) 
	3)
	4) 
	
	Quantitativos
	1)
	2)
	3)
	4)
	 
O peso dos RN da UTINeonatal foi verificado, agrupe e calcule a freqüência absoluta simples, percentual e acumulada.
Pesos: 1500;1510;1560;1600;1800;1830;1860;1900;1920;1940;2000;2010;2035; 2100;2200;2240;2300;2360;2450;2499;2550;2570;2700;2700;2700;2780; 2999.
	Classes de pesos
	ponto médio (pm)
	fi
	fpi
	Fpi
	 |---- g
	
	
	
	
	 |---- g
	
	
	
	
	 |---- g
	
	
	
	
	 |---- g
	
	
	
	
	 |---- g
	
	
	
	
	Total
	
	
	
	
Encontre a correspondência entre as medidas e os seus respectivos valores, preencha a coluna.
	Dados
	
	Tipos de dados
	1
	Media
	
	
	178.764,90
	2
	Mediana
	
	
	1.860
	3
	Desvio Padrão
	
	
	2.550
	4
	2ºQuartil
	
	
	2.170,85
	5
	3ºQuartil
	
	
	2.700
	6
	1ºQuartil
	
	
	2.100
	7
	Variância
	
	
	422,81
	8
	Moda
	
	
	2.100
Analise o gráfico seguinte e encontre os valores da mediana, 1º quartil, 3º quartil, valores mínimos e máximos.
	1) Mínimo
	
	
	2) Máximo
	
	
	3) 1ºQuartil
	
	
	4) 3ºQuartil
	
	
	5) Mediana
	
	
	
	
	
A
B
variável
elemento
caso
obs
2º Quartil
Valor mínimo
Valor máximo
1º Quartil
3º Quartil
Dra Filomena B Mello – CFE: 9262-A
Page � PAGE \* MERGEFORMAT �21�
_1328978770.unknown
_1361633880.unknown
_1361633934.unknown
_1328979305.unknown
_1328981858.unknown
_1327650514.unknown
_1328978260.unknown
_1328532487.unknown
_1327650276.unknown

Continue navegando

Outros materiais