Buscar

Aula 2 Organização dos dados

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
*
Organização de dados:
Tipos de variáveis
Tabelas
Daniel
danielreynaldobr@yahoo.com.br
*
*
Na última aula...
Descrever X Extrapolar
População x Amostra
*
*
Na última aula...
Lições sobre amostra e população
Nossa amostra deve ser representativa da população que queremos estudar.
Uma amostra representativa deve ser tão aleatória quanto possível (i.e., qualquer sujeito na população deve ter igual chance de fazer parte da amostra).
*
*
Outras constatações importantes...
A estatística nos ajuda a extrapolar para uma população da qual nossa amostra seja representativa.
*
*
Outras constatações importantes...
Escolher a amostra não é trivial.
Ao definir a amostra, estamos indiretamente definindo para que população nossos dados são aplicáveis.
Amostras devem ser tão independentes dentro de um grupo experimental como entre os diferentes grupos.
*
*
Introdução à apresentação de dados
Criação de procedimentos para a organização, resumo e descrição de grandes quantidades de dados. 
 Imprescindível para a adequada interpretação dos resultados.
*
*
Introdução à apresentação de dados
Tipos de variáveis
Organização de dados
Tabelas
Gráficos
*
*
Tipos de variáveis
VARIÁVEIS: Características de interesse que variam entre as unidades experimentais (ex: cor / sorologia para HIV / concentração de albumina).
DADOS: Informações sobre estas variáveis (ex: branco / negativo / 3,7 mg/dL).
VARIÁVEL
*
*
Variável Qualitativa
Nominal
Mortalidade após um tratamento
Ordinal
Conceito final em uma disciplina
*
*
Variável Quantitativa
Discreta
Número de filhos
Contínua
Nota em uma avaliação
*
*
Exemplo: questionário estudantil
ID: identificação do aluno
Turma: turma em que o aluno foi alocado – A ou B
Sexo: feminino (1) ou masculino (2)
Idade: idade em anos
Altura: altura em metros
Peso: peso em quilogramas
Fuma: hábito de fumar – Sim ou Não
Toler. Cig.: tolerância ao cigarro – Indiferente (I), Incomoda pouco (P) ou Incomoda muito (M)
Exerc.: horas de atividade física por semana
TV: horas gastas assistindo TV por semana
Op. TV: opinião a respeito da qualidade da programação na TV – Ruim (R), Média (M) ou Boa (B)
*
*
Informações de questionário estudantil – dados brutos
Tente classificar cada variável.
Não deixe de levar em conta sua natureza = use o bom senso!
*
*
Organização de dados
Os dados podem ser organizados em tabelas ou gráficos. 
Embora um certo volume de informação seja perdido quando os dados são resumidos, um grande volume pode também ser ganho. 
Conceitos básicos para montagem e apresentação de dados.
*
*
Tabelas
Distribuição de frequências
Frequência relativa
Frequência acumulada
*
*
Distribuição de frequências
Consiste de um conjunto de classes ou de categorias junto com contagens numéricas (frequências absolutas) que correspondam a cada conjunto de dados. 
*
*
Distribuição de frequências para dados sobre variáveis quantitativas
Necessário dividir os valores das observações em uma série de intervalos não-sobrepostos distintos. 
Frequentemente, os intervalos:
são construídos de modo que o limite inferior e o superior tenham sido selecionados;
apresentam largura igual. 
Com os limites inferior e superior selecionados, o nº. de observações cujos valores estejam dentro da faixa determinada é contado, e os resultados são arranjados na forma de tabela.
*
*
Nota-se na tabela acima que os valores do nível sérico de colesterol variam de 80 até 399 mg/100 ml, com relativamente poucas medidas nas extremidades dos intervalos, e uma grande proporção dos valores situados entre 120 e 279 mg/100 ml.
Por que esse fenômeno acontece? 
*
*
Qual é mais frequente?
*
*
Frequência relativa
A frequência relativa para um intervalo é a proporção do número de observações que nele aparece em relação à frequência total de valores.
Divide-se o número de valores dentro do intervalo pelo número total de valores na tabela (somatório).
A proporção pode se transformar em Frequência Relativa Percentual (fr% ou frp) se multiplicarmos os valores da frequência relativa por 100. 
Úteis para se comparar conjuntos de dados que contenham número desiguais de observações. 
*
*
*
*
Pode-se afirmar que, no conjunto A, a proporção de bolas vermelhas é maior que no conjunto B?
*
*
Frequência relativa acumulada
Valor relativo (ou relativo percentual) do número total de observações que apresentam um valor menor ou igual ao limite superior do intervalo. 
É calculada pela soma das frequências relativas para o intervalo especificado e todos os outros anteriores. 
*
*
*
*
Pontos importantes
As abreviaturas e símbolos devem estar no rodapé da tabela.
A fonte de dados deve ser indicada.
A tabela deve conter um título claro e que seja descritivo. Deve indicar a região e o período de tempo, caso seja aplicável. 
*
*
Sugestão de bibliografia
Pagano M e Gauvreau K. Princípios de Bioestatística. São Paulo: Cengage Learning. 2011.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando