Buscar

Bioestatística (Módulo 1)- Os componentes básicos da Bioestatística

Prévia do material em texto

Modulo 1 
Bioestatística é definida como a aplicação de princípios de 
estatística nas áreas de: 
 Medicina, 
 Saúde publica ou 
 Biologia 
Os princípios da estatística são baseados na: 
 
 
E incluem ferramentas e técnicas para coletar informações ou 
dados e, posteriormente, resumir, analisar e interpretar esses 
resultados. Esses princípios se estendem para que sejam feitas 
inferências e tiradas conclusões de forma adequada, levando em 
consideração a incerteza. 
 aplicada o objetivo é fazer uma inferência sobre 
uma população especifica. 
 é o conjunto de todos os indivíduos sobre os quais 
gostaríamos de fazer afirmação. 
estatística para fazer uma afirmativa da proporção 
desejada. 
subconjuntos da população de interesse. 
 
Quais são os problemas? 
A condução e interpretação apropriadas das aplicações da 
bioestatística requerem atenção a uma série de questões 
importantes. Elas incluem, mas não se limitam às seguintes: 
 Definir claramente o objetivo ou a pergunta da pesquisa. 
 Escolher um projeto de estudo adequado (por exemplo, a 
forma como os dados serão coletados). 
 Selecionar uma amostra representativa e garantir que ela 
seja do tamanho adequado. 
 Coletar e analisar cuidadosamente os dados 
 Produzir medidas ou estatísticas resumidas adequadas. 
 Gerar medidas de efeito ou associação adequadas. 
 Quantificar a incerteza. 
 Explicar adequadamente as relações entre as características. 
 Limitar as inferências à população apropriada. 
 
 
Antes de serem realizadas analises bioestatística, devemos 
definir, explicitamente, a população de interesse. 
A população é o conjunto de todos os indivíduos sobre os quais 
queremos fazer generalizações. 
 
Na maioria das vezes a população é tão grande que é 
impraticável estuda-la toda. Em vez disso, selecionamos uma 
amostra (subconjunto) da população e fazemos inferências 
sobre a população com base nos resultados de uma analise da 
amostra. 
 
 
 
Técnicas para resumir os dados coletados em uma amostra às 
vezes chamada variáveis são classificadas em um dos seguintes 
tipos: 
 Dicotômicas; 
 Ordinais; 
 Categóricas; 
 Continuas. 
 têm apenas duas respostas possíveis. As 
opções de resposta são geralmente codificadas como: 
 
 
 têm mais de duas respostas 
possíveis, mas as opções de resposta são ordenadas e não 
ordenadas, respectivamente. 
 Ordinais: respostas são ordenadas 
 Categóricas: respostas não são ordenadas 
 Os componentes básicos da bioestatística 
Matemática aplicada 
Os indivíduos são selecionados aleatoriamente 
na população para amostra. 
 
SIM NÃO Ou 
 
 
 (variável quantitativa ou medição) assume 
um numero ilimitado de respostas entre valores mínimos e 
máximos. 
 são medidas numéricas calculadas nas amostras. 
 medidas resumidas calculadas sobre as populações. 
 
 
As variáveis dicotômicas assumem uma de apenas duas respostas. 
O sexo é um exemplo de uma variável dicotômica, com as opções 
de resposta “masculino” ou “feminino”, assim como é o status 
atual de tabagismo e diabetes, com as opções de resposta “sim” 
ou “não”. 
As respostas para cada uma dessas variáveis são: 
 
 
 
 Estatística descritiva para variáveis dicotômicas 
As variáveis dicotômicas são frequentemente usadas para 
classificar os participantes como possuidores ou não de uma 
característica especifica, tendo ou não um atributo especifico. 
 
 
 
 
 
 
 
 
 
Gráficos de barras para variáveis dicotômicas 
A exibição gráfica adequada depende do tipo de variável que esta 
sendo analisada. Variáveis dicotômicas são mais bem resumidas 
usando gráficos de barra. 
As opções de resposta (sim/não, presente/ausente) são 
mostradas no eixo horizontal, e as frequências ou frequências 
relativas são plotadas no eixo vertical, produzindo um gráfico de 
barras de frequência ou um gráfico de barra de frequência 
relativa, respectivamente. 
 
SIM NÃO 
As variáveis dicotômicas costumam ser resumidas em 
tabelas de distribuição de frequência. 
 
 
1625/3539= 0,459 X 100= 45,9% total da 
amostra para sexo masculino. 
 
 
 
 
 
 
 
 
As frequências relativas podem, em teoria, ir de 0% a 100%, não 
é necessário sempre dimensionar os eixos de 0% a 100%. 
Histogramas para variáveis ordinais 
Os histogramas são exibições gráficas apropriadas para variáveis 
ordinais. Um histograma difere de um gráfico de barras em uma 
característica importante. O eixo horizontal de um histograma 
mostra as opções de resposta ordenadas distintas da variável 
ordinal. O eixo vertical pode mostrar frequências ou frequências 
relativas, produzindo um histograma de frequência ou um 
histograma de frequência relativa, respectivamente. As barras 
são centradas sobre cada opção de resposta e dimensionadas de 
acordo com as frequências ou frequências relativas, conforme 
desejado. A diferença entre um histograma e um gráfico de 
barras é que as barras em um histograma ficam juntas, não há 
espaço entre respostas adjacentes. 
Variável continua às vezes chamada de variável de medição ou 
quantitativas, assumem um numero ilimitado de respostas 
distintas entre um valor mínimo e máximo teóricos. 
 
HORIZONTAL (Tipos de respostas) 
V
ER
TI
C
A
L 
(f
re
q
u
ên
ci
a)
 
 
Categorias de pressão arterial ordenada 
Fr
eq
u
ên
ci
as
 o
u
 n
u
m
er
o
 d
e 
p
ar
ti
ci
p
an
te
s 
 
O histograma transmite a mensagem de que a 
maioria dos participantes esta nas duas categorias 
inferiores (mais saudáveis) da distribuição. 
 
 
 Estatística descritiva para variáveis continuas 
 
 
Media: o valor “médio”: conjunto de dados numéricos obtido 
somando os valores de todos os dados e dividindo a soma pelo 
número de dados. 
Mediana: o valor “do meio”: ponto central da distribuição, que 
é obtido após todas as observações serem colocadas em ordem 
crescente (ou decrescente), de acordo com o seu valor. 
Moda: o valor “mais comum”: indica o valor que aparece com 
maior frequência na amostra. 
 
 
 
 
 
 
 
 
 Media 
Na bioestatística, o termo "média" é um termo muito geral. 
Existem várias estatísticas que descrevem o valor médio de uma 
variável contínua. O primeiro provavelmente é o mais familiar-a 
média da amostra. A média da amostra é calculada pela soma de 
todos os valores e da divisão pelo tamanho da amostra. A 
média da amostra das pressões arteriais diastólicas é calculada 
da seguinte forma: 
MÉDIA= 
 
 
 
 
 
 
 
 Mediana 
A mediana da amostra é o valor do meio do conjunto de dados 
ordenados, ou o valor que separa os: 
 
 
A mediana é definida como a média dos dois valores do meio no 
conjunto de dados ordenados. 
 62+63+64+67+70+72+76+77+81+81 
Na amostra de n= 10 pressões arteriais diastólicas, os dois 
valores médios são 70 e 72 e, portanto, a mediana é: 
 
 
 
 
 
 
 
 
 
 
 
 Moda 
Moda é definida como valor mais frequente (o numero 
repetitivo). 
 62+63+64+67+70+72+76+77+81+81 
 
 
 Amplitude da amostra 
Em cada coluna da tabela 4-13 possui um numero mínimo e 
numero máximo. O calculo da amplitude se da por: 
 
 
 
Media Mediana Moda 
 
Amostra (população) aqui é n=10 
62+63+64+67+70+72+76+77+81+81 
10 
713 
 10 
= = 71,3 
 
Soma de todos 
os numero 
 
Amostra, 
quantidade a ser 
dividida 
Media 
indicada 
713 
10 
 71,3 
50% superiores dos 
valores 
50% inferiores. 
 (70 + 72) /2 = 71 
 
 
Mediana de cada coluna da tabela 4-13 
Valor repetido é 81 
Valor mínimo – valor máximo 
 
 
 
 
 
 
 
 
 
 
 Desvio padrão da media 
Se todos os valores observados em uma amostra estiverem 
próximos da sua media, o desvio padrão é pequeno (ou seja, 
próximo a zero), e se os valores observados variarem 
amplamente em relação a media da amostra, o desvio padrão é 
grande.Se todos os valores na amostra forem idênticos, o desvio 
padrão da amostra é zero. 
 
 
 
 
 
 
 
 
 
 
- = 
Amplitude seria então 62-81= 19 
 
 
(𝐗−𝐗 ̅) 
Seria o 
numero da 
tabela 
Valor da 
média 
76- 71,3= 4,7 
 
(𝐗−𝐗 ̅) 
𝟐 
Desvio da média 
elevado ao 
quadrado 
 
4,7 (4,7 X 4,7) = 22,09 
2 
A variância da amostra 
 
Soma-se 
tudo 
472,10 
 10-1 
472,10 
9 
=52,46 = 
Desvio padrão da amostra 
 
𝑠=√52,46=7,2 
Estatística chamada amplitude interquartil (AIQ). A amplitude 
interquartil é a diferença entre o primeiro e o terceiro quartil. 
O primeiro quartil indicado como Q1, é o valor no conjunto de 
dados que tem 25% dos valores abaixo dele. O terceiro quartil 
indicado como Q3, é o valor no conjunto de dados que tem 25% 
dos valores acima dele. A AIQ é definida como: 
 
AIQ = Q3− Q1 
 
 
77-64=13 AQ 
 
 
Quando o tamanho da amostra for 9, a mediana é o número do 
meio, 72. Os quartis são determinados da mesma maneira, 
observando as metades inferior e superior, respectivamente. 
Existem quatro valores na metade inferior, assim, o primeiro 
quartil é a média dos dois valores do meio da metade inferior, 
(64 + 67) / 2 = 65,5. A mesma abordagem é usada na metade 
superior para determinar o terceiro quartil, (77 + 81) / 2 = 79. 
Alguns pacotes de cálculo estatístico usam algoritmos 
ligeiramente diferentes para calcular os quartis. Os resultados 
podem ser diferentes, principalmente para amostras pequenas. 
 
 
 
 
 
 
 
 
Os valores atípicos são os valores abaixo de Q1− 1,5 × (Q3− Q1)ou 
acima de Q3+ 1,5 × (Q3− Q1). 
 
 Diagramas de caixa para variáveis continua 
Os diagramas de caixa são uteis para exibir a distribuição de uma 
variável continua. 
 
 
 
 
 
Máximo 
Q3 
Mediana 
Q1 
Mínimo 
 
 
O modelo de distribuição normal é um modelo de distribuição 
de probabilidade importante que é adequado quando uma 
experiência ou processo específicos apresentam um resultado 
contínuo. Existem muitos modelos de probabilidade diferentes 
para resultados contínuos e o modelo adequado depende da 
distribuição do resultado de interesse. O modelo de 
probabilidade normal se aplica quando a distribuição do 
resultado contínuo segue o que chamamos de distribuição 
gaussiana, ou é bem descrita por uma curva em forma de sino. 
 
O eixo vertical reflete a probabilidade de se 
observar cada valor. Note que a curva é mais alta 
no meio, sugerindo que os valores médios têm 
maiores probabilidades ou tendem mais a ocorrer. 
A curva cai acima e abaixo do meio, sugerindo que 
os valores nas duas extremidades são muito menos 
prováveis de ocorrer. 
 
 
 
 
 
Variáveis ordinais e variáveis categóricas possuem um número 
fixo de opções de resposta, as quais podem ser ordenadas ou 
não, respectivamente. Variáveis categóricas e ordinais 
geralmente têm mais de duas opções de resposta, enquanto 
variáveis dicotômicas possuem somente duas opções de 
resposta. Estatísticas resumidas para variáveis categóricas e 
ordinais enfocam principalmente frequências relativas (ou 
porcentagens) ou respostas obtidas para cada categoria. 
Estatística descritiva para variáveis ordinais e 
categóricas
, muitas vezes duas colunas são adicionadas à 
tabela de distribuição de frequência: 
 
Frequência 
acumulada 
Frequência relativa 
acumulada 
 
3533 - 100% 
1206 - X% 
3533x = 1206 x100 
3533x= 120.600 
X= 34,1% 
 são aquelas com duas ou mais respostas 
distintas, sendo que estas não são ordenadas. Alguns exemplos 
de variáveis categóricas mensuradas são: 
 Estado civil, 
 Mão dominante 
 E tabagismo. 
Frequência Frequência 
relativa

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes