BIOESTATÍSTICA - UNIDADE 4

Laisa Taliane

08/04/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Bioestatística I

12.747 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

- -1
BIOESTATÍSTICA
ESTATÍSTICA INFERENCIAL
Diogo Tavares Cardoso
- -2
Olá!
Você está na unidade . Conheça aqui a definição sobre probabilidade e como calculá-la,estatística inferencial
tanto para eventos dependentes quanto independentes. Entenda, ainda, as distribuições gaussianas e suas
definições e a distribuição dos dados, além do intervalo de confiança ou aqueles dois pontos percentuais para
mais ou para menos nas pesquisas eleitorais. Saiba o que significa o teste de hipótese e como podemos utiliza-los
na bioestatística.
Bons estudos!
- -3
1 Probabilidade
A probabilidade é muito utilizada quando jogamos jogos de carta ou em jogos de azar, contudo, na bioestatística,
utilizamos quando precisamos de dados para estimar a probabilidade de certo evento. Algumas vezes nos
perguntamos “qual a probabilidade de ficarmos gripados?”, outras vezes nos perguntamos “qual a probabilidade
de ter chuva de granizo hoje?” ou “qual a probabilidade de uma pessoa sedentária ter problemas cardíacos?”.
Para responder estas e outras perguntas precisamos de alguns dados para saber como estimar a probabilidade
sobre determinado evento.
- -4
1.1 Definição de probabilidade
Alguns elementos relacionados à bioestatística fazem parte do nosso cotidiano. Certamente, se alguém perguntar
a você o que é probabilidade, você vai saber o que significa esta palavra, porém, se pedirem para você explicar o
que é, você saberia? A probabilidade, por definição, é um ramo da matemática no qual é possível calcular a
chance que ocorra determinado evento (TAYLOR; BLAIR, 2013). Com o uso da probabilidade, é possível saber
qual a chance de se ter cara ou coroa ao lançar uma moeda, por exemplo. A probabilidade de que saia cara é de
e a probabilidade de sair coroa é de . Outra maneira na qual podemos representar é falando que a
probabilidade de sair cara ou coroa ao lançar a moeda pra cima é de 0,5 respectivamente (FARBER; LARSON,
2015) (VIEIRA, 2011).
O exemplo da moeda é algo bastante comum e clássico em diversas literaturas sobre o tema, porém, vamos
aprofundar um pouco mais. Imagine que você colocou 10 bolas dentro de um balde, sendo 2 bolas verdes e 8
bolas pretas. Para que você possa calcular a probabilidade de se retirar uma bola verde do balde, é preciso de
algumas premissas: ou seja, ao escolher a bola, a escolha não deve haver nenhum viés na escolha da bola,
deve ser feita de maneira aleatória. Para garantir isto, devemos sacudir o balde com bastante energia e, com os
olhos fechados, colocar a mão dentro do balde para, assim, retirarmos uma bola qualquer de maneira aleatória.
Com estas informações, podemos fazer a seguinte pergunta: qual a chance (probabilidade) que a bola retirada
seja verde? Concordamos que a chance de retirar uma bola verde do balde é de 0,2, porém qual a definição de
probabilidade nós utilizamos para chegarmos a esta resposta? Chegamos a esta resposta utilizando o número de
bolas verde, dividindo-o pelo número de bolas totais presente no balde.
Tendo isso em mente vejamos como Vieira (2011, p 163) traz uma definição clássica do que é probabilidade:
Se forem possíveis n eventos mutuamente exclusivos e igualmente prováveis e , se m desses eventos
tiverem a característica que chamaremos A, a probabilidade de que ocorra um evento com a
característica A é indicada por P(A) e é dada pela razão m/n.
Podemos, então, representar a probabilidade pela seguinte formula:
Esta formula é lida da seguinte maneira, () pode ser lido como “a probabilidade de...”. No nosso exemplo,P
podemos ler como: . é o número de eventos que atendea probabilidade de retira uma bola verde do balde NA
ao critério desejado (bolas verdes) e é o número de eventos totais (todas as bolas) (TAYLOR; BLAIR, 2013).N
A probabilidade, na bioestatística e, principalmente, na área da saúde, estima a frequência relativa sobre os
eventos que foram obtidos de uma série de dados. Ao estimar a probabilidade de ocorrer determinado evento, a
- -5
probabilidade é dada como relativa, como podemos observar na tabela sobre “Frequência defrequência
pacientes infectados com protozoários intestinais”, onde podemos observar a frequência relativa dos infectados
por algum protozoário intestinal e a frequência acumulada.
Tabela 1 - Frequência de pacientes com infectados protozoários intestinais.
Fonte: Oliveira et al., 2018
#PraCegoVer: na imagem, vemos uma tabela de frequência de pacientes infectados por protozoários intestinais,
com 4 colunas, sendo, respectivamente, de protozoários intestinais, frequência, frequência relativa e frequência
relativa acumulada.
Neste estudo, 256 pessoas foram investigadas para saber se estavam infectados por algum protozoário
intestinal. Com base nessa amostra, podemos dizer que a probabilidade de uma pessoa, que reside nesta
localidade, de estar infectado por algum protozoário intestinal é de 0,445.
A tabela “Frequência de pacientes infectados por Schistosoma mansoni e protozoários intestinais” mostra uma
amostra composta por duas doenças associadas, composta por um grupo de 256 pessoas. Essa população
amostral é composta por pessoas com parasitose intestinal (A), sem parasitose intestinal ( , com S. mansoni) (B)
e sem S. mansoni ( ou indivíduos com mais de uma dessas característica).
Fique de olho
As probabilidades podem ser escritas como frações, números decimais (entre zero e 1) ou
percentagens. Os números decimais podem ser arredondados, quando necessário, para duas
ou três casas decimais. Para expressar, em porcentagem, basta multiplicar o valor decimal por
100. Nos exemplos, as probabilidades foram escritas como frações ou números decimais.
- -6
Tabela 2 - Frequência de pacientes infectados por Schistosoma mansoni e protozoários intestinais.
Fonte: Oliveira et al., 2018
#PraCegoVer: na imagem, vemos uma tabela de pacientes infectados por e protozoáriosSchistosoma mansoni
intestinais.
Vamos a um exemplo prático. Observe a tabela onde apresenta a “Frequência de pacientes infectados por
e protozoários intestinais em que, nessa localidade, a probabilidade de estar infectadosSchistosoma mansoni ”
por é de 0,465 ou 46,4%. Agora, vamos calcular a probabilidade de umaSchistosoma mansoni
pessoa estar alguma infecção por protozoários intestinais, que é de ou 44,5%.
Nesta tabela, cada unidade apresenta a frequência e, nos cantos, a soma de cada categoria, com um total no
universo de amostra de 256 indivíduos.
- -7
1.2 Eventos independentes
Não é raro ouvir alguém dizer que algo não tem nada a ver com outra coisa, ou que não tem nada a ver ter
chovido hoje e eu ter ganhado na loteria. Neste exemplo, temos uma condição independente.
Para termos um evento independente, precisamos saber se um evento é capaz de influenciar outro. Alguns
exemplos podem ser claros, mas, no nosso exemplo, podemos dizer que estar infectado por parasitose intestinal
e são eventos independentes ou não? Para sabermos se um evento é independente ou não, podemosS. mansoni
utilizar a seguinte equação: , logo .
Assim, para calcularmos se os eventos são intendentes, conforme Ferber e Larson (2015, p. 142), primeiro
calcule a probabilidade do evento B, P(B). Então, calcule a probabilidade de B, dado A, P(B|A). Se os valores
Se , então .forem iguais, os eventos são independentes. P(B) ≠ P(B|A) A e B são eventos dependentes
Sabendo disto, temos a seguinte formula e, para este caso:
Como os resultados não são iguais, temos que o fato de ocorrer A não muda a probabilidade da ocorrência de B.
Assim, os eventos são independentes
Fique de olho
Não confunda eventos independentes com eventos mutuamente exclusivos. Mutuamente
exclusivos é considerado quando um evento ocorre e outro não pode ocorrer. Um exemplo é
que não se pode ter cara e coroa ao mesmo tempo. Assim, esses eventos são mutuamente
exclusivos e não são eventos independentes. A probabilidade de sair cara muda ao sair coroa.
- -8
1.3 A regra da multiplicação ( )e
Nós podemos utilizar uma regra paraidentificar que dois eventos podem ocorrer em sequência, que chamamos
de regra da multiplicação, dada pela equação:
Nós também podemos calcular as probabilidades que envolvem ambas as doenças. Qual a probabilidade
(chance) de escolher uma pessoa aleatória com parasitose intestinal (A) e com (B)? Com isto, temos aS. mansoni
seguinte formula . Então, podemos ler que a probabilidade de selecionar um
paciente que com parasitose intestinal (A) com (B) é de ou .e S. mansoni 0,207 20,7%
Assim, podemos determinar, também, a probabilidade de uma pessoa não estar com nenhuma doença com:
. Podemos, então, falar que, nesta população, a chance de selecionar alguém sem
nenhuma doença estudada (parasitose intestinal e ) é de ou S. mansoni 0,297 29,7%.
No exemplo que estamos utilizando, os eventos observados são entre si, porém, se os eventosindependentes
forem , a fórmula é um pouco mais elaborada e é dada pela seguinte equação: dependentes
Para podermos calcular, vamos utilizar os seguintes dados disponível na tabela 2, onde temos alunos que se
inscreveram em duas residências, da mesma instituição.
Tabela 3 - Frequência de alunos de medicina que são aprovados em suas residências médicas.
Fonte: Elaborado pelo autor, 2020
#PraCegoVer: Na imagem, vemos uma tabela de frequência de alunos de medicina que são aprovados em suas
residências médicas.
Observa-se que os dados são dependentes, em que:
Assim, , o que característica que os valores são dependentes. Sendo assim, utiliza-de a equação:
, onde . Desta forma, temos a probabilidade de 0,45 ou 45% de
aprovação nas residências em oftalmologia e clínica médica.
- -9
Assista aí
https://fast.player.liquidplatform.com/pApiv2/embed/746b3e163a5a5f89a10a96408c5d22c2
/3cbe0dfeca43ca9ded4b61ac7e8fa69a
1.4 Ou
Qual a probabilidade de selecionar um caso que uma pessoa aleatória tenha parasitose intestinal (A) está com ou
(B)? Neste exemplo, temos como critério qualquer uma das doenças ou ambos, e pode serS. mansoni
representado da seguinte maneira: .
Neste caso, a probabilidade de ocorrer (A) (B) pode ser dado na probabilidade de ocorrer P(A) + P(B) – Pou
(AB). Nesta condição, é retirado a probabilidade de P(AB), visto que ele é contado duas vezes. Assim, temos a
seguinte equação: porém, quando os eventos são mutuamente exclusivos a P(A) ,
P(B) é dado pela adição de P(A) + P(B), que é dado pela seguinte equação: ou .
Com isto, temos a probabilidade de e podemos interpretar este resultado
como ou %. de probabilidade de estar com parasitose intestinal com .0,703 70,3 ou S. mansoni
https://fast.player.liquidplatform.com/pApiv2/embed/746b3e163a5a5f89a10a96408c5d22c2/3cbe0dfeca43ca9ded4b61ac7e8fa69a
https://fast.player.liquidplatform.com/pApiv2/embed/746b3e163a5a5f89a10a96408c5d22c2/3cbe0dfeca43ca9ded4b61ac7e8fa69a
- -10
1.5 Probabilidade condicional
A probabilidade condicional é baseada em “qual a chance um evento ocorre sendo que outro evento já tenha
ocorrido”. Vamos imaginar que a probabilidade de chover na cidade de São Paulo é diferente da probabilidade de
no deserto do Saara. A probabilidade de chover depende da primeira condição.
A probabilidade condicional é definida por Vieira (2011, p. 170) como: “a probabilidade de ocorrer determinado
evento sob uma dada condição.” Farber e Larson (2015, p. 141) definem a probabilidade condicional como: “a
probabilidade de um evento ocorrer, dado que outro evento já tenha ocorrido.” Em outras palavras, qual a
probabilidade de um evento ocorrer sendo uma determinada condição. A probabilidade condicional pode ser
expressa pela seguinte formula , onde podemos ler da seguinte maneira: qual a probabilidade de B,
dado A.
Outro exemplo em que nos habituamos a observar probabilidade condicional, principalmente na área da saúde,
é: “quem possui a de obeso, possui uma probabilidade maior de ter uma de doençacondição condição
cardíaca”. Outro exemplo comum é: a de motorista embriagado aumenta a probabilidade dacondição condição
de acidente no trânsito em 3 ou 4 vezes. Diversas pesquisas são feitas para buscar conhecer quais probabilidades
são modificadas quando uma condição é imposta.
Voltando ao nosso exemplo apresentado na tabela 2, sobre a frequência de pacientes infectados por Schistosoma
e protozoários intestinais, qual a probabilidade que uma pessoa com parasitose intestinal tambémmansoni
esteja infectada pelo Schistosoma mansoni?
Nós podemos resolver a questão da seguinte maneira: , ou seja, a probabilidade de uma pessoa já
infectada por alguma parasitose intestinal e também por é de 0,465 ou simplesmenteSchistosoma mansoni
46,5%.
Fique de olho
No universo amostral de 256 pacientes, com a probabilidade condicional, houve uma redução
para 114 pacientes. Como a probabilidade condiciona considera um evento ocorre após outro
evento, temos o primeiro evento a parasitose intestinal e o segundo evento a infecção por S.
mansoni. Nesse universo amostral, apenas 114 pacientes tinham alguma parasitose intestinal,
sendo esse o nosso n amostral.
- -11
Outro exemplo que podemos utilizar sobre a probabilidade condicional é pensando se a probabilidade de estar
com alguma parasitose intestinal é igual a probabilidade de estar infectado por .S. mansoni
Para descobrir isto, pensaremos o seguinte: Em ambos os exemplos temos um universo amostra de 256
pacientes e, em ambos os casos, a probabilidade de estar infectado por é de e a probabilidadeS. mansoni 0,445
de estar infectado por protozoários é de Agora, podemos ver a relação entre as duas estimativas: 0,465.
.
Assim, podemos afirmar que a probabilidade de ter parasitose intestinal é um pouco maior que a probabilidade
de estar infectado por , S. mansoni ou podemos dizer que a probabilidade de estar infetado por parasitose
intestinal 1,04 vezes maior que a probabilidade de estar infectado por S. mansoni.
Se o valor apresentado fosse 2,4, poderia dizer que a probabilidade de uma pessoa ter sido infectada com
parasitose intestinal seria 2,4 vezes maior, ou teria 2,4 vezes mais chance de encontrar uma pessoa infectada por
parasitose intestinal que S. mansoni.
- -12
2 Tipos de distribuições
Para conferir as informações de distribuição de probabilidade, é importante conhece-la, para saber como os
dados são distribuídos. Isto ajudará você a saber como explorar esta informação. Os dados podem ter algumas
distribuições, sendo ou ou ou .distribuição normal paramétrica distribuição não normal não paramétrica
Além disso, a distribuição normal pode ser e .simétrica assimétrica
- -13
2.1 Tipos de distribuição normal
Distribuição normal uniforme (ou retangular): quando tem apenas um valor em toda a distribuição. Um
exemplo onde podemos encontrar uma distribuição uniforme é quando vamos a uma sala de aula. Nela, todos os
alunos têm a mesma idade ou elas são praticamente iguais. O gráfico de distribuição uniforme nos permite
identificar isso. No gráfico abaixo, observamos como a linha é uniforme (FARBER; LARSON, 2015) e (VON
HIPPEL, 2005).
Figura 1 - Distribuição uniforme.
Fonte: Elaborado pelo autor, 2020
#PraCegoVer: Na imagem, vemos um gráfico com barras e uma linha passando horizontalmente em suas
extremidades.
A distribuição uniforme é considerada simétrica quando a e são . Neste caso,média mediana valores iguais
ambos são 9.
Distribuição normal assimétrica: quando, no gráfico de frequência, ocorre uma cauda, o que permite que ela
se alongue para um dos lados. A distribuição pode ser ou :assimétrica positiva negativa
Negativa: quando a cauda alonga para a esquerda.
Positiva: quando a sua cauda alonga para a direita.
No gráfico “Distribuição assimétrica à esquerda (negativo) e à direita (positivo)” é possível ver a cauda das
distribuições:
- -14
Fonte: Elaborado pelo autor, 2020
#PraCegoVer: Na imagem, vemos um gráfico com barras que diminuem de tamanho da esquerda para direita,
com uma linha horizontal em suas extremidades.
O que determina um gráfico ter uma distribuiçãonormal assimétrica é que a e são média mediana valores
entre si.diferentes
• Distribuição normal simétrica
Quando uma linha vertical pode ser desenhada pelo meio do gráfico da distribuição e as metades
resultantes são imagens espelhadas. Em termos práticos, um espelhamento aproximado pode
caracterizar uma distribuição simétrica.
•
- -15
2.2 Distribuição normal simétrica, gaussiana ou paramétrica
A curva normal também é conhecida como curva de Gauss, e é amplamente utilizada em todas as áreas do
conhecimento porque o conceito de normalidade ocorre naturalmente em praticamente todas as medições
naturais. Para os dados, quando seguem uma distribuição normal, são necessárias algumas características como:
que seja uma variável continua e esta variável não deve ser dicotômica; que a proporção dos dados para toda a
população não estejam disponíveis, fazendo a necessidade de ter um modelo estatístico cujo será uma amostra
que represente toda esta população (VIEIRA, 2011). Na bioestatística, as variáveis quantitativas contínuas, que
seguem um padrão em suas distribuições de frequências, podem ser vistas como distribuições de probabilidade
e suas aplicações têm enorme utilidade cientifica e prática. A curva normal é caracterizada por dois parâmetros,
sendo ela a e o . Dessa forma é possível imaginar a existência de infinitas curvas normais,média desvio-padrão
tendo em conta variações, tanto da média como na variância comumente, encontradas em variáveis continuas
(SAMPAIO, 2015).
- -16
2.3 Curva normal reduzida
É também conhecida como distribuição normal reduzida, distribuição normal padronizada, escore padrão ou,
ainda, estatística . O uso da curva normal reduzida surgiu em decorrência da possibilidade de existência de umaZ
série infinita de curvas normais, representando a distribuição normal de probabilidade, onde cada uma é
definida pelos valores que a média e o desvio-padrão podem assumir para cada caso em particular. Essa
particularidade faz surgir a distribuição de referência, aqui denominada distribuição normal padronizada, cuja
característica fundamental é assumir que e o . Como resultadoa média é igual a zero desvio-padrão é igual a 1
dessa transformação aplicada a cada valor de , temos o surgimento de uma nova variável, que é denominada .x Z
Essa variável mede quanto um determinado valor de afasta da média, em unidades de desvio-padrãox
(SAMPAIO, 2015).
É possível ver na figura que, se o valor coincide com a média, seu escore é zero. A variação estatística ocorreZ
comumente no intervalo de ±3 desvio-padrão, onde, neste intervalo, incluem praticamente toda a amostra
estudada, mais precisamente 99,74%.
O cálculo da estatística , ou escore padrão, ou curva normal reduzida, é dado pela expressão:Z
Onde:
Z: afastamento dos valores de x em relação à média em número de desvio padrão;
X: valor de qualquer variável aleatória.
: média da distribuição.
: desvio-padrão da distribuição.
Quando Z=1, a área entre este valor e a média é de 0,3413 ou 34,13%. Já a área entre Z=±1 é de 0,6826 ou
68,26%. Suponhamos que, em uma distribuição de glicose plasmática em jejum, de homens com idade entre 30 e
39 anos, encontrou-se uma média ( ) de 100mg/dl e um desvio-padrão ( ) de 15mg/dl. Qual a proporção de
pessoas com glicose plasmática entre 100mg/dl e 120mg/dl?
Fique de olho
Qual a diferença entre x e z? A variável x é conhecido como resultado bruto, cujo representa o
valor da distribuição normal não reduzida ou não padrão. Já o valor de z representa o valor da
distribuição normal reduzida ou padrão (FARBER; LARSON, 2015)
- -17
Para este caso basta aplicarmos a equação , onde teremos:
Agora, podemos encontrar, na tabela da curva normal, para o intervalo z=0 e z=1,33, que é igual a 0,4082 ou
40,82%.
Tabela 4 - Distribuição de frequência normal acumulada de z (área sob a curva norma de 0 a z).
Fonte: SAMPAIO, 2015
#PraCegoVer: na imagem, vemos uma tabela de distribuição de frequência normal acumulada de Z, com várias
colunas e linhas, cada uma com um número inserido.
- -18
Assista aí
https://fast.player.liquidplatform.com/pApiv2/embed/746b3e163a5a5f89a10a96408c5d22c2
/42b6a155e3539fb5c86a15bb35c184e2
https://fast.player.liquidplatform.com/pApiv2/embed/746b3e163a5a5f89a10a96408c5d22c2/42b6a155e3539fb5c86a15bb35c184e2
https://fast.player.liquidplatform.com/pApiv2/embed/746b3e163a5a5f89a10a96408c5d22c2/42b6a155e3539fb5c86a15bb35c184e2
- -19
3 Testes estatísticos
Os testes estatísticos trazem uma análise inferencial sobre determinado evento. Assim, ele retira o viés subjetivo
do analisador e, qualquer um que analisar o conjunto de dados, poderá obter a mesma resposta, desde que se
tenha a mesma pergunta.
- -20
3.1 Intervalo de confiança
Um problema comum nas análises estatísticas é estimar parâmetros que possam auxiliar na caracterização de
uma variável. Como exemplo, podemos citar a porcentagem de pacientes que se recuperam em um certo
tratamento ou o tempo médio que demanda um anestésico para ter o efeito desejável. Os intervalos de confiança
constituem uma série de métodos que permitem obter conclusões acerca de uma população, a partir de uma
amostra representativa. O intervalo de confiança é um meio de de maneiraexpressar a precisão estatística
útil, sob o ponto de vista estatístico. É comum pensar que o intervalo de confiança é a probabilidade e que o
verdadeiro parâmetro que estamos buscando esteja dentro desse intervalo. Os intervalos de confiança são úteis
porque definem um limite superior e inferior, que são consistentes com os dados do nosso estudo, porém, não
nos informam de nenhuma probabilidade de se achar onde está o verdadeiro parâmetro que buscamos. Uma das
utilidades dos intervalos de confiança é dar uma ideia da da dispersão ou da variabilidade dasamplitude
estimativas obtidas pelas amostras. Um intervalo de confiança muito grande implica na suspeição de que o
resultado obtido é de ou de pouca credibilidade. Já intervalos de confiança cujas amplitudes debaixa acurácia
variação são pequenas possuem e credibilidade (FARBER; LARSON, 2015) (TAYLOR; BLAIR,maior acurácia
2013).
O intervalo de confiança deve conter uma probabilidade de erro, que surge do conhecimento do modelo de
distribuição de frequência do fenômeno que se deseja investigar. Geralmente, os modelos biológicos se aplicam à
distribuição de normalidade, que exige o conhecimento da variância e, por consequência, do desvio-padrão.
Universalmente, os intervalos de confiança usados em pesquisas médicas utilizam coeficientes de 95% ou 99%,
os quais nos dão a probabilidade com que o método resultará em uma resposta correta e compatível com a
expectativa do pesquisador. Um coeficiente de 95% permite concluir que, se repetimos 100 vezes a mesma
pesquisa, a margem de erro é de apenas 5% ou, em outras palavras, um erro a cada 20. Isto é o que se deseja em
95% do intervalo de confiança e que o verdadeiro valor da população não esteja dentro do intervalo de confiança
em apenas 5%.
O nível de significância (1-α) pode ser igual a 99%, 95%, 90%, entre outros. Comumente, nos artigos científicos é
comum observar que o nível de significância utilizado é de 95% ou α é igual a 0,05. Ao estimarmos o parâmetro,
podemos estar utilizando uma daquelas amostras dentre as 5% que geram estimativas intervalares, com erro
amostrais acima do desejável. Um intervalo de confiança de 95% de segurança somente é válido quando todos
. Quando este princípio é violado, provoca oos integrantes da amostra são independentes uns dos outros
erro amostral, que compromete a utilização do intervalo de confiança para inferências dos parâmetros
populacionais (SAMPAIO, 2015).
- -21
Na curva normal, é sabido que 95% dos valores se encontram entre a média ±1,96, vezes o desvio-padrão: µ±1,
96σ=0,95. Ao aplicarmos esta propriedade, obteremos a probabilidade de que um valor qualquer da distribuição
se encontre entre estes dois valores, com 95% de chance de acerto, sendo, assim,representado pela seguinte
equação: .
Para podermos calcular o intervalo de confiança da média, vamos supor que observamos, em um hospital, o
tempo de internação para um certo tipo de intervenção médica. Assim, o que se deseja é estimar o tempo média
(µ) sobre a população para a qual não se tem acesso. Para viabilizar o estudo, colheu-se uma amostra de
tamanho 100 (n) dos pacientes que já se submeteram ao procedimento médico, cujo o tempo de internação se
que saber. A média amostral encontrada foi de 4,53 dias, com o desvio-padrão de 3,68 dias. Deseja-se nível de
confiança de 95%. O intervalo de confiança será o seguinte:
Assim, temos, com 95% de segurança, que o tempo médio de internação pode varia de 3,81 dias, sendo este o
limite inferior, até 5,25 dias, como limite superior. A expectativa é de que a média verdadeira para o tempo de
internação esteja compreendida entre esses dois valores.
Caso o valor do intervalo de confiança contenha o valor de zero, podemos dizer que não há significância entre os
testes ou simplesmente podemos dizer que a observação não traz verdade.
- -22
3.2 Teste hipótese
Hipóteses são ferramentas científicas que direcionam qualquer procedimento investigativo da natureza. Uma
hipótese é uma , que despertam o interesse dospresunção antecipada da relação de duas ou mais variáveis
pesquisadores e, portanto, a explicação plausível para a indagação posta diante de um problema de natureza
cientifica ou não. Na aplicação de uma hipótese há, como pressupostos básicos sobre o conhecimento teórico dos
problemas levantados e suas reflexões críticas, eventuais respostas às indagações formuladas. Uma hipótese
pode ser considerada também uma condição ou princípio de que ela supõe, a fim de sua causa lógica e verificar
sua validade. É uma tentativa de análise geral formada sobre o fenômeno na observação.
Teoricamente, há duas condições inerentes às hipóteses científicas: . Deveser invariável e de caráter universal
ser invariante na medida em que a relação formulada não altera com o tempo e o caráter universal deve ser
verdadeiro para um número indefinido de indivíduos, ou para grandes conhecimentos. Estas exigências,
obviamente, oferecem certa rigidez e hipóteses inflexíveis. Frequentemente, não são usadas com o conhecimento
científico evolutivo. Como as hipóteses, uma vez bem formuladas, contribuem para o avanço do conhecimento,
desde que sejam bem fundamentadas, permitindo aceitações ou exclusões, com margens de erros reduzidas.
As hipóteses e .não devem ser indefinidas nem conter erros semânticos especificados
Devem e possibilitar sua confirmação ter reprodutibilidade confiável.
Do ponto de vista estatístico, as hipóteses são de duas naturezas: Uma hipótese nula,nula ou alternativa.
simbolizada por H0, é aquela que deseja testar à prova. Uma hipótese está associada a variações entre
proporções. Outra hipótese nula que estabelece igualdade de médias pode ser aplicável a três procedimentos
cirúrgicos para tratamento de uma mesma patologia. A hipótese de nulidade (H0) seria a de que não há
diferença entre os três tipos de intervenção, ou, analogamente, que os três procedimentos cirúrgicos
possibilitam o mesmo tempo de recuperação.
Ainda como exemplo de hipótese nula, pode-se considerar que os níveis séricos de colesterol entre homens e
mulheres não diferem entre si, o que implica dizer que não há relação entre os níveis de colesterol e sexo dos
pacientes. Se a hipótese é nula após a aplicação de testes estatísticos compatíveis com a estrutura dos dados, se
revela inaceitável e a hipótese alternativa (H0, ou HA) é aceita. Vê-se que a hipótese alternativa surge quando a
hipótese de nulidade é rejeitada.
Como os testes de hipóteses são conjecturas de probabilidades, estão, portanto, sujeitos a erros, que decorrem
de amostragens insuficientes, de metodologias analíticas inadequadas e não compatíveis com a distribuição dos
dados e outros fatores circunstanciais inerentes às pesquisas. A literatura estatística qualifica os erros
decorrentes das hipóteses em dois tipos: erro tipo I, também chamado de alfa, (α), ou, quando a hipótese
- -23
A probabilidade de se cometer esse erro é denominado α.nula é rejeitada, mas, no entanto, ela é verdadeira.
Obviamente, deseja-se um valor pequeno para a, comumente da ordem de 0,01 (1%) ou 0,05 (5%). α é também
conhecido como nível de significância. Por exemplo, α=0,05 significa que a hipótese nula é rejeitada em apenas
cinco chances dentre cem, quando deveria ser aceita. Ou seja, temos 95% de confiança de que a formulação da
hipótese de nulidade está correta. Em outras palavras você pode dizer que esta pode estar errada apenas
O outro erro é também chamado de β, que ocorre em 5% das vezes ao rejeitar a hipótese nula. o tipo II,
quando a hipótese nula a despeito de ser falsa é aceita como verdadeira. A probabilidade de se cometer
(SAMPAIO, 2015). Os testes de hipóteses estão resumidos naesse erro é conhecido como erro tipo II ou β
tabela abaixo:
Fonte: Elaborado pelo autor, 2020
#PraCegoVer: Na imagem, vemos uma tabela de erros associados aos testes de hipóteses.
Obviamente, toda pesquisa teria, como meta estatística ideal, minimizar α e β simultaneamente, mas é bastante
improvável que isto ocorra, visto que α e β são negativamente correlacionados. α e β só podem ser minimizadas
com aumento do tamanho amostral, o que frequentemente é inviável. A expressão 1-β corresponde ao poder do
teste estatístico, isto é, a potência do teste. Mede a probabilidade de rejeitar a H0 quando esta é falsa e indica a
probabilidade de tomada de decisão arreta baseada na hipótese alternativa.
Para a tomada de decisão, envolvendo a aplicação dos testes de hipóteses nas pesquisas médicas e biomédicas,
os seguintes passos devem ser adotados:
Estabelecer hipótese nula (H0);
Estabelecer a hipótese alternativa (H1);
Escolher o nível de significância (α) - comumente adota-se α =0,01; 0,05. O valor de a é critério a ser definido pelo
pesquisador;
Selecionar a técnica estatística adequada e mais compatível com a estrutura dos dados. (testes t, Z, Anova, etc.);
Estabelecer a região crítica (testes unilateral e bilateral);
Calcular a estatística do teste definido em d.
- -24
Conclusão: aceitar H0 se o teste estatístico estiver dentro da sua área de aceitação; ou rejeitar se o valor da
estatística estiver fora dos limites de aceitação da H0.
A aceitação ou rejeição da H0 depende do nível de significância (α) previamente fixado (habitualmente 0,01 ou
0.05), confrontando-o com o valor extraído do teste estatístico adequado para a estrutura dos dados. Se o valor
correspondente ao teste estatístico é menor do que aquele do nível de significância, aceita-se H0. Em caso
contrário, rejeita-se H0 e, obviamente, aceita-se H1.
Se os dados não batem com a hipótese nula, a diferença é dita como estatisticamente significante, porém, se os
dados não sustentam H0, é comum rejeitar ou, em caso contrário, aceita-la. Essa decisão, de tudo ou nada,
raramente se aplica às pesquisas biomédicas ou biológicas (BLAND, 2000). Nesse caso, é preferível dizer que não
temos como rejeitar H0 ou que falhamos em rejeitar H0.
- -25
3.3 Valor p (“p- ”)value
O valor p é uma medida que quantifica a evidência que dispomos contra a hipótese nula. Quanto menor o valor p,
maior é a evidência contra a hipótese nula. O valor p é amplamente conhecido e a literatura cientifica é farta em
citá-lo. Na estatística, o valor p, ou "p- ", é conhecido como nível descritivo e está diretamente associado aosvalue
testes de hipóteses. Nas pesquisas cientificas, as hipóteses são elaboradas pelo pesquisador tendo como
perspectiva a obtenção de respostas plausíveis e razoáveis para fenômeno que se quer esclarecer. Deseja-se
testar a hipótese nula contra uma hipótese alternativa obtida de um conjunto de dados ou observações. A
hipótese alternativa é aquela que esperamos ser verdadeira. Se a hipótese nula é falsa é, portanto, rejeitada. Nãopodemos provar que a hipótese alternativa é verdadeira, porém podemos demonstrar que ela é mais plausível
do que a hipótese nula, fornecida pelos dados. Esta demonstração é, usualmente, expressa em termos de
probabilidade ("p- ") que quantifica a força da evidência contra a hipótese nula e a favor da hipótesevalue
alternativa.
Obviamente, esses pontos de corte são arbitrários e, por isso, não são consensuais. A prática mais difundida nos
artigos científicos é arbitrar valores de p iguais ou menores do que 0,05 ou 0,01, previamente fixados pelos
pesquisadores e conhecidos como valores de α. Como regra geral, ao se usar um valor fixo de α, tem-se duas
opções conclusivas: se p ≤α = ; se p>α= .rejeita-se a H0 aceita-se a H0
A interpretação do valor p merece especial cautela. Por exemplo, se o valor p é 0,03 significa que há 3% de
chance de observar a diferença, tão grande como se as médias de duas populações fossem idênticas. Há a
tentação de concluir que há 97% de chance de que a diferença observada reflita a diferença real entre
populações e 3% de chance de que a diferença é devida ao acaso. Esta interpretação é incorreta. O que se pode
afirmar é que amostras aleatórias extraídas de populações idênticas conduzem a uma diferença menor do que a
observada em 97% dos experimentos e maior do que você observou em 3% dos experimentos. “Calcular o p-
valor é extremamente difícil e isso só é feito, hoje em dia, usando programas de computador” (VIEIRA, 2011, p.
251).
Assista aí
https://fast.player.liquidplatform.com/pApiv2/embed/746b3e163a5a5f89a10a96408c5d22c2
/fefd2529b7ab30a08fdb75a79baf2c2c
https://fast.player.liquidplatform.com/pApiv2/embed/746b3e163a5a5f89a10a96408c5d22c2/fefd2529b7ab30a08fdb75a79baf2c2c
https://fast.player.liquidplatform.com/pApiv2/embed/746b3e163a5a5f89a10a96408c5d22c2/fefd2529b7ab30a08fdb75a79baf2c2c
- -26
é isso Aí!
Nesta unidade, você teve a oportunidade de:
• conhecer a probabilidade e suas definições;
• calcular a probabilidade entre eventos dependentes e independentes;
• aprender os tipos de distribuições de dados;
• reconhecer o que é intervalo de confiança e a sua aplica;
• saber o que são teste de hipótese;
• identificar o que significa o valo p ou p-value.
Referências
BLAND, J. M. . 3 ed. Oxford University Press, 2000.An Introduction to Medical Statistics
FARBER, E.; LARSON, R. . 6. ed. São Paulo: Pearson Education do Brasil Ltda, 2015.Estatística Aplicada
OLIVEIRA, W. J. et al. Evaluation of diagnostic methods for the detection of intestinal schistosomiasis in endemic
areas with low parasite loads: Saline gradient, Helmintex, Kato-Katz and rapid urine test. PLoS Neglected
, v. 12, n. 2, p. 1–22, 2018.Tropical Diseases
SAMPAIO, I. B. M. . 4 ed. Belo Horizonte: FEPMVZ, Escola deEstatistica aplicada à experimentação animal
Veterinária da UFMG, 2015.
TAYLOR, R.; BLAIR, R. C. . 1 ed. Rio de Janeiro: PEARSON BRASIL, 2013.Bioestatística Para Ciências Da Saúde
VIEIRA, S. . 4 ed. Rio de Janeiro: Elsevier Brasil, 2011.Introdução a Bioestatística
VON HIPPEL, P. T. Mean, median, and skew: Correcting a textbook rule. , v. 13,Journal of Statistics Education
2005.
•
•
•
•
•
•
Olá!
1 Probabilidade
1.1 Definição de probabilidade
1.2 Eventos independentes
1.3 A regra da multiplicação (e)
Assista aí
1.4 Ou
1.5 Probabilidade condicional
2 Tipos de distribuições
2.1 Tipos de distribuição normal
Distribuição normal simétrica
2.2 Distribuição normal simétrica, gaussiana ou paramétrica
2.3 Curva normal reduzida
Assista aí
3 Testes estatísticos
3.1 Intervalo de confiança
3.2 Teste hipótese
3.3 Valor p (“p-value”)
Assista aí
é isso Aí!
Referências