noCOes-de-probabilidade-amostragem-e-estimaCAo-2

•

UNISINOS

1

0

1

0

Daniela Kleinhans

08.04.2014

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 9 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Bioestatística I

12.311 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

�PAGE �
�PAGE �9�
NOÇÕES DE PROBABILIDADE
CONCEITOS BÁSICOS
EXPERIMENTO: É um fenômeno produzido pelo homem e que pode ser repetido sob as mesmas condições. Pode ser:
DETERMINÍSTICO: conduz sempre ao mesmo resultado, qualquer que seja o número de repetições do experimento.
ALEATÓRIO: não é possível prever o resultado de uma repetição em particular, mesmo que o experimento tenha sido repetido várias vezes.
PROBABILIDADE: É um número entre zero e um, que expressa a chance de ocorrência de um resultado.
CÁLCULO DE PROBABILIDADE:
ENFOQUE CLÁSSICO: Supõe que todos os possíveis resultados de um experimento aleatório são igualmente prováveis. Assim, a probabilidade de um resultado A é dada pela razão:
, onde:
n: número de resultados possíveis
a: número de resultados favoráveis ao resultado
EXEMPLO: Imagine o lançamento de um dado equilibrado (um cubo perfeito, em que todas as faces sejam igualmente prováveis). Neste caso, n=6, pois existem 6 resultados.
Probabilidade de ocorrer a face 3 (
Probabilidade de ocorre uma face par (
ENFOQUE FREQUENCIAL OU EMPÍRICO: Neste enfoque, a probabilidade de um resultado é obtida através da frequência relativa de sua ocorrência em um grande número de repetições do experimento. Neste caso, não existe a suposição prévia de iguais probabilidades, o que existe é uma avaliação empírica da probabilidade de um resultado.
EXEMPLO: Imagine que um médico vá prescrever uma medicação a um paciente. Nem todos os pacientes reagem da mesma maneira a uma medicação. Estamos falando, portanto, de um experimento aleatório. Qual seria a probabilidade de um paciente se curar ao tomar a medicação prescrita? A melhor forma de avaliar esta probabilidade é através do enfoque frequencial. Neste caso, precisaríamos saber, dentre os pacientes que já foram tratados com esta medicação, qual o percentual de pacientes que se curou. Aí teríamos uma “estimativa” da probabilidade de um novo paciente se curar.
ENFOQUE SUBJETIVO: A probabilidade de um resultado ocorrer é obtida através de uma avaliação subjetiva, feita por um especialista no assunto, usando toda a informação disponível.
EXERCÍCIO: Num período de um mês, 100 pacientes sofrendo de determinada doença foram internados em um hospital. Informações sobre o método de tratamento aplicado em cada paciente e o resultado final obtido estão no quadro abaixo.

Tratamento
Resultado

A

B

Soma
Cura total
30
16
46
Cura parcial
18
16
34
Morte
12
8
20
Soma
60
40
100
Selecionando aleatoriamente um destes pacientes, determinar a probabilidade de o paciente escolhido:
(a) ter sido submetido ao tratamento A;
(b) ter sido totalmente curado;
(c) não ter sido totalmente curado;
(d) ter sido totalmente curado, sabendo-se que foi submetido ao tratamento A.
NOÇÕES DE AMOSTRAGEM
Frequentemente precisamos obter conclusões para um conjunto de elementos (população) observando apenas uma parcela deste conjunto (amostra). Este processo é chamado de INFERÊNCIA ESTATÍSTICA. Para que as inferências sejam confiáveis, é necessário que as amostras sejam obtidas por processos adequados, que garantam a sua representatividade.
Uma amostra pode ser:
Probabilística: envolve mecanismos aleatórios na seleção dos elementos.
Não probabilística: demais procedimentos, como amostras intencionais ou de voluntários.
PRINCIPAIS TÉCNICAS DE AMOSTRAGEM PROBABILÍSTICA:
AMOSTRA ALEATÓRIA SIMPLES: Equivale a um sorteio lotérico em que todos os elementos da população têm a mesma probabilidade de participar da amostra e todas as possíveis amostras também têm a mesma probabilidade de ocorrer.
AMOSTRA ALEATÓRIA SISTEMÁTICA: Pode ser utilizada quando os elementos de uma população estão naturalmente organizados em uma seqüência que não tenha relação com a variável de interesse (por exemplo, cadastro com o nome das pessoas, organizado em ordem alfabética). Consiste em selecionar elementos em intervalos regulares (a cada 10 ou 20, por exemplo), tendo-se o cuidado de sortear o primeiro elemento a participar da amostra, para garantir a aleatoriedade.
AMOSTRA ALEATÓRIA ESTRATIFICADA: Deve ser utilizada nos casos em que a população é muito heterogênea. Nesta situação, ela deve ser dividida em grupos (estratos), de tal forma que, dentro de cada grupo os elementos sejam semelhantes e as diferenças ocorram entre os grupos. Dentro de cada grupo, seleciona-se uma amostra. Desta maneira, garantimos que as diferentes características da população sejam representadas na amostra. Este tipo de amostragem, embora tenha a grande vantagem de melhorar a qualidade do estudo, exige um planejamento amostral mais cuidadoso e um conhecimento prévio da população a ser estudada, para que se possa fazer a estratificação.
As técnicas de Inferência Estatística que iremos estudar partem do pressuposto de que a amostra foi selecionada de forma aleatória simples. Se tiver sido utilizada alguma outra técnica de amostragem probabilística, não há problemas com relação a este pressuposto, pois a técnica de amostragem sistemática produz, sob condições gerais, resultados equivalentes a uma aleatória simples, enquanto que a amostragem estratificada produz melhores resultados.
O problema ocorre quando a amostra for não probabilística, o que é bastante comum, na prática. Quando isto ocorre, teoricamente falando, não poderíamos aplicar técnicas de inferência estatística. Este procedimento acabaria inviabilizando o uso da Estatística em muitas áreas do conhecimento, pois muitas vezes é inviável ou mesmo impossível aplicar alguma técnica probabilística. Nestas situações, o que se recomenda é um extremo cuidado ao fazer generalizações, respeitando sempre as limitações do estudo, extrapolando os resultados apenas para elementos que tenham características semelhantes àqueles que foram estudados.
ESTIMAÇÃO
Primeiro precisamos entender dois conceitos:
PARÂMETRO: Medida que caracteriza uma população (ex: média, desvio-padrão, proporção de elementos com uma característica,...).
ESTATÍSTICA OU ESTIMADOR: Medida que caracteriza uma amostra (ex: média, desvio-padrão, proporção de elementos com uma característica,...).
A partir destes conceitos, percebe-se que um parâmetro é uma constante, ou seja, possui um valor fixo (mesmo que ele seja desconhecido), enquanto que uma estatística é uma variável, pois depende de qual será a amostra selecionada.
Estimar é fazer uma previsão ou uma projeção. É fornecer um valor para um parâmetro desconhecido. A estimação pode ser:
Por ponto: fornece um único valor como estimativa para o parâmetro.
Por intervalo: fornece um intervalo de valores no qual se acredita que esteja contido o parâmetro.
Fazer uma estimação por ponto implica simplesmente calcular o respectivo estimador.
Principais estimadores por ponto:
Medida
Parâmetro
Estimador
Média
(

Variância Absoluta
(2
S2
Desvio-padrão
(
S
Proporção
(
p
ESTIMAÇÃO POR INTERVALO OU INTERVALO DE CONFIANÇA
Consiste em construir um intervalo em torno da estimativa por ponto, usando uma margem de erro.
CONCEITOS ASSOCIADOS:
NÍVEL DE CONFIANÇA (1-(): é a probabilidade de que o intervalo realmente contenha o valor do parâmetro. Deve ser fixado pelo pesquisador.
NÍVEL DE SIGNIFICÂNCIA ((): é o complementar do nível de confiança, correspondendo à probabilidade de erro ao se fazer uma estimação.
ERRO ABSOLUTO MÁXIMO DE ESTIMAÇÃO ((): é a margem de erro do intervalo. Corresponde à distância máxima que se admite, a um dado nível de confiança, entre o valor do parâmetro (desconhecido) e a estimativa obtida a partir da amostra. O erro de estimação pode ser fixado pelo pesquisador. Para tanto, ele deverá planejar cuidadosamente o seu estudo, determinando o tamanho de amostra que será necessário para obter esta margem de erro. Quando istonão é feito, ele pode ser calculado a partir da amostra coletada e seu valor dependerá: do tamanho da amostra, do nível de confiança desejado e da variabilidade da população.
INTERVALO DE CONFIANÇA PARA UMA PROPORÇÃO POPULACIONAL
OBSERVAÇÃO: Para que este intervalo seja construído é necessário trabalharmos com uma amostra relativamente grande (n>30).
O intervalo é da forma:
onde p: proporção amostral, ou seja,
(f: frequência da característica, na amostra)
z(: valor obtido em uma tabela de distribuição normal, associado ao nível de confiança desejado
EXEMPLO: De uma amostra de 400 adultos da comunidade X, 48 apresentaram determinada patologia.
Neste exemplo, a população é formada por todos os adultos da comunidade X.
A amostra é composta pelos 400 adultos que foram pesquisados.
Variável: presença ou ausência da patologia, que é uma variável qualitativa nominal.
Parâmetro a ser estimado: incidência desta patologia na população, ou seja, percentual de adultos da população que têm a patologia.
Estimativa: calculando a respectiva incidência na amostra, obtemos:
, ou 12%. Assim, estimamos que 12% dos adultos desta comunidade tenham a citada patologia. Esta é uma estimativa por ponto.
Na verdade, o que esperamos é que a incidência, na população, esteja próxima de 12%. Mas, o que significa estar próximo de 12%?
Aí surge a estimação por intervalo. Precisamos saber qual a margem de erro deste estudo. Para tanto, necessitamos fixar um nível de confiança. Vamos fixar 95%, que é um dos níveis mais usados.
Para este nível de confiança, o valor tabelado é 1,96 (obtido em uma tabela de distribuição normal).
Fazendo os cálculos:
Assim:
ou 3,2 pontos percentuais. Esta é a margem de erro desta pesquisa. Agora sabemos que estar próximo de 12% é estar a, no máximo, 3,2 pontos percentuais de distância deste valor.
Desta forma, obtemos a nossa estimação por intervalo, ou o nosso intervalo de confiança:
[12-3,2 a 12+3,2], ou seja, [8,8% a 15,2%]
Interpretação: Podemos afirmar, com 95% de segurança, que entre 8,8% e 15,2% dos adultos desta comunidade (população) têm a referida patologia.
Vamos agora mudar alguns dados do problema, para percebermos a influência de cada um destes dados na margem de erro da pesquisa.
- Em primeiro lugar, vamos mudar o nível de confiança, aumentando-o para 99% (mantendo todas as demais informações iguais). Neste caso, muda o valor tabelado, que passa a ser 2,58.
A margem de erro passa a ser
ou 4,2 pontos percentuais.
Portanto, sempre que aumentamos o nível de confiança do estudo, aumenta a margem de erro, ou seja o intervalo fica mais amplo.
- Em segundo lugar, vamos imaginar que a amostra tivesse sido composta por 1000 adultos, dos quais 120 tivessem a patologia. Neste caso, continuamos tendo 12% da amostra com a característica, mas agora esta estimativa foi obtida a partir de uma amostra maior.
Mantendo a confiança em 95% (situação inicial), o valor tabelado continua sendo de 1,96.
Fazendo os cálculos:
Assim:
ou 2 pontos percentuais.
Portanto, sempre que aumentamos o tamanho da amostra, diminui a margem de erro, ou seja, o intervalo fica mais estreito.
- Em terceiro lugar, vamos aumentar a variabilidade estimada para a população, aproximando a proporção amostral de 50%, que é quando temos maior variabilidade para uma variável qualitativa. Vamos então imaginar que, na nossa amostra de 400 adultos, 192 apresentaram a patologia.
Calculando a incidência na amostra, obtemos:
, ou 48%.
Mantendo a confiança em 95% (situação inicial), o valor tabelado continua sendo de 1,96.
Fazendo os cálculos:
Assim:
ou 4,9 pontos percentuais.
Portanto, quanto maior for a variabilidade da população, maior será a margem de erro, ou seja, o intervalo fica mais amplo.
Neste exemplo, imaginamos que a pesquisa já havia sido realizada e estávamos apenas calculando a margem de erro resultante. O mais correto é fazer um planejamento prévio do estudo, determinando quantas pessoas deveriam ser pesquisadas, para que tivéssemos, a um determinado nível de confiança, uma margem de erro estabelecida. Nesta situação, precisamos calcular um tamanho de amostra que atenda a estas condições. Para fazer isto, necessitamos fixar um nível de confiança e uma margem de erro, além de ter uma estimativa da variabilidade populacional (por exemplo, através da proporção de uma amostra).
Vamos fazer isto no exemplo: Usaremos 99% de confiança, com uma margem de erro de 3,2 pontos percentuais, que foi aquela que encontramos quando trabalhamos com 95% de confiança. Imagine que já tenha sido feito um estudo inicial (estudo piloto), revelando que 12% dos adultos pesquisados tinham a patologia. Para determinar o tamanho de amostra (n), trabalhamos algebricamente com as fórmulas da margem de erro e do Sp, e chegamos à seguinte fórmula:
Isto significa que deveríamos pesquisar 687 adultos da comunidade.
OBS. 1: Tamanho de amostra deve ser “arredondado” sempre para mais, pois o que se calcula é o tamanho mínimo.
OBS. 2: Ao analisarmos a fórmula
, ficamos com a falsa ideia de que calcular o tamanho da amostra seja uma tarefa fácil. Seria, se tivéssemos todas as informações. Isto dificilmente ocorre. Vejamos o que está envolvido neste cálculo:
z(: este valor é obtido numa tabela de distribuição normal. Para encontrá-lo, necessitamos do nível de confiança que, como já foi dito, deve ser fixado pelo pesquisador. Nem sempre o pesquisador tem noção suficientemente clara para tomar esta decisão.
: erro máximo de estimação. Neste caso, ele não será calculado, mas fixado pelo pesquisador.
p: estimativa da proporção populacional. Ao calcularmos o tamanho da amostra, usamos a proporção de 0,12, que havia sido encontrada na amostra. Neste caso, imaginamos que aquela amostra inicial, formada por 400 adultos, era uma amostra piloto. Como faríamos o cálculo, se não tivéssemos esta amostra inicial? Quando não temos esta informação, devemos verificar junto ao pesquisador se há uma ideia inicial a respeito da proporção. Se houver, esta informação será usada no cálculo. Caso não tenhamos qualquer informação, podemos usar o valor 0,5 (ou seja, 50%), pois ele é o valor de proporção que exige o maior tamanho de amostra. Se o nosso estudo atender as exigências no caso da proporção ser 0,5, então teremos estas exigências satisfeitas com folga para qualquer outra situação. No exemplo, se tivéssemos usado 0,5 ao invés de 0,12, necessitaríamos de uma amostra de 1626 adultos.
OBS. 3: No cálculo do tamanho da amostra, não consideramos o número total de adultos desta comunidade, ou seja, o tamanho da população. Neste caso, trabalhamos como se a população fosse infinita. Não imaginamos, obviamente, que existam infinitos adultos nesta comunidade, mas se este número for grande, ele pouco irá interferir no resultado final (ao contrário do que muitas pessoas imaginam). Para considerarmos o tamanho da população, devemos corrigir o resultado através da expressão:
, onde n0: valor calculado inicialmente, sem arredondamentos e N: tamanho da população.
Vamos fazer algumas simulações:
Inicialmente vamos imaginar que há 5.000 adultos na comunidade, ou seja, N=5000. Neste caso:
. Logo, bastaria pesquisarmos 604 adultos (o que corresponde a 12% do total de adultos da comunidade).
Agora vamos imaginar que há 100.000 adultos na comunidade. Neste caso:
. Logo, precisaríamos pesquisar 682 adultos (o que representa 0,7% do total de adultos desta comunidade).
Por esta simulação, podemos observar que, se a população for muito grande, esta informação é irrelevante para o cálculo do tamanho da amostra. A informação sobre o tamanho da população só fará diferença importante se a população for pequena (mas neste caso talvez devêssemos considerar a possibilidade de fazer um censo, ou seja, estudar todos os elementos da população).
EXERCÍCIO: Entreos eleitores de determinado município, foi selecionada uma amostra de 2000. Foi perguntado a estes eleitores em quem eles pretendem votar na próxima eleição para prefeito. Entre os pesquisados, 34% afirmaram que pretendem votar no candidato A.
Quem é a população de interesse nesta pesquisa?
Esta pesquisa foi feita através de um censo ou de uma amostragem?
Qual foi a variável pesquisada? Como ela se classifica?
Sabe-se que, para um nível de confiança de 95%, a margem de erro desta pesquisa é de 2,1 pontos percentuais. Qual seria o intervalo de estimação para o percentual de votos que este candidato deverá receber na próxima eleição?
Interprete o intervalo obtido.
Se o pesquisador desejasse diminuir a margem de erro, sem alterar o nível de confiança do estudo, o que ele deveria fazer?
Se o pesquisador desejasse aumentar o nível de confiança para 98%, o intervalo ficaria mais amplo ou mais estreito do que aquele que foi encontrado?

Nos exemplos citados anteriormente estávamos trabalhando com variáveis qualitativas. Nestes casos, só podemos trabalhar com percentuais. Quando trabalhamos com variáveis quantitativas, podemos fazer estimação de médias.
EXEMPLO: Para uma amostra de 25 pacientes que foram tratados com determinado tipo de analgésico, observou-se que o tempo médio que o analgésico levou para começar a fazer efeito foi de 18 minutos, com desvio-padrão de 3,5 minutos.
Neste exemplo, a população é formada por todas as pessoas que são tratadas com este analgésico.
A amostra é composta pelos 25 pacientes que foram pesquisados.
Variável: tempo que o analgésico levou para começar a fazer efeito, que é uma variável quantitativa contínua.
Parâmetro a ser estimado: tempo médio que o analgésico leva para começar a fazer efeito, para todos os pacientes que recebem este tratamento.
Estimativa: Uma estimativa por ponto para o parâmetro consiste em dizer que o tempo médio deverá ser de 18 minutos, aproximadamente.
Para saberemos quão próximo o tempo médio populacional deve estar dos 18 minutos encontrados na amostra, devemos fazer uma estimação por intervalo. Este intervalo é feito da seguinte maneira:
, onde
: média amostral e
: margem de erro da média amostral.
t(: valor obtido em uma tabela de distribuição t, com n-1 graus de liberdade, associado ao nível de confiança desejado.
, onde
é o desvio-padrão amostral (se conhecermos o desvio-padrão populacional, é ele que deverá ser usado).
Fazendo os cálculos:
Para 95% de confiança, o valor obtido na tabela t com 25-1=24 graus de liberdade é de 2,06.
A margem de erro é de
minutos.
Assim, o intervalo fica [18-1,44 a 18+1,44], ou seja, [16,56 minutos a 19,44 minutos]
Interpretação: Podemos afirmar, com 95% de segurança, que o tempo médio que este analgésico leva para começar a fazer efeito nos pacientes a ele submetidos (população) deve estar entre 16,56 minutos e 19,44 minutos.
OBSERVAÇÃO: Todos os comentários feitos com relação à influência dos diferentes fatores no cálculo da margem de erro e com relação ao cálculo do tamanho da amostra são válidos também para a estimação da média.
_1377127917.unknown
_1377129183.unknown
_1377423569.unknown
_1377423581.unknown
_1377423840.unknown
_1377129335.unknown
_1377130364.unknown
_1377130390.unknown
_1377130112.unknown
_1377129238.unknown
_1377128850.unknown
_1377128890.unknown
_1377128539.unknown
_1230470988.unknown
_1377110275.unknown
_1377127164.unknown
_1377127781.unknown
_1377110334.unknown
_1377110290.unknown
_1377108288.unknown
_1377110049.unknown
_1377110202.unknown
_1377108468.unknown
_1233770366.unknown
_1230470799.unknown
_1230470904.unknown
_1230043540.unknown
_1230468392.unknown
_1230468452.unknown
_1230040604.unknown