Buscar

Intervalos de Confiança

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Aula 2 - Intervalos de Confiança
Queremos fazer inferência, via estimação intervalar e teste de hipóteses para 2 características específicas da população, que nos permitirão inferir seu resultado em termos de média ou proporção;
Vimos que é necessário conhecer a distribuição amostral da média e proporção antes de definir os conceitos de estimação intervalar e teste de hipóteses;
Se a gente quiser caracterizar um parâmetro na população para responder uma pergunta de interesse em nosso estudo e esse parâmetro é uma variável qualitativa podemos fazer a modelagem usando a média. Temos que conhecer a distribuição amostral da média. Ao calcular a média dessa distribuição, ela irá coincidir com o verdadeiro valor na população. A variabilidade esperamos que seja similar na população, corrigido ao tamanho dessa população
Se for a proporção, esperamos que seja igual da população. Assim como a média, a variabilidade vai ser corrigida para a dada amostra. 
As distribuições amostrais para média e proporção são dadas, respectivamente, por:
Vimos que o TCL garante que para amostras grandes, a distribuição da média e proporção amostrais, devidamente padronizadas, se comportam aproximadamente como um modelo Normal.
Exemplos
Ex. 1: Suponha que para crianças nascidas com peso abaixo de 1050g, o nível de bilirrubina sérico tem distribuição Normal com média 8.5mg/dl e desvio padrão 3.5mg/dl. Calcule a probabilidade de que em uma amostra de 16 crianças, tenhamos: 
a) níveis inferiores a 8 mg/dl 
b) níveis entre 8.2 mg/dl e 9mg/dl
Ex. 2: A câmara de deputados defende um novo projeto de lei. Suponha que a proporção de pessoas no país favoráveis à implantação desta lei seja igual a 35%. Suponha que uma amostra aleatória de 300 pessoas foi extraída em determinada cidade do país. Determine: 
a) A probabilidade de se observar nesta amostra uma proporção de pessoas favoráveis ao projeto entre 30% e 50%; 
b) A probabilidade de que mais de 40% das pessoas nesta amostra sejam favoráveis à lei.
Estimação Pontual e Intervalar
Nosso objetivo aqui é obter uma estimativa destas quantidades, a partir de uma amostra aleatória extraída da população de interesse;
Na Inerência, via Estimação, é possível inferir sobre a média e/ou proporção populacional, via Estimação Pontual ou Intervalar;
Na Estimação Pontual obtemos um valor numérico único, próximo, em geral, do parâmetro de interesse na população. No entanto, ela não nos permite julgar a magnitude do erro cometido ao usar uma amostra para inferir sobre a população, uma vez que a mesma não fornece nenhuma informação sobre a variabilidade inerente do estimador, de forma a nos dar uma ideia de quão próximo (ou não) ele está do parâmetro populacional.
Por que, por exemplo, não é possível mensurar a variabilidade inerente ao estimador da média ou proporção, quando usamos apenas a Estimação pontual?
Suponha que os pesquisadores A e B extraíram uma amostra de mulheres residentes em SSA, com o objetivo de conduzir um estudo para avaliar se o uso de anticoncepcionais aumenta o risco de Trombose. Ambos os pesquisadores extraíram amostras distintas de mulheres e encontraram resultados diferentes para a proporção de mulheres com o referido diagnóstico. Neste caso, há um certo grau de incerteza, decorrente das amostras, e se usarmos apenas a estimativa pontual obtida em cada amostra para tirar conclusões sobre a prevalência de Trombose nas amostras observadas, não conseguiremos mensurar a magnitude do erro cometido nesta mensuração.
O problema fundamental da Inerência estatística é medir o grau de incerteza (ou risco) das generalizações feitas, e uma forma de mensurar este erro é estabelecendo limites, que com certa probabilidade, esperamos que incluam o verdadeiro valor do parâmetro populacional de interesse; 
Esses limites são chamados de “limites de confiança” e determinam um intervalo de confiança, no qual, com certo grau de confiança, deverá conter o verdadeiro valor do parâmetro; 
Uma estimativa intervalar indica a precisão, através da informação de um intervalo de números ao redor da estimativa pontual;
Estrutura Geral de um Intervalo de Confiança
O comprimento do intervalo mede a precisão da estimativa; 
Neste caso, o comprimento é dado por: C = b - a ; 
Importante: Ter um intervalo de confiança estreito, indica boa precisão feita acerca daquela característica populacional que está sendo estudada, mas NÃO NECESSARIAMENTE que o resultado amostral é próximo do populacional, pois podem haver vieses.
Além dos elementos apresentados na figura acima, existem outros que compõem um intervalo de confiança e são importantes para a sua construção: 
1. Nível (ou grau) de confiança (confiabilidade), denotado por (1 - 𝜶). O 𝜶 significa nível de significância adotado no estudo. Esse nível de significância é entre 0 e 1, assim esperamos que seja sempre um nível pequeno, pois se o coeficiente de confiança é o complementar do coeficiente de significância e precisamos ter uma confiança alta no estudo. Na área da saúde, os níveis de confiança adotados são de 95 ou 99%. O 𝜶 dá a ideia do erro máximo que esperamos cometer nas inferências feitas. Ou seja, significa que as nossas afirmações que estamos fazendo sobre a população através da amostra são boas, mas existe uma margem de erro máxima que pode existir.
2. Margem de erro, denotada por 𝜺. Vai ajudar a mensurar o erro que é cometido. Essa margem de erro não depende apenas da amostra, mas também da variabilidade observada na amostra que estamos trabalhando.
O grau de confiança tem sua origem na probabilidade associada ao processo de construção do intervalo, e sua definição deve ser anterior à obtenção da amostra que será usada para análise; 
Os graus de confiança mais comumente utilizados são o de 95% e 99; 
Seria impossível construir um intervalo de 100% de confiança, a menos que se trabalhasse com toda a população; 
Na maioria das aplicações não sabemos se um específico intervalo de confiança cobre de fato o verdadeiro valor do parâmetro populacional de interesse.
Principais parâmetros envolvidos nos estudos da área de Saúde
· Média; 
· Proporção; 
· Um valor que representa uma diferença de médias ou alguma medida de efeito, tipo incremento de peso; 
· Medidas epidemiológicas como: risco relativo, odds ratio, razão de prevalência, incidência, etc.
Intervalo de confiança para a média populacional
Se temos apenas estimativa pontual, que é a média observada na amostra, não conseguimos julgar a magnitude do erro que cometemos ao fazer a inferência para a média populacional olhando apenas o valor observado na média amostral
Vimos que um estimador pontual para 𝜇 é a média amostral. Logo, um intervalo de confiança para a média populacional é dado por:
Ɛ representa o erro amostral, comumente chamado de margem de erro, e é encontrado a partir da distribuição amostral da média;
Existem 2 formas de construirmos um intervalo de confiança para a média populacional 𝜇:
1. Usando a distribuição Normal como distribuição amostral da média. Usado se o tamanho da amostra for considerado grande e quando assumimos que conhecemos a variância na população.
2. Usando a t de Student como distribuição amostral da média. Usamos quando o tamanho da amostral for pequeno e não conhecemos, não temos informação seja com base em estudos anteriores afirmar ou inferir sobre essa variância populacional, teremos que obter informação sobre ela a partir da amostra. Nessa situação, apenas poderemos construir intervalos de confiança usando distribuição t;
Distribuição t de Student
Student é o pseudônimo de W. S. Gosset que, em 1908, propôs a distribuição chamada t de Student.
Esta distribuição é muito parecida com a distribuição Normal, pois assim como a Normal, é uma distribuição simétrica em torno da média. A distribuição normal têm dois parâmetros que vão reger o comportamento distribucional, que é a média (tendência central) e variância (tendência de dispersão);
A família de distribuições t é centrada no zero, assim como a Normal padrão, e também possui formato em sino;
Ao contrárioda distribuição Normal, que possui apenas 2 parâmetros (𝜇 e 𝝈²), a distribuição t possui 3 parâmetros: 𝜇, 𝝈² e 𝛎. A que avalia a tendência central é 𝜇, 𝝈² que é o parâmetro de distância que serve para avaliar a variabilidade (é tendência central). Além disso, tem 𝛎, que é o grau de liberdade. 
𝛎 é o parâmetro que determina a altura e largura da distribuição t, sendo chamado de grau de liberdade (g.l.). Ele depende do tamanho da amostra.
𝛎 depende do tamanho amostral n. Por isso, quando n → ∞ (ou seja, assume valores grandes), a distribuição t se aproxima da Normal.
Como ocorre com a Normal, para calcularmos probabilidades a partir da t, é preciso usar a mesma transformação feita com a Normal;
Se é a média amostral, então:
Quanto maior for o grau de liberdade do 𝛎 , maior é o n associado e a distribuição t tende a se aproximar da normal. Ótimo para grandes amostras, pois tende a se aproximar da normal.

Continue navegando