Buscar

Avaliação 2 Estatística Aplicada

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

Avaliação 2 – Estatística Aplicada
Alunas: Isabella Celeste Moura e Júlia Luíza Lopes Tolentino
Questão 1
a) A estimação de parâmetros pode ser mensurada através da estimação pontual ou da estimação intervalar. A Estimação Pontual refere-se a um único valor (estimativa pontual) que é obtido a partir de resultados (dados) de uma variável aleatória de uma amostra representativa extraída de uma determinada população. Ressalta-se que o objetivo da estimação pontual é selecionar um único número, baseado na amostra, que melhor representa da medida de interesse, ou seja, refere-se a um valor mais plausível para θ. Já a estimação intervalar é um intervalo de possíveis valores utilizados para estimar um parâmetro populacional, ou seja, para uma determinada medida de interesse. Por serem variáveis aleatórias, os estimadores pontuais possuem uma distribuição de probabilidade (distribuições amostrais). Dessa forma, é possível apresentar uma estimativa mais informativa para o parâmetro de interesse, que inclua uma medida de precisão do valor obtido - estimativa intervalar ou intervalo de confiança. Os intervalos de confiança são obtidos a partir da distribuição amostral de seus estimadores.
b) O nível de confiança é a probabilidade 1 − α, que é a proporção de vezes que o intervalo de confiança realmente contém o parâmetro populacional, supondo que a amostragem pudesse ser repetida um grande número de vezes. O nível de confiança representa a porcentagem de intervalos que iriam incluir o parâmetro populacional se fossem reunidas amostras da mesma população, repetidas vezes. Em resumo, é a frequência com a qual o intervalo observado contém o parâmetro real de interesse quando o experimento é repetido várias vezes. Em outras palavras, o nível de confiança seria a proporção de intervalos de confiança construídos em experimentos separados da mesma população e com o mesmo procedimento que contém o parâmetro de interesse real.
c) Já trabalhei em uma fábrica de resistores. Um “problema” que poderia ser resolvido através de inferência via estimação pontual seria encontrar a probabilidade de uma amostra aleatória de “n” resistores ter uma resistência média menor que 95 ohms, uma vez que a fábrica produz resistores que possuem uma resistência média de 100 ohms e um desvio-padrão de 10 ohms (considerando que a distribuição de resistências é normal). 
Questão 2
a) O teste de hipóteses é uma metodologia estatística que nos auxilia a tomar decisões sobre uma ou mais populações, baseado na informação obtida da amostra, ou seja, ele nos permite verificar se os dados amostrais trazem evidência que apoiem ou não uma hipótese estatística formulada. Para realizar o teste, existem alguns passos, conforme assinalados a seguir:
1. Estabeleça a hipótese nula, H0 e a hipótese alternativa H1.
2. Decida qual o teste a ser usado, checando se este é válido para o seu problema.
3. Calcule a estatística de teste, T.
4. Encontre a probabilidade (p-valor) de observar um valor tão extremo ou maior do que T se a hipótese nula é de fato verdadeira. Você precisará se referir aos valores críticos nas tabelas estatísticas as quais fornecem p-valores correspondendo aos valores das estatísticas de teste. 
5. Avalie a força da evidência contra H0. (Quanto menor p-valor, tanto mais evidência contra a hipótese nula.) Se for o caso, decida se esta é evidência suficiente para rejeitar (ou não rejeitar) a hipótese nula.
6. Estabeleça as conclusões e interpretação dos resultados.
b) O nível de significância, também conhecido como alfa ou α, é a probabilidade de rejeição da hipótese nula quando ela é verdadeira. Exemplo: um nível de significância de 0,05 indica um risco de 5% de concluir que existe uma diferença quando não há diferença real. Ou seja, ele determina a que distância do valor da hipótese nula será traçada a linha no gráfico. Já o valor-p é a probabilidade de observar dados tão extremos quanto os obtidos caso a hipótese nula seja verdadeira, ou seja, com esse valor, mostra a probabilidade de se observar uma diferença tão grande ou maior do que a que foi observada sob a hipótese nula.
c) Foi realizada uma pesquisa pelo SEBRAE/MG em que é possível afirmar que somente 40% dos seus clientes (micro e pequenas empresas) possuem curso superior. A mesma pesquisa, realizada pelo SEBRAE Nacional afirma que essa proporção é menor, para Minas Gerais. Para verificar sua suspeita, o concorrente sorteou, aleatoriamente, 30 clientes da referida instituição mineira e consultou-os acerca de ter ou não ter terceiro grau completo. Dessa forma, é possível formular esse problema como um problema de teste de hipóteses; interpretar os erros tipo I e tipo II; verificar qual é a região crítica para um nível de significância de 10%?; analisar, com base na região crítica construída em (c), qual foi a conclusão do concorrente caso 14 leitores responderam sim.
Questão 3
O procedimento prático e completo para se testar a média de uma população perpasse pelos seguintes passos:
1. Identificar o parâmetro de interesse a partir do problema;
2. Especificar as hipóteses; 
3. Escolher um nível de significância; 
4. Determine uma estatística de teste;
5. Encontrar a região crítica ou calcular o valor-p; 
6. Decidir se deve rejeitar ou não H0: comparar a região crítica com a estatística de teste ou comparar o valor-p com o nível de significância;
7. Por fim, concluir em termos do problema.
Em tese, no R, deve-se testar a normalidade dos dados. Se eles forem normais, verificar teste de variância conhecida. Se sim, fazer teste Z, se não, teste t. Caso a distribuição não for normal, testar a amostra grande. Se sim, teste Z, senão, teste não paramétricos.
Questão 4
As hipóteses a serem utilizadas são:
H0: µ1 = µ2 H0: µ1 ≤ µ2 H0: µ1 ≥ µ2
H1: µ1 ≠ µ2 H1: µ1 > µ2 H1: µ1 < µ2
Existem três suposições iniciais a serem feitas para realizar o teste de média de duas populações:
1. As duas populações seguem distribuição Normal?
A normalidade de cada uma das amostras é realizada, também, por um teste de hipóteses, no qual não rejeitar H0 significa que a distribuição é normal. Logo, antes de realizar, efetivamente, o teste das médias das duas populações, devem ser realizados outros testes. No R, pode ser feito o shapiro.test() para verificar a normalidade de cada amostra. Para não rejeitar H0 com 5% de significância, o p-valor encontrado deve ser maior que 0,05.
Se ambas as populações forem de distribuição Normal, o teste de comparação de médias será o teste t, no R: t.test(). Esta suposição, acerca da distribuição, é a que define o teste a ser utilizado, enquanto as outras duas apenas alteram as condições de realização.
2. Suas variâncias são iguais?
Para verificar a igualdade das variâncias, caso o interesse final não seja testá-las, é utilizado um teste F bilateral (no R, var.test(dados1,dados2)), com as seguintes hipóteses:
H0: σ12 = σ22
H1: σ12≠ σ22
Se o p-valor retornado for maior que 0,05, não rejeitamos H0 com 5% de significância. Logo, as variâncias são iguais. Também pode-se concluir esta informação a partir do Intervalo de Confiança retornado. Se as variâncias são iguais, a razão entre elas é 1. Se 1 estiver dentro do IC com 95% de confiança, não rejeitamos H0 com 5% de significância.
3. São pareadas ou não?
Duas amostras serão pareadas se cada observação da primeira pode ser comparada apenas com uma observação da segunda. Ou seja, cada ponto amostral só é compatível com ele mesmo.
Após verificar todos estes parâmetros, é realizado o teste:
t.test(dados1, dados2, alternative = , paired = , var.equal = );
Onde dados1 e dados2 são as diferentes amostras, “alternative” é onde especificamos se o teste é unilateral (“greater” ou “less”, dependendo do que o problema pede) ou bilateral (“two.sided”), “paired” é se as amostras são pareadas ou não (“TRUE” ou “FALSE”) e “var.equal” é se as variâncias são iguais (“TRUE” ou “FALSE”).
Se as duas médias populacionais forem efetivamente iguais, a diferença entre elas será 0. Se 0 estiver incluso no IC com 95% de confiança, não rejeitamos H0 com5% de significância (a hipótese H0 será uma das opções definidas no começo desta questão, dependendo do que o problema pede).
H0: µ1 = µ2 H0: µ1 ≤ µ2 H0: µ1 ≥ µ2
Questão 5
Script em anexo.