Baixe o app para aproveitar ainda mais
Prévia do material em texto
19/08/2018 1 INTRODUÇÃO Prof. Nagib Yassin O que é Estatística? Estatística O que modernamente se conhece como Ciências Estatísticas, ou simplesmente Estatística, é um conjunto de técnicas, cênicas e métodos de pesquisa e análise de dados que entre outros tópicos envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações. • A palavra "Estatística" tem pelo menos três significados: 1. coleção de informações numéricas ou dados, 2. medidas resultantes de um conjunto de dados, como por exemplo médias, 3. métodos usados na coleta e interpretação de dados. Razões para se estudar Estatística? • A disponibilidade de parelhos modernos, muitos dos quais acoplados a computadores, permitem a quantificação de muitos fenômenos. A massa de dados gerada precisa ser analisada adequadamente. • Na Ciência, são realizados estudos experimentais ou observacionais, em que o interesse é comparar grupos/tratamentos ou ainda determinar fatores prognósticos/risco importantes. • O material biológico estudado é sempre uma amostra e o objetivo final é tirar conclusões sobre toda a população de interesse com base na amostra. Em geral, a disciplina de estatística refere-se a métodos para coleta e descrição dos dados, e então a verificação da força da evidência nos dados pró ou contra certas idéias científicas. A presença de uma variação não previsível nos dados faz disso uma tarefa pouco trivial. 19/08/2018 2 Estatística Por que estudar Estatística? Toda análise estatística é feita para responder a algum questionamento”. Tal questionamento pode ser respondido através de metodologia apropriada. Metodologia científica E´o conjunto de técnicas e processos empregados para a pesquisa e a formulação de uma produção científica. Fluxo Científico Definições: Problema, objetivo, população alvo Planejamento da pesquisa: Variáveis, plano amostral ou experimental e técnica de análise Execução da pesquisa: Coleta de dados (observação, mensuração) Análise dos dados: Segundo os objetivos traçados e técnicas apropriadas Resultados: com relatório final Conclusões e previsões Como planejar uma pesquisa ▪ A adição de CLA (Acido Linoleico´ Conjugado) na ração de suínostende a reduzir a espessura de gordura dos mesmos? ▪ A quantidade de células cancerígenas encontradas está associada com o tempo de sobrevida do animal? ▪ A adição de fibra de coco na ração animal é benéfica, do ponto de vista da produção? Qual a proporção ideal para mistura na ração? O Problema ~ normalmente surge de um questionamento 19/08/2018 3 Como planejar uma pesquisa •Objetivo geral: é o objetivo central e responsável pelo desencadear do estudo. •Objetivos específicos: são formados por questões secundárias que ajudam a entender o resultado da pesquisa, corroborando, ou não, com o objetivo geral. Definição dos Objetivos Como planejar uma pesquisa • Em relação à coleta dos dados, a Pesquisa Quantitativa pode ser classificada em dois tipos: • Estudo Observacional - as informações, ou medidas, de interesse são coletadas por meio de observação, de tal forma que o pesquisador não exerça nenhuma interferência nas respostas; • Estudo Experimental - consiste na coleta de informação por meio de um experimento, no qual o pesquisador deliberadamente aplica um estímulo (tratamento) nas unidades amostrais para observar suaresposta. Coleta de Dados Como planejar uma pesquisa • Na área médica, os estudos observacionais ganham características particulares, mesmo envolvendo pesquisas com pessoas. Os principais estudos observacionais na área médica são: •Estudos de Prevalência ou Transversais; •Estudos retrospectivos ou de Caso-Controle; •Estudo de Coorte; Estudo Observacional 19/08/2018 4 É previamente planejado, sendo que o pesquisador consegue controlar fatores que possam interferir na resposta, diminuindo sua variabilidade final. O pesquisador pode, com isso, otimizar os resultados, com uma quantidade bastante reduzida de amostras. O estudo experimental requer um delineamento experimental. Na área médica, os estudos experimentais recebem o nome de Ensaio Clınico Aleatorizado. Estudo Experimental Como planejar uma pesquisa TESTES DE HIPÓTESES •Uma nova raça leiteira está sendo introduzida no país com a promessa de uma maior produção em relação as raças existentes, em especial, a Holandesa. Como verificar se tal raça realmente produz mais leite que a Holandesa? Suponha que a produção média de leite da raça Holandesa seja de 20 litros por cabeça. Situação 1: Testes de Hipóteses 19/08/2018 5 Testes de Hipóteses •Situação 2: Suponha que um pesquisador esteja desconfiado que o peso aos 21 dias de idade, de leitões da raça Large White, seja diferente dos 5 kg esperados para a raça. As hipóteses estatísticas para estudar o problema poderão ser expressas por: H0 : = 5,0 kg vs H1 :≠ 5,0 kg Observe que a hipótese nula define o peso histórico de animais aos 21 dias de idade para a raça. Já a hipótese alternativa é o que o pesquisador efetivamente quer verificar. Testes de Hipóteses Dependendo do que o pesquisador estiver observando ou interessado, sua hipótese de pesquisa poderá ser outra: Animais magros: Animais gordos: 𝑯𝟎: 𝝁 = 𝟓, 𝟎𝒌𝒈 𝑯𝟏: 𝝁 < 𝟓, 𝟎𝒌𝒈 𝑯𝟎: 𝝁 = 𝟓, 𝟎𝒌𝒈 𝑯𝟏: 𝝁 > 𝟓, 𝟎𝒌𝒈 Animais gordos: Testes de Hipóteses Se a comparação for entre os pesos médios, aos 21 dias de idades, das raças Large White (LW) e Duroc (D)? Como proceder? As raças diferem: Peso médio de LW maior que D Peso medio de LW menor que D 𝑯𝟎: 𝝁𝑳𝑾 = 𝝁𝑫 𝑯𝟏: 𝝁𝑳𝑾 ≠ 𝝁𝑫 𝑯𝟎: 𝝁𝑳𝑾 = 𝝁𝑫 𝑯𝟏: 𝝁𝑳𝑾 > 𝝁𝑫 𝑯𝟎: 𝝁𝑳𝑾 = 𝝁𝑫 𝑯𝟏: 𝝁𝑳𝑾 < 𝝁𝑫 19/08/2018 6 Testes de Hipóteses Teste de hipótese é uma suposição ou armação relativa a uma ou mais populações, baseada nos parâmetros populacionais, que pode ser verdadeira ou falsa. A ideia básica é que a partir de uma amostra da população será estabelecida uma segundo a qual a hipótese estabelecida será rejeitada ou não-rejeitada. Esta regra de decisão e chamada de teste. Normalmente existe uma hipótese que e de conhecimento comum que será denotada por H0 e chamada de hipótese nula. Qualquer outra hipótese diferente de H0 será chamada de hipótese alternativa e denotada por H1. Regra de Decisão Pode-se rejeitar uma hipótese nula quando de fato ela e verdadeira ou pode-se não-rejeitar H0 quando, de fato, ela e falsa. Situação real Decisão Aceitar H0 Rejeitar H0 H0 verdadeira Decisão correta (1-α ) Erro tipo II (probab.α) H0 Falso Erro tipo II (probab.β ) Decisão correta (1-β ) Cálculo do nível de significância Suponha que se decida não rejeitar a hipótese nula da Situação 2 se a média amostral estiver entre 4 e 6 kg . Caso isto não ocorra, a decisão será rejeitar H0. Sendo 50 o número de amostras coletadas e s2 = 1 kg 2, o valor de α será: ( ) ( ) ( ) 0 0 1 2 -12 = P (Rejeitar H | H verdadeiro) = P (y < 4 | = 5) + P y > 4 | = 5 y < 4 4 5 y - 6 6 5 = P < + P < 1/ 50 1/ 50 1/ 50 1/ 50 = P z < -7,0711 + P z > 7,0711 = 1,5375×10 − − Portanto, dadas as condições apresentadas, a probabilidade de se rejeitar H0 é praticamente nula 19/08/2018 7 Teste para a média de uma população A imunocastração é uma alternativa à castração cirúrgica. Ao aplicar a vacina, bloqueia-se a liberação do hormônio GnRH do hipotálamo e consequentemente de LH e FSH da hipófise e de testosterona pelos testículos. A castração serve para diminuir a produção de testosterona e, consequentemente, de indol e escatole, que são responsáveis pelo odor sexual da carne de machos não castrados (inteiros). Considerando-se que, em média, o nível de escatole de animais inteiros é de µ = 0,033µg, verifique se a imunocastração alterou o valor de escatole dos animais submetidos ao experimento. Os valores obtidos, em µg, foram os seguintes: 0,0235 0,02410,0253 0,0257 0,0264 0,0269 0,0272 0,0277 0,0284 0,0286 0,0308 Calcule: 1. a média; 2. a variância; 3. o desvio padrão; 4. o erro padrão da média; 5. o coeficiente de variação. 6. Teste as hipóteses: H0 : µ = 0,033 vs H1 : µ 6= 0,033 ao nível de 5% de significância. Teste para a média de uma população Como a variância populacional é desconhecida, aplica-se a equação: ( ) .Calc X x x t ss n − − = = 2 121 1 1 1 ; V(x)= 1 nn ii n ii i xx x x n n n == = = − − que tem Distribuição de Student com n – 1 graus de liberdade (g.l.). Valor crítico da distribuição t: tab. t = f [ ; (n - 1)g.l.] ( ); s =x s s V x n = .100 s CV x = Tomada de decisão (conclusão): calc. . 0 calc. . 0 Se t t Rejeita-se H Se t t Aceita-se H tab tab OBS: A tabela da distribuição t de Student a ser utilizada em nossas aulas é bilateral. Assim, se o teste efetuado for bilateral, entra exatamente com o α na tabela. Caso contrário, o teste realizado seja unilateral, deve-se entrar com 2α na tabela. Teste para a média de uma população 19/08/2018 8 Teste para a Diferença entre duas Médias ➢Teste para amostras independentes; ▪as variâncias são homogêneas; ▪as variâncias não são homogêneas; ➢Teste para amostras dependentes. Teste para duas amostras independentes As seguintes pressuposições devem ser observadas para a realização deste teste: ▪ as amostras de cada população investigada devem ser aleatórias e independentes; ▪ as variâncias da duas populações, ou seja, não são conhecidas, porém pode-se admitir que elas são iguais, isto é, 2 2 1 2 e 2 2 1 2 = ▪ as variáveis das populações de onde as amostras foram selecionadas devem apresentar distribução aproximadamente normal. Amostras independentes Como as variâncias populacionais são desconhecidas, porém homogêneas, aplica-se a equação dada por: ( ) ( )1 2 10 20 . 2 1 2 1 1 Calc C X X t S n n − − − = + sendo a variância conjunta, para duas amostras, dada por: 2 Cs ( ) ( )2 21 1 1 22 1 2 1 1 2 C n S n S S n n − + − = + − A forma geral para cálculo de variância conjunta é dada por: ( ) ( ) 2 2 1 1 1 1 n i i i i n i i n S s n = = − = − 19/08/2018 9 Variâncias homogêneas Antes da realização do teste é necessário verificar se as variâncias são homogêneas. Nesta situação as hipóteses testadas são: 2 2 1 2 2 2 2 2 0 1 2 1 1 2 2 2 1 2 : vs H :H = sendo que é mais comum testar 2 2 2 2 0 1 2 1 1 2: vs H :H = A variável teste para a homogeneidade de variâncias de duas populações independentes é dada por: ( ) ( ) 2 2 2 1 2 1 . 22 2 21 2 Maior valor da variância , Menor valor da variância , Calc S S S F SS S = = O valor crítico da distribuição F será estabelecido de acordo com o nível de significância (α) e o número de graus de liberdade. Ftab = f (α; n1 ; n2) n1 = número de g.l. do numerador n2 = número de g.l. do denominador . 0 . . 0 Se F . F Rejeita-se H Se F F Aceita-se H Calc tab Calc tab Variâncias homogêneas Tomada de decisão (conclusão): Exemplo • O pesquisador quer verificar se a imunocastração altera a largura (cm) dos testículos de suínos em relação a animais inteiros. Um experimento foi instalado com onze animais em cada grupo. As larguras observadas são: Imunocastrados 10,4 10,9 10,6 9,8 12,3 8,2 12,0 8,8 10,4 8,6 11,4 Inteiros 11,8 14,0 13,2 12,4 12,6 11,3 12,8 14,0 12,2 14,4 12,6 Teste, ao nível de 5%, se as larguras diferem. 19/08/2018 10 Variâncias não homogêneas • Caso as variâncias não sejam homogêneas é aplicada a aproximação de Satterthwaite (ou Welch) para os graus de liberdade usados e a estatística de teste fica: ( ) ( )1 2 1 2 . 2 2 1 2 1 2 Calc X X t s s n n − − − = + em que os graus de liberdade são calculados por: 2 2 2 1 2 1 2 2 2 2 2 1 2 1 2 1 21 1 s s n n v s s n n n n + = + − − Exemplo • O pesquisador quer verificar se a imunocastração altera o nível de indol (µg) de suínos em relação a animais inteiros. Um experimento foi instalado com onze animais em cada grupo. Os valores de indol observados são: Imunocastrados 0,0245 0,0270 0,0234 0,0232 0,0258 0,0237 0,0269 0,0246 0,0268 0,0263 0,0254 Inteiros 0,0428 0,0303 0,0462 0,0397 0,0427 0,0427 0,0332 0,0467 0,0459 0,0472 0,0422 Teste para duas amostras dependentes (pareados) • É utilizado quando o mesmo grupo de elementos é submetido a algum tipo de tratamento em duas situações distintas (ou dois tempos distintos). O objetivo seria saber se um determinado tratamento realizado faz com que o resultado final se altere. As hipóteses testadas são: 1 2 0 1 2 1 1 2 1 2 : vs H : H = A estatística de teste é dada por: 0 . d Calc d y t s n − = em que: ( )1 2 1 1 d média das diferenças entre os dois grupos, dada por: 1 1 , i = 1,2,...n s é o desvio padrão das diferenças entre os dois grupos, dado por d n n d i i i i i y y d y y n n= = → = = − 2 12 2 1 1 s 1 n in i d i i d d n n = = = − − 19/08/2018 11 Exemplo • Andrade & Ogliari (2007) apresentam um experimento conduzido para estudar o conteúdo de hemoglobina no sangue de suínos com deficiência de niacina. Aplicaram-se 20mg de niacina em oito suínos. Os níveis de hemoglobina no sangue foram mensurados antes e depois da aplicação da niacina. Os resultados obtidos no experimento foram: Animal 1 2 3 4 5 6 7 8 Antes 12,4 13,6 13,6 14,7 12,3 12,2 13,0 11,4 Depois 10,4 11,4 12,5 14,6 13,0 11,7 10,3 9,8 Tabela 1 – Níveis de hemoglobina no sangue antes e após a aplicação de niacina em suínos. Pode-se afirmar que a aplicação de niacina alterou a hemoglobina no sangue dos suínos?
Compartilhar