Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade II BIOESTATÍSTICA Profa. Ma. Mara Cynthia Probabilidade A teoria da probabilidade estuda as possibilidades da ocorrência de um experimento aleatório. Experimento aleatório: eventos que, mesmo quando repetidos inúmeras vezes, nas mesmas condições, podem apresentar resultados diferentes. Jogar um dado é um experimento aleatório. Sair o número 3 na face superior do dado é um evento. Espaço amostral ou Universo (U): resultados esperados. Probabilidade Probabilidade da Ocorrência de um Evento P(A) 𝑷 𝑨 = 𝒏(𝑨) 𝒏(𝑼) , 0 < P(A) < 1 N(A) = nº de elementos do conjunto de eventos N(U) = nº de elementos do espaço amostral Qual a probabilidade de sair o número 3 na face superior de um dado? P(A) = 1/6 ou 0,17 ou 17% Eventos Complementares: Sucesso + Insucesso = 100% Qual a probabilidade de não sair o número 3 na face superior de um dado: 100% - 17% = 83% Eventos Independentes (e): P= P1 x P2 Eventos Mutuamente Exclusivos (ou): P= P1 + P2 Distribuições teóricas de probabilidade Distribuições teóricas de probabilidade nos permitem determinar a probabilidade da ocorrência de determinados eventos: Quando temos variáveis discretas: nos permite especificar todos os resultados possíveis da variável aleatória e a probabilidade de sua ocorrência. Quando temos variáveis contínuas: nos permite determinar as probabilidades de sua ocorrência nos intervalos específicos de valores. Distribuição normal de probabilidade O aspecto gráfico de uma distribuição normal é (curva normal ou de Gauss): A área total limitada pela curva e pelo eixo das abscissas é igual a 1. É simétrica em torno da média: Fonte: a autora Distribuição normal reduzida de probabilidade A distribuição normal reduzida, ou padronizada, admite média 0 e desvio padrão 1. É indicada pela letra Z. Para reduzirmos os valores que desejamos para a curva padronizada, devemos utilizar a fórmula: A utilização da fórmula nos dá a associação das probabilidades à distribuição normal reduzida, que se apresenta na tabela de distribuição normal. Exemplo Admitindo que a distribuição de QI dos funcionários do Hospital e Maternidade Baruch de Toulouse seja normal, com média 100 pontos e desvio padrão 10 pontos, qual a probabilidade de um funcionário, tomado ao acaso, apresentar QI superior a 120 pontos? Temos: ഥ𝒙 = 100, s = 10 e desejamos saber P(X) > 120, x = 120 Então, temos: P(x) > 120 = P(Z) > 2 𝑧 = 𝑥 − ҧ𝑥 𝑆 𝑧 = 120 − 100 10 𝑧 = 20 10 𝑧 = 2 Exemplo Esboço de curva normal para P(z) > 2 A probabilidade de um funcionário, tomado ao acaso, apresentar QI superior a 120 pontos é de 2,28%. P(Z) >2 = P (z) > 0 – P(0 < z < 2) P(Z) >2 = 0,5 – 0,4772 P(Z) >2 = 0,0228 x 100 P(Z) >2 = 2,28% P(z) > 2 Fonte: a autora Interatividade Para melhorar as condições de pacientes com determinada doença crônica, existem 5 drogas: A, B, C, D e E. O gestor do Hospital Baruch de Toulouse recebeu, para seu departamento de pesquisas, verba suficiente para fazer a comparação de apenas três delas. Se o médico responsável pelo departamento escolher três drogas ao acaso para comparar e sabendo que o espaço amostral será de: U = {(A,B,C), (A,B,D), (A,B,E), (A,C,D), (A,C,E), (A,D,E), (B,C,D), (B,C,E), (B,D,E), (C,D,E)}, a probabilidade de a droga A ser escolhida por ele será de: a) 25% b) 60% c) 24% d) 30% e) 50% Introdução ao teste de hipóteses Pesquisa tem por objetivo responder às perguntas. Perguntas devem ser transformadas em hipóteses. Teste de hipóteses: mecanismo utilizado pela Estatística para generalizar uma pesquisa ou responder a uma hipótese. Testar uma hipótese pode ser, então, aceitar ou rejeitar uma afirmação sobre um determinado parâmetro. Hipótese nula (H0): a hipótese a ser testada. Hipótese alternativa (H1): a hipótese a ser considerada como uma alternativa à hipótese nula. Introdução ao teste de hipóteses Hipótese nula em um teste de hipótese relacionado com a média de uma população (mi) deve sempre especificar um único valor para aquele parâmetro. No caso de H0: = 0, podemos ter, de acordo com o que estivermos preocupados em decidir, para H1: 1. Teste bilateral: H1: 0, a média de uma população é diferente de um valor especificado. 2. Teste unilateral à esquerda: Então: H1: < 0, a média de uma população é menor que um valor especificado. 3. Teste unilateral à direita: Então: H1: > 0, a média de uma população é maior que um valor especificado. Aplicação do teste de hipóteses Após a definição das duas hipóteses, vamos utilizar os cálculos para determinar qual das hipóteses iremos rejeitar e qual iremos aceitar. Nível de significância (alfa): valor da probabilidade tolerável de incorrer no erro de rejeitar H0, quando H0 é verdadeira. Nível de significância de 5% significa que há uma confiança de 95% de que a decisão tomada foi acertada. Ainda pode ser de 10% ou de 1%. Então: = 0,05 ou = 0,10 ou = 0,01. Teste para amostras com a média de uma população Uma amostra é considerada pequena quando apresenta n < 30 e grande quando apresenta n 30. Amostras grandes n 30: Determinamos as hipóteses nula e alternativa. Definimos o nível de confiança. Calculamos o valor da estatística do teste (Zcalc). Exemplo O gestor do Hospital Baruch Toulouse verificou que o valor das refeições, em 2014, no restaurante que serve aos funcionários e clientes, que é terceirizado, teve preço médio de R$ 28,44 das refeições. Fez, então, uma pesquisa em 40 restaurantes, aleatoriamente escolhidos, na cidade e foi obtida média R$ 31,75 e desvio-padrão R$ 7,35. Os dados fornecidos proporcionam evidência suficiente para concluir que o preço médio pesquisado nos restaurantes da cidade é maior em relação ao restaurante que serve ao hospital? Utilize nível de significância de 1%. Devemos, em primeiro lugar, escrever as hipóteses: H0: = 28,44 (o preço médio não aumentou) H1: > 28,44 (o preço médio aumentou) Exemplo H0: = 28,44 (o preço médio pesquisado nos restaurantes da cidade é igual ao do restaurante que serve ao Hospital) H1: > 28,44 (o preço médio pesquisado nos restaurantes da cidade é maior do que o restaurante que serve ao Hospital) Cálculo do valor de z calculado: zcalc ഥ𝒙 = 𝟑𝟏, 𝟕𝟓, 𝝁 = 𝟐𝟖, 𝟒𝟒, 𝒔 = 𝟕, 𝟑𝟓, 𝒏 = 𝟒𝟎 𝒛𝒄𝒂𝒍𝒄 = ഥ𝒙 − 𝝁 𝑺 𝒏 = 𝟑𝟏, 𝟕𝟓 − 𝟐𝟖, 𝟒𝟒 𝟕, 𝟑𝟓 𝟒𝟎 = 𝟑, 𝟑𝟏 𝟕, 𝟑𝟓 𝟔, 𝟑𝟐 = 𝟑, 𝟑𝟏 𝟏, 𝟏𝟔 = 𝟐, 𝟖𝟓 Zcalc =2,85 Nível de significância 1%: = 0,01, Z0,01 = 2,33, Zcalc= 2,85 Logo, o preço médio pesquisado nos restaurantes da cidade é maior do que o restaurante que serve ao hospital. Exemplo Fonte: a autora Interatividade Em determinada maternidade, foram comparados os pesos de recém-nascidos de dois grupos de mães: fumantes e não fumantes para determinar se os recém-nascidos de mães fumantes nasciam abaixo do peso. Assinale a alternativa correta com relação às hipóteses de probabilidade geradas nesse estudo: a) H0: A probabilidade é a mesma para os dois grupos; H1: A probabilidade é maior para fumantes. b) H0: A probabilidade é maior para fumantes; H1: A probabilidade é menor para fumantes. c) H0: A probabilidade é a mesma para os dois grupos; H1: A probabilidade é igual para fumantes. d) H0: A probabilidade é a mesma para os dois grupos; H1: A probabilidade é diferente para fumantes. e) H0: A probabilidade é maior para os dois grupos; H1: A probabilidade é igual para fumantes. TesteT de Student para amostras pequenas Quando a amostra tem menos do que 30 elementos, procedemos da mesma forma do exemplo anterior e utilizamos outra tabela. Exemplo: A média de gastos com plano de saúde de todas as famílias, de certa região, é de R$ 1123,00 em um determinado ano. Nesse mesmo ano, coletando-se uma amostra aleatória de 15 famílias de classe média alta, obteve-se média R$ 1344,27 e desvio padrão de R$ 231,00. Com um nível de significância de 5%, os dados indicam que famílias da classe média alta gastam, em média, com plano de saúde, mais do que a média da região? Assuma que a distribuição de gastos com planos de saúde das famílias de classe média seja normalmente distribuída. Teste T de Student para amostras pequenas Ho: = 1123 (famílias da classe média alta gastam, em média, com plano de saúde, o mesmo do que a média da região) H1: > 1123 (famílias da classe média alta gastam, em média, com plano de saúde, mais do que a média da região) Dados: 0 = 1123; n = 15; ഥ𝒙 = 𝟏𝟑𝟒𝟒, 𝟐𝟕; s = 231 Nível de confiança: 5%, = 0,05 , Gl = n-1 (graus de liberdade) Gl = 15-1=14 t= 3,710 𝒕𝜶 = 𝟏, 𝟕𝟔 Como temos 𝒕 > 𝒕∝ ,o valor está dentro da área de rejeição. Rejeita-se H0 Famílias da classe média alta gastam mais do que a média da região com plano de saúde. Teste T de Student para amostras pequenas Fonte própria Teste de associação qui-quadrado clássico É utilizado para testar a significância entre duas variáveis qualitativas ou comparar duas ou mais amostras quando os resultados da variável resposta estão dispostos em categorias. O teste qui-quadrado clássico é utilizado quando o número total de dados é maior que 40. O cálculo do teste x² é utilizado para comparar valores observados e valores esperados, isto é, mede a distância entre as frequências observadas e as frequências esperadas na suposição das variáveis serem independentes (H0 verdadeira). Exemplo Foi feita uma pesquisa com uma amostra de 95 funcionários do Hospital e Maternidade Baruch de Toulouse, com a intenção de investigar o impacto da utilização dos cursos promovidos pelo método de ensino a distância, nas gerações x e y desses funcionários. Uma das questões da pesquisa era: “O curso promovido pelo método de ensino a distância é mais adequado do que o presencial”. As opções de respostas foram formuladas em escala Likert. O gestor do hospital não achou que a opção 3: Indiferente seja uma boa opção para essa resposta, então, decidiu testar com o teste qui-quadrado nessa opção, utilizando nível de confiança de 5%. H0: a opção de resposta 3: Indiferente deve ser considerada válida como qualquer outra resposta. H1: a opção de resposta 3: Indiferente não deve ser considerada válida como qualquer outra resposta. Exemplo Fonte: a autora Alternativas Geração X Geração Y Total 1: Não concordo totalmente 3 8 11 2:Não concordo parcialmente 2 16 18 3: Indiferente 0 6 6 4: Concorda parcialmente 8 31 39 5:Concordo totalmente 4 17 21 Total 17 78 95 Respostas Geração X Geração Y 1: Não concordo totalmente (11x17)/95=1,968421053 (11x78)/95=9,031578947 2:Não concordo parcialmente (18x17)/95=3,221052632 (18x78)/95=14,77894737 3: Indiferente (6x17)/95=1,073684211 (6x78)/95=4,926315789 4: Concorda parcialmente (39x17)/95=6,978947368 (39x78)/95=32,02105263 5:Concordo totalmente (21x17)/95=3,757894737 (21x78)/95=17,24210526 O curso promovido pelo método de ensino à distância é mais adequado do que o presencial? = 𝑡𝑜𝑡𝑎𝑙 𝑑𝑎 𝑙𝑖𝑛ℎ𝑎 𝑋(𝑡𝑜𝑡𝑎𝑙 𝑑𝑎 𝑐𝑜𝑙𝑢𝑛𝑎) (𝑡𝑜𝑡𝑎𝑙 𝑔𝑒𝑟𝑎𝑙) 𝑥2 = Ʃ (𝑂 − 𝐸 ) 𝐸 O curso promovido pelo método de ensino à distância é mais adequado do que o presencial? O curso promovido pelo método de ensino à distância é mais adequado do que o presencial? Respostas Geração X Geração Y 1: Não concordo totalmente (3-1,968421053)²/1,968421053=0,540613566 (8-9,031578947)²/9,031578947=0,117826034 2:Não concordo parcialmente (2-3,221052632)²/3,221052632=0,462882697 (16-14,77894737)²/14,77894737=0,10088469 3: Indiferente (0-1,073684211)²/1,073684211=1,073684211 (6-74,926315789)²/4,96315789=0,234008097 4: Concorda parcialmente (8-6,978947368)²/6,978947368=0,149384774 (31-32,02105263)²/32,02105263=0,03255822 5:Concordo totalmente (4-3,757894737)²/3,757894737=0,015597818 (17-17,24210526)²/17,24210526=0,003399524 Total 2,242163066 0,488676566 x2 = 2,242163066 + 0,488676566 x2 = 2,730839631 GL = (número de linhas -1) x (número de colunas -1) gl = (5–1) x (2-1) = 4x1 = 4 O valor encontrado na tabela é xt = 9,49 ( = 5%) Exemplo Fonte: a autora 𝑥2 = Ʃ (𝑂 − 𝐸 ) 𝐸 O curso promovido pelo método de ensino à distância é mais adequado do que o presencial? Respostas Geração X Geração Y 1: Não concordo totalmente (3-1,968421053)²/1,968421053=0,540613566 (8-9,031578947)²/9,031578947=0,117826034 2:Não concordo parcialmente (2-3,221052632)²/3,221052632=0,462882697 (16-14,77894737)²/14,77894737=0,10088469 3: Indiferente (0-1,073684211)²/1,073684211=1,073684211 (6-74,926315789)²/4,96315789=0,234008097 4: Concorda parcialmente (8-6,978947368)²/6,978947368=0,149384774 (31-32,02105263)²/32,02105263=0,03255822 5:Concordo totalmente (4-3757894737)²/3,757894737=0,015597818 (17-17,24210526)²/17,24210526=0,003399524 Total 2,242163066 0,488676566 Graus de Liberdade α 10% 5% 1% 1 2,7055 3,8415 6,6349 2 4,6052 5,9915 9,2103 3 6,2514 7,8147 11,3449 4 7,7794 9,4877 13,2767 5 9,2364 11,0705 15,0863 6 10,6446 12,5916 16,8119 Exemplo Se x2 ≤ xt H0 deve ser aceita Se x2 > xt H0 deve ser rejeitada 2,73 < 9,49 H0 deve ser aceita H0: A opção de resposta 3: Indiferente deve ser considerada válida como qualquer outra resposta. H1: A opção de resposta 3: Indiferente não deve ser considerada válida como qualquer outra resposta. Então, indiferente deve ser uma resposta considerada válida como qualquer outra resposta. Interatividade Leia atentamente as afirmações: I. O teste de associação qui-quadrado permite testar a significância entre duas variáveis qualitativas, como também comparar duas ou mais amostras quando os resultados da variável resposta estão dispostos em categorias. II. O teste qui-quadrado clássico é utilizado quando o número total de dados é menor que 40. III.A estatística do teste x² é uma espécie de medida de distância entre as frequências observadas e as frequências que esperaríamos encontrar em cada célula, na suposição das variáveis serem independentes, isto é, H0 verdadeira. De acordo com as afirmações, assinale a alternativa correta: a) Apenas a afirmação I está correta. b) Apenas as afirmações I e II estão corretas. c) Apenas as afirmações I e III estão corretas. d) Apenas as afirmações II e III estão corretas. e) Todas as afirmações estão corretas. Correlação e regressão Testa a relação entre duas variáveis. Diagrama de dispersão é a representação gráfica da relação entre duas variáveis. Correlação linear positiva Correlação linear negativa Correlação não linear Correlação nula Fonte: a autora Coeficiente de correlação de Pearson (R) É definida pela fórmula: Os valores limites de R são -1 e +1. r = +1: correlação perfeita e positiva. r = -1: correlação perfeita e negativa. r = 0: não há correlação entre as variáveis. 0,6≤|r|≤1: há correlação entre as variáveis. 0,3<|r|<0,6: há correlação relativamente fraca entre as variáveis. 0<|r|<0,3: a correlação é muito fraca e praticamente nada se pode concluir sobre a relação entre as variáveis em estudo. ExemploO gestor do Hospital Baruch de Toulouse deseja avaliar o curso que está proporcionando a seus colaboradores no sistema educação a distância. Para estudar, o colaborador tem acesso a questionários relativos aos conteúdos. Após fazer o questionário, obtém a nota relativa ao seu desempenho. Ao final do curso, o colaborador faz uma prova para ser avaliado sobre o que aprendeu. O gestor deseja saber se existe correlação entre a nota média dos questionários feitos pelo aluno e a nota da prova feita ao final do curso. Para tanto, colheu uma amostra, por amostragem aleatória simples, de 10 colaboradores e obteve os resultados: De acordo com a fórmula, foi criada uma nova tabela já com os somatórios necessários Exemplo Fonte: a autora Exemplo De acordo com a fórmula, foi criada uma nova tabela já com os somatórios necessários Portanto existe correlação entre as variáveis0,6≤|0,8958|≤1 Fonte: a autora Interatividade O gestor do Hospital Baruch de Toulouse deseja saber se existe correlação entre o tempo de estudo e as notas de provas no curso que está proporcionando a seus colaboradores. De acordo com a tabela e o diagrama que resultaram da pesquisa, assinale a alternativa correta: a) Existe uma correlação perfeita positiva entre o tempo de estudo e a nota da prova. b) Existe uma correlação perfeita negativa entre o tempo de estudo e a nota da prova. c) Existe uma correlação positiva entre o tempo de estudo e a nota da prova. d) Existe uma correlação negativa entre o tempo de estudo e a nota da prova. e) Não existe correlação entre o tempo de estudo e a nota da prova. Fonte: a autora ATÉ A PRÓXIMA!
Compartilhar