Baixe o app para aproveitar ainda mais
Prévia do material em texto
Impresso por Lyn Tv, CPF 045.762.702-65 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e não pode ser reproduzido ou repassado para terceiros. 12/03/2022 19:33:50 - -11 Outro exemplo que podemos utilizar sobre a probabilidade condicional é pensando se a probabilidade de estar com alguma parasitose intestinal é igual a probabilidade de estar infectado por .S. mansoni Para descobrir isto, pensaremos o seguinte: Em ambos os exemplos temos um universo amostra de 256 pacientes e, em ambos os casos, a probabilidade de estar infectado por é de e a probabilidadeS. mansoni 0,445 de estar infectado por protozoários é de Agora, podemos ver a relação entre as duas estimativas: 0,465. . Assim, podemos afirmar que a probabilidade de ter parasitose intestinal é um pouco maior que a probabilidade de estar infectado por , S. mansoni ou podemos dizer que a probabilidade de estar infetado por parasitose intestinal 1,04 vezes maior que a probabilidade de estar infectado por S. mansoni. Se o valor apresentado fosse 2,4, poderia dizer que a probabilidade de uma pessoa ter sido infectada com parasitose intestinal seria 2,4 vezes maior, ou teria 2,4 vezes mais chance de encontrar uma pessoa infectada por parasitose intestinal que S. mansoni. Impresso por Lyn Tv, CPF 045.762.702-65 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e não pode ser reproduzido ou repassado para terceiros. 12/03/2022 19:33:50 - -12 2 Tipos de distribuições Para conferir as informações de distribuição de probabilidade, é importante conhece-la, para saber como os dados são distribuídos. Isto ajudará você a saber como explorar esta informação. Os dados podem ter algumas distribuições, sendo ou ou ou .distribuição normal paramétrica distribuição não normal não paramétrica Além disso, a distribuição normal pode ser e .simétrica assimétrica Impresso por Lyn Tv, CPF 045.762.702-65 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e não pode ser reproduzido ou repassado para terceiros. 12/03/2022 19:33:50 - -13 2.1 Tipos de distribuição normal Distribuição normal uniforme (ou retangular): quando tem apenas um valor em toda a distribuição. Um exemplo onde podemos encontrar uma distribuição uniforme é quando vamos a uma sala de aula. Nela, todos os alunos têm a mesma idade ou elas são praticamente iguais. O gráfico de distribuição uniforme nos permite identificar isso. No gráfico abaixo, observamos como a linha é uniforme (FARBER; LARSON, 2015) e (VON HIPPEL, 2005). Figura 1 - Distribuição uniforme. Fonte: Elaborado pelo autor, 2020 #PraCegoVer: Na imagem, vemos um gráfico com barras e uma linha passando horizontalmente em suas extremidades. A distribuição uniforme é considerada simétrica quando a e são . Neste caso,média mediana valores iguais ambos são 9. Distribuição normal assimétrica: quando, no gráfico de frequência, ocorre uma cauda, o que permite que ela se alongue para um dos lados. A distribuição pode ser ou :assimétrica positiva negativa Negativa: quando a cauda alonga para a esquerda. Positiva: quando a sua cauda alonga para a direita. No gráfico “Distribuição assimétrica à esquerda (negativo) e à direita (positivo)” é possível ver a cauda das distribuições: Impresso por Lyn Tv, CPF 045.762.702-65 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e não pode ser reproduzido ou repassado para terceiros. 12/03/2022 19:33:50 - -14 Fonte: Elaborado pelo autor, 2020 #PraCegoVer: Na imagem, vemos um gráfico com barras que diminuem de tamanho da esquerda para direita, com uma linha horizontal em suas extremidades. O que determina um gráfico ter uma distribuição normal assimétrica é que a e são média mediana valores entre si.diferentes • Distribuição normal simétrica Quando uma linha vertical pode ser desenhada pelo meio do gráfico da distribuição e as metades resultantes são imagens espelhadas. Em termos práticos, um espelhamento aproximado pode caracterizar uma distribuição simétrica. • Impresso por Lyn Tv, CPF 045.762.702-65 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e não pode ser reproduzido ou repassado para terceiros. 12/03/2022 19:33:50 - -15 2.2 Distribuição normal simétrica, gaussiana ou paramétrica A curva normal também é conhecida como curva de Gauss, e é amplamente utilizada em todas as áreas do conhecimento porque o conceito de normalidade ocorre naturalmente em praticamente todas as medições naturais. Para os dados, quando seguem uma distribuição normal, são necessárias algumas características como: que seja uma variável continua e esta variável não deve ser dicotômica; que a proporção dos dados para toda a população não estejam disponíveis, fazendo a necessidade de ter um modelo estatístico cujo será uma amostra que represente toda esta população (VIEIRA, 2011). Na bioestatística, as variáveis quantitativas contínuas, que seguem um padrão em suas distribuições de frequências, podem ser vistas como distribuições de probabilidade e suas aplicações têm enorme utilidade cientifica e prática. A curva normal é caracterizada por dois parâmetros, sendo ela a e o . Dessa forma é possível imaginar a existência de infinitas curvas normais,média desvio-padrão tendo em conta variações, tanto da média como na variância comumente, encontradas em variáveis continuas (SAMPAIO, 2015). Impresso por Lyn Tv, CPF 045.762.702-65 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e não pode ser reproduzido ou repassado para terceiros. 12/03/2022 19:33:50 - -16 2.3 Curva normal reduzida É também conhecida como distribuição normal reduzida, distribuição normal padronizada, escore padrão ou, ainda, estatística . O uso da curva normal reduzida surgiu em decorrência da possibilidade de existência de umaZ série infinita de curvas normais, representando a distribuição normal de probabilidade, onde cada uma é definida pelos valores que a média e o desvio-padrão podem assumir para cada caso em particular. Essa particularidade faz surgir a distribuição de referência, aqui denominada distribuição normal padronizada, cuja característica fundamental é assumir que e o . Como resultadoa média é igual a zero desvio-padrão é igual a 1 dessa transformação aplicada a cada valor de , temos o surgimento de uma nova variável, que é denominada .x Z Essa variável mede quanto um determinado valor de afasta da média, em unidades de desvio-padrãox (SAMPAIO, 2015). É possível ver na figura que, se o valor coincide com a média, seu escore é zero. A variação estatística ocorreZ comumente no intervalo de ±3 desvio-padrão, onde, neste intervalo, incluem praticamente toda a amostra estudada, mais precisamente 99,74%. O cálculo da estatística , ou escore padrão, ou curva normal reduzida, é dado pela expressão:Z Onde: Z: afastamento dos valores de x em relação à média em número de desvio padrão; X: valor de qualquer variável aleatória. : média da distribuição. : desvio-padrão da distribuição. Quando Z=1, a área entre este valor e a média é de 0,3413 ou 34,13%. Já a área entre Z=±1 é de 0,6826 ou 68,26%. Suponhamos que, em uma distribuição de glicose plasmática em jejum, de homens com idade entre 30 e 39 anos, encontrou-se uma média ( ) de 100mg/dl e um desvio-padrão ( ) de 15mg/dl. Qual a proporção de pessoas com glicose plasmática entre 100mg/dl e 120mg/dl? Fique de olho Qual a diferença entre x e z? A variável x é conhecido como resultado bruto, cujo representa o valor da distribuição normal não reduzida ou não padrão. Já o valor de z representa o valor da distribuição normal reduzida ou padrão (FARBER; LARSON, 2015) Impresso por Lyn Tv, CPF 045.762.702-65 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e não pode ser reproduzido ou repassado para terceiros. 12/03/2022 19:33:50 - -17 Para este caso basta aplicarmosa equação , onde teremos: Agora, podemos encontrar, na tabela da curva normal, para o intervalo z=0 e z=1,33, que é igual a 0,4082 ou 40,82%. Tabela 4 - Distribuição de frequência normal acumulada de z (área sob a curva norma de 0 a z). Fonte: SAMPAIO, 2015 #PraCegoVer: na imagem, vemos uma tabela de distribuição de frequência normal acumulada de Z, com várias colunas e linhas, cada uma com um número inserido. Impresso por Lyn Tv, CPF 045.762.702-65 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e não pode ser reproduzido ou repassado para terceiros. 12/03/2022 19:33:50 - -18 Assista aí https://fast.player.liquidplatform.com/pApiv2/embed/746b3e163a5a5f89a10a96408c5d22c2 /42b6a155e3539fb5c86a15bb35c184e2 Impresso por Lyn Tv, CPF 045.762.702-65 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e não pode ser reproduzido ou repassado para terceiros. 12/03/2022 19:33:50 - -19 3 Testes estatísticos Os testes estatísticos trazem uma análise inferencial sobre determinado evento. Assim, ele retira o viés subjetivo do analisador e, qualquer um que analisar o conjunto de dados, poderá obter a mesma resposta, desde que se tenha a mesma pergunta. Impresso por Lyn Tv, CPF 045.762.702-65 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e não pode ser reproduzido ou repassado para terceiros. 12/03/2022 19:33:50 - -20 3.1 Intervalo de confiança Um problema comum nas análises estatísticas é estimar parâmetros que possam auxiliar na caracterização de uma variável. Como exemplo, podemos citar a porcentagem de pacientes que se recuperam em um certo tratamento ou o tempo médio que demanda um anestésico para ter o efeito desejável. Os intervalos de confiança constituem uma série de métodos que permitem obter conclusões acerca de uma população, a partir de uma amostra representativa. O intervalo de confiança é um meio de de maneiraexpressar a precisão estatística útil, sob o ponto de vista estatístico. É comum pensar que o intervalo de confiança é a probabilidade e que o verdadeiro parâmetro que estamos buscando esteja dentro desse intervalo. Os intervalos de confiança são úteis porque definem um limite superior e inferior, que são consistentes com os dados do nosso estudo, porém, não nos informam de nenhuma probabilidade de se achar onde está o verdadeiro parâmetro que buscamos. Uma das utilidades dos intervalos de confiança é dar uma ideia da da dispersão ou da variabilidade dasamplitude estimativas obtidas pelas amostras. Um intervalo de confiança muito grande implica na suspeição de que o resultado obtido é de ou de pouca credibilidade. Já intervalos de confiança cujas amplitudes debaixa acurácia variação são pequenas possuem e credibilidade (FARBER; LARSON, 2015) (TAYLOR; BLAIR,maior acurácia 2013). O intervalo de confiança deve conter uma probabilidade de erro, que surge do conhecimento do modelo de distribuição de frequência do fenômeno que se deseja investigar. Geralmente, os modelos biológicos se aplicam à distribuição de normalidade, que exige o conhecimento da variância e, por consequência, do desvio-padrão. Universalmente, os intervalos de confiança usados em pesquisas médicas utilizam coeficientes de 95% ou 99%, os quais nos dão a probabilidade com que o método resultará em uma resposta correta e compatível com a expectativa do pesquisador. Um coeficiente de 95% permite concluir que, se repetimos 100 vezes a mesma pesquisa, a margem de erro é de apenas 5% ou, em outras palavras, um erro a cada 20. Isto é o que se deseja em 95% do intervalo de confiança e que o verdadeiro valor da população não esteja dentro do intervalo de confiança em apenas 5%. O nível de significância (1-α) pode ser igual a 99%, 95%, 90%, entre outros. Comumente, nos artigos científicos é comum observar que o nível de significância utilizado é de 95% ou α é igual a 0,05. Ao estimarmos o parâmetro, podemos estar utilizando uma daquelas amostras dentre as 5% que geram estimativas intervalares, com erro amostrais acima do desejável. Um intervalo de confiança de 95% de segurança somente é válido quando todos . Quando este princípio é violado, provoca oos integrantes da amostra são independentes uns dos outros erro amostral, que compromete a utilização do intervalo de confiança para inferências dos parâmetros populacionais (SAMPAIO, 2015).
Compartilhar