Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 PROBABILIDADE E DISTRIBUIÇÕES DE PROBABILIDADE O estudo da probabilidade poderá auxiliar no estudo de índices do conceito de qualidade de testes diagnósticos. Fenômenos aleatórios: Situações em que os resultados possíveis são conhecidos, mas não se pode saber a priori qual deles ocorrerá. Especo amostral: Consiste no conjunto de todos os resultados possíveis de um experimento aleatório (S). Evento simples: Quando o espaço amostral é constituído de apenas um elemento. Seja um evento qualquer (A), considerando os casos favoráveis (F) e os contrários (C), a probabilidade de ocorrência do evento A é: CF FAP )( Numa determinada população, dividida em grupos de pessoas que residem em áreas diferentes, ocorre presença de hipertensos em 3 áreas, das 13 totais. Qual a probabilidade de ocorrência de hipertensos em uma área qualquer? P(A) = 3/13 = 0,2308 = 23,08%. Regras para combinar probabilidades: Regra 1: Ocorrência de eventos mutuamente exclusivos. A ocorrência de um exclui a ocorrência do outro. Numa amostra de pessoas examinadas, de cada 52, quatro apresentaram ácido úrico alto e quatro são hipertensas. Qual a probabilidade de, escolhendo uma pessoa aleatoriamente, ser hipertensa ou apresentar ácido úrico alto? P(A) = 13 2 52 8 52 4 52 4 0,1538 = 15,38%. Regra 2: Ocorrência de eventos independentes. A ocorrência de um não afeta a ocorrência de outros. Um casal é heterozigoto para o alelo recessivo olho azul. Qual a probabilidade de que os dois primeiros filhos tenham olhos azuis? (Aa x Aa) AA; Aa; Aa e aa. No caso de olho azul (aa), P(aa) = 4 1 para cada filho. Como cada filho é um evento independente do outro, então: P(2 filhos) = 16 1 4 1* 4 1 0,0625 = 6,25%. Observação: Além das regras supracitadas, deve-se atentar para eventos com ou sem reposição, pois implicará diretamente no desenvolvimento das operações. 2 Exemplos envolvendo eventos com e sem reposição: Num laboratório, um armário contém 5 ampolas da substância A, 4 da substância B e 3 da substância C. Retiram-se simultaneamente 3 ampolas. Qual a probabilidade de: a) Nenhuma seja da substância A? %.91,151591,0 44 7 10 5* 11 6* 12 7.. AAAPASNP b) Exatamente uma seja da substância A? %.73,474773,0 44 21 44 7*3 10 6* 11 7* 12 5*3.... AAAPASUEP c) Todas sejam da mesma substância? %.8182,6068182,0 44 3 10 1* 11 2* 12 3 10 2* 11 3* 12 4 10 3* 11 4* 12 5.... CCCPBBBPAAAPSMSTP Se fosse retirada uma só ampola, ou as ampolas não fossem retiradas aao mesmo tempo, uma questão poderia ser, por exemplo: Num laboratório, um armário contém 5 ampolas da substância A, 4 da substância B e 3 da substância C. Retiram-se 3 ampolas ao acaso, repondo-se logo em seguida. Qual a probabilidade de todas sejam da mesma substância? %.50,121250,0 1728 216 1728 27 1728 64 1728 125 12 3 12 4 12 5.... 333 CCCPBBBPAAAPSMSTP Verifiquem a forma de resolução, assim como a resposta da letra C da primeira questão e a segunda questão. Teoricamente são resolvidas da mesma forma, mas ao seguir a linha de raciocínio de cada uma delas, elas diferem numericamente! Probabilidade da reunião de dois eventos. Conforme os diagramas abaixo, tem-se: 1 – Reunião de dois eventos sem interseção: 3 P(A U B) = P(A) + P(B) 2 – Reunião de dois eventos sem interseção: P(A U B) = P(A) + P(B) - P(A∩B) Probabilidade da reunião de três eventos: P(A U B U C) = P(A) + P(B) + P(C) - P(A∩B) - P(A∩C) - P(B∩C) + P(A∩B∩C) Neste caso, pode-se deduzir que, em reunião de mais eventos, considera-se o seguinte padrão: Eventos ímpares são sempre somados, ao passo que os pares são subtraídos. Probabilidade do complemento: P(A) + P(Ā) = 1 P(Ā) = 1 - P(A) 4 Probabilidade do conjunto vazio P(A) = P(A U ) = P(A) + P() = P(A) P() = P(A) - P(A) P() = zero. Probabilidade condicional: Neste caso, há restrição do espaço amostral. Sejam A e B são eventos associados a um experimento [E]. Representa-se P(B/A) a probabilidade condicionada do evento B quando A tiver ocorrido. Assim: AP BAP A BP BP BAP B AP e Num grupo de diabéticos assistidos existem indivíduos discriminados da seguinte forma: 5 de sexo masculino com mais de 21 anos; 5 do sexo masculino com menos de 21 anos; 6 do sexo feminino com mais de 21 anos e 2 do sexo feminino com menos de 21 anos. Ao escolher uma pessoa ao acaso, qual a probabilidade de que: a) Tenha mais de 21 anos? P(a) = 18 11 18 65 0,6111 = 61,11%. b) seja do sexo feminino dado que tenha menos de 21 anos? P(♀ / < 21 anos) = 52 2 anos) 21 P( anos) 21 P(Feminino 0,2857 = 28,57%. Exemplo de aplicação: Consideremos 250 alunos que cursam o ciclo básico da UESC. Desses, 100 são homens (H), 150 são mulheres (M), 110 cursam biomedicina e 140 cursam biologia. A distribuição dos alunos é a seguinte: CURSO SEXO BIOMEDICINA BIOLOGIA TOTAL Homem 40 60 100 Mulher 70 80 150 Total 110 140 250 Um aluno é sorteado ao acaso. Qual a probabilidade de que esteja cursando biologia, dado que é mulher? 5 .0 se ; :Logo log 150 80 250 150 250 80 log 250 150 250 80log 150 80log BP BP BAP B AP MulherP MulheriaBioP Mulher iaBioP MulherPiaBioMulherP Mulher iaBioP Probabilidade Total: Conforme o diagrama abaixo: O espaço amostral (S) de um experimento [E] foi dividido em três eventos: R1, R2 e R3, onde: R1 ∩ R2 = ; R1 ∩ R3 = ; R2 ∩ R3 = e R1 U R2 U R3 = S. O evento B está contido no espaço amostral (S) e pode ser representado por: B = B ∩ S. Como S = R1 U R2 U R3 B = B ∩ (R1 U R2 U R3) ou B = (B ∩ R1) U (B ∩ R2) U (B ∩ R3) e P(B) = P[(B ∩ R1) U (B ∩ R2) U (B ∩ R3)]. Como (B ∩ R1), (B ∩ R2), (B ∩ R3) são eventos mutuamente exclusivos, P(B) = P(B ∩ R1) + P(B ∩ R2) + P(B ∩ R3). No caso de probabilidades condicionais, P(A ∩ B) = P(A/B)*P(B). Assim, P(B) = P(B/R1)*P(R1) + P(B/R2)*P(R2) + P(B/R3)*P(R3). De forma geral, a probabilidade total poderá ser escrita da seguinte forma: P(B) = P(B/R1)*P(R1) + ... + P(B/Rn)*P(Rn). De forma geral: n i i i RPR BPBP 1 * Determinada doença pode ser diagnosticada mediante teste em 50% dos que tomam determinada substância. Caso não seja ingerida tal substância, sua probabilidade de diagnóstico é de 25%. Detectou-se que a probabilidade de ingestão da substância ocorreu em 30% dos que se submeteram ao teste. Qual a probabilidade da doença ser diagnosticada? Eventos: Ocor A doença ocorrer; Ing Ingestão da substância; Ning Não ingerir a substância. P(Ocor) = P(Ocor / Ing) * P(Ing) + P(Ocor / Ning) * P(Ning) P(Ning) = 1 - 0,3 = 0,7 6 P(Ocor) = 0,5 * 0,3 + 0,25 * 0,7 = 0,325 = 32,5%. Teorema de Bayes Caso se deseja avaliar a probabilidade de ocorrência de uma das componentes dado que a probabilidade total tenha ocorrido, tem-se: P(Ri / B) = P(Ri ∩ B) / P(B) P(Ri ∩ B) * P(Ri). Substituindo-se os valores, tem-se: n K K K i ii RPR BP RPR BP B RP 1 * * As equipes A e B são responsáveis por 60% e 40%respectivamente, da análise de amostras. Os índices de defeitos nas análises das equipes são 3% e 7% respectivamente. (Estas análises irão ser repetidas) Se uma análise defeituosa for selecionada da produção das equipes, qual é a probabilidade de que tenha sido produzida pela equipe B? Eventos: A: A análise ter sido produzida pela equipe A; B: A análise ter sido produzida pela equipe B; d: a análise ser defeituosa (necessitar ser repetida) %.87,606087,0 4,0*07,06,0*03,0 4,0*07,0 */*/ */ BPBdPAPAdP BPBdP d BP 7 Distribuição de probabilidade: Fornece a probabilidade de cada valor de uma variável aleatória. Variável - Consiste em qualquer característica que pode ser medida ou categorizada. Variável aleatória: Uma variável que tem um valor numérico único (determinado aleatoriamente), para cada resultado de um experimento. Variável Aleatória discreta: Admite número finito de valores ou quantidade enumerável de valores. Variável Aleatória Contínua: Admite valores mensuráveis em uma escala contínua podendo ser infinitos valores entre dois valores, pois depende da escala a ser utilizada. Cada variável aleatória tem uma distribuição correspondente. Distribuição de probabilidade - Consiste num conjunto de valores de uma variável aleatória juntamente com suas probabilidades correspondentes. Famílias de distribuições: Pelo fato das distribuições serem utilizadas para modelar populações, lidam-se com famílias ao invés de uma única. A família é indexada por um ou mais parâmetros, o que permite variar certas características da distribuição, ao mesmo tempo em que permanece com uma forma funcional. Distribuições Discretas: Distribuição uniforme discreta; distribuição de Bernoulli; distribuição hipergeométrica; distribuição binomial; distribuição de Poisson; distribuição binomial negativa e distribuição geométrica. Distribuição Binomial – Consiste numa distribuição que tem como base uma variável aleatória discreta dicotômica (que pode assumir um de dois possíveis valores, que costumam ser denominadas de fracasso ou sucesso, representadas, respectivamente, por 0 e 1). Distribuição de Poisson – Distribuição discreta de probabilidade que se aplica às ocorrências de um evento ao longo de um intervalo especificado de tempo, distância, área, volume ou outra unidade semelhante. Esta distribuição pode ser usada como aproximação da distribuição binomial, em casos onde o número de eventos é muito grande e a probabilidade de ocorrência, muito pequena. Chamadas situações limítrofes. 8 Distribuições Contínuas: Distribuição uniforme; distribuição de Weibull; distribuição gama; distribuição normal; distribuição beta; distribuição de Cauchy; distribuição lognormal e distribuição normal dupla. Distribuições de Amostragem: Distribuições de probabilidade de estatísticas ou de funções de estatísticas, que descrevem seu comportamento ao longo de infinitas amostras. Distribuição associada à média – Distribuição t de Student. Distribuição associada à variância – Distribuição qui- quadrado. Distribuição associada à razão entre duas variâncias – Distribuição F de Snedecor. ------------------------------------------- Na distribuição binomial, a parte referente ao binômio de Newton consiste no número de resultados com exatamente X sucessos em N provas. A parte referente aos valores de “p” e “q” consiste na probabilidade de X sucessos em N provas para determinada ordem. Distribuição Binomial Fórmula: ordem. adeterminad para provasn em sucessos x de adeprobabilid provasn em sucessos x exatamente com resultados de * !)!( !**)( xnx Número xnxn x qPxxn nqP x n XP C Resolução de um binômio de Newton e suas implicações com a distribuição binomial: A parte envolvendo as combinações entre o número de resultados com exatamente X sucessos em ‘n’ provas tem como princípio a relação (p + q)n, a saber: .7213535217qp ... 1. e 2 1; :são escoeficient Cujos 2 1. e 1 :são soeficiente Cujos .1 ecoeficient úinco Cujo )( 7652433425677 222 1 0 qpqqpqpqpqpqpp qpqpqp qpqp qp Se estivermos diante da seguinte situação: n = 7 e x = 3: 9 .35 :é deseja se que componente a caso, Neste 35 !37!*3 !7 3 7 3 7 43qpC Uma forma de verificar os coeficientes, conforme o expoente a ser utilizado é mediante o triângulo de pascal, a saber: 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 1 6 15 20 15 6 1 1 7 21 35 35 21 7 1 Parâmetros – características - da distribuição: Média: μ = n * p; Variância: σ2 = n * p * q; Desvio Padrão: σ = (n * p * q)1/2 Função característica: niwpeq Esta distribuição permite o estudo de fenômenos que só contemplam duas alternativas: Sucesso ou fracasso. Esses tipos de ensaios são ditos independentes. Como esses ensaios foram investigados por James Bernoulli, no final do século XVII, são denominados ensaios de Bernoulli. Aplicação: Os registros dos laboratórios indicam que 30% dos exames são pagos mediante planos de saúde. De 10 exames feitos, qual a probabilidade de, exatamente três, serem pagos pelos planos? x = número de exames pagos pelos planos n = 10; p = 30% = 0,3; q = 1 - 0,3 = 0,7. %.68,262668,0)3()7,0(*)3,0(* !3)!310( !10)7,0(*)3,0(* 3 10 )3( 733103 pp Se a probabilidade de ocorrência de procedimento equivocado nas análises laboratoriais é de 30%, determinar a média e o desvio padrão da distribuição de procedimentos inadequados num total de 800 exames. n = 800; p = 0,3; q = 1 - 0,3 = 0,7. μ = n * p = 800 * 0,3 = 240 ocorrências de procedimentos inadequados σ = (n * p * q)1/2 = (800 * 0,3 * 0,7)1/2 σ 12,96 ocorrências. Um exemplo com complemento: Um levantamento efetuado num laboratório indicou que 20% dos exames para detectar dengue não apresentam diagnósticos verdadeiros, isto é, se trata de outra enfermidade. Se em determinado dia foram feitos 07 exames, determine 10 a probabilidade de que, no mínimo, três exames não apresentem diagnósticos verdadeiros. Exame c/ diagnóstico verdadeiro: P(V) = 0,8 Exame com diagnóstico falso: P(F) = 0,2 P[X 3] = 1 – P[X 2] = %3328,99995328,0004672,01 1*0000125,0*18,0*000064,0*764,0*00032,0*211 8,0*2,0* 0 7 8,0*2,0* 1 7 8,0*2,0* 2 7 1 8,0*2,0* 7 7 8,0*2,0* 6 7 8,0*2,0* 5 7 1 071625 071625 ou Uma aplicação interessante da distribuição binomial, na prática, foi a seguinte: Até o ano de 1981 o vestibular da UFBA apresentava provas com questões de múltipla escolha com cinco alternativas cada. De A até E. De 1982 em diante, foi dotado um novo sistema, em que cada questão apresenta 100 alternativas, variando de 00 a 99. Onde entra a distribuição binomial nessa história? Um candidato faz uma prova com 100 questões. Na primeira situação, ele encontrará cinco alternativas em cada questão. Numa segunda situação, ele encontrará 100 alternativas em cada questão. Se ele não sabe absolutamente nada, qual a média e o desvio padrão de acertos nas provas às quais ele se submeteu? Sistema 1: Alternativas (A; B; C; D e E). questões. 24 a 16 entre Acertaria 4 5 4*5 1*100** 20 5 1*100* qpn pn Sistema 2 - Alternativas: 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 questões. 0,9951 Acertaria 995,0 100 99* 100 1*100** 1 100 1*100* qpn pn Este sistema se for feito apenas com questões abertas, praticamente elimina o chute! 11 Distribuição de Poisson Quando o número de provas (n) tende para o infinito e a probabilidade (p) do evento de cada prova é próxima de zero, tem-se um caso limítrofe da distribuição binomial, sendo a distribuição de Poisson adequada para eventos independentes e raros. Assim, ! ***lim)( x eqp x n xp x xnx x onde: x = número de ocorrências ou sucessos; λ = valor esperado [média] λ = n * p Variância σ2 = λ e = base neperiana ou natural = 2,71828, oriunda da relação: .)(lim11)( exf x xf x x Principais características: 1 2 : : : : iweeticaCaracterísFunção PadrãoDesvio Variância Média Pode-se exemplificar tal situação com um exemplo, como segue: Uma alteração ocorre nove vezes a cada 1000 exposições à luz de determinada substância. Calcule a probabilidade de que num laboratório onde foram feitas: a) 200 exposições sejam detectadas oito alterações; b) 500 exposições, não haja nenhuma alteração. Experimento Observação de uma alteração 991,0009,01)( 009,01000 9)( Np Ap No item a, o experimento é repetido independentemente 200 vezes Há interesse na ocorrência de oito sucessos ( A = alteração) e 192 fracassos independentes da ordem de ocorrência. Resposta do item (a): .00042,000045,0 !8 )8,1(* )8( 8,1009,0*200*00042,0)991,0(*)009,0(* 8 200 )8( 88,1 1928 exp pnxp 12 Resposta do item (b): 0111,0 !0 )5,4(*)0(5,4009,0*500* 05,4 exppn Distribuição Normal de probabilidade Representação Gráfica: Função matemática: 2 2 1 * 2 1)( x exf Média = μ; Variância: σ2(x) = σ2. Desvio Padrão: σ Função característica: 2 22 i ew Algumas propriedades: - A probabilidade de um valor singular é zero; - Só há sentido em determinar probabilidade de intervalos. - O espaço amostral (S) tem probabilidade demonstrada pela seguinte relação: ][1)( Sdxxf Como muitos fenômenos estudados na Agronomia, na Biologia e na Medicina Veterinária são normalmente distribuídos ou muito aproximados, torna-se indispensável o estudo e o domínio do conhecimento desta distribuição, sendo, inclusive, um dos pressupostos da análise de variância, técnica amplamente 13 utilizada na pesquisa, seja na Experimentação Agrícola, Ciência Animal e/ou Ciências Biológicas. Para calcular uma probabilidade seria necessário calcular uma integral definida entre dois pontos da curva, para se obter a área sob a curva. Para não dificultar, adota-se a curva normal padronizada a partir do escore (Z), com auxílio de uma tabela, a saber: xZ Neste momento torna-se pertinente demonstrar o que ocorre se fizermos três intervalos, utilizando a distribuição normal. São eles: ; 2 e 3, a saber: No caso do intervalo: , tem-se: %.26,686826,03413,0*2 3413,000,100,1 PP ZPZXZ Significa que cerca de 68,26% dos valores da distribuição estão contidos neste intervalo. 14 No caso do intervalo: 2, tem-se: %.959544,024772,0*22 4772,000,200,22 PP ZPZXZ Significa que cerca de 95% dos valores da distribuição estão contidos neste intervalo. No caso do intervalo: 3, tem-se: %.999974,034987,0*23 4987,000,300,33 PP ZPZXZ Significa que cerca de 99% dos valores da distribuição estão contidos neste intervalo. Exemplos: O tempo que determinada substância leva para reagir na presença de material orgânico é de 1,5 horas, com desvio padrão de 0,3 horas. Se tal processo apresenta distribuição normal, qual o percentual de material orgânico que terá reagido antes de uma hora? 15 %.75,44525,05,00,1 4525,067,167,1 3,0 15,13,0 ;5,1 XP ZPZ A altura dos indivíduos de uma população distribui-se normalmente com média μ = 1,5 e desvio padrão = 0,09m. Qual a percentagem nesta distribuição, de indivíduos com altura acima de 1,8m ou mais? %.04,04996,05,08,1 4996,033,333,3 09,0 5,18,109,0 ;5,1 XP ZPZ Operações com distribuição normal: O peso de um produto usado na despoluição de reservatórios de água tem distribuição normal com média 230g e desvio padrão 3g. Este produto é embalado em caixas que contém 20 unidades cada, sem blister. A caixa vazia tem peso distribuído normalmente com média 30g e desvio padrão 5g. Calcule a probabilidade de uma caixa cheia pesar mais de 4660g. = 30g + 20 * 230g = 4630g 16 3178,14205)3(*20)5( 22 09,2 3178,14 46304660 XZ P(Z) = 0,4817 P(X>4660) = 0,5 – 0,4817 = 1,83%; Relações entre as distribuições: Binomial, de Poisson e a distribuição Normal: Quando n é grande e p e q não estão muito próximos de zero, a distribuição binomial se aproxima muito da distribuição normal. Matematicamente, tal fenômeno pode ser simbolizado da seguinte forma: dueb npq npXaP npq npXZ b a u n 2 2 2 1lim Assim, a variável aleatória padronizada npq npX é considerada assintoticamente normal. A mesma coisa pode-se aplicar à distribuição de Poisson, a saber: duebXaP b a u u 2 2 1lim Assim, a distribuição de Poisson se aproxima da distribuição normal quando Xou é assintoticamente normal. Distribuição Qui-Quadrado Representação gráfica: 17 Sejam {X1, X2, ..., Xv} v variáveis aleatórias independentes e normalmente distribuídas com média zero e variância 1. Considerando-se a variável aleatória: 222 2 1 2 ... v , onde 2 é chamado qui-quadrado. Então se pode demonstrar que p/X0: .0/0 2 2 1 2 0 2 1 2 2 2 xpxP dueu v xP x uu v Esta distribuição é chamada de qui-quadrado e o número de graus de liberdade associado a ela é v. A distribuição qui-quadrado é um caso especial da distribuição gama e apresenta as seguintes características principais: 2 2 21 2 v i v v Para v > 30 pode-se demonstrar que 122 2 v se aproxima muito de ser normalmente distribuída, com média 0 e variância 1. A importância da distribuição qui-quadrado, além de ser uma distribuição típica apresentada pela da variância, também está no fato de proporcionar estudos com variáveis categóricas, estudos não paramétricos, além de verificação de associaçãoe/ou independência entre fatores (tabelas de contingência ou de 18 dupla entrada), muito comumente estudadas nas áreas de Ciências Biológicas, Ciências da saúde, Agronomia e Medicina Veterinária. Quando se estuda a técnica da análise de variância, de forma geral, pode-se perceber que se trata da razão entre duas variâncias, uma devido ao que o pesquisador quer estudar, portanto provocada, e outra devido aos fatores aleatórios, causados pelos fenômenos naturais. Por se tratar da razão entre variâncias, ambas com distribuição qui-quadrado, utiliza-se a distribuição F, mediante aplicação do teste F. Este estudo é muito utilizado quando se deseja estudar os efeitos de mais de dois tratamentos, num experimento. Distribuição t de Student É chamada distribuição t de Student ou ainda distribuição t, com v graus de liberdade. O termo Student foi um pseudônimo utilizado pelo Gosset, responsável pela elaboração da mesma. Estatística: 2 1 2 1* 2 2 1 ; ttf t Representação gráfica: Algumas características desta distribuição: .2; 2 0 2 v v v 19 Considerando-se Y e Z variáveis aleatórias independentes, onde Y é normalmente distribuída com média 0 e variância 1, enquanto Z tem distribuição qui-quadrado com v graus de liberdade. Então a variável aleatória v Z YT tem distribuição t com v graus de liberdade. Esta distribuição é utilizada com muita freqüência quando se têm pequenas amostras n 30 elementos. Quando o número de graus de liberdade é muito grande, esta distribuição se aproxima da distribuição normal padrão. Utiliza-se para construção de intervalos de confiança, testes de hipóteses, quando temos dois grupos a serem comparados, sejam resultantes de dados pareados, amostras independentes, com variâncias consideradas iguais e/ou distintas. Além disso, também é utilizada no dimensionamento de amostras. Distribuição F – também conhecida como distribuição F de Snedecor. A denominação F foi uma homenagem ao R.A. Fisher. Estatística: 2 2 1 1 2 2 2 1 21 21 21 1 1 *1** 2 * 2 22,1, FFFf Representação Gráfica: A distribuição F é resultante da razão, ou quociente, entre duas variáveis com distribuição qui-quadrado, com n1 e n2 graus de liberdade, respectivamente. )12;11(; 12; 11; 2 2 2 1 nnF n n 20 Maiores detalhes serão vistos e estudados, com maior riqueza de exemplos e aplicações, quando chegarmos à parte de Testes de Hipóteses. Esta distribuição é de fundamental importância quando se estuda a técnica da análise de variância, que é um dos fundamentos da pesquisa agrícola, na área de ciência animal, ciências biológicas e da saúde, além da área da engenharia. Relacionamento entre as distribuições qui-quadrado, t e F Pode-se demonstrar matematicamente que as distribuições se relacionam da seguinte forma: v F tF vP vP vP vP 2 , ,, 2 , 2 1 ,1,1 De forma resumida, pode-se afirmar que elas se aproximam ao passo que o tamanho do conjunto de observações é muito grande. Mais alguns aspectos práticos relevantes a respeito das distribuições de probabilidade: Aos que fazem os cursos de Agronomia e Zootecnia, que cursam a disciplina Estatística Experimental, ou Biometria, ou disciplinas correlatas, saberão a importância destas distribuições estudadas de forma resumida nesta oportunidade. As demais áreas terão iniciação nestes assuntos, além da grande parte daqueles que foram fazer cursos de pós graduação. Pesquisa nas áreas biológicas, animal e agronômica, além dos dados observacionais, também utilizam muito a técnica da análise de variância, fortemente embasada nestas distribuições. Portanto, ao recomendar novas técnicas, novas fontes e/ou formas de aplicação de fertilizantes, defensivos agrícolas, métodos de controle biológico, métodos de irrigação, combinação de diferentes fontes de alimentos para os animais, novas variedades e/ou cultivares, além de muitas outras coisas, mesmo sem perceber, a maioria dos profissionais estão se baseando em resultados de pesquisas cujos fundamentos, cujas técnicas, são baseadas nas distribuições de probabilidade. Nas áreas de Engenharia e Informática, pode-se levar em consideração certos princípios orientadores que podem ser seguidos na escolha de uma distribuição de probabilidade para uma determinada aplicação, assim como para se determinar qual distribuição de probabilidade utilizar ao resolver problemas e/ou questões. 21 Alguns exemplos podem ser citados, por distribuição, conforme as características apresentadas: Distribuição de Bernoulli: - Lançar uma moeda e observar se ocorre cara ou não; - Lançar um dado e observar se ocorre seis ou não; - Numa linha de reposição, observar se um item, tomado ao acaso, é ou não defeituoso; - Verificar se um servidor de uma intranet está ou não ativo. Distribuição Binomial: - Lançar uma moeda cinco vezes e observar o número de caras; - Numa linha de produção, observar dez itens, tomados ao acaso, e verificar quantos estão defeituosos; - Verificar, num dado instante, o número de processadores ativos, num sistema com multiprocessadores; - Verificar o número de bits que não estão afetados por ruídos, em um pacote com n bits. Distribuição de Poisson: - Número de consultas a uma base de dados em um minuto; - Número de pedidos a um servidor num intervalo de tempo; - Número de erros de tipografia em um formulário; - Número de defeitos em um m2 de piso cerâmico; - Número de pulsações radioativas em um intervalo de tempo, na desintegração dos núcleos de uma substância radioativa. Na Engenharia, e na Informática, algumas variáveis aleatórias podem ser citadas como exemplo de variáveis aleatórias contínuas, a saber: - Tempo de resposta de um sistema computacional; - Rendimento de um processo químico; - Tempo de vida de um componente eletrônico; - Resistência de um material. Há, também, outras variáveis de natureza aleatória discreta, que podem ser utilizadas como contínuas, dado o grande número de possíveis resultados, a saber: - Número de transações por segundo de uma CPU; - Número de defeitos numa amostra de 5 mil itens. Distribuição Exponencial: - Tempo (em minutos) até a próxima consulta a uma base de dados; - Tempo (em segundos) entre pedidos a um servidor; - Distância (em metros) entre defeitos de uma fita. 22 A Distribuição Normal é considerada a mais importante, tanto por permitir modelar muitos fenômenos naturais quanto por possibilitar aproximações com outras distribuições, possibilitando cálculos de probabilidades de muitas variáveis aleatórias que seguem, na verdade outras distribuições.
Compartilhar