Baixe o app para aproveitar ainda mais
Prévia do material em texto
13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 1/30 INFERÊNCIA ESTATÍSTICA E SIMULAÇÃO AULA 2 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 2/30 Prof. João Carlos da Silva CONVERSA INICIAL Continuando com os passos iniciais da inferência estatística, entender como se forma uma distribuição de probabilidade ajuda a desvendar o comportamento da variável aleatória. Começaremos pelas definições de experimento, evento, espaço amostral e depois reforçaremos o conceito de probabilidade e suas aplicações. As técnicas de cálculos para encontrar os principais estimadores e intervalos de confiabilidade reforçam o aprendizado do analista e técnico de redes de computadores. Muitas vezes, necessitando tomar uma decisão precisa sobre os procedimentos que irá adotar no seu trabalho. As distribuições de probabilidade auxiliam na identificação do comportamento de uma variável, proporcionando repetitividade dos experimentos e determinando alguns padrões de manutenção preventiva básica. Sempre de forma simples e objetiva, para que todos os envolvidos na cadeia consigam aplicar os indicadores propostos. A definição correta de uma variável para o estudo, o comportamento de chances de ocorrência e a reprodução do valor esperado são excelentes pontos de aperfeiçoamento técnico e profissional. Nesta etapa, a inferência estatística começa a tomar forma e aplicações mais práticas na resolução dos problemas técnicos e administrativos. O grande desafio da distribuição de probabilidade descreve como a variável aleatória se comporta dentro de um espaço amostral pré- estabelecido. Bons estudos e continue no foco do aprendizado contínuo. Sucesso! TEMA 1 – EVENTO EXPERIMENTAL O evento experimental é um resultado possível em um espaço de possibilidades, é um acontecimento do experimento em análise. Esse evento define as respostas que o analista encontrou 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 3/30 após iniciar um estudo de caso ou procurar uma causa de um problema. É, normalmente, tabulado, identificado e referenciado para cada experimento, de modo a facilitar os cálculos e conclusões. Todas as operações de conjuntos numéricos são válidas nas operações com eventos e ajudam a entender como funcionam as probabilidades e suas distribuições. Em um trabalho, a definição correta da variável de estudo e a coleta correta de dados ajudam a compreensão dos resultados e dos eventos ocorridos. Os eventos são os valores numéricos coletados e uma boa compreensão desses resultados ajuda na elaboração e correção de futuros experimentos. 1.1 EVENTO Para determinar o evento, é importante entender que ele sempre vai surgir de um experimento. Esse experimento tem um objetivo, um planejamento, uma definição de população e pode ser repetido em condições similares. Imagine um experimento que deseja verificar quantos pacotes de dados são perdidos em uma conexão ponto a ponto, durante 1 hora, no horário de maior fluxo, entre uma empresa e um banco. Desta forma, é possível prever os resultados possíveis, pode ser zero ou todos os pacotes enviados com problema. Esta é a segunda definição importante, o espaço amostral (os possíveis resultados) não é esperado valores negativos nesse experimento e nem valores maiores dos que foram enviados. O evento é um resultado possível que pode acontecer neste experimento, dentro do espaço amostral definido. Para compreender melhor, seguem os símbolos matemáticos para essas definições: Experimento – é a descrição da análise que deve ser feita, indica a variável que vai ser analisada, mostrando o conjunto que vai ser analisado. Espaço Amostral – é o conjunto numérico ou qualitativo de todas as possíveis respostas do experimento, sendo cada elemento denominado ponto da amostra. Pode ser simbolizado pela letra ômega (Ω). Evento – são os possíveis resultados de uma coleta amostral, resultado de um experimento dentro de um plano amostral. Para ajudar a compreensão desses fundamentos, é necessário propor um experimento, indicar o espaço amostral e coletar as amostras. Imagine um experimento que deseja analisar perdas de pacotes em três coletas de 1.000 observações durante uma hora de atividade, conexão entre uma 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 4/30 empresa e um servidor de banco. Seguem resultados dessa coleta na Tabela 1, com uma coleta pela manhã, um início da tarde e outra no final da tarde: Tabela 1 – Exemplo de coleta de dados Para construir o experimento, é possível verificar 3 amostras com 1.000 observações. O primeiro evento ou subconjunto é A = {945 pacotes recebidos, 55 pacotes perdidos}, o segundo evento a ser analisado é B = {897 pacotes recebidos, 103 pacotes perdidos} e o terceiro evento é C = {938 pacotes recebidos, 62 pacotes perdidos}. O espaço amostral é constituído por os possíveis resultados, Ω = {0 até 1.000 pacotes recebidos, 1.000 até pacotes perdidos}. Neste experimento, não é possível acontecer esse evento, D = {2.000 pacotes recebidos, 62 pacotes perdidos}, nesse caso, é dito que é um evento impossível ou vazio (Ø). Na Figura 1, o resultado do evento A é ilustrado para facilitar o entendimento do que é um evento simples. Figura 1 – População Os eventos ajudam a entender a coleta de dados, nesse caso, amostra aleatória simples descrevendo com mais exatidão as possíveis respostas do sistema. O espaço amostral funciona como 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 5/30 o desenvolvimento do trabalho, indicando os limites de respostas do experimento. O experimento é a diretriz da atividade, informando qual a atividade deve ser feita, a coleta e um norteamento para os resultados. 1.2 OPERAÇÃO COM EVENTOS As operações com eventos são viáveis, pois são subconjuntos de uma população. Com isso, todas as operações com conjuntos são válidas para os eventos estatísticos. Essas operações devem estar contidas no espaço amostral, respostas possíveis. Não se pode realizar operações com eventos impossíveis. Todas as operações são realizadas com base na teoria de conjuntos: união e intersecção. Cada evento deve pertencer ao campo amostral (Ω) e as operações podem ser definidas, como observadas na Tabela 2, considerando dois eventos descritos como evento A e evento B: Tabela 2 – Operações de eventos Operação Símbolo Conjunto União A U B A ou B Intersecção A ∩ B A e B Para compreender melhor essas operações, imagine o experimento de coletar informações de um servidor, perda de pacotes ao longo do dia, de 3 empresas que utilizam os serviços desse servidor, as empresas R, X e S. Os eventos a seguir foram retirados por amostra aleatória simples e é necessário efetuar algumas operações de eventos. A = {190 pacotes perdidos – horário 9:00 até 10:00} B = {250 pacotes perdidos – horário 10:01 até 11:00} Na Figura 2, o resultado da coleta de dados, já com a separação dos pacotes perdidos por empresa: 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 6/30 Figura 2 – Coleta de dados Com os dados amostrados do servidor, é possível executar as principais operações com eventos, lembrando que cada evento descreve um recorte no estudo desejado. Seguem as resoluções viáveis com os dois eventos realizados: a) União – o responsável técnico quer descobrir quantos pacotes perdidos ocorreram no período dos eventos. Neste caso, quer encontrar o resultado da união do evento A e B, dos pacotes perdidos das 9:00 até 11:00. Para analisar essa ocorrência, irá utilizar a operação de união dos eventos, conjunto A unido com o conjunto B, (A U B). O resumo destes dois eventos é o conjunto A com 190 pacotes perdidos (A = {190}) e o conjunto B com 250 pacotes perdidos (B = {250}). Esta operação é possível, pois existe continuidade no espaço amostral e a união é junção dos dois eventos. Então, A U B = {190 unidocom mais 250} = 440 pacotes perdidos. No entanto, se o responsável quiser fazer outra análise com um horário que não foi amostrado, o resultado será um conjunto vazio (Ø). Na Figura 3, é possível verificar o resultado da união dos eventos selecionados para esse estudo, A U B = {440}. Figura 3 – União de eventos 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 7/30 b) Intersecção – o responsável técnico quer descobrir quantos pacotes perdidos ocorreram em comum no período dos eventos, por exemplo, pacotes da mesma empresa. E, nesse caso, quer encontrar o resultado da intersecção do evento A e B, dos pacotes perdidos da mesma empresa, das 9:00 até 11:00. Para analisar essa ocorrência, irá utilizar a operação de intersecção dos eventos, dados em conjunto A em comum com os dados do conjunto B, (A ∩ B). O evento que pode ser analisado na intersecção é a quantidade de pacotes perdidos da empresa R em comum no conjunto A (A = {55 pacotes perdidos da empresa R}) com o conjunto B (B = {60 pacotes perdidos da empresa R}). Esta operação é possível, pois existe uma conexão no espaço amostral e a intersecção é junção dos dois eventos. Então, A ∩ B = {55 no conjunto e 60 no conjunto B} = 115 pacotes perdidos da empresa R. Na Figura 4, é possível verificar o resultado da intersecção dos eventos selecionados para este estudo, A ∩ B = {115}. Figura 4 – Intersecção de eventos 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 8/30 Essas operações de eventos auxiliam a entender como são as principais conexões entre as possibilidades de coletas de dados. Por meio dessas operações, é viável criar probabilidade e chances de ocorrência. Os aspectos fundamentais das operações básicas servem de base para cálculos e interpretações de experimentos. TEMA 2 – PROBABILIDADE GERAL A probabilidade é de extrema importância nos estudos da inferência estatística, pois explica os fenômenos com amostras de distribuição de frequência, apenas descreve o acontecimento. A definição dos eventos e da probabilidade ajuda a visualizar o comportamento da variável aleatória e das amostras aleatórias. Descrevendo como funciona um experimento aleatório, fenômenos aleatórios e as distribuições de probabilidade. Para os estudos estatísticos, esses dois elementos definem como o experimento será conduzido, ajudando a simulação de dados e auxiliando na conclusão do estudo. Compreender as conexões entre evento e probabilidade ajuda a entrar nesse universo de análise e compreensão de modelos probabilísticos. O evento e a probabilidade são características da amostra que ajudam a entender como funciona a população de origem dos dados. Estudaremos esses elementos básicos para definir conjuntos e formulações matemáticas de eventos. 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 9/30 2.1 CONCEITO DE PROBABILIDADE Muitos experimentos podem ser realizados e reproduzidos sob as mesmas circunstâncias, com suas respectivas ocorrências e estimativas. A probabilidade é a indicação de uma chance de ocorrência de um certo evento, chance esta que deve estar associada ao espaço amostral. Essas chances podem ser classificadas como segue: a) A ocorrência é impossível, a solução não consta no espaço amostral, B = Ø, então, P (B) = 0. Imagine um experimento que analisa erros de conexões em um servidor de rede, mas o técnico quer analisar erros no computador local. Neste caso, não é possível verificar essa ocorrência, pois o foco é o servidor de rede. b) A ocorrência é certa, a solução é o espaço amostral, C = Ω, então, P (C) = 1. Imagine que no experimento anterior o técnico quer analisar todos os erros ocorridos no servidor de rede. Neste caso, é possível verificar todas as ocorrências. Essas duas noções definem a ocorrência ou probabilidade simples de um evento. A equação 1 demostra que essa chance deve estar entre 0 e 1. A probabilidade simples tem como seu cálculo (analisando os eventos observados ou de interesse) os resultados possíveis no campo amostral. Essa probabilidade tem grande representatividade quanto maior for a quantidade de vezes que conseguir repetir o experimento. Na equação 2, é indicado o cálculo da quantidade de um certo evento sobre a totalidade de eventos possíveis. 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 10/30 Para entender melhor esse conceito, lembre o exemplo dos pacotes perdidos de um servidor interligado com três empresas R, X e S. O analista quer verificar, nesse experimento, qual foi a probabilidade de pacotes perdidos da empresa R. É necessário observar a quantidade de pacotes perdidos da empresa R, A = {105 pacotes perdidos} e a quantidade total de pacotes perdidos, Ω = {440 pacotes perdidos}. Na equação 3, é calculada a probabilidade do número do evento analisado, sobre todas as ocorrências. Essa probabilidade pode ser lida como a chance de ocorrer um pacote perdido da empresa R sobre o total de pacotes perdidos que é de 0,24 ou 24 %. Assim, são calculadas todas as probabilidades simples de ocorrência. A probabilidade de ocorrência de pacote perdido da empresa S, P (S) = 0,40 ou 40%. A probabilidade de ocorrência de pacote perdido da empresa X, P (X) = 0,34 ou 34 %. A soma de todas as probabilidades simples do espaço amostral deve ser igual a 1 ou 100%, assim, abrangendo todas as possibilidades de ocorrência do experimento proposto pelo analista. Com esta definição inicial, é viável a introdução de outras operações de probabilidade. 2.2 ADIÇÃO DE PROBABILIDADES A regra da adição trabalha com a união de eventos possíveis do campo amostral, utilizando subconjuntos e somando esses valores. Existem duas opções básicas para realização do cálculo de adição de probabilidades, é importante conhecer como elas funcionam e onde podem ser aplicadas: a) Intersecção inexistente – o primeiro caso ocorre quando dois ou mais eventos são mutuamente exclusivos, em que não existe intersecção entre os acontecimentos ou os dados estudados. Assim, a intersecção é o conjunto vazio (A ∩ B = Ø), implicando na probabilidade desse evento ser zero (P (A ∩ B) = 0). A Equação 4 representa a definição união de probabilidade para (A ∩ B) = Ø: 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 11/30 O espaço amostral dessa união é representado na Figura 5, observa-se que não existe conexão entre os elementos estudados. Figura 5 – Intersecção de eventos mutuamente exclusivos Pode ser observado que os eventos ocorridos no conjunto A não têm ligação com o conjunto B. Imaginemos que o primeiro evento (A) foram os pacotes perdidos de uma empresa R conectada a um servidor A. O evento seguinte (B) é representado pelos pacotes perdidos de uma empresa T conectada a um servidor B. Neste caso, os pacotes analisados na primeira amostra são bem diferentes da segunda amostra, A = {Empresa R, Servidor A} e B = {Empresa T, Servidor B}. O resultado será a soma da probabilidade dos eventos, ignorando a intersecção, que não existe. b) Intersecção existente – o segundo caso ocorre quando dois ou mais eventos não são mutuamente exclusivos, existindo intersecção entre os acontecimentos ou os dados estudados. Assim, a intersecção é um conjunto possível e enumerável (A ∩ B) Ø, implicando na probabilidade desse evento ser diferente de zero (P (A ∩ B) 0). A Equação 5 representa a definição de união de probabilidade para (A ∩ B) Ø: 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 12/30 O espaço amostral dessa união é representado na Figura 6, existindo conexão entre os elementos estudados. Figura 6 – Eventos com intersecção Pode ser observado que os eventos ocorridos no conjunto A têm ligação com o conjunto B. Imaginemos que o primeiro evento foram pacotes perdidos de uma empresa R conectada a um servidor A. No evento B, os pacotes perdidos de uma empresa T conectada a um servidor A. Neste caso, os pacotes analisados na primeira amostra têm umafonte em comum com a segunda, A = {Empresa R, Servidor A} e B = {Empresa T, Servidor A}. O resultado será a soma da probabilidade dos eventos, devendo-se considerar a intersecção, pois ela existe. No entanto, para evitar contar duas vezes os elementos dos conjuntos analisados, é necessário realizar a subtração da intersecção. As operações de eventos respeitam a lógica apresentada e, para compreender melhor essas operações, será analisada a coletas de dados dos pacotes enviados entre um servidor de uma empresa e um servidor de banco. Na Tabela 3, será demonstrada uma tabela de contingência para facilitar as operações de eventos. Tabela 3 – Teste de pacotes 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 13/30 Imaginemos que um técnico ou analista pretende calcular a probabilidade de um pacote ter sido recebido ou pertencer ao teste 1, matematicamente representado por P (A U B). Com a apresentação das duas possíveis resoluções da regra da adição, o problema apresentado pode ser calculado com a existência de uma intersecção. Cada operação tem a sua interpretação matemática e estatística. A primeira operação de eventos, a união de conjuntos, analisa a possibilidade do evento A acontecer, ou o evento B acontecer ou os dois acontecerem (A+B). Considere que você quer analisar a probabilidade da ocorrência do evento pacote recebidos sem problema, na equação 6 é calculado o evento A: Outro evento analisado é a probabilidade de o teste analisado ser o teste 1, na equação 7, é calculado o evento B: Com a ajuda da Tabela 3, é fácil verificar a intersecção entre os dois eventos, o pacote ser recebido e pertencer ao teste 1, a ocorrência é de 945. Na equação 8, é calculada a probabilidade desse cruzamento: 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 14/30 Agora, é possível calcular a probabilidade de ocorrência do evento A e/ou o evento B, usando a regra da adição com a existência de intersecção, segundo a equação 9: Com isso, o resultado do experimento é que a probabilidade de sortear um pacote que foi recebido ou pertencer ao teste 1 é de 95,5%. Assim, o técnico consegue calcular pela soma de eventos qualquer probabilidade de acontecer um evento ou o outro dentro de um espaço amostral possível. Mas deixando bem claro que nem sempre é fácil encontrar uma intersecção de eventos, quando possível utilizar uma tabela de dupla entrada que facilita muito a visualização de cruzamento de eventos. 2.3 PROBABILIDADE MARGINAL Essa probabilidade consiste em combinar dois eventos em conjunto possível do espaço amostral, em que esses eventos devem ser mutuamente excludentes. Os eventos não podem acontecer ao mesmo tempo e contemplar todas as conexões possíveis. Em nosso exemplo dos testes para verificar as perdas de pacote, é considerado um evento principal e dois eventos resultantes. O evento principal é a realização dos testes e os resultantes são pacote recebido e pacote perdido. Com isso, a equação 10 ilustra a probabilidade marginal para dois eventos com todas as possíveis combinações: Na equação, o A indica o evento principal e o B, os eventos consequentes. Essa equação só é possível se todas as opções de B forem mutuamente exclusivas e coletivamente exaustivas. As 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 15/30 conexões não podem ter intersecções, ocorrência que indica que o evento não pode ocorrer. O valor de k indica todos os eventos consequentes gerados pelo evento principal, ou seja, todas as propostas do estudo original. No nosso exemplo, o pacote “é recebido” ou “é perdido”, não podendo ocorrer esses eventos ao mesmo tempo. Um pacote não pode ficar em aberto, devendo necessariamente receber um rótulo de evento dentro das possíveis respostas dadas no início do experimento. Imaginemos, ainda, que o analista quer calcular a probabilidade do teste 2 e suas possíveis respostas de “pacotes recebidos” e “pacotes perdidos”. Deve calcular a probabilidade marginal da execução do teste 2 no nosso experimento. Os testes têm a mesma quantidade de pacotes gerados, porém, podem existir casos que esse teste tem valores diferentes. A probabilidade pode ser calculada como a probabilidade de o teste 1 ser igual à probabilidade do teste 1 e pacote recebido, somado com a probabilidade do teste 1 e pacote não recebido. A equação 11 mostra o resultado do cálculo dessa probabilidade marginal (verificar as conexões da Tabela 3). Observe que sempre é feita a comparação com o total de pacotes gerados no experimento todo, pois temos que verificar as possibilidades do espaço amostral. É necessário garantir que esses eventos não aconteceram em outras etapas do conjunto e que cada evento é exclusivo. Nos cálculos, é sempre realizada a soma dos eventos e internamente a intersecção com o evento consequente. O evento pacote recebido não pode ser ao mesmo tempo pacote perdido, essa exclusão garante o sucesso do cálculo de probabilidade marginal. Outro cálculo de probabilidade marginal possível é analisar a probabilidade de pacote perdido, como evento principal e vir do teste 1, teste 2 e teste 3, como eventos consequentes. A resolução dessa probabilidade marginal pode ser demostrada na 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 16/30 equação 12, indicando que todas as margens de uma tabela de contingência podem ser calculadas diretamente. O valor final da soma das probabilidades é , que é exatamente a soma marginal da coluna de pacotes perdidos do experimento realizado. Os conceitos iniciais de probabilidade ajudam a entender as relações entre os eventos estudados, os conjuntos de possíveis respostas, o espaço amostral de todas as respostas e as equações básicas de probabilidade. Na inferência estatística e na simulação, conhecer as probabilidades facilita a entender como a amostra está relacionada com a população de origem. O trabalho começa a ficar bem mais interessante, quando se consegue verificar o comportamento dos dados e suas conexões básicas. TEMA 3 – PROBABILIDADE CONDICIONAL Procura relacionar a ocorrência de um evento do espaço amostral, considerando que um aconteceu um evento anterior. Procura encontrar probabilidades condicionadas a outra probabilidade, analisando suas conexões e dependências. Muitos eventos influenciam o que irá acontecer em um próximo; para o analista é importante entender estas relações de causa e efeito. A ligação de eventos, a interferência de processos é analisada na probabilidade condicional, pois nem sempre essas conexões são tão diretas e objetivas. Encontrar as relações de dependência e independência é o grande foco na condicionalidade e cálculo de suas probabilidades. Estudar esses efeitos traze grandes benefícios no planejamento e na organização de um projeto. 3.1 PROBABILIDADE CONDICIONAL DEPENDENTE 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 17/30 A probabilidade condicional básica é muito utilizada quando se deseja encontrar uma probabilidade considerando que um evento do espaço amostral já ocorreu. Esse condicionamento pode ocorrer quando um experimento deseja considerar um evento já realizado ou pré-definido para início de teste. Novamente, o experimento vai considerar dois eventos, um que já aconteceu e outro que irá acontecer, levando em consideração que este evento é possível e faz parte do espaço amostral. A Equação 13 identifica como é calculada a probabilidade condicional: O termo indica que a probabilidade de ocorrer o evento A, sabendo que o evento B já ocorreu, é a divisão da intersecção dos eventos, sobre o evento que já ocorreu ( ). Para exemplificar, imagine que um analista necessita verificar a probabilidade de um pacote ter sido perdido, sabendo que ele vem do teste 3, considerando o estudo do envio de uma empresa para um servidor de dados. Como já verificado, existem casos que existem intersecção e casos que não existem, cada caso será analisado separadamentee denominado com o termo correto. Neste experimento, foi verificado que existe intersecção entre os eventos estudados e é possível calcular a intersecção. No estudo do analista, ele quer encontrar, , a probabilidade de um pacote perdido dado que ocorreu o teste 3. Neste caso, os outros dois testes não são considerados, pois temos certeza da ocorrência e seleção do teste 3. Na Figura 7, é ilustrada como ocorre a probabilidade condicional: Figura 7 – Ilustração da probabilidade condicional 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 18/30 No problema proposto, a solução é calculada na equação 14: A probabilidade calculada é de 6,2%, indicando a ocorrência de um pacote perdido dado que foi selecionado o teste 3. No teste 3, existem 1.000 pacotes, 938 recebidos e 62 perdidos. A probabilidade condicional estuda, considera o cruzamento entre os eventos estudos e, assim, uma dependência entre os dados. 3.2 PROBABILIDADE CONDICIONAL INDEPENDENTE A probabilidade condicional independente ocorre quando a ocorrência de um evento não interfere o resultado de probabilidade de outro evento, neste caso, os eventos são independentes. A independência indica que não existe intersecção entre os eventos analisados. Por esse motivo, conhecer a probabilidade de um evento já ocorrido não ajuda a entender o outro evento que irá 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 19/30 ocorrer. No espaço amostral, os conjuntos não têm conexão e, por esse motivo, os eventos funcionam de forma independente. A equação 15 indica como é calculada essa probabilidade condicional de independência: (A) A probabilidade de A, sabendo que ocorreu o evento B, não interfere no evento analisado. Imagine que você continue estudando os pacotes perdidos, porém, é conhecido que ocorreu a instalação de um novo servidor na empresa. Esse evento é independente do teste que está ocorrendo entre um servidor existente e o servidor de um banco. Porém, quando queremos verificar a independência entre os eventos, esta equação é muito importante. Deixando bem claro que o analista deve conhecer as características do experimento que está realizando, pois facilita muito na conclusão de um experimento. A independência é muito importante para verificar se um evento tem influência sobre outro evento, indicando que a ocorrência de um não é resultado da existência do outro. Matematicamente, a inexistência de cruzamento de eventos comprova que um evento coexiste independente do outro. Imagine um teste para verificar a satisfação de clientes que tem dois tipos de serviço para atender suas necessidades de alto desempenho. Na tabela 4, consta o resultado de uma pesquisa de satisfação com 300 clientes de médio porte que utilizam serviços de redes de alto desempenho. A tabela construída foi adaptada para uma tabela cruzada, para facilitar a verificação de todas as conexões de eventos do espaço amostral. Tabela 4 – Satisfação com o serviço prestado Satisfação com o serviço Serviço prestado Sim Não Total Fibra óptica 176 44 220 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 20/30 Cabo coaxial 64 16 80 Total 240 60 300 O analista quer verificar se, nesse estudo, existe dependência entre a satisfação do cliente com o serviço prestado pelas operadoras de internet. Para isso, foi calculada a probabilidade condicional dos eventos e depois foi comparada com a satisfação do cliente. Lembrando que pelo princípio da independência, se a probabilidade condicional for igual a probabilidade simples, os eventos são independentes, logo, não existe conexão direta entre eles. Para esses dados, foram executados os cálculos seguintes, segundo equações 16 e 17. Agora, para calcular a probabilidade de estar satisfeito: Analisando os dois resultados, é verificada a igualdade das duas probabilidades, consequentemente, nesse estudo, a satisfação do cliente com o serviço prestado e o tipo do serviço prestado são independentes. Saber que o cliente escolheu o serviço com fibra óptica não garante a satisfação com o serviço prestado. Nessa comparação de probabilidade, os eventos não têm interferência direta, outros elementos que influenciam na satisfação do cliente. Entender a dependência ou independência de eventos em um espaço amostral ajuda os envolvidos a tomarem decisões e a investirem no local correto para melhoria de processos e 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 21/30 prestação de serviços. TEMA 4 – VARIÁVEL ALEATÓRIA DISCRETA Uma variável aleatória pode ser compreendida como o resultado numéricos que dependem de fatores aleatórios. Esses resultados são elementos possíveis do espaço amostral selecionado para o experimento. Esses valores identificam a amostra e as características da estatística que será estudada. As distribuições de probabilidade para essa variável aleatória são uma listagem das respostas obtidas na análise ou teste realizado, juntamente com as suas probabilidades. Uma variável aleatória pode assumir valores quantitativos discretos e contínuos, dependendo da investigação que deve ser realizada. Esta variável indica a principal característica que deve ser retirada no experimento, como tempo médio de funcionamento, falhas e perdas de pacote, entre outras. A definição correta da variável aleatória, auxilia nos cálculos, na interpretação do problema e futuras simulações. 4.1 DEFINIÇÃO DA VARIÁVEL ALEATÓRIA DISCRETA Uma variável aleatória é considerada discreta quando o resultado possível de um experimento for enumerável, finitos ou infinito. A nomenclatura desses resultados é indicada por lista de valores prováveis: assim por diante. Como esta listagem pode ser finita ou infinita, o último elemento vai depender dessa caracterização: Dados finitos – nesse caso, o último elemento é definido como . Por exemplo, a seleção de 5 servidores para verificar quantidade de pacotes perdidos em uma hora de estudo. Dados infinitos – nesse caso, não existe um último elemento, a lista contínua contando indefinidamente. Isso pode acontecer quando é necessário fazer um rastreamento de conexão e a parada só é feita por meio de uma programação ou de forma manual. A principal característica de uma variável discreta é a contagem de dados, o analista deve estar atento a esse detalhe, para facilitar a interpretação dos dados e análise de probabilidades. Imagine que um técnico realize diariamente uma atividade para verificar o funcionamento de 3 computadores e realize um teste para conectar a placa de rede deles. A variável discreta para esse experimento pode ter os seguintes diagnósticos: conectando (C) e não conectando (N). O estudo quer verificar quando computadores têm problemas na placa de rede 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 22/30 e não estão conectando, os valores possíveis desse espaço amostral é X = {0,1,2,3}. O resultado é possível, enumerável e finito, indicando a quantidade de computadores com problema na placa de rede. Cada resultado de uma variável aleatória discreta, denominado , pode ser associado a uma probabilidade = , considerando i a listagem dos possíveis resultado do experimento. No entanto, para ser considerada probabilidade da variável aleatória discreta, deve atender os seguintes requisitos: a) A probabilidade de um resultado da variável aleatória deve ser maior ou igual a zero, para todos os valores da lista resultante. A equação 18 demonstra esse requisito: b) A soma de todas as probabilidades associadas a uma variável aleatória discreta deve ser igual a 1. A equação 19 demonstra esse requisito: A função de probabilidade da variável aleatória discreta é a função p, que define todas as chances de ocorrência dos eventos analisados. Para validar os dois requisitos apresentados, considere o espaço amostral do nosso experimento de conexão de placa de rede, os resultados possíveis seriam: Ω = {CCC, CCN, CNC, NCC, CNN, NCN, NNC,NNN}. O resultado são 8 combinações possíveis e cada uma associada a uma probabilidade, observe a tabela 5: Tabela 5 – Resultados possível para conexão de placa de rede Placa de rede Conexão Pontos possíveis Probabilidade 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 23/30 3 CCC 1/8 2 CCN, CNC, NCC 3/8 1 CNN, NCN, NNC 3/8 0 NNN 1/8 O primeiro requisito foi satisfeito, cada variável aleatória discreta tem uma probabilidade associada e diferente de zero. Para verificação do segundo requisito, basta que a soma das probabilidades seja igual a 1. Para comprovar este requisito, é necessário somar todas as probabilidades associada a cada evento estuado. A equação 20 é a somatória das probabilidades e indica os possíveis resultados, X=3, representa 3 conexões realizadas com sucesso, assim, sucessivamente até nenhuma conexão com sucesso. Assim, é comprovada que essa variável é uma variável aleatória discreta, com uma distribuição de probabilidade que atende os requisitos de uma inferência estatística. Para que um estudo tenha valor científico, todas as condições devem ser atendidas, isso economiza tempo e dinheiro na elaboração de laudos e conclusões em procedimentos técnicos. Usar as ferramentas certas, com as variáveis corretas. 4.2 GRÁFICO DA PROBABILIDADE O gráfico de probabilidade da variável aleatória discreta ajuda a entender o comportamento da variável. Com isso o analista consegue prever alguns sintomas e definir manutenções preventivas. Para a construção do gráfico, todos os valores devem estar identificados como probabilidades. Na tabela 6, são calculadas as probabilidades de conexão da placa de rede dos computadores investigados. 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 24/30 Tabela 6 – Probabilidade de conexão da placa de rede Placa de rede Conexão Probabilidade 3 0,125 2 0,375 1 0,375 0 0,125 As probabilidades indicam que a chance de todos os computadores estarem conectando têm a mesma chance que nenhum computador esteja conectando. Na Figura 8, é plotado todos os pontos possíveis do espaço amostral estudo, com suas respectivas probabilidades. Figura 8 – Distribuição de probabilidade para a conexão da placa de rede Como observado, existe uma grande probabilidade de uma ou duas máquinas estarem com problema de conexão na placa de rede, totalizando 75% de chance de ocorrência. O comportamento da distribuição de probabilidade da variável aleatória discreta tem suas características, cada experimento possui definições e apontamentos importantes para o analista. Neste caso, as probabilidades ilustradas no gráfico auxiliam na tomada de decisão. O gráfico indica 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 25/30 as maiores chances de ocorrência e planejamentos de operação, lembrando que é esperado que todos os computadores tenham a mesma prioridade diante da manutenção. Esse gráfico de probabilidade indica uma chance honesta para cada máquina, qualquer preferência altera as probabilidades do experimento. TEMA 5 – DISTRIBUIÇÃO DE PROBABILIDADE VARIÁVEL ALEATÓRIA DISCRETA Para uma distribuição de probabilidades, algumas características numéricas são importantes para descrever o comportamento da variável aleatória. Cada experimento tem suas peculiaridades, suas probabilidades e a forma de condução do projeto. A distribuição de probabilidade representa como as variáveis expressam seus resultados, por meio da ocorrência e da probabilidade da ocorrência. Demonstrando comportamento das variáveis aleatórias discretas de acordo com um escopo de trabalho. As três principais características numéricas de uma distribuição de probabilidades são: o valor esperado, a variância e desvio padrão. Com esses estimadores, é possível conhecer e parametrizar ações para o estudo do experimento e inferir algumas conclusões iniciais de manutenção e reparo. 5.1 VALOR ESPERADO A média ponderada de uma distribuição de probabilidade de uma variável aleatória discreta é o valor esperado da variável estudada. Esse valor esperado começa com a multiplicação de cada resultado da variável observada (X) e sua respectiva probabilidade . Depois, é realizado um somatório com todos os resultados encontrados na multiplicação, a representação desses dois passos é indicada na equação 21: 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 26/30 Em nosso experimento de conexão da placa de rede, existe uma distribuição de probabilidades discreta, que indica o valor esperado ou a esperança matemática do evento estudo. Para encontrar o valor esperado de placas de redes conectadas, a equação 22 demonstra esse cálculo. A equação tem o número de placas conectadas, multiplicada pela probabilidade de ocorrência do evento. Considerando todas as respostas possíveis no campo amostral. O valor esperado é de 1,5 placas de redes que estejam funcionando normalmente, indica o valor médio de placas sem defeito de conexão por dia. Na prática, como a variável é discreta, é esperado que uma ou duas placas funcionem corretamente. O valor esperado é um forte estimador para detectar e avaliar propostas de manutenção preventiva, indicando uma probabilidade de erros em um experimento técnico. Essa característica da distribuição de probabilidade da variável aleatória discreta representa uma média esperada do evento estudado, padronizando algumas ações. 5.2 VARIÂNCIA E DESVIO PADRÃO Quando a distribuição de probabilidade apresenta um valor esperado para a distribuição, surge uma dúvida, como esses valores podem variar em torno dessa média. Nesse momento, surge a necessidade de estudar duas características importantes dessa distribuição de probabilidades, a variância e o desvio padrão da variável aleatória discreta. Essa variação ajuda a entender os limites possíveis do evento que está sendo estudado. Para calcular a variância, é necessário verificar quanto o ponto analisado está distante do ponto médio e depois é elevado o resultado ao quadrado, , depois multiplica-se o valor pela respectiva probabilidade do evento. Em seguida, é realizada a soma de todos os produtos encontrados. A equação 23 demonstra como é realizado o cálculo da variância de uma variável aleatória discreta. 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 27/30 Consequentemente, a equação 24 define o desvio padrão de uma variável aleatória discreta. Para facilitar o entendimento do cálculo da variância da conexão das placas de redes, a Tabela 7 demonstra todos os passos utilizados para encontrar o valor desejado. Nos cálculos, a E(X) = 1,4, como demostrado anteriormente. Tabela 7 – Cálculo da variância de conexão da placa de rede O valor da variância é a somatória dos valores resultantes, VAR (X) = 0,76, porém, esse valor é quadrático e de difícil interpretação. Por esse motivo, é calculado o desvio padrão da distribuição de probabilidade. Na equação 25, é encontrado esse valor. 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 28/30 Com o valor do desvio padrão, o analista consegue ter uma ideia de como a variável se comporta. O valor encontrado indica a variação em torno do valor esperado, no nosso problema, + 0,87 e -0,87 em relação à média calculada. Assim, um intervalo é criado para o experimento, conforme Figura 9. Figura 9 – Intervalo para a conexão da placa de rede A conclusão com esse intervalo é que a média de conexões diárias de funcionamento de placa de rede nos três computadores analisados é 1,4 e pode variar de 0,50 a 2,27 conexões. Esses valores da variável aleatória discreta correspondem a análises e intervenções diárias, indicando um padrão de probabilidade. Essas métricas facilitam a compreensão da amostra e, nas devidas proporções, tipificação de equipamentos e controle de processo, podem servir de simulação para toda a população de computadores de uma empresa. Quanto mais amostras forem coletadas, maior é a chance dos estimadoresse aproximarem do parâmetro da população. O valor esperado, a variância e o desvio padrão são os estimadores mais utilizados para descrever uma distribuição de probabilidade de uma variável aleatória discreta. Conhecer e identificar uma distribuição de probabilidade facilita o planejamento e o estabelecimento de indicadores para agilizar a manutenção e reparo de muitos processos em redes de computadores. FINALIZANDO 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 29/30 Nesta aula, foram contemplados os conceitos iniciais de distribuição de probabilidade, a necessidade de identificar um evento e uma variável aleatória. Buscamos calcular as principais probabilidades e entender suas representações e particularidades. Também foi analisada a importância da coerência dos dados amostrais, identificando o experimento e definindo o espaço de possibilidades. Entendemos como são realizadas as operações com eventos e com probabilidade de eventos, para conseguir compreender o comportamento de cada elemento do experimento. Trabalhamos probabilidades condicionais e seus principais limitantes. Identificamos uma variável aleatória discreta, um planejamento e atribuímos probabilidade para cada evento. Construímos um modelo de distribuição de probabilidade para uma variável discreta e formalizamos seus elementos principais: valor esperado, variância e desvio padrão. Dessa forma, ajudando o analista a interpretar melhor seu experimento, evento, espaço amostral e as probabilidades. REFERÊNCIAS ANDRADE, D. F.; OGLIARI, P. J., Estatística para as Ciências Agrárias e Biológicas: com noções de experimentação. 2. ed. Florianópolis: Editora UFSC, 2010. BARBETTA, P. A. Estatística para cursos de engenharia e informática. 3. ed. São Paulo: Atlas, 2010. BEKMAN, O. R.; COSTA NETO, P. L. O. Análise estatística da decisão. 2. ed. São Paulo: Blucher, 2009 (BVP). BUSSAB, W.O.; MORETTIN, P.A. Estatística Básica. 9. Ed. São Paulo: Saraiva, 2007. CLARK, J.; DOWNING, D., Estatística Aplicada. São Paulo: Editora Saraiva, 1998. COCHRAN, W. G., Técnicas de Amostragem. Rio de Janeiro: Editora Fundo de Cultura, 1965. DAVID, S. M. A estatística básica e sua prática. Livros Técnicos e Científicos, 2005. FARIAS, A. M. L. Apostila de Inferência Estatística. Rio de Janeiro: Universidade Federal Fluminense, Instituto de Matemática, 2008. GOMES, F. P. Curso de Estatística Experimental. Piracicaba: Livraria Nobel, 1985. 13/04/2023, 20:15 UNINTER https://univirtus.uninter.com/ava/web/roa/ 30/30 LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D., Estatística: Teoria e aplicações. Rio de Janeiro: LTC, 2012. MAGALHÃES, M. N.; LIMA, A.C. P. Noções de Probabilidade e Estatística, 7. ed. EDUSP, 2011. MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidade para Engenheiros. 2. ed. Rio de Janeiro: LTC, 2003. MONTGOMERY, D. C. Estatística aplicada e probabilidade para engenheiros. Rio de Janeiro: LTC, 2018. (MB) MORRIS, D.; MARK, S. Probability and Statistics. 4th. ed. 2012. SPINELLI, W.; SOUZA, M. S.; Introdução à Estatística. São Paulo: Editora Ática.
Compartilhar