Aula2

Inferência I

•

UNINTER

Davi Becker

19/09/2023

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Inferência I

51 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 1/30
INFERÊNCIA ESTATÍSTICA E
SIMULAÇÃO
AULA 2
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 2/30
Prof. João Carlos da Silva
CONVERSA INICIAL
Continuando com os passos iniciais da inferência estatística, entender como se forma uma
distribuição de probabilidade ajuda a desvendar o comportamento da variável aleatória.
Começaremos pelas definições de experimento, evento, espaço amostral e depois reforçaremos o
conceito de probabilidade e suas aplicações. As técnicas de cálculos para encontrar os principais
estimadores e intervalos de confiabilidade reforçam o aprendizado do analista e técnico de redes de
computadores. Muitas vezes, necessitando tomar uma decisão precisa sobre os procedimentos que
irá adotar no seu trabalho.
As distribuições de probabilidade auxiliam na identificação do comportamento de uma variável,
proporcionando repetitividade dos experimentos e determinando alguns padrões de manutenção
preventiva básica. Sempre de forma simples e objetiva, para que todos os envolvidos na cadeia
consigam aplicar os indicadores propostos. A definição correta de uma variável para o estudo, o
comportamento de chances de ocorrência e a reprodução do valor esperado são excelentes pontos
de aperfeiçoamento técnico e profissional.
Nesta etapa, a inferência estatística começa a tomar forma e aplicações mais práticas na
resolução dos problemas técnicos e administrativos. O grande desafio da distribuição de
probabilidade descreve como a variável aleatória se comporta dentro de um espaço amostral pré-
estabelecido.
Bons estudos e continue no foco do aprendizado contínuo. Sucesso!
TEMA 1 – EVENTO EXPERIMENTAL
O evento experimental é um resultado possível em um espaço de possibilidades, é um
acontecimento do experimento em análise. Esse evento define as respostas que o analista encontrou
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 3/30
após iniciar um estudo de caso ou procurar uma causa de um problema. É, normalmente, tabulado,
identificado e referenciado para cada experimento, de modo a facilitar os cálculos e conclusões.
Todas as operações de conjuntos numéricos são válidas nas operações com eventos e ajudam a
entender como funcionam as probabilidades e suas distribuições. Em um trabalho, a definição correta
da variável de estudo e a coleta correta de dados ajudam a compreensão dos resultados e dos
eventos ocorridos. Os eventos são os valores numéricos coletados e uma boa compreensão desses
resultados ajuda na elaboração e correção de futuros experimentos.
1.1 EVENTO
Para determinar o evento, é importante entender que ele sempre vai surgir de um experimento.
Esse experimento tem um objetivo, um planejamento, uma definição de população e pode ser
repetido em condições similares. Imagine um experimento que deseja verificar quantos pacotes de
dados são perdidos em uma conexão ponto a ponto, durante 1 hora, no horário de maior fluxo, entre
uma empresa e um banco. Desta forma, é possível prever os resultados possíveis, pode ser zero ou
todos os pacotes enviados com problema. Esta é a segunda definição importante, o espaço amostral
(os possíveis resultados) não é esperado valores negativos nesse experimento e nem valores maiores
dos que foram enviados.
O evento é um resultado possível que pode acontecer neste experimento, dentro do espaço
amostral definido. Para compreender melhor, seguem os símbolos matemáticos para essas
definições:
Experimento – é a descrição da análise que deve ser feita, indica a variável que vai ser analisada,
mostrando o conjunto que vai ser analisado.
Espaço Amostral – é o conjunto numérico ou qualitativo de todas as possíveis respostas do
experimento, sendo cada elemento denominado ponto da amostra. Pode ser simbolizado pela
letra ômega (Ω).
Evento – são os possíveis resultados de uma coleta amostral, resultado de um experimento
dentro de um plano amostral.
Para ajudar a compreensão desses fundamentos, é necessário propor um experimento, indicar o
espaço amostral e coletar as amostras. Imagine um experimento que deseja analisar perdas de
pacotes em três coletas de 1.000 observações durante uma hora de atividade, conexão entre uma
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 4/30
empresa e um servidor de banco. Seguem resultados dessa coleta na Tabela 1, com uma coleta pela
manhã, um início da tarde e outra no final da tarde:
Tabela 1 – Exemplo de coleta de dados
Para construir o experimento, é possível verificar 3 amostras com 1.000 observações. O primeiro
evento ou subconjunto é A = {945 pacotes recebidos, 55 pacotes perdidos}, o segundo evento a ser
analisado é B = {897 pacotes recebidos, 103 pacotes perdidos} e o terceiro evento é C = {938 pacotes
recebidos, 62 pacotes perdidos}.
O espaço amostral é constituído por os possíveis resultados, Ω = {0 até 1.000 pacotes recebidos,
1.000 até pacotes perdidos}. Neste experimento, não é possível acontecer esse evento, D = {2.000
pacotes recebidos, 62 pacotes perdidos}, nesse caso, é dito que é um evento impossível ou vazio (Ø).
Na Figura 1, o resultado do evento A é ilustrado para facilitar o entendimento do que é um evento
simples.
Figura 1 – População
Os eventos ajudam a entender a coleta de dados, nesse caso, amostra aleatória simples
descrevendo com mais exatidão as possíveis respostas do sistema. O espaço amostral funciona como
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 5/30
o desenvolvimento do trabalho, indicando os limites de respostas do experimento. O experimento é
a diretriz da atividade, informando qual a atividade deve ser feita, a coleta e um norteamento para os
resultados.
1.2 OPERAÇÃO COM EVENTOS
As operações com eventos são viáveis, pois são subconjuntos de uma população. Com isso,
todas as operações com conjuntos são válidas para os eventos estatísticos. Essas operações devem
estar contidas no espaço amostral, respostas possíveis. Não se pode realizar operações com eventos
impossíveis.
Todas as operações são realizadas com base na teoria de conjuntos: união e intersecção. Cada
evento deve pertencer ao campo amostral (Ω) e as operações podem ser definidas, como observadas
na Tabela 2, considerando dois eventos descritos como evento A e evento B:
Tabela 2 – Operações de eventos
Operação Símbolo Conjunto
União A U B A ou B
Intersecção A ∩ B A e B
Para compreender melhor essas operações, imagine o experimento de coletar informações de
um servidor, perda de pacotes ao longo do dia, de 3 empresas que utilizam os serviços desse
servidor, as empresas R, X e S. Os eventos a seguir foram retirados por amostra aleatória simples e é
necessário efetuar algumas operações de eventos.
A = {190 pacotes perdidos – horário 9:00 até 10:00}
B = {250 pacotes perdidos – horário 10:01 até 11:00}
Na Figura 2, o resultado da coleta de dados, já com a separação dos pacotes perdidos por
empresa:
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 6/30
Figura 2 – Coleta de dados
Com os dados amostrados do servidor, é possível executar as principais operações com eventos,
lembrando que cada evento descreve um recorte no estudo desejado. Seguem as resoluções viáveis
com os dois eventos realizados:
a) União – o responsável técnico quer descobrir quantos pacotes perdidos ocorreram no
período dos eventos. Neste caso, quer encontrar o resultado da união do evento A e B, dos
pacotes perdidos das 9:00 até 11:00. Para analisar essa ocorrência, irá utilizar a operação de
união dos eventos, conjunto A unido com o conjunto B, (A U B). O resumo destes dois eventos
é o conjunto A com 190 pacotes perdidos (A = {190}) e o conjunto B com 250 pacotes perdidos
(B = {250}). Esta operação é possível, pois existe continuidade no espaço amostral e a união é
junção dos dois eventos. Então, A U B = {190 unidocom mais 250} = 440 pacotes perdidos. No
entanto, se o responsável quiser fazer outra análise com um horário que não foi amostrado, o
resultado será um conjunto vazio (Ø). Na Figura 3, é possível verificar o resultado da união dos
eventos selecionados para esse estudo, A U B = {440}.
Figura 3 – União de eventos
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 7/30
b) Intersecção – o responsável técnico quer descobrir quantos pacotes perdidos ocorreram
em comum no período dos eventos, por exemplo, pacotes da mesma empresa. E, nesse caso,
quer encontrar o resultado da intersecção do evento A e B, dos pacotes perdidos da mesma
empresa, das 9:00 até 11:00. Para analisar essa ocorrência, irá utilizar a operação de intersecção
dos eventos, dados em conjunto A em comum com os dados do conjunto B, (A ∩ B). O evento
que pode ser analisado na intersecção é a quantidade de pacotes perdidos da empresa R em
comum no conjunto A (A = {55 pacotes perdidos da empresa R}) com o conjunto B (B = {60
pacotes perdidos da empresa R}). Esta operação é possível, pois existe uma conexão no espaço
amostral e a intersecção é junção dos dois eventos. Então, A ∩ B = {55 no conjunto e 60 no
conjunto B} = 115 pacotes perdidos da empresa R. Na Figura 4, é possível verificar o resultado
da intersecção dos eventos selecionados para este estudo, A ∩ B = {115}.
Figura 4 – Intersecção de eventos
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 8/30
Essas operações de eventos auxiliam a entender como são as principais conexões entre as
possibilidades de coletas de dados. Por meio dessas operações, é viável criar probabilidade e chances
de ocorrência. Os aspectos fundamentais das operações básicas servem de base para cálculos e
interpretações de experimentos.
TEMA 2 – PROBABILIDADE GERAL
A probabilidade é de extrema importância nos estudos da inferência estatística, pois explica os
fenômenos com amostras de distribuição de frequência, apenas descreve o acontecimento. A
definição dos eventos e da probabilidade ajuda a visualizar o comportamento da variável aleatória e
das amostras aleatórias. Descrevendo como funciona um experimento aleatório, fenômenos
aleatórios e as distribuições de probabilidade.
Para os estudos estatísticos, esses dois elementos definem como o experimento será conduzido,
ajudando a simulação de dados e auxiliando na conclusão do estudo. Compreender as conexões
entre evento e probabilidade ajuda a entrar nesse universo de análise e compreensão de modelos
probabilísticos. O evento e a probabilidade são características da amostra que ajudam a entender
como funciona a população de origem dos dados. Estudaremos esses elementos básicos para definir
conjuntos e formulações matemáticas de eventos.
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 9/30
2.1 CONCEITO DE PROBABILIDADE
Muitos experimentos podem ser realizados e reproduzidos sob as mesmas circunstâncias, com
suas respectivas ocorrências e estimativas. A probabilidade é a indicação de uma chance de
ocorrência de um certo evento, chance esta que deve estar associada ao espaço amostral. Essas
chances podem ser classificadas como segue:
a) A ocorrência é impossível, a solução não consta no espaço amostral, B = Ø, então, P (B)
= 0. Imagine um experimento que analisa erros de conexões em um servidor de rede, mas o
técnico quer analisar erros no computador local. Neste caso, não é possível verificar essa
ocorrência, pois o foco é o servidor de rede.
b) A ocorrência é certa, a solução é o espaço amostral, C = Ω, então, P (C) = 1. Imagine
que no experimento anterior o técnico quer analisar todos os erros ocorridos no servidor de
rede. Neste caso, é possível verificar todas as ocorrências.
Essas duas noções definem a ocorrência ou probabilidade simples de um evento. A equação 1
demostra que essa chance deve estar entre 0 e 1.
A probabilidade simples tem como seu cálculo (analisando os eventos observados ou de
interesse) os resultados possíveis no campo amostral. Essa probabilidade tem grande
representatividade quanto maior for a quantidade de vezes que conseguir repetir o experimento. Na
equação 2, é indicado o cálculo da quantidade de um certo evento sobre a totalidade de eventos
possíveis.
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 10/30
Para entender melhor esse conceito, lembre o exemplo dos pacotes perdidos de um servidor
interligado com três empresas R, X e S. O analista quer verificar, nesse experimento, qual foi a
probabilidade de pacotes perdidos da empresa R. É necessário observar a quantidade de pacotes
perdidos da empresa R, A = {105 pacotes perdidos} e a quantidade total de pacotes perdidos, Ω =
{440 pacotes perdidos}. Na equação 3, é calculada a probabilidade do número do evento analisado,
sobre todas as ocorrências.
Essa probabilidade pode ser lida como a chance de ocorrer um pacote perdido da empresa R
sobre o total de pacotes perdidos que é de 0,24 ou 24 %. Assim, são calculadas todas as
probabilidades simples de ocorrência. A probabilidade de ocorrência de pacote perdido da empresa
S, P (S) = 0,40 ou 40%. A probabilidade de ocorrência de pacote perdido da empresa X, P (X) = 0,34
ou 34 %. A soma de todas as probabilidades simples do espaço amostral deve ser igual a 1 ou 100%,
assim, abrangendo todas as possibilidades de ocorrência do experimento proposto pelo analista.
Com esta definição inicial, é viável a introdução de outras operações de probabilidade.
2.2 ADIÇÃO DE PROBABILIDADES
A regra da adição trabalha com a união de eventos possíveis do campo amostral, utilizando
subconjuntos e somando esses valores. Existem duas opções básicas para realização do cálculo de
adição de probabilidades, é importante conhecer como elas funcionam e onde podem ser aplicadas:
a) Intersecção inexistente – o primeiro caso ocorre quando dois ou mais eventos são
mutuamente exclusivos, em que não existe intersecção entre os acontecimentos ou os dados
estudados. Assim, a intersecção é o conjunto vazio (A ∩ B = Ø), implicando na probabilidade
desse evento ser zero (P (A ∩ B) = 0). A Equação 4 representa a definição união de
probabilidade para (A ∩ B) = Ø:
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 11/30
O espaço amostral dessa união é representado na Figura 5, observa-se que não existe conexão
entre os elementos estudados.
Figura 5 – Intersecção de eventos mutuamente exclusivos
Pode ser observado que os eventos ocorridos no conjunto A não têm ligação com o conjunto B.
Imaginemos que o primeiro evento (A) foram os pacotes perdidos de uma empresa R conectada a
um servidor A. O evento seguinte (B) é representado pelos pacotes perdidos de uma empresa T
conectada a um servidor B. Neste caso, os pacotes analisados na primeira amostra são bem
diferentes da segunda amostra, A = {Empresa R, Servidor A} e B = {Empresa T, Servidor B}. O
resultado será a soma da probabilidade dos eventos, ignorando a intersecção, que não existe.
b) Intersecção existente – o segundo caso ocorre quando dois ou mais eventos não são
mutuamente exclusivos, existindo intersecção entre os acontecimentos ou os dados estudados.
Assim, a intersecção é um conjunto possível e enumerável (A ∩ B) Ø, implicando na
probabilidade desse evento ser diferente de zero (P (A ∩ B) 0). A Equação 5 representa a
definição de união de probabilidade para (A ∩ B) Ø:
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 12/30
O espaço amostral dessa união é representado na Figura 6, existindo conexão entre os
elementos estudados.
Figura 6 – Eventos com intersecção
Pode ser observado que os eventos ocorridos no conjunto A têm ligação com o conjunto B.
Imaginemos que o primeiro evento foram pacotes perdidos de uma empresa R conectada a um
servidor A. No evento B, os pacotes perdidos de uma empresa T conectada a um servidor A. Neste
caso, os pacotes analisados na primeira amostra têm umafonte em comum com a segunda, A =
{Empresa R, Servidor A} e B = {Empresa T, Servidor A}. O resultado será a soma da probabilidade dos
eventos, devendo-se considerar a intersecção, pois ela existe. No entanto, para evitar contar duas
vezes os elementos dos conjuntos analisados, é necessário realizar a subtração da intersecção.
As operações de eventos respeitam a lógica apresentada e, para compreender melhor essas
operações, será analisada a coletas de dados dos pacotes enviados entre um servidor de uma
empresa e um servidor de banco. Na Tabela 3, será demonstrada uma tabela de contingência para
facilitar as operações de eventos.
Tabela 3 – Teste de pacotes
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 13/30
Imaginemos que um técnico ou analista pretende calcular a probabilidade de um pacote ter sido
recebido ou pertencer ao teste 1, matematicamente representado por P (A U B).
Com a apresentação das duas possíveis resoluções da regra da adição, o problema apresentado
pode ser calculado com a existência de uma intersecção.
Cada operação tem a sua interpretação matemática e estatística. A primeira operação de
eventos, a união de conjuntos, analisa a possibilidade do evento A acontecer, ou o evento B
acontecer ou os dois acontecerem (A+B).
Considere que você quer analisar a probabilidade da ocorrência do evento pacote recebidos sem
problema, na equação 6 é calculado o evento A:
Outro evento analisado é a probabilidade de o teste analisado ser o teste 1, na equação 7, é
calculado o evento B:
Com a ajuda da Tabela 3, é fácil verificar a intersecção entre os dois eventos, o pacote ser
recebido e pertencer ao teste 1, a ocorrência é de 945. Na equação 8, é calculada a probabilidade
desse cruzamento:
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 14/30
Agora, é possível calcular a probabilidade de ocorrência do evento A e/ou o evento B,
usando a regra da adição com a existência de intersecção, segundo a equação 9:
Com isso, o resultado do experimento é que a probabilidade de sortear um pacote que foi
recebido ou pertencer ao teste 1 é de 95,5%. Assim, o técnico consegue calcular pela soma de
eventos qualquer probabilidade de acontecer um evento ou o outro dentro de um espaço amostral
possível. Mas deixando bem claro que nem sempre é fácil encontrar uma intersecção de eventos,
quando possível utilizar uma tabela de dupla entrada que facilita muito a visualização de cruzamento
de eventos.
2.3 PROBABILIDADE MARGINAL
Essa probabilidade consiste em combinar dois eventos em conjunto possível do espaço amostral,
em que esses eventos devem ser mutuamente excludentes. Os eventos não podem acontecer ao
mesmo tempo e contemplar todas as conexões possíveis. Em nosso exemplo dos testes para verificar
as perdas de pacote, é considerado um evento principal e dois eventos resultantes. O evento
principal é a realização dos testes e os resultantes são pacote recebido e pacote perdido. Com isso, a
equação 10 ilustra a probabilidade marginal para dois eventos com todas as possíveis combinações:
Na equação, o A indica o evento principal e o B, os eventos consequentes. Essa equação só é
possível se todas as opções de B forem mutuamente exclusivas e coletivamente exaustivas. As
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 15/30
conexões não podem ter intersecções, ocorrência que indica que o evento não pode ocorrer. O
valor de k indica todos os eventos consequentes gerados pelo evento principal, ou seja, todas as
propostas do estudo original.
No nosso exemplo, o pacote “é recebido” ou “é perdido”, não podendo ocorrer esses eventos ao
mesmo tempo. Um pacote não pode ficar em aberto, devendo necessariamente receber um rótulo de
evento dentro das possíveis respostas dadas no início do experimento.
Imaginemos, ainda, que o analista quer calcular a probabilidade do teste 2 e suas possíveis
respostas de “pacotes recebidos” e “pacotes perdidos”. Deve calcular a probabilidade marginal da
execução do teste 2 no nosso experimento. Os testes têm a mesma quantidade de pacotes gerados,
porém, podem existir casos que esse teste tem valores diferentes. A probabilidade pode ser calculada
como a probabilidade de o teste 1 ser igual à probabilidade do teste 1 e pacote recebido, somado
com a probabilidade do teste 1 e pacote não recebido. A equação 11 mostra o resultado do cálculo
dessa probabilidade marginal (verificar as conexões da Tabela 3).
Observe que sempre é feita a comparação com o total de pacotes gerados no experimento todo,
pois temos que verificar as possibilidades do espaço amostral. É necessário garantir que esses
eventos não aconteceram em outras etapas do conjunto e que cada evento é exclusivo. Nos cálculos,
é sempre realizada a soma dos eventos e internamente a intersecção com o evento consequente.
O evento pacote recebido não pode ser ao mesmo tempo pacote perdido, essa exclusão garante
o sucesso do cálculo de probabilidade marginal. Outro cálculo de probabilidade marginal possível é
analisar a probabilidade de pacote perdido, como evento principal e vir do teste 1, teste 2 e teste 3,
como eventos consequentes. A resolução dessa probabilidade marginal pode ser demostrada na
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 16/30
equação 12, indicando que todas as margens de uma tabela de contingência podem ser calculadas
diretamente.
O valor final da soma das probabilidades é , que é exatamente a soma marginal da coluna
de pacotes perdidos do experimento realizado.
Os conceitos iniciais de probabilidade ajudam a entender as relações entre os eventos
estudados, os conjuntos de possíveis respostas, o espaço amostral de todas as respostas e as
equações básicas de probabilidade. Na inferência estatística e na simulação, conhecer as
probabilidades facilita a entender como a amostra está relacionada com a população de origem. O
trabalho começa a ficar bem mais interessante, quando se consegue verificar o comportamento dos
dados e suas conexões básicas.
TEMA 3 – PROBABILIDADE CONDICIONAL
Procura relacionar a ocorrência de um evento do espaço amostral, considerando que um
aconteceu um evento anterior. Procura encontrar probabilidades condicionadas a outra
probabilidade, analisando suas conexões e dependências. Muitos eventos influenciam o que irá
acontecer em um próximo; para o analista é importante entender estas relações de causa e efeito.
A ligação de eventos, a interferência de processos é analisada na probabilidade condicional, pois
nem sempre essas conexões são tão diretas e objetivas. Encontrar as relações de dependência e
independência é o grande foco na condicionalidade e cálculo de suas probabilidades. Estudar esses
efeitos traze grandes benefícios no planejamento e na organização de um projeto.
3.1 PROBABILIDADE CONDICIONAL DEPENDENTE
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 17/30
A probabilidade condicional básica é muito utilizada quando se deseja encontrar uma
probabilidade considerando que um evento do espaço amostral já ocorreu. Esse condicionamento
pode ocorrer quando um experimento deseja considerar um evento já realizado ou pré-definido para
início de teste. Novamente, o experimento vai considerar dois eventos, um que já aconteceu e outro
que irá acontecer, levando em consideração que este evento é possível e faz parte do espaço
amostral. A Equação 13 identifica como é calculada a probabilidade condicional:
O termo indica que a probabilidade de ocorrer o evento A, sabendo que o evento B já
ocorreu, é a divisão da intersecção dos eventos, sobre o evento que já ocorreu ( ). Para
exemplificar, imagine que um analista necessita verificar a probabilidade de um pacote ter sido
perdido, sabendo que ele vem do teste 3, considerando o estudo do envio de uma empresa para um
servidor de dados. Como já verificado, existem casos que existem intersecção e casos que não
existem, cada caso será analisado separadamentee denominado com o termo correto.
Neste experimento, foi verificado que existe intersecção entre os eventos estudados e é possível
calcular a intersecção. No estudo do analista, ele quer encontrar, , a
probabilidade de um pacote perdido dado que ocorreu o teste 3. Neste caso, os outros dois testes
não são considerados, pois temos certeza da ocorrência e seleção do teste 3. Na Figura 7, é ilustrada
como ocorre a probabilidade condicional:
Figura 7 – Ilustração da probabilidade condicional
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 18/30
No problema proposto, a solução é calculada na equação 14:
A probabilidade calculada é de 6,2%, indicando a ocorrência de um pacote perdido dado que foi
selecionado o teste 3. No teste 3, existem 1.000 pacotes, 938 recebidos e 62 perdidos. A
probabilidade condicional estuda, considera o cruzamento entre os eventos estudos e, assim, uma
dependência entre os dados.
3.2 PROBABILIDADE CONDICIONAL INDEPENDENTE
A probabilidade condicional independente ocorre quando a ocorrência de um evento não
interfere o resultado de probabilidade de outro evento, neste caso, os eventos são independentes. A
independência indica que não existe intersecção entre os eventos analisados. Por esse motivo,
conhecer a probabilidade de um evento já ocorrido não ajuda a entender o outro evento que irá
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 19/30
ocorrer. No espaço amostral, os conjuntos não têm conexão e, por esse motivo, os eventos
funcionam de forma independente.
A equação 15 indica como é calculada essa probabilidade condicional de independência:
(A)
A probabilidade de A, sabendo que ocorreu o evento B, não interfere no evento analisado.
Imagine que você continue estudando os pacotes perdidos, porém, é conhecido que ocorreu a
instalação de um novo servidor na empresa. Esse evento é independente do teste que está ocorrendo
entre um servidor existente e o servidor de um banco. Porém, quando queremos verificar a
independência entre os eventos, esta equação é muito importante. Deixando bem claro que o
analista deve conhecer as características do experimento que está realizando, pois facilita muito na
conclusão de um experimento.
A independência é muito importante para verificar se um evento tem influência sobre outro
evento, indicando que a ocorrência de um não é resultado da existência do outro.
Matematicamente, a inexistência de cruzamento de eventos comprova que um evento coexiste
independente do outro. Imagine um teste para verificar a satisfação de clientes que tem dois tipos de
serviço para atender suas necessidades de alto desempenho. Na tabela 4, consta o resultado de uma
pesquisa de satisfação com 300 clientes de médio porte que utilizam serviços de redes de alto
desempenho. A tabela construída foi adaptada para uma tabela cruzada, para facilitar a verificação de
todas as conexões de eventos do espaço amostral.
Tabela 4 – Satisfação com o serviço prestado
Satisfação com o serviço
Serviço prestado Sim Não Total
Fibra óptica 176 44 220
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 20/30
Cabo coaxial 64 16 80
Total 240 60 300
O analista quer verificar se, nesse estudo, existe dependência entre a satisfação do cliente com o
serviço prestado pelas operadoras de internet. Para isso, foi calculada a probabilidade condicional
dos eventos e depois foi comparada com a satisfação do cliente. Lembrando que pelo princípio da
independência, se a probabilidade condicional for igual a probabilidade simples, os eventos são
independentes, logo, não existe conexão direta entre eles. Para esses dados, foram executados os
cálculos seguintes, segundo equações 16 e 17.
Agora, para calcular a probabilidade de estar satisfeito:
Analisando os dois resultados, é verificada a igualdade das duas probabilidades,
consequentemente, nesse estudo, a satisfação do cliente com o serviço prestado e o tipo do serviço
prestado são independentes. Saber que o cliente escolheu o serviço com fibra óptica não garante a
satisfação com o serviço prestado. Nessa comparação de probabilidade, os eventos não têm
interferência direta, outros elementos que influenciam na satisfação do cliente.
Entender a dependência ou independência de eventos em um espaço amostral ajuda os
envolvidos a tomarem decisões e a investirem no local correto para melhoria de processos e
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 21/30
prestação de serviços.
TEMA 4 – VARIÁVEL ALEATÓRIA DISCRETA
Uma variável aleatória pode ser compreendida como o resultado numéricos que dependem de
fatores aleatórios. Esses resultados são elementos possíveis do espaço amostral selecionado para o
experimento. Esses valores identificam a amostra e as características da estatística que será estudada.
As distribuições de probabilidade para essa variável aleatória são uma listagem das respostas
obtidas na análise ou teste realizado, juntamente com as suas probabilidades. Uma variável aleatória
pode assumir valores quantitativos discretos e contínuos, dependendo da investigação que deve ser
realizada. Esta variável indica a principal característica que deve ser retirada no experimento, como
tempo médio de funcionamento, falhas e perdas de pacote, entre outras. A definição correta da
variável aleatória, auxilia nos cálculos, na interpretação do problema e futuras simulações.
4.1 DEFINIÇÃO DA VARIÁVEL ALEATÓRIA DISCRETA
Uma variável aleatória é considerada discreta quando o resultado possível de um experimento
for enumerável, finitos ou infinito. A nomenclatura desses resultados é indicada por lista de valores
prováveis: assim por diante. Como esta listagem pode ser finita ou infinita, o último
elemento vai depender dessa caracterização:
Dados finitos – nesse caso, o último elemento é definido como . Por exemplo, a seleção de 5
servidores para verificar quantidade de pacotes perdidos em uma hora de estudo.
Dados infinitos – nesse caso, não existe um último elemento, a lista contínua contando
indefinidamente. Isso pode acontecer quando é necessário fazer um rastreamento de conexão e
a parada só é feita por meio de uma programação ou de forma manual.
A principal característica de uma variável discreta é a contagem de dados, o analista deve estar
atento a esse detalhe, para facilitar a interpretação dos dados e análise de probabilidades. Imagine
que um técnico realize diariamente uma atividade para verificar o funcionamento de 3 computadores
e realize um teste para conectar a placa de rede deles.
A variável discreta para esse experimento pode ter os seguintes diagnósticos: conectando (C) e
não conectando (N). O estudo quer verificar quando computadores têm problemas na placa de rede
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 22/30
e não estão conectando, os valores possíveis desse espaço amostral é X = {0,1,2,3}. O resultado é
possível, enumerável e finito, indicando a quantidade de computadores com problema na placa de
rede.
Cada resultado de uma variável aleatória discreta, denominado , pode ser associado a uma
probabilidade = , considerando i a listagem dos possíveis resultado do experimento.
No entanto, para ser considerada probabilidade da variável aleatória discreta, deve atender os
seguintes requisitos:
a) A probabilidade de um resultado da variável aleatória deve ser maior ou igual a
zero, para todos os valores da lista resultante. A equação 18 demonstra esse requisito:
b) A soma de todas as probabilidades associadas a uma variável aleatória discreta deve ser
igual a 1. A equação 19 demonstra esse requisito:
A função de probabilidade da variável aleatória discreta é a função p, que define todas as
chances de ocorrência dos eventos analisados.
Para validar os dois requisitos apresentados, considere o espaço amostral do nosso experimento
de conexão de placa de rede, os resultados possíveis seriam: Ω = {CCC, CCN, CNC, NCC, CNN, NCN,
NNC,NNN}. O resultado são 8 combinações possíveis e cada uma associada a uma probabilidade,
observe a tabela 5:
Tabela 5 – Resultados possível para conexão de placa de rede
Placa de rede
Conexão Pontos possíveis Probabilidade
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 23/30
3 CCC 1/8
2 CCN, CNC, NCC 3/8
1 CNN, NCN, NNC 3/8
0 NNN 1/8
O primeiro requisito foi satisfeito, cada variável aleatória discreta tem uma probabilidade
associada e diferente de zero. Para verificação do segundo requisito, basta que a soma das
probabilidades seja igual a 1. Para comprovar este requisito, é necessário somar todas as
probabilidades associada a cada evento estuado. A equação 20 é a somatória das probabilidades e
indica os possíveis resultados, X=3, representa 3 conexões realizadas com sucesso, assim,
sucessivamente até nenhuma conexão com sucesso.
Assim, é comprovada que essa variável é uma variável aleatória discreta, com uma distribuição
de probabilidade que atende os requisitos de uma inferência estatística. Para que um estudo tenha
valor científico, todas as condições devem ser atendidas, isso economiza tempo e dinheiro na
elaboração de laudos e conclusões em procedimentos técnicos. Usar as ferramentas certas, com as
variáveis corretas.
4.2 GRÁFICO DA PROBABILIDADE
O gráfico de probabilidade da variável aleatória discreta ajuda a entender o comportamento da
variável. Com isso o analista consegue prever alguns sintomas e definir manutenções preventivas.
Para a construção do gráfico, todos os valores devem estar identificados como probabilidades. Na
tabela 6, são calculadas as probabilidades de conexão da placa de rede dos computadores
investigados.
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 24/30
Tabela 6 – Probabilidade de conexão da placa de rede
Placa de rede
Conexão Probabilidade
3 0,125
2 0,375
1 0,375
0 0,125
As probabilidades indicam que a chance de todos os computadores estarem conectando têm a
mesma chance que nenhum computador esteja conectando. Na Figura 8, é plotado todos os pontos
possíveis do espaço amostral estudo, com suas respectivas probabilidades.
Figura 8 – Distribuição de probabilidade para a conexão da placa de rede
Como observado, existe uma grande probabilidade de uma ou duas máquinas estarem com
problema de conexão na placa de rede, totalizando 75% de chance de ocorrência.
O comportamento da distribuição de probabilidade da variável aleatória discreta tem suas
características, cada experimento possui definições e apontamentos importantes para o analista.
Neste caso, as probabilidades ilustradas no gráfico auxiliam na tomada de decisão. O gráfico indica
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 25/30
as maiores chances de ocorrência e planejamentos de operação, lembrando que é esperado que
todos os computadores tenham a mesma prioridade diante da manutenção. Esse gráfico de
probabilidade indica uma chance honesta para cada máquina, qualquer preferência altera as
probabilidades do experimento.
TEMA 5 – DISTRIBUIÇÃO DE PROBABILIDADE VARIÁVEL ALEATÓRIA
DISCRETA
Para uma distribuição de probabilidades, algumas características numéricas são importantes para
descrever o comportamento da variável aleatória. Cada experimento tem suas peculiaridades, suas
probabilidades e a forma de condução do projeto. A distribuição de probabilidade representa como
as variáveis expressam seus resultados, por meio da ocorrência e da probabilidade da ocorrência.
Demonstrando comportamento das variáveis aleatórias discretas de acordo com um escopo de
trabalho.
As três principais características numéricas de uma distribuição de probabilidades são: o valor
esperado, a variância e desvio padrão. Com esses estimadores, é possível conhecer e parametrizar
ações para o estudo do experimento e inferir algumas conclusões iniciais de manutenção e reparo.
5.1 VALOR ESPERADO
A média ponderada de uma distribuição de probabilidade de uma variável aleatória discreta é o
valor esperado da variável estudada. Esse valor esperado começa com a multiplicação de cada
resultado da variável observada (X) e sua respectiva probabilidade . Depois, é realizado um
somatório com todos os resultados encontrados na multiplicação, a representação desses dois
passos é indicada na equação 21:
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 26/30
Em nosso experimento de conexão da placa de rede, existe uma distribuição de probabilidades
discreta, que indica o valor esperado ou a esperança matemática do evento estudo. Para encontrar o
valor esperado de placas de redes conectadas, a equação 22 demonstra esse cálculo. A equação tem
o número de placas conectadas, multiplicada pela probabilidade de ocorrência do evento.
Considerando todas as respostas possíveis no campo amostral.
O valor esperado é de 1,5 placas de redes que estejam funcionando normalmente, indica o valor
médio de placas sem defeito de conexão por dia. Na prática, como a variável é discreta, é esperado
que uma ou duas placas funcionem corretamente. O valor esperado é um forte estimador para
detectar e avaliar propostas de manutenção preventiva, indicando uma probabilidade de erros em
um experimento técnico. Essa característica da distribuição de probabilidade da variável aleatória
discreta representa uma média esperada do evento estudado, padronizando algumas ações.
5.2 VARIÂNCIA E DESVIO PADRÃO
Quando a distribuição de probabilidade apresenta um valor esperado para a distribuição, surge
uma dúvida, como esses valores podem variar em torno dessa média. Nesse momento, surge a
necessidade de estudar duas características importantes dessa distribuição de probabilidades, a
variância e o desvio padrão da variável aleatória discreta. Essa variação ajuda a entender os limites
possíveis do evento que está sendo estudado.
Para calcular a variância, é necessário verificar quanto o ponto analisado está distante do ponto
médio e depois é elevado o resultado ao quadrado, , depois multiplica-se o valor pela
respectiva probabilidade do evento. Em seguida, é realizada a soma de todos os produtos
encontrados. A equação 23 demonstra como é realizado o cálculo da variância de uma variável
aleatória discreta.
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 27/30
Consequentemente, a equação 24 define o desvio padrão de uma variável aleatória discreta.
Para facilitar o entendimento do cálculo da variância da conexão das placas de redes, a Tabela 7
demonstra todos os passos utilizados para encontrar o valor desejado. Nos cálculos, a E(X) = 1,4,
como demostrado anteriormente.
Tabela 7 – Cálculo da variância de conexão da placa de rede
O valor da variância é a somatória dos valores resultantes, VAR (X) = 0,76, porém, esse valor é
quadrático e de difícil interpretação. Por esse motivo, é calculado o desvio padrão da distribuição de
probabilidade. Na equação 25, é encontrado esse valor.
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 28/30
Com o valor do desvio padrão, o analista consegue ter uma ideia de como a variável se
comporta. O valor encontrado indica a variação em torno do valor esperado, no nosso problema, +
0,87 e -0,87 em relação à média calculada. Assim, um intervalo é criado para o experimento,
conforme Figura 9.
Figura 9 – Intervalo para a conexão da placa de rede
A conclusão com esse intervalo é que a média de conexões diárias de funcionamento de placa
de rede nos três computadores analisados é 1,4 e pode variar de 0,50 a 2,27 conexões. Esses valores
da variável aleatória discreta correspondem a análises e intervenções diárias, indicando um padrão de
probabilidade.
Essas métricas facilitam a compreensão da amostra e, nas devidas proporções, tipificação de
equipamentos e controle de processo, podem servir de simulação para toda a população de
computadores de uma empresa. Quanto mais amostras forem coletadas, maior é a chance dos
estimadoresse aproximarem do parâmetro da população. O valor esperado, a variância e o desvio
padrão são os estimadores mais utilizados para descrever uma distribuição de probabilidade de uma
variável aleatória discreta.
Conhecer e identificar uma distribuição de probabilidade facilita o planejamento e o
estabelecimento de indicadores para agilizar a manutenção e reparo de muitos processos em redes
de computadores.
FINALIZANDO
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 29/30
Nesta aula, foram contemplados os conceitos iniciais de distribuição de probabilidade, a
necessidade de identificar um evento e uma variável aleatória. Buscamos calcular as principais
probabilidades e entender suas representações e particularidades. Também foi analisada a
importância da coerência dos dados amostrais, identificando o experimento e definindo o espaço de
possibilidades.
Entendemos como são realizadas as operações com eventos e com probabilidade de eventos,
para conseguir compreender o comportamento de cada elemento do experimento. Trabalhamos
probabilidades condicionais e seus principais limitantes. Identificamos uma variável aleatória discreta,
um planejamento e atribuímos probabilidade para cada evento. Construímos um modelo de
distribuição de probabilidade para uma variável discreta e formalizamos seus elementos principais:
valor esperado, variância e desvio padrão. Dessa forma, ajudando o analista a interpretar melhor seu
experimento, evento, espaço amostral e as probabilidades.
REFERÊNCIAS
ANDRADE, D. F.; OGLIARI, P. J., Estatística para as Ciências Agrárias e Biológicas: com noções
de experimentação. 2. ed. Florianópolis: Editora UFSC, 2010.
BARBETTA, P. A. Estatística para cursos de engenharia e informática. 3. ed. São Paulo: Atlas,
2010.
BEKMAN, O. R.; COSTA NETO, P. L. O. Análise estatística da decisão. 2. ed. São Paulo: Blucher,
2009 (BVP).
BUSSAB, W.O.; MORETTIN, P.A. Estatística Básica. 9. Ed. São Paulo: Saraiva, 2007.
CLARK, J.; DOWNING, D., Estatística Aplicada. São Paulo: Editora Saraiva, 1998.
COCHRAN, W. G., Técnicas de Amostragem. Rio de Janeiro: Editora Fundo de Cultura, 1965.
DAVID, S. M. A estatística básica e sua prática. Livros Técnicos e Científicos, 2005.
FARIAS, A. M. L. Apostila de Inferência Estatística. Rio de Janeiro: Universidade Federal
Fluminense, Instituto de Matemática, 2008.
GOMES, F. P. Curso de Estatística Experimental. Piracicaba: Livraria Nobel, 1985.
13/04/2023, 20:15 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 30/30
LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D., Estatística: Teoria e aplicações. Rio de Janeiro:
LTC, 2012.
MAGALHÃES, M. N.; LIMA, A.C. P. Noções de Probabilidade e Estatística, 7. ed. EDUSP, 2011.
MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidade para Engenheiros.
2. ed. Rio de Janeiro: LTC, 2003.
MONTGOMERY, D. C. Estatística aplicada e probabilidade para engenheiros. Rio de Janeiro:
LTC, 2018. (MB)
MORRIS, D.; MARK, S. Probability and Statistics. 4th. ed. 2012.
SPINELLI, W.; SOUZA, M. S.; Introdução à Estatística. São Paulo: Editora Ática.