Buscar

Aula1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 1/30
 
 
 
 
 
 
 
 
 
 
 
 
 
INFERÊNCIA ESTATÍSTICA E
SIMULAÇÃO
AULA 1
 
 
 
 
 
 
 
 
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 2/30
 
 
Prof. João Carlos da Silva
CONVERSA INICIAL
O grande desafio da inferência estatística é obter informações de uma população com dados
fornecidos por uma amostra. Definir processos e técnicas de amostragem, distribuição de amostras e
definir estimadores são pontos importantes nestes conceitos iniciais.
Um bom profissional da área técnica necessita entender como usar essas ferramentas estatísticas
e discernir onde utilizá-las. As novas tecnologias, a velocidade de dados e a quantidade de
informações, possibilitaram a utilização de inferência estatísticas em todos os ramos das ciências,
testando, verificando e simulando dados para provar sua consistência e veracidade.
Com essas ferramentas, podemos minimizar experimentos e testes de várias áreas da tecnologia,
delimitando uma amostra significativa que represente todos os dados possíveis. Com isso,
diminuímos a quantidade de investimentos para validar pesquisas e testes de sistemas, pois
podemos usar amostrar para verificar comportamento da população.
A inferência estatística vem para agilizar e proporcionar base científica para os estudos
empresarias, para iniciar é necessário conhecer alguns conceitos básicos, passando por a definição de
população e amostra, parâmetro e estatísticas, e a formação de um estimador e intervalo amostral de
confiança.
Um excelente estudo e esteja aberto para conceitos novos e desafiadores.
TEMA 1 – POPULAÇÃO
A população de um estudo deve representar todos os indivíduos, objetos e dados desse
conjunto. Com essas informações, é possível obter, pelo menos, um atributo relevante para entender
o comportamento do todos os indivíduos e consolidar hipóteses. Desta forma, cada representante do
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 3/30
grupo recebe um número ou uma característica para facilitar a compreensão do funcionamento desta
população.
Para os estudos estatísticos, devem ser observados: a formação, as especificidades e arranjos dos
elementos do conjunto, indicando como é o comportamento do todo. Assim, cada população tem
características resumidas que representam todo o grupo de estudo e são indicadas por variáveis
numéricas: média, variância, desvio padrão, modo, entre outras. Estudaremos os elementos básicos
para definir uma população e o comportamento em um estudo de caso.
1.1 CARACTERÍSTICAS DE FORMAÇÃO
Para determinar o número de formação de uma população, é importante entender que existem
dois tipos distintos de agrupamento. Isso define como serão realizados os cálculos e definição de
coleta de dados. Uma população representa o total de dados ou objetos que devem ser analisados.
Na Figura 1, é possível verificar um agrupamento populacional. É importante verificar que o grupo
possua as mesmas características, para auxiliar na contagem, especificação e medição das variáveis
do estudo.
Figura 1 – População
Crédito: Aha-Soft/Shutterstock.
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 4/30
O tamanho do grupo define o tamanho da população, os agrupamentos populacionais podem
ser definidos como finitos e infinitos e estão correlacionados com a facilidade de encontrar todos os
elementos do conjunto. A representação numérica de um número de informações, dados ou objetos
em uma população é denotado pela letra n máscula (N), indicando o total desse grupo. Por exemplo,
imagine uma empresa que possui 2.300 computadores e 1.500 funcionários, o valor populacional dos
computares será representado por N = 2.300 e o número de funcionários N = 1.500.
1.2 POPULAÇÃO FINITA
Possui um número limitado de dados ou objetos a serem analisados, porém esse número pode
ser muito grande. As principais características dessa formação é que ela é enumerável e tem
possibilidade de contagem.
Em uma rede local de computadores de uma organização, os elementos físicos fazem parte de
uma população finita, por exemplo: roteadores, hubs, servidores, cabos, conexões e entre outros.
Na Figura 2, podemos ver uma ilustração de um agrupamento de uma população finita, com os
seus elementos e subconjuntos. Com isso, a análise e a inferência estatística auxiliam na
determinação de ações e verificações importantes no sistema que será verificado. As coletas de
informação tendem a ser mais eficiente com um número finito de uma população, pois se torna mais
eficaz na comparação de dados.
Figura 2 – População finita e enumerável
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 5/30
Crédito: Elenabsl/Shutterstock.
1.3 POPULAÇÃO INFINITA
Possui um número ilimitado de dados ou objetos a serem analisados, principalmente quando
são realizadas análise ao longo do tempo. Em uma rede local de computadores de uma organização,
os elementos da rede lógica e as informações trocadas pelos equipamentos podem ser consideradas
como uma população infinita.
Uma das grandes vantagens dessa população da rede lógica é que a coleta de dados também
pode ser ilimitada. Isso gera facilidades para validar algumas definições estatísticas e tornar os
estudos confiáveis. Imagine um profissional que quer verificar o desempenho da troca de
informações entre uma rede de computares e a velocidade de comunicação, ambos com população
infinita, a inferência estatística tem papel fundamental para auxiliar o profissional no estudo que
deseja realizar.
TEMA 2 – AMOSTRA ALEATÓRIA SIMPLES
Uma amostra é um subconjunto de uma população de interesse e todos os resultados e
conclusões serão tomadas baseadas nesta coleta de dados. Por esse motivo, a amostra deve ser
representativa, para conseguir espelhar em escala menor, os efeitos ocorridos na população
estudada. Por isso, esta coleta deve ser calculada, planejada e realizada, com tempo e métrica bem
definida pelo profissional que irá realizar o estudo. Assim, é factível realizar um plano de trabalho
para resolver problemas ocorridos em uma rede de computadores e outras áreas da tecnologia.
2.1 AMOSTRAGEM DE DADOS
Existem várias maneiras de coletar informações de uma população de interesse, essa técnica é
denominada amostragem. Para delimitar os estudos, será demonstrado a amostragem aleatória
simples, que tem muitas aplicações nas redes de computadores.
Uma amostragem aleatória simples consiste em retirar uma amostra representativa de uma
população, conforme ilustrado na Figura 3. Caso ocorram outras amostras com o mesmo tamanho da
amostra inicial, estas devem ter a mesma chance (probabilidade) de ser selecionada.
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 6/30
Figura 3 – Amostra aleatória simples
Crédito: Bakhtiar Zein/Shutterstock.
A representação numérica do um número de observações retiradas de uma população, é
denotado pela letra n minúscula (n), indicando o total desse subconjunto amostral. Por exemplo,
imagine uma empresa que possui 10 roteadores e o responsável técnico necessita avaliar o
desempenho de dois roteadores disponíveis na rede. O responsável deve selecionar de forma
aleatória dois equipamentos para análise, sendo que a população será representada por N=10 e a
amostra aleatória simples será representada por n=2. Para que essa amostra seja considerada válida,
a chance de sortear quais outros pares devem ser as mesmas.
Para garantir que a amostra tenha a mesma probabilidade de ocorrência, devem ser seguidos os
seguintes passos a seguir, o resultado é verificado na Figura 4:
Passo 1 – numerar e identificar os elementos da população, em nosso caso, vamos numerar de
1 até 10.
Passo 2 – definir um método para sortear o par de roteadores que serão analisados, podendo
gerar uma função randômica no Excel ou escrever os números em papéis e sortear.
Passo 3 – garantir que o sorteio possaser repetido várias vezes e que não exista nenhum viés
no método escolhido.
Passo 4 – selecionar os equipamentos que foram sorteados para iniciar a análise.
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 7/30
Figura 4 – Método de amostragem aleatória simples
Seguindo todos os passos propostos, o estudo consegue ter uma metodologia simples e
eficiente para coleta de dados. O importante é garantir a mesma chance de sorteio para todas as
amostras possíveis, certificando, desta forma, que a inferência estatística tem eficiência nos estudos
selecionados.
2.2 AMOSTRA COM REPOSIÇÃO E SEM REPOSIÇÃO
As amostras simples podem ser retiradas com reposição e sem reposição, mas, quando
trabalhamos com populações muito grandes, os dois tipos de amostragem levam a resultados bem
parecidos. A maioria das distribuições que são utilizadas para análise de dados em redes de
computadores utiliza amostragem simples com reposição.
Para entender melhor o que é uma amostra com e sem reposição, uma analista tem que
selecionar 20 computadores para análise de dados de conexão da rede, em uma população de 100
computadores. Seguem os dois tipos de amostragem:
a)  Amostra simples sem reposição – nesta amostragem, o analista sorteia duas máquinas
para realizar o teste de conexão de rede, porém, esse par não é mais verificado. Não existe
reposição da amostra para a população inicial, esses elementos não participam de teste de
outras conexões. A cada retirada a população vai diminuindo e as probabilidades vão se
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 8/30
alterando. Na primeira amostragem, a população possui 100 computadores e são retirados dois
computadores, como não existe reposição a próxima retirada a população possui 98
computadores. Na Tabela 1, é possível verificar como esse processo vai acontecendo ao longo
do tempo. A cada nova retirada de elementos, o desenho do sorteio vai se alterando, até
finalizar todos os computadores de testes.
Tabela 1 – Amostra simples sem reposição
Computadores Amostras
100 27, 42
98 11, 98
96 01, 55
95 44, 81
94 33, 62
93 25, 94
92 05, 47
91 81, 77
90 36, 09
... ...
2 21, 38
Na Figura 5, é indicado como é feita essa amostragem. A cada retirada de uma amostra de dois
elementos, a população sofre um decréscimo de dois itens.
Figura 5 – Amostragem simples sem reposição
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 9/30
Neste formato de amostragem, um elemento que é testado não volta a lista de prováveis teste,
assim é definida a amostragem simples sem reposição.
b)   Amostra simples com reposição – nesta amostragem, o analista sorteia duas máquinas
para realizar o teste de conexão de rede, porém, esse par é recolocado na população original.
Existe reposição da amostra para a população inicial, esses elementos continuam fazendo parte
de teste de conexões. Na Tabela 2, é possível verificar que a cada retirada de um par de
elementos, a população não altera e as probabilidades continuam as mesmas. Esse processo vai
acontecendo a cada nova retirada de elementos para a análise da rede.
Tabela 2 – Amostra simples com reposição
Computadores Amostras
100 27, 42
100 11, 98
100 01, 55
100 44, 81
100 33, 62
100 25, 94
100 05, 47
100 81, 77
100 36, 09
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 10/30
... ...
100 21, 38
Na Figura 6, é indicado como é feita esta amostragem, a cada retirada de uma amostra de dois
elementos, a população não sofre um decréscimo de dois itens.
Figura 6 – Amostragem simples com reposição
As amostras simples com reposição tornam a inferência estatística muito mais assertiva e as
análises de dados refletindo os aspectos reais de funcionamento. Para se obter um planejamento
adequado, a definição de como será a coleta de dados é fundamental para o sucesso da atividade
que se quer desenvolver. Neste caso, é possível verificar que os dados amostrais, conseguem refletir
os fenômenos que ocorrem nos dados populacionais.
A preparação inicial de uma atividade determina o êxito na realização do trabalho e direciona o
progresso dos estudos. A partir desse momento, toda vez que for mencionado amostra aleatória
simples, você deve relacionar à amostra aleatória simples com reposição.
2.3 DEFINIÇÃO MATEMÁTICA DE AMOSTRA SIMPLES
Em um estudo de uma população, os valores podem ser representados por uma variável
aleatória X, essa variável representa um atributo de interesse. Pode ser o tempo de resposta,
desempenho da rede, incluindo outras áreas. Um sorteio de uma amostra aleatória simples de
tamanho n é representado por  de uma variável aleatória X. Essa representação indica
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 11/30
a variável aleatória da amostra e a ordem que foram coletado os dados para a pesquisa ou
experimento.
Imagine um estudo que quer verificar a qualidade na transmissão de dados, são realizadas 3
coletas de 1.000 observações e cada observação dura 1 segundo. Por nossa definição matemática,
seguem os itens observados:
a)  Variável aleatória – X: qualidade na transmissão de dados
b)  População: transmissão de dados
c)   Tamanho da população: infinita
d)  Notação: N = ∞
e)  Amostra: três amostras com 1.000 observações
f)    Tamanho da amostra: 3.000 observações, divididas em três subgrupos
g)  Notação: 
h)  Variável aleatória da amostra: 
Para um estudo eficiente, é necessário indicar o horário e a data da coleta de dados, informando
o resultado obtido em cada amostra. Na Tabela 3, há um exemplo dessa representação:
Tabela 3 – Exemplo de coleta de dados
Desta maneira, é definido o modelo matemático e estatístico para um experimento, ajudando a
alimentar os simuladores e facilitar a resolução de cada problema. Outra vantagem é que essas
informações podem resumir e orientar as discussões, interpretações e conclusões dos trabalhos. No
entanto, deve-se sempre manter os dados, pois são eles que indicam os valores reais da coleta de
dados, a informação original é um grande trunfo para realizar uma excelente inferência estatística.
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 12/30
TEMA 3 – ESTATÍSTICA E PARÂMETRO
A definição e compreensão correta do que é estatística e o que é parâmetro tem relevância
fundamental nos cálculos na inferência estatística. Entender como obter cada uma destas
característica do experimento, direciona os testes e conclusões dos estudos. Cada um desses
elementos tem a sua importância e estão ligados diretamente à população e à amostra. Essas
características conseguem indicar vários detalhes sobre o estudo que está sendo realizado e facilitam
o entendimento da ligação entre os elementos que estão sendo observados.
A estatística e o parâmetro definem o direcionamento de como o responsável deve proceder
seus diagnósticos e pesquisas. Indicando os padrões, modelos e planejamentos que devem ser
seguidos, para obter conhecimento e aplicações para o que se deseja investigar. Essas métricas são
de grande importância para uma análise estatística e matemática.
3.1 PARÂMETRO
É uma dimensão numérica que retrata um atributo de uma população que está sendo estudada
e analisada. Esse parâmetro pode ter medição, especificação técnica ou regulamentação, cada um
com sua aplicação e padronização definida previamente por órgãos de regulamentação. É importante
definir cada um deles:
a) Medição –acontece quando uma população tem seus elementos analisados por meio de
uma medição. Por exemplo: tempo de resposta de uma conexão, qualidade de uma imagem,
quantidade de portas, assim por diante.
b) Especificação técnica – normalmente vem de especificação de cada fornecedor,
característica própria ou de um conjunto de fabricantes. Por exemplo: Memória RAM: 256 Mb,
Memória FLASH: 64 Mb e Throughput: 61.440 Mbps.
c) Regulamentação – informação definida por um órgão regulamentador, por exemplo:
Anatel, em 01de dezembro de 2017, Tags: Comunicação Multimídia, SCM, Banda Larga, Norma
Fiscalização, Portaria Vigente. Ato n. 4456, de 11 de junho de 2018.
O parâmetro ajuda a sintetizar uma grande quantidade de informações, indicar caminhos e
padronizar processos. Essa notação facilita a comparação e prognóstico dos elementos retirados da
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 13/30
população. Isso determina a operação das organizações e definições de qualidade de serviços e
competência técnica.
O parâmetro é um resumo numérico de um banco de dados, que vem de uma variável aleatória
(X), determinada no início de um estudo. Esses parâmetros são comumente chamados de
representação numérica, por exemplo: média populacional, variância populacional, peso
populacional, entre outros. Segue as principais notações que são usadas nos estudos estatísticos, que
facilitam a compreensão do comportamento dos dados e padroniza as nomeações matemáticas. Na
Tabela 4, são verificados os principais parâmetros utilizados na estatística.
Tabela 4 – Parâmetro populacional
Característica Parâmetro
Média µ
Variância σ²
Desvio padrão σ
Proporção P
Correlação ρ
Números de elementos N
Fonte: Adaptado de Dalton e Ogliari, 2010.
Esses valores indicam característica da população e auxiliam na inferência estatística, lembrando
que esta população poder sair de uma população maior para facilitar os estudos. O parâmetro é a
régua de precisão que ajuda a entender o comportamento do grupo, de elementos ou de dados.
3.2 ESTATÍSTICA
É uma dimensão numérica que retrata um atributo de uma amostra que está sendo estudada e
analisada. Essa estatística pode ser medida por meio de ensaios e retirada de dados amostrais, essas
informações servem de direcionamento para verificação de informações. É esperado que esses dados
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 14/30
se comportem de acordo com a população que foi amostrada, servindo de generalização para todas
as demais amostras que serão retiradas.
Esses valores amostrais contribuem para validação de sistemas, qualidade de serviços e
adequação a normas, procurando sempre atender os pressupostos informados pela população
amostrada. Segue as principais notações que são usadas nos estudos estatísticos, que facilitam a
compreensão do comportamento dos dados e padroniza as nomeações matemáticas. Na Tabela 5,
são verificados os principais parâmetros utilizados na estatística.
Tabela 5 – Estatística amostral
Característica Estatística
Média
Variância s²
Desvio padrão s
Proporção
Correlação r
Números de elementos n
Fonte: Adaptado de Dalton e Ogliari, 2010.
O valor da estatística depende dos valores amostrados e sofre variações dependendo do
planejamento executado. Uma estatística amostral é uma estimativa dos dados populacionais e
denominada de estimador. Esse estimador é um excelente referencial do parâmetro, por exemplo:
a) O estimador da média populacional (µ) é a média amostral ( )
b) O estimador da variância populacional (σ²) é a variância amostral (s²)
c) O estimador da correlação populacional (ρ) é a correlação amostral (r)
O valor dessas estimativas indica uma forte relação entre parâmetro e estatística, isso sempre
analisando se a amostra é representativa. Na Figura 7, é possível verificar a ligação entre o parâmetro
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 15/30
(população), estatística (amostra) e a inferência estatística. O exemplo para ilustrar esta ligação será o
mesmo utilizado anteriormente, a retirada de 2 computadores (n=2), em uma população de 100
computadores (N=100).
Figura 7 – Pressupostos da inferência estatística
É importante um plano de amostra adequado para que a inferência estatística tenha sua
efetividade nos cálculos e conclusões. A inferência procura estimar os valores populacionais por meio
das amostras, relacionando estatística com parâmetro. Quanto melhor forem estas estimativas,
menos desperdícios de tempo e de investimentos, para realização das atividades de uma empresa ou
instituição.
TEMA 4 – DISTRIBUIÇÕES AMOSTRAIS
Para conseguir ter êxito no cálculo das estimativas, é importante conhecer como que esses
dados amostrais se comportam e com isso conseguir determinar erros de precisão e formato dos
dados. Os casos que serão analisados são de amostra aleatória simples, com a representação dos
principais estimadores.
O desafio é, por meio de uma amostra, conseguir prever os valores da população, atender aos
parâmetros e atingir as métricas propostas no referencial técnico de uma instituição. Esses dados
serão mais eficientes, quanto maior forem as observações e a definição correta do estimador. Quanto
mais amostras retiradas de uma mesma população, mais perto do valor verdadeira espera-se estar.
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 16/30
As distribuições amostrais indicam esse caminho que deve ser percorrido, para encontrar os
estimadores eficientes.
4.1 DISTRIBUIÇÃO AMOSTRAL DA MÉDIA
A distribuição amostral da estatística da média é representada por , procura atingir a média
populacional do estudo que está sendo realizado. A média amostral é formulada por meio de uma
média simples, seguindo a equação (1):
, média amostral
n, quantidade total de observações da amostra
, número da observação
Essa média amostral possui valores distintos, pois a coleta de dados é retirada em momentos
diferentes e pontos diferentes. Com isso, é comum uma variação entre as médias amostrais e com o
maior número de coleta essa média tende a se aproximar da média populacional.
Para compreender melhor essa distribuição, imagine um técnico que deseja verificar a latência
em um link de uma conexão entre um computador e um servidor que está localizado em outro
estado.
Na Figura 8, temos uma ilustração dessa conexão, existem vários fatores que interferem no
tempo de resposta, mas vamos nos concentrar na média amostral do tempo da latência. Assim, é
possível analisar falhas, processos e metodologias que estão sendo aplicadas para melhorar o tempo
de latência. Lembrando que latência é o tempo que um pacote de dados leva para sair do
computador original e chegar no destino planejado.
Figura 8 – Conexão entre computador e servidor
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 17/30
Crédito: Microone/Shutterstock.
O experimento a seguir foi realizado para testar tempo de latência (milissegundos) entre um
computador local e um servidor localizado no estado de São Paulo, utilizando o site <http://yuip.org/
pt/test-latency>. Esse experimento durou 10 minutos e cada amostra coletada em um intervalo de 1
minuto. Na Tabela 6, encontra-se a especificação de 5 observações em 10 amostras. Nesse
experimento, os parâmetros de latência que serão utilizados para comparação dos dados:
µ = 54 ms (milissegundo) – média populacional
σ = 5 ms (milissegundo) – erro padrão populacional
As médias esperadas devem estar entre 49 e 59 milissegundos, atendendo as especificações do
experimento que será realizado.
Tabela 6 – Distribuição amostral da média amostral
http://yuip.org/pt/test-latency
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 18/30
O valor da média amostral, calculado para a primeira amostra ( , é demostrado na
equação 2, aplicando a equação 1:
Assim, são calculadas as médias amostrais que procuram demonstrar o funcionamento da média
populacional. Pode-se observar que cada amostra tem a sua característica própria, a primeira obteve
o menor tempo de latência e sétima, o maior tempo. Poderia também ser criada uma relação com a
probabilidade de cada média amostral ocorrer, mas, neste momento, está sendo considerado
somente o evento, sem probabilidades de ocorrência.
Lembrando que para esse experimento foi considerando um tempo de latência padronizado de
54 ms, temos 4 amostras que atenderam ao tempo estipulado (1, 3, 4 e 6) e 6 amostrasque não
atenderam (2,5,7,8,9 e 10). A conclusão é que o atendimento da norma nos 10 minutos de
experimento foi de 40%. Neste momento, entra em cena o papel do responsável técnico que deve
observar e iniciar a verificação dos prováveis problemas. A próxima etapa para entender essa
distribuição das médias amostrais é a análise dos gráficos dos dados e seu comportamento em torno
dos parâmetros estipulados.
4.2 GRÁFICO DA DISTRIBUIÇÃO AMOSTRAL DA MÉDIA
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 19/30
O gráfico de distribuição demonstra como os dados se comportam em relação ao tamanho da
amostra. No caso do experimento acima realizado, amostra com 10 observações, é possível analisar o
comportamento dos dados no tempo e no espaço determinados no experimento. A grande
vantagem da rede de computadores é que a população é ilimitada, podemos retirar várias amostras
de vários tamanhos.
O único cuidado que temos que tomar é que o procedimento de coleta de todas as amostras
deve ser exatamente os mesmos: critérios, condições e equipamentos. Lembre que o planejamento
do experimento é que garante uma inferência estatística correta.
O experimento se divide em duas partes, a análise do comportamento e a relação com o
parâmetro, lembrando que os dados estão sendo analisados em relação ao tempo.
a)  Comportamento – no experimento realizado de latência, demonstrado na Figura 9, é
possível verificar como os tempos de latência se distribuem ao longo do experimento. Foram
coletadas 100 observações, distribuídas em grupo de 5 observações, que facilitam a análise dos
dados.
O comportamento das médias, é ilustrado pela linha vermelha no gráfico de distribuição, pode-
se observar uma oscilação nos tempos médios amostrais, sofrendo grandes variações ao longo do
experimento. Os elementos de cada amostra refletem diretamente na média e é muito importante
realizar uma análise individual em cada amostra.
Figura 9 – Gráfico da distribuição da média amostral da latência (ms) (1)
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 20/30
Em um gráfico de tempo de latência, é importante realizar uma coleta contínua de dados e varia
o tamanho da amostra e verificar as variações dos dados ao longo do tempo. Essa variação pode
ajudar a entender o comportamento dos elementos estudados e melhorar a assertividades dos
modelos estudos e implantados em uma rede de computadores.
Relação com o parâmetro – outro fator importante é a relação com o parâmetro definido no
experimento. Graficamente, é possível verificar quais médias amostrais estão dentro do padrão
estabelecido e quais não estão nos índices determinados. Na Figura 10, é demonstrado como a
distribuição das médias amostrais se comportam em relação ao parâmetro estipulado: µ = 54
ms e σ = 5 ms.
Figura 10 – Gráfico da distribuição da média amostral da latência (ms) (2)
A linha vermelha indica o ponto máximo (59 ms), o extremo inferior (49 ms) não foi desenhado,
pois nenhuma amostra atingiu este valor. Com o gráfico, é possível verificar as amostras que
atendem a norma estipulada, temos como médias amostrais dentro do parâmetro:  
As demais amostras foram do valor determinado e continuam esse comportamento, os estudos
devem ser aprofundados. Deixando bem claro que não está sendo referenciado nenhuma
probabilidade para os eventos. Isso será integrado a distribuição, com o conhecimento dos
parâmetros e aprendizado dos conceitos básicos estatísticos.
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 21/30
Agora, na Figura 11, será apresentado os histogramas da distribuição das 100 amostras e das 10
médias amostrais, neste momento, não está sendo analisado o tempo da coleta de dados, e sim a
frequência de ocorrência.
Figura 11 – Histograma da distribuição amostral e distribuição da média amostral
O gráfico da distribuição amostral e da média amostral indicam uma forte ocorrência no lado
esquerdo do histograma, com pouca ocorrência no lado direito. Com esses gráficos, podemos
verificar algumas tendências nessas amostras, sendo possível analisar o desempenho em comparação
com os parâmetros populacionais. Assim, podem ser propostas distribuições com probabilidades de
ocorrência e a criação de faixas mais confiáveis de aceitação de amostras.
Cada população possui suas características e os gráficos de distribuição ajudam a entender
como funciona esta população. Deixando bem claro que esses parâmetros devem estar descritos e de
fácil entendimento para o responsável pelos testes e experimentos.
TEMA 5 – ESTIMAÇÃO DE PARÂMETROS
Estimação consiste em usar os dados coletados por meio de uma amostra, ou conjunto de
amostras, para estimar os parâmetros de uma população desconhecida. Por meio desse
procedimento, consegue-se avaliar os dados amostrais e inferir sobre o comportamento dos dados
populacionais. Os parâmetros mais utilizados para essa análise são: Média (µ), Variância (σ²), Desvio
Padrão (σ) e Proporção (P).
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 22/30
O responsável técnico pelo estudo, ou analista que está resolvendo um problema, tem que
garantir que as amostras que estão utilizando resultados verdadeiros e com todas as propriedades de
validação dos processos. Estimadores bem escolhidos fornecem uma avaliação correta sobre os
parâmetros utilizados. A sequência das atividades depende de um estimador estatísticos com
propriedades e características relevantes para o estudo. Boas estimações dependem da escolha
coerente de um estimador e das características dos dados que estão sendo analisados.
5.1 PROPRIEDADES DOS ESTIMADORES
Os estimadores necessitam ter algumas propriedades para serem selecionados com válidos para
o estudo das características da população. Como vimos anteriormente, cada parâmetro tem uma
estatística equivalente para validar as inferências estatísticas. Seguem algumas características
importantes para definir um bom estimador:
a) Não viciado – ocorre quando o estimador escolhido tem o valor esperado ou médio,
igual a parâmetro estimado.
b) Consistência – ocorre quando o estimador escolhido tem a sua variabilidade diminuída,
conforme aumenta o tamanho da amostra.
c) Eficiência – ocorre quando o estimador escolhido tem as duas características informadas
anteriormente, não viciado e consistente.
Para entender melhor essas propriedades, imagine um campeonato de arremesso de dardos, no
qual existem 4 equipes competindo pelo título de campeã. Cada equipe lançou 8 dardos, como
demonstrado na Figura 12, apresentando os resultados dos lançamentos de cada equipe.
Figura 12 – Resultado dos 8 lançamentos das equipes A, B, C e D
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 23/30
Fonte: Adaptado Bussab e Morrettin, 2002.
Com esses resultados, é possível identificar as principais propriedades dos estimadores. Nesse
exemplo, o centro do alvo é o parâmetro desejado. Imagine que, no lugar de uma equipe de dardos,
fosse uma equipe tentando diagnosticar um problema de rede ou detectar um problema de
instalação lógica. Cada equipe expõe comportamentos distintos, assim como estimadores estatísticos
têm características distintas.
Para entender essas características, é necessário fazer uma análise de cada equipe de arremesso
de dardo:
Equipe A – tem pouca precisão (consistência) e pouca eficiência, porém, é não viciada, os
arremessos estão muitos espalhados.
Equipe B – tem pouca precisão (consistência), pouca eficiência e viciada, os arremessos não
acertam o alvo.
Equipe C – tem boa precisão (consistência) e boa eficiência e não viciada, os arremessos ficam
bem perto do alvo.
Equipe D – tem boa precisão (consistência), pouca eficiência e viciada, os arremessos não
acertam o alvo.
Não é uma tarefa fácil encontrar um estimador com as três propriedades, mas os estatísticos e
matemáticos já calcularam os melhores estimadores. Na Tabela 7, é possível verificar os estimadoresque possuem as melhores propriedades para os seus respectivos parâmetros.
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 24/30
Tabela 7 – Parâmetros e estimadores
Característica Parâmetro Estimador
Média µ
Variância σ² s²
Desvio padrão σ s
Proporção P
Correlação ρ r
Números de elementos N n
Fonte: Adaptado de Dalton e Ogliari, 2010.
É muito importante que os estimadores tenham as três propriedades apresentadas, porém,
quando tiver um estimador que não possua todas as características é necessário simular um cenário e
verificar os melhores estimadores. Procurando usar os estimadores corretos, as estimativas serão
mais assertivas e os parâmetros mais bem compreendidos.
5.2 ESTIMATIVA PONTUAL
Quando é retirada uma amostra aleatória simples de uma população, os estimadores estatísticos
procuram explicar como funciona o parâmetro populacional. Essas variáveis amostrais procuram
atender uma distribuição amostral correspondente aos dados originais conhecidos. A estimativa
pontual utiliza um único ponto para descrever o parâmetro de interesse utilizados estimadores com
propriedades já mencionadas.
Os estimadores apresentados até o momento têm a características de resumir os dados em um
ponto. Por exemplo, a média amostral procura inferir informações sobre a média populacional, em
que são retiradas amostras aleatórias simples, depois se calcula as médias e verifica o seu
comportamento diante de um certo parâmetro conhecido ou estipulado.
Imagine uma coleta de 6000 pacotes e estão divididos em subgrupos de 2000 observações,
. Em cada grupo existe uma média de pacotes perdidos e uma média
geral de pacotes perdidos.
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 25/30
Esta média geral é o estimador que procura explicar o parâmetro para perda de pacotes. O
primeiro subgrupo perdeu 540 pacotes, o segundo, 500 pacotes, e o terceiro, 460 pacotes, a média
de pacotes perdidos é de 500. Esta é uma estimativa pontual  esse valor tem a proposta de
descrever o valor da população. Na Figura 13, é possível verificar que a quantidade de informações
que circulam, muitas vezes, impossibilita a assertividade na estatística retirada da amostra.
Figura 13 – Pacotes circulantes em uma rede de computadores
Crédito: Bluebay/Shutterstock.
O grande problema de utilizar uma estimativa por ponto é que ela não fornece uma métrica de
assertividade ou erro da amostral. A dúvida da precisão estaria embutida nos estudos realizados, o
quanto o valor amostral está distante do valor paramétrico. O erro amostral deve ser levado em
consideração e está relacionado com a distribuição amostral que será utilizada.
O valor encontrado em uma amostra raramente conseguirá ser igual ao valor do parâmetro, mas
chegará perto. O erro amostral procura informar esta diferença entre a estimativa e o parâmetro. No
exemplo da média amostral, o erro amostral pode ser verificado na equação 3:
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 26/30
Não é fácil calcular o erro amostral, o seu cálculo depende da qualidade e variabilidade da
amostra, do valor do parâmetro, da distribuição amostral da variável aleatória e do processo de
escolha das amostras. No entanto, pode-se estipular um erro amostral para se verificar a qualidade
da amostra, pois muitas vezes os valores reais são desconhecidos.
5.3 ESTIMATIVA INTERVALAR
O estimador pontual tem uma variação entre a estatística amostral e o parâmetro analisado, isso
indica que amostras têm estimativas diferentes. Como podem ocorrem análises diferentes em um
mesmo banco de dados, é apropriado formular um estimador que consiga perceber está
variabilidade. Para isso, é construído um estimador intervalar que estipula um intervalo de confiança
para enquadrar um estimador pontal.
Esse processo consiste em associar uma estimativa pontual em um erro amostral máximo ( ),
tolerado pelo processo ou estudo. Esse intervalo deve possuir um limite inferior (LI) e um limite
superior (LS), para limitar um parâmetro ( ), em que possui uma distribuição amostral do estimador
pontual ( ). Nas equações 4 e 5, é descrito como encontrar o limite inferior (LI) e um limite superior
(LO) de um estimador intervalar.
O erro amostral máximo depende da distribuição amostral, que será definida no estimador
amostral pontual. A Figura 14 exemplifica melhor como é definido esse primeiro intervalo de
confiança.
Figura 14 – Estimativa e intervalo de confiança
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 27/30
Fonte: Adaptado de Dalton e Ogliari, 2017.
No intervalo proposto, o estimador pontual ( ) indica o centro do intervalo e as extremidades
são definidas pelo erro amostral máximo ( ). Com esses valores, podemos analisar se o parâmetro
( ) está contido nesse intervalo. Como exemplo, será utilizado duas amostras do estudo de erro de
latência do Tema 4. As amostras de médias amostrais,   fazem parte da composição dos
intervalos, segue os dados que serão usados:
Para construir os intervalos, todos as variáveis estão denominadas, a seguir a resolução
matemática para o intervalo da primeira amostra ( ):
O intervalo construído tem a seguinte configuração, conforme Figura 15:
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 28/30
Figura 15 – Estimativa e intervalo de confiança
Neste caso, o parâmetro ( ) está contido no intervalo de confiança da média amostral com a
amostragem de amostra simples aleatória, temos fortes evidências de que a estimativa está correta.
Para construir os intervalos, todos as variáveis estão denominadas, a seguir a resolução
matemática para o intervalo da primeira amostra ( );
O intervalo construído tem a seguinte configuração, conforme Figura 16:
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/ 29/30
Neste caso, o parâmetro ( ) não está contido no intervalo de confiança da média amostral com a
amostragem de amostra simples aleatória, temos fortes evidências de que a estimativa não está
correta.
A construção desses intervalos de confiança dependem da característica do parâmetro que está
sendo analisado. Esse parâmetro pode ser conhecido ou não conhecido e cada experimento vai
direcionar a amostragem. O típico é não conhecer o parâmetro, pois a maioria das populações
estudadas em redes de computadores possuem populações infinitas. Em outros casos, existem
definições de órgãos regulatórios para regularem a prestação de serviços e ainda especificações
técnicas que determinam o funcionamento dos equipamentos.
FINALIZANDO
Nesta aula, foram contemplados os conceitos iniciais de inferência estatística, a importância de
definir um planejamento amostral e identificar os parâmetros populacionais, assim como a relação
matemática entre o parâmetro e a população, a estatística e a amostra, com suas representações.
Também foram analisadas a conexão que existe entre os dados amostrais, a amostragem simples
aleatória e, por consequência, a sua distribuição. A relevância que a estimativa de um estimador com
propriedades estatísticas bem definidas consegue ajudar na inferência de dados amostrais. Entender
que uma amostra pode contar pequenos pedaços de uma história, mas um bom estimador consegue
auxiliar a entender o todo. Apresentação dos estimadores pontuais e estimador intervalar, a
importância de verificar os erros que existem em uma amostragem e a necessidade de se criar
intervalos de confiança. O planejamento de uma atividade define o seu sucesso e confiabilidade dos
dados: planejar, calcular e concluir.
REFERÊNCIAS
ANDRADE, D. F.; OGLIARI, P. J., Estatística para as Ciências Agrárias e Biológicas: com noções
de experimentação. 2. ed. Florianópolis: Editora UFSC, 2010.
BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 9. ed. São Paulo: Saraiva, 2007.
CLARK, J.; DOWNING, D. Estatística Aplicada. São Paulo: Editora Saraiva, 1998.
13/04/2023, 20:14 UNINTER
https://univirtus.uninter.com/ava/web/roa/30/30
COCHRAN, W. G. Técnicas de amostragem. Rio de Janeiro: Editora Fundo de Cultura, 1965.
DAVID, S. M. A estatística básica e sua prática. Livros Técnicos e Científicos, 2005
FARIAS, A. M. L. Apostila de Inferência Estatística. Rio de Janeiro: Universidade Federal
Fluminense, Instituto de Matemática, 2008.
GOMES, F. P. Curso de Estatística Experimental. Piracicaba: Livraria Nobel, 1985.
LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. Estatística: Teoria e aplicações. Rio de Janeiro: LTC,
2012.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatística. 7. ed. EDUSP, 2011.
MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidade para Engenheiros.
2. ed. Rio de Janeiro: LTC, 2003.
MORRIS D.; MARK S. Probability and Statistics. 4th. ed. 2012.
SPINELLI, W.; SOUZA, M. S. Introdução à Estatística. São Paulo: Editora Ática.

Continue navegando