Prévia do material em texto
ESTATÍSTICA
PROF.A MA. SIMONE DEMEIS BRAGUIM
Reitor:
Prof. Me. Ricardo Benedito de
Oliveira
Pró-reitor:
Prof. Me. Ney Stival
Gestão Educacional:
Prof.a Ma. Daniela Ferreira Correa
PRODUÇÃO DE MATERIAIS
Diagramação:
Alan Michel Bariani
Thiago Bruno Peraro
Revisão Textual:
Gabriela de Castro Pereira
Letícia Toniete Izeppe Bisconcim
Mariana Tait Romancini
Produção Audiovisual:
Heber Acuña Berger
Leonardo Mateus Gusmão Lopes
Márcio Alexandre Júnior Lara
Gestão da Produção:
Kamila Ayumi Costa Yoshimura
Fotos:
Shutterstock
© Direitos reservados à UNINGÁ - Reprodução Proibida. - Rodovia PR 317 (Av. Morangueira), n° 6114
Prezado (a) Acadêmico (a), bem-vindo
(a) à UNINGÁ – Centro Universitário Ingá.
Primeiramente, deixo uma frase de
Sócrates para reflexão: “a vida sem desafios
não vale a pena ser vivida.”
Cada um de nós tem uma grande
responsabilidade sobre as escolhas que
fazemos, e essas nos guiarão por toda a vida
acadêmica e profissional, refletindo diretamente
em nossa vida pessoal e em nossas relações
com a sociedade. Hoje em dia, essa sociedade
é exigente e busca por tecnologia, informação
e conhecimento advindos de profissionais que
possuam novas habilidades para liderança e
sobrevivência no mercado de trabalho.
De fato, a tecnologia e a comunicação
têm nos aproximado cada vez mais de pessoas,
diminuindo distâncias, rompendo fronteiras e
nos proporcionando momentos inesquecíveis.
Assim, a UNINGÁ se dispõe, através do Ensino a
Distância, a proporcionar um ensino de qualidade,
capaz de formar cidadãos integrantes de uma
sociedade justa, preparados para o mercado de
trabalho, como planejadores e líderes atuantes.
Que esta nova caminhada lhes traga
muita experiência, conhecimento e sucesso.
Prof. Me. Ricardo Benedito de Oliveira
REITOR
33WWW.UNINGA.BR
U N I D A D E
01
SUMÁRIO DA UNIDADE
INTRODUÇÃO ............................................................................................................................................................. 5
1 - CONCEITOS FUNDAMENTAIS ............................................................................................................................. 6
1.1 EXPERIMENTO ALEATÓRIO ................................................................................................................................. 6
1.2 ESPAÇO AMOSTRAL ............................................................................................................................................ 6
1.3 EVENTO ................................................................................................................................................................. 6
1.3.1 EVENTOS MUTUAMENTE EXCLUSIVOS ......................................................................................................... 6
2 - PROBABILIDADE ................................................................................................................................................... 7
2.1 RESULTADOS IGUALMENTE PROVÁVEIS (EQUIPROVÁVEIS) .......................................................................... 7
2.2 DEFINIÇÃO CLÁSSICA DE PROBABILIDADE ..................................................................................................... 7
2.3 PROBABILIDADE CONDICIONAL ....................................................................................................................... 9
2.4 PROBABILIDADE INDEPENDENTE ................................................................................................................... 10
CÁLCULO DAS PROBABILIDADES
PROF.A MA. SIMONE DEMEIS BRAGUIM
ENSINO A DISTÂNCIA
DISCIPLINA:
ESTATÍSTICA
4WWW.UNINGA.BR
3 - INDEPENDÊNCIA ESTATÍSTICA ........................................................................................................................ 10
4 - VARIÁVEIS ALEATÓRIAS .................................................................................................................................... 14
4.1. VARIÁVEL ALEATÓRIA DISCRETA .................................................................................................................... 15
4.2 VARIÁVEL ALEATÓRIA CONTÍNUA ................................................................................................................... 16
4.3 FUNÇÃO DENSIDADE DE PROBABILIDADE ..................................................................................................... 16
4.4 FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA ...................................................................................................... 17
4.5 CARACTERIZAÇÃO DE UMA VARIÁVEL ALEATÓRIA DISCRETA .................................................................... 17
4.6 VARIÂNCIA DE UMA VARIÁVEL ALEATÓRIA ................................................................................................... 18
4.7 VARIÁVEL ALEATÓRIA BIDIMENSIONAL ......................................................................................................... 18
5 - MEDIDAS DE POSIÇÃO OU MEDIDAS DE TENDÊNCIA CENTRAL ................................................................. 19
5.1 MEDIA OU ESPERANÇA MATEMÁTICA ............................................................................................................ 19
5.2 PROPRIEDADES DA MÉDIA .............................................................................................................................. 19
5.3 VANTAGENS E DESVANTAGENS DA MÉDIA ................................................................................................... 20
5.4 MEDIANA (MD) .................................................................................................................................................. 20
5.5 MODA (MO) ........................................................................................................................................................ 21
5.6 SEPARATRIZES .................................................................................................................................................. 21
6 - MEDIDAS DE DISPERSÃO ................................................................................................................................. 22
6.1 AMPLITUDE TOTAL (AT) .................................................................................................................................... 22
6.2 VARIÂNCIA ......................................................................................................................................................... 23
6.3 DESVIO PADRÃO ................................................................................................................................................ 23
6.4 COEFICIENTE DE VARIAÇÃO (CV) ................................................................................................................... 24
7 - MEDIDAS DE SIMETRIA .................................................................................................................................... 24
8 - MEDIDAS DE CURTOSE ..................................................................................................................................... 25
9 - RESUMO DAS PRINCIPAIS FÓRMULAS DAS PROBABILIDADES ................................................................ 25
5WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
INTRODUÇÃO
A Estatística teve por função, nas suas origens, principalmente a organização e
apresentação de dados coletados empiricamente.
O desenvolvimento da teoria das probabilidades permitiu, entretanto, a criação de
técnicas mais adequadas de amostragem e formas de relacionar as amostras e as populações de
onde provieram essas amostras.
O estudo das probabilidades teve origens no século XVII, bem posterior à Estatística,
por meio do estudo dos jogos de azar propostos pelo Cavalheiro de Mère aos matemáticos
franceses Fermat e Pascal. No entanto, somente no século XX éos demais limites serão obtidos somando aos limites inferiores o valor de h. Isto é,
42 |----- 42+h = 42 + 2=44
44 |----- 44+h = 46
46 |----- 46+h = 48
48 |----- 48+h = 50
50 |----- 50+h = 52
Observe que a notação (|-----) significa que se está incluindo os valores iguais ao limite
inferior e excluindo os valores iguais ou superiores ao limite superior.
A partir da listagem ordenada das classes, podem-se construir os chamados quadros (ou
tabelas) de frequência ou distribuições de frequência, que permitem uma melhor visualização
dos dados.
Frequência: é o número de valores que aparecem no domínio de uma classe.
58WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
3.2 Construção de Distribuição de Frequência Contínua
Utilizando os limites de classes obtidos acima para o exemplo, tem-se o quadro abaixo:
Tabela 07: Número de funcionários de 25 postos de saúde de Maringá,
Paraná, 31/01/2017.
Classes Frequência (Fi)
42 |----- 44 4
44 |----- 46 3
46 |----- 48 8
48 |----- 50 6
50 |----- 52 4
Total 25
Fonte: Dados hipotéticos.
Uma tabela de frequências completa deve conter as seguintes informações:
i) xi é o ponto médio da i-ésima classe; representa a média dos pontos limites da classe;
ii) n é o tamanho da amostra;
iii) ni é o número de observações, ou a frequência, da i-ésima classe;
iv) Fi é a frequência absoluta da i-ésima classe;
v) fi é a frequência relativa da i-ésima classe,
vi) Fac é a frequência acumulada;
vii) fac é a frequência relativa acumulada,
Tabela 07: Número de funcionários de 25 postos de saúde de Maringá,
Paraná, 31/01/2017
Classes xi Fi fi Fac fac
42 |----- 44 43 4 0,16 4 0,16
44 |----- 46 45 3 0,12 7 0,28
46 |----- 48 47 8 0,32 15 0,6
48 |----- 50 49 6 0,24 21 0,84
50 |----- 52 51 4 0,16 25 1
Total --- 25 1 --- ---
Fonte: Dados hipotéticos.
59WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
4 - GRÁFICOS
Os principais gráficos utilizados na representação de distribuição de frequências são:
i) Histograma e polígono de frequência;
ii) Ogiva ou polígono de frequência acumulada.
4.1 Histogramas
Um conjunto de retângulos com bases sobre um eixo dividido de acordo com os tamanhos
de classe, centros nos pontos médios das classes e áreas proporcionais às frequências.
Fonte: Dados hipotéticos
4.2 Polígonos de frequências
É um gráfico que se obtém unindo por uma poligonal os pontos correspondentes às
frequências das diversas classes, centradas nos respectivos pontos médios (xi). Para obter as
interseções do polígono com o eixo, cria-se em cada extremo do histograma uma classe com
frequência nula.
Fonte: Dados hipotéticos
OBSERVAÇÃO: Suavizando a linha poligonal que define o polígono obtém-se uma
curva que visualiza a tendência de variação dos dados.
4.3 Polígonos de frequência acumulada ou ogivas
É o gráfico representativo de uma distribuição acumulada de frequências. É uma
poligonal ascendente. No eixo horizontal colocam-se as extremidades de classe e no eixo vertical
as frequências acumuladas.
Note que a frequência acumulada relacionada com o limite inferior da primeira classe é
sempre zero.
Ao contrário do polígono de frequência, a ogiva de frequências acumuladas utiliza os
pontos extremos dos intervalos de classe, e não os pontos médios.
Fonte: Dados hipotéticos
6161WWW.UNINGA.BR
U N I D A D E
04
SUMÁRIO DA UNIDADE
INTRODUÇÃO ........................................................................................................................................................... 63
1 - ESTATÍSTICAS E PARÂMETROS ....................................................................................................................... 64
2 - ESTIMAÇÃO, ESTIMADOR E ESTIMATIVA ..................................................................................................... 64
2.1 CONCEITO DE ESTIMAÇÃO ............................................................................................................................... 64
2.2 CONCEITOS DE ESTIMADOR E ESTIMATIVA ................................................................................................. 65
2.2.1 ESTIMATIVA PONTUAL .................................................................................................................................. 65
2.2.2 DISTRIBUIÇÃO AMOSTRAL DOS ESTIMADORES ....................................................................................... 65
2.2.3 DISTRIBUIÇÃO AMOSTRAL DA MÉDIA (X) ................................................................................................. 65
3 - INTERVALOS DE CONFIANÇA ........................................................................................................................... 69
INFERÊNCIA ESTATÍSTICA
PROF.A MA. SIMONE DEMEIS BRAGUIM
ENSINO A DISTÂNCIA
DISCIPLINA:
ESTATÍSTICA
62WWW.UNINGA.BR
3.1 INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL (µ) QUANDO A VARIÂNCIA (σ2) É
CONHECIDA ............................................................................................................................................................. 69
3.2 INTERVALO DE CONFIANÇA PARA MÉDIA (µ) QUANDO A VARIÂNCIA (σ2) É DESCONHECIDA ............... 71
3.3 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA .......................................................................................... 73
3.4 INTERVALO DE CONFIANÇA PARA A PROPORÇÃO (P) ................................................................................. 75
3.5 INTERVALO DE CONFIANÇA PARA A DIFERENÇA DE MÉDIAS QUANDO AS VARIÂNCIAS
POPULACIONAIS FOREM CONHECIDAS ............................................................................................................... 76
3.6 INTERVALO DE CONFIANÇA PARA A DIFERENÇA DE MÉDIAS QUANDO AS VARIÂNCIAS
POPULACIONAIS FOREM GUAIS E DESCONHECIDAS ........................................................................................ 77
4 - TESTE DE HIPÓTESE PARAMÉTRICO ............................................................................................................. 79
4.1 PROCEDIMENTO GERAL DO TESTE DE HIPÓTESE (TH) ................................................................................ 81
4.2 PASSOS PARA CONSTRUÇÃO DE UM TESTE DE HIPÓTESE PARAMÉTRICO ............................................. 81
4.3 TESTES DE HIPÓTESES PARAMÉTRICOS ...................................................................................................... 82
4.3.1 TESTES PARA A MÉDIA DE UMA POPULAÇÃO, COM VARIÂNCIA CONHECIDA ...................................... 82
4.3.2 TESTES PARA µ COM σ2 DESCONHECIDO ................................................................................................ 85
4.3.3 TESTE DE HIPÓTESE PARA A PROPORÇÃO DE SUCESSO POPULACIONAL (P) ..................................... 88
4.3.4 TESTE DE HIPÓTESE PARA A DIFERENÇA DE DUAS MÉDIAS POPULACIONAIS COM VARIÂNCIAS
CONHECIDAS ........................................................................................................................................................... 90
4.4.5 TESTE DE HIPÓTESES PARA A DIFERENÇA DE DUAS MÉDIAS COM VARIÂNCIAS DESCONHECIDAS E
IGUAIS ...................................................................................................................................................................... 93
5 - ESTATÍSTICA NÃO PARAMÉTRICA .................................................................................................................. 96
5.1. TESTE DE MANN-WHITNEY ........................................................................................................................... 99
6 - TABELAS ............................................................................................................................................................ 103
63WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
INTRODUÇÃO
Inferência Estatística ou Estatística indutiva é a parte da estatística que utiliza métodoscientíficos para fazer afirmações e tirar conclusões sobre características ou parâmetros de uma
população, baseando-se em resultados de uma amostra. O próprio termo “indutiva” decorre da
existência de um processo de indução, isto é, um processo de raciocínio em que, partindo-se do
conhecimento de uma parte, procura-se tirar conclusões sobre a realidade no todo. Essas são
decisões baseadas em procedimentos amostrais.
Nosso objetivo é procurar a conceituação formal desses princípios intuitivos do dia-a-dia
para que possam ser utilizados cientificamente em situações mais complexas.
É fácil perceber que um processo de indução (em estatística) não pode ser exato. Ao
induzir, portanto, estamos sempre sujeitos a erro. A Inferência Estatística, entretanto, irá nos
dizer até que ponto poderá estar errando em nossas induções, e com que probabilidade. Esse fato
é fundamental para que uma indução (ou inferência) possa ser considerada estatística, e faz parte
dos objetivos da Inferência Estatística.
Em suma, a Inferência Estatística busca obter resultados sobre as populações a partir das
amostras, dizendo também, qual a precisão desses resultados e com que probabilidade se pode
confiar nas conclusões obtidas. Evidentemente, a forma como as induções serão realizadas irá
depender de cada tipo de problema, conforme será estudado posteriormente.
64WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
1 - ESTATÍSTICAS E PARÂMETROS
Obtida uma amostra, muitas vezes desejamos usá-la para produzir alguma característica
da amostra. Por exemplo, se queremos calcular a média da amostra ( x1 , x2 , ...,xn ), será dada por:
Para facilitar a linguagem usada em Inferência Estatística, iremos diferenciar as
características da amostra e da população.
Um parâmetro é uma medida usada para descrever uma característica da população.
Assim, se estamos colhendo amostras de uma população identificada pela variável aleatória X,
então, seriam parâmetros a média E(X) ou, ainda, sua variância V(X).
Os símbolos mais comuns são dados na tabela a seguir:
Medidas Estatísticas
(amostra)
Parâmetros
(população)
Média X m
Variância s2 s2
Nº de elementos N N
Proporção f ou P̂ p
2 - ESTIMAÇÃO, ESTIMADOR E ESTIMATIVA
2.1 Conceito de Estimação
O processo de indução que se pretende realizar sobre uma população pode ser feito, a
partir de uma amostra, de duas maneiras: Estimação e teste de hipóteses.
a) Estimação: é o processo que usa os resultados extraídos da amostra para produzir
inferências sobre a população da qual foi extraída, aleatoriamente, a amostra.
Existem dois tipos de estimação por ponto e por intervalo. A primeira se dá quando,
a partir da amostra, procura-se obter um único valor de um certo parâmetro populacional. A
estimação por intervalo é feita quando a partir da amostra procura-se construir um intervalo de
variação ( )q q1 , 2 com uma certa probabilidade de conter o verdadeiro parâmetro populacional
q .
65WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
b) Testes de Hipóteses: é o processo que usa os resultados extraídos da amostra para
testar valores de certos parâmetros da população (testes paramétricos) ou para testar a natureza
da distribuição da população (testes não-paramétricos).
2.2 Conceitos de Estimador e Estimativa
Estimador () de um parâmetro populacional q é uma variável aleatória função dos
elementos amostrais xi ( i = 1,2,..,n) , isto é:
= f(x1 , x2 ,...,xn ).
Por outro lado, estimativa é o valor numérico obtido pelo estimador (ou estatística) numa
amostra.
Exemplo 1: O parâmetro populacional m pode ser estimado pelo estimador (média da
amostra).
Exemplo 2: O parâmetro populacional s2 (variância) pode ser estimado pelo estimador
S2 (variância amostral).
2.2.1 Estimativa pontual
Podemos estimar parâmetros populacionais através de uma amostra. Suponhamos, por
exemplo, que, para estimar a renda familiar média, m·, em certa região, tomamos uma amostra
aleatória de 100 famílias. Então, certamente, a média amostral, , é um estimador razoável de m.
Porém, sabemos que flutua em redor de m.: às vezes estando acima, outras vezes abaixo. A média
é uma estimativa pontual de m.
O objetivo deste tópico será estudar outra forma de estimarmos os parâmetros
populacionais, ou seja, buscaremos conceitos científicos de estimativas por intervalos.
2.2.2 Distribuição amostral dos estimadores
O objetivo deste tópico é estudar como se distribuem por amostragem os seguintes
estimadores: o estimador x da média populacional m, o estimador p̂ da proporção populacional
p e o estimador ( yx − ) da diferença de médias populacionais ( yx m−m ). É relevante lembrarmos
o seguinte esquema:
2.2.3 Distribuição amostral da média (x)
De uma população X, tira-se uma amostra de tamanho n formada pelos elementos x1, x2,
..., xn. O estimador da média populacional m é:
∑
=
=
n
1i
ix
n
1x
66WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Para auxiliar a compreensão das conclusões apresentadas:
Exemplo 3: Consideremos a seguinte população finita 2, 4, 6, 8.
Como N=4 ,
E(X)=mx=∑
=
⋅
N
1i
ii )x(px e
VAR(X)= =s2
x = ( ) ( )[ ]22
i
2
x
N
1i
i XEXE)x(p)x( −=⋅m−∑
=
fazendo a função de
distribuição de probabilidade, tem-se:
x P(X=x) x.P(X=x) X².P(X=x)
2 1/4 2/4 4/4
4 1/4 4/4 16/4
6 1/4 6/4 36/4
8 1/4 8/4 64/4
S 1 5 30
0
1/4
1/2
0 2 4 6 8 10
P(
X=
x)
X
Gráfico-1: Distribuição de probabilidade da
variável aleatória X
Buscando relacionar a caracterização da população com a amostra, pode-se, por exemplo,
tomar todas as amostras com reposição (independência) de tamanho 2. O número total de
amostras será 42 = 16, distribuídas da seguinte forma:
(2,2) (2,4) (2,6) (2,8)
(4,2) (4,4) (4,6) (4,8)
(6,2) (6,4) (6,6) (6,8)
(8,2) (8,4) (8,6) (8,8)
67WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Calculando-se as respectivas médias amostrais, tem-se a população de todas as médias
amostrais.
2 3 4 5
3 4 5 6
4 5 6 7
5 6 7 8
O estimador x é uma variável aleatória discreta, e facilmente pode-se calcular sua
esperança e variância. A distribuição de probabilidade da média é:
x P(X=x) x.P(X=x) X².P(X=x)
2 1/16 2/16 4/16
3 2/16 6/16 18/16
4 3/16 12/16 48/16
5 4/16 20/16 100/16
6 3/16 18/16 108/16
7 2/16 14/16 98/16
8 1/16 8/16 64/16
S 1 5 27,5
Assim, a esperança da média amostral, E( x ) = ∑
=
n
1i
ii )x(px = 5
A partir destes resultados, temos as seguintes proposições:
Proposição 1) A média das médias amostrais ou E( x ) é igual à média m populacional, ou
0
1/16
1/8
3/16
1/4
1 2 3 4 5 6 7 8 9
Pr
ob
ab
ili
da
de
Médias
Gráfico-2: Distribuição de probailidade das médias
68WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Proposição 2) A variância da média amostral é igual à variância populacional dividida
pelo tamanho da amostra, ou n
)X(VAR
2
2
x
s
=s=
Por meio dos gráficos 1 e 2, pode-se comparar a distribuição de probabilidade para a
população e a distribuição das médias amostrais.
Observa-se que a medida que o tamanho da amostra aumenta, independendo da
distribuição da população original, a distribuição amostral das médias ( X ) aproxima-se cada vez
mais de uma distribuição normal. Esse resultado é fundamental na teoria de Inferência Estatística
e é conhecido como Teorema do Limite Central (TLC).
Teorema 3.2 - Para amostras aleatórias simples ( X1 , X2 ,.., Xn ), retiradas de uma população
com média m e variância s2, a distribuição amostral da média X = (X1 + X2+..+Xn)/n aproxima-
se de uma distribuição normal com média m e variância s2/n , quando n →∞.
Corolário 3.1 - Se (X1 + X2+..+Xn) é amostra aleatória simples da população X com média
m e variância s2 , e = (X1 + X2+..+Xn)/n então,
Usa-se a transformação usual de reduzir a distribuição de X a uma distribuição normal
padrão.
DEFINIÇÃO 13 - Seja e a variávelaleatória que mede a diferença entre a estatística X e
o parâmetro m, isto é,
e = X - m .
Corolário 3.2 - A distribuição de e aproxima-se de uma distribuição normal com média
0 e variância s2/n , isto é, e = N( 0, s2/n).
O Teorema do Limite Central (TLC) afirma que X aproxima-se de uma normal quando
n →∞. É fácil verificar, que a rapidez dessa convergência depende da distribuição da população da
qual a amostra é retirada. Se a população original é próxima da normal, sua convergência é rápida;
já, se a distribuição da população tem outra distribuição, essa convergência é mais demorada.
Como regra prática, aceita-se que para amostras com mais de 30 elementos a aproximação já
pode ser considerada muito boa.
Portanto, se X é uma população com distribuição normal de média m e variância s2, e se
dessa população retira-se amostras de tamanho n, então,
isto é, a distribuição da variável x por amostragem casual simples será sempre normal com
a mesma média da população X e variância n vezes menor. Isso significa que quanto maior o
tamanho da amostra, menor será a variância de x , ou o estimador x será mais preciso à medida
que o tamanho da amostra aumentar. Se a população X não for normal, x terá distribuição
“aproximadamente” normal
n
NX
2
, : sm
69WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
É importante destacar que se a população for finita e de tamanho N conhecido, e se a
amostra de tamanho n dela retirada for sem reposição, tem-se:
3 - INTERVALOS DE CONFIANÇA
A estimativa de um parâmetro por pontos não possui uma medida do possível erro
cometido na estimação. Uma maneira de expressar a precisão da estimação é estabelecer limites,
que com certa probabilidade incluam o verdadeiro valor do parâmetro da população. Esses limites
são chamados “limites de confiança”: determinam um intervalo de confiança no qual deverá estar
o verdadeiro valor do parâmetro.
Logo, a estimativa por intervalo consiste na fixação de dois valores tais que (1-a) seja a
probabilidade de que o intervalo, por eles determinado, contenha o verdadeiro valor do parâmetro.
a : nível de significância
(1-a): coeficiente de confiança ou nível de confiabilidade
Desta forma, a partir de informações da amostra, deve-se calcular os limites de um
intervalo, valores críticos, que em (1-a)% dos casos inclua o valor do parâmetro a estimar e em
a% dos casos não inclua o valor do parâmetro.
3.1 Intervalo de Confiança para a Média Populacional (µ)
quando a Variância (σ2) é conhecida
Deseja-se estimar a média da população X conhecendo o valor da variância s2, ou seja,
X: N (? , s2).
Com a utilização das distribuições amostrais, ,
Procedimentos para a construção do intervalo de confiança (IC):
➢Retira-se da população uma amostra casual simples de n elementos.
➢Calcula-se a média da amostra x .
➢Calcula-se o desvio padrão da média amostral
nn
2
x
s
=
s
=s .
➢Fixa-se o nível de significância a e determina-se o valor de Z correspondente.
1−
−
=
N
nN
nx
ss
s
m@
n
, Nx
2
70WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Pode-se usar uma notação simplificada para o intervalo de confiança para a média
populacional, assim:
Exemplo 4: A ingestão de um medicamento adormece o paciente. O tempo decorrido
entre a ingestão do medicamento e o adormecimento em minutos é distribuído normalmente com
σ=10 min. Uma amostra de 25 pacientes submetidos ao tratamento com o remédio é formada.
Observou-se que . Construir um IC para µ, com 96% de confiança.
Solução:
71WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Logo,
Conclusão ou interpretação: Estima-se que o tempo médio entre a ingestão do
medicamento e o adormecimento está entre 50,90 min e 59,10, com uma confiança de 96%.
3.2 Intervalo de Confiança para Média (µ) quando a
Variância (σ2) é desconhecida
Sabe-se que a variável
x
xZ
s
m−
= tem distribuição normal. Quando não conhecemos a
variância (s2), deve-se usar seu estimador (s2) e tem-se:
n
s
n
ss
2
x == .
Distribuição de t de Student é a variável definida como
xs
xt m−
=f , com f graus de
liberdade, onde f = n-K (n é o número de informações independentes da amostra e K número de
parâmetros da população a serem estimados além do parâmetro inerente ao estudo).
Quando n é suficientemente grande, s2 se aproxima bastante de s2, o que faz com que a
variável t se aproxime da variável normal Z. Para estimar o intervalo de confiança para a média
quando a variância populacional (s2) for desconhecida deve-se seguir o procedimento padrão
adotado anteriormente:
➢ Retira-se uma amostra de n elementos da população.
➢ Calcula-se a média da amostra ∑
=
=
n
1i
ix
n
1x .
➢ Calcula-se a variância amostral:
➢ Determina-se o desvio padrão para a distribuição amostral da média
Observe que xs é o estimador de xs (estimador do erro padrão).
72WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
➢ Fixa-se o nível de significância a e determina-se o valor de t correspondente.
Usa-se uma notação simplificada para o intervalo de confiança para a média populacional,
tem-se:
Exemplo 5: Registram-se os valores 0,28; 0,30; 0,27; 0,33 e 0,31 segundos, obtidos
em 5 medições do tempo de reação de um indivíduo a certo estímulo (distribuição Normal).
Determinar os limites de confiança de 95% e 99% para o tempo médio de reação da população
ao estímulo.
Solução:
73WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Interpretação: Com uma confiança de 95%, estima-se que o tempo médio de reação da
população ao estímulo está entre 0,27 segundos e 0,33 segundos.
Interpretação: Estima-se que o limite de confiança de 99% para o tempo médio de reação
da população ao estímulo está entre 0,25 segundos e 0,35 segundos.
3.3 Intervalo de Confiança para a Variância
De acordo com Magalhães (2008, p. 267) pode-se propor o Teste qui-quadrado:
[...] nosso problema foi testar hipóteses sobre os parâmetros média e
proporção. Em geral, as formas das distribuições de probabilidade eram
conhecidas (ou seriam aproximadas) e tínhamos que decidir quanto a
aceitar uma ou outra hipótese, sobre o valor desse parâmetro. Em termos
práticos, outra situação comum é termos observações de uma variável
aleatória cuja distribuição na população é desconhecida. Nesse caso,
uma das primeiras providências é tentar identificar o comportamento da
variável com um modelo teórico. [...]
Destaca-se que o modelo a ser proposto pode ser testado por meio do denominado Teste
de Aderência. O qual será dado:
Distribuição qui-quadrado ( 2χ ), com )1( −n graus de liberdade, ou seja:
74WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Então, o intervalo será dado por:
Exemplo 6: Admita n=10, 42 =S e que se deseja construir um intervalo de confiança
(IC) para variância ao nível de 90%.
Solução:
Observando-se a tabela da distribuição qui-quadrado obtêm-se:
logo
Interpretação: O intervalo [2,13; 10,81] contém a verdadeira variância, com 90% de
confiança.
75WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
3.4 Intervalo de Confiança para a Proporção (p)
Seja uma amostra de tamanho n > 30. Deseja-se construir um intervalo de confiança para
a proporção populacional p. o procedimento é semelhante aos anteriores.
➢ Calcula-se a proporção da amostra
n
xp̂ = , onde x é o número de vezes que ocorre o
“sucesso” do experimento.
➢ Como desconhecemos a verdadeira proporção, determina-se o desvio padrão para a
distribuição amostral da proporção utilizando sua estimativa
n
q̂p̂sp̂ = .
➢ Fixa-se o nível de significância a e determina-se o valor de z correspondente.
, que desenvolvido determina o intervalo de confiança para a proporção.
Assim,
IC[m , 1-a] =
⋅+⋅− aa n
q̂p̂zp̂ ;
n
q̂p̂zp̂
22
ou,
⋅+
⋅− aa n
q̂p̂zp̂ p
n
q̂p̂zp̂
22
, com (1-a) de confiabilidade.
Exemplo 7: Para se estimar a porcentagem de alunos do curso de Biologia, do Centro
Universitário Ingá – UNINGÁ, favoráveis à modificação do currículo escolar, tomou-se uma
amostra de 100 alunos, dos quais 80 foram favoráveis à mudança. Determine:
a) Qual o erro da estimativa admitindo-se 96% de confiança?
b) Para a situação anterior, qual será o IC para a verdadeira porcentagem de alunos
favoráveis à mudança?
aa −=
≤
⋅
− 1
ˆˆ
ˆ
z
n
qp
ppP
76WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Solução:
a)
Conclusão: O erro cometido na estimativa é de 0,0820.
Conclusão: Pode-se afirmar com 96% de confiabilidade que a proporção dos alunos
do Centro Universitário Ingá – UNINGÁ favoráveis à mudança curricular está entre 71,80% e
88,20%.
3.5 Intervalo de Confiança para a Diferença de Médias
quando as Variâncias Populacionais forem conhecidas
A construção do Intervalo de confiança (IC) é semelhante a realizada para a média
quando conhecemos a variância populacional. Deve-se observar a distribuição para a diferença
das médias.
Sejam duas amostra de tamanho n e m retiradas respectivamente de populações com
distribuições normais independentes X e Y com média mx e my e desvios padrões sx e sy. O IC para
a diferença das médias (mx - my) será:
ou seja,
com (1-a) de confiabilidade.
77WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Exemplo 8: Está sendo estudados dois processos para conservar alimentos, cuja principal
variável de interesse é o tempo de duração dos mesmos. No processo A, o tempo X de duração
segue a distribuição XA:N(mA, 100), e no processo B, o tempo Y obedece a distribuição XB: N(mB,
100). Sorteiam-se duas amostras independentes: a de A, com 16 latas, apresentou tempo médio
de duração igual a 50, e a de B, com 25 latas, duração média igual a 60. Para verificar se os dois
processos podem ter o mesmo desempenho, decidiu-se construir um IC para a diferença (mA-mB)
com um nível de confiança de 95%; caso o zero pertença ao intervalo, pode-se concluir que existe
evidência de igualdade dos processos. Podemos considerar a igualdade dos processos?
Solução:
XA: Tempo de duração dos alimentos pelo processo A
XB: Tempo de duração dos alimentos pelo processo B
2
As = 100 2
Bs = 100 1-a = 95%
1n =16 2n = 25 ( Ax - Bx ) = -10
Ax = 50 Bx = 60
Erro = e =
mn
z
2
y
2
x
2
s
+
s
⋅a , assim:
O erro máximo da estimativa da diferença das médias é 6,28, logo o IC é:
Conclusão: Podemos afirmar, ao nível de 95% de confiança, que diferença entre o tempo
médio de conservação dos alimentos fabricados pelo processo A e processo B está entre –16,28
e –3,72, desta forma, pode-se dizer que não há evidência de igualdade entre os dois processos.
3.6 Intervalo de Confiança para a Diferença de Médias
Quando as Variâncias Populacionais forem guais e descon-
hecidas
Destaca-se que temos dois casos, quando temos amostra um ( 1n ) e amostra dois ( 2n ),
apresentados abaixo:
Para o caso de pequenas amostras, consideramos pequenas se ( 1n + 2n -2)da distribuição normal
padronizada
a) H
H
0 0
1 0
:
:
q q
q q
=
≠
b) Teste Unilateral à Direita: quando utilizamos a “cauda” direita da distribuição normal
padronizada.
b)
H
H
0 0
1 0
:
:
q q
q q
=
>
c) Teste Unilateral à Esquerda: quando utilizamos a “cauda” esquerda da distribuição
normal padronizada
c)
H
H
0 0
1 0
:
:
q q
q q
=
Caso (c)
Teste unilateral a esquerda
H
H
0 0
1 0
:
:
m m
m m
=
ℜ∈ ou RC= { }a>ℜ∈ zz/z
Caso (c) - Teste unilateral à esquerda: Devemos determinar x , tal que P X x( )≥ = −1 a
ou, equivalentemente, devemos determinar− za , tal que P Z z( )≥ − = −a a1 .
A região de rejeição da hipótese H0 , ou região crítica, será:
RC={ }cxx /x
caso (c)
H
H
0 0
1 0
:
:
m m
m m
=
devemos determinar ta tal que a−=≤ a 1)tt(P .
86WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Cuja região crítica pode ser definida ( x é a média da amostra):
RC={ }2xx/ x >ℜ∈ ou RC= { }a>ℜ∈ tt /t
Caso (c) - Devemos determinar x 1, tal que ou, equivalentemente,
devemos determinar− ta , tal que a−=−≥ a 1)tt(P .
Cuja região crítica pode ser definida: ( x é a média da amostra)
RC={ }1xx/ x ta/2, rejeita-se H0. Caso contrário não existe evidências
para se rejeitar H0.
Idem para os casos b) e c).
Observação: no caso em que n ≥ 30, o procedimento é o mesmo, podendo-se utilizar
valores Z para aproximar valores t na determinação das regiões críticas.
Exemplo 11: Deseja-se investigar se certa moléstia que ataca o rim altera o consumo
de oxigênio desse órgão. Para indivíduos sadios, admite-se que esse consumo tem distribuição
Normal com média 12 cm3/min. Os valores medidos em cinco pacientes com a moléstia foram:
14,4; 12,9; 15,0; 13,7 e 13,5. Qual seria a conclusão, ao nível de 1% de significância?
ns
ìXt 0−
=
87WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Solução:
Passo 1: Hipóteses
H0: A moléstia não altera a média de consumo renal de oxigênio.
H1: Indivíduos portadores da moléstia têm média alterada.
Passo 2: Estatística teste
Uma vez que s é desconhecido e n
=
01
00
pp:H
pp:H
caso (c)
ℜ∈ ou RC= { }a>ℜ∈ zz/z
c) Devemos determinar fc tal que ou, equivalentemente, devemos
determinar a− z , tal que a−=−≥ a 1)zZ(P 2 .
Cuja região crítica ou região de rejeição será:
RC={ }1fp̂/ p̂ f2, rejeita-se H0.
Isto equivale a dizer que se o valor zcal da variável do teste, obtido no passo 4, estiver na região
crítica, ou seja, , rejeita-se H0. Em caso contrário, não rejeitamos
H0.
Idem para os casos b) e c).
Exemplo 12: Um biólogo, consumidor de certas provetas acusou o fabricante, dizendo
que mais de 20% das unidades fabricadas apresentam defeito. Para confirmar sua acusação,
ele usou uma amostra de tamanho 50, onde 30% das peças eram defeituosas. Mostre como o
fabricante poderia refutar a acusação. Utilize um nível de significância de 10%.
Solução:
Passo 1: Hipóteses
H0: A proporção das unidades fabricadas que apresentam defeito é de 20%.
H1: A proporção das unidades fabricadas que apresentam defeito é significativamente
superior a 20%.
H : 0,20
H : 0,20
0
1
p
p
=
>
90WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Passo 2: Estatística teste
A estatística do teste é:
Passo 3: Região crítica
O Teste é unilateral à direita e sendo a = 0,10, da tabela obtemos . Assim:
Passo 4: Valor da estatística teste
O valor da estatística da decisão é:
Passo 5: Conclusão
Como , rejeita-se H0 ao nível de significância de 10%, ou seja, com
90% de confiança, há evidências de que a proporção das unidades fabricadas que apresentam
defeitos seja significativamente superior a 20%.
4.3.4 Teste de hipótese para a diferença de duas médias
populacionais com variâncias conhecidas
Passo 1: Hipóteses
Enunciar as hipóteses (Deve ser feito no início da pesquisa, antes de se realizar a
experiência amostral).
caso (a)
≠m−mm≠m
=m−mm=m
)0( :H
)0( :H
21211
21210
caso (b)
>m−mm>m
=m−mm=m
)0( :H
)0( :H
21211
21210
caso (c)
Hipóteses
≠m−mm≠m
=m−mm=m
)0( :H
)0( :H
21211
21210
93WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
H0: O peso líquido médio do inseticida é o mesmo nos dois períodos.
H1: O peso líquido médio do inseticida é significativamente diferente
nos dois períodos.
Passo 2: Estatística Teste
Como s1 = s2 = s é conhecido, a estatística do teste é:
Passo 3: Região crítica
O teste é bilateral e sendo a = 0,05, da tabela obtemos za 2 1 96= , . Assim:
Passo 4: Valor da Estatística do Teste
O valor da estatística da decisão é:
Passo 5: Conclusão: Como (-2,22
Caso(c)
H
H
0 1 2
1 1 2
:
:
m m
m m
=
= χPP
Na tabela Qui-quadrado, na linha 1, não existe o valor 4,8214. Ele está entre os valores 3,84
e 5,024, correspondentes às colunas do 5% e 2,5%,respectivamente. Assim, )8214,4( 2
1 >= χPP
está entre 0,025 e 0,05.
Conclusão: Ao nível de significância de 5%, rejeitamos a hipótese de homogeneidade
entre as proporções de animais que contraíram a doença nos grupos vacina padrão e vacina nova,
em favor da hipótese de que essas proporções são diferentes (0,025
2
az rejeita-se H0, com risco α, que há diferença entre os grupos.
Exemplo 16: Determine no nível de 10%, se as vendas médias das empresas de
agronegócios são diferentes.
Empresa A Empresa B
(em 10^6 $)
10 22
18 17
9 15
8 10
2 7
11 7
4 8
3 14
9 15
12
10
101WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Solução:
a) 91 =n (Empresa B) e n2=11.
b) Postos de todas as vendas:
A B
11° 20°
19° 18°
8,5° 16,5°
6,5° 11°
1° 4,5°
13° 4,5°
3° 6,5°
2° 15°
8,5° 16,5°
14°
11°
Soma 97,5 112,5
Assim, 2R =97,5 e 1R =112,5.
c) Escolher 2R =97,5.
d)
Desta forma, obtém-se o teste:
Passo 1: Hipóteses
H0 : As vendas das duas empresas são iguais.
H1 : As vendas das duas empresas são diferentes.
Passo 2: α=10%. Escolher N(0,1).
Passo 3: Com auxílio da tabela N(0,1),
102WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
Passo 4: Cálculo do valor da variável
Passo 5: Conclusão
Como , não se rejeita H0, ou seja, as vendas das duas empresas são iguais.
A seguir, disponibilizamos alguns dados interessantes para você utilizar.
103WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
6 - TABELAS
104WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
105WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
4
ENSINO A DISTÂNCIA
106WWW.UNINGA.BR
ENSINO A DISTÂNCIA
REFERÊNCIAS
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. São Paulo:
Atlas, 1996.
MAGALHÃES, Marcos Nascimento; DE LIMA, Antonio Carlos Pedroso. Noções de
Probabilidade e Estatística. São Paulo: Editora da Universidade de São Paulo, 7° ed., 2010.
MORETTIN, Luiz Gonzaga. Estatística Básica: probabilidade e inferência. São Paulo: Pearson,
2010.
NEDER, Henrique Dantas. Curso de Introdução à Estatística Econômica e Aplicada. 2000.
Disponível em: . Acesso em: 02 abr. 2018.
REIS, Edna Afonso; REIS, Ilka Afonso. Exercícios Resolvidos em Introdução à Bioestatística.
Disponível em: . Acesso em: 21 fev. 2018.que se desenvolveu uma teoria
matemática rigorosa baseada em axiomas, definições e teoremas. Com o advento da teoria das
probabilidades, foi possível estabelecer as distribuições de probabilidade, consideradas como
a “espinha” dorsal da teoria estatística, pois todos os processos inferenciais são aplicações de
distribuições de probabilidade.
Assim, o conhecimento dos conceitos advindos da teoria das probabilidades é de grande
importância para uma correta utilização da técnica estatística.
6WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
1 - CONCEITOS FUNDAMENTAIS
1.1 Experimento Aleatório
É o processo de coleta de dados relativos a um fenômeno que acusa variabilidade em
seus resultados, ou seja, podemos dizer que são os experimentos cujos resultados podem não ser
os mesmos, ainda que sejam repetidos sob condições idênticas. Por exemplo:
➢ Ex.1: Jogar um dado e observar o número mostrado na face superior.
➢ Ex.2: Lançar uma moeda e um dado e observar a sua face superior.
➢ Ex.3: observar o sexo de um recém-nascido.
1.2 Espaço amostral
É o conjunto de todos os resultados possíveis de um experimento.
Representaremos espaço amostral por S ou Ω.
➢ S1: { 1, 2, 3, 4, 5, 6 }
➢ S2: { c1, c2, c3, c4, c5, c6, k1, k2, k3, k4, k5, k6}, onde c representa o número de cara e
k o nº de coroa.
➢ S3: { M, F}, onde M representa o sexo masculino e F representa o feminino.
Quando um espaço amostral consiste em um número finito ou infinito numerável de
eventos, é chamado de espaço amostral discreto. Se o espaço amostral consiste em todos os
números reais de determinado intervalo, ele é chamado de espaço amostral contínuo.
1.3 Evento
É um subconjunto de um espaço amostral, assim, o próprio S é um evento, chamado
evento certo e o conjunto vazio (ɸ) também é um evento, chamado evento impossível. As
mesmas operações realizadas com conjuntos são válidas também para os eventos.
1.3.1 Eventos mutuamente exclusivos
Dois eventos A e B são chamados de eventos mutuamente exclusivos ou mutuamente
excludentes se, e somente se, a ocorrência de um evento impede a ocorrência de outro evento,
ou seja,
7WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
2 - PROBABILIDADE
A cada evento A associado a um espaço amostral S, associamos um número real P(A)
denominado probabilidade de A, tal que:
Esta definição não nos diz como calcular P(A). Apenas nos dá algumas propriedades
gerais que P(A) deve ter. Antes de aprendermos como calcular P(A) vamos enunciar mais algumas
propriedades decorrentes destas propriedades mais gerais:
Propriedades relacionadas às probabilidades:
• Se A e B forem mutuamente excludentes (m.e.) então
d) Se S ou Ω for finito, então a soma das probabilidades de todos os resultados possíveis
é igual a 1.
2.1 Resultados igualmente prováveis (equiprováveis)
A hipótese mais comumente feita para espaços amostrais finitos é a de que todos os
resultados sejam igualmente prováveis. Tais espaços são chamados equiprováveis.
2.2 Definição clássica de Probabilidade
Consideremos então um espaço equiprovável S e seja um evento qualquer. A
probabilidade de A ocorrer será dada por:
em que, n(A) é o número de elementos de A e n(S) é o número de elementos de S. É
muito importante compreender que a expressão acima é apenas uma consequência da suposição
de que todos os resultados sejam igualmente prováveis e ela é somente aplicável quando essa
suposição for atendida.
8WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
Exemplo 1: O Centro Universitário Ingá possui 180 alunos matriculados no curso de
Psicologia e 220 no curso de Biologia. Nesta universidade existe um programa que prevê a escolha
aleatória de um aluno para representá-la num congresso local. Qual a probabilidade do aluno
escolhido ser do curso Psicologia? Qual a probabilidade que o sorteado seja aluno de Biologia?
Solução:
a) A= {O aluno sorteado é do curso de Psicologia}
Interpretação: A probabilidade de que o aluno escolhido seja do curso de Psicologia é
de 45%.
b) B= {O aluno sorteado é do curso de Biologia}
Interpretação: A probabilidade de que o aluno escolhido seja do curso de Biologia é de
55%.
Exemplo 2: Considere a seguinte tabela:
CURSO
SEXO
TOTAL
Masculino (M) Feminino (F)
A = Biologia 70 40 110
B = Psicologia 10 40 50
C = Medicina 20 20 40
D = Biomedicina 20 10 30
TOTAL 120 110 230
Sejam os eventos: A={Aluno de Biologia}
B={Aluno de Psicologia}
C={Aluno de Medicina}
D={Aluno de Biomedicina}
M={Aluno do sexo masculino}
F={aluno do sexo feminino}
Considerando agora o sorteio de um destes alunos e usando a frequência relativa como
aproximação da probabilidade calcule os seguintes eventos: P(A); P(B); P(C); P(D);
9WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
Solução:
uma vez que B e M
não são mutuamente excludentes, ou seja, existe a intersecção dos dois eventos.
2.3 Probabilidade Condicional
Dois eventos, A e B, são ditos de probabilidades condicionais se, dado que um tenha
ocorrido, isto afeta a probabilidade do outro evento ocorrer. Temos então que, Se P(B) é diferente
de zero, a probabilidade condicional de A relativa à B, isto é, a probabilidade de A ocorrer dado
que B tenha ocorrido (ou A dado B), isto é:
10WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
2.4 Probabilidade independente
Dois eventos, A e B, são ditos independentes se a probabilidade do evento A ocorrer não
é afetada pela ocorrência ou não de B, ou seja:
2.5 Teorema do produto (Regra da multiplicação)
De acordo com Fonseca (apud MATINS, 1996, p. 27) pode-se definir o Teorema do
produto a partir da definição de probabilidade condicional: “[...] A probabilidade da ocorrência
simultânea de dois eventos, A e B, do mesmo espaço-amostral, é igual ao produto da probabilidade
de um deles pela probabilidade condicional do outro, dado o primeiro. [...]”.
Assim, se A e B são eventos são condicionais, então:
3 - INDEPENDÊNCIA ESTATÍSTICA
Se A e B são dois eventos independentes, então “um evento A é considerado independente
de outro evento B se a probabilidade de A é igual a probabilidade condicional de A dado B”
(FONSECA, 1996).
Assim, se A e B são dois eventos independentes, temos:
Exemplo 3: Sejam os eventos tais que ;
Calcular m considerando A e B:
i) Mutuamente exclusivos;
ii) Independentes;
11WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
Solução:
a) A fórmula que podemos utilizar com as informações que temos é a da união (U) de
eventos. Não podemos esquecer que os eventos são m.e. (mutuamente exclusivos ou mutuamente
excludentes), assim:
b) Sendo as mesmas informações utilizaremos a fórmula da união (U), mas não
esquecendo que os eventos agora são independentes, assim temos:
Observação: lembre-se que m é um valor inteiro.
Exemplo 4: De acordo com as tábuas atuárias a probabilidade de que um homem esteja
vivo daqui a 30 anos é 3/5, a de sua mulher é 4/5. Calcular a probabilidade de que daqui a 30 anos:
a) Ambos estejam vivos.
b) Somente o homem esteja vivo.
c) Somente a mulher esteja viva.
d) Nenhum esteja vivo.
e) Pelo menos um esteja vivo.
12WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
Solução:
Primeiramente devemos enunciar os eventos de interesse:
H : Homem esteja vivo daqui a 30 anos.
H : Homem esteja morto daqui a 30 anos.
M : Mulher esteja viva daqui a 30 anos.
M: Mulher esteja morta daqui a 30 anos.
Assim,
Observação: lembre-se que o complementar de estar vivo é estar morto e o símbolo de
evento complementar é uma barra acima do evento de interesse.
Como os eventos são independentes, temos:
a) Ambos estejam vivos;
Para calcularmos a probabilidade de o homem estar vivo e a mulher estar viva daqui a 30
anos devemos lembrar que os eventos são independentes, e desta forma, a intersecção dos dois
eventos é dada pela multiplicação dos eventos, assim:
Interpretação:A probabilidade de que um homem e uma mulher estejam vivos daqui a
30 anos é de 48,00%.
b) Somente o homem esteja vivo;
Observe a informação que somente o homem está vivo daqui a 30 anos, ou seja, a mulher
está morta. Desta forma,
Interpretação: A probabilidade de que um homem esteja vivo daqui a 30 anos e que a
mulher esteja morta é de 12,00%.
c) Somente a mulher esteja viva;
Se somente a mulher está viva daqui a 30 anos, significa que o homem já morreu.
13WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
Interpretação: A probabilidade de que a mulher esteja viva daqui a 30 anos e que o
homem esteja morto é de 32,00%.
d) Nenhum esteja vivo.
Se nenhum está vivo significa que ambos já morreram daqui a 30 anos, assim:
Interpretação: A probabilidade de que a mulher esteja morta e o homem também daqui
a 30 anos é de 12,00%.
e) Pelo menos um esteja vivo.
Para calcular a probabilidade de que pelo menos um deles esteja vivo, devemos interpretar
que: o homem pode estar vivo ou a mulher está viva daqui a 30 anos, ou ainda, os dois estão vivos.
Mas lembre-se que a probabilidade do homem estar vivo é independente da probabilidade da
mulher está viva daqui a 30 anos.
Desta forma, utiliza-se a fórmula da união de eventos:
Interpretação: A probabilidade de que ambos estarem vivos daqui a 30 anos é de 92,00%.
14WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
4 - VARIÁVEIS ALEATÓRIAS
Quando realizamos um experimento, não temos obrigatoriamente, que obter um valor
numérico. Por exemplo, ao descrevermos uma peça manufaturada, podemos associar duas
categorias: “defeituosas” e “não defeituosas”, ou seja, uma variável qualitativa. Por outro lado, ao
estudarmos a descrição dos dados, vimos que os recursos disponíveis para análise das variáveis
quantitativas são mais ricos do que para as variáveis qualitativas, portanto, buscaremos uma
maneira de trabalharmos esta situação de uma maneira mais prática e facilitada associando
sempre um número real a qualquer evento de um espaço amostral, possibilitando assim, a
construção de modelos probabilísticos para tais variáveis.
DEFINIÇÃO 1 - Variável Aleatória: Seja E um experimento e S um espaço amostral
associado a esse experimento. Uma função X que associe a cada elemento s Є S um número real
X(s), denomina-se Variável Aleatória (v.a.).
Exemplo 5: Seja o experimento E: lançar duas moedas. O espaço amostral associado a
este experimento será:
S= {CC, CK, KC, KK}
Podemos definir uma v.a. (variável aleatória) como sendo:
X: Número de caras obtidas nas duas moedas.
• Para o evento s1 = {CC}, temos X(s1) = 2
• Para o evento s2 = {CK}, temos X(s2) = 1
• Para o evento s3 = {KC}, temos X(s3) = 1
• Para o evento s4 = {KK}, temos X(s4) = 0
Portanto, os valores assumidos pela v.a. X são os elementos do conjunto {0, 1, 2}.
Observações:
I) Embora usemos o termo “variável”, X é uma função cujo domínio é S e contradomínio
e R.
II) Para simplificar a notação, em geral, escrevemos X e não X(S).
III) Podem-se definir inúmeras v.a. para um mesmo espaço amostral S.
IV) Se S é numérico, então X(S) = S.
V) As variáveis aleatórias podem ser discretas ou contínuas.
15WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
4.1. Variável aleatória discreta
DEFINIÇÃO 2 – Variável Aleatória Discreta: Seja X uma v.a. Se o número de valores
possíveis de X for finito ou infinito enumerável, denominaremos X de variável aleatória discreta.
Ao trabalharmos com uma variável aleatória discreta, a função que descreve as
probabilidades da variável aleatória X assumir valores particulares será denominada Função de
Probabilidade.
DEFINIÇÃO 3 - Função de Probabilidade. Seja X uma variável aleatória discreta. A
cada possível resultado xi associaremos um número p(xi) = P(X = xi) denominado probabilidade
de xi. os números p(xi) e i= 1,2,3,...,n devem satisfazer:
Então esta função é chamada de “Função de Probabilidade” no ponto da variável aleatória
X.
Os pares ordenados [xi , p(xi)], onde i= 1, 2, ..., n é denominado de distribuição de
probabilidade.
Exemplo 6: Seja o experimento E: lançar 2 dados e a variável aleatória Y: soma dos pontos
obtidos na face de cada dado.
O espaço amostral associado a este experimento será:
De onde obtemos a seguinte função distribuição de probabilidade:
Y 2 3 4 5 6 7 8 9 10 11 12
P(Y=yi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
16WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
4.2 Variável aleatória contínua
DEFINIÇÃO 4 – Variável Aleatória Contínua: Seja X uma variável aleatória. Suponha
que Rx, o contra-domínio de X, é um intervalo ou um conjunto de intervalos. Então diremos que
X é uma variável aleatória contínua.
Lembremos que no caso da v.a. discreta definiu-se P(X=xi) como função de probabilidade,
no caso v.a. contínua, este conceito não poderá ser aplicado, pois X assume valores não
enumeráveis.
Para melhor entendimento, tomemos como exemplo um relógio elétrico, onde os
ponteiros dos segundos movem-se continuamente. Neste caso, o conjunto de possíveis valores
de X não é um conjunto enumerável de valores, como no caso de um relógio mecânico, pois X
pode assumir qualquer valor do intervalo [0,360º] = {xЄR / 0≤ x ≤360º}. Assumindo que não
existe uma região de preferência para o ponteiro parar, e como existem infinitos pontos nos
quais o ponteiro pode parar, cada um com igual probabilidade, cada ponto teria probabilidade de
ocorrer igual a zero. Assim, não tem muito sentido falar na probabilidade de o ângulo X ser igual
a certo valor, pois esta probabilidade sempre será igual a zero. Entretanto, podemos determinar a
probabilidade de o ângulo X estar compreendido entre dois valores quaisquer, por exemplo: P(0º
a.
4.4 Função de distribuição acumulada
DEFINIÇÃO 6 – Função de distribuição acumulada. Seja X uma variável aleatória
discreta ou contínua. Define-se a função F como Função de distribuição acumulada da v.a. (f.d.)
como:
1.1 Se X for uma v.a.d. (variável aleatória discreta),
1.2 Se X for uma v.a.c. (variável aleatória contínua),
4.5 Caracterização de uma variável aleatória discreta
Tal como para conjuntos de dados de amostras e populações, é frequentemente útil
descrever uma distribuição de probabilidade em termos de sua média e de sua variância. A média
será chamada de valor esperado (esperança matemática ou expectância).
Valor esperado, esperança matemática ou expectância - E(X)
DEFINIÇÃO 7 – Seja X uma v.a.d. com possíveis valores x1, x2 , ..., xn. Seja p(xi)=P(X=xi), com
i=1, 2, ..., n. Então o valor esperado de X (ou esperança de X), denotado por
E(X) ou µX, é definido como:
∑
=
=
n
1iii )x(px)X(E ou ii FxXE ∑=)(
18WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
Exemplo 7: Descobriu-se que a chegada de clientes a uma loja de materiais fotográficos,
durante intervalos aleatórios escolhidos de 10 minutos, segue a distribuição:
Número de chegadas (X) 0 1 2 3 4 5
Probabilidade p(xi) 0,15 0,25 0,25 0,20 0,10 0,05
Sabe-se que , ii FxXE ∑=)( assim,
4.6 Variância de uma variável aleatória
Embora o valor da esperança de variável aleatória nos dê boas informações sobre o seu
comportamento, ainda não nos diz tudo. É óbvio que precisamos definir uma medida que nos dê
o grau de dispersão de probabilidade em torno da média e essa medida é chamada de variância.
Do exemplo do dado, acima, temos que calcular:
Assim,
4.7 Variável aleatória bidimensional
Existem casos em que há interesse por dois resultados simultâneos.
Segundo Fonseca (apud Martins, 1996, p. 47) pode-se definir variável aleatória
bidimensional: “[...] X=X(s) e Y=Y(s), duas funções, cada uma associando um número real a
cada resultado s Є S, denomina-se (X,Y) uma variável aleatória bidimensional [...]”.
Exemplo 8: Seja E: jogar dois dados, em que (X,Y) = pontos dos respectivos dados:
X/Y 1 2 3 4 5 6
1 1/36 1/36 1/36 1/36 1/36 1/36
2 1/36 1/36 1/36 1/36 1/36 1/36
3 1/36 1/36 1/36 1/36 1/36 1/36
4 1/36 1/36 1/36 1/36 1/36 1/36
5 1/36 1/36 1/36 1/36 1/36 1/36
6 1/36 1/36 1/36 1/36 1/36 1/36
19WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
5 - MEDIDAS DE POSIÇÃO OU MEDIDAS DE TENDÊNCIA
CENTRAL
São medidas que objetivam representar o ponto central de equilíbrio de uma distribuição
de dados. Essas medidas representam quantitativamente os dados, e as mais utilizadas são a
média ou esperança matemática, mediana e moda.
5.1 Media ou esperança matemática
Média representa o ponto de equilíbrio de um conjunto de dados. Seja (x1,x2,...,xn) um
conjunto de dados, a média é dada por:
Quando os dados são agrupados em intervalos de classes, xi corresponde ao ponto médio
do intervalo.
5.2 Propriedades da média
1 - A soma algébrica dos desvios tomados em relação à média é nula. Isto é, = 0
onde di = xi - x, i = 1, 2, ..., n e x é a média do conjunto de dados.
2 - Somando-se ou subtraindo-se uma constante, k, a todos os valores de uma variável, a
média do conjunto fica aumentada ou diminuída dessa constante.
3 - Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante,
k, a média do conjunto fica multiplicada ou dividida por essa constante.
20WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
5.3 Vantagens e desvantagens da média
É uma medida que, por uniformizar os dados, não representa bem os conjuntos que
revelam tendências extremas, uma vez que a mesma será grandemente influenciada por valores
discrepantes.
Suponha por exemplo, que durante um ano letivo, um aluno obtenha as seguintes notas
em uma disciplina: 30, 35, 25, 30, 25, 35, 35, 95, 90, 100.
Um cálculo rápido nos mostra que sua média final foi 50. Como a média final deve
traduzir o aproveitamento do aluno durante o ano e a média 50 só foi conseguida à custa das três
últimas notas, concluímos que 50 é um valor falho para medir o aproveitamento do aluno.
Desta forma, entende-se que:
1 - A média nem sempre tem existência real, isto é, ela nem sempre faz parte do conjunto
de dados;
2 - É a medida de posição mais conhecida e de maior emprego;
3 - É facilmente calculada;
4 - Serve para compararmos conjuntos semelhantes;
5 - Depende de todos os valores do conjunto de dados;
6 - Em geral não ocupa a posição central do conjunto (ocupa a posição do centro de
equilíbrio).
5.4 Mediana (Md)
A mediana de um conjunto de valores ordenados segundo uma ordem de grandeza é o
valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de
elementos.
Quando o conjunto de observações tem um número ímpar de valores, não-agrupados
em classes, então a mediana é dada pela expressão:
Quando o conjunto de observações tem um número par de valores, não-agrupados
em classes, então a mediana será, a média aritmética dos dois números que ocuparem o meio da
série:
Quando o conjunto de observações se apresenta agrupados em classes em uma tabela de
frequências, então a mediana é dada pela expressão:
Vantagens e desvantagens da mediana
1- Não depende de todos os valores da série, podendo mesmo não se alterar com a
modificação de alguns deles;
2- Não é influenciada por valores discrepantes.
21WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
5.5 Moda (Mo)
Moda é o valor que ocorre com maior frequência em uma série de dados. Existem séries
de dados em que nenhum valor aparece mais vezes que outros. Neste caso não apresenta moda,
as quais denomina-se séries amodais. Em outros casos, pode aparecer dois ou mais valores de
concentração. Diz-se, então, que a série tem duas ou mais modas (bimodal, trimodal). Quando
os dados se apresentam agrupados em tabelas de frequências, é necessário utilizar a expressão
de Czuber para calcular o valor que representa a moda:
(em que “i” é a ordem da classe de maior frequência).
Podemos também, neste caso, tomar o ponto médio da classe modal como sendo a moda.
5.6 Separatrizes
Quartis (Qi): Denominamos quartis os valores de uma série que a divide em quatro
partes iguais. Indicamos por: Q1,... Q3.
Decis (Di): Denominamos decis os nove valores e uma série que a divide em dez partes
iguais. Indicamos por: D1,... D9.
Percentis (Pi): Denominamos percentis os noventa e nove valores de uma série que a
divide em cem partes iguais. Indicamos por: P1,... P99.
Para valores NÃO-AGRUPADOS (em ROL): Quando a série tem um número par de
valores, as posições dos quartis deverão ser calculadas por :
Quando a série tem um número ímpar de valores, as posições dos quartis deverão ser
calculadas por:
22WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
Quando p for inteiro, então o elemento quartílico será Q = xp. Caso p não seja inteiro o
elemento quartílico será a média dos valores mais próximos.
Para valores AGRUPADOS (em tabelas): As medidas de posição para dados agrupados
são calculadas através da expressão:
em que:
S = é a separatriz desejada (Md, Q, D, P);
K = é a ordem da separatriz: K = 1 para a mediana
K = 1, 2, 3 para os quartis
K = 1, ... , 9 para os decis
K = 1, ... , 99 para os percentis
p = é a posição da observação (dado) que é a separatriz desejada e é calculada pela
expressão:
Observação: Os decis e os percentis, geralmente, são calculados para dados agrupados.
6 - MEDIDAS DE DISPERSÃO
São medidas estatísticas que indicam o grau de dispersão, ou variabilidade do conjunto
de observações pesquisados, em relação a uma medida de tendência central. Elas descrevem os
dados qualitativamente.
Uma única medida não é suficiente para descrever de modo satisfatório um conjunto de
observações. Por exemplo, dois conjuntos de dados podem ter a mesma média aritmética e, no
entanto, a dispersão de um pode ser muito maior que a dispersão do outro. As principais medidas
de dispersão Amplitude total, Variância, Desvio Padrão, Coeficiente de variação.
6.1 Amplitude total (AT)
Amplitude total é a diferença entre o maior e o menor valor observado.
AT = x (máximo) - x (mínimo), para valores não agrupados,
AT = L(máximo) - l(mínimo) para valores agrupados em classes em uma tabela de
frequências, em que:
L é o limite superior da última classe da tabela de frequências
e,
l é o limite inferior da primeira classe da tabela de frequências.
S l h p Fa
Fk i
i
i
= +
− −.( )1
p
n ou N
ou ou ou
K= ⋅
... ....
... ... ... ... ... ...2 4 10 100
23WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
6.2 Variância
Variância é a medida que fornece o grau de dispersão, ou variabilidadedos valores do
conjunto de observações em torno da média. Ela é calculada tomando-se a média dos quadrados
dos desvios em relação à média:
( )
s
m2
2
=
−∑ x
N
i
para valores populacionais não agrupados,
( )
1
2
2
−
−
= ∑
n
xx
s i
para valores amostrais não agrupados,
( )
s
m2
2
=
−∑ x F
N
i i
para valores populacionais agrupados em classes em uma
tabela de frequências,
( )
1
2
2
−
−
= ∑
n
Fxx
s ii
para dados amostrais agrupados em classes em uma tabela
de frequências.
6.3 Desvio padrão
Como a variância é calculada a partir do quadrado dos desvios, sua unidade é quadrada
em relação à variável estudada, o que, sob o ponto de vista prático é um inconveniente. Por isso
mesmo, imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada
desvio padrão, definido como a raiz quadrada da variância e representada por:
2ss = (desvio padrão amostral)
2ss = (desvio padrão populacional)
24WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
1
ENSINO A DISTÂNCIA
6.4 Coeficiente de variação (CV)
Coeficiente de variação é uma medida relativa da dispersão ou variabilidade dos dados:
Destaca-se que o desvio padrão tem a mesma unidade de medida que os dados, de modo
que o coeficiente de variação é adimensional.
Critérios para interpretação do CV: Quanto menor for o coeficiente de variação, mais
representativa dos dados será média. Coeficiente de variação acima de 50%, a média não é
representativa.
• Se 0%≤ cv% 0 (assimétrica positiva)
As 0,263 (platicúrtica)
K = 0,263 (mesocúrtica)
Kem que nasceram 20 coelhos?
Solução:
X: Número de coelhos machos
n = 20
p = 0,40 (probabilidade de sucesso do evento de interesse)
q = 1-p = 1-0,40 = 0,60 (probabilidade de fracasso do evento de interesse)
Então, a probabilidade de obter pelo menos dois coelhos é k ≥ 2 , ou seja, de dois até
vinte. Deve-se calcular pelo complementar para facilitar os cálculos, assim:
Portanto, a probabilidade de que nasçam pelo menos 2 coelhos machos num dia em que
nasceram 20 coelhos é de 0,9995 ou 99,95%.
1.2 Distribuição de Poisson
A Distribuição de Poisson é um caso particular da distribuição binomial, quando o
número de provas n tende para o infinito e, a probabilidade p de cada evento, em uma única
prova, tende a zero, entretanto E[X] = n permanece finita e não nula.
DEFINIÇÃO 8 – Diz-se que a variável aleatória X tem distribuição de Poisson com
parâmetro λ=np, se sua função de probabilidade é dada pela fórmula:
Com λ representando o número médio dos eventos ocorridos no intervalo considerado.
A distribuição será denotada por X~P (λ) onde:
E(X) = V(X) = λ = np
31WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
2
ENSINO A DISTÂNCIA
A Distribuição de Poisson também é chamada de distribuição de eventos raros, tais como:
i) Número de falhas de um computador em um dia de operação.
ii) Número de chamadas recebidas por um PBX durante um intervalo pequeno de tempo.
iii) Número de relatórios de acidentes enviados a uma companhia de seguros em uma
semana.
Exemplo 3: O número de mortes por afogamento em fins de semana, numa cidade
praiana, é de 2 para cada 50.000 habitantes. Qual a probabilidade de que em:
a) Ocorra nenhum afogamento?
b) 200.000 habitantes ocorram 5 afogamentos?
c) 112.500 habitantes ocorram pelo menos 3 afogamentos?
Solução:
a) X: Número de afogamentos
λ = 2
Portanto, a probabilidade de que não ocorra nenhum afogamento a cada 50.000 habitantes
é de 0,1353 ou 13,53%.
b) X: Número de afogamentos a cada 200.000 habitantes
Cuidado, agora temos que calcular o número médio de afogamentos por habitantes, pois
o evento mudou de 50.000 habitantes, para cada 200.000 habitantes. Assim, temos que calcular
a nova média:
2 = 50.000 habitantes
λ = 200.000 habitantes
Resolvendo por regra de três obtemos:
50.000l = 2.200.000
λ = 8
Assim,
32WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
2
ENSINO A DISTÂNCIA
Portanto, a probabilidade de que ocorra 5 afogamentos a cada 200.000 habitantes é de
0,0916 ou 9,16%.
c) X: Número de afogamentos a cada 112.500 habitantes
Cuidado, agora temos que calcular o número médio de afogamentos por habitantes, pois
o evento mudou para cada 112.500 habitantes. Também preste atenção que pede para calcular a
probabilidade de pelo menos 3 afogamentos, isso significa três ou mais. Como não sabemos até
quantos afogamentos podem ocorrer aleatoriamente em um dia, calculamos pelo complementar.
Assim,
2 = 50.000 habitantes
λ = 112.500 habitantes
Resolvendo por regra de três obtemos:
50.000λ = 2. 112.500
λ= 4,5
Desta forma,
Portanto, a probabilidade de que ocorra pelo menos três afogamentos a cada 112.500
habitantes é de 0,8264 ou 82,64%.
33WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
2
ENSINO A DISTÂNCIA
2 - MODELOS DE DISTRIBUIÇÕES CONTÍNUAS
2.1 Distribuição Normal
DEFINIÇÃO 9 – Seja uma variável aleatória contínua e independente X que apresenta a
seguinte função densidade:
Em que, os parâmetros µ e σ2 são respectivamente a média e a variância populacional que
satisfaz as condições:
a) -∞
c) -∞ 1,00) g) 0,1587
h) P(Z > 1,645) h) 0,0495
i) P(Z > -2,05) i) 0,9798
j) P(Z > -8,0 ) j) 1
k) P(Z > 6,6 ) k) 0
l) P(-1,0N(0,95;4,75)
X: Sistema total, ∑
=
=
100
1i
iXX
Assim, a média e a variância do sistema é dada por:
e, a Notação é: X ~ N(95;475)
a) A variável aleatória de interesse é o sistema funcionando totalmente, assim:
Portanto, a confiabilidade do sistema funcionar, em qualquer dia, seja superior a 97 é de
0,1788 ou 17,88% do tempo.
38WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
2
ENSINO A DISTÂNCIA
b) A variável aleatória de interesse é o sistema funcionando totalmente dentro de um
intervalo, assim:
Portanto, a confiabilidade do sistema completo funcionar adequadamente quando pelo
menos 80 componentes funcionam é de 0,9890, ou seja, 98,90% do tempo.
Exemplo 7: As alturas de 10.000 alunos do Centro Universitário UNINGÁ têm
distribuição aproximadamente normal, com média 170 cm e desvio - padrão 5 cm.
a. Qual a probabilidade de alunos com altura superior a 165 cm?
b. Qual o número esperado de alunos com altura inferior a 173 cm?
c. Qual o número esperado de alunos com altura entre 168 cm e 175 cm?
d. Qual o intervalo simétrico em torno da média, que conterá 75% das alturas dos
alunos?
Solução:
Notação é: X ~ N(170;52), ou X ~ N(170;25)
X: Altura dos alunos do Centro Universitário UNINGÁ.
a) Qual a probabilidade de alunos com altura superior a 165 cm?
ou
Portanto, a probabilidade de alunos com altura superior a 165 cm é de 0,8413, ou seja,
84.13%.
39WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
2
ENSINO A DISTÂNCIA
b) Qual o número esperado de alunos com altura inferior a 173 cm?
Cuidado, como queremos um número esperado (número médio) temos que calcular a
probabilidade da altura pedida no exercício e multiplicarmos pela constante (k), pela propriedade
da média, a qual é o número de alunos desta instituição. Desta forma,
Assim,
Portanto, o número esperado de alunos do Centro Universitário UNINGÁ que tem altura
inferior a 173 cm é de 7257 alunos.
c) Qual o número esperado de alunos com altura entre 168 cm e 175 cm?
Assim,
Portanto, o número esperado de alunos do Centro Universitário UNINGÁ que tem altura
entre 168 cm a 175 cm é de 4967 alunos.
40WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
2
ENSINO A DISTÂNCIA
d) Qual o intervalo simétrico em torno da média, que conterá 75% das alturas dos alunos?
Sabemos que a soma de todas as probabilidades é 1. Temos como limite 75%, ou 0,75,
então consequentemente:
Como temos a probabilidade, da tabela Normal Padronizada obtemos os valores críticos:
Assim,
Portanto, o intervalo simétrico em torno da média, que conterá 75% das alturas dos
alunos está entre 164,25 cm e 175,75 cm.
41WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
2
ENSINO A DISTÂNCIA
3 - DISTRIBUIÇÃO QUI-QUADRADO
Seja x1, x2, x3,,..., xp, em que “p” variáveis aleatórias independentes, normalmente
distribuídas, com média zero e variância 1.
DEFINIÇÃO 11 – A variável aleatória tem distribuição qui-quadrado se:
Em que “p” é um parâmetro da função densidade denominado “grau de liberdade”,
denotado pela letra grega “φ”, onde lê-se fi. A média é igual ao grau de liberdade, e que a variância
é igual ao dobro do número de graus de liberdade. Desta forma,
A distribuição qui-quadrado está tabelada nos livros referenciados.
Exemplo 8: Admita parâmetro 8, ou seja, φ=8 e α=5% unilateral à direita.
Solução:
Observe a primeira coluna da tabela com φ=8, e na primeira linha observe o alfa
informado, neste caso, α=5%, encontre a intersecção da linha com a coluna o número 15,5.
Graficamente temos:
Exemplo 9: Admita parâmetro 23, ou seja, φ=23 e α=5% bilateral.
Solução:
Observe a primeira coluna da tabela com φ=23, e na primeira linha observe a metade do
valor do alfa informado, neste caso, α=5%\2= 0,025, encontre a intersecção da linha com a coluna
o número 38,1, sendo este o limite superior da qui-quadrado.
O valor da abscissa à esquerda é obtido na tabela observando na primeira coluna com
φ=23 e na primeira linha com 0,975 (1-0,025), em que encontramos 11,7, sendo este o limite
inferior.
42WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
2
ENSINO A DISTÂNCIA
Graficamente temos:
4 - DISTRIBUIÇÃO T-STUDENT
A variável
s
m−
=
XZ tem distribuição normal. Quando não conhecemos a variância
populacional (σ2), devemos usar sua estimativa, a variância amostral (S2).
DEFINIÇÃO 12 – A variável com distribuição de “t de Student” com “φ” graus de
liberdade é definida como:
em que:
(estimador do erro padrão)
Quando o tamanho da amostra for suficientemente grande (n≥30), S2 se aproxima
bastante de σ2, o que faz com que a variável “t” se aproxime da variável normal “Z”.
Se o tamanho da amostra for pequeno (n51
2.3.1 GRÁFICO EM BARRAS (OU EM COLUNAS) .................................................................................................. 52
2.3.2 GRÁFICO EM SETORES ................................................................................................................................. 52
2.3.3 GRÁFICO EM LINHA ....................................................................................................................................... 53
2.3.4 GRÁFICO COMPARATIVO .............................................................................................................................. 53
3 - RESUMO E APRESENTAÇÃO DE DADOS QUANTITATIVOS ........................................................................... 54
3.1 CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA DISCRETA .......................................................... 54
3.2 GRÁFICO EM BARRAS (OU EM COLUNAS) .................................................................................................... 55
3.3 AGRUPAMENTO DOS DADOS – DISTRIBUIÇÃO DE FREQUÊNCIAS ............................................................ 56
3.2 CONSTRUÇÃO DE DISTRIBUIÇÃO DE FREQUÊNCIA CONTÍNUA ................................................................. 58
4 - GRÁFICOS ........................................................................................................................................................... 59
4.1 HISTOGRAMAS ................................................................................................................................................... 59
4.2 POLÍGONOS DE FREQUÊNCIAS ....................................................................................................................... 59
4.3 POLÍGONOS DE FREQUÊNCIA ACUMULADA OU OGIVAS ............................................................................ 60
47WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
INTRODUÇÃO
Nesta Unidade, estudaremos a Estatística Descritiva: descrever, analisar e interpretar os
dados numéricos de uma população ou amostra.
Então, aprenderemos sobre apresentação de dados qualitativos com os tipos de tabelas e
as maneiras de fazer cada uma delas. Também veremos sobre os tipos de séries estatísticas e os
gráficos, os quais são muito utilizados para exposição de dados e que possuem diversos tipos que
são utilizados conforme a intenção da pesquisa e os dados coletados.
Vamos estudar e analisar as maneiras de se apresentar os dados quantitativos também, a
saber: Distribuição de Frequência discreta, Distribuição de Frequência Contínua e, após ver como
são construídas, estudaremos os gráficos de histogramas, polígonos de frequências e polígonos
de frequência acumulada.
48WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
1 - ESTATÍSTICA DESCRITIVA
Segundo (FONSECA, 1996), como o próprio nome sugere, estatística descritiva se
constitui num conjunto de técnicas que objetivam descrever, analisar e interpretar os dados
numéricos de uma população ou amostra.
A amostra dos dados pode ser obtida de diversas formas, tais como: amostra aleatória
simples (a.a.s.), amostra sistemática, amostra estratificada proporcional, ou a combinação delas.
Não iremos nos ater neste tema, pois é outra disciplina de estatística.
Coletados os dados, surgem então questões do tipo: Como comunicar os dados obtidos?
Como descrever e caracterizar o conjunto de dados como um todo?
Pode-se tentar lê-los e adquirir uma idéia subjetiva da informação nele contida. Porém em
muitas situações isto não é viável devido ao grande número de dados. Além disso, uma impressão
subjetiva não só é difícil de ser transmitida como também pouco convincente. Assim, chegamos
à conclusão de que são necessárias técnicas estatísticas que reduzam e descrevam uma grande
quantidade de informação.
Para condensar e comunicar os dados são usados dois esquemas: as tabelas e as
representações gráficas. Estas estratégias se direcionam de forma diferente quando se trata de
dados qualitativos ou quantitativos, conforme veremos em seguida. Além disso, os dados podem
ser organizados para uma única variável de cada vez, ou envolvendo duas ou mais variáveis.
Para caracterizar o conjunto de dados como um todo, faz-se a análise descritiva dos
mesmos através das medidas descritivas.
2 - RESUMO E APRESENTAÇÃO DE DADOS
QUALITATIVOS
2.1 Tabelas
Ao se resumir os dados coletados, em uma tabela, algumas normas devem ser seguidas:
a) Toda tabela deve conter Título e Fonte. Título: é a indicação que precede a tabela e
que contém a designação do fato observado, o local e a época em que foi registrado. Fonte: é a
indicação da entidade responsável pelo fornecimento dos dados ou pela sua elaboração.
b) Outros dois elementos primordiais na tabela são: o cabeçalho e a coluna indicadora.
O primeiro evidencia o conteúdo das colunas e fica na parte superior da tabela, o segundo mostra
o conteúdo das linhas.
c) Cada cruzamento entre linha e coluna é denominado célula ou casa.
d) Nenhuma célula (casa) deve ficar em branco.
e) Hífen (-), indica que o valor numérico é nulo.
f) Reticência (...) , indica que não se dispõe do dado.
g) Interrogação (?) , indica dúvida quanto a exatidão do valor numérico.
49WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
h) Zeros (0; 0,0; 0,00), indica valor muito pequeno em relação a unidade utilizada.
i) A tabela não é fechada lateralmente por traços verticais.
j)Não há obrigatoriedade de linha vertical entre as colunas, mas deve ser usada quando a
tabela apresenta muita informação (muitas colunas e/ou muitas linhas).
2.1.1 Tabelas simples
É a representação dos valores de uma única variável.
Tabela 01: VENDAS DE IMÓVEIS REALIZADAS PELAS MAIORES
IMOBILIÁRIAS DA CIDADE DE SÃO PAULO EM 1999
Coluna indicadora Título
IMOBILIÁRIA UNIDADES VENDIDAS
AItaplan
Lopes
Nosso Teto
Procasa
5186
4273
4992
3426
TOTAL 17877
Fonte: Setor Imobiliário de São Paulo.
Total Corpo da tabela
2.1.2 Tabelas de dupla entrada ou de contingência
É a representação, em uma única tabela, de valores de mais de uma variável, isto é, a
conjugação de duas tabelas simples.
TABELA 2
Tabela 02: MIGRAÇÃO RURAL, EM MILHÕES POR DÉCADA,
EM ALGUNS ESTADOS BRASILEIROS NOS ANOS
1970 E 1980
ESTADOS
ANOS
70 80
BA 0,7 1,0
RS 1,4 1,1
PR 2,4 1,5
MG 2,4 1,6
Fonte: revista ISTO É, julho/98.
50WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
2.2 Tipos de séries estatísticas
2.2.1 Temporal
Também conhecida como cronológica, evolutiva ou histórica. É a série em que os dados
são observados segundo a época de ocorrência. Nesta série o fator variável é tempo e os fixos são:
local e espécie.
Tabela 03: POSTOS DE TRABALHO, NOS BANCOS,
BRASIL, 1992/1997
ANO NÚMERO DE POSTOS
(em milhares)
1992 677
1993 664
1994 643
1995 590
1996 524
1997 481
Fonte: revista ISTO É, julho/98.
2.2.2 Geográfica
Também denominada Territorial ou espacial. É a série em que os dados são observados
segundo a localidade de ocorrência. Nesta série o fator variável é local e os fixos são: tempo e
espécie.
Tabela 04: BALANÇO COMERCIAL DA REGIÃO
SUL DO BRASIL EM 1995
REGIÃO VALOR (em US$ milhão)
Paraná 1200
Rio Grande do Sul 3200
Santa Catarina 1600
Total 6000
Fonte: Almanaque Abril 96.
2.2.3 Específica
Também conhecida por categórica. É a série em que os dados são agrupados segundo a
modalidade de ocorrência (os dados variam em f unção do gênero específico em estudo). Nesta
série o fator variável é espécie e os fixos são: tempo e local.
51WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
Tabela 05: PREÇOS MÉDIOS, EM REAIS, PAGOS PELAS
COOPERATIVAS/CEREALISTAS AOS PRODUTORES,
SÃO PAULO, 24/02/1999
PRODUTO PREÇO MÉDIO
Algodão
Milho
Soja
Trigo
6,90***
8,18**
16,09**
11,08*
Fonte: jornal Folhade São Paulo, 24/02/99.
Nota: *** Preço por arroba em caroço, para o tipo 6.
** Preço por saca de 60 kg.
* Preço por saca de 60 kg, Ph 78, por região.
2.2.4 Distribuição de frequências
É a série em que os dados são agrupados segundo suas respectivas frequências absolutas
(a variação dos dados fica definida conforme as classes em que foram divididos ou os valores
assumidos). Nesta série os três valores tempo, local e espécie são fixos.
Tabela 06: DISTRIBUIÇÃO DOS SALÁRIOS DOS
FUNCIONÁRIOS DO HOSPITAL ESPERANÇA,
FEVEREIRO, 2017.
Salários Número de funcionários
000 |---- 937 11
937 |---- 1437 8
1437 |---- 1937 6
1937 |---- 2437 2
2437 |---- 2937 1
2937 |---- 3437 1
3437 |---- 3937 3
Total 32
Fonte: Departamento Pessoal.
2.3 Gráficos
Os gráficos são de grande utilidade na apresentação de dados estatísticos. Os números
são considerados frios e de difícil interpretação, mas ganham vida quando são substituídos por
figuras que mostram, com uma simples olhadela, o significado global de um conjunto de dados.
Os gráficos mais usados para dados qualitativos são: Barras ou Colunas, Setor e Linha.
Assim como as tabelas, os gráficos também devem ter título e fonte. Nos gráficos
apresentados em nosso estudo, utilizamos os dados das tabelas 2, 4, 3 e 2 respectivamente.
52WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
2.3.1 Gráfico em barras (ou em colunas)
São empregados para representar informações de qualquer tipo de variável, inclusive o
tempo (no caso em que o número de datas não é muito grande).
Fonte: Revista ISTO É, julho/98.
2.3.2 Gráfico em setores
Aplicável quando as categorias básicas são quantificáveis. Toma-se um círculo (360
graus), que é dividido em setores com áreas proporcionais às frequências das diversas categorias.
Fonte: Almanaque. Abril 1996.
53WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
2.3.3 Gráfico em linha
É um dos mais importantes gráficos; representa observações feitas ao longo do tempo,
em intervalos iguais ou não. Tais conjuntos de dados constituem as chamadas séries históricas,
ou séries temporais. Traduzem o comportamento de um fenômeno em certo intervalo de tempo.
Fonte: revista ISTO É, julho/98.
2.3.4 Gráfico comparativo
É um gráfico utilizado quando se deseja comparar variáveis.
Fonte: revista ISTO É, julho/98.
54WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
3 - RESUMO E APRESENTAÇÃO DE DADOS
QUANTITATIVOS
Quando nos é proposta a análise de um conjunto de dados sem características de séries
cronológicas, geográficas ou específicas, o tratamento descritivo desses dados estatísticos deve
iniciar-se por um processo de sintetização. A sintetização dos dados poderá ser feita, adotando-
se algum critério de classificação (subconjuntos), que permita apresentar os dados em tabelas, de
forma resumida. Tais tabelas são chamadas distribuição de frequências.
3.1 Construção de uma Distribuição de Frequência Discreta
Para o desenvolvimento desse item, utilizaremos o Exemplo 12: A prescrição médica
solicita que 250 mL de soro glicofisiológico sejam infundidos em 3 horas. Para atender a essa
prescrição, é necessário controlar o gotejamento do soro para, aproximadamente, 28 gotas/
minuto. Uma amostra de prescrições deste soro, infundidos em horas, coletados no Hospital
Esperança de Maringá, em 12/2017, foi de:
6 3 5 6 4 3 5 4
4 2 3 2 5 4 3 4
Os dados são fictícios.
Para a construção de uma distribuição de frequência discreta, vamos utilizar alguns dados
importantes que devem ser conceituados para nosso estudo.
Dados brutos (Xi): É o conjunto de dados numéricos obtidos após a crítica dos valores
coletados, como acima.
Representação: - x1,...,xn ( se amostrais );
- x1,...,xN (se populacionais ).
ROL: É o arranjo dos dados brutos em ordem crescente ou decrescente. O rol em geral,
por ser trabalhoso em sua elaboração, pode ser dispensado.
Organizando os dados brutos do exemplo 12 em ROL CRESCENTE obtemos:
ROL: 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6.
Frequência absoluta (Fi): É o número de vezes que um valor Xi aparece no conjunto de
dados.
Frequência absoluta acumulada (Fac): Consiste em acumular o número vezes que um
dado Xi aparece no conjunto de dados acrescido da frequência absoluta dos Xi’s anteriores.
No exemplo usado, a distribuição de frequência será:
55WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
Tabela 06: Prescrições de 250 mL de soro glicofisiológico, infundidos
em horas, coletados no Hospital Esperança,
de Maringá, 12/2017.
Soro infundido
em Horas Fi Fai
2 2 2
3 4 6
4 5 11
5 3 14
6 2 16
Total 16 ---
Fonte: Dados fictícios.
Observação: Na tabela acima, a coluna dos Fai’s (frequência absoluta acumulada) é
uma coluna complementar da distribuição de frequência. Veremos no exemplo a seguir uma
distribuição de frequência completa.
3.2 Gráfico em barras (ou em Colunas)
Utilizado quando os dados consistem em contagens e não de mensurações em escala
contínua. Os valores distintos Xi’s são locados no eixo horizontal, e em cada um deles traça-se um
segmento vertical de altura proporcional à respectiva frequência.
Fonte: revista ISTO É, julho/98.
56WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
3.3 Agrupamento dos dados – Distribuição de
frequências
Um grande conjunto de dados quantitativos necessita de um método eficiente de
agrupamento ou de sumarização, de forma que seu manuseio, visualização e compreensão sejam
simplificados. Para isto, os dados devem ser agrupados em classes.
Exemplo 13: Considere uma amostra de 25 postos de saúde, da variável “número de
funcionários”, da região de Maringá em 31/01/2017. Suponha os dados fictícios.
46 47 51 47 43 47 43 44 51 49
48 43 48 46 42 49 46 45 46 44
46 49 51 48 50
Os dados, como apresentados acima, são chamados brutos, pois não foram ainda
submetidos a nenhum tipo de tratamento.
Inicialmente, os dados devem ser colocados em ordem crescente, ou seja, em ROL:
42 43 43 43 44 44 45 46 46 46
46 46 47 47 47 48 48 48 49 49
49 50 51 51 51
Pode-se observar agora que das 25 observações o menor valor é 42 e o maior é 51.
Amplitude (AT)
É a diferença entre o maior e o menor valor do conjunto de dados observados.
Para os dados acima: AT = 51-42 = 9.
Observa-se que esse exemplo contém um número pequeno de observações (n=25),
quando há um grande número de dados observados o processo de ordenação é trabalhoso e a
listagem final pouco representará. Nesses casos, pode-se simplificar o processo agrupando os
dados em certo número de classes, cujos limites serão denominados limite inferior e limite
superior.
A quantidade de classes e a amplitude destas devem ser obtidas observando as seguintes
normas:
i)as classes devem cobrir a amplitude total;
ii)o extremo superior de uma classe é o extremo inferior da classe seguinte;
iii)cada valor observado deve enquadrar-se em apenas uma classe;
iv)número total de classes não deve ser inferior a 5 e nem superior a 25;
O número de classes (k), pode ser obtido de uma das fórmulas seguintes:
i) k = n ;
ii)k = 1 + 3,22 log n (fórmula de Sturges)
57WWW.UNINGA.BR
ES
TA
TÍ
ST
IC
A
| U
NI
DA
DE
3
ENSINO A DISTÂNCIA
Para o conjunto de dados do exemplo:
Não é obrigatório o uso de qualquer dessas fórmulas, pois existem outras, mas estas são
as mais conhecidas.
O número de classes pode ser estabelecido pelo bom senso de quem vai construir a tabela.
Dividindo a amplitude total (AT) por 5 chega-se ao tamanho ou amplitude de cada uma
das classes:
Observação: quando os valores observados são números inteiros, os limites das classes
também devem ser números inteiros. Aconselho escolher o número mais próximo de AT que
resulte em um número inteiro.
Agora, utilizando esse valor podem-se obter os limites inferiores e superiores das classes:
i) O limite inferior da primeira classe é o menor valor da série;
ii)