Prévia do material em texto
Cap´ıtulo 1
CONCEITOS INICIAIS
1.1 INTRODUC¸A˜O
A Estat´ıstica trabalha com a coleta, apresentac¸a˜o, ana´lise e uso de dados para a resoluc¸a˜o de
problemas, tomada de deciso˜es, desenvolvimento de estimativas e planejamento e desenvolvi-
mento tanto de produtos quanto de procedimentos.
A Estat´ıstica e´ usada em va´rios sentidos. Pode referir-se na˜o so´ a simples tabulac¸a˜o de
informac¸o˜es nume´ricas, como a relato´rios de transac¸o˜es na bolsa de valores, como ao corpo de
te´cnicas utilizadas para processar ou analisar dados. A palavra Estat´ıstica e´ de origem grega
statisto´s que significa estabelecer ou verificar. Este ramo da cieˆncia tambe´m pode ser definido
como a parte da matema´tica em que se investigam os processos de obtenc¸a˜o, organizac¸a˜o e ana´lise
de dados sobre determinada populac¸a˜o ou amostra e os me´todos de obtenc¸a˜o de concluso˜es, fazer
infereˆncia, ilac¸o˜es ou predic¸o˜es com base nesses dados.
Nas u´ltimas de´cadas teˆm ocorrido um crescimento acentuado do uso das te´cnicas estat´ısticas,
uma vez que atrave´s delas e´ poss´ıvel estudar fenoˆmenos e prever alguns resultados, e ainda e´
poss´ıvel melhorar ı´ndices.
A esseˆncia de uma ana´lise estat´ıstica e´ tirar concluso˜es sobre uma populac¸a˜o, ou
universo, com base em uma amostra de observac¸o˜es.
1.2 Pesquisas, dados, variabilidade e estat´ıstica
Normalmente Estat´ıstica esta´ associado a nu´meros, tabelas e nu´meros, mas a importaˆncia da
Estat´ıstica fica melhor representada por dois ingredientes comuns: dados e variabilidade.
Para o engenheiro conhecer as propriedades f´ısicas de um novo material, tais como dureza,
1
flexibilidade, densidade, porosidade, entre outros pode ser fatores que podera˜o por a casa a pique!
Em geral, a busca por melhorias na qualidade de um processo produtivo implica a reduc¸a˜o
da variabilidade. A variabilidade pode ser reduzida com investimentos em pessoal, ma´quinas
e tecnologia, mas muitas vezes ela pode ser acomodada com o conhecimento de relac¸o˜es entre
fatores do processo e caracter´ısticas funcionais do produto, o que envolve conhecimentos de
engenharia, pesquisas, dados e ana´lises estat´ısticas.
1.3 A Estat´ıstica na Engenharia
Logo apo´s a Revoluc¸a˜o Industrial, me´todos estat´ısticos foram incorporados nos processos
industriais para garantir a qualidade dos produtos. Amostras de itens produzidos eram avaliadas
sistematicamente para inferir se o processo estava sob controle. Mais recentemente, a avaliac¸a˜o
da qualidade passou a ser feita ao longo do processo produtivo como forma de corrigir eventuais
falhas no sistema assim que elas aparecessem. Isso levou a um aumento da qualidade do produto
final e reduc¸a˜o de custos, pois se reduziriam drasticamente as perdas por defeitos.
Ale´m do acompanhamento estat´ıstico da qualidade, as indu´strias costumam fazer experimen-
tos estatisticamente planejados para encontrar a combinac¸a˜o dos n´ıveis dos fatores do processo
que levem a melhor qualidade poss´ıvel. Na outra ponta, as empresas levantam dados de amostras
de consumidores para realizar pesquisas de marketing direcionadas ou para adequar os produ-
tos aos clientes. O planejamento dessas amostras e a ana´lise dos dados necessitam de te´cnicas
estat´ısticas.
Muitas vezes, a relac¸a˜o entre estat´ıstica e engenharia e´ ainda mais estreita. Os pro´prios
me´todos de engenharia costumam incorporar intrinsecamente procedimentos probabil´ısticos ou
estat´ısticos.
2
A Estat´ıstica pode ser dividida em 4 grandes grupos:
1. Amostragem: subconjuntos com as mesmas caracter´ısticas da populac¸a˜o, usada em quase
tudo na Estat´ıstica;
2. Estat´ıstica Descritiva: descreve e organiza os dados atrave´s de tabelas, gra´ficos e nu´meros
ı´ndices;
3. Probabilidade: estudo de fenoˆmenos aleato´rios que ocorrem ao acaso (incerteza);
4. Infereˆncia Estat´ıstica: ferramentas para tomadas de decisa˜o acerca da populac¸a˜o (Testes
de hipo´teses, Intervalos de confianc¸a, ANOVA).
1.4 Estat´ıstica descritiva e infereˆncia estat´ıstica
Os governos veˆm, de longa data, utilizando recenceamentos como forma de contar indiv´ıduos e
propriedades, e o escopo de descrever, resumir e analisar dados de censos levou ao desenvolvi-
mento de me´todos que consistem o que se chama estat´ıstica descritiva, que compreende o
manejo dos dados para resumi-los ou descreveˆ-los, sem ir ale´m, isto e´, sem fazer nenhuma in-
fereˆncia. Por exemplo, se os testes feitos em um laborato´rio mostraram que um determinado
metal atinge de 0 a 60 graus em
18, 7 19, 2 16, 2 12, 3 17, 5 13, 9
minutos, afirmamos que a metade deles atinge 60 graus em 16,3 minutos, esta e´ uma caracter´ıstica
da estat´ıstica descritiva.
Embora a estat´ıstica descritiva seja um ramo importante da estat´ıstica as informac¸o˜es es-
tat´ısticas quase sempre sa˜o obtidas de amostras, e isto significa que sua ana´lise exige general-
izac¸o˜es que ultrapassam os dados. Assim, a infereˆncia estat´ıstica teˆm sido muito utilizada, e
seus me´todos teˆm apresentados resultados interessantes.
Os me´todos da infereˆncia estat´ıstica permitem prever a durac¸a˜o me´dia da vida u´til de uma
calculadora manual, estimar o valor de consumo de a´gua do ano de 2010, comparar eficieˆncia
de dois programas de dieta, determinar a dosagem ideal para determinado medicamento, entre
va´rias coisas.
1.5 Populac¸a˜o e amostra
Define-se populac¸a˜o como um conjunto de elementos que possuem caracter´ısticas similares.
3
Amostra pode ser definida como uma parte da populac¸a˜o, um subconjunto, ou ainda um
fragmento ou exemplar representativo da populac¸a˜o. Geralmente, e´ a partir deste subconjunto
da populac¸a˜o que se estabelecem ou estimam as propriedades e caracter´ısticas dessa populac¸a˜o.
Na maioria dos casos, os pesquisadores fazem uso de amostras com o objetivo de descrever e
fazer infereˆncias na populac¸a˜o.
1.6 Natureza dos dados
Os dados estat´ısticos constituem a mate´ria-prima das pesquisas estat´ısticas, e nada mais sa˜o do
que informac¸o˜es sobre fatos observados. Podem ser pesos de animais, medidas de caracter´ısticas
pessoais ou intensidade de terremotos, podem ser simples respostas (sim ou na˜o, solteiro ou
casado, defeituoso ou perfeito), este tipo de dados sa˜o chamados de dados catego´ricos (qualitativos
ou descritivos). Estes dados podem ser associados com nu´meros (0 ou 1), ou seja, sa˜o nume´ricos
apenas na apareˆncia, da´ı recebem a nomenclatura de dados nominais. E, os dados quantitativos,
que representam uma quantidade, sa˜o nu´meros e a partir deles podem-se fazer va´rios estudos
(nu´meros de filhos numa famı´lia, temperatura de determinado metal, ı´ndice de inflac¸a˜o).
Principalmente em pesquisas sociais, o analista se defronta com situac¸o˜es em que dispo˜e de
muitos dados, e e´ dif´ıcil absorver as informac¸o˜es que procura investigar, e portanto e´ dif´ıcil captar
intuitivamente todas as informac¸o˜es que os dados conte´m.
4
E´ necessa´rio reduzir as informac¸o˜es ate´ o ponto que elas possam ser interpretadas com clareza,
isto e´, resumi-las atrave´s de medidas-s´ınteses, comumente chamadas de estat´ısticas descritivas.
Assim, uma estat´ısitca descritiva e´ um nu´mero que descreve sozinho uma caracter´ıstica de um
conjunto de dados.
As pessoas normalmente se lembram da estat´ıstica quando se veˆem diante de grandes quan-
tidades de informac¸a˜o. Na percepc¸a˜o do senso comum, o emprego de me´todos estat´ısticos seria
algo semelhante a` pra´tica da minerac¸a˜o. Um estat´ıstico seria um tipo de minerador bem suce-
dido, capaz de explorar e processar montanhas de nu´meros e delas extrair valiosas concluso˜es.
Entretanto, a atividade estat´ıstica mais importante na˜o e´ a ana´lise de dados, e sim o planeja-
mento dos experimentos emque os dados devem ser obtidos. Quando isso na˜o for feito da forma
apropriada, o resultado muitas vezes e´ uma montanha de nu´meros este´reis, da qual estat´ıstico
algum conseguiria quaisquer concluso˜es.
Para tal, devemos projetar o planejamento de forma que ele seja capaz de fornecer exatamente
o tipo de informac¸a˜o que procuramos. Quando se pretende fazer um estudo estat´ıstico completo,
existem va´rias faces do trabalho que devem ser observadas:
1. definic¸a˜o do problema: definic¸a˜o ou formulac¸a˜o correta do problema a ser estudado;
2. planejamento: determinac¸a˜o do procedimento necessa´rio para resolver o problema, espe-
cialmente em como levantar informac¸o˜es sobre o objeto de estudo;
3. coleta de dados: obtenc¸a˜o, reunia˜o e registro sistema´tico de dados;
4. operac¸a˜o dos dados: sumarizac¸a˜o, consiste em resumir os dados atrave´s de sua contagem
e agrupamento;
5. apresentac¸a˜o dos dados: pode ser em forma de tabelas ou gra´ficos;
6. ana´lise e interpretac¸a˜o dos dados: mais importante e mais delicada fase, consiste em
tirar concluso˜es que auxiliem o pesquisador a resolver seu problema e propor medidas que
solucionem o mesmo.
1.7 Amostragem
A Estat´ıstica lida na˜o somente com a organizac¸a˜o e ana´lise de dados depois de sua coleta, como
tambe´m com o desenvolvimento de te´cnicas de coleta (Amostragem).
5
Na˜o basta saber descrever os dados convenientemente e dominar as te´cnicas estat´ısticas as-
sociadas para tal. Antes de tudo, e´ preciso garantir que a amostra ou amostras que sera˜o usadas
sejam obtidas de maneira adequada, para evitar que erros grosseiros acontec¸am e leve a perder
os resultados.
E´ de suma importaˆncia que os dados sejam de uma amostra representativa da populac¸a˜o, ou
seja, a amostra deve manter as caracter´ısticas principais da populac¸a˜o. Para tal, assumiremos
que a populac¸a˜o seja finita e composta de N elementos, salvo quando explicitamos o contra´rio.
O nu´mero de elementos que sera˜o amostrados sera´ representado por n.
Os problemas de amostragem podem ser de dif´ıcil entendimento dependendo do que se deseja
estudar em uma populac¸a˜o. Por exemplo, em pesquisas de opinia˜o ha´ uma grande complexidade
de coleta de dados, e, em tais casos e´ necessa´rio maiores cuidados.
Distinguem-se dois tipos de amostragem: (1) Amostragem probabil´ıstica: quando todos os ele-
mentos da populac¸a˜o tem probabilidades conhecidas, e diferente de zero, de pertencer a` amostra.
(2) Em caso contra´rio, a amostragem e´ dita ser na˜o-probabil´ıstica.
1.8 Amostragem probabil´ıstica
Desta maneira, a amostragem probabil´ıstica implica um sorteio com regras bem determinadas,
cuja realizac¸a˜o so´ e´ poss´ıvel se a populac¸a˜o e´ finita e totalmente acess´ıvel.
A amostragem probabil´ıstica e´ a melhor recomendac¸a˜o que se deve fazer no sentido de garantir
a representatividade da amostra, pois o acaso sera´ o u´nico responsa´vel por eventuais discrepaˆncias
entre populac¸a˜o e amostra.
Ale´m disso, as amostragens probabil´ısticas sa˜o particularmente importantes nos processos de
infereˆncia, pois os me´todos estat´ısticos sa˜o constru´ıdos sob suas propriedades. Descreveremos a
seguir alguns tipos de amostragens probabil´ısticas.
1.8.1 Amostragem casual simples
Tambe´m conhecida como simples ao acaso, aleato´ria, casual, simples, elementar, randoˆmica,
e´ equivalente a um sorteio lote´rico. Nela, todos os elementos da populac¸a˜o teˆm igual
probabilidade de pertencer a` amostra.
Sendo N o nu´mero de elementos da populac¸a˜o e n o nu´mero de elementos da amostra, cada
elemento da populac¸a˜o tem probabilidade n
N
de pertencer a` amostra ( considernado-se amostras
6
sem reposic¸a˜o).
E´ a te´cnica amostral mais utilizada em pesquisas. Na pra´tica, enumera-se os elementos da
populac¸a˜o de 1 a N , e sorteia-se, a seguir, por meio de um dispositivo aleato´rio qualquer, n
nu´meros da sequeˆncia, estes nu´meros compora˜o a amostra.
A selec¸a˜o de uma amostra aleato´ria simples pode ser facilitada com o uso de nu´meros
aleato´rios, ou seja, nu´meros resultantes de sucessivos sorteios aleato´rios do conjunto {1, 2, 3, · · · , 9}
fazendo com que todo nu´mero com mesma quantidade de algarismos tenha a mesma probabili-
dade de ocorreˆncia.
1.8.2 Amostragem sistema´tica
Quando os elementos da populac¸a˜o se apresentam ordenados e a retirada dos elementos da
amostra e´ feita periodicamente, temos uma amostragem sistema´tica.
Assim:
7
1. calcula-se o intervalo de selec¸a˜o, dado por I = N/n, desprezando as decimais;
2. sorteia-se o primeiro elemento do conjunto {1, 2, · · · , I}; e
3. completa-se a amostra, extraindo um elemento a cada I elementos.
Por exemplo, em uma linha de produc¸a˜o onde sa˜o produzidos 300 itens por dia, uma amostra
sistema´tica de tamanho 10, deve escolher elementos de cada 30 itens produzidos.
Ou ainda, seja N = 800 e n = 50, supondo a populac¸a˜o ordenada, a amostra sistema´tica e´
composta pelos elementos de posic¸a˜o mu´ltipla de 16 (800
50
= 16)!!!
A principal vantagem da amostragem sistema´tica esta´ na grande facilidade de coleta, en-
tretanto existe um grande perigo: pois se existem ciclos de variac¸a˜o da varia´vel de interesse, a
amostra sistema´tica contera´ a caracter´ıstica do ciclo; especialmente se o per´ıdo coincidir com a
retirada do elemento.
1.8.3 Amostragem Estratificada
Muitas vezes a populac¸a˜o se divide em subpopulac¸o˜es ou estratos, com caracter´ısticas comuns
em cada estrato, e diferente de estrato para estrato. E pode ocorrer que os estratos na˜o sejam
bem representados na amostra simples, por exemplo, pois os tamanhos dos estratos diferem.
Por exemplo, se para estudar a dureza de certo ac¸o temos corpos de prova de dois fornecedores,
enta˜o a populac¸a˜o dos corpos de prova pode ser dividida em dois estratos. Sob os diversos estratos
da populac¸a˜o sa˜o realizadas selec¸o˜es aleato´rias de forma independente. A amostra completa e´
obtida atrave´s da agregac¸a˜o das amostras de cada estrato.
Amostragem estratificada proporcional: a proporcionalidade do tamanho de cada estrato da
populac¸a˜o e´ mantida na amostra. Por exemplo, se um estrato abrange 20% da populac¸a˜o, ele
tambe´m deve abranger 20% da amostra.
Amostragem estratificada uniforme: selecionamos o mesmo nu´mero de elementos em cada
estrato. E´ o processo usual quando se deseja comparar os diversos estratos.
Exemplo: considere uma populac¸a˜o de tamanho 100, onde existem 4 estratos, com 50, 25,
10 e 15 elementos cada um. Extraia uma amostra estratificada proporcional de tamanho 10.
8
1.8.4 Amostragem por meio de conglomerados
Ao contra´rio da amostragem estratificada, a amostragem de conglomerados tende a produzir
uma amostra que gera resultados menos precisos, quando comparada com uma amostra aleato´ria
simples de mesmo tamanho. Contudo, seu custo financeiro tende a ser bem menor, especialmente
em amostragens de grandes populac¸o˜es.
Quando a populac¸a˜o apresenta uma subdivisa˜o por meio de pequenos grupos, chamados de
conglomerados, e´ poss´ıvel - e conveniente - fazer-se a amostragem por conglomerados, que consiste
em sortear um nu´mero suficiente de conglomerados, cujos elementos construira˜o a amostra.
Ou seja, as unidades de amostragem, sobre as quais e´ feito o sorteio, passam a ser os con-
glomerados, e na˜o mais os elementos individuais da populac¸a˜o.
1.9 Amostragem na˜o-probabil´ıstica
As amostras na˜o-probabil´ısticas sa˜o tambe´m, muitas vezes, empregadas na estat´ıstica, por sim-
plicidade ou inacessibilidade de toda a populac¸a˜o.
Nestes casos, supo˜e-se um tamanho amostral e usa-o para coletar as amostras.
Pode-se ainda, “tentar” fazer um sorteio aleato´rio (amostragem a esmo). Por exemplo de
1000 parafusos, realizar uma amostrade tamanho 10. Tomam-se 10 destes parafusos.
E ainda, pode-se fazer uma amostragem intecional, quando o pesquisador deseja que deter-
minado elemento fac¸a parte de sua amostra, logo ele o escolhe intencionalmente. E´ o que ocorre
com os convocados a depor a favor de um re´u, por um advogado perante um tribunal.
1.10 Exerc´ıcios
1. Uma populac¸a˜o de 1000 elementos foi dividida em 3 estratos, sendo um com 100 elementos
(E1), outro com 300 elementos (E2) e o u´ltimo com 600 elementos (E3). Pretende-se retirar
uma amostra de 60 elementos para uma pesquisa, qual deve ser o tamanho da amostra em
cada estrato?
2. Selecione 8 alunos da populac¸a˜o listada abaixo, atrave´s de amostragem casual simples,
usando um dispositivo de sorteio aleato´rio.
9
Nu´mero Nome Notas Nu´mero Nome Notas
1 Alysson 5,8 19 Isabela 7,0
2 Amanda 7,3 20 Jessica 2,1
3 Anderson 2,1 21 Jhonatan 3,9
4 Angela 7,5 22 Joa˜o Guilherme 5,6
5 Arthur 8,2 23 Jose´ Alfredo 7,8
6 Artur 4,3 24 Kaio 6,5
7 Camila 5,6 25 Leandro 4,6
8 Cayo 6,6 26 Let´ıcia 7,8
9 Cesar 5,4 27 Lucas 4,9
10 Cezar 7,8 28 Maicon 6,5
11 Daniel 9,5 29 Maresa 4,5
12 Fabio 3,2 30 Maria Isabella 6,7
13 Fagner 4,0 31 Maur´ıcio Andrei 5,5
14 Gabriela 3,7 32 Nathan 5,4
15 Glo´ria 8,4 33 Ricardo 0,3
16 Gryele 6,5 34 Thais 1,3
17 Herily 3,4 35 Thayse 2,5
18 Igor 6,7 36 Valeria 5,8
3. Selecione uma amostra estratificada uniforme, de tamanho n = 6 do exerc´ıcio 1.
4. Seja um conjunto de 20 corpos de prova numerados de 1 a 20. Usando uma tabela de
nu´meros aleato´rios, divida aleatoriamente esses corpos de prova em dois grupos de dez
elementos.
5. Selecione uma amostra estratificada proporcional, de tamanho n = 4 para os grupos do
exerc´ıcio anterior.
6. Identifique o tipo de amostragem utilizado.
(a) Ao escalar um ju´ri um tribunal de justic¸a decidiu selecionar aleatoriamente 4 pessoas
brancas, 3 morenas, e 4 negras.
(b) Um cabo eleitoral escreve o nome de cada senador do Brasil, em carto˜es separados,
mistura e extra´ı 10 nomes.
(c) Um administrador hospitalar faz uma pesquisa com as pessoas que esta˜o na fila de
espera para serem atendidas pelo sistema SUS, entrevistando uma a cada 10 pessoas
da fila.
7. Explique o procedimento que pode ser usado para obter uma amostra aleato´ria simples de
10 servidores da UTFPR que possui 245 servidores.
10
8. No problema anterior, explique a maneira de obter uma amostra sistema´tica.
9. No problema anterior, explique a maneira de obter uma amostra estratificada, considerando
faixa de idade como estrato.
10. Descreva o tipo de estratificac¸a˜o que pode ser usado para estudar falta a`s aulas de Proba-
bilidade e Estat´ıstica.
11. Com o objetivo de fazer testes de qualidade com determinados produtos de uma indu´stria
optou-se por realizar um levantamento por amostragem. A populac¸a˜o e´ constitu´ıda por:
produto A: A1, A2, A3, A4, A5, A6, A7, A8, A9, A10
produto B: B1, B2, B3, B4, B5, B6, B7, B8, B9, B10
produto C: C1, C2, C3, C4, C5, C6, C7, C8, C9, C10,
C11, C12, C13, C14, C15, C16, C17, C18, C19, C20,
C21, C22, C23, C24, C25, C26, C27, C28, C29, C30
Realizar uma amostragem aleato´ria estratificada proporcional por produto para obter uma
amostra global de tamanho 10.
11
Cap´ıtulo 2
Ana´lise Explorato´ria de dados
Com o advento da informa´tica, o mundo encheu-se de dados. As empresas tem dados de suas
atividades, de seus funciona´rios, de seus clientes, etc. Mas para que estes dados sejam informa-
tivos, necessitamos organiza´-los de forma adequada. Este e´ o papel da estat´ıstica descritiva.
Na ana´lise explorato´ria dos dados, ale´m de descrever os dados, buscamos conhecer algumas
caracter´ısticas do processo, com base nos dados. Com o uso adequado de tabelas, gra´ficos e
medidas, podemos descobrir certas estruturas que na˜o eram evidentes nos dados brutos.
2.1 Organizac¸a˜o e apresentac¸a˜o de dados
No dia-a-dia nos deparamos com varia´veis qualitativas e varia´veis quantitativas, estas u´ltimas
podendo ser cont´ınuas (idade, peso, diaˆmetro) ou discretas (n. de filhos, n. de defeitos por
unidade). O me´todo mais comum de resumir dados consiste em apresenta´-los em forma conden-
sada de tabelas ou gra´ficos.
Suponha o banco de dados abaixo, que sa˜o notas de um teste de coordenac¸a˜o f´ısica aplicado
12
a 20 estudantes, apo´s terem ingerido uma quantidade de a´lcool igual a 10% de seu peso:
69 84 52 93 61 74 79 65 88 63
57 64 67 72 74 55 82 61 68 77
Pergunta: O que podemos fazer para tornar esta massa de informac¸a˜o mais utiliza´vel???
1. alguns autores acham interessante calcular valores extremos;
2. algumas vezes e´ interessante ordenar os dados, ou seja criar um rol de dados;
3. entretanto, para um banco grande de dados, a ordenac¸a˜o e´ uma tarefa bastante dif´ıcil. E´
conveniente enta˜o usar a te´cnica de apresentac¸a˜o em ramo-e-folhas que oferece uma boa
visualizac¸a˜o global dos dados.
Para tal, decompomos os algarismos em dezenas e unidades, marcando junto valores com
mesmas dezenas. As dezenas ficam alinhadas a esquerda, e as unidades a` direita. Cada
linha representa a posic¸a˜o de um ramo e cada algarismo a` direita da reta vertical pode ser
considerado como uma folha;
4. Distribuic¸a˜o de frequ¨eˆncias, seja a tabela que representa a quantidade (em toneladas) de
o´xido de enxofre emitidas por uma indu´stria em 80 dias:
Toneladas de oxido de enxofre frequ¨eˆncia
5,0 ⊢ 9,0 3
9,0⊢ 13,0 10
13,0⊢ 17,0 14
17,0⊢ 21,0 25
21,0⊢ 25,0 17
25,0⊢ 29,0 9
29,0⊢ 33 2
13
Esta tabela e´ chamada de distribuic¸a˜o de frequ¨eˆncia ou distribuic¸a˜o. Se os dados esta˜o
agrupados em categorias na˜o nume´ricas, a tabela se chama distribuic¸a˜o por categorias (ou
qualitativa), por exemplo, considere as 2439 queixas sobre caracter´ısticas de conforto nos
avio˜es de uma companhia ae´rea:
Natureza das reclamac¸o˜es n. de reclamac¸o˜es
espac¸o insuficiente para pernas 719
assentos desconforta´veis 914
corredores estreitos 146
espac¸o insuficiente p/ bagagem ma˜o 218
banheiros insuficientes 58
outras 384
E´ poss´ıvel transformar uma tabela como esta em uma distribuic¸a˜o nume´rica mediante
codificac¸a˜o dos dados, por exemplo, atribuindo a`s seis alternativas os nu´meros 1,2,3,4,5 e
6, mas isto nos daria dados nominais que sa˜o nume´ricos apenas em sentido trivial.
A construc¸a˜o de uma tabela de frequ¨eˆncia consiste essencialmente de treˆs etapas:
1. escolha das classes (intervalos ou categorias);
2. enquadramento dos dados nessa categoria;
3. contagem do nu´mero de elementos em cada classe.
A etapa mais dif´ıcil e´ a primeira, a saber, a escolha de uma classificac¸a˜o conveniente. Em
distribuic¸o˜es nume´ricas, consiste em decidir quantas classes utilizar e a amplitude de cada uma.
Esta escolha e´ puramente arbitra´ria, mas costuma-se observar:
1. raramente usam-se menos de seis classes ou mais de quinze classes. O nu´mero exato depende
de cada situac¸a˜o;
2. ter certeza que cada elemento se enquadra em uma e somente uma classe;
3. sempre que poss´ıvel, as classes devem ter amplitudes iguais, geralmente sa˜o mu´ltiplos de
5;
Um crite´rio utilizado na determinac¸a˜o do nu´mero de classes k e´ atrave´s da fo´rmula emp´ırica
de Sturges:
k = 1 + 3, 32logn
14
onde n representa o total de observac¸o˜es.
A amplitude (h) de cada classe sera´ dada por
h =
a
k
onde a representa a amplitude total das observac¸o˜es, definida como a diferenc¸a entre o maior e
o menor valores observados.
Exemplo: (a) Construa uma distribuic¸a˜o para as seguintes notas obtidas por 40 estudantes
em um teste.
75 89 66 52 90 68 83 94 77 60 38 47 87 65 97 49 65 72
73 81 63 77 91 88 74 37 85 76 74 63 69 72 31 87 76 58
63 70 72 65
(b) Construa a tabela de frequeˆncias relativas;
(c) Construa atabela de frequeˆncias acumuladas;
15
(d)Construa a tabela de frequeˆncias acumladas relativas;
2.2 Apresentac¸o˜es gra´ficas
Quando as distribuic¸o˜es de frequ¨eˆncia teˆm como principal objetivo condensar grandes conjuntos
de dados em uma forma fa´cil de assimilar, e´ melhor apresentar essas distribuic¸o˜es graficamente.
Uma figura fala mais alto que mil palavras!
Para as distribuic¸o˜es de frequ¨eˆncia, a forma mais comum de apresentac¸a˜o gra´fica e´ o his-
tograma. Um histograma e´ constru´ıdo, representando-se as medidas ou observac¸o˜es que sa˜o
agrupadas em uma escala horizontal, e as frequ¨eˆncias de classe em uma escala vertical; trac¸am-se
enta˜o retaˆngulos, cujas bases sa˜o iguais aos intervalos de classe e cujas alturas sa˜o as frequ¨eˆncias
de classe correspondentes. As marcac¸o˜es na escala horizontal de um histograma podem ser os
pontos me´dios, os limites de classe, as fronteiras de classe ou outros valores ba´sicos arbitra´rios.
Obs.: os retaˆngulos de um histograma va˜o de uma fronteira de classe ate´ a pro´xima. Na˜o e´
poss´ıvel trac¸ar histogramas de distribuic¸o˜es com classes abertas; exige-se, outrossim, cuidado
especial quando os intervalos de classe na˜o sa˜o todos iguais.
Exemplo: Construa o histograma do exemplo de toneladas de o´xido de enxofre emitidas por
uma indu´stria em 80 dias!!!
16
Ana´logos aos histogramas sa˜o os gra´ficos de barras. As alturas dos retaˆngulos, ou barras,
representam as frequ¨eˆncias de classe como em um histograma, mas na˜o se tem necessariamente
em vista uma escala horizontal cont´ınua.
Outra forma, na˜o tanto utilizada, e´ o pol´ıgono de frequ¨eˆncia. Aqui, as frequ¨eˆncias de classe
sa˜o marcadas nos pontos me´dios, e os valores sucessivos sa˜o unidos por segmentos retil´ıneos. Se
faz necessa´rio acrescentar classes com frequ¨eˆncia zero em ambos os extremos da distribuic¸a˜o para
ligar o gra´fico a` escala horizontal.
Aplicando a uma distribuic¸a˜o cumulativa te´cnica ideˆntica, obtemos a chamada ogiva. Em
17
uma ogiva, entretanto, as frequ¨eˆncias sa˜o acumuladas sa˜o marcadas nas fronteiras de classe, e
na˜o nos pontos me´dios.
Embora o aspecto visual dos histogramas, gra´ficos em barras, pol´ıgonos de frequ¨eˆncia e ogivas
constitua acentuada melhoria sobre as simples tabelas, ha´ va´rias maneiras em que as distribuic¸o˜es
podem ser apresentadas de forma ainda mais eficiente. Duas formas, bastante utilizada por
jornais e revistas, sa˜o o pictograma e o gra´fico de setores, conhecido tambe´m como gra´fico
de pizza.
Para construir um gra´fico de setor, comec¸amos por converter a distribuic¸a˜o em uma dis-
tribuic¸a˜o percentual. Como um c´ırculo completo corresponde a 360 graus, obtemos os aˆngulos
centrais dos diversos setores multiplicando as percentagens por 360. Existem bastante variac¸o˜es
destes gra´ficos. Um aspecto negativo neste tipo de gra´fico e´ que ele e´ de dif´ıcil comparac¸a˜o com
outros, o que na˜o ocorre com os histogramas.
E, informac¸o˜es nume´ricas podem ser resumidas atrave´s de mapas, que podem ser feitos
somente com auxilio de programas gra´ficos.
2.3 Medidas descritivas
Quando analisamos uma varia´vel qualitativa, basicamente constru´ımos sua distribuic¸a˜o de frequeˆncias.
No entanto, ao explorarmos varia´veis quantitativas, temos condic¸o˜es de empregar algumas me-
18
didas descritivas, que sintetizam as caracter´ısticas da distribuic¸a˜o. Vamos falar de medidas de
tendeˆncia central e de dispersa˜o.
2.3.1 Medidas de tendeˆncia central
1. Me´dia aritme´tica
O conceito de me´dia e´ bastante familiar. Seja (x1, x2, · · · , xn) uma amostra de n observac¸o˜es
de certa varia´vel aleato´ria X. A me´dia aritme´tica dessas observac¸o˜es e´ definida por:
x¯ =
x1 + x2 + · · ·+ xn
n
=
∑n
i=1 xi
n
A me´dia resume os dados de forma a torna´-los mais informativos.
Exemplo 1: Em 12 dias anotou-se o nu´mero de chamadas telefoˆnicas: 4, 3, 5, 5, 10, 8, 9, 6, 3, 4, 8, 7
Calcule a me´dia das chamadas por dia.
Exemplo 2: Um gerente de supermercado, que deseja estudar a movimentac¸a˜o de pessoas
em seu estabelecimento, constata que 295, 1002, 941, 768, 1283 pessoas entraram na loja
nos u´ltimos 5 dias. Deˆ o nu´mero me´dio de pessoas na loja.
Exemplo 3: Se o sala´rio me´dio anual pago aos treˆs administradores de uma firma e´
R$156000, 00. Algum deles pode receber um sala´rio anual superior a R$500000, 00?
Propriedades da me´dia
(a) a me´dia sempre pode ser calculada;
(b) a me´dia e´ u´nica;
(c) leva em conta todos os valores do banco de dados;
Exemplo 4: As idades de 6 alunos sa˜o: 18, 19, 20, 17, 19, 18 e a idade do professor deles e´
50. Deˆ a me´dia das 7 pessoas.
Estranho na˜o???? Para evitar estes problemas usa-se outra medida de localizac¸a˜o central:
19
2. Mediana
E´ a medida do elemento do meio se n e´ ı´mpar, ou a me´dia dos elementos centrais se n e´
par:
Me =
{
x(n+1
2
), se n impar;
x(n2 )
+x(n2 +1)
2
, se n par.
Nota: Para calcular a mediana e´ necessa´rio que os dados estejam ordenados!!!
Exemplo 1: Sejam os litros de vaza˜o de torneiras por uma hora:
53, 31, 67, 53, 36
Encontre a mediana.
Exemplo 2: Considere o nu´mero de pessoas que frequeˆntam certa disciplina de uma insti-
tuic¸a˜o:
40, 32, 37, 30, 24, 40, 38, 35, 40, 28, 32, 37
Deˆ a mediana.
3. Quantis
A mediana tambe´m e´ conhecida como segundo quartil, e e´ um quantil dentre va´rios exis-
tentes. Por exemplo: os quartis, os decis e os percentis, que dividem o banco de dados em
4, 10 e 100 partes, respectivamente.
O processo de ca´lculo consiste em repetir o mesmo procedimento de ca´lculo para a mediana.
Exemplo 1: Os registros de uma biblioteca mostram que 22 alunos do ensino me´dio con-
sultaram os seguintes nu´meros de livros durante o u´ltimo ano:
62, 73, 40, 72, 79, 88, 35, 51, 48, 42, 75
65, 69, 82, 50, 66, 103, 68, 54, 38, 52, 72
Ache a mediana, Q1 e Q3.
20
Exemplo 2: Ao testarem um novo sistema de coleta de res´ıduos sanita´rios, engenheiros
constataram que 21 resideˆncias despejavam os seguintes litros por uma hora:
69 58 70 80 46 61 65 74 75 55 67
56 70 72 61 66 58 68 70 68 58
Determine a mediana e os quartis.
4. Moda
A moda de um conjunto de dados e´ o nu´mero que teve maior nu´mero de repetic¸o˜es.
Quando na˜o ha´ nu´mero que mais repete, dizemos que o conjunto e´ amodal. Se houverem
dois valores com iguais sequeˆncias, o conjunto e´ bimodal. E se houverem va´rios nu´meros,
dizemos que e´ um conjunto multimodal.
Exemplo 1: Encontre a moda do conjunto de dados de res´ıduos sanita´rios.
5. Me´dia para dados agrupados
Quando os dados sa˜o apresentados em uma distribuic¸a˜o de frequeˆncias, todos os valores
inclu´ıdos num certo intervalo de classe sa˜o considerados coincidentes com o ponto me´dio
do intervalo. Desta maneira:
x =
∑n
i=1 fixi
n
onde: fi e´ a frequeˆncia de cada classe; e xi e´ o ponto me´dio de cada classe.
Exemplo 1: Calcular a me´dia dos dados da distribuic¸a˜o de o´xido de enxofre.
Exemplo 2: Calcular a me´dia dos dados da distribuic¸a˜o de idade dos alunos.
6. Mediana para dados agrupados
21
No caso de dados agrupados em classes de frequeˆncias, a mediana pode ser calculada pela
expressa˜o (deduzida a partir do histograma de frequeˆncias)
Me = Li+
P −′ fa
fMe
h
onde: Li= e´ o limite inferior da classe mediana ( em uma distribuic¸a˜o de frequeˆncias
chama-se classe mediana a` classe que conte´m a mediana)
P = n/2 e´ a posic¸a˜o da classe mediana;
′fa e´ a frequeˆncia acumulada da classe vizinha anterior a` classe mediana;
fMe e´ a frequeˆncia da classe mediana;
h e´ a amplitude do intervalo da classe mediana;
Exemplo:
7. Moda para dados agrupados
No caso de dados agrupados em classes de frequeˆncias, a modapode ser calculada pela
expressa˜o (deduzida a partir do histograma de frequeˆncias)
Mo = Li+
f ′
′f + f ′
h
onde: Li e´ o limite inferior da classe modal (em uma distribuic¸a˜o de frequeˆncias chama-se
de classe modal a` classe de maior frequeˆncia);
′f e´ a frequeˆncia de classe imediatamente inferior a` classe modal;
f ′ e´ a frequeˆncia de classe imediatamente posterior a` classe modal;
h e´ a amplitude de intervalo de classe modal.
Exemplo:
22
2.3.2 Medidas de dispersa˜o
O que e´?
As medidas de tendeˆncia central informam apenas informac¸o˜es parciais sobre um conjunto
de dados, pois diferentes amostras podem ter a mesma me´dia, mas diferentes entre si.
1. Amplitude
A medida de dispersa˜o mais simples de uma amostra e´ a amplitude, que e´ a diferenc¸a entre
o maior e o menor valor da amostra.
Quanto maior a amplitude, sugere-se maior dispersa˜o dos dados, pois ha´ mais valores em
intervalos maiores.
2. Variaˆncia
A variaˆncia e´ a mais importante medida de dispersa˜o. Ela leva em conta os desvios em
relac¸a˜o a` me´dia, e´ definida como:
s2 =
∑n
i=1(xi − x)2
n− 1
Note que: quanto mais perto da me´dia forem os dados, menor sera´ a variaˆncia, uma vez
que os valores xi sera˜o mais parecidos com x. E vice-versa.
Propriedades:
1. A variaˆncia sempre e´ positiva, pois e´ uma soma de valores positivos: (x1− x)2 ≥ 0 para
qualquer que seja xi;
2. Se somarmos alguma constante c a todos os dados e calcularmos a variaˆncia esta na˜o
sera´ alterada;
3. Se multiplicarmos uma constante c por todos os dados, a variaˆncia ficara´ multiplicada
pelo quadrado desta constante.
3. Desvio padra˜o
A variaˆncia e´ uma medida cuja unidade de medida e´ unidades ao quadrado, isto dificulta
a sua comparac¸a˜o com os dados. Com o intuito de resolver este impasse, resolveu-se
estabelecer uma medida de dispersa˜o calculada na mesma unidade dos dados, por isto, o
desvio padra˜o e´ a raiz quadrada da variaˆncia:
s =
√∑n
i=1(xi − x)2
n− 1
23
4. Coeficiente de variac¸a˜o
O desvio padra˜o depende das unidades de medida dos dados, e isto e´ uma desvantagem.
Uma medida de variabilidade relativa que independe de unidades de medida e´ o coeficiente
de varic¸a˜o [CV (%)].
Ele expressa o desvio padra˜o como percentagem do que esta´ sendo medido:
CV (%) =
s
x
× 100%
Nota: quanto menor o valor do CV (%) menor e´ a variabilidade dos dados.
Exemplo 1: Da˜o-se, a seguir, os tempos (em segundos) de reac¸a˜o a um alarme de inceˆndio,
apo´s a liberac¸a˜o de fumac¸a:
12 9 11 7 9 14 6 10
Calcule a me´dia, a variaˆncia, o desvio padra˜o, a amplitude e o coeficiente de variac¸a˜o.
5. Variaˆncia para dados agrupados
Para dados agrupados usa-se a expressa˜o:
s2 =
∑n
i=1 fi(xi − x¯)2
n− 1
onde fi e´ a frequeˆncia de repetic¸a˜o de xi.
2.3.3 O diagrama de caixas
24
Uma forma de apresentar graficamente os conceitos discutidos e´ atrave´s do diagrama de
caixas ou Box-plot. Trata-se de um retaˆngulo que representa o desvio interquart´ılico. Esse
retaˆngulo representa, portanto, a faixa dos 50% dos valores mais t´ıpicos da distribuic¸a˜o. O
retaˆngulo e´ dividido no valor correspondente a` mediana; assim, ele indica o quartil inferior, a
mediana e o quartil superior. Entre os quartis e os extremos, sa˜o trac¸adas linhas. Caso existam
valores discrepantes (ale´m de 1, 5dq), a linha e´ trac¸ada ate´ o u´ltimo valor na˜o discrepante, e os
valores discrepantes sa˜o indicados por pontos. Eventuais pontos muito discrepantes (ale´m de
3dq) normalmente sa˜o representados por s´ımbolos diferentes para serem bem destacados.
Interpretando o diagrama de caixa
1. a caixa central inclui os 50% dos dados centrais;
2. os bigodes mostram a amplitude dos dados, isto e´, a diferenc¸a entre o maior e menor valores;
3. a simetria e´ indicada pela caixa e bigodes e pela localizac¸a˜o da me´dia;
4. e´ relativamente fa´cil comparar grupos, construindo diagramas de caixa lado a lado, con-
forme figura a seguir;
Em um Box-plot, para reconhecer simetria nos dados:
1. a distaˆncia de Q1 a` mediana e´ igual a` distaˆncia da mediana ate´ Q3;
2. a distaˆncia do valor mı´nimo ate´ Q1 e´ igual a distaˆncia do valor ma´ximo ate´ Q3;
25
3. a mediana e´ igual a me´dia.
Para reconhecer “outliers”:
1. a partir do valor mı´nimo, marque 3(Q3 − Q1), todos os valores a partir do mı´nimo e
3(Q3 −Q1) e´ um dado disperso;
2. idem para o ma´ximo.
Exemplo 1: Um artigo reportou dados sobre um experimento, investigando o efeito de
muitas varia´veis de processos na oxidac¸a˜o, em fase de vapor, e naftaleno. Uma amostra da
conversa˜o percentual molar de naftaleno em anidrido male´ico resulta em:
4, 2 4, 7 4, 7 5, 0 3, 8 3, 6 3, 0 5, 1 3, 1 3, 8
4, 8 4, 0 5, 2 4, 3 2, 8 2, 0 2, 8 3, 3 4, 8 5, 0
Exemplo 2: As nove medidas que seguem sa˜o temperaturas de fornalha, registradas em
bateladas sucessivas de um processo de fabricac¸a˜o de semicondutores (unidades em oF )
953 950 948 955 951 949 957 954 955
26
2.4 Exerc´ıcios
1. Da˜o-se a seguir as alturas, em cent´ımetros, de 16 alunos de curso secunda´rio:
172 182 177 174 166 158 170 178
163 161 191 167 171 201 166 172
Construa um ramo-e-folhas com os ramos rotulados 15,16,17,18,19 e 20.
2. As cifras abaixo representam os ganhos de 15 vendedores:
425 440 610 518 324 482 624 390
468 457 509 561 482 480 520
Construa um ramo-e-folhas com os ramos rotulados 3,4,5, e 6; utilize os algarismos das
dezenas como folhas.
3. Os pesos dos membros de um time universita´rio de futebol americano variam de 52 a 98.
Indique os limites de 6 classes em que esses pessos podem ser agrupados.
4. Da´-se, a seguir, a distribuic¸a˜o das massas de 125 espe´cimes de minerais coletados em uma
excursa˜o:
peso(gramas) nu´mero de espe´cimes
0,0⊢20,0 16
20,0⊢40,0 38
40,0⊢60,0 35
60,0⊢80,0 20
80,0⊢100,0 11
100,0⊢120,0 4
120,0⊢140,0 1
Se poss´ıvel, determine quantos espe´cimes pesam
(a) no ma´ximo 59,9 gramas;
(b) mais de 59,9 gramas;
(c) mais de 80,0 gramas;
(d) 80 gramas ou menos;
(e) exatamente 70 gramas;
27
(f) entre 60,0 e 100,0 gramas.
5. Da´-se abaixo a distribuic¸a˜o das faturas mensais de 200 clientes de uma loja de departa-
mentos
quantia(reais) frequ¨eˆncia
0,00⊢20,0 22
20,00⊢40,0 47
40,00⊢60,0 66
60,00⊢80,0 35
80,00⊢100,0 21
100,00⊢120,0 9
(a) fac¸a um histograma desta distribuic¸a˜o
(b) fac¸a um gra´fico em barras da distribuic¸a˜o.
6. Da´-se a seguir a distribiuc¸a˜o dos pesos de 150 pedras coletadas em um experimento sobre
rochas
(a) fac¸a um histograma desta distribuic¸a˜o
(b) trace um pol´ıgono de frequ¨eˆncia da mesma.
peso(gramas) frequ¨eˆncia
90⊢100 6
100⊢110 25
110⊢120 46
120⊢130 37
130⊢140 22
140⊢150 7
150⊢160 3
160⊢170 3
170⊢180 0
180⊢190 1
7. Converta a distribuic¸a˜o do exerc´ıcio anterior em uma distribuic¸a˜o cumulativa do tipo
“menos de” e trace uma ogiva.
8. Os sala´rios de quatro homens sa˜o: 1500, 00; 1800, 00; 1950, 00 e 9000, 00 reais. Determinar o
sala´rio me´dio destes homens. Poder-se-ia dizer que o sala´rio me´dio e´ t´ıpico para os sala´rios?
9. Entre 100 nu´meros, vinte sa˜o 4, quarenta sa˜o 5, trinta sa˜o sa˜o 6 e os restantes sa˜o 7.
Determinar a me´dia aritme´tica dos dados.
28
10. Calcule a me´dia, moda, mediana e variaˆncia dos dados:
Alturas (cm) frequ¨eˆncia
151⊢ 159 5
159⊢ 167 18
167⊢ 175 42
175⊢ 183 27
183⊢190 8
total 100
11. Os graus de um estudante em seis exames foram: 84, 91, 72, 68, 87 e 78. Determine a
mediana dos graus.
12. Se ha´ (a) 85 e (b) 150 nu´meros ordenados em rol, como se determinaria a mediana desses
nu´meros?
13. Determinar a me´dia, a mediana e a moda dos conjuntos de nu´meros:
(a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
(b) 51,6; 48,7; 50,3; 49,5; 48,9
14.Os nu´meros que seguem sa˜o as safras (em tabuleiros por acre) de passas secas ao sol durante
um per´ıodo de 10 anos:
715 825 640 900 790
965 895 700 915 945
Determine a amplitude, a variaˆncia, o desvio padra˜o, o coeficiente de variac¸a˜o.
15. Cada uma das listas a seguir conte´m apenas um valor que e´ diferente de todos os outros.
Calcule o desvio padra˜o de cada uma e fac¸a uma ana´lise dos resultados.
a. 6 6 6 10
b. 6 10 10 10
c. 20 20 20 24
d. 20 20 20 20 24
e. 20 20 20 20 20 24
16. Um dado foi lanc¸ado 50 vezes e foram registrados os seguintes resultados:
5 4 6 1 2 5 3 1 3 3 4 4 1 5 5 6 1 2 5 1 6 6 3 2 4
29
3 4 5 1 1 6 6 2 1 1 4 4 4 3 4 3 2 2 2 3 2 6 6 2 1
Construa uma distribuic¸a˜o de frequeˆncia sem intervalo e determine:
(a) A amplitude total R.50
(b) A frequeˆncia total R.50
(c) A frequeˆncia simples absoluta do primeiro elemento R.10
(d) A frequeˆncia simples relativa do primeiro elemento R.20%
(e) A frequeˆncia simples absoluta do segundo elemento R.9
(f) A frequeˆncia simples relativa do quinto elemento R.12%
(g) A frequeˆncia acumulada relativa do sexto elemento R.100%
17. Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 alunos das
Engenharias da UTFPR Campus Campo Moura˜o:
151 152 154 158 159 159 160 161 161 161
161 162 163 163 164 165 165 165 166 166
166 166 167 167 167 167 167 168 168 168
168 168 168 168 168 168 168 169 169 169
169 169 169 169 169 170 170 170 170 170
170 170 171 171 171 171 172 172 173 173
173 173 174 174 174 175 175 175 176 176
176 176 176 177 177 177 177 178 178 178
179 179 180 180 180 180 181 181 181 182
182 182 183 184 185 186 187 188 190 190
calcule:
(a) a amplitude amostral;
(b) o nu´mero de classes;
(c) a amplitude de classes;
(d) os limites de classes;
30
(e) as frequeˆncias absolutas das classes;
(f) as frequeˆncias relativas;
(g) os pontos me´dios das classes;
(h) as frequeˆncias acumuladas;
(i) o histograma e o pol´ıgono de frequeˆncia;
(j) a ogiva;
(k) fac¸a um breve comenta´rio sobre os valores das alturas desta amostra atrave´s da dis-
tribuic¸a˜o de frequeˆncia.
18. Considere a seguinte distribuic¸a˜o de frequeˆncia correspondente aos diferentes prec¸os de um
determinado produto em vinte lojas pesquisadas:
Prec¸os N. de lojas
50 2
51 5
52 6
53 6
54 1
Total 20
(a) Quantas lojas apresentam um prec¸o de 52, 00? R.2
(b) Construa a tabela de frequeˆncias simples relativas;
(c) Cosntrua a tabela de frequeˆncias absolutas acumuladas;
(d) Quantas lojas apresentaram um prec¸o de ate´ 52, 00 inclusive? R.13
(e) Qual o percentual de lojas com prec¸o maior do que 51, 00 e menor que 54, 00? R.6%
19. Numa empresa o sala´rio me´dio dos homens e´ de R$4000, 00 com um desvio padra˜o de
R$1500, 00, e o das mulheres e´ na me´dia de R$3000, 00 com desvio de R$1200, 00. Qual
dos sexos apresenta maior dispersa˜o? R.mulheres
20. Analisando as curvas abaixo marque a resposta correta
31
(a) a curva I e´ sime´trica - x¯ > med > mo;
(b) a curva II e´ assime´trica - mo > σ2 > x¯;
(c) a curva I e´ sime´trica - x¯ = med = mo;
(d) a curva III e´ sime´trica positiva - x¯ = med = mo
21. Na empresa Mercury Ltda foi observada a distribuic¸a˜o de funciona´rios do setor de servic¸os
gerais com relac¸a˜o ao sala´rio semanal, conforme mostra a distribuic¸a˜o de frequ¨eˆncias:
salario semanal (em dolares) fi
25 ⊢ 30 10
30 ⊢ 35 20
35 ⊢ 40 30
40 ⊢ 45 15
45 ⊢ 50 40
50 ⊢ 55 35
Total 150
Pede-se:
(a) sala´rio me´dio semanal dos funciona´rios
(b) desvio padra˜o, o coeficiente de variac¸a˜o e a moda dos sala´rios semanais dos funciona´rios
(c) Se o empresa´rio divide os funciona´rios em treˆs categorias, com relac¸a˜o ao sala´rio, de
sorte que: Os 25% menos produtivos sejam da categoria A; Os 25% seguintes sejam
da categoria B e Os 25% seguintes, isto e´, os mais produtivos, sejam da categoria C;
Pede-se determinar os limites dos sala´rios das categorias A,B e C
(d) Esboce o box-plot da distribuic¸a˜o e comente-o.
22. Uma distribuic¸a˜o sime´trica unimodal apresenta mediana igual a 36dm e coeficiente de
variac¸a˜o em torno de 20%. Determine a variaˆncia dessa distribuic¸a˜o.
32
Cap´ıtulo 3
Elementos de Probabilidade
3.1 Probabilidades
A maneira mais comum de medirmos as incertezas relacionadas com eventos (por exemplo,
resultado de um pleito eleitoral, resultados obtidos com a ingesta˜o de um novo medicamento)
consiste em atribuir-lhes probabilidades ou especificar as chances de ocorreˆncia do evento.
Dentre os diversos conceitos de probabilidade, o de maior aplicac¸a˜o e´ a interpretac¸a˜o frequen-
cial: A probabilidade de um evento e´ a proporc¸a˜o do nu´mero de vezes que eventos do mesmo tipo
ocorrem a longo prazo
3.2 Experimento aleato´rio
Um experimento e´ dito ser aleato´rio quando satisfaz a`s seguintes condic¸o˜es:
1. pode ser repetido indefinidamente;
2. somos capazes de descrever todos os poss´ıveis resultados do experimento, embora na˜o
sejamos capazes de predizer, com certeza, qual ocorrera´;
3. obedece a` regularidade estat´ıstica, ou seja, quando o experimento for repetido um grande
nu´mero de vezes, surgira´ uma configurac¸a˜o definida;
3.3 Espac¸o amostral
E´ o conjunto S de todos os resultados poss´ıveis de um experimento aleato´rio. Cada resultado do
experimento aleato´rio e´ denominado ponto amostral.
33
Exemplo: Lanc¸ar um dado honesto e observar o resultado obtido; Contar o nu´mero de dias
que choveu durante certo meˆs em certa cidade. O nu´mero de mensagens que sa˜o transmitidas
corretamente por dia em uma rede de computadores.
O espac¸o amostral pode ser:
1. Finito: formado por um nu´mero limitado de resultados poss´ıveis.
2. Infinito enumera´vel: formado por um nu´mero infinito de resultados, os quais podem ser
listados.
1. Infinito: formado por intervalos de nu´meros reais.
Definic¸a˜o: Um espac¸o amostral e´ dito discreto quando for finito ou infinito enumera´vel; e´
dito cont´ınuo quando for infinito, formado por intervalos de nu´meros reais.
3.4 Evento
E´ qualquer subconjunto do espac¸o amostral S. Deve-se sempre considerar como eventos de
qualquer espac¸o amostral, o evento imposs´ıvel (aquele que nunca ocorre) ∅ e o evento certo (o
pro´prio espac¸o amostral) S.
Considerando o espac¸o referente ao lanc¸amento do dado honesto, temos como poss´ıveis even-
tos: ∅, S, {1},{2},{3},{4},{5},{6},{1, 2}, ...,{5, 6}, {1, 2, 3},...,S = {1, 2, 3, 4, 5, 6}.
Classe de eventos aleato´rios e´ o conjunto formado por todos os eventos de S. Por exemplo,
seja S = {c, k} enta˜o a clase de eventos de S e´
Como um evento e´ um subconjunto do espac¸o amostral, enta˜o todos os conceitos da teoria
de conjuntos podem ser aplicados a eventos. Considerando A e B eventos quaisquer, veja as
principais operac¸o˜es na tabela a seguir:
Unia˜o A ∪B reu´ne os elementos de ocorre quando ocorrer
ambos os conjunto pelo menos um deles
Intersec¸a˜o A ∩B formado somente pelos ocorre quando ocorrer
elementos que esta˜o em A e B ambos os eventos
Complementar A formado pelos elementos ocorre quando na˜o
que na˜o esta˜o em A ocorrer o evento A
Seja o experimento: lanc¸amento de um dado e os eventos:
A= nu´mero par no dado;
34
B= nu´mero maior que 2 no dado;
C= nu´mero 6;
1. Deˆ os eventos complementares;
2. Deˆ as reunio˜es;
3. Deˆ as intersecc¸o˜es;
Eventos sa˜o ditos mutuamente exclusivos se e so´ se eles na˜o puderem ocorrer simultane-
amente. Enta˜o, para dois eventos quaisquer A e B, temos:
A e B sa˜o mutuamente exclusivos ⇐⇒ A ∩B = ∅
Nota: Ha´ uma diferenc¸a entre exclusivo e exaustivo. Se os eventos A e B sa˜o exclusivos, enta˜o:
P (A ∩B) = 0
Se os eventos A e B sa˜o exaustivos, enta˜o:
P (A ∪B) = 1
3.5 Definic¸a˜o axioma´tica de probabilidadeA probabilidade e´ um nu´mero associado a um evento, destinado a medir sua possibilidade de
ocorreˆncia.
Seja S o espac¸o amostral e E um evento associado a ele, P (E) e´ a probabilidade de ocorreˆncia
de E:
1. Axioma 1: 0 ≤ P (E) ≤ 1;
35
2. Axioma 2: P (S) = 1;
3. Axioma 3: Se A,B, · · · , K sa˜o eventos mutuamente exclusivos,
P (A ∪B ∪ · · · ∪K) = P (A) + P (B) + · · ·+ P (K)
Destes axiomas surgem as propriedades:
1. P (∅) = 0;
2. P (A¯) = 1− P (A);
3. P (A ∪B) = P (A) + P (B)− P (A ∩B);
Uma regra pra´tica e objetiva para a atribuic¸a˜o nume´rica da probabilidade e´:
P (A) =
h
n
onde h e´ o nu´mero de resultados de S favora´veis ao evento A, e n e´ o nu´mero de resultados
poss´ıveis de S, desde que todos sejam igualmente prova´veis.
Exemplo: No lanc¸amento de um dado honesto, calcular a probabilidade de sair:
1. o nu´mero 2:
2. um nu´mero par:
3. um nu´mero ı´mpar:
4. o nu´mero 8:
5. um nu´mero menor que 7:
3.6 Probabilidade condicional e independeˆncia
Muitas vezes, ha´ interesse em calcular a probabilidade de ocorreˆncia de um evento A, dada a
ocorreˆncia de um evento B. Exemplos
1. Qual e´ a probabilidade de chover amanha˜, sabendo que choveu hoje?
2. Qual a probabilidade de um dispositivo eletroˆnico funcionar sem problemas por 200 horas
consecutivas, sabendo que ele ja´ funcionou por 100 horas?
36
Em outras palavras, queremos calcular a probabilidade de ocorreˆncia de A condicionada a`
ocorreˆncia pre´via de B. Essa probabilidade e´ representada por P (A|B) leˆ-se probabilidade de A
dado B.
Sejam A e B eventos quaisquer, sendo P (B) > 0. Definimos a probabilidade condicional de
A dado B por:
P (A|B) = P (A ∩B)
P (B)
Desta fo´rmula, segue que:
P (A ∩B) = P (B)P (A|B)
Para treˆs eventos, A,B e C a regra do produto pode ser escrita como
P (A ∩B ∩ C) = P (A)P (B|A)P (C|A ∩B)
Exemplo: Uma urna conte´m 5 bolas exatamente iguais, exceto nas cores, pois 3 sa˜o brancas
e 2 sa˜o pretas. Uma bola e´ retirada dessa urna e em seguida uma outra bola e´ retirada. Qual a
probabilidade de ambas serem brancas, sabendo-se que na˜o houve reposic¸a˜o da primeira bola?
Dois ou mais eventos sa˜o independentes quando a ocorreˆncia de um dos eventos na˜o influ-
encia a probabilidade de ocorreˆncia dos outros.
Se dois eventos A e B sa˜o independentes, enta˜o:
P (A|B) = P (A), P (B|A) = P (B)
Como consequeˆncia, a regra do produto pode ser simplificada da seguinte forma:
P (A ∩B) = P (A)P (B|A) = P (A)P (B)
Essa relac¸a˜o e´ usada para definir formalmente eventos independentes, ou seja:
A e B sa˜o independentes ⇐⇒ P (A ∩B) = P (A)P (B)
A definic¸a˜o de independeˆncia ainda pode ser ampliada para mais eventos, como segue:
E1, E2, · · · , En sa˜o independentes ⇐⇒ P (E1 ∩ E2 ∩ · · · ∩ En) = P (E1)P (E2) · · ·P (En)
37
Exemplo: No caso do exemplo anterior, das 5 bolas na urna, suponhamos agora que sa˜o
retiradas 3 bolas, uma apo´s a outra, sempre com reposic¸a˜o da bola anterior. Qual a probabilidade
das 3 serem brancas?
3.7 Teorema da probabilidade total
A probabilidade de ocorrer pelo menos um entre dois eventos E1 e E2 e´ igual a soma das proba-
bilidades de E1 e E2, menos a probabilidade de E1 e E2 ocorrerem simultaneamente, ou seja,
P (E1 ∪ E2) = P (E1) + P (E2)− P (E1 ∩ E2)
Demonstrac¸a˜o:
No caso de treˆs eventos: E1, E2, E3, tem-se que
P (E1∪E2∪E3) = P (E1)+P (E2)+P (E3)−P (E1∩E2)−P (E1∩E3)−P (E2∩E3)+P (E1∩E2∩E3)
Exemplo: No circuito da figura a seguir, a probabilidade de que cada rele´ esteja fechado e´
de 0, 8. Supondo que cada rele´ seja aberto ou fechado independentemente um do outro, calcular
a probabilidade de que a corrente passe de A para B.
38
3.8 Teorema de Bayes
Se E1, E2, · · · , En sa˜o n eventos dois a dois mutuamente exclusivos e exaurem o conjunto S dos
eventos elementares, enta˜o se P (Ei) > 0(i = 1, 2, · · · , n) tem-se
P (Ei | B) = P (Ei)P (B | Ei)
P (E1)P (B | E1) + P (E2)P (B | E2) + · · ·+ P (En)P (B | En)
onde B e´ um evento que so´ pode ocorrer como efeito de uma das causas mutuamente exclusivas
Ei.
O teorema de Bayes fornece a probabilidade de que o evento Ei tenha ocorrido na hipo´tese
de que o evento B tenha sido observado.
Exemplo 1: Uma caixa A tem 3 fichas vermelhas e 2 azuis e a caixa B tem 2 vermelhas e 8
azuis. Joga-se uma moeda honesta, se a moeda der cara extrai-se uma ficha de A, se der coroa
de B. Uma ficha vermelha e´ extra´ıda. Qual a probabilidade de ter sa´ıdo cara no lanc¸amento?
Exemplo 2: Uma indu´stria produz quatro tipos de va´lvulas eletroˆnicas: A,B,C e D. A
probalidade de uma va´lvula do tipo A ser defeituosa e´ 1%, do tipo B e´ 0, 5%, do tipo C e´ 2%
e do tipo D e´ 0, 2%. Em um depo´sito existem 1000 va´lvulas do tipo A, 500 do tipo B, 300 do
tipo C e 200 do tipo D. Uma va´lvula e´ retirada aleatoriamente do depo´sito e verifica-se que esta´
defeituosa. Qual a probabilidade de que a va´lvula retirada seja do tipo D?
39
3.9 Varia´veis aleato´rias
Sa˜o grandezas sujeitas a variac¸o˜es. Conjunto de dados espec´ıficos que podem assumir valores
ou aspectos distintos, segundo os casos particulares ou circunstaˆncias. CRESPO (1997) define
varia´vel como “...conjunto de resultados poss´ıveis de um fenoˆmeno”.
Pode ser entendida como varia´vel quantitativa, cujo resultado (valor) depende de fatores
aleato´rios:
Exemplos:
1. nu´mero de coroas obtido no lanc¸amento de duas moedas;
2. nu´mero de pessoas que visitam um determinado site, num certo per´ıodo de tempo;
3. tempo de resposta de um sistema computacional;
4. tempo de espera numa fila;
Estas varia´veis aleato´rias (v.a.) tem a caracter´ıstica: o resultado e´ um nu´mero real e na˜o
podemos preveˆ-lo com exatida˜o, pois depende do experimento aleato´rio.
Formalmente, uma v.a. e´ uma func¸a˜o que associa elementos do espac¸o amostral ao conjunto
de nu´meros reais.
As v.a.s podem ser discretas ou cont´ınuas.
3.9.1 Varia´veis aleato´rias discretas
Definida uma v.a. discreta, temos a descric¸a˜o do que pode ocorrer no experimento aleato´rio:
1. quais resultados podem ocorrer; e
2. qual a probabilidade de cada resultado acontecer.
Exemplo 1: Seja X uma v.a. X = nu´mero obtido no lanc¸amento de um dado comum.
40
Se X for discreta, com poss´ıveis valores {x1, x2, · · ·} enta˜o a distribuic¸a˜o de probabilidades de
X pode ser apresentada pela chamada func¸a˜o de probabilidade, que associa a cada valor poss´ıvel
xi a sua probabilidade de ocorreˆncia p(xi), ou seja:
p(xi) = P (X = xi), (i = 1, 2, · · ·)
Uma func¸a˜o de probabilidade deve satisfazer:
1. p(xi) ≥ 0;
2.
∑
i p(xi) = 1
Exemplo 2: O espac¸o amostral de um experimento aleato´rio e´ {a, b, c, d, e, f} e cada resul-
tado e´ igualmente prova´vel. Uma v.a. e´ definida como segue:
resultado a b c d e f
X 0 0 1,5 1,5 2 3
41
Exemplo 3: Considere o lanc¸amento de duas moedas honestas. Seja X o nu´mero de caras.
Deˆ a distribuic¸a˜o de X.
Func¸a˜o de distribuic¸a˜o acumulada
E´ outra forma de representar uma distribuic¸a˜o de probabilidade de uma v.a.:
F (x) = P (X ≤ x),∀x ∈ ℜX
Exemplo 4: Seja X= nu´mero obtido no lanc¸amento de um dado. Construa a func¸a˜o de
distribuic¸a˜o acumulada de X.
graficamente:
Exemplo 5: Construa F (x) do exemplo 2 e fac¸a um esboc¸o do gra´fico.
42
graficamente:
Valor esperado (esperanc¸a) e variaˆncia
Na ana´lise explorato´ria dos dados, definimos me´dia, variaˆncia e desvio padra˜o para sintetizar
informac¸o˜es sobre distribuic¸o˜es de frequeˆncias. De forma ana´loga, essas medidas tambe´m podem
ser definidas para as varia´veis aleato´rias, com o objetivo de sintetizar caracter´ısticas relevantes
de uma distribuic¸a˜o de probabilidades.
A me´dia ou valor esperado de uma v.a. discreta X e´ dada por:
E(X) =
n∑
i=1xip(xi)
E a variaˆncia e´ dada por:
V (X) = σ2X = E[X − E(X)]2 = · · · = E(X2)− [E(X)]2
Demonstrac¸a˜o:
Exemplo 6: Calculemos as esperanc¸as e variaˆncias dos exemplos anteriores!!!
43
Exemplo 7: O nu´mero de mensagens enviadas por hora, atrave´s de uma rede de computa-
dores tem a seguinte distribuic¸a˜o:
X=n. mensagens 10 11 12 13 14 15
p(x) 0,08 0,15 0,30 0,20 0,20 0,07
Calcule E(X) e V (X).
Exemplo 8: A distribuic¸a˜o a seguir e´ de chance que um bit transmitido atrave´s de um canal
de transmissa˜o digital seja recebido com erros. X = nu´mero de bits com erro nos pro´ximos 4
bits transmitidos. Encontre E(X) e V (X).
X 0 1 2 3 4
p(x) 0,6561 0,2916 0,0486 0,0036 0,0001
3.9.2 Varia´veis aleato´rias cont´ınuas
Muitas v.a que surgem na vida de um engenheiro ou de um profissional da informa´tica teˆm
natureza eminentemente cont´ınua, tais como:
1. tempo de resposta de um sistema computacional;
2. rendimento de um processo qu´ımico;
3. tempo de vida de um componente eletroˆnico;
44
4. resisteˆncia de um material; etc
Define-se uma v.a. cont´ınua por meio de sua func¸a˜o de densidade de probabilidade (fdp).
As probabilidades de eventos associados a uma varia´vel aleato´ria cont´ınua X podem ser
calculadas atrave´s de uma func¸a˜o densidade de probabilidade de f , que deve satisfazer:
1. f(x) ≥ 0, ∀x ∈ ℜ; e
2.
∫∞
−∞ f(x)dx = 1
Se A = [a, b], enta˜o P (A) = P (a < X < b) =
∫ b
a
f(x)dx
Exemplo 9: Seja a varia´vel aleato´ria T definida como o tempo de resposta na consulta a
um banco de dados, em minutos. Suponha que essa varia´vel aleato´ria tenha a seguinte fdp:
f(t) =
{
2e−2t, para t ≥ 0
0, para t < 0
Primeiramente esbocemos o gra´fico:
Calculemos a probabilidade de a resposta demorar mais do que 3 minutos, isto e´: P (T > 3).
Func¸a˜o de distribuic¸a˜o acumulada
45
Como X e´ uma v.a. cont´ınua com fdp f , definimos sua func¸a˜o de distribuic¸a˜o acumulada
por:
F (x) = P (X ≤ x) =
∫ x
−∞
f(s)ds, ∀x ∈ ℜ
Consideremos a fdp do exemplo anterior: para t < 0:
para t ≥ 0:
e, graficamente:
Retomando o exemplo anterior, o ca´lculo de P (T > 3) pode ser feito aplicando a func¸a˜o
acumulada:
46
Dada a func¸a˜o de distribuic¸a˜o acumulada F , podemos obter a fdp f por:
f(x) =
d
dx
F (x)
Para todo ponto x em que F e´ deriva´vel. Assim, a func¸a˜o F tambe´m caracteriza a distribuic¸a˜o
de probabilidades de uma v.a
Propriedades de F (x)
1. 0 ≤ F (x) ≤ 1;
2. limx→−∞F (x) = 0;
3. limx→∞F (x) = 1;
4. F (x) e´ na˜o-decrescente, isto e´, x1 ≤ x2 =⇒ F (x1) ≤ F (x2);
5. F (x2)− F (x1) = P (x1 ≤ X ≤ x2), x2 > x1
Exemplo 10: Seja X uma fdp dada por
f(x) =
x, 0 ≤ x < 1
2− x, 1 ≤ x < 2
0, x /∈ [0, 2
Calcule:
1. P (0 < X < 5);
2. P (0 < X < 1);
3. F (x);
4. os gra´ficos f(x) e F (x);
47
Esperanc¸a e variaˆncia
Uma v.a. cont´ınua X, com fdp f , tem valor esperado e variaˆncia definidos por:
E(X) =
∫ ∞
−∞
xf(x)dx
V (X) = E(X2)− [E(X)]2
onde E(X2) =
∫∞
−∞ x
2f(x)dx
Propriedades de E(X)
1. E(k) = k, k e´ constante,
2. E(kX) = k(E(X)
3. E(X ± Y ) = E(X)± E(Y )
4. E(aX ± k) = aE(X)± k
5. E(XY ) = E(X)E(Y )
Propriedades de V (X)
1. V (k) = 0
48
2. V (kX) = k2V (X)
3. V (X ± k) = V (X)
4. Cov(X,Y ) = E(XY )− E(X)E(Y )
Se X e Y sa˜o independentes E(XY ) = E(X)E(Y ), logo Cov(X,Y ) = 0
5. V (X ± Y ) = V (X) + V (Y )± 2Cov(X,Y )
Exemplo 11: Para os exemplos anteriores, calcule E(X) e V (X).
49
3.10 Varia´veis aleato´rias bidimensionais
Interesse: estudar mais de um resultado de um experimento aleato´rio. Por exemplo: selecionar
amostras de folhas de ac¸o fabricadas e medir a forc¸a de cisamento e o diaˆmetro da solda. A forc¸a
e o diaˆmetro sa˜o v.a. de interesse. Ainda, selecionar pessoas e medir a altura e o peso.
Definic¸a˜o: Uma v.a. bidimensional (X,Y ) e´ um par de func¸a˜o que associa cada uma um
nu´mero real a cada resultado do espac¸o amostral.
Seja X uma v.a. que assume os valores x1, x2, · · · , xm e Y uma v.a. que assume os valores
y1, y2, · · · , yn.
Definic¸a˜o: A func¸a˜o de probabilidade conjunta associa cada par (xi, yj), i = 1, 2, · · · ,m e
j = 1, 2, · · · , n a probabilidade
P (X = xi, Y = yj) = p(xi, yj)
A distribuic¸a˜o conjunta de probabilidade da v.a. bidimensional (X,Y ) e´ o conjunto:
{(xi, yj), p(xi, yj), i = 1, 2, · · · ,m; j = 1, 2, · · · , n}
Note que
∑m
i=1
∑n
j=1 P (X = xi, Y = yj) = 1
Se (X,Y ) for cont´ınua, a fdp e´ uma func¸a˜o f(x, y) tal que
1. f(x, y) ≥ 0, ∀(x, y) ∈ ℜXY ; e
2.
∫ ∫
ℜXY f(x, y)dxdy = 1.
Exemplo 12: Verifique se
{
0, 0453(xy2 + 2x), x ∈ [0, 1] e y ∈ [0, 2]
0, caso contra´rio.
e´ fdp.
50
Distribuic¸o˜es marginais
Sendo (X,Y ) uma v.a. bidimensional discreta, definem-se as distribuic¸o˜es marginais de X e
Y , respectivamente, por
p(xi) = P (X = xi) =
∞∑
j=1
p(xi, yj)
q(yj) = P (Y = yj) =
∞∑
i=1
p(xi, yj)
e no caso cont´ınuo, por
g(x) =
∫ ∞
−∞
f(x, y)dy
h(y) =
∫ ∞
−∞
f(x, y)dx
Dadas duas varia´veis aleato´rias discretas X e Y , elas sa˜o independentes se, para todos os
pares (xi, yj),
p(xi, yj) = p(xi)q(yj)
e sendo elas cont´ınuas, elas sa˜o independentes se, para todos os valores de X e Y ,
f(x, y) = g(x)h(y)
Sendo (X,Y ) uma varia´vel aleato´ria bidimensional e fanzendo Z = H(X,Y ) tem-se
E(Z) =
∞∑
j=1
∞∑
i=1
H(xi, yj)p(xi, yj),
Se (X,Y ) for uma varia´vel aleato´ria bidimensional discreta, e
E(Z) =
∫ ∞
−∞
∫ ∞
−∞
H(x, y)f(x, y)dxdy
se (X,Y ) for uma varia´vel aleato´ria bidimensional cont´ınua.
Exemplo 13: A distribuic¸a˜o de probabilidade conjunta da varia´vel aleato´ria discreta (X,Y )
e´ dada abaixo
YX 2 4 6 8
2 0,05 0,03 0,02 0,01
4 0,10 0,12 0,08 0,05
6 0,06 0,10 0,08 0,06
8 0,08 0,10 0,04 0,02
Determinar:
51
1. as distribuic¸o˜es marginais de X e Y ;
2. E(Z) sendo Z = XY .
3. distribuic¸a˜o marginal de X.
Exemplo 14: Suponha que a fdp conjunta da varia´vel aleato´ria bidimensional (X,Y ) seja
dada por
f(x, y) =
{
k(xy + x
2
2
), 0 ≤ x ≤ 1, 0 ≤ y ≤ 3;
0, quaisquer outros valores.
Calcular:
1. o valor da constante k;
52
2. as distribuic¸o˜es marginais de X e Y ;
3. E(XY ).
3.11 Distribuic¸o˜es teo´ricas de probabilidades
Estudaremos agora alguns modelos probabil´ısticos padro˜es, que podem ser usados em diversas
situac¸o˜es pra´ticas. O problema passa a ser, enta˜o, determinar qual modelo e´ o mais adequado
para a situac¸a˜o em estudo e como aplica´-lo adequadamente.
3.11.1 Principais distribuic¸o˜es teo´ricas discretas de probabilidades
Distribuic¸a˜o de Bernoulli
Talvez os experimentos mais simples sa˜o aqueles em que observamos presenc¸a ou na˜o de alguma
caracter´ıstica, que sa˜o conhecidos como ensaios de Bernoulli. Alguns exemplos:
1. lanc¸ar uma moeda e observar se ocorre cara ou na˜o;
2. lanc¸ar um dado e observar se ocorre seis ou na˜o;
3. numa linha de produc¸a˜o, observar se um item, tomado ao acaso e´ ou na˜o defeituoso;
53
4. verificar se um servidor de uma intranet esta´ ou na˜o ativo.
Denominamos sucesso ou fracasso os dois eventos poss´ıveis em cada caso. O ensaio de
Bernoulli e´ caracterizado por uma varia´vel aleato´ria X, definida por X = 1 se sucesso; X = 0,
se fracasso. A func¸a˜o de probabilidade de X e´ dada por
X p(x)
0 1-p
1 p
total 1
onde p = P (sucesso). A distribuic¸a˜o fica completamente especificada ao atribuirmos um valor
para p. No exemplo da moeda, p = 1
2
. Outras caracter´ısticas da distribuic¸a˜o de Bernoulli:
E(X) = p
V (X) = p(1− p)
F (x) =
0, se x < 0
1− p, se 0 ≤ x < 1
1, se x ≥ 1
Distribuic¸a˜o de Binomial
Na maior parte das vezes, sa˜o realizados n ensaios de Bernoulli. O interesse esta´no nu´mero X
de ocorreˆncias de sucesso, como nos exemplos:
1. lanc¸ar uma moeda cinco vezes e observar o nu´mero de caras;
2. numa linha de produc¸a˜o, observar dez itens, tomados ao acaso, e verificar quantos sa˜o
defeituosos;
3. verificar o nu´mero de bits que na˜o esta˜o afetados por ru´ıdos, em um pacote de n bits.
Nos exemplos precedentes, se for poss´ıvel supor:
1. ensaios independentes;
2. P (sucesso) = p, constante para todo ensaio (0 < p < 1)
Temos, enta˜o, exemplos de experimentos binomiais.
54
Uma v.a. com distribuic¸a˜o binomial de paraˆmetros n e p pode ser apresentada por:
X = X1 +X2 + · · ·+Xn
Onde X1 + X2 + · · · + Xn sa˜o v.a. independentes, sendo cada uma delas com distribuic¸a˜o de
Bernoulli de paraˆmetro p. Como Xi sera´ 0 ou 1, dependendo da ocorreˆncia ou na˜o de sucesso no
i−e´simo ensaio, enta˜o a soma X correspondera´ ao nu´mero de sucessos.
Definic¸a˜o: Seja X uma v.a. com distribuic¸a˜o binomial de paraˆmetros n e p (sendo 0 < p <
1). A probabilidade de X assumir um certo valor x, pertencente ao conjunto {0, 1, 2, · · · , n} e´
dada pela expressa˜o:
p(x) =
(
n
x
)
px(1− p)n−x
Ainda,
E(X) = np
V (X) = npq
Exemplo 15: Sabe-se que 20% dos animais submetidos a certo tratamento na˜o sobrevivem.
Se esse tratamento foi aplicado em 20 animais e se X = nu´mero de na˜o sobreviventes:
1. qual a distribuic¸a˜o de X?
2. E(X) e V (X);
3. P (2 < X ≤ 4);
55
4. P (X ≥ 2);
Exemplo 16: Dados histo´ricos mostram que 5% dos itens provindos de um fornecedor
apresentam algum tipo de defeito. Considerando um lote com 20 itens, calcular a probabilidade
de:
1. haver um item com defeito;
2. haver exatamente dois itens defeituosos;
3. haver mais de dois itens defeituosos;
4. qual e´ o nu´mero esperado de itens defeituosos no lote?
5. e de itens bons?
56
Distribuic¸a˜o de Poisson
Muitas vezes, no uso da binomial, acontece que n e´ muito grande (n→∞) e p e´ pequeno (p→ 0).
Nesses casos na˜o encontramos o valor em tabelas, ou enta˜o o ca´lculo e´ dif´ıcil. Assim, pode-se
fazer uma aproximac¸a˜o da binomial pela Poisson, fazendo:
1. n→∞, (n > 30);
2. p→ 0, (p < 0, 1);
3. 0 < np ≤ 10 consideraremos np = λ.
Assim e´ poss´ıvel mostrar que:
X ∼ B(n, p) ≈ X ∼ Poi(λ)
Consideremos a probabilidade de ocorreˆncia de sucessos em um determinado intervalo de
tempo. Seja X = nu´mero de sucessos no intervalo, enta˜o:
P (X = k) =
e−λλk
k!
, k = 0, 1, 2, · · ·
onde λ e´ a me´dia.
Esta distribuic¸a˜o e´ usada em:
1. carros que passam no cruzamento por 1 hora;
2. erros tipogra´ficos por pa´gina;
3. defeitos por unidade por pec¸a fabricada;
4. mortes por atacaque do corac¸a˜o por ano numa cidade;
5. tempo de espera numa fila
Para a Poisson, tem-se
E(X) = λ, V (X) = λ
Exemplo 17: Num livro de 800 pa´ginas ha´ 800 erros de impressa˜o. Qual a probabilidade de
que uma pa´gina contenha pelo menos 3 erros?
57
Exemplo 18: Supondo que as consultas num banco de dados ocorrem de forma independente
e aleato´ria, com uma taxa me´dia de treˆs consultas por minuto, calculemos a probabilidade de
que no pro´ximo minuto ocorram menos do que 3 consultas?
Exemplo 19: Suponha que o nu´mero de consumidores que entrem num banco em uma hora
seja uma v.a. de Poisson. Suponha tambe´m que P (X = 0) = 0, 05. Deˆ E(X) e V (X)
3.11.2 Principais distribuic¸o˜es teo´ricas cont´ınuas de probabilidades
Distribuic¸a˜o Uniforme cont´ınua ou retangular
Uma v.a. X tem distribuic¸a˜o uniforme de paraˆmetros a e b, se sua densidade e´ especificada por
f(x) =
{
1
b−a , se x ∈ [a, b]
0, caso contra´rio.
Dizemos que X ∼ U [a, b].
Aqui, E(X) = b+a
2
, pois
58
e V (X) = (a−b)
2
12
, pois
A func¸a˜o de distribuic¸a˜o acumulada e´:
F (x) =
∫ x
a
1
b− adt = · · ·
Assim,
F (x) =
0, se x < a
x−a
b−a , se a ≤ x < b
1, se x ≥ b
graficamente:
Exemplo 20: A espessura de um filme fotorresistente aplicado a pastilhas na fabricac¸a˜o de
semicondutores, em certa localizac¸a˜o na pastilha esta´ uniformemente distribu´ıda em 0, 2050 e
0, 2150 microˆmetros.
1. deˆ F (x);
59
2. deˆ a proporc¸a˜o de pastilhas que excedem 0, 2125 micrometro na espessura do filme;
3. que espessura e´ excedida por 10% das pastilhas?
4. deˆ E(X) e V (X).
Distribuic¸a˜o exponencial
Enquanto a distribuic¸a˜o de Poisson pode ser usada para modelar o nu´mero de ocorreˆncias em
um per´ıodo cont´ınuo, a distribuic¸a˜o exponencial pode modelar a v.a. cont´ınua que representa o
intervalo entre as ocorreˆncias. Exemplos:
1. tempo (em minutos) ate´ a pro´xima consulta a uma base de dados;
60
2. tempo (em segundos) entre pedidos a um servidor;
3. distaˆncia (em metros) entre defeitos de uma fita;
Assim, X ∼ exp(α) se sua fdp e´
f(x) =
{
αe−αx, se x ≥ 0, α > 0
0, se x < 0
graficamente:
Ainda, E(X) = 1
α
, pois
V (X) = 1
α2
E, a func¸a˜o distribuic¸a˜o acumulada e´ dada por:
F (x) =
∫ x
0
αe−αtdt =
Assim, F (x) =
{
1− e−αx, se x ≥ 0
0, se x < 0
Graficamente:
Exemplo 21: Seja X com fdp
f(x) =
{
k
2
e−x, se x ≥ 0
0, se x < 0
61
1. deˆ k;
2. deˆ F (x);
3. a mediana a distribuic¸a˜o (m e´ mediana se P (X > m) = P (X < m))
Exemplo 22: Dada a varia´vel aleato´ria T= tempo de resposta na consulta a um banco de
dados (em minutos) com fdp
f(t) =
{
2e−2t, para t ≥ 0
0, para t < 0
Calcular a probabilidade da consulta demorar mais que 3 minutos, isto e´, P (T > 3).
Distribuic¸a˜o Normal
A normal e´ considerada a distribuic¸a˜o de probabilidades mais importante, pois permite mode-
lar uma infinidade de fenoˆmenos naturais e, ale´m disso, possibilita realizar aproximac¸o˜es para
calcular probabilidades de muitas varia´veis aleato´rias que teˆm outras distribuic¸o˜es. E´ muito
importante tambe´m na infereˆncia estat´ıstica, como sera´ observado mais adiante.
62
A distribuic¸a˜o normal e´ caracterizada por uma func¸a˜o de probabilidade, cujo gra´fico descreve
uma curva em forma de sino, como mostra a figura a seguir.
Observe que essa forma de distribuic¸a˜o evidencia que ha´ maior probabilidade de a varia´vel
aleato´ria assumir valores pro´ximos do centro.
Dados os paraˆmetros µ ∈ ℜ e σ > 0, a fdp da normal e´ dada por:
f(x) =
1
σ
√
2pi
e
−1
2
(x−µ
σ
)2 , −∞ < x <∞
Com certo esforc¸o matema´tico, e´ poss´ıvel mostrar que
E(X) = µ
V (X) = σ2
A normal ainda tem como caracter´ısticas:
1. a curva e´ sime´trica em torno de µ, assim a me´dia e´ igual a mediana.
2. a func¸a˜o f(x) tem um ponto de ma´ximo para x = µ.
3. teoricamente, a curva prolonga-se de −∞ ate´ ∞, sendo limx→±∞ f(x) = 0.
4. a a´rea total sob a curva e´ igual a 1, ou seja,
∫∞
−∞ f(x)dx = 1.
Distribuic¸a˜o Normal Padra˜o - Z
Todas as curvas normais representativas de distribuic¸o˜es de frequeˆncias podem ser trans-
formadas em uma curva normal padra˜o, usando o desvio padra˜o (σ) como unidade de medida
indicativa dos desvios dos valores da varia´vel em estudo ( x ), em relac¸a˜o a` me´dia (µ ).
A Distribuic¸a˜o Normal Padra˜o e´ caracterizada por ter me´dia (µ ) igual a zero e desvio padra˜o
(σ) igual a 1.
63
Se a varia´vel X tem distribuic¸a˜o normal, pode ser transformada para uma forma padra˜o,
denominada Z, (ou, como comumente se diz, pode ser padronizada) subtraindo-se sua me´dia e
dividindo-se pelo seu desvio padra˜o:
z =
x− µ
σ
E´ importante lembrar que a a´rea sob a curva pode ser entendida como uma medida de sua
probabilidade e que a a´rea sob a curva normal e´ igual a 1 (100%).
Assim, a varia´vel X cuja distribuic¸a˜o e´ X ∼ N(µ, σ2) e´ transformada na forma padronizada
Z cuja distribuic¸a˜o e´ Z ∼ N(0, 1). Essa e´ a distribuic¸a˜o normal padra˜o, que ja´ esta´ tabelada,
pois osparaˆmetros da populac¸a˜o (desvio padra˜o e me´dia) sa˜o conhecidos.
Enta˜o, se forem tomados dois valores espec´ıficos, pode-se determinar a proporc¸a˜o de a´rea sob
a curva entre esses dois valores.
Para aprender a usar a tabela da Normal
1. Seja Z ∼ N(0, 1). Calcule:
(a) P (Z < 1, 32)
(b) P (Z < 3, 0)
(c) P (Z < −0, 82)
64
(d) P (Z > 2, 43)
(e) P (Z > −1, 34)
(f) P (−1 < Z < 1)
2. Z ∼ N(0, 1). Calcule:
(a) P (Z < z) = 0, 9
(b) P (Z < z) = 0, 5
(c) P (Z > z) = 0, 1
(d) P (−1, 24 < Z < z) = 0, 8)
3. Seja X ∼ N(13, 4). Calcule:
(a) P (X < 3)
65
(b) P (X > 8)
(c) P (2 < X < 7)
(d) P (X > x) = 0, 4
Exemplo 23: Em uma populac¸a˜o de indiv´ıduos adultos de sexo masculino, cuja estatura
me´dia e´ 1, 70m e desvio padra˜o e´ 0, 08m, qual a probabilidade de um indiv´ıduo apresentar
estatura entre 1, 60 e 1, 82m?
Exemplo 24: A resisteˆncia a` compressa˜o de amostras de cimento pode ser modelada com
distribuic¸a˜o N(6000kg/cm2, 100kg/cm2).
1. Qual a probabilidade da resisteˆncia da amostra ser menor que 6250kg/cm2?
2. Qual a probabilidade da resisteˆncia da amostra estar entre 5800 e 5900kg/cm2?
66
3. Qual resisteˆncia e´ excedida por 95% das amostras?
Exemplo 25: O tempo de reac¸a˜o de um motorista para o est´ımulo visual e´ normalmente
distribu´ıdo com me´dia 0, 4s e desvio padra˜o 0, 05s.
1. Qual a probabilidade de que uma reac¸a˜o requeira mais de 0, 5s?
2. Qual a probabilidade de que uma reac¸a˜o requeira entre 0, 4s e 0, 5s?
3. Qual o tempo de reac¸a˜o que e´ excedido em 90% do tempo?
3.12 Exerc´ıcios
1. Deˆ o espac¸o amostral dos seguintes experimentos:
(a) lanc¸amento simultaˆneo de treˆs moedas.
(b) lanc¸amento simultaˆneo de um dado e uma moeda.
(c) distribuic¸a˜o dos quatro filhos de um casal, quanto ao sexo, por ordem de nascimento.
67
(d) retirada de 4 bolas de uma urna contendo duas bolas brancas e 5 bolas verdes.
2. Considere o experimento: lanc¸amento de dois dados, um branco e outro verde, e observando
a face superior; determine:
(a) o espac¸o amostral;
(b) o evento: ocorreˆncia de nu´meros iguais nos dois dados;
(c) o evento: ocorreˆncia de nu´meros cuja soma seja 5;
3. Um lote conte´m pec¸as de 5, 10 ,... ,30 mm de diaˆmetro. Suponha que 2 pec¸as sejam
selecionadas no lote. Se x e y indicam respectivamente os diaˆmetros da primeira e da
segunda pec¸as selecionadas, o par (x, y) representa um ponto amostral. Usando o plano
cartesiano, indicar os seguintes eventos:
(a) A = {x = y};
(b) B = {y < x};
(c) C = {x = y − 10};
(d) D = {x+y
2
< 10}
4. Voceˆ faz parte de um grupo de 10 pessoas, para treˆs das quais sera˜o distribu´ıdos preˆmios
iguais. Calcule a probabilidade de que voceˆ seja um dos premiados. R. 3
10
5. Jogando-se dois dados, qual a probabilidade de que a soma dos pontos obtidos seja menor
que 4? R. 1
12
6. Lanc¸am-se dois dados honestos. Calcule a probabilidade de que a soma obtida seja igual a
10. R. 1
12
7. De um baralho de 52 cartas tira-se ao acaso uma das cartas. Determine a probabilidade de
que a carta seja: (a) uma dama; (b) uma dama de paus; (c) uma carta de ouros;R. 1
13
, 1
52
, 13
52
8. No lanc¸amento de dois dados iguais, qual a probabilidade de a soma dos pontos ser 8 e um
dos dados apresentar 6 pontos? R. 1
18
9. Ha´ 50 bolas numa urna, distribu´ıdas como segue:
68
Cor nu´mero
azul 20
vermelho 15
laranja 10
verde 5
Total 50
Misturam-se as bolas e escolhe-se uma. Determine a probabilidade de a bola escolhida ser:
(a) verde; R. 1
10
(b) vermelha ou verde; R.2
5
(c) azul;R.2
5
(d) amarela;R.0
(e) azul ou verde; R.1
2
(f) na˜o-amarela; R.1
(g) na˜o vermelha; R.35
50
10. Determine a chance em favor da extrac¸a˜o de uma dama de um baralho de 52 cartas. Qual
a chance contra? R. 1
13
, 12
13
11. No sistema ilustrado abaixo, cada rele´ tem funcionamento independente e a probabilidade
de que um rele´ qualquer esteja fechado e´ igual a 0, 80. Determine a probabilidade da
corrente ele´trica passar do ponto A para o ponto C do sistema. R.0, 7554
12. Uma indu´stria produz 4 tipos de vigas em ac¸o, A,B,C e D. A probabilidade de que a
viga A seja defeituosa e´ de 5%, a viga B e´ 3%, a viga C e´ 8% e a viga D e´ 10%. Em uma
construc¸a˜o, utilizaram-se todos os tipos de vigas nas seguintes quantidades: 400 vigas do
tipo A, 100 vigas do tipo B, 300 do tipo C e 200 do tipo D. Sabe-se que uma das vigas
utilizadas nesta construc¸a˜o apresentou defeito, calcule a probabilidade de que seja:
(a) Viga do tipo A;
69
(b) Na˜o seja uma viga do tipo C.
13. Em uma fa´brica foram instaladas 1000 laˆmpadas novas. Sabe-se que a durac¸a˜o me´dia
das laˆmpadas e´ de 800 horas e o desvio padra˜o de 100 horas, com distribuic¸a˜o normal.
Determinar a quantidade de laˆmpadas que durara˜o:
(a) Mais que 750 horas; R.691
(b) Entre 520 e 880 horas.R.785
14. Suponha que a porcentagem de impurezas de um composto seja uma varia´vel aleato´ria
cont´ınua com fdp:
f(x) =
{
k(2x2 + x), 0 ≤ x ≤ 1
0, x > 1, x < 0
(a) Calcule o valor da constante k R. 6
7
(b) Calcule P (X > 0, 60) R. 0,722
(c) Esboce o gra´fico da func¸a˜o distribuic¸a˜o acumulada F (X)
0, se x < 0
4x3
7
+ 3x
2
7
, se 0 ≤ x < 1
1, se x ≥ 1
15. Um dado honesto e´ lanc¸ado 10 vezes. Usando a distribuic¸a˜o binomial, calcule a probabili-
dade de:
(a) Verificar face 5 em exatamente 2 lanc¸amentos; R.0, 29
(b) Verificar face 2 no ma´ximo 2 lanc¸amentos; R.0, 8075
(c) Verificar face 3 ao menos 1 vez; R.0, 8385
16. [1 ponto] O nu´mero de vezes que um motor ele´trico e´ acionado em uma indu´stria segue a
distribuic¸a˜o Poisson. Sabe-se que, em me´dia, o motor e´ acionado 3 vezes a cada hora de
expediente. Determine a probabilidade de:
(a) O motor na˜o seja acionado em 2h de expediente; R.e−6
(b) O motor seja acionado no ma´ximo 2 vezes em 2h de expediente; R.19e−6 + e−5
(c) O motor seja acionado ao menos 1 vez em 1h de expediente; R.1− e−3
(d) Qual o nu´mero esperado de acionamento em 4h de expediente? R.12
70
17. Sejam X e Y os escores em um teste de inteligeˆncia geral e em um teste de prefereˆncia ocu-
pacional, rescpectivamente. A func¸a˜o de densidade de probabilidade das varia´veis aleato´rias
X,Y e´ dada por
f(x, y) =
{
k
1000
, 0 ≤ x ≤ 100, 0 ≤ y ≤ 10
0, caso contra´rio
(a) Ache o valor apropriado de k; R.1
(b) Encontre a densidade marginal de X. R.g(X) = 1
100
, x ∈ [0, 100]
18. Suponha que uma caixa contenha treˆs moedas: duas honestas e uma de duas caras. Retirar
uma moeda ao acaso e joga´-la. Pergunta: qual a probabilidade da moeda ter sido a de
duas caras, dado que o resultado final foi cara? R.1
2
19. Dada a distribuic¸a˜o conjunta de X e Y , independentes, seja Z = 2X − 4Y . Calcule E(Z),
V (Z) e as marginais de X e Y . R.E(Z) = 1, 4;V (Z) = 6, 76
X Y 0 1 2
1 0,06 0,12 0,02
2 0,15 0,30 0,05
3 0,09 0,18 0,03
20. Sejam X : renda familiar em R$1000, 00; Y : nu´mero de aparelhos em TV.
X 1 2 3 1 3 2 3 1 2 3
Y 2 1 3 1 3 3 2 1 2 3
Deˆ a distribuic¸a˜o de (X,Y ), deˆ as marginais, E(X), E(Y ), V (X), V (Y ). R.E(X) = E(Y ) =
2, 1;V (X) = V (Y ) = 0, 69
21. Uma operadora do mercado de ac¸o˜es contata seus 20 clientes mais importantes todas as
manha˜s. Se a probabilidade de se fazer uma transac¸a˜o como resultado desse contato e´ de
uma em treˆs, quais sa˜o as chances de ela fazer 10 ou mais transac¸o˜es? R.0, 9824
22. Verifique se a func¸a˜o a seguir e´ fdp e determine as probabilidades.
f(x) =
2x+ 1
25
, x = 0, 1, 2, 3, 4
(a) P (X = 4) R. 9
25
(b) P (X ≤ 1) R. 4
25
71
(c) P (2 ≤ X < 4) R.12
25
(d) P (X > −10) R.1
23. Cada amostra de ar tem 10% de chance de conter um determinado poluente orgaˆnico. Con-
sidere que as amostrassejam independentes com relac¸a˜o a` presenc¸a do poluente. Encontre
(a) a probabilidade de que nas pro´ximas 18 amostras exatamente 2 contenham o poluente.
(b)No mı´nimo quatro amostras contenham o poluente. R.0, 2835; 0, 0982
24. Falhas ocorrem ao longo do comprimento de um fio delgado de cobre. Seja X a varia´vel
aleato´ria que conta o nu´mero de falhas em um comprimento de L mil´ımetros de fio e
suponha que o nu´mero me´dio de falhas em L mil´ımetros seja λ. Suponha que o nu´mero de
falhas siga a distribuic¸a˜o de Poisson, com me´dia de 2, 3 falhas por mil´ımetro. Determine a
probabilidade de existirem exatamente 2 falhas em 1 mil´ımetro de fio. R.0, 2652
25. Suponha que o tempo que um operador de coleta de dados leva para preencher um for-
mula´rio eletroˆnico para uma base de dados esteja uniformente entre 1,5 e 2,2 minutos.
(a) Qual e´ a me´dia e a variaˆncia do tempo que o operador leva para preencer o formula´rio?
R.1, 85; 0, 0408
(b) Qual a probabilidade de levar menos de dois minutos para preencher o formula´rio?
R.0, 7143
(c) Determine a func¸a˜o de distribuic¸a˜o cumulativa do tempo que leva para preencher o
formula´rio. R.
0, se x < 1, 5
x−1,5
0,7
, se 1, 5 ≤ x < 2, 2
1, se x ≥ 2, 2
26. O tempo de recarga, sob condic¸o˜es normais, de uma bateria de laptop e´ distribu´ıdo nor-
malmente, com me´dia de 260 minutos e um desvio-padra˜o de 50 minutos.
(a) Qual a probabilidade da bateria durar mais de quatro horas? R.0, 6554
(b) Qual a probabilidade da bateria durar entre 2,5 e 3,5 horas? R.0, 1448
27. Colesterol e´ uma substaˆncia gordurosa que e´ uma parte importante da ligac¸a˜o (membrana)
externa das ce´lulas do corpo de animais. Sua faixa normal para um adulto e´ 120−240mg/dl.
O instituto de Alimentos e Nutric¸a˜o das Filipinas encontrou que o n´ıvel de colesterol
para adultos filipinos tem uma me´dia de 159, 2mg/dl e 84, 1% de adultos tem um n´ıvel
de colesterol abaixo de 200mg/dl. Suponha que o n´ıvel de colesterol esteja distribu´ıdo
normalmente.
72
(a) Determine o desvio padra˜o; R.41, 21
(b) Qual o valor do n´ıvel de colesterol que excede 90% da populac¸a˜o? R.106, 03
28. Um cac¸a n´ıquel tem dois discos que funcionam independentemente um do outro. Cada
disco tem 10 figuras: 4 mac¸a˜s, 3 bananas, 2 peras e 1 laranja. Uma pessoa paga R$80 e
aciona a ma´quina. Se aparecerem 2 mac¸a˜s, ganha R$40. Se aparecerem 2 bananas, ganha
R$80; R$140 se aparecerem 2 peras e ganha 180 se aparecerem 2 laranjas. Qual a esperanc¸a
de ganho numa u´nica rodada? Resposta: R.− 59, 00
29. Sabe-se que uma moeda mostra face cara quatro vezes mais do que a face coroa, quando
lanc¸ada. Esta moeda e´ lanc¸ada 4 vezes. Seja X o nu´mero de caras que aparecem, determine:
(a) E(X) R.3, 20
(b) V (X) R.0, 64
(c) P (X ≥ 2) R.0, 9728
30. Dois jogadores fazem uma aposta. A paga R$100 para B e lanc¸a duas moedas viciadas na˜o
simultaneamente. A probabilidade de sair cara na primeira moeda e´ 0,3 e da segunda e´ 0,2.
Se sair cara na primeira moeda tem o direito de lanc¸ar a segunda, se sair cara na segunda
moeda ganha R$200, e se sair coroa, ganha R$100. Se sair coroa na primeira moeda, A
nada ganha. Qual a esperanc¸a de lucro do jogador A em uma u´nica jogada? Resposta:
R.− 64, 00
31. Uma pessoa vende colheitadeiras de milho. Visita semanalmente uma, duas ou treˆs pro-
priedades rurais com probabilidades 0,2 , 0,5 e 0,3, respectivamente. De cada contato pode
conseguir a venda de uma colheitadeira por 120.000, com probabilidade 0,3, ou nenhuma
com probabilidade de 0,7. Determine o valor total esperado das vendas semanais. R.75.600
32. Seja X: renda familiar em milhares de reais e Y : nu´mero de carros na famı´lia. Considere
o quadro:
X 2 3 4 2 3 3 4 2 2 3
Y 1 2 2 2 1 3 3 1 2 2
(a) E(2X − 3Y ) R.− 0, 1
(b) COV (X,Y ) R.0, 28
(c) V (5X − 3Y ) R.10, 01
73
33. Verifique se as seguintes func¸o˜es sa˜o func¸o˜es de probabilidade e determine as probabilidades
requeridas:
(a)
x -2 -1 0 1 2
f(x) 1
8
2
8
2
8
2
8
1
8
i. P (X ≤ 2) R.1
ii. P (X > −2) R.7
8
iii. P (−1 ≤ X ≤ 1) R.6
8
(b) f(x) = 2x+1
25
, x = 0, 1, 2, 3, 4
i. P (X = 4) R. 9
25
ii. P (X ≤ 1) R. 4
25
iii. P (2 ≤ X < 4) R.12
25
iv. P (X > −10) R.25
25
34. O setor de comercializac¸a˜o estima que um novo instrumento para ana´lise de amostras de
solo tera´ grande sucesso, moderado sucesso ou na˜o tera´ sucesso, com probabilidades de
0,3; 0,6 e 0,1, respectivamente. A receita anual associada com um produto de grande
sucesso, moderado sucesso ou nenhum sucesso e´ de R$10 milho˜es, R$5 milho˜es e R$1
milha˜o, respectivamente. Fac¸a a varia´vel aleato´ria X denotar a renda anual do produto.
Determine a func¸a˜o de probabilidade de X. R.
X 10 5 1
P (X) 0,3 0,6 0,1
35. Em um processo de fabricac¸a˜o de semicondutores, treˆs pastilhas de um lote sa˜o testadas.
Cada pastilha e´ classificada como passa ou falha. Suponha que a probabilidade de uma
pastilha passar no teste seja de 0,8 e que as pastilhas sejam independentes.
(a) Qual e´ a probabilidade de que todas as treˆs pastilhas passem no teste? R.0, 83
(b) Determine a func¸a˜o de probabilidade do nu´mero de pastilhas de um lote que passe no
teste.
R.
X passa falha
P (X) 0,8 0,2
36. Suponha que a func¸a˜o de distribuic¸a˜o cumulativa da varia´vel aleato´ria X seja
F (x) =
0, se x < −2;
0, 2, se − 2 ≤ x < 0;
0, 7, se 0 ≤ x < 2;
1, se x ≥ 2.
Determine a func¸a˜o de probabilidade de X. R.
X -2 0 2
P (X) 0,2 0,5 0,3
74
37. A espessura (em polegadas) de um painel de madeira que um consumidor requer e´ uma
varia´vel aleato´ria com a seguinte func¸a˜o de distribuic¸a˜o cumulativa
F (x) =
0, se x < 1
8
0, 2, se 1
8
≤ x < 1
4
0, 9, se 1
4
≤ x < 3
8
1, se 3
8
≤ x
Determine as seguintes probabilidades:
(a) P (X ≤ 1
8
) R.0, 2
(b) P (X ≤ 1
4
) R.0, 9
(c) P (X ≤ 5
16
) R.0, 9
(d) P (X > 1
4
) R.0, 1
38. Se a faixa de X for o conjunto {0, 1, 2, 3, 4} e P (X = x) = 0, 2, determine a esperanc¸a e a
variaˆncia desta varia´vel aleato´ria. R.E(X) = 2;V (X) = 2
39. Suponha que f(x) = e−(x−4) para 4 < x. Determine as seguintes probabilidades
(a) P (1 < X) R.1
(b) P (2 ≤ X < 5) R.1− e−1
(c) P (5 < X) R.e−1
(d) Determine x tal que P (X < x) = 0, 9 R.4− ln0, 1
40. Suponha que f(x) = 1, 5x2 para −1 < x < 1. Determine as seguintes probabilidades
(a) P (0 < X) R.0, 5
(b) P (0, 5 < X) R.0, 4375
(c) P (−0, 5 ≤ X ≤ 0, 5) R.0, 125
(d) P (X < 0ouX > −0, 5) R.1
(e) Determine x tal que P (x < X) = 0, 05 R.0, 9654
41. A func¸a˜o densidade de probabilidade do comprimento de uma dobradic¸a para fechar uma
porta e´ f(x) = 1, 25 para 74, 6 < x < 75, 4 mil´ımetros. Determine o seguinte:
(a) P (X < 74, 8) R.0, 25
(b) P (X < 74, 8ouX > 75, 2) R.0, 5
75
(c) Se as especificac¸o˜es para esse processo forem de 74,7 a 75,3 mil´ımetros, que proporc¸a˜o
das dobradic¸as se ajusta a`s especificac¸o˜es? R.75%
42. Suponha que a func¸a˜o de distribuic¸a˜o cumulativa da varia´vel aleato´ria X seja
F (x) =
0, se x < −2
0, 25x+ 0, 5, se − 2 ≤ x < 2
1, se 2 ≤ x
Determine o seguinte:
(a) P (X < 1, 8) R.0, 95
(b) P (X > −1, 5) R.0, 875
(c) P (−1 < X < 1) R.0, 5
(d) f(x) R.
{
0, 25, se x ∈ [−2, 2)
0, c. c.
(e) os gra´ficos de F (x) e f(x)
(f) E(X) e V (X) R.E(X) = 0, V (X) = 4
3
43. A largura do espac¸amento e´ uma propriedade importante em um cabec¸ote magne´tico de
gravac¸a˜o. Em unidades codificadas, se a largura for uma varia´vel aleato´ria cont´ınua ao longo
da faixa de 0 < x < 2 com f(x) = 0, 5x, determine a func¸a˜o de distribuic¸a˜o cumulativa da
largura do espac¸amento. R.
0, se x < 0
0,5x2
2
, se x ∈ [0, 2)
1, se 2 ≤ x
44. Suponha que f(x) = 0,25 para 0 < x < 4. Determine E(X) e V (X). R.2; 1, 3¯
45. Sejam X : renda familiar em R$1000, 00 e Y : nu´mero de filhos por famı´lia. Considere o
quadro:
X 1 2 3 1 3 2 3 1 2 3
Y 2 1 3 1 3 3 2 1 2 3
Deˆ a distribuic¸a˜o conjunta de (X,Y ), as distribuic¸o˜es marginais, as esperanc¸as e variaˆncias
de X e Y . R.
Y X 1 2 3
1 0,2 0,1 0
2 0,1 0,1 0,1
3 0 0,1 0,3
46. Determine o valor de c, tal que a func¸a˜o f(x, y) = cxy para 0 < x < 3 e 0 < y < 3 satisfac¸a
as propriedades de uma func¸a˜o de densidade de probabilidade conjunta. R. 4
81
76
(a) Calcule P (X < 2.5, Y < 3); R.0, 694¯
(b) A marginal X; R.9x
4
(c) E(X + Y ); R.4
47. O tempo de vida (em horas) de um transistor e´ uma varia´vel aleato´ria com distribuic¸a˜o
exponencial. O tempo me´dio de vida do transistor e´ de 500 horas.
(a) Qual a fdp de X : tempo de vida do transistor? R.
{
1
500
e−
1
500
x, se x ≥ 0
0, caso contra´rio.
(b) Calcule a probabilidade de o transistor durar mais que 500 horas? R.e−1
(c) Calcule a probabilidade de o transistor durar entre 300 e 1000 horas? R.e
−3
5 − e−2
48. Em seu caminho matinal, voceˆ se aproxima de um determinado sinal de traˆnsito, que esta´
verde 20% do tempo. Suponha que cada manha˜ represente uma tentativa independente
cujo sucesso e´ a luz estar verde.
(a) Qual a distribuic¸a˜o de X? R.Bin(n; 0, 2)
(b) Em 5 manha˜s, qual a probabilidade de a luz esteja verde exatamente 1 dia? R.0, 4096
(c) Em 20 manha˜s, qual a probabilidade de que a luz esteja verde em menos de 3 dias?
R.0, 94208
49. O nu´mero de falhas em parafusos de ma´quinas de uma indu´stria de ceraˆmica segue a
distribuic¸a˜o de Poisson com me´dia de 0, 1 falha por metro quadrado.
(a) Qual a probabilidade de que haja duas falhas em 1 metro quadrado de ceraˆmica?
R.0, 0045
(b) Qual a probabilidade de que haja 1 falha em 10 metros quadrados de ceraˆmica?
50. A resisteˆncia a` compressa˜o de amostras de cimento pode ser modelada por uma distribuic¸a˜o
normal com me´dia de 6000 quilogramas por cent´ımetro quadrado e um desvio padra˜o de
100 quilogramas por cent´ımetro quadrado.
(a) Qual a probabilidade da resisteˆncia da amostra ser menor que 6250kg/cm2? R.0, 9938
(b) Qual a probabilidade da resisteˆncia da amostra estar entre 5800 e 5900kg/cm2?
R.0, 1359
(c) Qual a resisteˆncia e´ excedida por 95% das amostras R.5835
77
Cap´ıtulo 4
Infereˆncia estat´ıstica
O objetivo da Infereˆncia Estat´ıstica e´ produzir afirmac¸o˜es sobre uma determinada caracter´ıstica
da populac¸a˜o na qual estamos interessados, a partir de informac¸o˜es colhidas de uma parte dessa
populac¸a˜o (amostra). Esta caracter´ıstica pode ser representada por uma v.a. Se tive´ssemos
informac¸o˜es completas sobre a func¸a˜o de probabilidade, no caso discreto, ou sobre a fdp, no
caso cont´ınuo, da varia´vel em questa˜o, na˜o ter´ıamos necessidade de colher uma amostra. Toda a
afirmac¸a˜o desejada seria obtida atrave´s da distribuic¸a˜o da varia´vel, usando-se as propriedades es-
tudadas. Mas isso raramente acontece. Ou na˜o temos qualquer informac¸a˜o a respeito da varia´vel,
ou ela e´ apenas parcial. Podemos admitir, por exemplo, que a altura dos brasileiros adultos, que
ela siga uma distribuic¸a˜o normal. Mas desconhecemos os paraˆmetros que a caracterizam (me´dia
e variaˆncia). Em outros casos, podemos ter uma ide´ia da me´dia e da variaˆncia, mas desconhece-
mos a forma da curva. Enta˜o, o uso de uma amostra nos ajudaria a formar uma opinia˜o sobre o
comportamento da varia´vel na populac¸a˜o.
Resumidamente, Infereˆncia e´ o estudo dos me´todos estat´ısticos para tomada de deciso˜es ou
conlcuso˜es acerca da populac¸a˜o.
4.1 Estimador e Estimativa
Estimador ou estat´ıstica: func¸a˜o de elementos da amostra. Usam-se letras maiu´sculas. Por
exemplo:
X¯; S2; S; min; max; mediana = Me
Estimativa: valor nume´rico para o estimador. Usam-se letras minu´sculas.
me´dia: x¯ = 13, 5, variaˆncia=s2 = 1, 2cm2.
78
4.2 Qualidades de um bom estimador
1. estimadores na˜o tendenciosos
tn e´ estimador na˜o tendensioso se
E(tn) = θ
Se for tendencioso enta˜o
B = E(tn)− θ
B e´ o vie´s, tendeˆncia.
Exemplo 1: X¯ e´ estimador na˜o tendencioso para µ pois:
2. estimadores consistentes (ou de variaˆncia mı´nima)
tn e´ estimador consistente de θ se
lim
n→∞
E(tn) = θ; e lim
n→∞
V (tn) = 0
Exemplo 2: X¯ ∼ N(µ.σ2
n
)
3. estimadores suficientes
Sa˜o aqueles capazes de retirar toda a informac¸a˜o das amostras.
79
Cap´ıtulo 5
Estimac¸a˜o
5.1 Estimac¸a˜o por pontos
Aqui o paraˆmetro θ e´ estimado por um u´nico valor.
5.1.1 Estimador da me´dia populacional µ
x¯ =
∑n
i=1 xi
n
5.1.2 Estimador da variaˆncia populacional σ2
s2 =
∑n
i=1(xi − µ)2
n
se µ conhecido;
s2 =
∑n
i=1(xi − x¯)2
n− 1
se µ desconhecido.
5.1.3 Estimador do desvio padra˜o populacional σ
s =
√∑n
i=1(xi − µ)2
n
se µ conhecido;
s =
√∑n
i=1(xi − x¯)2
n− 1
se µ desconhecido.
80
5.1.4 Estimador da proporc¸a˜o populacional ρ
pˆ =
h
n
5.2 Estimac¸a˜o por intervalos
Na estimac¸a˜o por intervalos, consto´i-se um intervalo em torno da estimativa por ponto, de modo
que esse intervalo tenha uma probabilidade conecida de conter o verdadeiro valor do paraˆmetro.
Seja o paraˆmetro θ, tal que
P (t1 ≤ θ ≤ t2) = 1− α
1. o intervalo t1 ≤ θ ≤ t2 e´ denominado de intervalo de confianc¸a (I.C.);
2. os extremos desse intervalo, t1 e t2, sa˜o denominados de limites de confianc¸a;
3. a probabilidade conhecida 1− α e´ denominada de n´ıvel de confianc¸a;
A escolha do n´ıvel de confianc¸a depende da precisa˜o com que se deseja estimar o paraˆmetro.
E´ bastante comum a utilizac¸a˜o dos n´ıveis de 95% e 99%. Evidentemente, o aumento da confianc¸a
no intervalo implica no aumento de sua amplitude.
5.2.1 I.C. para a me´dia populacional µ
1. σ conhecido
Seja uma populac¸a˜o caracterizada pela distribuic¸a˜o de uma v.a. X com os seguintes
paraˆmetros: E(X) = µ e V (X) = σ2. Devido ao erro experimental onipresente, X e´
uma v.a.; assim, o interesse recai em seu valor esperado µ.
Escolhendo zα
2
em func¸a˜o do n´ıvel de confianc¸a 1−α desejado, tal que P (−zα
2
≤ z ≤ zα
2
) =
1− α, onde z = x¯−µσ
n
, podemos escrever:
P
(
−zα
2
≤ x¯− µσ√
n
≤ zα
2
)
= 1− α
e, isolando µ:
81
Portanto, o I.C. de 1− α100% para µ sera´:
x¯− zα
2
σ√
n
≤ µ ≤ x¯+ zα
2
σ√
n
Exemplo 1: O desvio padra˜o dos comprimentos das pec¸as produzidas por certa ma´quina e´
2mm. Uma amostra de 50 pec¸as produzidas por essa ma´quina apresentou me´dia x¯ = 25mm.
Construir um I.C. de 95% para o verdadeiro comprimento das pec¸as produzidas por essa
ma´quina.
2. σ desconhecido
O I.C. descrito anteriormente somente podera´ ser usado nas situac¸o˜es em que conhecemos
σ!!! E isto na˜o e´ muito comum!!!
Em caso contra´rio, o procedimento usual e´ substituir σ pelo desvio padra˜o calculado com
os dados da amostra:
s =
√∑n
i=1(xi − x¯)2
n− 1
A distribuic¸a˜o t de Student
Supondo a populac¸a˜o com distribuic¸a˜o normal, a estat´ıstica
t =
x¯− µ
s/
√
n
tem distribuic¸a˜o de probabilidades conhecida como distribuic¸a˜o t de Student, com gl = n−1
graus de liberdade.
A distribuic¸a˜o t de Student tem forma parecida com a normal padra˜o, mas e´ um pouco
mais dispersa. Essa dispersa˜o varia com o tamanho da amostra. E´ bastante dispersa para
amostras pequenas, mas se aproxima da normal padra˜o para amostras grandes.
Dado um n´ıvel de confianc¸a 1−α, podemos obter o valor t1−α da distribuic¸a˜o t de Student,
usando uma tabela, na linha correspondente a gl = n− 1.
82
I.C. para µ com o uso da distribuic¸a˜o t de Student
Usando a tabela, com gl = n − 1, podemos escolher o valor tα
2
em func¸a˜odo n´ıvel de
confianc¸a 1− α desejado, tal que
P (−tα
2
≤ t ≤ tα
2
) = 1− α
onde t = x¯−µs√
n
com gl = n− 1 graus de liberdade.
Ou ainda,
P
(
−tα
2
≤ x¯− µs√
n
≤ tα
2
)
= 1− α
que isolando µ
Portanto, o I.C. de (1− α)100% para a me´dia µ sera´
x¯− tα
2
s√
n
≤ µ ≤ x¯+ tα
2
s√
n
83
Exemplo 2: Uma amostra de cabos produzidos por uma indu´stria foi ensaiada e as tenso˜es
de rupturas obtidas foram:
750 780 745 770 765kgf
Construir o I.C. de 99% para a verdadeira tensa˜o de ruptura desses cabos.
5.2.2 I.C. para a variaˆncia populacional σ2
A distribuic¸a˜o Chi-quadrado
Seja z1, z2, · · · , zn, n varia´veis aleato´rias normais padra˜o. Definimos a varia´vel aleato´ria chi-
quadrado como:
χ2 = z21 + z
2
2 + · · ·+ z2n
A distribuic¸a˜o de chi-quadrado tem 1 paraˆmetro, n, o qual e´ chamado de graus de liberdade. A
me´dia da distribuic¸a˜o de χ2 com n graus de liberdade e´:
E(χ2(n)) = n
A distribuic¸a˜o Qui-quadrado na˜o e´ sime´trica, ao contra´rio do que sucede com as distribuic¸o˜es
Normal e t de Student. A` medida que o nu´mero de graus de liberdade aumenta, a distribuic¸a˜o
torna-se mais sime´trica, como na figura:
Os valores da distribuic¸a˜o Chi-quadrado podem ser positivos ou nulos, mas na˜o podem ser
negativos.
A distribuic¸a˜o Chi-quadrado e´ diferente consoante o nu´mero de graus de liberdade, os quais
se escrevem gl = n–1. A` medida que o nu´mero de gl aumenta, a distribuic¸a˜o aproxima-se da
distribuic¸a˜o Normal.
I.C. para σ2 com o uso da distribuic¸a˜o Chi-quadrado
Para este caso, temos
P (χ21−α
2
≤ χ2 ≤ χ2α
2
) = 1− α
84
c
onde
χ2 =
(n− 1)s2
σ2
com gl = n− 1 graus de liberdade. Da´ı
P
(
χ21−α
2
≤ (n− 1)s
2
σ2
≤ χ2α
2
)
= 1− α
e, isolando σ2 resulta:
P
(
(n− 1)s2
χ2α
2
≤ σ2 ≤ (n− 1)s
2
χ21−α
2
)
= 1− α
Portanto, o I.C. de (1− α)100% para σ2 sera´
(n− 1)s2
χ2α
2
≤ σ2 ≤ (n− 1)s
2
χ21−α
2
Exemplo 3: Um mesmo aˆngulo foi medido 5 vezes obtendo-se os resultados
30o15′ 30o13′ 30o17′ 30o15′ 30o14′
Estimar a variaˆncia atrave´s de um I.C. de 95%.
85
5.2.3 I.C. para o desvio padra˜o populacional σ
Considerando a raiz quadrada positiva do I.C. de σ2, obtemos o I.C. de (1−α)100% para σ, que
sera´: √
(n− 1)s2
χ2α
2
≤ σ ≤
√
(n− 1)s2
χ21−α
2
Exemplo 4: Construir o I.C. de 95% para o desvio padra˜o populacional do exemplo anterior.
5.2.4 I.C. para a proporc¸a˜o populacional p
Em muitas situac¸o˜es, o principal interesse e´ alguma proporc¸a˜o p. Por exemplo:
1. a proporc¸a˜o de itens defeituosos em uma linha de produc¸a˜o;
2. a proporc¸a˜o de consumidoress que va˜o comprar certo produto;
3. a proporc¸a˜o de mensagens que chegam adequadamente a seu destino.
Para amostras suficientemente grandes, a distribuic¸a˜o amostral das proporc¸o˜es e´ aproximada-
mente normal com
z =
pˆ− p√
pq
n
de onde vem que
P
(
−zα
2
≤ pˆ− p√
pq
n
≤ zα
2
)
= 1− α
e da´ı, isolando p temos
Portanto, o I.C. de (1− α)100% para p sera´
pˆ− zα
2
√
pq
n
≤ p ≤ pˆ+ zα
2
√
pq
n
86
Exemplo 5: Em uma amostra de 200 pec¸as produzidas por certa ma´quina, verificou-se que
10 eram defeituosas. Estimar a verdadeira proporc¸a˜o de pec¸as defeituosas produzidas por essa
ma´quina, utilizando um I.C. de 90%.
5.3 Exerc´ıcios
1. Na avaliac¸a˜o de dois sistemas computacionais, A e B, foram selecionadas 400 cargas de
trabalho (tarefas) - supostamente uma amostra aleato´ria de infinidade de cargas de trabalho
que poderiam ser submetidas a esses sistemas. O sistema A foi melhor que o B em 60%
dos casos. Construir intervalos de confianc¸a para p (proporc¸a˜o de vezes que o sistema A e´
melhor que o sistema B, considerando todas as poss´ıveis cargas de trabalho) usando n´ıveis
de confianc¸a de 95% e 99%.
2. Em uma indu´stria de cerveja, a quantidade de cerveja inserida em latas tem-se comportado
como uma varia´vel aleato´ria com me´dia 350ml e desvio padra˜o 3ml. Apo´s alguns problemas
na linha de produc¸a˜o, suspeita-se que houve alterac¸a˜o da me´dia. Uma amostra de 20 latas
acusou me´dia x¯ = 346ml. Construa um, I.C. para o novo valor da quantidade me´dia µ
de cerveja inserida em latas, com n´ıvel de confianc¸a 95%, supondo que na˜o tenha ocorrido
alterac¸a˜o no desvio padra˜o.
3. Deseja-se avaliar a dureza esperada µ do ac¸o produzido sob um novo processo de teˆmpera.
Uma amostra de dez corpos de prova do ac¸o produziu os seguintes resultados de dureza,
em HRc:
36, 4 35, 7 37, 2 36, 5 34, 9 35, 2 36, 3 35, 8 36, 6 36, 9
Construir um I.C. de 95%.
4. Em uma amostra aleato´ria simples com 200 edif´ıcios com 5 anos, em certa cidade, 55%
apresentaram problemas este´ticos relevantes apo´s entrega da obra. Construir um IC para
87
a proporc¸a˜o de edif´ıcios da cidade que apresentaram problemas este´ticos relevantes nos 5
primeiros anos. Use 1− α = 95%.
5. Uma empresa fabricante de pastilhas para freios efetua um teste para controle de qualidade
de seus produtos. Selecionou-se uma amostra de 600 pastilhas, das quais 18 apresentaram
n´ıveis de desgaste acima do tolerado. Construir um IC para a proporc¸a˜o de pastilhas com
desgaste acima do tolerado, do atual processo industrial, com n´ıvel de confianc¸a de 95%.
Interpretar o resultado.
6. Uma amostra de 10 va´lvulas eletroˆnicas foi testada e os tempos de vida (em horas) foram
2100 2150 2200 2130 2180 2120 2180 2100 2130 2160
Estimar o tempo me´dio de vida e a variaˆncia desse tipo de va´lvula.
7. Foram realizadas 12 determinac¸o˜es da densidade (g/cm3) de certo metal, obtendo-se os
resultados
19, 0 19, 3 19, 1 19, 3 19, 2 19, 4 19, 2 19, 3 19, 2 19, 0 19, 5 19, 3
Estimar a variaˆncia e o desvio padra˜o da verdadeira densidade atrave´s de um IC de 95%.
88
Cap´ıtulo 6
Testes de hipo´teses
6.1 Introduc¸a˜o
Uma hipo´tese estat´ıstica e´ uma afirmativa a respeito de um paraˆmetro de uma distribuic¸a˜o de
probabilidade. Por exemplo, podemos formular a hipo´tese que a produtividade e´ diferente de 2,5
pec¸as/hora. Formalmente isso e´ escrito como:{
H0 : µ = 2, 5pec¸as/hora
H1 : µ 6= 2, 5pec¸as/hora
H0 e´ chamada de hipo´tese nula e H1 de hipo´tese alternativa. Nesse caso, a alternativa
formulada e´ bilateral, mas tambe´m podem ser estabelecidas alternativas unilaterais, tais como:{
H0 : µ = 2, 5pec¸as/hora
H1 : µ < 2, 5pec¸as/hora
Os testes de hipo´tese sa˜o uma das aplicac¸o˜es da estat´ıstica mais usadas. Via de regra, a
hipo´tese nula e´ feita com base no comportamento passado do produto/processo/servic¸os, en-
quanto a alternativa e´ formulada em func¸a˜o de alterac¸o˜es / inovac¸o˜es recentes.
No ambiente atual de melhoria cont´ınua, e´ fa´cil entender a importaˆncia dos testes de hipo´tese:
eles permitem confirmar a efica´cia das medidas de melhoria adotadas.
Ao testar a hipo´tese, toma-se uma amostra aleato´ria do sistema em estudo e se calcula o
paraˆmetro desejado. Conforme o valor do paraˆmetro, a hipo´tese nula sera´ aceita ou rejeitada, a
partir de procedimentos estat´ısticos.
6.2 Passos para realizar um T.H.
Passo 1: Definic¸a˜o da Hipo´tese
89
O primeiro passo e´ o estabelecimento das hipo´teses: hipo´tese nula (H0) e hipo´tese alternativa
(H1).
Hipo´tese Nula (H0): E´ um valor suposto para um paraˆmetro. Se os resultados da amostra
na˜o forem muito diferentes de H0, ela na˜o podera´ ser rejeitada.
Hipo´tese Alternativa (H1): E´ uma hipo´tese que contraria a hipo´tese nula, complementar
de H0. Essa hipo´tese somente sera´ aceita se os resultados forem muito diferentes de H0.
Passo 2: Calcular a estat´ıstica do Teste
E´ o valor calculado a partir da amostra, que sera´ usado na tomada de decisa˜o. Uma maneira
de tomar-se uma decisa˜oe´ comparar o valor tabelado com a estat´ıstica do teste.
Para o caso de testes de me´dias, a estat´ıstica do teste e´ a varia´vel padronizada Z:
Zcalc =
x¯− µ
σ√
n
Passo 3: Regia˜o Cr´ıtica
O valor da estat´ıstica do teste, no caso, o valor Z, e´ calculado supondo que a hipo´tese nula
(H0) e´ verdadeira. No entanto, o valor calculado pode estar associado a uma probabilidade de
ocorreˆncia muito baixa. Nesse caso, a hipo´tese nula deve ser rejeitada e aceitamos a hipo´tese
alternativa.
A regia˜o cr´ıtica e´ a regia˜o onde H0 e´ rejeitada. A a´rea da regia˜o cr´ıtica e´ igual ao n´ıvel de
significaˆncia (α), que estabelece a probabilidade de rejeitar H0 quando ela e´ verdadeira.
Por exemplo, se utilizarmos o n´ıvel de significaˆncia de 5%, a probabilidade de rejeitar H0
quando ela e´ verdadeira e´ igual a 5%. Na pra´tica, os valores usuais de alfa sa˜o α = 0, 01; 0, 05
ou 0, 10.
Tipos de testes:
1. Unilateral a` direita {
H0, µ = µ0
H1, µ > µ0
2. Unilateral a` esquerda: {
H0, µ = µ0
H1, µ < µ0
3. Bilateral {
H0, µ = µ0
H1, µ 6= µ0
90
Graficamente e´ poss´ıvel observar cada uma dessas regio˜es nas figuras a seguir:
Passo 4: Regra de Decisa˜o
Se o valor da estat´ıstica do teste cair na regia˜o cr´ıtica, rejeita-se H0. Ao rejeitar a hipo´tese
nula (H0) existe uma forte evideˆncia de sua falsidade.
Ao contra´rio, quando aceitamos, dizemos que na˜o houve evideˆncia amostral significativa no
sentido de permitir a rejeic¸a˜o de H0.
Passo 5: Conclusa˜o
Aceitar H0, implica que a hipo´tese nula na˜o pode ser rejeitada!
Rejeitar H0 implica que temos evideˆncias estat´ısticas para rejeita´-la com um risco conhecido
: α.
91
6.3 Teste para a me´dia populacional µ
1. H0 : µ = µ0
2. H1 :
a) µ < µ0
b) µ > µ0
c) µ 6= µ0
3. Fixar o n´ıvel de significaˆncia α;
4. Determinar a regia˜o de rejeic¸a˜o;
5. Calcular a estat´ıstica de teste
CASO 1: O desvio padra˜o populacional σ e´ conhecido
Para este caso, a estat´ıstica de teste e´ dada por:
z =
x¯− µ0
σ√
n
CASO 2: O desvio padra˜o populacional σ e´ desconhecido
Para este caso, a estat´ıstica de teste e´ dada por:
t =
x¯− µ0
s√
n
6. Regras de decisa˜o
(a) a) se z < −zα ou t < −tα, rejeita-se H0;
(b) b) se z > zα ou t > tα, rejeita-se H0;
(c) c) se |z| > zα
2
ou |t| > tα
2
, rejeita-se H0;
Exemplo 1: Uma populac¸a˜o tem desvio padra˜o conhecido, sendo igual a 5mm. Se uma
amostra de 50 elementos, obtida dessa populac¸a˜o, tem me´dia igual a 46mm; podemos afirmar
que a me´dia dessa populac¸a˜o e´ superior a 43mm, ao n´ıvel de significaˆncia de 1%?
92
Exemplo 2: Um fabricante afirma que a tensa˜o me´dia de ruptura dos cabos produzidos por
sua companhia na˜o e´ inferior a 500kgf . Uma amostra de 7 cabos foi ensaiada, obtendo-se os
resultados (em kgf)
490 495 480 493 475 478 485
Testar a afirmac¸a˜o do fabricante, utilizando α = 5%.
A seguir tem-se um resumo do procedimento de teste de hipo´tese por meio de um organograma.
6.4 Teste para a diferenc¸a ente duas me´dias populacionais
µ1 e µ2
CASO 1: Os desvios padro˜es populacionais σ1 e σ2 sa˜o conhecidos
1. H0 : µ1 − µ2 = d0
2. H1 :
a) µ1 − µ2 < d0
b) µ1 − µ2 > d0
c) µ1 − µ2 6= d0
3. Fixar α
93
4. Determinar a regia˜o de rejeic¸a˜o
5. Calcular a estat´ıstica do teste
z =
(x¯1 − x¯2)− d0√
σ21
n1
+
σ22
n2
6. Regras de decisa˜o
(a) a) se z < −zα, rejeita-se H0;
(b) b) se z > zα, rejeita-se H0;
(c) c) se |z| > zα
2
, rejeita-se H0;
Exemplo 3: Uma amostra de 100 va´lvulas da Companhia A tem me´dia x¯A = 1530h, sendo
σA = 100h. Uma amostra de 70 va´lvulas da Companhia B, tem x¯B = 1420h, sendo σB = 80h.
Testar a hipo´tese de que as va´lvulas da Companhia A em relac¸a˜o a B tem durac¸a˜o me´dia superior
a 100h. Utilizar α = 0, 01.
CASO 2: Os desvios padro˜es populacionais σ1 e σ2 sa˜o desconhecidos e supostamente
iguais
1. H0 : µ1 − µ2 = d0
2. H1 :
a) µ1 − µ2 < d0
b) µ1 − µ2 > d0
c) µ1 − µ2 6= d0
3. Fixar α
4. Determinar a regia˜o de rejeic¸a˜o
5. Calcular a estat´ıstica do teste
t =
(x¯1 − x¯2)− d0√
s2p(
1
n1
+ 1
n2
)
94
onde s2p =
(n1−1)s21+(n2−1)s22
n1+n2−2
6. Regras de decisa˜o
(a) a) se t < −tα, rejeita-se H0;
(b) b) se t > tα, rejeita-se H0;
(c) c) se |t| > tα
2
, rejeita-se H0;
Exemplo 4: Dois tipos de soluc¸o˜es qu´ımicas foram ensaiados para se determinar os pH. Os
resultados obtidos foram
soluc¸a˜o A: 7, 50 7, 54 7, 51 7, 53 7, 50
soluc¸a˜o B: 7, 49 7, 50 7, 51 7, 52 7, 50 7, 51
Testar a hipo´tese de que na˜o existe diferenc¸a entre os pH me´dios das duas soluc¸o˜es, supondo
que os desvios padro˜es populacionais sa˜o iguais. Usar α = 0, 05.
CASO 3: Os desvios padro˜es populacionais σ1 e σ2 sa˜o desconhecidos e supostamente
diferentes
1. H0 : µ1 − µ2 = d0
2. H1 :
a) µ1 − µ2 < d0
b) µ1 − µ2 > d0
c) µ1 − µ2 6= d0
3. Fixar α
4. Determinar a regia˜o de rejeic¸a˜o
5. Calcular a estat´ıstica do teste
t =
(x¯1 − x¯2)− d0√
s21
n1
+
s22
n2
95
Esta estat´ıstica t tem distribuic¸a˜o t de Student com v graus de liberdade, onde
v =
(
s21
n1
+
s22
n2
)2
(
s21
n1
)2
n1−1 +
(
s22
n2
)2
n2−1
6. Regras de decisa˜o
(a) a) se t < −tα, rejeita-se H0;
(b) b) se t > tα, rejeita-se H0;
(c) c) se |t| > tα
2
, rejeita-se H0;
Exemplo 5: Uma mesma distaˆncia foi medida 5 vezes por certo instrumento, antes e apo´s
sofrer uma calibrac¸a˜o.
antes: 100, 8 101, 3 100, 6 99, 5 100, 1
depois: 100, 5 100, 4 100, 5 100, 3 100, 3
Testar a hipo´tese de que na˜o existe diferenc¸a entre os resultados obtidos antes e apo´s a
calibrac¸a˜o do instrumento. Usar α = 5%.
CASO 4: Se os dados sa˜o emparelhados
Esse teste deve ser utilizado quando os dados esta˜o relacionados dois a dois de acordo com
algum crite´rio.
1. H0 : µ1 − µ2 = d0
2. H1 :
a) µ1 − µ2 < d0
b) µ1 − µ2 > d0
c) µ1 − µ2 6= d0
3. Fixar α
96
4. Determinar a regia˜o de rejeic¸a˜o
5. Calcular a estat´ıstica do teste
t =
d¯− d0
s√
n
onde s =
√∑
(di−d¯)2
n−1 ; d¯ =
∑
di
n
; di = x1i − x2i
sendo que di representa a i-e´sima diferenc¸a entre duas observac¸o˜es emparelhadas.
6. Regras de decisa˜o
(a) a) se t < −tα, rejeita-se H0;
(b) b) se t > tα, rejeita-se H0;
(c) c) se |t| > tα
2
, rejeita-se H0;
Exemplo 6: Dois opera´rios determinaram os pesos (em g) das impurezas contidas em 6
amostras de certo produto qu´ımico, obtendo os resultados
Amostras 1 2 3 4 5 6
Opera´rio A 10,1 10,4 10,2 10,5 99 10,0
Opera´rio B 9,8 10,0 10,1 10,0 10,1 9,5
Pode-se concordar com a hipo´tese de que na˜o existe diferenc¸a entre as determinac¸o˜es dos dois
opera´rios, no n´ıvel de significaˆncia de 1%?
6.5 Teste para a variaˆncia populacional σ2
1. H0 : σ
2 = σ20
2. H1 :
a) σ2 < σ20
b) σ2 > σ20
c) σ2 6= σ20
97
3. Fixar α
4. Determinar a regia˜o de rejeic¸a˜o
5. Calcular a estat´ıstica do teste
χ2 =
(n− 1)s2
σ20
6. Regras de decisa˜o
(a) a) se χ2 < −χ21−α, rejeita-se H0;
(b) b) se χ2 > χ2α, rejeita-se H0;
(c) c) se χ2 < χ21−α
2
, ou χ2 > χ2α
2
rejeita-se H0;
Exemplo 7: As chapas de ac¸o produzidas por certa indu´stria teˆm uma especificac¸a˜o tal que
a variaˆncia de suas espessuras (em mm) na˜o deve ser superior a 0, 0009mm2. Uma indu´stria de
10 chapas tem espessura (em mm):
3, 15 3, 18 3, 15 3, 12 3, 14 3, 13 3, 17 3, 16 3, 15 3, 16
Testar a hipo´tese de que a variaˆncia esta´ dentro da especificac¸a˜o desejada, usando α = 0, 05.
6.6 Teste para a igualdade de duas variaˆncias popula-
cionais σ21 e σ
2
2
1. H0 : σ
2
1 = σ
2
2
2. H1 :
a) σ21 < σ
2
2
b) σ21 > σ
2
2
c) σ21 6= σ22
3. Fixar α
98
4. Determinar a regia˜ode rejeic¸a˜o
5. Calcular a estat´ıstica do teste
F =
s21
s22
6. Regras de decisa˜o
(a) a) se F < F1−α, rejeita-se H0;
(b) b) se F > Fα, rejeita-se H0;
(c) c) se F < F1−α
2
, ou F > Fα
2
rejeita-se H0;
A distribuic¸a˜o F de Snedecor
Sejam as v.a. independentes χ2v1 e χ
2
v2
, enta˜o
F (v1, v2) = Fv1,v2 =
χ2v1
χ2v2
=
χ2v1/v1
χ2v2/v2
A distribuic¸a˜o F de Snedecor depende de dois paraˆmetros: v1 e v2, denominados, respectiva-
mente de graus de liberdade do numerador e denominador.
Notac¸a˜o: F ∼ F (v1, v2) ou F ∼ Fv1,v2
Os valores de F (v1, v2) tais que P (F ≥ F (v1, v2)) = α sa˜o encontrados em tabelas.
Exemplos: Encontrar os valores de F (v1, v2) tais que:
1. P (F > F (3, 5)) = 0, 05
2. P (F > F (2, 4)) = 0, 05
3. P (F < F (4, 2)) = 0, 05
Para este u´ltimo caso, utiliza-se a fo´rmula de recorreˆncia:
F1−α(v1, v2) =
1
P (F > Fα(v2, v1))
99
E para os casos bilaterais
Fα
2
(v1, v2) =
1
F1−α
2
(v1, v2)
Exemplo 8: Foram testadas as durabilidades (em km) dos pneus das marcas A e B, obtendo-
se para 5 pneus de cada marca os resultados: marca A: 30000 32000 28000 26000 31000
marca B: 25000 30000 20000 21000 23000
Existe diferenc¸a significativa entre as variaˆncias das durabilidades dos dois pneus, no n´ıvel de
significaˆncia de 10%?
6.7 Teste para a proporc¸a˜o populacional p
1. H0 : p = p0
2. H1 :
a) p < p0
b) p > p0
c) p 6= p0
3. Fixar α
4. Determinar a regia˜o de rejeic¸a˜o
5. Calcular a estat´ıstica do teste
z =
pˆ− p0√
p0(1−p0)
n
6. Regras de decisa˜o
(a) a) se z < −zα, rejeita-se H0;
(b) b) se z > zα, rejeita-se H0;
(c) c) se |z| > zα
2
, rejeita-se H0;
100
Exemplo 9: Para determinarmos se um certo tipo de tratamento para evitar a corrosa˜o e´
eficiente, 45 tubos de um total de 50 apresentaram resultados satisfato´rios. Sabe-se que o trata-
mento e´ considerado eficiente se pelo menos 95% dos tubos apresentarem resultado satisfato´rio.
Qual a conlusa˜o, ao n´ıvel de significaˆncia de 5%?
6.8 Exerc´ıcios
1. Os indiv´ıduos de um pa´ıs apresentam altura me´diade 170cm e desvio padra˜ode 3cm. Uma
amostra de 80 indiv´ıduos apresentou me´dia de 168,5cm. Podemos afirmar, ao n´ıvel de 1%,
que essa amostra e´ formada por indiv´ıduos daquele pa´ıs? R. Rejeita H0.
2. Lanc¸a-se uma moeda 100 vezes e observa-se que ocorrem 35 caras. Baseado nesse resultado,
podemos afirmar, ao n´ıvel de 5%, que a moeda na˜o e´ honesta? R. Rejeita H0.
3. O sala´rio dos empregados metalu´rgicos gira em torno de 4,5 sala´rios mı´nimos, com desvio
padra˜o de 0,5 sala´rios. Uma indu´stria contrata 75 empregados, com um sala´rio me´dio de
4,3 s.m. Ao n´ıvel de 10% podemos afirmar que essa indu´stria a´ga sala´rios inferiores a`
media?R. Rejeita H0.
4. Um exame padra˜o de inteligeˆncia tem sido usado por va´rios anos com me´dia de 85 pontos
e desvio padra˜o de 5 pontos. Um grupo de 40 estudantes e´ ensinado, dando-se eˆnfase a`
resoluc¸a˜o de testes. Se esse grupo obtem me´dia de 88 pontos no exame, ha´ razo˜es para se
acreditar que a enfase dada mudou o resultado do teste ao n´ıvel de 10%?R. Rejeita H0.
5. Um fabricante de droga medicinal afirma que ela e´ 80% ou mais eficaz na cura de uma
alergia, em um determinado per´ıodo. Em uma amostra de 200 pacientes, a droga curou
150 pessoas. Testar ao n´ıvel de 10% se a pretensa˜o do fabricante e´ leg´ıtima.R. Rejeita H0.
6. Em 600 lanc¸amentos de um dado, obteve-se o ponto seis em 123 lanc¸amentos. Aos n´ıveis
101
de 5 e 1% de significaˆncia, ha´ raza˜o para se desconfiar de que o dado seja viciado quanto
ao ponto seis?R. Rejeita H0, Na˜o rejeita H0.
7. A resisteˆncia a` quebra de um fio usado na fabricac¸a˜o de material molda´vel necessita ser no
mı´nimo 100psi. Experieˆncia passada indicou que o desvio padra˜o da resisteˆncia a` quebra
foi de 2psi. Uma amostra de nove espe´cimes e´ testada e a resisteˆncia me´dia a` quebra e´
98psi. A fibra deve ser julgada como aceita´vel ao n´ıvel de 5% de significaˆncia? R. Rejeita
H0.
8. Um teste de impacto Izod foi feito em 20 corpos de prova de tubo de PVC. O padra˜o ASTM
para esse material requer que a resistencia ao impacto Izod seja maior que 1, 0ft− lb/in. A
me´dia e o desvio padra˜o obtidos da amostra foram x¯ = 1, 25 e s = 0, 25, respectivamente.
Teste H0 : µ = 1, 0 versus H1 : µ > 1, 0, usando α = 0, 01 e retire concluso˜es. R. Rejeita
H0.
9. Uma ma´quina automa´tica de enchimento e´ usada para encher garrafas com detergente
l´ıquido. Uma amostra aleato´ria de 20 garrafas resulta em uma variaˆncia da amostra do
volume de enchimento de s2 = 0, 0153. Se a variaˆncia do volume de enchimento exceder
0.01, existira´ uma proporc¸a˜o inaceita´vel de garrafas cujo enchimento na˜o foi completo e
cujo enchimento foi em demasia. Ha´ evideˆncia nos dados da amostra sugerindo que o
fabricante tenha um problema com garrafas cheias com falta e excesso de detergente?R.
Na˜o rejeita H0.
10. Dois tipos de pla´sticos sa˜o adequados para por um fabricante de componentes eletroˆnicos.
A resisteˆncia a` quebra desse pla´stico e´ importante. E´ sabido que σ1 = σ2 = 1, 0psi. A
partir de uma amostra aleato´ria de tamanho n1 = 10 e n2 = 12, obtemos x¯1 = 162, 5 e
x¯2 = 155, 0. A companhia na˜o adotara´ o pla´stico 1, a menos que sua resisteˆncia me´dia a`
quebra exceda a`quela do pla´stico 2 por, no mı´nimo, 10 psi. Baseados na informac¸a˜o da
amostra, eles deveriam usar o pla´stico 1? Use α = 5%. R. Rejeita H0.
11. O diaˆmetro de basto˜es de ac¸o, fabricados em duas ma´quinas extrusoras diferentes, esta´
sendo investigado. Duas amostras aleato´rias de tamanho n1 = 15 e n2 = 17 sa˜o sele-
cionadas e as me´dias e as variaˆncias das amostras sa˜o x¯1 = 8, 73, s
2
1 = 0, 35, x¯2 = 8, 68
e s22 = 0, 4 respectivamente. Suponha σ
2
1 = σ
2
2 e que os dados sejam retirados de uma
populac¸a˜o normal. Ha´ evideˆncia que confirme de que as duas ma´quinas produzem basto˜es
com diferentes diaˆmetros me´dios? R. Na˜o rejeita H0.
102
12. Camadas de o´xidos em pastilhas de semicondutores sa˜o atacadas em uma mistura de gases,
de modo a atingir a espessura apropriada. A variabilidade na espessura dessas camadas
de o´xidos e´ uma caracter´ıstica cr´ıtica da pastilha. Uma baixa variabilidade e´ desejada
para as etapas subsequentes do processo. Duas misturas diferentes de gases esta˜o sendo
estudadas para determinar se uma delas e´ superior na reduc¸a˜o da variabilidade de espessura
das camadas de o´xido. Vinte pastilhas sa˜o atacadas com cada ga´s. Os desvios padra˜o das
espessura de o´xido sa˜o s1 = 1, 96 angstrons e s2 = 2, 13 angstrons, respectivamente. Ha´
qualquer evideˆncia que indique ser um ga´s prefer´ıvel em relac¸a˜o ao outro? R. Na˜o rejeita
H0.
13. Um cliente de uma torrefac¸a˜o de cafe´ suspeita que os pesos dos pacotes que deveriam ser
de 500gr na˜o esta˜o corretos. Resolveu, enta˜o retirar uma amostra dos pesos de 16 pacotes:
510 495 500 501 499 503 500 495 492 499 499 497 495 499 501
(a) calcule o peso me´dio e o desvio padra˜o dos elementos da amostra; R.499; 4, 21
(b) o cliente tem raza˜o na suspeita? Use α = 5%. R. Na˜o tem raza˜o. Na˜o rejeita.
14. Um artigo descreve os resultados de testes de tensa˜o quanto a` adesa˜o em 22 corpos de
prova de liga. A carga no ponto de falha do corpo e´ dada a seguir (em MPa)
19, 8 18, 5 17, 6 16, 7 15, 8 15, 4 14, 1 13, 6 11, 9 11, 4
11, 4 8, 8 7, 5 15, 4 15, 4 19, 5 14, 9 12, 7 11, 9 11, 4 10, 1 7, 9
A me´dia amostral e´ x¯ = 13, 71 e s = 3, 55. Os dados seugerem que a carga me´dia na falha
excede 10MPa? (α = 0, 05) R. Sim. Rejeita H0.
15. Lanc¸a-se uma moeda 100 vezes e observa-se que ocorrem 40 caras. Baseado nesse resultado,
podemos afirmar, ao n´ıvel de 5% que a moeda na˜o e´ homesta? R. A moeda e´ desonesta.Rejeita H0.
16. Uma pec¸a ao ser fabricada, foi planejada de tal maneira que uma de suas dimenso˜es e´ 10cm.
A variaˆncia do processo produtivo e´ de 0, 0095cm2. Se uma amostra de 40 pec¸as fornece
essa dimensa˜o me´dia igual a 10, 05cm, devemos rejeitar a hipo´tese nula de que µ = 10cm,
em favor da alternativa µ 6= 10cm?. Usar α = 0, 05. R. Rejeita H0.
17. Uma fa´brica produz certo tipo de reguladores de pressa˜o. Esses reguladores sa˜o produzidos
para suportar uma pressa˜o de 20atm. Um ensaio e´ realizado com uma amostra de 7
103
reguladores de pressa˜o e verificou-se que as presso˜es suportadas sa˜o (em atm)
19, 5 18, 9 19, 0 19, 1 18, 9 19, 3 19, 0
Com base no ensaio realizado, podemos concluir que a pressa˜o suportada e´ na realidade
menor que 20atm? Usar α = 0, 01. R.Rejeita H0.
18. Duas amostras de tubos de ac¸o das marcas A e B foram ensaiadas e as resisteˆncias me´dias
obtidas foram de 40kgf/mm2 e 35kgf/mm2, com variaˆncias de 5, 0 e 4, 0 (kgf/mm2)2,
respectivamente. Sabendo-se que foram ensaiados 15 tubos de cada marca, ha´ evideˆncia,
ao n´ıvel de 1% de que a resisteˆncia me´dia dos tubos da marca A seja maior que a de marca
B? Supor que as variaˆncias populacionais sejam iguais. R. Rejeita H0.
19. Duas ma´quinas A e B produzem parafusos, e sabe-se que as variaˆncias dos comprimentos
dos parafusos sa˜o 25mm2 e 20mm2, respectivamente. Uma amostra de 40 parafusos da
ma´quina A apresentou comprimento me´dio de 30mm, enquanto que uma amostra de 50
parafusos da ma´quina B apresentou me´dia de 25mm. Existe uma diferenc¸a significativa
entre os comprimentos me´dios dos parafusos fabricados pelas duas ma´quinas, ao n´ıvel de
5%? R. Rejeita H0.
20. Foram ensaiadas va´lvulas das marcas A e B, e verificou-se que os tempos de vida (em h)
foram marca A: 1500 1450 1480 1520 1510
marca B: 1000 1300 1180 1250
Pode-se concluir, ao n´ıvel de significaˆncia de 1%, que o tempo me´dio de vida das va´lvulas
de marca A supera o de B em mais de 300h? Supor que os desvios padro˜es populacionais
sa˜o diferentes. R. Na˜o e´ poss´ıvel. Na˜o rejeita H0.
104
Cap´ıtulo 7
ANOVA
7.1 Introduc¸a˜o
A ana´lise de variaˆncia e´ um teste estat´ıstico amplamente difundido entre os analistas, e visa
fundamentalmente verificar se existe uma diferenc¸a significativa entre as me´dias e se os fatores
exercem influeˆncia em alguma varia´vel dependente.
Os fatores propostos podem ser de origem qualitativa ou quantitativa, mas a varia´vel depen-
dente necessariamente devera´ ser cont´ınua.
A principal aplicac¸a˜o da ANOVA (ANalisis Of VAriance) e´ a comparac¸a˜o de me´dias oriundas
de grupos diferentes, tambe´m chamados tratamentos, como por exemplo me´dias histo´ricas de
questo˜es de satisfac¸a˜o, empresas que operam simultaneamente com diferentes rendimentos, entre
muitas outras aplicac¸o˜es.
Existem dois me´todos para calcular-se a variaˆncia: dentro de grupos (MQG) e a variaˆncia das
me´dias (MQR). Em uma Anova, calcula-se esses dois componentes de variaˆncia. Se a variaˆncia
calculada usando a me´dia (MQR) for maior do que a calculada (MQG) usando os dados perten-
centes a cada grupo individual, isso pode indicar que existe uma diferenc¸a significativa entre os
grupos.
Existem dois tipos de problemas a serem resolvidos atrave´s da Anova: a n´ıveis fixos ou a
n´ıveis aleato´rios. A aleatoriedade determinada a questa˜o do problema.
Na grande maioria dos casos trata-se de n´ıveis fixos, afinal o segundo tipo de problema
(aleato´rio) somente surgira´ quando ocorrer um estudo envolvendo uma escolha aleato´ria de fatores
(em 10 lotes de produc¸a˜o, escolhe-se apenas 5, entre 15 ma´quinas de um total de 20, por exemplo).
105
7.1.1 Variac¸a˜o entre e intra grupos
Variac¸a˜o entre os grupos (between-group variation): diferenc¸a entre a me´dia de um grupo em
relac¸a˜o a` me´dia global (tambe´m chamado de efeito de cada grupo).
Variac¸a˜o dentro dos grupos (within-group variation): diferenc¸a entre cada indiv´ıduo em relac¸a˜o
a` me´dia das observac¸o˜es do grupo ao qual pertence (tambe´m chamado de erro de amostragem).
7.1.2 Teste F
E´ a raza˜o da variac¸a˜o entre os grupos e a variac¸a˜o dentro dos grupos
F =
varianciaentreosgrupos/(k − 1)
varianciadentrodosgrupos/(n− k)
Serve para estimar as diferenc¸as entre os dois componentes da variabilidade.
O teste F e´ um “superteste t” que permite a comparac¸a˜o de mais de duas me´dias simultane-
amente.
7.1.3 Valores de F
F pro´ximo de 1,0: as duas estimativas da variaˆncia sa˜o semelhantes e aceita-se H0.
F muito maior que 1,0: existe alguma forc¸a atribu´ıvel para as diferenc¸as dos grupos e rejeita-se
H0.
F calculado < F tabelado = H0 verdadeira
F calculado > F tabelado = H0 recusada
7.1.4 Graus de Liberdade
k–1 = nu´mero de grupos – 1
N–k = nu´mero de observac¸o˜es – nu´mero de grupos
7.1.5 Pressupostos
1. As observac¸o˜es dentro de cada grupo tem distribuic¸a˜o normal;
2. As observac¸o˜es sa˜o independentes entre si;
3. As variaˆncias de cada grupo sa˜o iguais, ou seja, verifica-se a homocedasticidade.
106
7.2 ANOVA - fator u´nico
Exemplo motivador: Foi realizado um experimento para analisar o efeito de um certo pol´ımero na
resisteˆncia da madeira. Foi testado 4 tipos de pol´ımeros A,B,C e D em 3 amostras de madeira.
A tabela mostra a resisteˆncia (kgf) obtida. Fac¸a a ana´lise de variaˆncia para verificar se existe
diferenc¸a significativa entre os pol´ımeros.
A B C D
25 35 41 60
32 28 35 67
27 33 38 59
Pergunta: Sera´ que os tipos de pol´ımeros possuem igual resisteˆncia da madeira???
Para responder a tal questa˜o, devemos realizar o seguinte teste de hipo´tese:{
H0 : µA = µB = µC = µD
H1 : pelo menos uma me´dia diferente.
Para que este teste possa ser realizado, devemos supor que as variaˆncias popoulacionais sejam
iguais (hipo´tese de homocedasticidade).
7.2.1 A ANOVA
Suponha a n´ıveis diferentes de um u´nico fator que queiramos comparar. A resposta para cada
um dos tratamentos e´ uma v.a. Observe a tabela:
tratamentos observacoes totais medias
1 y11 y12 y13 ... y1n y1. y1.
2 y21 y22 y23 ... y2n y2. y2.
3 y31 y32 y33 ... y3n y3. y3.
... ... ... ... ... ... ...
k yk1 yk2 yk3 ... ykn yk. yk.
y.. y..
onde yi. =
∑n
j=1 yij, yi. =
yi.
n
, i = 1, 2, · · · , k
y.. =
∑k
i=1
∑n
j=1 yij, y.. =
y..
N
, N = kn
A ANOVA divide a variabilidade total nos dados da amostra em dois componentes. Enta˜o o
teste de hipo´tese ja´ enunciado e´ baseado na comparac¸a˜o de duas estimativas independentes da
variaˆncia da populac¸a˜o. A variabilidade total nos dados e´ descrita pela soma total dos quadrados
SQTot =
k∑
i=1
n∑
j=1
(yij − y..)2,
107
SQTot= SQTrat + SQRes
ou ainda,
k∑
i=1
n∑
j=1
(yij − y..)2 = n
k∑
i=1
(yi. − y..)2 +
k∑
i=1
n∑
j=1
(yij − yi.)2
simplificando:
SQTot =
∑k
i=1
∑n
j=1 y
2
ij − y
2
..
N
SQTrat =
∑k
i=1
y2i.
n
− y2..
N
SQRes = SQTot− SQTrat
Assim, a tabela da ANOVA e´ dada por:
Fonte variacao Soma quadrados gl me´dia quadrados Fcal
tratamentos SQTrat k − 1 QMTrat = SQTrat
k−1
QMTrat
QMRes
erros SQRes k(n− 1) QMRes = SQRes
k(n−1)
total SQTot kn− 1
onde Fcal ∼ Fα, k−1, k(n−1). O teste leva a rejeic¸a˜o de H0 se Fcal > Fα, k−1, k(n−1).
Agora ja´ estamos aptos a resolver o nosso exemplo motivador!!!
Exemplo motivador: Foi realizado um experimento para analisar o efeito de um certo pol´ımero na
resisteˆncia da madeira. Foi testado 4 tipos de pol´ımeros A,B,C e D em 3 amostras de madeira.
A tabela mostra a resisteˆncia (kgf) obtida. Fac¸a a ana´lise de variaˆncia para verificar se existe
diferenc¸a significativa entre os pol´ımeros.
A B C D
25 35 41 60
32 28 35 67
27 33 38 59
Devemos calcular SQRes, SQTot e SQTrat para podermos completara tabela ANOVA!!!
Com estes resultados completamos a tabela:
108
Fonte variacao Soma quadrados gl me´dia quadrados Fcal
tratamentos
erros
total
Conclusa˜o do teste:
Me´todo de Scheffe`
Existem diversos me´todos para verificar quais me´dias diferem das demais, como: me´todo de
Tukey, de Scheffe`, de Duncan, de contrastes ortogonais.
O me´todo de Scheffe` e´ o mais geral e o mais cmompleto mas perde em precisa˜o para os
demais.
Se duas me´dias µi e µj diferem significativamente, Scheffe` demonstrou que
|x¯i − x¯j| > ∆α
onde
∆α =
√
QMRes
(
1
ni
+
1
nj
)
(k − 1)Fα, k−1, k(n−1)
Do nosso exemplo:
Me´todo de Tukey
O procedimento de Tukey faz uso de outra distribuic¸a˜o, chamada distribuic¸a˜o da amplitude
studentizada, cuja estat´ıstica de teste e´
q =
y¯max − y¯min√
QMTrat/n
onde y¯max e´ a maior me´dia amostral e y¯min e´ a menor me´dia amostral entre p me´dias amostrais.
Seja qα(a, f) o ponto percentual α superior de q, onde a e´ o nu´mero de tratamentos e f e´ o
109
nu´mero de graus de liberdade para o erro. Duas me´dias, y¯i. e y¯j., (i 6= j), sa˜o consideradas
significantemente diferentes se
|y¯i. − y¯j.| > Tα
onde
Tα = qα(a, f)
√
QMRes
n
Os valores de qα(a, f) para α = 0, 05 e α = 0, 01 e uma selec¸a˜o de valores para a e f esta˜o em
uma tabela.
O procedimento de Tukey tem a propriedade de que o n´ıvel de significaˆncia geral e´ exatamente
α para tamanhos amostrais iguais e e´ no ma´ximo α para tamanhos amostrais diferentes.
7.3 ANOVA - fator duplo sem repetic¸a˜o
Nesse modelo, os elementos sa˜o classificados segundo dois crite´rios, ou seja, existem duas carac-
ter´ısticas de interesse que devera˜o ser testadas simultaneamente, constituindo duas classificac¸o˜es
cruzadas.
Notac¸o˜es utilizadas:
xij : elemento da i−e´sima linha e j−e´sima coluna
x¯i. : me´dia da i−e´sima linha
x¯.j : me´dia da j−e´sima coluna
x¯ : me´dia total
k : nu´mero de colunas
n : nu´mero de linhas
Testes a serem realizados
para as linhas:
I :
{
H01, µ1. = µ2. = · · ·µn.
H11, pelo menos uma das me´dias e´ diferente das demais
para as colunas:
II :
{
H02, µ.1 = µ.2 = · · ·µ.k
H12, pelo menos uma das me´dias e´ diferente das demais
Uma tabela de dados e´ como:
110
L C C1 C2 · · · Cj · · · Ck soma lin soma lin qud
L1 x11 x12 · · · x1j · · · x1k T1. Q1.
L2 x21 x22 · · · x2j · · · x2k
...
...
... · · · ... · · · ...
Li xi1 xi2 · · · xij · · · xik
...
...
... · · · ... · · · ...
Ln xn1 xn2 · · · xnj · · · xnk
soma col T.1 T
soma col qud Q.1 Q
Aqui, Ti. =
∑k
j=1 xij, Qi. =
∑k
j=1 x
2
ij,
T.j =
∑n
i=1 xij, Q.j =
∑n
i=1 x
2
ij
T = soma total, Q = soma total dos quadrados
x¯i. =
Ti.
k
= me´dia da i−e´sima linha
x¯.j =
T.j
n
= me´dia da j−e´sima coluna
¯¯x = T
nk
= me´dia de todos os valores
Aqui SQTot = SQL+ SQC + SQRes
onde SQTot = Q− T 2
nk
, SQC =
∑k
j=1
T 2.j
n
− T 2
nk
, SQL =
∑n
i=1
T 2i.
k
− T 2
nk
Assim a ANOVA e´ como:
Fonte variacao S.Q. gl Q.M Fcal
entre linhas SQL n− 1 QML = SQL
n−1 Fi =
QML
QMRes
entre colunas SQC k − 1 QMC = SQC
k−1 Fj =
QMC
QMRes
residual(dentro) SQRes (n− 1)(k − 1) QMRes = SQRes
(n−1)(k−1)
total SQTot
Concluso˜es: Teste I : rejeitar H0 se Fcal > Fn−1, (n−1)(k−1) e,
Teste II : rejeitar H0 se Fcal > Fk−1, (n−1)(k−1) e,
Agora podemos resolver um exemplo!!!
Exemplo: Foram analisados 3 marcas diferentes de cimentos A,B e C similares entre si, para
saber qual seria o melhor em termos de rendimento e fixac¸a˜o. Para isso, estes cimentos foram
utilizados por 4 pedreiros, e para cada marca foi atribu´ıda uma nota, analisando os quesitos
(rendimento e fixac¸a˜o). Com esses dados fac¸a uma ana´lise de variaˆncia e conlua se existe diferenc¸a
significativa para as me´dias atribu´ıdas pelos pedreiros e entre os cimentos A,B e C.
111
Pedreiro A B C
I 45 48 60
II 90 69 78
III 79 57 77
IV 82 70 97
7.4 ANOVA - fator duplo com repetic¸a˜o
Exemplo motivador: Foram observados os tempos, em segundos, gastos por quatro opera´rios para
montar certa pec¸a segundo treˆs me´todos diferentes. Cada opera´rio montou duas pec¸as segundo
cada me´todo, sendo os resultados fornecidos a seguir. E´ considerada admiss´ıvel a existeˆncia de
interac¸a˜o entre opera´rios e me´todos. Verificar, pela ANOVA, se existe diferenc¸a significativa
entre os me´todos e/ou entre os opera´rios.
operarios
1 2 3 4
I 54 46 55 51
52 47 54 60
metodos II 59 61 59 56
57 55 61 57
III 59 63 63 59
62 58 61 60
A ANOVA para este teste e´ como:
112
F.V. S.Q. gl Q.M. Fcalc
entre linhas SQL =
∑n
i=1
T 2i..
kr
− T 2
nkr
n− 1 QML = SQL
n−1 Fl =
QML
QMRes
entre colunas SQC =
∑k
j=1
T 2.j.
nr
− T 2
nkr
k − 1 QMC = SQC
k−1 Fcol =
QMC
QMRes
interacao SQI = SQTr − SQL− SQC (k − 1)(n− 1) QMI = SQI
(k−1)(n−1) Fi =
QMI
QMRes
entre tratamentos SQTr =
∑n
i=1
∑k
j=1
T 2ij.
r
− T 2
nkr
nk − 1 QMTr = SQTr
nk−1
residual SQRes = SQTot− SQTr nk(r − 1) QMRes = SQRes
nk(r−1)
total SQTot = Q− T 2
nkr
nkr − 1
Nota: r = nu´mero de repetic¸o˜es.
Aqui as hipo´teses sa˜o as mesmas para o caso sem repetic¸a˜o, mas aqui ainda podemos testar
o fato de haver interac¸a˜o entre as linhas e colunas.
Usaremos o Excel para resolver este exerc´ıcio:
Conclusa˜o:
7.5 Exerc´ıcios
1. Para testar a tensa˜o de ruptura de tijolos similares de seis furos de 3 olarias diferentes,
foram colhidos 3 tijolos de cada olaria para a verificac¸a˜o. Exercendo uma pressa˜o em cada
tijolo para constatar a resisteˆncia, foram obtidos os dados abaixo. Pode-se afirmar que
existe diferenc¸a significativa da tensa˜o de ruptura entre os tijolos das olarias? R. na˜o existe
diferenc¸a.
113
Olaria A Olaria B Olaria C
117 115 118
120 110 123
114 116 119
2. A tabela apresenta as resisteˆncias de corpos de prova onde e´ testado 4 tipos diferentes de
ceraˆmicas. Determinar ao n´ıvel de 1%, se existe diferenc¸a significativa nas resisteˆncias dos
4 tipos de ceraˆmicas, ou seja, qual ceraˆmica oferece maior resisteˆncia? A resisteˆncia e´ dada
em MPa. R. A ceraˆmica D.
Ceraˆmica A Ceraˆmica B Ceraˆmica C Ceraˆmica D
8,5 9,1 4,9 7,5
6,4 8,7 6,5 7,9
7,1 7,6 5,7 9,7
7,4 7,9 5,2 10,1
Use a tabela a seguir e conisidere a ANOVA:
3. Para comparar a absorc¸a˜o de a´gua dentro de quatro tipos de massa ceraˆmica, analisaram-se
corpos de prova de treˆs fornadas. Em cada fornada, era analisado um corpo de prova de
cada tipo de massa ceraˆmica. Os resultados (porcentagem de absorc¸a˜o de a´gua) foram:
Fornada C1 C2 C3 C4
1 1,2 1,5 1,1 2,1
2 2,1 2,1 1,3 2,7
3 1,5 1,9 1,3 2,4
Os dados mostram evideˆncia suficiente para garantir diferenc¸a na porcentagem esperada
de absorc¸a˜o de a´gua nos quatro tipos de massa ceraˆmica? E nos tipos de fornadas? Para
este exerc´ıcio, considere os dados da tabela abaixo: R. Existe diferenc¸a entre fornadas e
massa ceraˆmica.
114
4. A anemia e´ uma doenc¸a que afeta muitas pessoas e que pode ter diversas origens. Pretendendo-
se avaliar poss´ıveis diferenc¸as entre diferentes tratamentos de estados aneˆmicos, planejou-se
uma experieˆncia com 120 indiv´ıduos aneˆmicos, divididos aleatoriamente em treˆs grupos de
40, aos quais se atribuiu a cada um, um dos tratamentos. O primeiro tratamento era
constitu´ıdo apenas por uma dieta rica em ferro. O segundo tratamento combinava um
suplemento de ferro com a dieta do primeiro tratamento e o u´ltimo acrescentava um com-
plexo vitamı´nico. No sentido de avaliar poss´ıveis diferenc¸as entre os tratamentos, efetuou-se
uma ANOVA com base nos valores de hemoglobina dos 120 indiv´ıduos apo´s um per´ıodo
de 3 meses de tratamento. Os resultados da ANOVA encontram-se na tabelaseguinte.
Complete a tabela nos espac¸os apropriados.
F.V. S.Q. g.l. Q.M. Fcal
Entre grupos 1,522
Dentre grupos 121,403
Total 122,925
5. Com o intuito de estudar a influeˆncia da temperatura ambiente na capacidade de trabalho
das pessoas, 80 estudantes universita´rios foram divididos em 4 grupos equilibrados que
115
foram sujeitos a 4 temperaturas selecionadas ao acaso. Cada aluno teve que responder
a um conjunto de 150 questo˜es simples tendo sido contabilizado o nu´mero de respostas
corretas. Os resultados encontram-se no ficheiro Respostas.sav.
Considerando que sa˜o va´lidos os pressupostos de realizac¸a˜o de uma ANOVA parame´trica,
conduza uma ANOVA de efeitos aleato´rios e retire concluso˜es (α = 0, 05). Escreva as
hipo´teses em causa, registre o valor da estat´ıstica de teste, conclua. No caso de concluir
que a temperatura influencia a capacidade de trabalho, fornec¸a uma estimativa da variaˆncia,
σ2.
T1 T2 T3 T4
142 120 100 50
130 121 105 70
112 110 98 60
122 111 97 61
131 130 96 62
109 121 102 51
140 129 101 52
138 128 95 57
127 123 94 60
148 110 93 61
108 137 100 53
109 140 102 58
117 121 95 54
131 123 94 62
135 117 78 63
123 119 92 67
139 139 85 69
140 140 80 78
147 139 70 80
143 135 71 51
6. Foi realizada uma experieˆncia para testar o efeito da alimentac¸a˜o na aprendizagem. Para o
efeito separou-se uma turma em quatro grupos: um grupo de controle ao qual foi fornecida
bebida e comida a` discric¸a˜o, um outro grupo ao qual se forneceu apenas comida, um grupo
que apenas ingeriu bebidas e um quarto grupo que na˜o teve direito nem a comer nem a
beber. Em seguida, os alunos assistiram a uma aula sobre a ANOVA no Excel. No final,
cada aluno realizou um teste cujos resultados se encontram a seguir.
116
Grupo A Grupo B Grupo C Grupo D
98 90 89 56
90 87 90 67
95 92 86 54
100 95 96 23
(a) Construa caixas de bigodes comparativas e observe as diferenc¸as entre os grupos.
(b) Efectue uma ANOVA parame´trica para averiguar se existem diferenc¸as significativas
entre os grupos, ao n´ıvel de significaˆncia de 5%.
(c) Escreva as hipo´teses em causa;
(d) Registe o valor da estat´ıstica de teste;
(e) Conclua.
7. Uma empresa deseja adquirir certa ma´quina e verificou que existem na prac¸a 4 marcas
diferentes: A,B,C e D que satisfazem. Decidiu-se que sera´ comprada a ma´quina que
apresentar o melhor rendimento. Foi realizado um ensaio com 4 ma´quinas em per´ıodos
iguais durante 5 dias. Com relac¸a˜o ao rendimento, existe diferenc¸a significativa entre as
ma´quinas ao n´ıvel de 5%?
A B C D
120 119 125 123
123 121 127 121
121 118 128 121
125 120 127 120
122 123 128 120
8. Os dados abaixo sa˜o de um experimento inteiramente ao acaso, onde 5 processos de es-
tocagem foram usados em um produto perec´ıvel por absorc¸a˜o de a´gua. Vinte e cinco
exemplares deste produto foram divididos em cinco grupos, e apo´s uma semana mediu-se a
quantidade de a´gua absorvida. Os resultados codificados esta˜o abaixo. Existem evideˆncias
que os processos de estocagem produzem resultados diferentes? Caso haja, calcule Tukey.
Processo A Processo B Processo C Processo D Processo E
8 4 1 4 10
7 -2 2 6 8
6 0 0 5 7
5 -2 -1 5 4
8 3 -3 4 9
117
9. Os dados abaixo mostram a produc¸a˜o de milho em kg/100m2, segundo a variedade. Fac¸a
a ANOVA para comparar se existe diferenc¸a significativa entre as variedades do milho na
produc¸a˜o. Caso haja, fac¸a os testes de Tukey e Scheffe`.
Variedade A Variedade B Variedade C Variedade D
34 26 37 23
26 37 45 28
33 42 39 30
36 34 41 37
31 36 53 32
10. Um engenheiro suspeita que o acabamento da superf´ıcie de uma pec¸a de metal seja influ-
enciado pelo tipo de pintura usada e pelo tempo de secagem. Ele seleciona treˆs tempos
de secagem - 20, 25 e 30 minutos - e seleciona aleatoriamente dois tipos de pintura den-
tre as va´rias dispon´ıveis. Ele realiza um experimento e obte´m os dados mostrados aqui.
Analise-os e tire concluso˜es. Estime os componentes da variaˆncia.
Tempo de secagem
Pintura 20 25 30
74 73 78
1 64 61 85
50 44 92
92 98 66
2 86 73 45
68 88 85
11. Estudam-se os fatores que influenciam a forc¸a de ruptura de um fio de cobre. Quatro
ma´quinas e treˆs operadores sa˜o escolhidos aleatoriamente e roda-se um experimento que
usa partes do mesmo pedac¸o de fio medindo um metro. Os resultados sa˜o os seguintes:
Ma´quina
Operador 1 2 3 4
A 109 110 108 110
110 115 109 116
B 111 110 111 114
112 111 109 112
C 109 112 114 111
111 115 109 112
Teste em relac¸a˜o a interac¸o˜es e efeitos principais ao n´ıvel de 5%.
118
12. Uma companhia emprega engenheiros para estudos de tempo. Sua supervisora deseja de-
terminar se os padro˜es estabelecidos por eles sa˜o influenciados por uma interac¸a˜o entre
engenheiros e operadores. Ela seleciona treˆs operadores aleatoriamente e realiza um exper-
imento no qual os engenheiros estabelecem padro˜es de tempo para uma mesma tarefa. Ela
obte´m os dados a seguir. Analise-os e tire concluso˜es.
Operador
Engenheiro 1 2 3
1 2,59 2,38 2,40
2,78 2,49 2,72
2 2,15 2,85 2,66
2,86 2,72 2,87
119
Cap´ıtulo 8
Controle Estat´ıstico de processos
A estat´ıstica fornece ferramentas fundamentais para o controle e gerenciamento eficazes de setores
produtivos ou processos. Controle pode ser definido como o ato ou efeito de dominar ou fiscalizar
determinadas atividades de pessoas, setores, departamentos, processos ou produtos entre outros,
para que estas atividades atendam as especificac¸o˜es ou planejamentos pre´-determinados.
Segundo BRASSARD (2001, P.85) controle estat´ıstico e´ definido como ”... a condic¸a˜o do
processo na qual as causas foram removidas, depois de evidenciadas, pelas cartas de controle, a
na˜o ocorreˆncia de pontos fora de limites de controle e a na˜o ocorreˆncia de modelos na˜o aleato´rios
ou tendeˆncias dentro destes limites.
8.1 CARTAS DE CONTROLE
E´ uma das principais te´cnicas do controle estat´ıstico de processo ou CEP. A carta de controle
e´ uma apresentac¸a˜o gra´fica de uma caracter´ıstica da qualidade que foi medida ou calculada a
partir da amostra versus o nu´mero da amostra ou tempo. A carta de controle conte´m uma linha
central, representando o valor me´dio da caracter´ıstica da qualidade que corresponde ao estado
sob controle (isto e´, apenas as causas aleato´rias esta˜o presentes), duas outras linhas horizontais,
chamadas o limite superior de controle (LSC) e limite inferior de controle (LIC), como mostrado
na figura a seguir.
Esses limites de controle sa˜o escolhidos de modo que, se o processo esta´ sob controle, prati-
camente todos os pontos amostrais estara˜o entre eles. Se os pontos estiverem entre os limites de
controle, o processo e´ considerado sob controle, e na˜o e´ necessa´ria qualquer ac¸a˜o. No entanto,
um ponto que caia fora dos limites de controle e´ interpretado como evideˆncia de que o processo
esta´ fora de controle, sendo necessa´rias investigac¸a˜o e ac¸a˜o corretiva para encontrar e eliminar
120
a causa ou causas responsa´veis por esse comportamento. E´ costume unir os pontos amostrais
na carta de controle por segmentos de reta, de modo a facilitar a visualizac¸a˜o da evoluc¸a˜o da
sequ¨eˆncia de pontos ao longo do tempo.
8.1.1 Ana´lise de Padro˜es em Cartas de Controle
A carta de controle e´ uma ferramenta muito u´til no aperfeic¸oamento de um processo e a sua
utilizac¸a˜o e interpretac¸a˜o deve ser feita cuidadosamente, pois a mesma pode indicar uma condic¸a˜o
fora de controle quando um ou mais pontos se localizam fora dos limites de controle, ou, ale´m
disso, quando os pontos exibem um comportamento na˜o-aleato´rio.
Em geral, ha´ uma raza˜o pela qual um padra˜o na˜o-aleato´rio particular aparece em uma carta
de controle, e se puder ser descobertoe eliminado, o desempenho do processo pode ser melhorado.
O reconhecimento de ocorreˆncia de padro˜es em uma carta de controle se da´ pela existeˆncia
de uma sequ¨eˆncia de pontos, ou seja, por uma fila de observac¸o˜es do mesmo tipo, podendo ser
estabelecidos em ordem crescente ou em ordem decrescente. Embora as sequ¨eˆncias sejam uma
medida importante de comportamento na˜o-aleato´rio em uma carta de controle, outros tipos de
padro˜es podem, tambe´m indicar uma condic¸a˜o fora de controle. A habilidade para interpretar
um padra˜o particular requer experieˆncia e conhecimento do processo.
8.1.2 Usos Ba´sicos das Cartas de Controle
As cartas de controle sa˜o aplicadas para:
1. Verificar se em determinado per´ıodo um processo estava sob controle.
2. Orientar a Administrac¸a˜o na manutenc¸a˜o do processo sob controle, verificando com atenc¸a˜o
a` ocorreˆncia de uma tendeˆncia em alguma direc¸a˜o ou padro˜es sistema´ticos.
121
Ha´ pelo menos cinco razo˜es para a popularidade das cartas de controle:
1. a carta de controle e´ uma te´cnica para melhorar a produtividade, pois: reduz desperd´ıcio
de insumos, reduz o retrabalho e consequ¨entemente aumenta a produtividade, diminui os
custos e finalmente a capacidade de produc¸a˜o aumenta (medida em nu´meros de artigos
bons por hora);
2. a carta de controle e´ eficaz na prevenc¸a˜o de defeituosos, pois ajuda a manter o processo sob
controle e, portanto coerente com a filosofia ”fac¸a certo na primeira vez”. Se a empresa na˜o
tem um processo eficiente, o cliente esta´ pagando algue´m para produzir artigos inadequados;
3. a carta de controle impede ajustamentos desnecessa´rios no processo, pois distingue entre
ru´ıdo aleato´rio e variac¸a˜o anormal. Nenhum outro meio, inclusive o operador humano e´
eficiente nesta distinc¸a˜o. Se o processo e´ ajustado sem base na carta de controle, frequ¨en-
temente, o que ocorre e´ um aumento da variaˆncia do ru´ıdo aleato´rio e isto pode resultar
na deteriorac¸a˜o do desempenho do processo. Assim, a carta de controle e´ coerente com a
filosofia ”se ele na˜o esta´ quebrado, na˜o o conserte”;
4. a carta de controle fornece informac¸o˜es para que o operador fac¸a um diagno´stico sobre o
processo, podendo conduzir a` implantac¸a˜o de uma mudanc¸a que melhore o desempenho do
processo;
5. a carta de controle fornece informac¸a˜o sobre a capacidade do processo, revelando o valor de
importantes paraˆmetros do processo e sua estabilidade no tempo e, assim, uma estimativa
da capacidade do processo pode ser feita. Esta informac¸a˜o e´ muito u´til para quem projeta
o produto e o processo.
As cartas de controle esta˜o entre as mais importantes ferramentas de controle e gerenciamento,
sendo ta˜o importantes quanto os controles de custo e de material.
8.2 TIPOS DE CARTAS DE CONTROLE
Va´rios tipos de cartas de controle sa˜o utilizados com o objetivo de monitorar o processo e,
consequ¨entemente, verificar se variac¸o˜es de fatores particulares esta˜o presentes no processo. Uma
carta de controle varia conforme os dados que ela contenha:
1. Se os dados sa˜o cont´ınuos (geralmente medidas f´ısicas) ela devera´ ser constru´ıda com a
me´dia amostral e com amplitude amostral R ou desvio padra˜o s.
122
2. Se os dados sa˜o discretos ela devera´ ser constru´ıda com as estat´ısticas amostrais: nu´mero de
defeituosos ou com a frac¸a˜o de defeituosos ou ainda com o nu´mero de defeitos por unidade
do produto.
As cartas de controle podem ser classificadas como:
1. Carta de controle por varia´veis;
2. Carta de controle para atributos.
8.2.1 Carta de Controle por Varia´veis
E´ utilizada quando a Administrac¸a˜o esta´ interessada na evoluc¸a˜o de uma caracter´ıstica quanti-
tativa cont´ınua. Este tipo de carta controla tanto o valor me´dio do desempenho do processo, por
meio da Carta , como a variabilidade do processo, por meio da Carta S ou o que e´ mais comum,
pela Carta da Amplitude R.
8.2.2 Carta x¯
E´ utilizada quando um processo de produc¸a˜o e´ medido em termos do valor me´dio de uma varia´vel.
LC = x¯
LIC = x¯− A2R¯
LSC = x¯+ A2R¯
A quantidade A2 e´ uma constante que depende apenas da amostra n, logo pode ser tabelada.
Tamanho da amostra n
n 2 3 4 5 6 7 8 9 10 N 25
A2 1,88 1,023 0,729 0,577 0,483 0,419 0,373 0,337 0,308 N 0,153
Aplicac¸a˜o da carta x¯
Exemplo 1: Numa indu´stria de conservas populares, e´ produzido um tipo de doce de con-
sumo popular, cujo peso final varia muito. Como a empresa esta´ ampliando os seus pontos de
venda (come´rcio em geral) e como a legislac¸a˜o obriga que no ro´tulo venha constando o peso
l´ıquido do produto e e´ aceita uma variac¸a˜o, optaram por acompanhar a produc¸a˜o durante um
nu´mero de semanas e a cada dia retiravam uma amostra do lote de fabricac¸a˜o e realizavam a sua
pesagem, compondo a lista de verificac¸a˜o abaixo.
123
Semana Peso Peso Peso Peso Peso Total Media por semana Amplitude
1 55 75 65 80 80
2 90 95 60 60 55
3 100 75 75 65 65
4 70 110 65 60 60
5 55 65 95 70 70
6 75 85 65 65 65
7 120 110 65 85 70
8 65 65 90 90 60
9 70 85 60 65 75
Resoluc¸a˜o:
8.2.3 Carta R
E´ utilizada quando o processo de produc¸a˜o e´ medido em termos da amplitude de uma varia´vel.
Como a amplitude R esta´ relacionada com o desvio padra˜o do processo, a variabilidade do
processo pode ser controlada por meio do gra´fico dos valores da amplitude amostral R, para
sucessivas amostras. Os limites de controle a 3 desvios padro˜es sa˜o dados por:
LC = R¯
LIC = R¯D3
LSC = R¯D4
As quantidades D3 e D4 podem ser tabeladas de modo que se tem:
Tamanho da amostra n
n 2 3 4 5 6 7 8 9 10 N 25
D3 0 0 0 0 0 0,076 0,136 0,184 0,223 N 0,459
D4 3,267 2,575 2,282 2,115 2,004 1,924 1,864 1,816 1,777 N 1,541
124
Aplicac¸a˜o da carta R
Exemplo 2: Construa a carta R para o problema apresentado no exemplo 1.
8.2.4 Carta s
Embora as cartas x¯ e R sejam bastante usadas, algumas vezes torna-se deseja´vel estimar di-
retamente o desvio padra˜o do processo em vez de indiretamente atrave´s do uso da amplitude
R.
Os limites de controle sa˜o:
LIC = B3S¯
LC = S¯
LIC = B4S¯
onde B3 e B4 sa˜o tabelados.
Tamanho da amostra n
n 2 3 4 5 6 7 8 9 10 N 25
B3 0 0 0 0 0,030 0,118 0,185 0,239 0,284 N 0,565
B4 3,267 2,568 2,266 2,089 1,970 1,882 1,815 1,761 1,716 N 1,435
Aplicac¸a˜o da carta S
Exemplo 3: Construa a carta R para o problema apresentado no exemplo 1.
125
8.2.5 Carta de Controle para Medidas Individuais
Existem casos onde o tamanho da amostra para o monitoramento do processo e´ n = 1, ou seja,
a amostra consiste de uma unidade individual. Como por exemplo, toda a unidade fabricada
e´ inspecionada de modo que na˜o ha´ raza˜o para formar subgrupos, a taxa de produc¸a˜o e´ muito
lenta, entre outras. Em tais situac¸o˜es a carta de controle para unidades individuais e´ u´til. Nesse
tipo de carta de controle, e´ comum utilizar a amplitude mo´vel de duas observac¸o˜es consecutivas
como base para estimar a variabilidade do processo.
A amplitude mo´vel e os limites de controle sa˜o definidos como:
Amplitude Mo´vel −→MRi = |xi − xi−1|
LSC = x¯+ 3
M¯R
d2
LC = x¯
LIC = x¯− 3M¯R
d2
E´ necessa´rio observar que M¯R e´ a me´dia das amplitudes mo´veis de duas observac¸o˜es e x¯ e´
a me´dia amostral. Ale´m disso, se uma amplitude mo´vel de n = 2 observac¸o˜es e´ usada, enta˜o
d2 = 1, 128.
Aplicac¸a˜o da carta para medidas individuais
Exemplo 4: A Companhia de Saneamento do Estado do Parana´ - Sanepar, realiza o controle
dia´rio de va´rias caracter´ısticas de qualidade da a´gua tratada, entre essas caracter´ısticas esta´ a
turbidez, determinada a partir da quantidade de organismos em suspensa˜o na a´gua. De acordo
com o ministe´rio da sau´de o valor ma´ximo permitido para essa caracter´ıstica e´ de 1,0uT para
que a a´gua seja considerada pota´vel. No dia 15/12/2006 foram coletadas de hora em hora as
seguintes amostras:
126
N. da amostra Ana´lise da Turbidez N. da amostra Ana´lise da Turbidez
1 0,64 13 0,62
2 0,64 14 0,50
3 1,13 15 0,48
4 1,20 16 0,50
5 1,04 17 0,63
6 0,72 18 0,64
7 1,00 19 0,66
8 0,61 20 0,74
9 0,57 21 0,53
10 0,78 22 0,75
11 0,64 23 0,67
12 0,64 24 0,80
8.3 Carta de Controle por Atributos
Ha´ situac¸o˜es em que se tem um atributo do produto. O atributo pode ser “defeituoso” ou “na˜o
defeituoso”. As quatro cartas de controle por atributos mais utilizadas sa˜o:
8.3.1 Carta P
Considera como medida de qualidade a frac¸a˜o de defeituosos produzidos pelo processo, ou seja,
considera a raza˜o entre o nu´mero de itens defeituosos e o total de itens. Esses itens podem
apresentar va´rias caracter´ısticas distintas que sa˜o examinadas concomitantemente, se no teste
de qualquer destas caracter´ısticas o item em considerac¸a˜o falhar este sera´ classificado como
defeituoso. Os limites de controle sa˜o:
LSC = p¯+ 3
√
p¯(1− p¯)
n
LC = p¯
LIC = p¯− 3
√
p¯(1− p¯)
n
onde p¯ e´ a estimativa da frac¸a˜o na˜o-conforme (defeituosos) do processo.
Aplicac¸a˜o da carta P
Exemplo 5: O nu´mero de interruptores na˜o-conformes em amostras de tamanho 100 e´
mostrado na tabela a seguir. Construa uma carta de controle para verificar se o processo esta´
sob controle. Se na˜o, suponha que causas atribu´ıveis possam ser encontradas e calcule os limites
de controle revisados.
127
amostra N. de interruptores nao-conforme amostra N. de interruptores nao-conforme
1 7 11 6
2 4 12 15
3 1 13 0
4 3 14 9
5 6 15 5
6 8 16 1
7 10 17 4
8 5 18 5
9 2 19 7
10 7 20 12
8.3.2 Carta NP
E´ similar a Carta P , com a diferenc¸a que o que se deseja e´ marcar o nu´mero de itens defeituosos
na amostra. Se na˜o se dispo˜e de um valor padra˜o para p, enta˜o p¯ pode ser usado para estimar p.
LSC = np¯+ 3
√
np¯(1− p¯)
LC = np¯
LIC = np¯− 3
√
np¯(1− p¯)
Aplicac¸a˜o da carta NP
Exemplo 6: Repita o exemplo 5, construindo a carta NP .
128
8.3.3 Carta C
Um item e´ considerado defeituoso quando na˜o satisfaz uma ou va´rias especificac¸o˜es. Em con-
sequ¨eˆncia, um item defeituoso ira´ conter pelo menos um defeito. Em va´rias situac¸o˜es e´ poss´ıvel
que uma unidade do produto apresente mais de uma na˜o-conformidade. Portanto, a carta C
considera como medida de qualidade o nu´mero de na˜o-conformidades (defeitos) por unidade do
produto.
A me´dia da v.a. X e´ o paraˆmetro c e a variaˆncia tambe´m e´ c, logo o desvio padra˜o
√
c e os
limites de controle a 3 desvios padro˜es, sa˜o:
LSC = c+ 3
√
c
LC = c
LIC = c− 3√c
Caso o limite inferior de controle especificado acima se torne negativo assume valor zero.
Aplicac¸a˜o da carta C
Exemplo 7: A tabela abaixo apresenta o nu´mero de na˜o-conformidades encontradas na
inspec¸a˜o final em aparelhos de DVD. Voceˆ pode concluir que o processo esta´ sob controle es-
tat´ıstico? Qual a linha central e quais os limites de controle que voceˆ recomenda para a produc¸a˜o
futura?
n. aparelho n. nao-conformidades n. aparelho n. nao conformidades
2412 0 2421 1
2413 1 2422 0
2414 1 2423 3
2415 0 2424 2
2416 2 2425 8
2417 1 2426 6
2418 1 2427 2
2419 5 2428 1
2420 2 2429 1
129
8.3.4 Carta U
Considera como medida de qualidade o nu´mero de na˜o-conformidades por unidade de inspec¸a˜o.
Os limites de controle desta carta:
LSC = u¯+ 3
√
u¯
n
LC = u¯
LIC = u¯− 3
√
u¯
n
onde u¯ e´ a me´dia do nu´mero me´dio de defeitos por unidade de inspec¸a˜o em m amostras de
tamanho n.
Aplicac¸a˜o da carta U
Exemplo 8: Os dados a seguir representam o nu´mero de na˜o-conformidades por 1000m em
cabos de telefone. O processo esta´ sob controle estat´ıstico?
amostra n. nao-conformidades amostra n. nao conformidades
1 1 11 24
2 1 12 6
3 3 13 9
4 7 14 11
5 8 15 15
6 10 16 8
7 5 17 3
8 13 18 6
9 0 19 7
10 19 20 4
130