Buscar

Caderno_Didatico

Prévia do material em texto

Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística -UFSM UFS 
 
 
 
 
ANAELENA BRAGANÇA DE MORAES 
LUCIANE FLORES JACOBI 
ROSELAINE RUVIARO ZANINI 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 CADERNO DIDÁTICO 
ESTATÍSTICA 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Santa Maria 
UFSM 
2008
 Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística -UFSM UFS 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 Ficha catalográfica elaborada por Rosa Maria Fristsch Feijó CRB-10/662 
 Biblioteca Central – UFSM
E84e Moraes, Anaelena B.
 Estatística : caderno didático / Anaelena B. Moraes, Luciane
 F. Jacobi, Roselaine R. Zanini. – Santa Maria : UFSM, CCNE, De
partamento de Estatística, 2001.
 56 p.
 1. Estatística I. Jacobi, Luciane F. II. Zanini, Roselaine R.
 III. Título.
 CDU : 519.22/.25:311
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM i
 
 
Sumário 
 
 
1 - Conceitos Iniciais 1
1.1 Conceito de estatística 1
1.2 Divisão da estatística 1
1.3 População 1
1.4 Amostra 2
1.5 Dados estatísticos 2
1.6 Variável 2
1.7 Níveis de mensuração de uma variável 2
1.8 Arredondamento de dados 3
1.9 Método estatístico 4
1.10 Representação tabular 5
1.11 Séries estatísticas 5
1.12 Representação gráfica 6
 
2 – Distribuições de Freqüências 8
 Representação de variáveis 8
 1.1 Discretas 8
 1.2 Contínuas 8
2 Alguns conceitos básicos 9
 2.1 Dados brutos 9
 2.2 Rol 9
 2.3 Amplitude total 9
 2.4 Classe 9
 2.5 Limites de classe 9
 2.6 Amplitude de classe 9
 2.7 Ponto médio de classe 9
 2.8 Tipos de freqüências 9
 2.9 Exemplos de distribuições de freqüências 10
 2.10 Gráficos representativos de uma distribuição de freqüências em classes 10
 
3 – Medidas Descritivas 14
 Introdução 14
2 Medidas de tendência central 14
 2.1 Média aritmética 14
 2.2 Mediana 15
 2.3 Moda 16
3 Separatrizes 17
 3.1 Quartis 17
 3.2 Decis 18
 3.3 Percentis 19
4 Medidas de dispersão 19
 4.1 Amplitude de variação 19
 4.2 Desvio médio 20
 4.3 Soma de quadrados 20
 4.4 Variância 20
 4.5 Desvio padrão 22
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM ii
 4.6 Coeficiente de variação 22
5 Assimetria e curtose 22
 5.1 Assimetria 22
 5.2 Curtose 23
 
4 – Probabilidade 25
1 Introdução 25
2 Noções de experimento, espaço amostral e eventos 25
 2.1 Experimento aleatório 25
 2.2 Espaço amostral 25
 2.3 Evento 25
3 Álgebra de eventos 25
4 Conceitos de probabilidade 26
 4.1 Conceito empírico 26
 4.2 Definição clássica de probabilidade 26
 4.3 Definição axiomática 27
5 Probabilidade condicionada 27
6 Independência estatística 28
7 Teorema de Bayes 29
8 Resumo das propriedades do cálculo de probabilidades 29
 
5 – Variáveis Aleatórias 30
1 Noções sobre variáveis aleatórias 30
2 Variáveis aleatórias discretas 30
 2.1 Função de probabilidade 30
 2.2 Valor esperado ou média de uma variável aleatória discreta 30
 2.3 Variância de uma variável aleatória discreta 31
3 Variáveis aleatórias contínuas 31
 3.1 Função densidade de probabilidade 31
 3.2 Valor esperado ou média de uma variável aleatória contínua 32
 3.3 Variância de uma variável aleatória contínua 32
4 Modelos probabilísticos para variáveis aleatórias 32
 4.1 Distribuição binomial 32
 4.2 Distribuição de Poisson 33
 4.3 Distribuição normal 34
 4.4 Distribuição Qui-quadrado (χ2) 35
 4.5 Distribuição “t” de Student 36
 4.6 Distribuição “F” (Fisher) 36
 
6 – Amostragem 37
1 Introdução 37
 1.1 Definição de amostragem 37
 1.2 Importância da utilização da amostragem 37
 1.3 Situações em que pode não valer à pena a realização de uma amostragem 37
 1.4 Tipos de investigação 37
2 Tipos de amostragem probabilistica 38
 2.1 Amostragem aleatória simples 38
 2.2 Amostragem sistemática 38
 2.3 Amostragem estratificada 39
3 Distribuição por amostragem 39
 3.1 Amostragem com ou sem reposição 40
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM iii
 3.2 Distribuição amostral das médias 40
4 Determinação do tamanho da amostra 40
 4.1 Para estimar a média populacional 40
 4.2 Para estimar uma proporção populacional 42
 
7 – Estimação de Parâmetros 43
1 Introdução 43
2 Estimativas pontuais e intervalares 43
3 Tipos de intervalos 43
 3.1 Intervalo de confiança para a média µ 43
 3.2 Intervalo de confiança para a proporção populacional p 44
 3.3 Intervalo de confiança para a diferença de médias populacionais µ1 e µ2 44
 3.4 Intervalo de confiança para a diferença de proporções populacionais p1 e p2 45
 
8 – Testes de Hipóteses Paramétricos 46
1 Introdução 46
2 Hipóteses estatísticas 46
3 Testes de hipóteses 46
 3.1 Hipóteses 46
 3.2 Tipos de erros 46
 3.3 Nível de significância do teste 47
 3.4 Graus de liberdade 47
 3.5 Teste bilateral 47
 3.6 Teste unilateral 47
 3.7 Probabilidade exata do teste 47
 3.8 Procedimento para a realização de um teste de hipóteses 48
4 Testes de hipóteses paramétricos 48
 4.1 Teste para uma média com variância populacional σ2 conhecida 48
 4.2 Teste para uma média com variância populacional σ2 desconhecida 48
 4.3 Teste para a proporção populacional p 49
 4.4 Teste para a diferença entre duas médias populacionais independentes 49
 4.5 Teste para a diferença entre duas amostras dependentes – Teste t pareado 52
 4.6 Teste para a diferença entre duas proporções populacionais p1 e p2 52
 4.7 Teste para a diferença entre duas variâncias 53
 
9 – Análise de Variância – ANOVA 54
1 Introdução 54
2 Pressuposições básicas à aplicação da ANOVA 54
3 ANOVA – Uma classificação: amostras de mesmo tamanho 54
4 ANOVA – Uma classificação: amostras de tamanhos diferentes 55
5 Comparação de médias 55
 5.1 Teste de Tuckey 56
 
10 – Testes de Hipóteses Não-Paramétricos 57
1 Teste de adequação 57
2 Teste qui-quadrado de independência 58
3 Coeficiente de contingência 59
 
11 – Correlação e Regressão Linear Simples 60
1 Análise de correlação linear simples 60
 1.1 Estimativa do coeficiente de correlação 61
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM iv
 1.2 Teste para o coeficiente de correlação 62
2 Regressão linear simples 63
 2.1 Considerações na análise de regressão 63
3 Teste para verificar a significância da regressão 65
4 Coeficiente de determinação ou explicação 66
 
Referências Bibliográficas 66
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Telefone para contato: (055) 3220 8486 sub-ramais 32 ou 33 ou 3220 8612 
Departamento de Estatística – CCNE – UFSM 
http://www.ufsm.br/estat e http://www.ufsm.br/ppgemq 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 1
 
1 - Conceitos Iniciais 
 
1.1 Conceito de estatística 
Existem muitas definições propostas por autores, objetivando estabelecer com clareza o que é 
estatística, como por exemplo: 
• A estatística é um conjunto de métodos destinados a coleta, organização, resumo, apresentação e 
análise de dados de observação, bem como a tomada de decisões razoáveis baseadas em tais análises; 
• A estatística é a matemática aplicada aos dados de observação; 
• A estatística é um conjunto de processos ou técnicas empregadas na investigação e análise de 
fenômenos coletivos oude massa. 
 
1.2 Divisão da estatística 
A estatística divide-se em: 
⎪⎩
⎪⎨
⎧
⎩⎨
⎧
adaaplicstatísticaE
lInferenciaouIndutivaaEstatístic
DescritivaaEstatístic
cametodológiougeralaEstatístic 
Estatística geral 
Visa elaborar métodos gerais aplicáveis a todas as fases do estudo dos fenômenos de massa. A 
estatística matemática é a parte da estatística geral que tem por finalidade o estudo das propriedades 
matemáticas dos fenômenos de massa e a dedução e demonstração rigorosa dos procedimentos e fórmulas 
usadas. A estatística geral ainda pode ser dividida em dois grandes campos: 
 
 Estatística descritiva 
Trata da coleta, da organização, classificação, apresentação e descrição dos dados de observação. 
Refere-se à maneira de apresentar um conjunto de dados em tabelas e gráficos e à maneira de resumir, 
através de certas medidas, as informações contidas nestes dados. 
 
 Estatística indutiva ou inferencial 
Visa tirar conclusões sobre a população a partir de amostras. Refere-se à maneira de estabelecer 
conclusões para toda uma população quando se observar apenas parte desta população. 
 
Estatística aplicada 
É todo o ramo do conhecimento científico que proceda, única ou principalmente, por intermédio da 
metodologia estatística. Exemplos: Biometria (ciência que trata da mensuração da vida e dos processos 
vitais), Demografia, Econometria, Psicometria (mensuração da personalidade, do desenvolvimento mental 
e do comportamento de indivíduos e grupos e seus ajustamentos a mudanças no meio ambiente), 
Mecânica Estatística, Sociometria (maneira como as pessoas vivem, sua cultura, opiniões e atitudes, assim 
como o relacionamento de uns com os outros). 
 
Algumas aplicações da estatística 
A estatística é uma ciência de múltiplas aplicações e de fundamental importância no campo da 
investigação científica, sendo de utilização cada vez mais acentuada em qualquer atividade profissional. 
Então, é razoável que os profissionais de diversas áreas adquiram um mínimo de conhecimento técnico 
sobre estatística que possibilitem a compreensão de termos como: variabilidade, regressão, correlação, 
significância, etc. que aparecem com freqüência em artigos de publicações especializadas. 
 
1.3 População 
É todo o conjunto de elementos que possuam ao menos uma característica comum observável. 
Obs.: elementos = objetos, animais, pessoas, material contínuo (sólido, líquido ou gás). 
 
 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 2
1.4 Amostra 
É uma parte da população, sendo que a mesma deve ser selecionada de acordo com algum critério 
para que possa ser representativa da população. 
 
1.5 Dados estatísticos 
São as características observadas ou medidas nos elementos, sendo que os dados de observação 
constituem a matéria-prima da estatística. 
 
1.6 Variável 
É um símbolo, como X, Y, Z, ..., que pode assumir resultados de um conjunto, que lhe são 
atribuídos, conjunto este chamado domínio da variável. Se a variável pode assumir somente um valor, ela 
é denominada constante. 
 
As variáveis podem ser classificadas em: 
• Variáveis qualitativas ou atributos: indica alguma propriedade do fenômeno de observação; 
• Variáveis quantitativas discretas: quando podem assumir apenas alguns valores de um conjunto; 
• Variáveis quantitativas contínuas: quando podem assumir, teoricamente, qualquer valor de um 
conjunto. 
 
Em geral, as medições dão origem a variáveis contínuas, enquanto que as enumerações ou 
contagens resultam em variáveis discretas. 
 
Solução: a) Variável quantitativa contínua; b) Variável quantitativa contínua; c) Variável quantitativa 
discreta; d) Variável quantitativa contínua; e) Variável quantitativa discreta; f) Variável qualitativa. 
 
1.7 Níveis de mensuração de uma variável 
Nível de mensuração significa a escala em que foi medida a variável, objeto de investigação. São 
quatro os níveis de mensuração: nominal, ordinal, intervalar e de razão. 
 
Nível nominal 
A mensuração, em seu mais baixo nível, existe quando números ou outros símbolos são utilizados 
para classificar um elemento. Estes números ou símbolos constituem uma escala nominal ou 
classificadora. As únicas estatísticas aplicáveis são: a moda e as freqüências. 
 
Nível ordinal 
Pode ocorrer que os elementos em uma categoria de dada escala não sejam apenas diferentes dos 
elementos de outras categorias da mesma escala, mas que guardem certo tipo de “relação” com eles. Isto 
é, a variável em estudo é partida em categorias ordenadas em graus convencionados havendo uma relação 
entre categorias do tipo: “maior do que”. Pode-se calcular a mediana e todas as estatísticas de postos, além 
da moda e das freqüências. 
 
 
 
Exemplo: Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas). 
a) quantidade de alcatrão em cigarros; 
b) altitude de um avião; 
c) número de assinantes de um serviço de computador on-line; 
d) precipitação pluviométrica durante um ano; 
e) salário dos funcionários de uma empresa; 
f) gênero dos filhos de casais residentes em uma cidade. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 3
Nível intervalar 
Quando a escala tem todas as características de uma escala ordinal, e, além disso, se conhecem as 
distâncias entre dois números quaisquer da escala, então se consegue uma mensuração consideravelmente 
mais forte que a ordinal. Atribui-se à variável um número real, uma unidade constante e comum de 
mensuração. A unidade de mensuração e o ponto zero são arbitrários. A escala intervalar é a primeira 
escala verdadeiramente quantitativa. Neste nível todas as estatísticas paramétricas comuns são aplicáveis. 
 
Nível de razão 
Quando uma escala tem todas as características de uma escala de intervalos e, além disso, tem um 
verdadeiro ponto zero como origem, é chamada escala de razão. Como no nível anterior, todas as 
estatísticas são aplicáveis. 
 
 
Solução: a) Nível ordinal; b) Nível de razão; c) Nível nominal; d) Nível intervalar; e) Nível intervalar; 
f) Nível ordinal; g) Nível nominal; h) Nível razão; i) Nível ordinal; j) Nível nominal. 
 
1.8 Arredondamento de dados 
Arredondar um número significa reduzir a quantidade de algarismos significativos após a vírgula, 
deste número. O objetivo é reduzir os erros por arredondamento, quando é grande o volume de números a 
arredondar. A Portaria 36, de 6 de agosto de 1965 do Instituto Nacional de Pesos e Medidas, estabelece os 
seguintes critérios para o arredondamento de dados. 
 
Regras de arredondamento 
• Quando o primeiro algarismo após aquele que será arredondado for 0, 1, 2, 3, 4, conserva-se o 
algarismo a ser arredondado e desprezam-se os seguintes; 
• Quando o primeiro algarismo após aquele que será arredondado for 6, 7, 8, 9 ou 5, este último seguido 
de outros algarismos, onde pelo menos, um é diferente de zero, aumenta-se uma unidade no algarismo 
a ser arredondado e desprezam-se os seguintes; 
• Quando o primeiro algarismo após aquele que será arredondado for 5, seguido de zeros, conserva-se o 
algarismo a ser arredondado se ele for par, ou aumenta-se uma unidade, se ele for ímpar, desprezando 
os seguintes. 
 
 Par ← 5 → Ímpar 
↓ ↓ 
Conserva Soma uma unidade 
0, 1, 2, 3 ou 4 6, 7, 8, 9 ou 5+ 
Exemplo: Determine o nível de mensuração mais adequado (nominal, ordinal, intervalar ou razão). 
a) classificação como: acima da média, médio ou abaixo da média para encontros marcados com 
desconhecidos; 
b) conteúdo de nicotina (em miligramas) de cigarros; 
c) números de inscrição do INSS; 
d) temperaturas (em graus Celsius); 
e) anos em que ocorreram eleições presidenciais; 
f) graus finais (A, B, C, D, F) de estudantes de estatística; 
g) códigos de endereçamento postal(CEP); 
h) rendas anuais de enfermeiras; 
i) carros classificados como subcompacto, compacto, intermediário ou grande; 
j) cores de uma amostra de confetes M&M. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 4
 
 
Solução: a) 33,56; b) 9,52; c)10,32; d) 63,49; e) 6,72; f) 0,99 
 
1.9 Método estatístico 
Quando se pretende empreender um estudo estatístico completo, existem diversas fases do trabalho 
que devem ser desenvolvidas para se chegar aos resultados finais do estudo. 
 
Fases do método estatístico 
• Definição do problema: a primeira fase do trabalho estatístico consiste em uma definição ou 
formulação correta do problema a ser estudado. Além de considerar detidamente o problema objeto do 
estudo, o analista deverá examinar outros levantamentos realizados no mesmo campo e análogos, uma 
vez que parte da informação de que necessita pode, muitas vezes, ser encontrada nesses últimos. 
 
• Planejamento da pesquisa: o passo seguinte, após a definição do problema, compreende a fase do 
planejamento, que consiste em se determinar o procedimento necessário para resolver o problema e, em 
especial, como levantar informações sobre o assunto objeto do estudo. É nessa fase que será escolhido 
o tipo de levantamento a ser utilizado. 
Outros elementos importantes que devem ser tratados nessa mesma fase são o cronograma das 
atividades, através do qual são fixados os prazos para as várias fases, os custos envolvidos, o exame das 
informações disponíveis, o delineamento da amostra e a forma como serão escolhidos os dados. 
 
• Coleta ou levantamento dos dados: o terceiro passo é essencialmente operacional, compreendendo a 
coleta das informações propriamente ditas. Formalmente, a coleta de dados se refere à obtenção, 
reunião e registro sistemáticos de dados, com um objetivo determinado. 
 
• Crítica e digitação dos dados: antes de começar a analisar os dados, é conveniente que lhes seja dado 
algum tratamento prévio, a fim de torná-los mais expressivos. È um trabalho de condensação e de 
tabulação dos dados, que chegam ao analista de forma desorganizada, tornando impossível a tarefa de 
apreender todo o seu significado pela simples leitura. 
 
• Organização e representação dos dados: a apresentação ou exposição dos dados observados constitui a 
quinta fase do método estatístico. Há duas formas de apresentação, que não se excluem mutuamente: 
a) a apresentação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em 
linhas e colunas distribuídas de modo ordenado, segundo algumas regras práticas adotadas pelos 
diversos sistemas estatísticos; 
b) a apresentação gráfica dos dados numéricos constitui uma apresentação geométrica. Embora a 
apresentação tabular seja de extrema importância, no sentido de facilitar a análise numérica dos dados, 
não permite ao analista obter uma visão tão rápida, fácil e clara do fenômeno e sua variação como a 
conseguida através de um gráfico. 
 
• Análise dos dados e interpretação dos resultados: a última fase do trabalho estatístico é a mais 
importante e também a mais delicada. Nesta etapa, o interesse maior reside em tirar conclusões que 
auxiliem o pesquisador a resolver seu problema. A análise dos dados estatísticos está ligada 
essencialmente ao cálculo de medidas, cuja finalidade principal é descrever o fenômeno. Assim, o 
conjunto de dados a ser analisado pode ser expresso por números-resumos, as estatísticas, que 
evidenciam características particulares desse conjunto. 
 
Exemplo: Dado os valores abaixo, fazer o arredondamento para décimo. 
a) 33,5630; b) 9,5194; c) 10,32500; 
d) 63,4850000001; e) 6,7153; f) 0,9880; 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 5
1.10 Representação tabular 
Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A elaboração de 
tabelas deve obedecer às normas editadas pelo Instituto Brasileiro de Geografia e Estatística - IBGE. 
Abaixo se apresenta uma tabela esquemática sendo indicados os seus elementos. 
 
 Título: O quê?; Onde?; Quando? 
Cabeçalho Total 
 
 
 ÍColuna Indicadora 
 
 
 
 
Corpo da tabela 
Total 
 ⎪⎭
⎪⎬
⎫
:Nota
*
:Fonte
 Chama de Rodapé 
No rodapé de uma tabela podem aparecer, se necessário: a fonte (entidade responsável pelas 
informações contidas na tabela), notas (observações gerais sobre a tabela) e/ou chamadas (observações 
feitas em relação a pontos específicos da tabela sendo os símbolos usados: *, **, ...; ’, ”, ...; i, ii, ... e k). 
 
1.11 Séries estatísticas 
Uma série estatística é um conjunto de dados ordenados segundo uma característica comum, sendo 
apresentadas sob forma de tabela e/ou gráfico. 
A classificação de uma série é feita de acordo com a variação de três elementos que a compõem: a 
espécie (o fenômeno), o local (o lugar onde o fenômeno acontece) e a época (fator temporal ou 
cronológico a que se refere o fenômeno). 
O nome da série depende do(s) elemento(s) que varia(m). Assim, pode-se ter uma série específica, 
geográfica, temporal, mista ou uma distribuição de freqüências. 
 
Exemplos de séries 
 
Série específica (série simples): 
 
Tabela - Freqüências e porcentagens dos 2.000 empregados da 
Companhia MB, segundo o grau de instrução 
Grau de instrução Freqüência (ni) Porcentagem 
Fundamental 650 32,50 
Médio 1.020 51,00 
Superior 330 16,50 
 Total 2.000 100,00 
Fonte: Dados hipotéticos 
 
Série geográfica-específica (série composta ou mista): 
 
Tabela - Opinião da população, por local de residência, sobre um 
projeto governamental 
 Local de residência 
Total Opinião Urbano Suburbano Rural 
A favor 30 35 35 100 
Contra 60 25 15 100 
 Total 90 60 50 200 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 6
1.12 Representação gráfica 
 Um gráfico é toda a forma de representação das séries estatísticas que seja baseada no desenho. 
 O gráfico deve ser atraente para cumprir sua finalidade de mostrar resultados e bem construído 
para permitir a análise do fenômeno exposto. A fim de que isso aconteça, deve-se observar alguns 
aspectos básicos como: simplicidade, clareza e veracidade. 
 Do mesmo modo que nas tabelas estatísticas, nos gráficos, deve-se considerar um título que 
informe a espécie, o lugar e o tempo do fenômeno representado, bem como a fonte de onde foram 
coletados os dados expostos. 
 
Gráficos analíticos 
 Pontos 
 
 Linhas 
 Simples 
Classificação Barras Sobrepostas 
dos gráficos Justapostas 
 analíticos 
 Superfície Simples 
 Colunas Sobrepostas 
 Justapostas 
 
 Setores 
 
Exemplos de gráficos 
Gráfico de pontos
0
2
4
6
8
10
0 1 2 3 4 5 6 7 8 9
Variável X
Va
riá
ve
l Y
 
Gráfico de linha
0
2
4
6
8
10
1 2 3 4 5 6 7 8 9
Variável X
Va
riá
ve
l Y
 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 7
 
Gráfico de colunas
0
2
4
6
8
10
1 2 3 4 5 6 7 8 9
Variável X
Va
riá
ve
l Y
 
 
Gráfico de colunas justapostas
0
2
4
6
8
10
1 2 3 4 5 6 7
Variável X
Va
riá
ve
l Y Seqüência1
Seqüência2
 
 
Gráfico de colunas sobrepostas
0
2
4
6
8
10
1 2 3 4 5 6 7
Variável X
Va
riá
ve
l Y
Série2
Série1
 
 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 8
Gráfico de barras
0 1 2 3 4 5 6 7 8 9
1
2
3
45
6
7
Variável B
Variável A
 
 
Gráfico de setores
A
B
C
 
 
 
2 – Distribuições de Freqüências 
 
 Uma distribuição de freqüência é uma tabela que reúne o conjunto de dados, conforme as 
freqüências ou as repetições de seus valores. Esta tabela pode representar os dados em classes ou não, de 
acordo com a classificação dos dados em discretos ou contínuos. 
 
1 Representação de variáveis 
 
1.1 Discretas 
 Neste caso, representam-se as observações numa tabela de freqüências, não agrupadas em classes, 
designadas de séries de magnitude por ponto. É útil quando a série apresenta poucos valores distintos. 
 
1.2 Contínuas 
 Neste caso, utiliza-se também a tabela de freqüências, mas sob forma de intervalos, mesmo que 
isto sacrifique algum detalhe na ordenação de valores individuais. É útil quando a série apresenta muitos 
valores distintos. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 9
2 Alguns conceitos básicos 
 
2.1 Dados brutos 
 São os valores originais conforme eles foram coletados, não estando ainda prontos para análise, 
pois não estão numericamente organizados ou tabelados. 
 
2.2 Rol 
 É uma lista, onde as observações são dispostas em uma determinada ordem: crescente ou 
decrescente. O objetivo da ordenação é tornar possível a visualização das variações ocorridas, uma vez 
que os valores extremos são percebidos de imediato, e também facilitar a construção da distribuição de 
freqüências. 
⎥⎯⎯⎯⎯→⎯⎯⎯⎯⎯⎢ rol crescente 
 Xmín Xmáx 
 
2.3 Amplitude total [Simbologia: H, At ou R] 
 É a diferença entre o maior e o menor valor observado da variável em estudo: H = Xmáx - Xmín 
 
2.4 Classe 
 É cada um dos grupos ou intervalos de valores em que se subdivide a amplitude total do conjunto 
de tamanho n. 
 Para a determinação do número de classes, existem diversos métodos, dentre os quais destaca-se a 
regra de Sturges, que estabelece que o número de classes (k) é calculado por: k = 1 + 3,3 log n. 
O analista deverá ter em mente que a escolha do número de classes dependerá antes da natureza 
dos dados e da unidade de medida em que eles forem expressos, do que de regras muitas vezes arbitrárias 
e pouco flexíveis. Recomenda-se considerar 4 ≤ k ≤ 12. 
 
2.5 Limites de classe 
 São os dois valores extremos de cada classe. 
• Limite inferior (Li.): é o menor valor da classe considerada; 
• Limite superior (Ls.): é o maior valor da classe considerada. 
 
2.6 Amplitude de classe [Simbologia: h] 
 É a diferença entre o limite superior e o limite inferior da classe, ou seja: 
• h = Ls – Li, quando a distribuição de freqüências já existe; ou 
• h = H/k, para a determinação da amplitude das classes de uma distribuição de freqüências a ser 
construída. 
 
2.7 Ponto médio de classe [Simbologia: Xi] 
É a média aritmética dos limites da classe. É o valor representativo da classe: 
2
LL
X ii sii
+= . 
 
2.8 Tipos de freqüências 
 Para construção de uma tabela de distribuição de freqüência é necessário conhecer alguns de seus 
termos: 
⎪⎪
⎪
⎩
⎪⎪
⎪
⎨
⎧
⎪⎪⎩
⎪⎪⎨
⎧
⎩⎨
⎧
⎩⎨
⎧
⎩⎨
⎧
Relativa
Absoluta
eDecrescent
Relativa
Absoluta
Crescente
Acumulada
Relativa
Absoluta
Simples
sfreqüênciadeTipos 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 10
 
Freqüência absoluta [Simbologia: fi] 
É o número de observações que aparece em uma classe ou valor individual. 
 
Freqüência relativa [Simbologia: fri] 
É o quociente entre a freqüência absoluta e o número total de observações, sendo que: 
∑
=
= k
1i
i
i
r
f
ff
i ou 100
f
f%f k
1i
i
i
ri
⋅=
∑
=
, onde: 0 < fr < 1; f r
i
k
i=
∑
1
= 1. 
 
Freqüência acumulada crescente [Simbologia: faci ou Fci] 
É a soma de todas as freqüências anteriores com a freqüência do intervalo considerado. 
 
2.9 Exemplos de distribuições de freqüências 
 
Por ponto: 
 
Valores Freqüências (fi) 
10 7 
15 12 
20 14 
25 8 
30 10 
Total 51 
 
 
 
Por intervalo: 
Preço, em R$, de certo produto 
 
 
Preço (R$) fi 
6 ⊢ 8 2 
8 ⊢ 10 5 
10 ⊢ 12 10 
12 ⊢ 14 6 
14 ⊢ 16 3 
16 ⊢ 18 2 
Total 25 
 
 ? 
 
2.10 Gráficos representativos de uma distribuição de freqüências em classes 
 
Histograma 
 É um gráfico de colunas justapostas, cujas alturas são proporcionais às freqüências absolutas e 
cujas bases correspondem ao intervalo de classe da distribuição. 
 
 Limites superiores 
Limites inferiores 
Classes 
 Freqüências das classes
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 11
Expected
Normal
Histograma
Classes
Fr
eq
üê
nc
ia
s
0
1
2
3
4
5
6
7
8
9
10
11
0 2 4 6 8 10 12 14 16 18 20
 
Polígono de freqüências 
 É um gráfico de linha, cujos vértices são proporcionais às freqüências absolutas e correspondem 
aos pontos médios das classes da distribuição. 
Polígono de freqüências
Pontos médios das classes
Fr
eq
üê
nc
ia
s
0
1
2
3
4
5
6
7
8
9
10
11
0 2 4 6 8 10 12 14 16 18 20
 
Ogiva 
 É um gráfico de linha, cujos vértices são proporcionais às freqüências acumuladas e correspondem 
aos limites inferiores das classes da distribuição. 
Ogiva
Classes
Fr
eq
üê
nc
ia
s 
ac
um
ul
ad
as
0
2
4
6
8
10
12
14
16
18
20
22
24
26
28
0 2 4 6 8 10 12 14 16 18 20
 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 12
 
 
Solução: 
N° de vendas fi fri Fci
10 1 0,042 1 
11 3 0,125 4 
12 4 0,167 8 
13 5 0,208 13 
14 7 0,292 20 
15 2 0,083 22 
16 1 0,042 23 
17 1 0,042 24 
Total 24 1 
 
O histograma e polígono de freqüência são dados por: 
 
 
 
Assim como o gráfico das freqüências acumuladas (ogiva): 
 
 
 
 
 
Exemplo 1: A tabela abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante 
um mês, por uma firma comercial. Construa uma distribuição de freqüência por pontos: 14 – 12 – 11 – 
13 – 14 – 13 – 12 – 14 – 13 – 14 – 11 – 12 – 12 – 14 – 10 – 13 – 15 – 11 – 15 – 13 – 16 – 17 – 14 – 14. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 13
 
Solução: Amplitude total: H = 97 – 33 = 64 
 Número de classes: k = 1 + 3,3 log 50 = 1 + 3,3 (1,7) ≅ 7 classes 
 Amplitude de classe: h = 64/7 ≅ 10 
 A primeira classe inicia-se por 33. Assim, a distribuição de freqüência será: 
 
Classes fi fri Fci
33 ⊢ 43 7 0,14 7 
43 ⊢ 53 5 0,10 12 
53 ⊢ 63 9 0,18 21 
63 ⊢ 73 11 0,20 32 
73 ⊢ 83 10 0,20 42 
83 ⊢ 93 6 0,12 48 
93 ⊢103 2 0,04 50 
Total 50 1 – 
 
O histograma e o polígono de freqüência para os dados estão a seguir: 
 
Assim como o gráfico das freqüências acumuladas (ogiva): 
 
Histograma 
Polígono de 
freqüências 
Exemplo 2: Dado o rol de 50 notas (dadas em créditos), agrupar os elementos em classe e construir os 
gráficos: 33 – 35 – 35 – 39 – 41 – 41 – 42 – 45 – 47 – 48 – 50 – 52 – 53 – 54 – 55 – 55 – 57 – 59 – 60 – 
60 – 61 – 64 – 65 – 65 – 65 – 66 – 66 – 66 – 67 – 68 – 69 – 71 – 73 – 73 – 74 – 74 – 76 – 77 – 77 – 
78 – 80 – 81 – 84 – 85 – 85 – 88 – 89 – 91 – 94 – 97
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 14
 
3 – Medidas Descritivas 
 
1 Introdução 
A estatística descritiva visa descrever os dados disponíveis da forma mais completa possível sem, 
no entanto, se preocupar em tirar conclusões sobre um conjunto maior de dados (população). As medidas 
descritivas básicas mais importantessão as de posição e as de dispersão ou variabilidade. 
 
Classificação das medidas descritivas: 
Medidas descritivas 
⎪⎪
⎪
⎩
⎪⎪
⎪
⎨
⎧
⎩⎨
⎧
⎩⎨
⎧
CurtoseeAssimetria,Momentos
lativaRe
Absoluta
Dispersão
esSeparatriz
centralnciaeˆTend
Posição
 
 
2 Medidas de tendência central 
Quando se trabalha com dados numéricos observa-se uma tendência destes de se agruparem em 
torno de um valor central. Isto indica que algum valor central é característica dos dados e que o mesmo 
pode ser usado para descrevê-los e representá-los. 
As medidas de tendência central são: média, mediana e moda. 
 
2.1 Média aritmética [Simbologia: 
⎩⎨
⎧
→
→µ
amostraX
população ] 
 É a mais utilizada das medidas de tendência central para descrever, resumidamente, um conjunto 
de dados. 
 
Média aritmética para dados não-tabelados 
A média aritmética consiste na soma de todas as observações Xi dividida pelo número "n" de 
observações do grupo. 
 
n
X
n
X...XXX
n
1i
i
n21
∑
==+++= 
 
Propriedades da média aritmética: 
• A soma dos desvios em relação à média é nula; ( )∑ =− 0XXi 
• A média de uma constante é igual à constante; k)k(X = 
• A média do produto de uma constante por uma variável é igual ao produto da constante pela média da 
variável; [ ])X(Xk)kX(X ii = 
• A soma dos quadrados dos desvios em relação à média é um mínimo. ( )∑ − 2i XX < ( )∑ ∀− a,aX 2i ≠ X 
 
Exemplo: Para os dados do Exemplo 1, determinar a média aritmética. . 
 
21,13
24
14141716131511151310141212111413141213111214
n
X
X
n
1i
i
=+++++++++++++++++++++==
∑
= 
 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 15
 
Média aritmética para dados tabelados 
Se os dados estiverem agrupados em uma tabela de freqüências, pode-se obter a média aritmética 
da distribuição, calculando-se: 
n
fX
X
k
1i
ii∑
== 
 
 
Solução: 
No exemplo 1: 2,13
24
1x171x162x157x145x134x123x111x10
n
fXX
k
1i
ii =+++++++== ∑
=
 
No exemplo 2: 6,65
50
2x986x8810x7811x689x585x487x38
n
fX
X
k
1i
ii =++++++== ∑
=
 
 
2.2 Mediana [Simbologia: Md ou X~ ] 
A mediana divide em duas partes o conjunto das observações ordenadas. Colocando-se os valores 
em ordem crescente ou decrescente, a mediana é o elemento que ocupa o valor central. 
 
 50% Md 50% 
 ⎥⎯⎯⎯⎯⎯→⎯⎯⎯⎯⎯⎢ rol crescente 
 Xmín Xmáx 
 
Mediana para dados não-tabelados 
 
Procedimento no caso de dados brutos: 
 
1. Colocam-se os dados em ordem (rol); 
2. Se o número de elementos "n" for ímpar, a mediana será o elemento central que ocupa a posição 
2
1n + ; 
3. Se "n" for par, a mediana será a média aritmética entre os dois elementos centrais que ocupam as 
posições 
2
n e 
n
2
1+ do rol. 
Solução: 
Primeiro se faz o rol: 10 – 11 – 11 – 11 – 12 – 12 – 12 – 12 – 13 – 13 – 13 – 13 – 13 – 14 – 14 – 14 – 14 – 
14 – 14 – 14 – 15 – 15 – 16 – 17. 
 
Como n = n° par, encontra-se os elementos que ocupam as posições: n/2 e n/2 + 1. 
º12
2
24
2
nPMd === º1312
241
2
nPMd =+=+= 
Os números que ocupam as posições 12° e 13° são 13 e 13. Assim a mediana será igual a 13. 
 
Mediana para dados tabelados 
 
a) Procedimento no caso de distribuição por ponto: 
Exemplo: Determinar a mediana para os dados do Exemplo 1. 
onde: Xi = ponto médio da classe i; 
 fi = a freqüência absoluta da classe i; 
 ∑
=
k
1i
if = n 
Exemplo: Para os dados do Exemplo 1 e 2, determinar a média aritmética 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 16
1. Calcula-se a posição da mediana: PMd = 
2
n (n par) ou PMd = 
2
1n + (n ímpar); 
2. Se “n” é ímpar, a mediana será o valor de Xi correspondente à primeira Fci ≥ PMd; 
3. Se “n” é par, a mediana será o valor de Xi correspondente à primeira Fci > PMd. Caso Fci = PMd, será a 
média entre o valor de Xi correspondente a esta Fci e o próximo valor de Xi. 
 
Solução: 
Calcula-se PMd, como n = n° par, obtém-se o termo n/2; 12º
2
24
2
nPMd === 
Procura-se a 1ª Fci maior que 12. A mediana será o Xi (valor) correspondente a essa Fci, logo Md = 13. 
 
 
b) Procedimento no caso de distribuição por classe: 
1. Calcula-se a posição da mediana: PMd = 
2
n ; 
2. A mediana estará localizada na classe onde, pela primeira vez, Fci ≥ PMd; 
3. Para encontrar o valor da mediana aplica-se a seguinte fórmula: 
 onde: Li = limite inferior da classe que contém a mediana; 
 ( )
Md
iMd
id f
FcPh
LM
−+= 
 Fci = freqüência acumulada da classe anterior à classe que 
contém a mediana; 
 h = amplitude da classe que contém a mediana; 
 fMd = freqüência da classe que contém a mediana. 
 
Solução: Determina-se em qual posição está a mediana: °=== 25
2
50
2
nPMd elemento (4ª classe). 
 
2.3 Moda [Simbologia: Mo ou Xˆ ] 
A moda de um grupo de observações é definida como a medida de freqüência máxima ou é (são) 
o(s) valor(es) que se repete(m) mais vezes. Pode ser utilizada para dados qualitativos. 
 
Moda para dados não-tabelados 
A moda será o valor mais freqüente no conjunto de dados, podendo, este mesmo conjunto, possuir 
mais de uma moda (bimodal ou plurimodal), ou ainda, não apresentar moda (amodal). 
 
Solução: 
a) O número 1,10 é a moda porque é o valor que ocorre mais freqüentemente. 
b) Os números 27 e 55 são ambos modas, porque ocorrem com a mesma maior freqüência. Esse conjunto 
de dados é bimodal porque tem duas modas. 
c) Não há moda, porque nenhum valor se repete. 
( ) ( ) 64,66
11
2125x1063
f
FcPh
LMd
Md
iMd
i =−+=−+=
Exemplo: Determinar a mediana para os dados do Exemplo 1. 
Exemplo: Determinar a mediana para os dados do Exemplo 2. 
Exemplo: Ache as modas dos seguintes conjuntos de dados. a) 5,40 1,10 0,42 0,73 0,48 1,10 
b) 27 27 27 55 55 55 88 88 99 c) 1 2 3 6 7 8 9 10 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 17
Moda para dados tabelados 
Quando a distribuição é por ponto, a determinação da moda é imediata pela simples inspeção da 
tabela, já que a Mo é o valor de freqüência máxima. 
Quando a distribuição de freqüências é por intervalo, pode-se calcular a moda bruta que é o ponto 
médio da classe de maior freqüência (método rudimentar). 
 
Solução: 
No exemplo 1, a moda é o elemento com a maior freqüência, o 14. 
No exemplo 2, a moda é o valor de Xi da classe onde ocorre a maior freqüência, neste caso o 68. 
 
Observações importantes: 
Não há regra fixa para se escolher entre a média, a mediana e a moda. Entretanto algumas 
observações podem ser feitas quanto à utilização das mesmas. 
• A média aritmética é a medida de tendência central mais utilizada, principalmente quando não há 
valores aberrantes (muito extremos) no conjunto de dados, sendo a medida mais conveniente para 
cálculos posteriores; 
• A mediana deve ser usada, sempre que possível, como medida representativa de distribuições 
fortemente assimétricas, ou seja, quando os valores extremos do conjunto são muito distantes dos 
outros, pois o seu valor não é afetado por estes valores; 
• A moda é usada quando há interesse em saber o ponto de concentração do conjunto ou o tipo de 
distribuição que se está analisando, sendo que o seu valor, em se tratando de dados agrupados, é 
fortemente afetado pela maneira como as classes são constituídas. 
 
3 Separatrizes 
São valores de posição, que dividem o rol. As principais medidas separatrizes são:mediana, 
quartis, decis e centis ou percentis. 
 
3.1 Quartis [Simbologia: Qi] 
Os quartis dividem um conjunto de dados em quatro partes iguais. Assim: 
0% 25% 50% 75% 100% 
|--------------------|--------------------|--------------------|--------------------| 
 Q1 Q2 =Md Q3 
 
onde: Q1 = primeiro quartil e separa os primeiros 25% dos 75% restantes; 
Q2 = segundo quartil ou mediana e separa o conjunto de dados em 2 partes iguais; 
Q3 = terceiro quartil e separa os primeiros 75% dos 25% restantes. 
 
Quartis para dados não-tabelados 
 
Procedimento no caso de dados brutos: 
1. Colocam-se os dados em ordem (rol); 
2. Calcula-se a posição do quartil através da fórmula: PQi = i .
4
n ; 
3. O quartil será o valor que ocupa, no rol, a posição calculada anteriormente. 
Solução: 
Calcula-se as posições dos quartis. e 
 
O 6° e 18° elementos são Q1 = 12 e Q3 = 14 respectivamente. 
Exemplo: Determinar a moda para os dados do Exemplo 1 e 2. 
Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 1. 
°== 6
4
24x1P 1Q °== 184
24x3P 3Q
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 18
 
Quartis para dados tabelados 
 
a) Procedimento no caso de distribuição por ponto: 
1. Calcula-se a posição do quartil PQi = i . 4
f
k
1n
i∑= = i .
4
n ; 
2. O quartil será o valor de Xi correspondente à primeira Fci ≥ PQi. 
 
Calcula-se a posição do elemento. 
O 6° e 18° elementos são Q1 = 12 e Q3 = 14 respectivamente. 
 
b) Procedimento no caso de distribuição por classe: 
1. Calcula-se a posição do quartil PQi = i . 4
f
k
1n
i∑= = i .
4
n ; 
2. O quartil estará localizado na classe onde, pela primeira vez, Fci ≥ PQi; 
3. Para encontrar o valor do quartil aplica-se a seguinte fórmula: 
 onde: Li = limite inferior da classe que contém o respectivo quartil; 
Qi
iQi
ii f
FcPh
LQ
⎟⎠
⎞⎜⎝
⎛ −
+= 
 Fci = freqüência acumulada da classe anterior à classe que 
contém o quartil; 
 h = amplitude da classe que contém o quartil; 
 fQi = freqüência da classe que contém o quartil. 
 
Solução: 
No exemplo 2, calcula-se a posição do elemento. 
 
Após verifica-se a classe onde se encontra cada elemento que ocupam essas posições. O Q1 
encontra-se na 3ª classe e o Q3 encontra-se na 5ª classe. Assim: 
 ( ) 56,53
9
125,12x1053Q
1
=−+=
 
( )
5,78
10
325,37x1073Q
3
=−+=
 
 
3.2 Decis [Simbologia: Di] 
São valores que dividem o conjunto das observações em 10 (dez) partes iguais. Para encontrar o 
valor do decil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do 
decil, a fórmula será: 
°== 6
4
24x1P
1Q
°== 18
4
24x3P
3Q
°== 5,12
4
50x1P
1Q
°== 5,37
4
50x3P
3Q
Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 1. 
Exemplo: Determinar Q1 e Q3 para os dados do Exemplo 2. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 19
PDi = i .
10
fi∑ = i .
10
n 
 
Para encontrar o valor do decil quando os dados estão agrupados em classe, a fórmula será: 
 ( )
Di
iDi
ii f
FcPhLD −+= 
 
3.3 Percentis [Simbologia: Pi] 
São valores que dividem o conjunto das observações em 100 partes iguais. Para encontrar o valor 
do percentil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do 
percentil, a fórmula será: 
 
 Ppi = i .
100
fi∑ = i .
100
n 
 
Para encontrar o valor do percentil quando os dados estão agrupados em classe, a fórmula será: 
 ( )
Pi
iPi
ii f
FcPhLP −+= 
 
4 Medidas de dispersão 
As medidas de dispersão visam descrever os dados no sentido de informar o grau de dispersão ou 
afastamento dos valores observados em torno de um valor central. Elas indicam se um conjunto é 
homogêneo (pouca ou nenhuma variabilidade) ou heterogêneo (muita variabilidade). 
A descrição do conjunto de dados é mais completa quando se considera além de uma medida de 
tendência central, uma medida de dispersão ou variação, porque é comum encontrar-se séries que, apesar 
de apresentarem a mesma média, são compostas de maneiras diferentes, o que mostra que as medidas de 
tendência central são insuficientes para descrever adequadamente uma série estatística. 
Algumas medidas de variação são: a amplitude de variação, o desvio médio, a soma de quadrados, 
a variância, o desvio padrão e o coeficiente de variação. 
 
Classificação das medidas de dispersão: 
 
{⎪
⎪⎪
⎩
⎪⎪
⎪
⎨
⎧
⎪⎪⎩
⎪⎪⎨
⎧
variaçãodeeCoeficientRelativa
Variância
padrãoDesvio
médioDesvio
Amplitude
Absoluta
dispersãodeMedidas 
 
4.1 Amplitude de variação [Simbologia: H] 
É a diferença entre o maior e o menor valor do conjunto, sendo a mais simples das medidas de 
dispersão, porém de grande instabilidade, porque considera somente os valores extremos do conjunto. 
Também é chamada de desvio extremo. 
 
H = Xmáx. - Xmín. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 20
 
 
Solução: Para o exemplo 1: H = 17 – 10 = 7 
Para o exemplo 2: H = 98 – 38 = 60 
 
4.2 Desvio médio [Simbologia: Dm] 
É a média aritmética dos valores absolutos dos desvios tomados em relação à média ou à mediana. 
Considera-se o módulo de cada desvio, XXidi −= , evitando-se, com isso, que 0di
n
1i
=∑
=
. 
 
Desvio médio para dados não tabelados 
n
di
n
XXi
Dm
n
1i
n
1i
∑∑
== =
−
= 
 
Desvio médio para dados tabelados 
 
O desvio médio é preferido em relação ao desvio padrão, quando esse for indevidamente 
influenciado pelos desvios extremos. 
 
 
Solução: Para o exemplo 1: 31,1
24
21,1317...21,131121,1310
n
XX
Dm
n
1i
i
=−++−+−=
−
=
∑
= 
Para o exemplo 2; 95,13
50
6,697
50
26,6598...56,654876,6538
n
f.XX
Dm
k
1i
ii
==×−++×−+×−=
−
=
∑
= 
 
 
4.3 Soma de quadrados [Simbologia: SQ] 
A soma de quadrados refere-se a soma dos quadrados dos desvios em relação à média: 
( ) ( ) ( ) ( )∑
=
−++−+−=−= n
1i
2
n
2
2
2
1
2
i
XX......XXXXXXSQ n
X
X
2n
1i
in
1i
2
i
⎟⎟⎠
⎞
⎜⎜⎝
⎛
−=
∑
∑ =
= 
 
4.4 Variância [Simbologia 
⎩⎨
⎧
→
→σ
amostras
população
2
2
] 
A variância populacional (σ2) é a soma de quadrados dividida pelo número de observações N: 
n
.fXX
Dm
k
1i
ii∑
=
−
=
Exemplo: Determinar a amplitude H para os dados do Exemplo 1 e 2. 
Exemplo: Determinar o desvio médio Dm para os dados do Exemplo 1 e 2. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 21
( )
N
N
X
X
N
)XX(
N
SQ
n
1i
2n
1i i2
i
n
1i
2
i2
∑ ∑∑
=
=
=
−
=
−
==σ 
Quando a variância é calculada a partir de uma amostra para fins de estimação, o denominador 
passa a ser (n - 1), o que nos fornece uma estimativa imparcial da variância populacional. 
 
 
Variância para dados não-tabelados 
1n
)X(X
s
n
1i
2
i
2
−
−
=
∑
= = 
1n
n
)X(
X
n
1i
n
1i
2
i
2
i
−
−∑ ∑
=
=
 
O denominador (n - 1) é denominado de "graus de liberdade" dessa estimativa. 
 
Solução: 
( ) ( ) ( ) ( ) ( ) 2,78
124
13,2117...13,211113,211113,2110
1n
XX
s
2222
n
1i
2
i
2 =−
−+−+−+−=−
−
=
∑
= 
 
Propriedades da variância 
• A variância de uma constante é zero; 
s2(k) = 0 
• A variância da soma ou diferença de uma constante k com uma variável é igual a variância da variável;s2(k + X) = s2(X) 
• A variância da soma de variáveis independentes é igual a soma das variâncias das variáveis; 
s2(X + Y) = s2(X) + s2(Y) 
• A variância do produto de uma constante por uma variável é igual ao produto do quadrado da 
constante pela variância da variável. 
s2(k.X) = k2. )X(s2 
 
Variância para dados tabelados 
s2 = 
( )
1n
fXX
k
1i
i
2
i
−
−∑
= ou s2 = 
1n
n
fX
fX
k
1i
2
i
k
1i
i
i
2
i
−
⎟⎠
⎞⎜⎝
⎛
−∑ ∑
=
=
 
 
Solução: No exemplo 1, 
( ) ( ) ( ) ( ) ( ) 78,2
124
1x21,1317...4x21,13123x21,1311121,1310
1n
f.XX
s
2222
k
1i
i
2
i
2 =−
−+−+−+×−=−
−
=
∑
= 
No exemplo 2, 
( ) ( ) ( ) ( ) ( ) 288
150
2x6,6598...9x6,65585x6,65487x6,6538
1n
f.XX
s
2222
k
1i
i
2
i
2 =−
−+−+−+−=−
−
=
∑
= 
Exemplo: Determinar a variância para os dados do Exemplo 1. 
Exemplo: Determinar a variância para os dados do Exemplo 1 e 2. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 22
 
4.5 Desvio padrão [Simbologia 
⎩⎨
⎧
→
→σ
amostras
população ] 
O desvio padrão é uma das medidas mais úteis da variação de um grupo de dados. A vantagem do 
desvio padrão sobre a variância, é que este permite uma interpretação direta da variação do grupo, pois o 
mesmo é expresso na mesma unidade em que estão expressas as medidas observadas. 
O desvio padrão é a raiz quadrada da variância, então, é calculado por: 2ss = . 
Para os dados de medição, especialmente em grandes amostras (n ≥ 30), verifica-se que, cerca de 
68% das observações estarão entre sX ± ; 95% das observações estarão entre s2X ± e praticamente 
100% entre s3X ± . 
 
Solução: No exemplo 1, 67,178,2ss 2 === . 
No exemplo 2, 97,16288ss 2 === . 
 
4.6 Coeficiente de variação [Simbologia: CV ou CV%] 
O coeficiente de variação é uma medida de dispersão relativa, utilizada quando se deseja comparar 
a variação de conjuntos de dados que apresentem diferentes unidades de medição e ou tamanhos 
diferentes, pois o coeficiente de variação independe da unidade de medida dos dados. O coeficiente de 
variação pode também ser expresso como percentagem da média. 
X
sCV = ou 100
X
s%CV ⋅= 
 
 
Solução: No exemplo 1, %62,12100x
21,13
67,1100x
X
sCV === 
No exemplo 2, %87,25100x
6,65
97,16100x
X
sCV === 
 
5 Assimetria e curtose 
As medidas de assimetria e curtose complementam as medidas de posição e de dispersão no 
sentido de proporcionar uma descrição e compreensão mais completa das distribuições de freqüências. 
Estas distribuições não diferem apenas quanto ao valor médio e à variabilidade, mas também quanto a sua 
forma (assimetria e curtose). 
 
5.1 Assimetria 
Assimetria é o grau de desvio, afastamento da simetria ou grau de deformação de uma distribuição 
de freqüências. Se a curva de uma distribuição tem uma "cauda" mais longa à direita da ordenada máxima 
do que à esquerda, diz-se que a distribuição é desviada para a direita ou que ela tem assimetria positiva. Se 
ocorrer o inverso, diz-se que ela é desviada para a esquerda ou tem assimetria negativa. 
Os coeficientes de assimetria servem para medir o “grau” de deformação da distribuição. 
 
 
 
 
Exemplo: Determinar o desvio padrão amostral para os dados do Exemplo 1 e 2. 
Exemplo: Determinar o CV para os dados do Exemplo 1 e 2. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 23
Coeficiente de assimetria de Pearson [Simbologia: C.A.] 
 
s
MoX.A.C −= 
 
Intensidade da assimetria: 
• Coeficiente < 0,2: simetria; 
• 0,2 < Coeficiente < 1,0: assimetria fraca; 
• Coeficiente > 1,0: assimetria forte. 
 
Interpretação: 
• Coeficiente negativo: distribuição assimétrica negativa (à esquerda), sendo X < Md < Mo; 
• Coeficiente nulo: distribuição simétrica, sendo X = Md = Mo; 
• Coeficiente positivo: distribuição assimétrica positiva (à direita), sendo X > Md > Mo. 
 
 
 
Solução: No exemplo 1: 474,0
668,1
1421,13
s
MoX.A.C −=−=−= → assimetria fraca. 
No exemplo 2: 1414,0
97,16
686,65
s
MoX.A.C −=−=−= → simetria. 
 
5.2 Curtose 
É o grau de achatamento (afilamento) de uma curva em relação à curva normal, tomada como 
padrão. Uma distribuição pode ser classificada quanto à curtose, como segue: 
 
• Platicúrtica: a curva é mais achatada do que a normal (σ ou s grandes); 
• Mesocúrtica: a curva é normal (σ ou s intermediários); 
• Leptocúrtica: a curva é mais alta do que a normal (σ ou s pequenos). 
Para medir o grau de curtose de uma distribuição, podem-se usar dois tipos de medidas: 
 
Exemplo: Determinar a assimetria para os dados do Exemplo 1 e 2. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 24
 
Coeficiente centílico de curtose [Simbologia: K] 
 
 
 
)DD(2
QQ
K
19
13
−
−= 
onde: Q1 = o primeiro quartil; 
 Q3 = o terceiro quartil; 
 D1 = o primeiro decil; 
 D9 = o nono decil. 
 
Interpretação: 
 
• K < 0,263 curva leptocúrtica; 
• K = 0,263 curva mesocúrtica; 
• K > 0,263 curva platicúrtica. 
 
 
Solução: 
No exemplo 1, primeiro se encontra o D1 e D9: 
PD1 = 1.
10
24 = 2,4 ou seja, o D1 = 11 e PD9 = 9. 10
24 = 21,6 ou seja, o D9 = 15 
 
Após calcula-se o coeficiente centílico de curtose 
( ) 25,011152
1214
)DD(2
QQ
K
19
13 =−
−=−
−= , conclui-se então que a curva é leptocúrtica. 
 
 
No exemplo 2, primeiro se encontra o D1 e D9: 
PD1 = 1 .
10
50 = 5 ou seja, ( ) ( ) 14,40
7
051033
f
FcPhLD
1D
1D
11 =−×+=−+= 
PD9 = 9 .
10
50 = 45 ou seja, 
( ) ( ) 88
6
42451083
f
FcPhLD
9D
9D
99 =−×+=−+= 
 
Após calcula-se o coeficiente centílico de curtose: 
( ) 2606,014,40882
56,535,78
)DD(2
QQK
19
13 =−
−=−
−= , conclui-se então que a curva é leptocúrtica. 
 
 
 
 
 
Exemplo: Determinar a curtose para os dados do Exemplo 1 e 2 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 25
 
4 – Probabilidade 
 
1 Introdução 
O trabalho estatístico se desenvolve a partir da observação de determinados fenômenos e emprega 
dados numéricos relacionados aos mesmos, para tirar conclusões que permitam conhecê-los e explicá-los 
a ponto de poder, com determinado grau de crença, obter o desenvolvimento teórico do fenômeno. Para 
tanto é necessário que se formule um modelo que ajude a melhor elucidá-lo. 
No campo da estatística, os modelos matemáticos utilizados são denominados, modelos não-
determinísticos ou probabilísticos, ou seja, que avaliam com que probabilidade os resultados podem 
ocorrer. 
 
2 Noções de experimento, espaço amostral e eventos 
 
2.1 Experimento aleatório [Simbologia: E] 
É uma das realizações do fenômeno sob observação. Se o fenômeno seguir um modelo não-
determinístico, tem-se um experimento aleatório, com as seguintes características: 
 
• O experimento pode ser repetido; 
• Embora não seja possível afirmar que resultado em particular ocorrerá, é possível descrever o conjunto 
de todos os resultados possíveis do experimento; 
• À medida que aumenta o número de repetições aparece uma certa regularidade que torna possível a 
construção de um modelo matemático. 
 
2.2 Espaço amostral [Simbologia: S] 
É o conjunto de todos os possíveis resultados de um experimento aleatório. 
 
2.3 Evento [Simbologia: A, B, C, ...] 
É qualquer subconjunto do espaço amostral de um experimento. 
 
Tipos de eventos: 
1. Eventos mutuamente exclusivos: dois eventos A e B são denominados mutuamente exclusivos, se eles 
não puderem ocorrer juntos, isto é, A∩B = ∅; 
2. Eventoscomplementares: são os eventos que se completam em relação ao espaço amostral, isto é, 
A∪A = S, onde A é o evento complementar de A; 
3. Eventos impossíveis: são eventos que não possuem elementos no espaço amostral, isto é, A = ∅ e 
P(A) = 0; 
4. Eventos certos: são eventos que possuem todos os elementos do espaço amostral, isto é, A = S e 
P(A) = 1; 
5. Eventos independentes: são eventos que podem ocorrer simultaneamente, isto é, A∩B ≠ ∅ e 
P(A∩B) = P(A) . P(B) 
6. Eventos dependentes: são eventos em que a ocorrência de um deles está condicionada à ocorrência de 
outro, acontece um evento se o outro já ocorreu, isto é, A∩B ≠ ∅ e P(A∩B) = P(A) . P(B/A), com 
P(A) ≠ 0. 
 
3 Álgebra de eventos 
Podem-se combinar os eventos da mesma maneira que se faz com os conjuntos: 
 
1. Se A e B forem dois eventos, A ∩ B significa que A e B ocorrem; 
2. Se A e B forem dois eventos, A ∪ B significa que A ou B ocorrem 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 26
 
Solução: C = coroa e K = cara 
a) S = {(1,C); (2,C); (3,C); (4,C); (5,C); (6,C); (1,K); (2,K); (3,K); (4,K); (5,K); (6,K)}; 
b) A = {(2,C); (4,C); (6,C)}; 
B = {(1,K); (3,K); (5,K)}; 
C = {(3,C); (6,C); (3,K); (6,K)}. 
c) 
i) B = {(1,C); (2,C); (3,C); (4,C); (5,C); (6,C); (2,K); (4,K); (6,K)}; 
ii) A ∪ B = {(2,C); (4,C); (6,C); (1,K); (3,K); (5,K)}; 
iii) B ∩ C = {(3,K)}; 
iv) BA∪ = {(1,C); (3,C); (5,C); (2,K); (4,K); (6,K)}. 
d) A ∩ B = ∅, são mutuamente exclusivos; 
A ∩ C = {(6,C)}, não são mutuamente exclusivos; 
B ∩ C = {(3,K)}, não são mutuamente exclusivos. 
 
4 Conceitos de probabilidade 
Interpretação como freqüência relativa, definição clássica e definição axiomática. 
O problema fundamental da probabilidade consiste em: “atribuir um número a cada evento A, o 
qual avaliará as chances de ocorrência de A quando o experimento for realizado”. 
 
4.1 Conceito empírico 
É uma interpretação da probabilidade como freqüência relativa. 
Repetindo-se um experimento E um grande número de vezes e calculando-se a freqüência relativa 
do evento A, obtém-se um número "p" que pode ser tomado como a probabilidade da ocorrência de A, que 
nesse caso, poderia ser tomada como: 
P(A) = 
n
)A(f
lim
n
p
∞→
= 
 
4.2 Definição clássica de probabilidade 
É válida para espaços amostrais finitos e equiprováveis. Se todos os resultados de um espaço 
amostral finito forem igualmente prováveis, ou seja, admitindo-se que S possa ser escrito sob a forma S = 
{a1, a2, .... , ak}, então, a cada evento formado por um resultado simples (ai) associa-se um número "pi", 
denominado probabilidade de A, que satisfaça as seguintes condições: 
• pi ≥ 0; 
• P(S) = p1 + p2 + .... + pk = 1p
k
1i
i =∑
=
; 
Exemplo: Lance um dado e uma moeda. 
a) Construa o espaço amostral 
b) Enumere os seguintes eventos 
A = {marcado por número par, coroa} 
B = {marcado por número ímpar, cara} 
C = {múltiplos de 3} 
c) Expresse os eventos 
i. B 
ii. A ou B ocorrem 
iii. B e C ocorrem 
iv. BA ∪ 
d) Verifique dois a dois os eventos A, B e C e diga quais são mutuamente exclusivos. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 27
• 
k
1pi = , já que todos os resultados são igualmente prováveis. 
Disto decorre que, para qualquer evento A constituído de r resultados simples, tem-se: 
P(A) = r . 1/k = 
k
r , sendo que: 
P(A) = 
nº de casos favoráveis a A pelos quais E pode ocorrer
n total de casos pelos quais E pode ocorrerº
 = r / k 
 
Pela definição clássica de probabilidade devida a Laplace: seja E um experimento aleatório que dá 
origem a k resultados mutuamente excludentes e igualmente possíveis. Seja A um evento constituído por r 
resultados de E. A probabilidade de ocorrer o evento A é definida como sendo a razão r/k”. 
 
4.3 Definição axiomática 
Seja E um experimento e S um espaço amostral associado a E. A cada evento A associa-se um 
número real representado por P(A) e denominado probabilidade de A, que satisfaça aos seguintes 
axiomas: 
1. 0 ≤ P(A) ≤ 1; 
2. P(S) = 1; 
3. Se A e B forem eventos mutuamente excludentes, então: P(A ∪ B) = P(A) + P(B); 
4. Se A1, A2, ... , An,... forem dois a dois eventos mutuamente excludentes, então: 
P( ∞=∪ 1i Ai) = P(A1) + P(A2) + ... + P(An) + ... 
 
Solução: Adotando dl = peça com defeito leve; b = peça boa; dg = peça com defeito grave: a) P( dg ) = 
P(dl∪b) = P(dl) + P(b) = 10/16 + 4/16 = 14/16; b) P(b) = 10/16; c) P(b∪dg) = 10/16 + 2/16 = 12/16. 
 
Teoremas fundamentais: 
 
Teorema 1: se ∅ for um evento (conjunto) vazio, então: P(∅) = 0; 
Teorema 2: se A for um evento complementar de A, então: P( A ) = 1 - P(A); 
Teorema 3: se A e B forem eventos quaisquer, então: P(A ∪ B) = P(A) + P(B) - P(A ∩ B); 
Teorema 4: se A e B forem eventos de um espaço amostral S e se A ⊂ B, então: P(A) ≤ P (B). 
 
 
Solução: Adotando os eventos: M = a mulher estar viva daqui há 30 anos; H = o homem estar vivo daqui 
há 30 anos. a) P( M∩H) = P( M ) x P(H) = 1/4 x 3/5 = 3/20; b) P(M∩H ) = P(M) x P( H ) = 3/4 x 2/5 = 6/20; 
c) P(H∪M) = P(H) + P(H) – P(H∩M) = 3/5 + 3/4 - 3/5 x 3/4 = 18/20; d) P(M∩H) = P(M) x P(H) = 3/4 x 
3/5 = 9/20 
 
5 Probabilidade condicionada 
Seja A e B dois eventos associados a um experimento E. Denota-se por P(B/A), a probabilidade do 
evento B, condicionada a ocorrência do evento A. 
Exemplo: Um lote é formado por 10 peças boas, 4 com defeitos leves e duas com defeitos graves. Uma 
peça é escolhida ao acaso. Calcule a probabilidade de que: a) ela não tenha defeitos graves; b) ela não 
tenha defeitos; c) ela seja boa ou tenha defeitos graves. 
Exemplo: A probabilidade de uma mulher estar viva daqui a 30 anos é 3/4 e de seu marido é 3/5. 
Calcular a probabilidade de: a) apenas o homem estar vivo; b) somente a mulher estar viva; c) pelo 
menos um estar vivo; d) ambos estarem vivos. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 28
Sempre que se calcula a P(B/A), se está, essencialmente, calculando P(B) em relação ao espaço 
reduzido A e utiliza-se a seguinte fórmula, onde P(A) ≠ 0: 
P(B/A) = 
)A(P
)BA(P ∩ com P(A) ≠ 0, pois A já ocorreu. 
Pode-se escrever também, através do teorema do produto: 
P(A∩B) = P(A/B) . P(B) e P(B∩A) = P(B/A) . P(A) 
Que representa uma alternativa para o cálculo da probabilidade da interseção de dois eventos. 
 
Exemplo: Uma urna contém cinco bolas pretas, três vermelhas e duas brancas. Foram extraídas 3 bolas 
sem reposição. Qual a probabilidade de terem sido duas bolas pretas e uma vermelha? 
 
Solução: Sendo os eventos: P = bolas pretas, V = bolas vermelhas e B = bolas brancas; 
P(P ∩ P ∩ V) + P(P ∩ V ∩ P) + P(V ∩ P ∩ P) = 25,03
720
60
8
4
9
5
10
3
8
4
9
3
10
5
8
3
9
4
10
5 =×=××+××+×× 
 
6 Independência estatística 
Se a ocorrência ou não do evento A, não afetar a probabilidade de ocorrência do evento B e vice-
versa, diz-se que A e B são independentes. 
É compreensível que os eventos A e B sejam inteiramente não relacionados. Saber que B ocorreu 
não fornece qualquer informação sobre a ocorrência de A. De fato, o cálculo seguinte mostra isso: 
Se A e B forem independentes, pode-se escrever: 
 
P(A/B) = P(A) e P(B/A) = P(B) 
 
Nesse caso, usando-se a expressão anterior para P(A∩B), tem-se: 
 
P(A∩B) = P(A/B) . P(B) = P(A) . P(B) 
P(A∩B) = P(B/A) . P(A) = P(A) . P(B) 
 
Chegando-se à condição de independência, na qual A e B serão eventos independentes se e 
somente se: 
 
P(A∩B) = P(A) . P(B) 
 
 
Exemplo: As probabilidades de 3 jogadores marcarem um penalty são respectivamente 2/3 , 4/5 e 7/10. Se 
cada um “cobrar” uma única vez, qual a probabilidade de:a) todos acertarem; b) apenas uma certar; c) 
todos errarem. 
 
Solução: Considerando A: o jogador 1 acertar, B: o jogador 2 acertar e C: o jogador 3 acertar, temos: 
a) P(A ∩ B ∩ C) = 3733,0
150
56
10
7
5
4
3
2 ==×× 
b) P(A CB ∩∩ ) + P( ∩A B C∩ ) + P( ∩∩ BA C) = =××+××+××
10
7
5
1
3
1
10
3
5
4
3
1
10
3
5
1
3
2 
= 1667,0
150
25
150
7126 ==++ 
c) P( CBA ∩∩ ) = 02,0
150
3
10
3
5
1
3
1 ==×× 
 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 29
 
7 Teorema de Bayes 
P(B1/A) = 
)A(P
)AB(P 1 ∩ , 
 
onde: P(A) = P(A/B1) . P(B1) + P(A/B2) . P(B2) + ... + P(A/Bk) . P(Bk) = probabilidade total 
 P(B1/A) = )A(P
)B(P).B/A(P 11 
 P(B1/A) = )B(P)B/A(P)B(P)B/A(P)B(P)B/A(P
)B(P).B/A(P
332211
11
⋅+⋅+⋅ 
 
Generalizando-se essa aplicação para Bi: 
∑
=
⋅⎟⎠
⎞⎜⎝
⎛
⋅⎟⎠
⎞⎜⎝
⎛
= n
1i
i
i
i
i
i
)P(BB
AP
)P(BB
AP
/A)P(B 
 
Esse resultado é conhecido como teorema de Bayes. É também denominada fórmula da 
probabilidade das causas ou dos antecedentes. Desde que os Bi`s constituam uma partição do espaço 
amostral, um e somente um, dos eventos Bi ocorrerá. Portanto, a expressão acima nos dá a probabilidade 
de um particular Bi dado que o evento A tenha ocorrido. A fim de aplicar esse teorema, deve-se conhecer 
os valores dos Bi`s, sendo que, se esses valores são desconhecidos, fica impossibilitada a sua aplicação. 
 
Exemplo: Três máquinas, A, B e C produzem respectivamente 0,4; 0,5 e 0,1 do total de peças de uma 
fábrica. As porcentagens de peças defeituosas nas respectivas máquinas são de 3%, 5% e 2%. Uma peça é 
sorteada ao acaso e verifica-se que é defeituosa. Qual a probabilidade de que a peça tenha vindo da 
máquina B? 
Solução: P(A) = 0,4; P(B) = 0,5; P(C) = 0,1; P(def/A) = 0,03; P(def/B) = 0,05; P(def/C) = 0,02; 
=×+×+×
×=⋅+⋅+⋅= 02,01,005,05,003,04,0
05,05,0
)C
defP(P(C))B
defP(P(B))def
AP(P(A)
)B
defP(B).P(
P(B/def) 0,641 
 
8 Resumo das propriedades do cálculo de probabilidades 
 
 
onde: P(Bi) = probabilidades à priori (conhecidas); 
 P(A/ Bi) = probabilidades condicionais (conhecidas); 
 P(Bi/A) = probabilidades à posteriori. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 30
 
5 – Variáveis Aleatórias 
 
1 Noções sobre variáveis aleatórias 
Ao descrever o espaço amostral de um experimento, nem sempre o resultado individual será um 
número, embora, muitas vezes haja interesse na mensuração de alguma característica e no seu registro 
numérico. 
Para que seja possível a utilização dos recursos da estatística descritiva, é necessária uma função, 
que transforme o espaço amostral não-numérico em um espaço amostral numérico. Sendo assim, 
considerando-se E um experimento e S o espaço amostral associado ao experimento, a função X, que 
associa a cada elemento s ∈ S, um número real, X(s) é denominada variável aleatória. 
Desse modo, tem-se uma função definida no espaço amostral, chamada de variável aleatória. 
 
2 Variáveis aleatórias discretas [Simbologia: VAD] 
Seja X uma variável aleatória. Se o número de valores possíveis de X, Rx (contra-domínio de X) 
for finito ou infinito numerável (números naturais ou inteiros), denomina-se X de variável aleatória 
discreta. 
As variáveis aleatórias discretas surgem, em geral, de medidas de enumeração ou contagem, como 
por exemplo, número de pontos obtidos em um teste, número de insetos por planta, número de peças boas, 
número de pessoas que votam, número de erros em contas, etc. 
S = { s1, s2, ... , sn } →
X
 RX 
 
2.1 Função de probabilidade [Simbologia: f(X)] 
É a probabilidade de que a variável aleatória assuma o valor x. Se X é uma variável aleatória, a 
cada possível valor xi de X (x1, x2, x3, ....), associa-se um número p(xi) = P(X = xi), ou ainda, P(X=x1), 
P(X=x2), P(X= x3), denominado probabilidade de xi. A função que associa probabilidades não-nulas aos 
possíveis valores da variável aleatória e zero aos demais valores é denominada função de probabilidade. 
 
X x1 x2 x3 ... xn 
P(X) p(x1 ) p(x2) p(x3) ... p(xn ) 
 
Os números p(xi) devem satisfazer as seguintes condições: p(xi) > 0, ∀ i; Σ p(xi) = 1. 
 
Representação gráfica: gráfico de bastões 
 
P(X)
p(x2)
p(x1)
x1 x2 X
p(x3)
x3
 
 
2.2 Valor esperado ou média de uma variável aleatória discreta [Simbologia: E(X) ou µ(X)] 
Se X é uma VAD, define-se valor esperado de X, como: E(X) = ∑
=
n
i 1
ii )p(xx 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 31
2.3 Variância de uma variável aleatória discreta [Simbologia: V(X) ou σ2] 
Se X é uma VAD, define-se a variância de X, como: 
 V(X) = [ ] )x(p)X(Ex i
2n
1i
i∑
=
− = [ ]22 )X(E)X(E − onde: E(X2) = ∑
=
n
1i
i
2
i )x(px 
 
Exemplo: Para o lançamento de duas moedas determine a distribuição de probabilidades do número de 
caras e após encontre a E(X) e V(X). 
 
Solução: Fazendo C = cara e K = coroa e sendo x igual ao número de caras obtidas, tem-se: S = {(C,C); 
(C,K); (K,C); (K,K)}. Associando: x = 0 (nenhuma cara); x = 1 (uma cara) e x = 2 (duas caras), tem-se: 
 
x 0 1 2 
p(x) 1/4 2/4 = 1/2 1/4 
 
Graficamente 
 
E(X) = ∑
=
n
1i
ii )p(xx = 14
12
2
11
4
10 =×+×+× cara 
V(X) = [ ]22 )X(E)X(E − = ( ) 5,015,11
4
12
2
11
4
10 2222 =−=−⎟⎠
⎞⎜⎝
⎛ ×+×+× cara2 
 
 
3 Variáveis aleatórias contínuas [Simbologia: VAC] 
Seja X uma variável aleatória. Suponha que Rx (contradomínio de X), seja um intervalo ou uma 
coleção de intervalos. Neste caso, diz-se que X é uma variável aleatória contínua. 
As variáveis aleatórias contínuas, geralmente, surgem de dados de medições, como por exemplo, 
comprimento, peso, altura, temperatura, etc.. 
 
3.1 Função densidade de probabilidade [Simbologia: f(X)] 
Seja X uma VAC, a função densidade de probabilidade f(x), é uma função que satisfaz as 
condições: 
• f(x) ≥ 0, ∀ x ∈ Rx; 
• ∫+∞
∞−
dx)x(f = 1. 
Além disso, para qualquer c < d em RX: P(c < X <d) = ∫d
c
dx)x(f . 
Comentários: 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 32
P (c < X < d) representa a área sob a curva da função, f(x) entre X = c e X = d; 
P(X = k) = ∫ =k
k
0dx)x(f ; 
P(c < X < d) = P (c ≤ X ≤ d) = P (c < X ≤ d) = P (c ≤ X < d). 
 
3.2 Valor esperado ou média de uma variável aleatória contínua [Simbologia: E(X) ou µ(X)] 
Se X é uma VAC, o valor esperado de X é definido por: 
E(X) = ∫+∞
∞−
dx)x(fx 
3.3 Variância de uma variável aleatória contínua [Simbologia: V(X) ou σ2] 
Se X é uma VAC, define-se a variância de X, como: 
V(X) = [ ]22 )X(E)X(E − onde: E(X2) = f(x)dxx 2∫+∞
∞−
 
 
Solução: 
a) 1dxKdx.x
6
1dxKx
6
13
0
3
0
3
0
=+=⎟⎠
⎞⎜⎝
⎛ +∫ ∫∫ → [ ] 1x.Kx.61 30
3
0
2 =+⎥⎦
⎤⎢⎣
⎡ → 13.K0
2
3
6
1 2 =+⎟⎟⎠
⎞
⎜⎜⎝
⎛ + →
12
1K = ; 
b) ∫ ∫∫ +=+=≤≤ 21 3021 dx121dx.x61121x61)2x1(P =
2
1
2
1
2
x.
12
1
2
x.
6
1
⎥⎦
⎤⎢⎣
⎡+⎥⎦
⎤⎢⎣
⎡
= ( )12
12
1
2
1
2
2
6
1 22 −+⎟⎟⎠
⎞
⎜⎜⎝
⎛ − =
4
1 
c) E(X) = ∫+∞
∞−
dx)x(fx = ∫ ⎟⎠⎞⎜⎝⎛ +
3
0
dx
12
1x
6
1.x = ∫ ⎟⎠⎞⎜⎝⎛ +
3
0
2 dxx
12
1x
6
1 =
3
0
23
2
x
12
1
3
x
6
1 ⎥⎦
⎤⎢⎣
⎡ + = 1,875 
V(X) = [ ]22 )X(E)X(E − = dx)x(fx 2∫
+∞
∞−
 - 1,8752 = dx
12
1x
6
1x
3
0
2 ⎟⎠
⎞⎜⎝
⎛ +∫ - 3,516 = 4,12 – 3,516 = 0,604. 
 
4 Modelos probabilísticos para variáveis aleatórias 
Os valores possíveis de uma variável aleatória e suas respectivas probabilidades determinam a 
distribuição de probabilidadeda variável aleatória. Algumas, por apresentarem características 
semelhantes, nos permitem estabelecer um modelo teórico para determinar a solução de certos problemas. 
Para variáveis aleatórias discretas, os modelos estudados serão: Binomial e Poisson. 
 
4.1 Distribuição binomial → Notação: X ~ b(n, p) 
A distribuição binomial tem as seguintes características: 
• São realizadas n repetições independentes e do mesmo tipo do experimento E (n ensaios de Bernoulli); 
• Cada repetição do experimento E admite apenas 2 resultados: sucesso ou fracasso; 
• A probabilidade de sucesso em cada repetição do experimento é sempre igual a p. 
Assim, considerando “n” tentativas independentes de um mesmo experimento aleatório, uma 
particular amostra aleatória conterá k sucessos e (n-k) fracassos, com probabilidades associadas p e q, 
respectivamente. A probabilidade total será dada por p + q =1. 
Exemplo: Seja 
⎪⎩
⎪⎨
⎧ ≤≤+=
casooutroqualquerem0
3x0seKx
6
1
f(x) 
Pede-se: a) encontrar K; b) encontrar P(1≤ x ≤ 2); c) determinar E(X) e V(X); 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 33
Como qualquer seqüência com k sucessos e (n-k) fracassos terá a mesma probabilidade de 
ocorrência, resta-nos saber quantas se pode formar. Para isto calcula-se knC , que é o número de 
seqüências possíveis que podem ocorrer. 
Definição: A variável aleatória discreta X tem comportamento binomial com “n” repetições de E e 
probabilidade de sucesso p, cuja função de probabilidade é dada por: 
 
 onde: 
)!kn(!k
!nCkn −= knkkn qpC)kX(P −== 
 k = 0, 1, 2, ..., n; 
 k! = 1 . 2 . 3 . ... . k. 
 
A esperança e a variância são dadas por: E(X) = n.p e VAR(X) = n.p.q 
 
 
Solução: Sabe-se que: n = 8, p = 1/2 e q = 1/2. X = número de caras (sucesso). 
a) 22,0
2
1
2
1C)5X(P
585
5
8 =⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛==
−
; 
b) 996,0
2
1
2
1C1)0X(P1)1X(P
080
0
8 =⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛−==−=≥
−
 
c) =⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛+⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛+⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛==+=+==≤
62
2
8
71
1
8
80
0
8 2
1
2
1C
2
1
2
1C
2
1
2
1C)2X(P)1X(P)0X(P)2X(P 0,14 
 
 
4.2 Distribuição de Poisson → Notação: X ~ P(λ) 
Esta distribuição é muito usada quando se deseja contar o número de eventos de um certo tipo, que 
ocorrem em um intervalo de tempo, superfície ou volume, como por exemplo: número de falhas em um 
computador em certo dia; número de chamadas telefônicas durante meio dia; número de relatórios de 
acidentes enviados a uma seguradora em uma semana, etc.. 
Sua aplicação aparece freqüentemente em problemas de fila de espera, controle de estoques, 
controle de qualidade, programação de equipamentos, etc.. O modelo foi desenvolvido pelo matemático 
francês Poisson. 
Definição: A variável aleatória X tem distribuição de Poisson, com parâmetro λ > 0, se: 
 
 
!k
e)kX(P
kλ==
λ−
 
 onde: λ é o número médio de eventos ocorridos no intervalo considerado; 
 k = 0, 1, 2, 3, .......; 
 e ≅ 2,7183; 
 k! = 1 . 2 . 3 . ... . k. 
 
A esperança e a variância são dadas por: E(X) = λ e VAR(X) = λ 
A distribuição binomial pode ser aproximada para a Poisson, fazendo-se λ = n . p, quando o 
tamanho da amostra é grande (n → ∞ ) e a probabilidade p é pequena (p → 0). Na prática, quando n > 30 
e p < 0,05. 
 
Exemplo: Em média há 2 chamadas por hora num certo telefone. Calcular: a) a probabilidade de se 
receber no máximo 3 chamadas em 2 horas; b) a probabilidade de nenhuma chamada em 90 minutos. 
Solução: λ = 2 chamadas/hora. 
Exemplo: Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de ocorrer: a) 5 caras; 
b) pelo menos uma cara; c) no máximo 2 caras. 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 34
a) P(X ≤ 3 (2h)) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = ( ) ( ) ( ) ( )
!3
4e
!2
4e
!1
4e
!0
4e 34241404 −−−− +++ = 
0,0183 + 0,0732 + 0,1464 + 0,1953 = 0,433. 
b) P(X = 0 (1,5h)) = ( )
!0
3e 03− = 0,0498. 
 
A seguir, são apresentados alguns modelos para variáveis aleatórias contínuas. 
 
4.3 Distribuição normal → Notação: X ~ N (µ, σ2) 
A distribuição normal também é conhecida como distribuição de Gauss. É um dos mais 
importantes modelos de probabilidade para variáveis aleatórias contínuas, sendo aplicado em inúmeros 
fenômenos e muito utilizado no desenvolvimento teórico em na área de inferência estatística. 
Definição: A variável aleatória contínua X tem distribuição normal, se a função densidade de 
probabilidade for: 
 
2
2
2
)x(
e
2
1)x(f σ
µ−−
πσ= , ∞<<∞− x 
 
 onde: µ = média populacional; 
σ2 = variância populacional. 
 
A esperança ou média e a variância são os parâmetros da distribuição normal, dados por: E(X) = µ 
e VAR(X) = σ2. 
 
A distribuição normal tem as seguintes características: 
• A curva da distribuição tem forma de sino e é simétrica em relação à média µ; 
• Na medida em que os pontos se afastam da média µ, a curva torna-se assintótica, ou seja, ela se 
aproxima bastante do eixo horizontal, mas não chega a tocá-lo; 
• A área total sobre a curva é 1, devido ao fato da mesma ser uma função densidade de probabilidade; 
• O ponto máximo da função corresponde à média µ. 
0
1
2
3
-2 0 2 4 6 8 10 12 14 z = 0 
50 %50%
 
Para calcular uma probabilidade associada à distribuição normal faz-se: 
 
P (a < X < b) = 
2
2
2
)x(
b
a
e
2
1 σ
µ−−
∫ πσ dx 
 
Para evitar o uso de integrais, os principais valores das probabilidades podem ser encontrados 
numa tabela da curva normal, construída através de uma padronização. 
Esta padronização transforma qualquer valor da variável X numa escala Z, sendo que Z representa 
número de desvios padrões de afastamento em relação à média. 
A fórmula para a padronização de X em Z é: σ
µ−= XZ sendo que os valores de Z e suas 
respectivas áreas de probabilidade estão tabelados. 
 
 
Anaelena B. Moraes, Luciane F. Jacobi, Roselaine R. Zanini 
Departamento de Estatística - UFSM 35
 
Exemplo: Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio padrão 
10. Determine a probabilidade de um indivíduo submetido ao teste ter nota: a) maior que 120; b) maior 
que 80; c) entre 85 e 115; d) maior que 100; e) entre 110 e 120; f) menor que 75; g) igual a 90. 
Solução: 
a) 2
10
100120Z1 =−= → P(X > 120) = P(Z > Z1) = P(Z > 2) = 0,5 – 0,4772 = 0,0228. 
b) 2
10
10080Z1 −=−= → P(X > 80) = P(Z > Z1) = P(Z > -2) = 0,5 + 0,4772 = 0,9772. 
c) 5,1
10
10085Z1 −=−= e 5,110
100115Z2 =−= 
P(75 < X < 115) = P(Z1 < Z < Z2) = P(-1,5 < Z < 1,5) = 0,4332 + 0,4332 = 0,8664. 
d) 0
10
100100Z1 =−= → P(X > 80) = P(Z > Z1) = P(Z > 0) = 0,5 + 0,0000 = 0,5000. 
e) 1
10
100110Z1 =−= e 210
100120Z2 =−= 
P(110 < X < 120) = P(Z1 < Z < Z2) = P(1 < Z < 2) = 0,4772 - 0,3413 = 0,1359. 
f) 5,2
10
10075
1 −=−=Z → P(X < 75) = P(Z < Z1) = P(Z < -2,5) = 0,5 – 0,4938 = 0,0062. 
g) Não é possível calcular a área sobre um ponto, portanto a probabilidade é zero. 
 
Exemplo: Certo produto tem peso médio de 10g e desvio-padrão 0,5g. É embalado em caixas de 120 
unidades que pesam em média 150g e desvio-padrão 8g. Qual a probabilidade de que uma caixa cheia 
pese mais de 1.370g? 
Solução: Peso do produto: µp = 10 e σp = 0,5; Peso da caixa: µc = 150 e σc = 8. 
A média da caixa cheia é µtotal = 120x10 + 150 = 1350g. 
A variância da caixa cheia é 2totalσ = 120x(0,5)2 + (8)2=140,8. O desvio-padrão será σtotal= 8,140 =11,86g. 
Então: 69,1
86,11
13501370Z1 =−= → P(X > 1.370) = P (Z > Z1) = P(Z > 1,69) = 0,5 – 0,4545 = 0,0455. 
 
4.4 Distribuição Qui - Quadrado (χ2) 
Sejam X1, ....., Xn, variáveis aleatórias independentes, normalmente distribuídas,

Outros materiais

Perguntas Recentes