[PDF] ESTATISTICA E PROBABILIDADE

•
UNEB

Felipe Marques
26/03/2020
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
FUNDAÇÃO DE ESTUDOS SOCIAIS DO PARANÁ
ESTATÍSTICA APLICADA
ALUNO: 	
 (
100
)
 (
Marco Antônio Santoro Bara
)
Nota sobre o autor	
Marco Antônio Santoro Bara é Bacharel em Administração de Empresas pela FESP (Fundação de Estudos Sociais do PR), é Licenciado em Matemática pela UFPR (Universidade Federal do PR) é pós-graduado em Matemática Superior pela FUSVE-RJ, é pós-graduado em EaD pela FESP, é mestre em Administração na área de Finanças pela UFRGS e doctor of Philosophy in Business Administration pela Flórida Christian University. Certificou-se junto a Case Western Reserve University em parceria com a UNINDUS (Universidade da Indústria da FIEP) no curso de Investigação Apreciativa (I.A.), metodologia utilizada no Fórum Paraná Futuro 10.
É professor universitário das disciplinas: Matemática Financeira, Cálculo Diferencial e Integral, Lógica Matemática e Estatística na FESP (Fundação de Estudos Sociais do PR); lecionou ainda: Geometria Analítica, Matemática Financeira na Escola Técnica da UFPR (Universidade Federal do PR) nos cursos presenciais e lecionou ainda em parceria com o ITDE a disciplina de estatística no módulo à distância; lecionou por mais de 10 anos: Matemática Financeira, Pesquisa Operacional no UNICENP (Centro Universitário Positivo).
Além da experiência em sala de aula como professor, atuou também na indústria, durante 5 anos na Nestlé Industrial e Comercial na área Administrativa – Financeira e atualmente é sócio proprietário da Mbara Empreendimentos Imobiliários LTDA, sócio proprietário da ENZE Curitiba – Distribuidora de Cosméticos e ainda é funcionário do Banco do Brasil.
Dedico este material didático aos meus filhos Ana Paula e Rodrigo
Augusto.
ESTATÍSTICA
1.0 ALGUMAS DEFINIÇÕES DE ESTATÍSTICA
Etimologicamente a palavra estatística vem de “status” expressão latina que significa: ”sensu lato”, o estudo do estado. Os primeiros a empregarem esse termo foram os Alemães seguidos pela Itália, França, Inglaterra e ainda por outros países.
Para Levasseur a estatística é: “O estudo numérico dos fatos sociais”. Yule define estatística como: “Dados quantitativos afetados marcadamente por uma multiplicidade de causas”.
Uma definição mais usual nos dias de hoje seria: “Um método científico que permite a análise, em base probabilística, de dados coligados e condensados”. Ou ainda podemos dizer que Estatística é um conjunto de métodos quantitativos, que servem para a coleta, organização, redução e apresentação de dados, análise dos mesmos e a obtenção de conclusões válidas e tomadas de decisões a partir de tais análises.
Estatística pode ser entendida como sendo a ciência de aprendizagem a partir de dados.
No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas. Assim podemos dizer que a Estatística fornece métodos que auxiliam o processo de tomada de decisão.
1.1 POR QUE ESTUDAR ESTATÍSTICA?
O raciocínio estatístico é largamente utilizado no governo e na administração; assim, é possível que, no futuro, um empregador venha a contratar ou promover um profissional por causa do seu conhecimento de estatística. Essa é uma razão, esperamos que ao final deste trabalho o leitor encontre suas próprias razões.
1.2 A NATUREZA DOS DADOS
Os dados estatísticos constituem a matéria prima das pesquisas estatísticas, eles surgem quando se fazem mensurações ou se restringem observações.
Estatística descritiva: Trata-se da descrição e resumo dos dados.
Probabilidade: É um estudo que envolve o acaso.
Inferência: É a análise e interpretação de dados amostrais (Amostragem).
Modelos: São versões simplificadas (abstrações) de algum problema ou situação real.
1.3 TIPOS DE DADOS
Quantitativos	Contínuos Discretos
Qualitativos	Nominais Por postos
As variáveis contínuas podem assumir qualquer valor num intervalo contínuo. Os dados referentes a tais variáveis dizem-se dados contínuos. Ex.: peso, comprimento, espessura onde se usa a mensuração.
As variáveis discretas assumem valores inteiros de dados discretos são os resultados da contagem de números de itens. Ex.: alunos da sala de aula, número de defeitos num carro novo, acidentes de uma fábrica.
Os dados nominais surgem quando se definem categorias e se conta o número de observações pertencentes a cada categoria. Atuam dentro das variáveis “Qualitativas”, às quais devemos associar a valores numéricos para que possamos processar estatisticamente. Ex.: cor dos olhos (azuis, verdes, castanhos), sexo (masculino e feminino), desempenho (excelente, bom, sofrível, mau), etc.
Os dados por postos consistem de valores relativos atribuídos para denotar ordem: primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em 1ª, 2ª, 3ª colocadas.
TABELA 1: A mesma população pode originar diferentes tipos de dados.
TIPOS DE DADOS
	POPULAÇÕES
	CONTÍNUOS
	DISCRETOS
	NOMINAIS
	POR POSTO
	Alunos de administração
	idade/peso
	N. de classes
	Homens/Mulheres
	3º grau
1.4 TIPOS DE LEVANTAMENTOS
Os levantamentos podem ser classificados em contínuos, periódicos e ocasionais:
CONTÍNUOS: Quando os eventos vão sendo registrados à medida que ocorrem. Exemplos os registros civis dos fatos vitais (nascimento, óbitos e casamentos).
PERIÓDICOS: Acontecem ciclicamente. Exemplo é o recenseamento, feito no Brasil a cada dez anos. A realização de um Censo Demográfico representa o desafio mais importante para um instituto de estatística, sobretudo em um país de dimensões continentais como o Brasil, com 8 514 215,3 km2, composto por 27 Estados e 5 507 municípios existentes na data de referência da pesquisa, abrangendo um total de 54 265 618 de domicílios pesquisados (dados do IBGE sobre o Censo de 2000).
OCASIONAIS: São aqueles realizados sem a preocupação de continuidade ou periodicidade preestabelecidas, exemplos a maioria dos trabalhos de investigação cientifica.
Os dados ainda podem ser classificados em: primários e secundários.
DADOS PRIMÁRIOS: Quando o investigador não encontra dados publicados adequados ao seu estudo, parte para a realização de um inquérito, isto é, os dados são levantados diretamente na população no momento da investigação.
DADOS SECUNDÁRIOS: Quando o investigador para verificar as suas hipóteses de trabalho utiliza-se de dados já existentes, arquivados, registrados ou publicados. Podem ser, até mesmo, dados gerados pelo Departamento de Estatística de Populações da Fundação Instituto Brasileiro de Geografia e Estatística (IBGE).
1.5 PLANEJAMENTO DE EXPERIMENTOS 1- Definição do problema: Um Estudo ou Uma Análise 2- Formular plano adequado para coleta de dados
3- Organizar os dados
4- Analisar e interpretar os dados 5- Relatar as conclusões
EXERCÍCIOS
1- Identifique os seguintes exemplos em termos de tipos de dados:
a- 17 gramas
b- 3 certos, 2 errados
c- 25 segundos
d- 25 alunos na classe e- tamanho de camisa f- Km/litro
g- O mais aprazível h- O mais lento
i- 5 acidentes no mês de maio
2.0 AMOSTRAGEM	 AMOSTRAGEM VERSUS CENSO: Uma amostra usualmente envolve o estudo de uma parcela dos itens de uma população, enquanto que o censo requer o estudo de todos os itens.
Restrições ao Censo:
· Custo
· Populações infinitas
· Dificuldade nos critérios (Precisão)
· Produtos de testes Destrutivos (fósforos, munições)
· Tempo despendido (atualização)
· Tipos de informações mais restritivas
Casos de exceção:
· Populações pequenas
· Amostras grandes em relação à população
· Se exige precisão completa
· Se já são disponíveis informações completas
2.1 DEFINIÇÕES:
POPULAÇÃO: é o conjunto de indivíduos (ou objetos), que tem pelo menos uma variável comum observável. População é a totalidade dos elementos de um conjunto com uma dada característica, no qual se deseja fazer um determinado estudo.
AMOSTRA: é qualquer subconjunto da população extraída para se realizar estudos estatísticos.
A estatística indutiva é a ciência que busca tirar conclusões probabilísticas sobre a população, com base em resultados verificados em amostras retiradas dessa população.
Entretanto não basta que saibamos descrever convenientemente os
dados da amostra para que possamos executar, com êxito, um trabalho estatístico completo. Antes de tudo é preciso garantir que a amostra ou amostras que serão utilizadas sejam obtidas por processos adequados.
· O que é necessário garantir, em suma, é que a amostra seja “Representativa”
da população.
Dois aspectos nas amostras são fundamentais, e que dão a sua representatividade em termos:
· Qualitativos: Amostras que representem todas as subpopulações, quando for o caso.
· Quantitativos: Que possua quantidade de dados suficientes para representar a população.
Na indústria onde amostras são frequentemente retiradas para efeito de Controle da Qualidade dos produtos e materiais, em geral os problemas de amostragem são mais simples de resolver.
Por outro lado, em pesquisas sociais, econômicas ou de opinião, a complexidade dos problemas de amostragem são normalmente bastante grandes.
Inferência estatística envolve a formulação de certos julgamentos sobre um todo após examinar apenas uma parte, ou a amostra, dele.
A probabilidade e a amostragem estão estreitamente correlacionadas e juntas formam o fundamento da teoria de inferência.
· Amostragem é o ato de retirar amostra, isto é, a ação.
· Amostra é a quantidade de dados especificados para representar a população.
Amostragem aleatória permite estimar o valor do erro possível, isto é, dizer
“quão próxima” está a amostra da população, em termos de representatividade.
Amostragem não aleatória não apresenta esta característica.
Há vários métodos para extrair uma amostra, talvez o mais importante seja a amostragem aleatória. De modo geral, a amostragem aleatória exige que cada elemento tenha a mesma oportunidade de ser incluído na amostra.
Nas Populações discretas uma amostra aleatória é aquela em que cada item da população tem a mesma chance de ser incluído na amostra.
Nas Populações contínuas, uma amostra aleatória é aquela em que a probabilidade de incluir na amostra qualquer intervalo de valores é igual à percentagem da população que está naquele intervalo.
Populações finitas: é quando, temos constituído por números finitos, ou fixos de elementos, medidas ou observações.
Ex.: Peso bruto de 3000 latas de tinta de um certo lote de produção.
Populações infinitas: são aquelas que contém, pelo menos hipoteticamente, um número infinito de elementos.
Ex.: Produção de carros V.W. produzidos no Brasil e a serem produzidos (universo volkswagem), processo probabilístico.
2.2 AMOSTRAGEM ALEATÓRIA BASEADA EM NÚMEROS ALEATÓRIOS (RANDÔMICOS)
As tabelas de números aleatórios contém os dez algarismos 0,1,2,3,4,.	,9.
Esses números podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem.
A probabilidade de qualquer algarismo aparecer em qualquer ponto é 1/10. Portanto todas as combinações são igualmente prováveis.
Conceitualmente, poderíamos construir uma tabela de números aleatórios numerando dez bolinhas com os algarismos de 0 a 9, colocando-as numa urna,
misturando bem e extraindo uma de cada vez, com reposição, anotando os valores obtidos.
A título de ilustração poderíamos querer selecionar aleatoriamente 15 clientes de uma lista de 830 de um grande magazine, a finalidade poderia ser:
Estimar a frequência de compras; Determinar o valor médio de cada compra; Registrar as queixas contra o sistema.
2.3 OUTROS PLANOS DE AMOSTRAGEM	
Amostragem probabilística versus Amostragem não probabilística.
Os planos de amostragem probabilística são delineados de tal modo que se conhece a probabilidade de todas as combinações amostrais possíveis. Em razão disso, pode-se determinar a quantidade de variável amostral numa amostra aleatória e uma estimativa do erro amostral. A amostragem aleatória é um exemplo da amostragem probabilística.
A amostragem não probabilística é a amostragem subjetiva, ou por julgamento, onde a variabilidade amostral não pode ser estabelecida com precisão, consequentemente, não é possível nenhuma estimativa do erro amostral.
A verdade é que, sempre que possível, deve-se usar a amostragem probabilística.
2.4 AMOSTRAGEM POR JULGAMENTO (NÃO PROBABILÍSTICA)
Se o tamanho da amostra é bem pequeno; digamos, de uns 5 itens, a amostragem aleatória pode dar resultados totalmente não representativos, ao passo que uma pessoa familiarizada com a população pode especificar quais os itens mais representativos da população.
Exemplo: Uma equipe médica deve trabalhar com pacientes que se apresentem como voluntários para testar um novo medicamento. Nenhum desses grupos podem ser considerados como uma amostra aleatória do público em geral, e seria perigoso tentar tirar conclusões gerais com base em tal estudo. Todavia, os resultados poderiam proporcionar uma base para a elaboração de um plano de amostragem aleatório para validar os resultados básicos. Os perigos inerentes à pesquisa médica, bem como outro tipo de pesquisa, frequentemente obrigam a limitar a pesquisa inicial a um pequeno grupo de voluntários.
Exemplo: A aplicação de hormônios em mulheres na menopausa, após um período de tempo notou-se o aumento das chances de adquirirem câncer de mama, doenças cardíacas etc.
2.5 AMOSTRAGEM PROBABILÍSTICA	
SISTEMÁTICA ESTRATIFICADA CONGLOMERADO
AMOSTRAGEM SISTEMÁTICA
 (
K= N /n
)É muito parecida com a amostragem aleatória simples. Podemos ter uma amostragem realmente aleatória, escolhendo-se cada K-ésima amostra, onde K obtém-se dividindo o tamanho da população pelo tamanho da amostra.
onde:	N= Tamanho da População n= Tamanho da Amostra
EX. N= 200 e n=10 então K=200/10 = 20
Significa que será escolhido um item a cada sequência de 20 de uma lista. Para iniciar pode-se usar uma tabela de números aleatórios de 0 a 9 para iniciar os grupos. Por exemplo se der o 9, escolhemos o 9º, 29º, 49º, 69º .., etc.
AMOSTRAGEM ESTRATIFICADA
Pressupõe a divisão da população em subgrupos Homogêneos (Estratos), procedendo então a amostragem de cada subgrupo. Ex.: Para se fazer o inventário do estoque, é comum termos 10% dos itens representarem cerca de 60% do valor total enquanto que os 90% restantes representam só 40% do valor total (Curva A,B,C; Pareto; regra 80/20).
AMOSTRAGEM POR CONGLOMERADO
Pressupõe a disposição dos itens de uma população em subgrupos heterogêneos (subpopulações) representativos da população global. Neste caso cada conglomerado pode ser encarado como uma mini população.
Ex.: Estudo pré-eleitoral para medir a preferência dos eleitores. (Subgrupos: sexo, educação, faixa etária, poder aquisitivo, região da habitação, etc.)
RESUMO
A finalidade da amostra é permitir fazer inferência sobre a população após inspeção de apenas parte dela. Fatores como custo, ensaios destrutivos e populações infinitas, tornam a amostragem preferível a um estudo completo (Censo) da população.
Naturalmente espera-se que a amostra seja representativa da população da qual foi extraída.
Potencialmente, este objetivo é atingido quando a amostragem é aleatória.
Para populações discretas o termo “Aleatório” significa que cada item da
população tem a mesma chance de participar na amostra.
No caso de populações contínuas, significa que a probabilidade de incluir qualquer valor de um dado intervalo de valores é igual à proporção de valores naquele intervalo.
As amostras aleatórias podem ser obtidas:
· Através de um processo de mistura, como o embaralhamento de cartas;
· Pela utilização de um processo mecânico (Misturadores);
· Utilizando-se uma tabela de números aleatórios para proceder à seleção de uma lista.
Em certas condições, podem ser mais eficientes variantes da amostragem aleatória simples, tais como amostragem sistemática (periódica), estratificada (subgrupos Homogêneos), ou amostragem por aglomerados (subgrupos convenientes e heterogêneos).
A principal vantagem da amostragem aleatória é que se pode determinar o grau de variabilidade amostral, o que é essencial na inferência estatística. Para a amostragem não probabilística falta esta característica.
3.0 ANÁLISE EXPLORATÓRIA DE DADOS
Em alguma fase de seu trabalho, o pesquisador se vê às voltas com o problema
de analisar e entender uma massa de dados, relevantes ao seu particular objeto de estudos.
De modo geral, podemos dizer que a essência da ciência é a observação e que seu objetivo básico é a inferência. Esta é a parte da metodologia da ciência que tem por objetivo a coleta, a redução, a análise e a modelagem dos dados, a partir do que, finalmente, faz-se a inferência para uma população, da qual os dados (amostras) foram obtidos.
4.0 DISTRIBUIÇÃO DE FREQUÊNCIA
Para cada tipo de variável existem técnicas mais apropriadas para resumir as informações.
Porém podemos usar algumas técnicas empregadas num caso e adaptá-las para outros.
Quando se estuda uma variável, o maior interesse do pesquisador é conhecer a distribuição dessa variável através das possíveis realizações (valores) da mesma.
Exemplo: Dados relativos a uma amostra de 36 funcionários de uma população de 2000 funcionários da empresa XYZ. Ver resultados anotados na tabela abaixo.
TABELA 1: Dados relativos a uma amostra de 36 funcionários de uma população de 2000 funcionários da empresa XYZ.
	Nº
	ESTADO CIVIL
	GRAU DE INSTRUÇÃO
	Nº DE FILHOS
	SALÁRIO (X SAL. MIN)
	IDADE ANOS MESES
	REGIÃO DE PROCEDÊNCIA
	1
	solteiro
	1º grau
	---
	4
	26
	03
	interior
	2
	casado
	1º grau
	1
	4,56
	32
	10
	capital
	3
	casado
	1º grau
	2
	5,25
	36
	05
	capital
	4
	solteiro
	2º grau
	- --
	5,73
	20
	10
	outro
	5
	solteiro
	1º grau
	---
	6,26
	40
	07
	outro
	6
	casado
	1º grau
	0
	6,66
	28
	00
	interior
	7
	solteiro
	1º grau
	---
	6,86
	41
	00
	interior
	8
	solteiro
	1º grau
	---
	7,39
	43
	04
	capital
	9
	casado
	2º grau
	1
	7,59
	34
	10
	capital
	10
	solteiro
	2º grau
	- --
	7,44
	23
	06
	outro
	11
	casado
	2º grau
	2
	8,12
	33
	06
	interior
	12
	solteiro
	1º grau
	---
	8,46
	27
	11
	capital
	13
	solteiro
	2º grau
	- --
	8,74
	37
	05
	outro
	14
	casado
	1º grau
	3
	8,95
	44
	02
	outro
	15
	casado
	2º grau
	0
	9,13
	30
	05
	interior
	16
	solteiro
	2º grau
	- --
	9,35
	38
	08
	outro
	17
	casado
	2º grau
	1
	9,77
	31
	07
	capital
	18
	casado
	1º grau
	2
	9,8
	39
	07
	outro
	19
	solteiro
	superior
	---
	10,53
	25
	08
	interior
	20
	solteiro
	2º grau
	- --
	10,76
	37
	04
	interior
	21
	casado
	2º grau
	1
	11,06
	30
	09
	outro
	22
	solteiro
	2º grau
	- --
	11,59
	34
	02
	capital
	23
	solteiro
	1º grau
	---
	12,00
	41
	00
	outro
	24
	casado
	superior
	0
	12,79
	26
	01
	outro
	25
	casado
	2º grau
	2
	13,23
	32
	05
	interior
	26
	casado
	2º grau
	2
	13,6
	35
	00
	outro
	27
	solteiro
	1º grau
	---
	13,85
	46
	07
	outro
	28
	casado
	2º grau
	0
	14,69
	29
	08
	interior
	29
	casado
	2º grau
	5
	14,71
	40
	06
	interior
	30
	casado
	2º grau
	2
	15,99
	35
	10
	capital
	31
	solteiro
	superior
	---
	16,22
	31
	05
	outro
	32
	casado
	2º grau
	1
	16,61
	36
	04
	interior
	33
	casado
	superior
	3
	17,26
	43
	07
	capital
	34
	solteiro
	superior
	---
	18,75
	33
	07
	capital
	35
	casado
	2º grau
	2
	19,40
	48
	11
	capital
	36
	casado
	superior
	3
	23,30
	42
	02
	interior
TABELA 2: Frequência e porcentagem da amostra de 36 empregados da empresa XYZ, segundo o grau de instrução.
	GRAU DE INSTRUÇÃO
	TABULAÇÃO
	FREQUÊNCIA
f
	FREQ. RELATIVA fR (%)
	1º grau
	I I I I I I I I I I I I
	12
	33,33
	2º grau
	I I I I I I I I I I I I I I I I I I
	18
	50,00
	superior
	I I I I I I
	6
	16,67
	TOTAL
	
	36
	100
TABELA 3: Frequência e porcentagem dos 2000 empregados (População) da empresa XYZ (Censo x Probabilidade)
	GRAU DE
INSTRUÇÃO
	FREQUÊNCIA
f
	FREQ. RELATIVA
fR % CENSO
	FREQ. RELATIVA
fR % PROVÁVEL
	1º grau
	650
	32,50
	33,33
	2º grau
	1020
	51,00
	50,00
	superior
	330
	16,50
	16,67
	TOTAL
	2000
	100
	100
TABELA 4: Frequência e porcentagens dos 36 empregados (Amostra) da empresa XYZ.
	CLASSES DE SALÁRIOS
	FREQUÊNCIA
f
	FREQ. RELATIVA
fR (%)
	4 |----- 8
	10
	27,78
	8 |----- 12
	12
	33,33
	12 |----- 16
	8
	22,22
	16 |----- 20
	5
	13,89
	20 |----- 24
	1
	2,78
	TOTAL
	36
	100
TABELA 5: Frequências e porcentagem dos empregados da empresa XYZ, segundo Nº de filhos.
	Nº DE FILHOS
	FREQÜÊNCIA
f
	FREQ. RELATIVA fR (%)
	0
	4
	20
	1
	5
	25
	2
	7
	35
	3
	3
	15
	5
	1
	5
	TOTAL
	20
	100
5.0 APRESENTAÇÃO GRÁFICA
A apresentação gráfica dos dados e respectivos resultados de sua análise pode também ser feita sob forma de figuras, em geral gráficos ou diagramas.
Gráficos devem ser autoexplicativos e de fácil compreensão, de preferência sem comentários inseridos. Os gráficos devem ser simples, atrair a atenção do leitor e inspirar confiança.
5.1 DIAGRAMA DE ORDENADAS
Para sua construção é traçada uma reta horizontal (ou vertical) de sustentação; a partir de pontos equidistantes na reta, traçam-se perpendiculares cujos comprimentos sejam proporcionais às frequências.
Ex. Considerando a tabela abaixo:
	CLASSES DE
SALÁRIOS
	FREQUÊNCIA
f
	FREQ. RELATIVA
fR (%)
	4 |----- 8
	10
	27,78
	8 |----- 12
	12
	33,33
	12 |----- 16
	8
	22,22
	16 |----- 20
	5
	13,89
	20 |----- 24
	1
	2,78
	TOTAL
	36
	100
Frequências 12
10
8
6
4
2
0
4 I-------8	8 I-------12	12 I-------16	16 I-------20	20 I	24
Salários
5.2 (
SALÁRIOS
)DIAGRAMA DE BARRAS/COLUNAS
A mesma distribuição acima poderia ser representada por meio de diagrama que levasse em conta a magnitude da área da figura geométrica, já que a vista repousa melhor sobre uma superfície do que sobre uma linha.
Ex. Considerando a tabela abaixo:
	CLASSES DE
SALÁRIOS
	FREQUÊNCIA
f
	FREQ. RELATIVA
fR (%)
	4 |----- 8
	10
	27,78
	8 |----- 12
	12
	33,33
	12 |----- 16
	8
	22,22
	16 |----- 20
	5
	13,89
	20 |----- 24
	1
	2,78
	TOTAL
	36
	100
	14
	
	12
	
	
	
	
	
	10
	
	
	
	
	
	8
	
	
	
	
	
	6
	
	
	
	
	
	4
	
	
	
	
	
	2
	
	
	
	
	
	0
	
4 |----- 8
	
8 |----- 12
	
12 |----- 16
	
16 |----- 20
	
20 |----- 24
5.4 DIAGRAMA DE SETORES CIRCULARES
Outra opção seria através de setores circulares, na qual se divide a área total de um círculo em subáreas (setores) proporcionais as frequências.
Ex. Considerando a tabela abaixo:
	CLASSES DE
SALÁRIOS
	FREQUÊNCIA
f
	FREQ. RELATIVA
fR (%)
	4 |----- 8
	10
	27,78
	8 |----- 12
	12
	33,33
	12 |----- 16
	8
	22,22
	16 |----- 20
	5
	13,89
	20 |----- 24
	1
	2,78
	TOTAL
	36
	100
 (
Salários
2.78
13.89
27.78
22.22
33.33
1
2
3
4
5
)
5.5 DIAGRAMA LINEAR
No diagrama linear deve-se plotar os pontos nos eixos como foi feito no diagrama de barras e em seguida unir esses pontos por semi-retas constituindo- se desta forma o diagrama linear.
Ex. Considerando a tabela abaixo:
	CLASSES DE
SALÁRIOS
	FREQUÊNCIA
f
	FREQ. RELATIVA
fR (%)
	4 |----- 8
	10
	27,78
	8 |----- 12
	12
	33,33
	12 |----- 16
	8
	22,22
	16 |----- 20
	5
	13,89
	20 |----- 24
	1
	2,78
	TOTAL
	36
	100
 (
Salários
14
12
10
8
6
4
2
0
4 |----- 8
8 |----- 12
12 |----- 16
16 |----- 20
20 |----- 24
)
6.0 MONTAGEM DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS
A análise estatística de dados relativos a uma amostra de uma população, requer uma aglutinação organizada de informações, conforme regras cuja prática demonstrou serem eficientes.
O agrupamento destes dados em subgrupos é feito com base nos seguintes conceitos:
Amplitude total (AT): é a diferença entre a medida máxima e a medida mínima.
Número de classes (d): é o número de divisões que estipulamos para a Amplitude Total.
Normalmente pode-se usar d ≈ √ n onde n é o número de itens na amostra. (Classe: é o intervalo de variação das medidas.)
Amplitude do intervalo de classe (AI): é a diferença entre os valores máximos e mínimos de cada classe.
 (
AI = AT / d
)Amplitude do intervalo de cada classe
OBS.: Normalmente, usa-se um número mínimo de 5 e no máximo 20 classes, de preferência de mesma amplitude.
As classes devem ser mutuamente exclusivas, para que não haja dúvida na localização dos valores das variáveis, podemos daí utilizar as seguintes simbologias para os intervalos:
0 I 10 intervalo aberto & fechado, para significar que o intervalo compreende
os valores da variável maiores do que 0 (exclusive) e até 10 (inclusive);
0 I 10 intervalo fechado & aberto, para significar que compreende os valores
da variável
a partir de 0 (inclusive) e até 10 (exclusive);
0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores maiores do que 0 e menores do que 10.
0 I----I 10 intervalo fechado & fechado, para significar que compreende os valores da variável a partir de 0 (inclusive) e até 10 (inclusive).
TABELA DE DISTRIBUIÇÃO DAS FREQÜÊNCIAS
Para a facilidade e metodização do processo de análise estatística, monta-se uma tabela que agrupe as informações obtidas, da forma de Tabela de Frequências.
Consideremos uma relação de pesos de pacotes de manteiga, em gramas, de uma amostra de 100 pacotes extraídos parcialmente de um processo automático de empacotamento.
TABELA 6
	AMOSTRA
	PESO
	AMOSTRA
	PESO
	AMOSTRA
	PESO
	AMOSTRA
	PESO
	AMOSTRA
	PESO
	1
	207
	21
	220
	41
	210
	61
	210
	81
	217
	2
	213
	22
	204
	42
	214
	62
	220
	82
	211
	3
	210
	23
	213
	43
	219
	63
	213
	83
	213
	4
	215
	24
	211
	44
	215
	64
	217
	84
	218
	5
	201
	25
	214
	45
	217
	65
	214
	85
	213
	6
	210
	26
	217
	46
	213
	66
	219
	86
	213
	7
	212
	27
	224
	47
	218
	67
	214
	87
	218
	8
	204
	28
	211
	48
	214
	68
	215
	88
	216
	9
	209
	29
	220
	49
	215
	69
	223
	89
	206
	10
	212
	30
	209
	50
	212
	70
	217
	90
	212
	11
	215
	31
	214
	51
	221
	71
	213
	91
	207
	12
	216
	32
	208
	52
	211
	72
	218
	92
	213
	13
	221
	33
	217
	53
	218
	73
	207
	93
	215
	14
	219
	34
	214
	54
	205
	74
	210
	94
	212
	15
	222
	35
	209
	55
	220
	75
	208
	95
	223
	16
	225
	36
	212
	56
	203
	76
	214
	96
	210
	17
	215
	37
	208
	57
	216
	77
	211
	97
	226
	18
	218
	38
	215
	58
	222
	78
	205
	98
	224
	19
	213
	39
	211
	59
	206
	79
	215
	99
	214
	20
	216
	40
	216
	60
	221
	80
	207
	100
	215
No caso da amostra de pacotes de manteiga acima, temos:
AT = 226 – 201 = 25 gramas
Temos d  √100 10 classes, porém deve-se utilizar sempre que possível número
ímpar de classes, no caso podemos usar 9 classes.
Amplitude do intervalo de cada classe 2,78 (aprox. 3)
Isto é: AI = 25/9 = 2,78
 (
AI 
adotado = 3 e 
AT 
adotado = 27 (começa um antes do menor e termina um depois do maior valor)
)
TABELA 7
	
	
	
	FREQ
	FREQ.
RELATIVA %
	FREQ.
ACUMULADA
	FREQ. ACUM.
REL. %
	
	CLASSE
	TABULAÇÃO
	f
	fR
	F
	FR
	1
	200 I--- 203
	I
	1
	1
	1
	1
	2
	203 I--- 206
	I I I I
	4
	4
	5
	5
	3
	206 I--- 209
	I I I I I I I I I I
	10
	10
	15
	15
	4
	209 I--- 212
	I I I I I I I I I I I I I I I
	15
	15
	30
	30
	5
	212 I--- 215
	I I I I I I I I I I I I I I I I I I I I I I I I I
	25
	25
	55
	55
	6
	215 I--- 218
	I I I I I I I I I I I I I I I I I I I I I
	21
	21
	76
	76
	7
	218 I--- 221
	I I I I I I I I I I I I I
	13
	13
	89
	89
	8
	221 I--- 224
	I I I I I I I
	7
	7
	96
	96
	9
	224 I--- 227
	I I I I
	4
	4
	100
	100
	
	
	Σ
	100
	100%
	
	
Onde:
Frequência (f) = número de vezes que as medidas ocorrem no intervalo de classes
Frequência Relativa (fR) = porcentagem da frequência de cada classe em relação ao total de elementos.
 (
f
R
 
=
 (f / n).100
)
Frequência acumulada (F) = soma das frequências até o intervalo de classe considerado.
Ex. F5 = f1+ f2 + f3 + f4 + f5 → 1 + 4 + 10 + 15 + 25 = 55
Frequência acumulada relativa (FR) = soma das frequências relativas até o intervalo considerado. Por ex.: FR3 = fR1 + fR2 + fR3 → 1 + 4 + 10 = 15
7.0 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL
Como o próprio nome indica, a medida de tendência central visa a determinar o centro da distribuição. Esta determinação, porém, não é bem definida daí parece razoável chamarmos de “tendência central”.
São medidas de tendência central:
· MÉDIA ARITMÉTICA SIMPLES/PONDERADA ( x̅ );
· MEDIANA (md);
· MODA (mo).
7.1 MÉDIA ARITMÉTICA SIMPLES
7.1.1 PARA UMA LISTA
Esta é a situação mais simples: para se calcular a média, basta somarmos todos os elementos da lista e dividirmos o resultado pelo número de elementos.
 (
x
̅ 
 
=
Σ x
i
 
/
 
n
)
Exemplo: Calcular a média aritmética simples de 8, 3, 5, 12, 10.
x̅ = 8+3+5+12+10 = 38 = 7,6
5	5
7.1.2 PARA DADOS TABULADOS
Outra possibilidade é calcular a média quando os dados vêm dispostos em uma tabela na qual é informada a frequência absoluta simples fi de cada elemento xi. O total de elementos n é obtido somando todas as frequências absolutas simples fi.
 (
x
̅ 
 
=
Σ (x
i
 . f
i
) 
/ 
n
)
Exemplo: Calcular a média aritmética do conjunto descrito a seguir:
	xi
	fi
	1
	2
	2
	3
	3
	1
x̅ = (1 . 2 + 2. 3 + 3 . 1) / (2+3+1)
x̅ = 11 / 6
x̅ = 1,83
7.1.3 PARA DISTRIBUIÇÃO DE FREQUÊNCIA
 (
x
̅ 
 
=
Σ (PM
i
 . f
i
) 
/ 
n
)Neste caso, os dados estão agrupados em classes e devemos calcular a média a partir da distribuição de frequência correspondente, apresentada em forma de tabela. Cada classe tem um ponto médio PM que é igual à metade da soma de seus limites inferior e superior.
Exemplo: Calcular a média do conjunto descrito pela distribuição de frequência a seguir:
	xi
	fi
	0 |----- 3
	2
	3 |----- 6
	5
	6 |----- 9
	7
	9 |----- 12
	4
	12 |----- 15
	3
x̅ = (1,5 . 2 + 4,5 . 5 + 7,5 . 7 + 10,5 . 4 + 13,5 . 3) / (2+5+7+4+3)
x̅ = 160,5 / 21
x̅ = 7,64
7.2 MÉDIA ARITMÉTICA PONDERADA
 (
x
̅ 
 
=
Σ(x
i
 .f
i
 ) 
/
 
Σ f
i
)
onde: fi = frequência dos dados xi
Exemplo: Calcular a média ponderada dos números 5, 8, 6, 2 ; os quais ocorrem com as frequências 3, 2, 4 e 1, respectivamente.
Números x = 5, 8, 6, 2
Frequências f = 3, 2, 4, 1
x̅ = 5.3+8.2+6.4+2.1 = 57 = 5,7
3+2+4+1	10
7.3 MEDIANA (md)
7.3.1 PARA UMA LISTA
Esta é a situação mais simples: para se calcular a mediana, basta ordenar os elementos da lista e localizar o elemento que está ao centro da lista, isto é, para o qual há o mesmo número de ocorrências antes e depois.
Obs.: se o número de elementos for par, basta localizar os dois elementos medianos e calcular média aritmética entre eles.
Exemplo-1: Qual é a mediana do conjunto {10, 7, 5, 1, 3, 4 ,6} Basta ordenar e localizar o elemento mediano: {1,3,4,5,6,7,10}
md = 5
Exemplo-2: Qual é a mediana do conjunto {10, 7, 5, 1, 3, 4 , 6, 9 }
Basta ordenar e localizar o elemento mediano: {1,3,4,5,6,7,9,10} md = (5+6) / 2
md = 5,5
7.3.2 PARA DADOS TABULADOS
No caso de cálculo da mediana quando estamos trabalhando com dados tabulados determinamos o valor mais provável dessa distribuição a partir de:
Posição da md = (Frequência acumulada total + 1) = FA + 1
2	2
Exemplo: Qual a mediana do conjunto descrito pela tabela abaixo:
	xi
	fi
	FA
	10
	3
	3
	13
	4
	7
	16
	6
	13
	17
	5
	18
	25
	1
	19
Como n = 19 , a posição central é (n+1) / 2, logo 20 /2 , isto é 10° posição. Portanto a mediana é md = 16
{10,10,10,13,13,13,13,16,16,16,16,16,16,17,17,17,17,17,25}
Ou seja, a posição da MEDIANA é definida por	n+1 
2
-ésimo elemento
quando ”n” é ímpar e temos um número inteiro que dá a posição da mediana. Quando temos o meio do caminho entre dois números inteiros, isto é, ”n” é par, a mediana será a média deles.
Exemplo: Determine a posição da mediana para: (a) n=15, (b) n=45 e (c)n=88.
(a) n+1 = 15+1	= 8	, e a mediana é o valor do 8° elemento; 2	2
(b) n+1 = 45+1 = 23	, e a mediana é o valor do 23° elemento; 2	2
(c) n+1 = 88+1 = 44,5	, e a mediana é a média do valor do 44° e o
2	2	45°elemento.
Ou seja, quando n é par procuramos duas posições:	n
2
e	n +1 2
7.3.3 PARA DISTRIBUIÇÃO DE FREQUÊNCIA
Neste caso, os dados estão agrupados em classes e devemos calcular a mediana a partir da distribuição de frequência correspondente, apresentada em forma de tabela. Ao contrário dos itens anteriores, não precisamos nos preocupar se há um número ímpar ou par de elementos. Basta encontrar a classe mediana e aplicar a fórmula para o cálculo da mediana para distribuição de frequências.
No caso do exercício da distribuição dos 100 valores de peso de pacotes de manteiga temos:
Posição da md = (Frequência acumulada total ) = FA
2	2
md = FA = 100 = 50, e a mediana é o valor do 50° elemento
2	2
 (
50° valor
)
	F 0
	1
	5
	15
	30
	55
	76
	89
	96
	100
	X 200
	203
	206
	209
	212
	215
	218
	221
	224
	227
	
(55 – 30)
(55 – 50)
	
(215 – 212)
Δ
	
ou
	
(55 – 30)
(50 – 30)
	
(215 – 212)
Δ
Δ = 5 x 3 = 0,6
25
portanto a mediana
será 215 - Δ
logo, md = 215 - 0,6 = 214,4.
Δ = 20 x 3 = 2,4
25
portanto a mediana será 212 + Δ
logo, md = 212 + 2,4 = 214,4.
Assim, para encontrarmos a mediana para dados agrupados em classes
podemos formalizar os passos anteriores na seguinte equação:
Md = linf + h.
n/2 - Fant fmed
onde:
n/2 = metade da quantidade de dados
h = amplitude da classe mediana
linf = limite inferior da classe da mediana
fmed = frequência absoluta da classe da mediana
Fant = frequência acumulada da classe anterior a da mediana
Voltando ao exemplo, temos:
1º Passo: da tabela 7 - página 18, temos as frequências acumuladas já calculadas;
2º Passo: n = 100 => n/2 = 100/2 = 50 => localização da classe mediana: 5ª classe, isto é, classe 212 I--- 215;
3º Passo: encontrar na tabela: linf , fmed e Fant :
linf = 212
fmed = 25
Fant = 30
4º Passo: substituir os dados na equação:
md = linf + h.
n/2 - Fant fmed
md = 212+ 3.
50 – 30
25
= 212 + 3. 0,8 = 212 + 2,4 = 214,4
md = 214,4
7.3.1 SEPARATRIZES (QUARTIS, DECIS E CENTIS)
Como extensão do conceito de mediana, podemos dividir os valores em quatro, dez e cem partes iguais. Essas divisões são chamadas de quartis, decis e centis, respectivamente.
O cálculo dessas divisões é semelhante ao da mediana, isto é:
Quartis:
Qi = linf + h.
i.n/4 - FQi-1
fQi
onde i = 1,2,3
Decis:
 (
i.n/10 -
 
F
Di-1
f
Di
)Di = linf + h.	onde i = 1,2,3, ..., 8,9.
Centis:
Ci = linf + h.
i.n/100 - FCi-1 fCi
onde i = 1,2,3,...,98,99.
Onde:
h = amplitude da classe
linf = limite inferior da classe da quartílica, decílica ou percentílica
fQi , fDi , fCi = frequências das classes quartílica, decílica e percentílica, respectivamente
FQi-1 , FDi-1 , FCi-1 = frequências acumuladas da classe anterior à classe quartílica, decílica ou percentílica.
Voltando ao exemplo anterior, temos:
i) Se quisermos calcular o 1º Quartil, ou seja, 25% dos dados:
Q1 = linf + h.
1.n/4 - FQi-1
fQi
= 209 + 3.
100/4 – 15	=
15
209 + 3 . 0,67	= 211
ii) Para o 3º Quartil:
Q3 = linf + h.
3.n/4 - FQi-1
fQi
= 215 + 3 .
3.100/4 – 55
21
215 + 3. 0,95 = 217,85
iii) Para o 8º Decil:
D8 = linf + h.
8.n/10 - FDi-1
fDi
= 218 + 3.
8.100/10 - 76
13
218 +3. 0,31 = 218,93
iv) Para o 15º Centil:
:
C15 = linf + h.
15.n/100 - FCi-1
fCi
= 206 + 3.
15.100/100 - 5
10
= 209
OBS.: Caso tenhamos dados não agrupados em classes, como por exemplo a sequência 2,3,3,4,5,7,7,8,10,11,12,12, 13; o cálculo do 3º Quartil será:
Posição:	3.n/4 = 3.13/4 = 9,75
A posição 9,75ª será aproximada pela inteira imediatamente posterior a ela, ou seja, a 10ª posição, logo Q3 = 11. E assim, analogamente, para encontrar os decis e centis de uma série de dados não agrupados em classes.
7.4 MODA ( mo )
7.4.1 PARA UMA LISTA
Em um conjunto de números a moda é o valor que ocorre com maior frequência, isto é, o valor mais comum.
Exemplos:
1) 2, 2, 3, 7, 8, 8, 8, 9, 10
moda=8
2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
moda = Ф (não existe moda)
3) 2, 2, 4, 4, 4, 5, 6, 7, 8, 8, 8, 9
moda = 4 e 8
7.4.2 PARA DADOS TABULADOS
Para se determinar a moda quando os dados vêm dispostos em uma tabela, deve-se procurar qual elemento tem a maior frequência absoluta simples.
Exemplo: Qual a moda do conjunto descrito abaixo?
	xi
	fi
	10
	3
	13
	4
	16
	5
	17
	7
	25
	2
mo = 17 , pois aparece 7 vezes.
7.4.3 PARA DISTRIBUIÇÃO DE FREQUÊNCIAS
Na verdade, o cálculo da moda para uma distribuição de frequências é apenas aproximado, haja vista não sabermos exatamente como os dados estão distribuídos dentro de cada classe.
Para o exemplo do exercício das distribuições de frequências dos pacotes de manteiga (onde os dados são tabulados agrupados em classes) uma forma de estimar o valor da moda é pela Estimativa de Pearson (para dados tabulados agrupados em classes):
 (
m
o
 = 3. m
d
 – 2. x
̅
)
Voltando ao exemplo, temos:
mo = 3.214,4 – 2. 214,49 => mo = 214,22
onde a média foi calculada da forma:
x̅ = 201,5 . 1 + 204,5 .4 + 207,5 .10 + 210,5 .15 + 213,5 .25 + 216,5 .21 + 219,5 . 13 + 222,5. 7 + 225,5. 4
1 + 4 + 10 + 15 + 25 + 21 + 13 + 7 + 4
x̅ = 214,49
O cálculo da moda pelo Método de Pearson é mais utilizado quando temos uma indicação de que os três parâmetros de tendência central (média, mediana e moda) estejam muito próximos.
Um outro método, de origem gráfica, é o Método de Czuber, que utilizamos na maioria dos casos:
mo = linf + h.
 	a	.
a + p
onde:
linf = limite inferior da classe modal.
a = diferença entre a fi da classe modal e a fi da classe anterior. Entenderemos como classe anterior aquela que precede à classe modal.
p = diferença entre a fi da classe modal e a fi da classe posterior (aquela que vem logo após a classe modal).
h = amplitude da classe modal.
O primeiro passo é a determinação da classe modal, aquela com maior fi.
No nosso exemplo é 212 I--- 215 pois temos 25 elementos nesta classe.
mo = 212 + 3.
 	( 25 - 15 )	.
(25-15) + (25-21)
mo = 212 + 3 . 	10	.
10 + 4
mo = 212 + 3 . 0,7143
mo = 212 + 2,14
mo = 214,14
EXERCÍCIOS
1-) Qual a média aritmética dos números ímpares menores do que 10?
R: 5
2-) Calcule a média aritmética do conjunto descrito a seguir:
	xi
	fi
	1
	3
	2
	4
	3
	1
	4
	2
R: 2,2
3-) Calcular a média do conjunto descrito pela distribuição de frequências a seguir:
	xi
	fi
	0,0 |----- 2,0
	15
	2,0 |----- 4,0
	25
	4,0 |----- 6,0
	13
	6,0 |-----8,0
	37
	8,0 |-----10,0
	10
R: 5,04
4-) Calcular a mediana do conjunto {5,3,7,1,9}
R: 5
5-) Calcular a mediana do conjunto {1,1,3,5,6,9,23,24}
R: 5,5
6-) Calcular a mediana do conjunto descrito pela tabela a seguir:
	xi
	fi
	100
	3
	135
	6
	160
	5
	175
	7
	250
	2
R: 160
7-) Calcular a mediana do conjunto descrito pela tabela a seguir:
	xi
	fi
	10
	3
	15
	6
	16
	5
	21
	7
	23
	3
R: 16
8-) Calcular a mediana do conjunto descrito pela distribuição de frequência a seguir:
	xi
	fi
	0,0 |----- 2,0
	15
	2,0 |----- 4,0
	25
	4,0 |----- 6,0
	16
	6,0 |-----8,0
	34
	8,0 |-----10,0
	10
R: 5,25
9-) Calcular a moda do conjunto { 5,3,7,1,5,2,9}
R: 5
10-) Calcular a moda do conjunto descrito pela tabela a seguir
	xi
	fi
	100
	3
	135
	6
	160
	5
	175
	7
	250
	2
R: 175
11-) Calcular a moda, pelo método de Czuber, do conjunto descrito pela distribuição de frequência a seguir:
	xi
	fi
	0,0 |----- 2,0
	15
	2,0 |----- 4,0
	25
	4,0 |----- 6,0
	16
	6,0 |-----8,0
	34
	8,0 |-----10,0
	28
R: 7,5
12-) Calcule os quartis da tabela abaixo:
	Classes
	fi
	50 |----- 54
	10
	54 |----- 58
	23
	58 |----- 62
	28
	62 |----- 66
	20
	66 |----- 70
	12
	70 |----- 74
	7
	Total
	100
 (
Decil: 3, 7 e 9
Centil: 13, 33 e 80
)R: Q1 = 56,61	,	Q2 = 60,43	, Q3 = 64,8
8.0 TIPOS DE DISTRIBUIÇÃO
As distribuições de frequência podem se apresentar de diversas formas conforme as figuras a seguir:
8.1 DISTRIBUIÇÃO SIMÉTRICA OU EM FORMA DE SINO
A distribuição é simétrica quando os valores se distribuem igualmente em torno da média
A) Normal
B) Alongada
C) Achatada
Distribuições simétricas
A distribuição das frequências faz-se de forma aproximadamente simétrica, relativamente a uma classe média
Caso especial de uma distribuição simétrica
Quando dizemos que os dados obedecem a uma distribuição normal, estamos tratando de dados que distribuem-se em forma de sino.
Distribuições Assimétricas
A distribuição das frequências apresenta valores menores num dos lados:
CURVA ASSIMÉTRICA À DIREITA (ASSIMETRIA POSITIVA)
CURVA ASSIMÉTRICA À ESQUERDA (ASSIMETRIA NEGATIVA)
8.3 DISTRIBUIÇÃO MODAL, AMODAL, BIMODAL E MULTIMODAL
Chamamos de moda (mo) numa distribuição, ao valor da medida ou classe que corresponde à frequência máxima. Sob o critério da moda as distribuições classificam-se em:
A) DISTRIBUIÇÃO MODAL – Quando a distribuição tem frequência máxima ela é denominada modal.
mo
B) DISTRIBUIÇÃO AMODAL – Quando a distribuição não tem moda
C) DISTRIBUIÇÃO BIMODAL – Quando a distribuição tem duas modas.
mo	mo
D) DISTRIBUIÇÃO MULTIMODAL
– Quando a distribuição tem mais de duas modas
mo	mo	mo
9.0 MEDIDAS DE VARIABILIDADE (OU DE DISPERSÃO)
As medidas de dispersão indicam se os valores estão relativamente próximos uns dos outros, ou separados. Podemos dizer que dispersão é o grau com o qual os valores numéricos de uma distribuição tendem a se distanciar em torno de um valor médio.
Em todos os casos, o valor zero indica ausência de dispersão; a dispersão aumenta à proporção que aumenta o valor da medida (amplitude, desvio- padrão, variância).
9.1 AMPLITUDE TOTAL (AT)
É a medida mais simples de dispersão. É a diferença entre o maior e o menor valor das observações.
AT = Xmax – Xmin
Embora exista simplicidade de cálculo, existem duas restrições ao seu uso generalizado:
1- Utiliza apenas uma parcela das informações contidas nas observações. O seu valor não se modifica mesmo que os valores das observações variem, desde que conservem os seus valores máximo e mínimo. Ou seja, depende apenas dos valores externos (max e min), não sendo afetada pelos valores internos.
2- Depende do número de observações na amostra. Em geral o valor da amplitude cresce quando cresce o tamanho da amostra.
9.2 DESVIO EM RELAÇÃO À MÉDIA ARITMÉTICA (di)
O desvio di em relação à média de um conjunto de dados é a diferença do valor xi e a média aritmética x̅ do conjunto, isto é:
di = (xi - x̅ )
Exemplos :
1-) Calcular os desvios di para o seguinte conjunto : 3, 4, 5, 6, 7
Onde	x̅ = 3+4+5+6+7	= 5
5
	xi
	di
	3
	-2
	4
	-1
	5
	0
	6
	1
	7
	2
	
	∑ di = 0
2-) Calcular os desvios di para a seguinte distribuição :
	xi
	fi
	di
	82
	5
	-4,6
	85
	10
	-1,6
	87
	15
	0,4
	89
	8
	2,4
	90
	4
	3,4
	
	∑ fi = 42
	∑ di = 0
Onde	x̅ = 82 .5.+ 85. 10 + 87. 15 + 89 . 8 + 90. 4
5 + 10 + 15 + 8 + 4
x̅ = 86,6
(3) Calcular os desvios di para a seguinte distribuição :
	Classes
	xi (PM)
	fi
	di
	di . fi
	35 |----- 45
	40
	2
	-22,91
	-45,82
	45 |----- 55
	50
	13
	-12,91
	-167,83
	55 |----- 65
	60
	20
	-2,91
	-58,20
	65 |----- 75
	70
	10
	7,09
	70,90
	75 |----- 85
	80
	7
	17,09
	119,63
	85 |----- 95
	90
	3
	27,09
	81,27
	
	
	∑ fi = 55
	∑ di = 12,55
	∑ di. fi = 0
Onde x̅ = 40 .2 + 50 .13 + 60 .20 + 70 .10 + 80 .7 + 90 .3
2 + 13 + 20 + 10 + 7 + 3
x̅ = 3460 / 55
x̅ = 62,91
9.3 DESVIO MÉDIO ( d̅ )
O desvio médio d̅ é a média aritmética dos módulos dos desvios, isto é:
d̅ = ∑ di = ∑ xi - x̅
n	n
Para uma distribuição de frequências (simples ou por classes), teremos:
d̅ = ∑ di . fi = ∑ xi - x̅	.fi
n	n
Exercício
13-) Calcular o desvio médio para os exemplos (1), (2) e (3) anteriores.
9.4 VARIÂNCIA ( ou s2)
Variância da população é a soma dos quadrados dos desvios de cada observação em relação à média de “x” e divide-se por N. Indica-se a Variância da População por σ².
Podemos fazer a mesma analogia com a Variância da Amostra dada por S².
 (
σ² = 
∑ (x
i
 - µ)
2
 
. f
i
N
)Variância para uma população:
onde  é a média populacional e N é o tamanho da população.
 (
s
2
 = ∑ (x
i
 - 
x
̅ 
)
2
 .f
i
n - 1
)Variância para uma amostra:
Onde x̅ é a média amostral e n é o tamanho da amostra.
As equações anteriores para  e s2 representam uma maneira de cálculo dessas medidas.
Podemos também utilizar as seguintes equações:
 (
σ² = 
∑ f
i
(x
i
)
2
 – N. µ
2
N
) (
s
2
 = ∑ f
i
(x
i
)
2
 – n. 
x
̅ 
2
n - 1
)
Como medida de dispersão, a Variância tem a desvantagem de apresentar como unidade de medida o quadrado da unidade de medida dos dados. Se os dados estão em metros, a Variância fica em metros quadrados. O desvio padrão por sua vez, fica com valor na mesma da unidade da variável.
Obs: A variância sendo uma média de uma soma de quadrados é sempre maior ou igual a 0. Ela será nula se os valores dos dados são constantes.
9.5 DESVIO PADRÃO ( ou s)
É a medida que determina a variação dos valores observados em torno da média da distribuição, e representa a distância do ponto de inflexão da curva até a linha da média.
A partir da variância podemos calcular o desvio padrão como segue:
Desvio padrão da população:  =√
Desvio padrão da amostra: s = √s2
9.6 COEFICIENTE DE VARIAÇÃO (cv)
 (
cv = 

 

 


)O coeficiente de variação cv é a razão entre o desvio padrão e a média aritmética. Esta medida é adimensional e geralmente é expressa em porcentagens. A equação para o seu cálculo é:
Para população
 (
cv = 
s
 

 

x
̅
)Para amostra
Exercícios
14-) (ICMS/MG) As alturas do jogadores de basquete da seleção brasileira são: 1,98m; 2,04m; 2,06m; 2,02m e 2,05m. A média de altura dessa seleção e m, é de:
a) 2,01	b) 2,02	c) 2,03	d) 2,04	e) 2,05
15-) (TTN) Assinale a alternativa correta, considerando a série: 8,5,14,10,8 e15.
a) A média aritmética é 10 e a mediana é 12.
b) A amplitude total é 7 e a moda é 8.
c) A mediana é 9 e a amplitude total é 10.
d) A média aritmética é 1 e a amplitude total é 7.
e) A mediana é 12 e a amplitude total é 7.
16-) (ICMS/MG) Na série composta de notas de Estatística: 4,5,7,8,5,5,6,8,6. A média aritmética simples, a mediana e a moda são, respectivamente:
a) 6,5 e 4
b) 6,6 e 5
c) 6,6 e 6
d) 6,5 e 5
e) 7,6 e 5
17-) (ICMS/MG) Dados os conjuntos de valores: A = {1,1,2,3,4,5,5,8,8,8,9,10}
B = {6,7,8,9,10,11,12}
C = {1,2,4,4,4,4,5,8,9,9,9,9,10}
Em relação a moda, afirmamos que:
I-	A é unimodal, e a moda é 8 II-	B é unimodal, e a moda é 9
III-	C é bimodal, e as modas são 4 e 9.
Então, em relação as afirmativas, é correto dizer que:
a) Todas são verdadeiras
b) Todas são falsas
c) Somente I e II são verdadeiras
d) Somente I e III são verdadeiras
e) Somente II e III são verdadeiras
18-) (AFRF/05) Para dados agrupados representados por uma curva de frequências, as diferenças entre os valores da média, da mediana e da moda são indicadores da assimetria da curva. Indique a relação entre essas medidas de posição para uma distribuição negativamente assimétrica.
a) A média apresenta o maior valor e a mediana se encontra abaixo da moda.
b) A moda apresenta o maior valor e a média se encontra abaixo da mediana.
c) A média apresenta o menor valor e a mediana se encontra abaixo da moda.
d) A média, a mediana e a moda são coincidentes.
e) A moda apresenta o menor valor e a mediana se encontra abaixo da média.
19-) (TRF/06) Considere a seguinte distribuição das frequências absolutas dos salários mensais em R$, referente a 200 trabalhadores de uma indústria (os intervalos são fechados à esquerda e abertos à direita).
	Classes de Salários
	Frequências
Absolutas
	De R$ 400 até R$ 500
	50
	De R$ 500 até R$ 600
	70
	De R$ 600 até R$ 700
	40
	De R$ 700 até R$ 800
	30
	De R$ 800 até R$ 900
	10
Sobre essa distribuição de salários é correto afirmar que:
a) O salário modal encontra-se na classe de R$800 até R$900
b) O salário mediano encontra-se na classe de R$600 até R$700
c) O salário modal encontra-se na classe de R$600 até R$700
d) O salário modal encontra-se na classe de R$700 até R$800
e) O salário mediano encontra-se na classe de R$500 até R$600.
20-) (ICMS/MG) O quadro abaixo nos mostra a distribuição dos erros cometidos por 20 alunos numa prova de português. O valor do desvio médio dessa distribuição é:
	N0 DE ERROS
(xi)
	N0 DE ALUNOS
(fi)
	1
	2
	2
	6
	3
	5
	4
	4
	5
	3
a) 1,0
b) 1,5
c) 2,0
d) 2,5
e) 3,0
Gabarito
14 -- C
15 -- C
16 -- B
17 -- D
18 – B e C
19 -- E
20 – A
21-) (TRF) Considere os seguintes conjuntos de observações referentes a cinco diferentes variáveis:
T: 10;10;10;10;10;8
V: 10;10;10;10;8;8
X: 10;10;10;8;8;8
Y: 10;10;8;8;8;8
Z: 10;8;8;8;8;8
O conjunto de observações que apresenta a maior variabilidade, medida pelo desvio padrão, é o referente à variável:
a) Y
b) T
c) V
d) X
e) Z
22-) (AFRF/02) Numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de frequências abaixo:
	Classes
	Frequência (f)
	29,5 |----- 39,5
	4
	39,5 |----- 49,5
	8
	49,5 |----- 59,5
	14
	59,5 |----- 69,5
	20
	69,5 |----- 79,5
	26
	79,5 |----- 89,5
	18
	89,5 |----- 99,5
	10
Assinale a opção que corresponde ao desvio absoluto
médio. a) 16,0
b) 17,0
c) 16,6
d) 18,1
e) 13,0
23-) (AFRF/09) Considere a seguinte amostra aleatória das idades em anos completos dos alunos em um curso preparatório. Com relação a essa amostra, marque a única opção correta: 29,27,25,39,29,27,41,31,25,33,27,25,25,23,27,27,32,26,24,36,32,26,28,24,28,
27,24,26,30,26,35,26,28,34,29,23,28.
a) A média e a mediana das idades são iguais a 27.
b) A moda e a média das idades são iguais a 27.
c) A mediana das idades é 27 e a média é 26,08.
d) A média das idades é 27 e o desvio padrão é 1,074.
e) A moda e a mediana das idades são iguais a 27.
24-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	2 |----- 4
	2
	4 |----- 6
	6
	6 |----- 8
	5
	8 |----- 10
	4
	10 |----- 12
	3
25-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	2 |----- 4
	11
	4 |----- 6
	10
	6 |----- 8
	11
	8 |----- 10
	4
	10 |----- 12
	4
26-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	4 |----- 6
	8
	6 |----- 8
	10
	8 |----- 10
	20
	10 |----- 12
	30
	12 |----- 14
	20
27-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	2 |----- 4
	7
	4 |----- 6
	9
	6 |----- 8
	18
	8 |----- 10
	10
	10 |----- 12
	6
28-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	2 |----- 4
	9
	4 |----- 6
	12
	6 |----- 8
	6
	8 |----- 10
	2
	10 |----- 12
	1
29-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	4 |----- 6
	6
	6 |----- 8
	8
	8 |----- 10
	12
	10 |----- 12
	10
	12 |----- 14
	4
30-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	45 |----- 55
	3
	55 |----- 65
	7
	65 |----- 75
	4
	75 |----- 85
	5
	85 |----- 95
	1
31-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	9 |----- 19
	10
	19 |----- 29
	20
	29 |----- 39
	40
	39 |----- 49
	20
	49 |----- 59
	10
32-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	50 |----- 60
	15
	60 |----- 70
	20
	70 |----- 80
	30
	80 |----- 90
	20
	90 |----- 100
	15
33-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	20 |----- 30
	10
	30 |----- 40
	20
	40 |----- 50
	25
	50 |----- 60
	20
	60 |----- 70
	10
34-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	50 |----- 58
	10
	58 |----- 66
	15
	66 |----- 74
	25
	74 |----- 82
	24
	82 |----- 90
	16
	90 |----- 98
	10
35-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	2 |----- 4
	6
	4 |----- 6
	10
	6 |----- 8
	14
	8 |----- 10
	6
	10 |----- 12
	4
36-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	2 |----- 4
	20
	4 |----- 6
	15
	6 |----- 8
	35
	8 |----- 10
	20
	10 |----- 12
	10
37-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa:
	Classe
	f
	2 |----- 4
	5
	4 |----- 6
	5
	6 |----- 8
	10
	8 |----- 10
	30
	10 |----- 12
	20
	12 |----- 14
	25
	14 |----- 16
	5
38-) (PUC-SP) O histograma abaixo apresenta a distribuição de frequência das faixas salariais numa pequena empresa.
Com os dados disponíveis, pode-se concluir que a média desses salários é , aproximadamente:
a) R$ 420,00
b) R$ 536,00
c) R$ 562,00
d) R$ 640,00
e) R$ 708,00
39-) Numa escola, o professor de educação física mediu as alturas de 100 alunos do sexo masculino e construiu a seguinte distribuição de frequências:
	Alturas
(em cm)
	Número de
estudantes
	150 |----- 158
	5
	158 |----- 166
	15
	166 |----- 174
	48
	174 |----- 182
	25
	182 |----- 190
	7
Pede-se:
a) Variância
b) Desvio padrão
c) Histograma
40-) Qual a Variância e o Desvio Padrão para a distribuição da seguinte tabela?
	Número de pessoas
	Idade
	5
	22
	3
	14
	6
	18
	1
	28
	4
	21
	8
	20
a) 7,85 e 3 respectivamente
b) 8,15 e 2,9 respectivamente
c) 8,5 e 3,1 respectivamente
d) 8,75 e 2,5 respectivamente
e) 8,06 e 2,8 respectivamente
GABARITO
21 D
22 E
23 E
24 Média	= 7 Moda	= 5,6 Mediana	= 6,8 Q1	= 5
Q3	= 9
D1	= 4
D9	= 10,66
Variância = 6 Desvio padrão = 2,45 Desvio médio = 2
Coeficiente de variação = 0,3499 Variância relativa	= 0,1224
25 Média	= 6
Moda	= 3,83 e 6,25
Mediana = 5,8
Q1	= 3,82
Q3	=	7,63
D1	= 2,72
D9	= 10
Variância =	6,4 Desvio padrão = 2,53 Desvio médio = 2,15
Coeficiente de variação = 0,4216 Variância relativa	= 0,1778
26 Média	= 10 Moda	= 11 Mediana = 10,4 Q1	=	8,4
Q3	=	11,87
D1	=	6,16
D9	=	13,12
Variância =	5,91 Desvio padrão = 2,43 Desvio médio = 2,05
Coeficiente de variação = 0,2431 Variância relativa	= 0,0591
27 Média = 6,96 Moda = 7,06 Mediana = 7
Q1	= 5,22
Q3	= 8,7
D1	= 3,42
D9	= 10,33
Variância = 5,68 Desvio padrão = 2,38 Desvio médio = 1,81
Coeficiente de variação = 0,3424 Variância relativa	= 0,1172
28 Média = 5,27 Moda = 4,67 Mediana = 5
Q1	= 3,64
Q3	= 6,5
D1	= 2,66
D9	= 8
Variância = 4,2 Desvio padrão = 2,05 Desvio médio = 1,57
Coeficiente de variação = 0,3889 Variância relativa	= 0,1513
29 Média	= 8,9 Moda	= 9,33 Mediana = 9
Q1	= 7
Q3	= 10,8
D1	= 5,33
D9	= 12
Variância =	5,79 Desvio padrão = 2,41 Desvio médio = 1,93
Coeficiente de variação = 0,2704 Variância relativa	= 0,0731
30 Média	= 67 Moda	= 60,71 Mediana = 65
Q1	= 57,85
Q3	= 77
D1	= 51,66
D9	= 83
Variância = 131 Desvio padrão = 11,45 Desvio médio = 10
Coeficiente de variação = 0,1708 Variância relativa	= 0,0292
31 Média = 34 Moda = 34 Mediana = 34 Q1	= 27
Q3	= 42
D1	= 19,5
D9	= 49,5
Variância = 120 Desvio padrão = 10,95 Desvio médio = 8
Coeficiente de variação = 0,3175 Variância relativa	= 0,1008
32 Média = 75 Moda = 75 Mediana = 75 Q1	= 65
Q3	= 85
D1	= 56,66
D9	= 93,33
Variância = 160 Desvio padrão = 12,65 Desvio médio = 10
Coeficiente de variação = 0,1680 Variância relativa	= 0,0284
33 Média = 45 Moda = 45 Mediana = 45
Q1	= 35,625
Q3	= 54,375
D1	= 28,5
D9	= 61,5
Variância = 141,18 Desvio padrão = 11,88 Desvio médio = 9,41
Coeficiente de variação = 0,2640 Variância relativa	= 0,0697
34	Média	= 74,08
Moda	= 73,27
Mediana = 74
Q1	= 66
Q3	= 82,5
D1	= 58
D9	= 90
Variância = 132,47 Desvio padrão = 11,51 Desvio médio = 9,68
Coeficiente de variação = 0,1554 Variância relativa	= 0,0241
35 Média	= 6,6 Moda	= 6,66 Mediana = 6,57 Q1	= 4,8
Q3	= 8
D1	= 3,33
D9	= 10
Variância =	5,44 Desvio padrão = 2,33 Desvio médio = 1,88
Coeficiente de variação = 0,3534 Variância relativa	= 0,1249
36 Média	= 6,7 Moda	= 7,14 Mediana = 6,85 Q1	= 4,66
Q3	= 8,5
D1	= 3
D9	= 10
Variância = 6,11 Desvio padrão = 2,47 Desvio médio = 1,99
Coeficiente de variação = 0,3689 Variância relativa	= 0,1361
37 Média	= 10 Moda	= 9,33 Mediana = 10 Q1	= 8,33
Q3	= 12,4
D1	= 6
D9	= 13,6
Variância = 8,6 Desvio padrão = 2,93 Desvio
médio = 2,4
Coeficiente de variação = 0,2933 Variância relativa	= 0,0860
38 E
39 Variância = 55,07	Desvio Padrão = 7,42
40 E
10.0 PROBABILIDADE
O problema fundamental da estatística consiste em trabalhar com o acaso e a
incerteza.
Chama-se probabilidade de um acontecimento a razão entre o número de casos
favoráveis ao mesmo e o número total de acontecimentos possíveis.
As leis da hereditariedade foram a primeira grande aplicação das probabilidades na área de biociências. Hoje conhecemos muitas aplicações: ocorrência de mutações, risco de doenças, chance de sobrevivência, distribuição e interação de espécies, etc.
A aplicação mais importante, entretanto, é feita na estatística. Nenhuma observação e nenhuma experiência podem ser precisamente planejadas e analisadas sem algum método estatístico. Mesmo se mantivermos as condições experimentais mais constantes possíveis, a repetição de uma observação ou uma experiência dificilmente resulta sempre exatamente igual. Sempre existem flutuações.
Portanto, todas as conclusões baseadas em dados empíricos (baseado apenas na experiência, e não no estudo) são necessariamente encaradas com incerteza. Tentamos expressar o grau de incerteza em termos de probabilidades. Então, um pesquisador afirma “significância ao nível de cinco por cento”, ele admite a possibilidade de uma afirmativa errônea. Antes da compreensão de alguns métodos estatísticos é necessário um conhecimento básico sobre probabilidades.
Quando se considera uma população limitada de P indivíduos, a probabilidade de cada um ser escolhido, ao acaso, é de 1/P.
Laplace definiu probabilidade como: “O quociente do número de casos favoráveis sobre o número de casos igualmente possíveis”. Por exemplo, se jogarmos uma moeda “não viciada” para o ar, de modo geral não podemos afirmar se vai dar cara ou coroa.
Porém existem apenas dois eventos possíveis: sair “cara” (K) ou “coroa” (C). Nesse exemplo existe um caso favorável a esse evento em dois casos possíveis. A P (K) = ½ ou 50%.
Considerando-se “cara” como sucesso e “coroa” como fracasso e representando-se o acontecimento favorável como “P” e o não favorável como “Q”, temos as razões:
P= ½ e Q = ½
Sendo P+Q = 1 então P= (1 - Q) e Q = (1 - P)
A probabilidade de um evento A, denotada por P (A), é um número de 0 a 1, que indica a chance de ocorrência do evento A. Quanto mais próxima de 1 é P(A), maior é a chance de ocorrência do evento A, e quanto mais próxima de Zero, menor é a chance de ocorrência do evento A.
 (
A
 
um
 
evento
 
impossível
 
atribui-se
 
a
 
probabilidade
 
Zero
.
 
Um
 
evento
 
certo
 
tem probabilidade
 
1
.
)
As probabilidades podem ser expressas, inclusive por valores decimais, frações e porcentagem como: 20%; 2 em 10; 0,2; ou ainda, 1/5.
Além do uso na interpretação de jogos de azar, usa-se ainda a probabilidade mediante determinada combinação de julgamento, experiência ou dados históricos, para predizer Quão Provável é a ocorrência de determinado evento futuro.
Há numerosos exemplos de tais situações no campo dos Negócios e do Governo. A previsão da aceitação de um novo produto, o cálculo dos custos de produção, a contratação de um novo empregado, o preparo do orçamento, a avaliação do impacto de uma redução de impostos sobre a inflação – tudo isso contém algum elemento de acaso.
10.1 ESPAÇO AMOSTRAL E EVENTOS
Consideremos o experimento que consiste em “extrair uma carta de um baralho de 52 cartas”. Há 52 eventos elementares no espaço amostral. Quanto aos eventos podemos classificá-los em:
 (
A
)ESPAÇO AMOSTRAL
COMPLEMENTO
MUTUAMENTE EXCLUSIVOS
NAO SÃO MUTUAMENTE EXCLUSIVOS
Cartas vermelhas e cartas pretas
 (
A
B
)Não se interceptam cartas de copas e cartas de paus
 (
A
B
)Cartas de copas e figuras, tem elementos em comum.
 (
A
B
C
D
)COLETIVAMENTE EXAUSTIVOS
Cartas de paus, ouro, copas e espadas
10.2 TRÊS ORIGENS DA PROBABILIDADE
Há três maneiras diferentes de calcular ou estimar probabilidades, O método Clássico, quando o espaço amostral tem resultados igualmente prováveis. O método Empírico, que se baseia na frequência relativa de ocorrência de um evento num grande número de provas repetidas; e o método Subjetivo, que utiliza estimativas pessoais baseadas num certo grau de crença.
OBJETIVO	SUBJETIVO
	CLÁSSICO
	EMPÍRICO
	Opinião Pessoal
	(resultados igualmente prováveis)
O Método Clássico
	(dados históricos)
	
Os jogos de azar (lançamento de moedas, jogo de dados, extração de cartas) usualmente apresentam resultados igualmente prováveis.
 (
P (cada
 
resultado)
 
=
 
1
.
N
° 
de resultados
 
possíveis
)Nestes casos temos:
Se cada carta de um baralho de 52 tem a mesma chance de ser escolhida, então a probabilidade de extrair cada uma delas é de 1/52 : P (A) = 1/52 ou 1,92%.
Da mesma forma a probabilidade de termos uma cara no lançamento de uma
moeda é ½ ou 50%. O mesmo ocorre com uma coroa, ou seja, ½ ou 50%.
No caso de um dado temos a probabilidade de dar qualquer número: 1, 2, 3, 4, 5 ou 6 de 1/6 ou de 16,66%.
De forma geral vale também a expressão:
 (
P(A) = 
Número de resultados associados ao evento A
 Número total de resultados possíveis
)
Por exemplo, a probabilidade de extração de uma dama, de acordo com esta definição, é:
P (dama) = 4 damas = 		4 . = 1 . = 7,69% 52 cartas	52	13
Analogamente, a probabilidade de obter número ímpar no lance de um dado é: P(ímpar) = 	3 faces	. = 3 .	ou 50%
6 faces possíveis	6
A MATEMÁTICA DA PROBABILIDADE
Muitas aplicações de estatística exigem a determinação da probabilidade de combinações de eventos. Há duas categorias de eventos de interesse, A e B, no espaço amostral.
Pode ser necessário determinar P(A e B), isto é; a probabilidade de ocorrência de ambos os eventos.
Em outras situações, podemos querer a probabilidade de ocorrência de A ou B,
P(A ou B).
Cálculo da Probabilidade da ocorrência de dois eventos “independentes”
P(A e B)
Se dois eventos são independentes, então a probabilidade da ocorrência de ambos é igual ao produto de suas probabilidades individuais:
P(A e B) = P(A) . P(B)
Exemplo: Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas as faces serem cara?
É razoável admitir que os resultados das duas moedas sejam independentes um do outro. Além disso, para moedas equilibradas, P(cara)= ½ .
Logo P(cara e cara) será:
	1ª moeda
	
	2ªmoeda
	
	½
	x
	½
	=	¼ ou 25%
Cálculo da Probabilidade da ocorrência de dois eventos “mutuamente exclusivos”
P(A ou B ocorrerá)
Se dois eventos são mutuamente exclusivos, a probabilidade de ocorrência de qualquer um deles é a soma de suas probabilidades individuais. Para dois eventos A e B temos:
P(A ou B) = P(A) + P(B)
Exemplo: qual é a probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado?
P(cinco) ou P(seis) = P (5) + P(6) = 1 . + 	1 . = 2	. = 33,33%
6	6	6
Cálculo da Probabilidade da ocorrência de dois eventos “não mutuamente
exclusivos”
P(A ou B ou ambos ocorrerão)
Suponhamos a probabilidade de extração de uma carta de paus ou um dez de um baralho de 52 cartas. Como é possível que uma carta seja simultaneamente de “paus” e um “dez”, os eventos não são mutuamente exclusivos. Assim devemos excluir a probabilidade de intersecção. Então temos:
P(paus) = 13 . , P(dez)= 	4	., P( dez de paus) = 1 ., 52	52	52
P(paus ou dez, ou ambos) = P(paus) + P(dez) - P(dez de paus)
= 13	. + 	4	.- 	1	.	= 16 . = 30,77%
52	52	52	52
NAIPE
 (
♣
 
K
♣
 
Q
♣ 
J
♣
 
10
♣
 
9
♣
 
8
♣
 
7
♣
 
6
♣
 
5
♣
 
4
♣
 
3
♣
 
2
♣ 
A
) (
♦
 
J
♦
 
10
♥
 
10
♠ 
10
)PAUS		OUROS		COPAS	ESPADA PRETA	VERMELHA	VERMELHA		PRETA
	♣ K
♣ Q
♣ J
	· K
· Q
· J
	♥ K
♥ Q
♥ J
	♠ K
♠ Q
♠ J
	♣ 10
	♦ 10
	♥ 10
	♠ 10
	♣ 9
	♦ 9
♦ 8
♦ 7
♦ 6
♦ 5
♦ 4
♦ 3
♦ 2
♦ A
	♥ 9
♥ 8
♥ 7
♥ 6
♥ 5
♥ 4
♥ 3
♥ 2
♥ A
	♠ 9
♠ 8
♠ 7
♠ 6
♠ 5
♠ 4
♠ 3
♠ 2
♠ A
	♣ 8
	
	
	
	♣ 7
	
	
	
	♣ 6
	
	
	
	♣ 5
	
	
	
	♣ 4
	
	
	
	♣ 3
	
	
	
	♣ 2
	
	
	
	♣ A
	
	
	
Resumindo:
P (A e B), para eventos independentes (Multiplicação) P(A) x P(B)
P (A ou B), para eventos mutuamente exclusivos (Soma) P(A)
+ P(B)
P (A ou B ou ambos ocorrerão), para eventos não mutuamente exclusivos
P(A) + P(B) - P(A interseção B)
10.3 ALGUMAS PROPRIEDADES
Como foi visto no final do item anterior, existem algumas regras de probabilidade. Neste item detalharemos tais regras, conhecidas como propriedades da probabilidade.
Revendo, a probabilidade de um evento A ocorrer é um número entre 0 e 1, ou seja:
0  P(A)  1
Se considerarmos o espaço amostral, S, e o conjunto vazio, , como eventos, temos:
P(S) = 1 (evento certo)
P() = 0 (evento impossível)
Arranjo com Repetição
Todos os elementos podem aparecer repetidos em cada grupo de p elementos.
Fórmula: Ar(m,p) = mp.
Exemplo: Seja C={A,B,C,D}, m=4 e p=2. Os arranjos com repetição desses 4 elementos tomados 2 a 2 são 16 grupos que onde aparecem elementos repetidos em cada grupo. Todos os agrupamentos estão no conjunto:
 (
A
r
={
A
A
,
A
B,A
C
,
A
D
,
B
A
,
B
B
,
BC,
B
D
,CA,
C
B
,
C
C
,CD,DA,DB
,D
C
,DD}
)
Permutação com Repetição
Se em um dado conjunto um elemento é repetido a vezes, outro elemento é repetido b vezes e assim sucessivamente, o número total de permutações que podemos obter é dada por:
A resolução do exemplo com o uso da fórmula é:
Exemplos
Quantos anagramas podemos obter a partir das letras da palavra PARAR?
Como a palavra PARAR possui 5 letras, mas duas delas são repetidas duas vezes cada, na solução do exemplo vamos calcular P5(2, 2):
Portanto:
O número de anagramas que podemos formar a partir das letras da palavra PARAR é igual 30.
Possuo 4 bolas amarelas, 3 bolas vermelhas, 2 bolas azuis e 1 bola verde. Pretendo colocá-las em um tubo acrílico translúcido e incolor, onde elas ficarão umas sobre as outras na vertical. De quantas maneiras distintas eu poderei formar esta coluna de bolas?
 (
10
)Neste caso de permutação com elementos repetidos temos um total de 10 bolas de quatro cores diferentes. Segundo a repetição das cores, devemos calcular P (4, 3, 2):
Então:
Eu poderei formar esta coluna de bolas de 12600 maneiras diferentes.
Combinação com Repetição
Todos os elementos podem aparecer repetidos em cada grupo até p vezes.
Fórmula: Cr(m,p)=C(m+p-1,p)
Exemplos:
1) De quantos modos podemos comprar 4 salgadinhos em uma lanchonete que oferece 7 opções de escolha de salgadinhos?
R: 210
2) Podendo escolher entre 5 tipos de queijo e 4 marcas de vinho, de quantos modos é possível fazer um pedido num restaurante, com dois queijos e 3 garrafas de vinho?	R = 300
Exercícios	
41-) Joga-se uma vez: um dado equilibrado, determine a probabilidade de obter:
a) Um 6
b) 5 ou 6 ou 7
c) Um número par
d) Um número menor que quatro
42-) Há 50 bolas numa urna, distribuídas da seguinte maneira: 20 azuis, 15 vermelhas, 10 laranjas e 5 verdes. Misturaram-se as bolas e escolhe-se uma.
Determine a probabilidade de a bola escolhida ser:
a) Verde
b) Azul
c) Azul ou verde
d) Não vermelha
e) Vermelha ou verde
f) Amarela
g) Não amarela
43-) Um baralho tem 52 cartas divididas igualmente entre 4 naipes: ouros, copas, paus e espadas. Os naipes paus e espadas são de cor preta. Os naipes de ouros e copas de cor vermelha. Cada naipe possui 13 cartas: A (ás),2,3,4,5,6,7,8,9,10, J (valete),Q(dama) e K(rei).
Extrai-se uma só carta de um baralho de 52 cartas. Determine a probabilidade de obter:
a) Um valete
b) Uma figura
c) Uma carta vermelha
d) Uma carta de ouros
e) Um dez de paus
f) Um nove vermelho ou um oito preto
g) Um nove ou um valete
h) Uma carta de ouros ou uma dama
44-) (BRDE/01) Observa-se que 10% dos projetos que chegam a uma agência de financiamento apresentam informações incorretas. Qual a probabilidade de que, de três projetos escolhidos aleatoriamente, nenhum deles apresente informação incorreta?
a) Zero
b) 0,001
c) 0,270
d) 0,300
e) 0,729
45-) (TCE-RS/12) Segundo o controle de qualidade de uma empresa, a probabilidade do seu produto apresentar falha é de 0,10. Três pessoas compram o produto. A probabilidade de somente duas dessas pessoas terem comprado o produto com falha é:
a) 0,001
b) 0,009
c) 0,027
d) 0,243
e) 0,810
46-) Lança-se uma moeda 5 vezes, qual a probabilidade de ocorrer 3 caras e duas coroas?
a) 31,25%
b) 25%
c) 40%
d) 37,50%
e) 50%
47-) Dentre doze candidatos que participaram de um teste, quatro reprovaram. Se três dos candidatos fossem selecionados, aleatoriamente, um após o outro, qual a probabilidade de que todos esses alunos tivessem sido aprovados?
a) 14/55
b) 8/55
c) 8/27
d) 27/55
e) 16/27
48-) Um juiz deve analisar 12 processos de reclamações trabalhistas, sendo 4 de médicos, 5 de professores e 3 de bancários. Considere que inicialmente, o juiz selecione aleatoriamente um grupo de 3 processos para serem analisados. Com base nessas informações, assinale a alternativa do valor mais próximo da probabilidade de que, nesse grupo:
I- Todos os processos sejam de bancários a) 1,25%
b) 0,45%
c) 25%
d) 7,5%
e) 12,5%
II- Pelo menos um dos processos seja de professor a) 16%
b) 54%
c) 84%
d) 75%
e) 44%
49-) (UFRJ) Para testar a eficácia de uma campanha de anúncio do lançamento de um novo sabão S, uma agência de propaganda realizou uma pesquisa com 2000 pessoas. Por uma falha da equipe, a agência omitiu os dados dos campos x,y,z e w no seu relatório sobre a pesquisa, conforme mostra a tabela abaixo:
	Número de pessoas que:
	Adquiriram S
	Não adquiriram S
	Total
	Viram o anúncio
	x
	y
	1500
	Não viram o anúncio
	200
	z
	500
	Total
	600
	w
	2000
Suponha que uma dessas 2000 pessoas entrevistadas seja escolhida ao acaso e que todas as pessoas tenham a mesma probabilidade de serem escolhidas.
Determine a probabilidade de que essa pessoa tenha visto o anúncio da campanha e adquirido o sabão S.
50-) No lançamento simultâneo de dois dados, qual a probabilidade de:
a) Se obter soma 8?	b) Ocorrer soma 12?	c) Ocorrer soma 1?
GABARITO
41)	a) 1/6	b) 1/3	c) 1 /2	d) 1 /2
42)	a) 1/10 b) 2/5	c) 1 /2	d) 7/10	e) 2/5	f) 0	g) 1
43)	a) 1/13 b) 3/13 c) 1 /2	d) 1 /4	e) 1/52 f) 1/13 g) 2/13	h) 4/13
44) E
45) C
46) A
47) A
48) I: B	II: C 49)	1/5
50)	a) 5/36	b) 1/36	c) 0
10.4 PROBABILIDADE CONDICIONAL (TEOREMA DE BAYES)
Seja E um espaço amostral finito e não-vazio e A um evento não-vazio de E. Suponhamos que o evento A tenho ocorrido e que queiramos saber qual a probabilidade de ocorrer um outro evento B não-vazio de E.
Essa nova probabilidade é indicada por P(B│A) e dizemos que ela é “a probabilidade de B condicionada ao fato de que A já ocorreu”, ou simplesmente, que é a probabilidade condicional de B em relação a A.
Temos, nesse caso, uma mudança do espaço amostral.
A probabilidade de B será em relação ao espaço amostral A e o elemento procurado de B deverá pertencer a B∩A; portanto, a nova probabilidade é:
 (
P(B│A) = 
P(B∩A)
P(A)
)
Por outro lado, P(B│A) = P(B∩A)  P(B∩A) = P(A) . P(B│A)
P(A)
Como B∩A = A∩B, então P(A∩B) = P(B) . P(A│B)
Podemos escrever então:
 (
P(A∩B) = P(B) . P(A│B) = P(A) . P(B│A)
)
Exemplos:
1-) Uma urna contém 8 bolas amarelas e 6 bolas verdes. Qual é a probabilidade de retirarmos 2 bolas sucessivamente, sem reposição, sendo a primeira verde e a segunda amarela?
P(V) = 6/14 = 3/7 P(A│V) = 8/13
Logo, P(V∩A) = P(V) . P(A│V) = (3/7) . (8/13) = 24/91
2-) Retira-se, ao acaso, um valete de um baralho comum, de 52 cartas. Sem reposição da carta extraída, qual é a probabilidade de, numa segunda retirada, sair outro valete?
P(A)= 4/52 = 1/13
P(B│A) = 3/51 = 1/17
Logo, P(A∩B) = P(A) . P(B│A) = (1/13) . (1/17) = 1/221
Exercícios:
51-) (TCE-RS/12) Dois professores corrigem a prova de redação de um concurso público. O professor A corrige o dobro de provas do que o professor B. Sabe-se que 60% das provas corrigidas pelo professor A tiveram nota superior a 7, enquanto apenas 20% das provas corrigidas pelo professor B tiveram nota superior a 7. Se um candidato teve conceito não superior a 7, a probabilidade de sua prova ter sido corrigida pelo professor A é:
a) 0,85571
b) 0,75000
c) 0,33333
d) 0,50000
e) 0,25000
52-) Os arquivos levantados pelo censo da cidade A
em 1998 revelaram que, apenas 20% dos homens possuem QI (coeficiente de inteligência) acima de 150, enquanto que essa incidência nas mulheres é de 70%. Estima-se em 90% a porcentagem dos homens nessa população. Um pesquisador do censo, acaba de se encontrar com uma pessoa com QI acima de 150. Calcule a probabilidade desta pessoa ser do sexo feminino.
a) 70%
b) 18%
c) 28%
d) 46%
e) 72%
53-) Os arquivos levantados pelo censo da cidade A em 1998 revelaram que, apenas 20% dos homens possuem QI (coeficiente de inteligência) acima de 150, enquanto que essa incidência nas mulheres é de 70%. Estima-se em 90% a porcentagem dos homens nessa população. Calcule a probabilidade de sortear uma pessoa do sexo feminino com QI acima de 150.
a) 70%
b) 18%
c) 28%
d) 46%
e) 72%
54-) Os arquivos da polícia revelam que, das vítimas de acidente automobilístico que utilizam cinto de segurança, apenas 20% sofrem ferimentos graves, enquanto que essa incidência é de 70% entre as vítimas que não utilizam o cinto de segurança. Estima-se em 90% a porcentagem dos motoristas que usam o cinto. A polícia acaba de ser chamada para investigar um acidente em que houve um indivíduo gravemente ferido. Calcule a probabilidade de ela estar usando o cinto no momento do acidente.
	a)
	18%
	b)
	14%
	c)
	56,25%
	d)
	43,75%
	e)
	72%
	55-) A
	probabilidade de Márcio chegar em casa tarde para jantar é 25%. Por
outro lado, a probabilidade do jantar atrasar é 10%. Se não há qualquer relacionamento entre os atrasos de Márcio e os atrasos do jantar, qual a probabilidade de ocorrerem ambos os atrasos?
a) 25%
b) 10%
c) 3%
d) 5%
e) 2,50%
56-) Os arquivos da polícia revelam que, das vítimas de acidente automobilístico que utilizam cinto de segurança, apenas 20% sofrem ferimentos graves, enquanto que essa incidência é de 70% entre as vítimas que não utilizam o cinto de segurança. Estima-se em 90% a porcentagem dos motoristas que usam o cinto. Calcule a probabilidade de um indivíduo estar usando o cinto no momento do acidente e ficar gravemente ferido.
a) 18%
b) 14%
c) 56,25%
d) 43,75%
e) 72%
57-) Uma grande empresa possui dois departamentos: um de artigos femininos e outro de artigos masculinos. Para o corrente ano fiscal, o diretor da empresa estima que as probabilidades de os departamentos de artigos femininos e masculinos obterem uma margem de lucro de 10% são iguais a 30% e 20% respectivamente. Além disso, ele estima em 5,1% a probabilidade de ambos os departamentos obterem uma margem de lucro de 10%. No final do ano fiscal, o diretor verificou que o departamento de artigos femininos obteve uma margem de lucro de 10%. Desse modo, a probabilidade de o departamento de artigos masculinos ter atingido a margem de lucro de 10% é igual a:
a) 17%
b) 20%
c) 25%
d) 24%
e) 30%
58-) Uma companhia preocupada coma sua produtividade costuma oferecer cursos de treinamento a seus operários. A partir da experiência, verificou-se que um operário, recentemente admitido, que tenha frequentado o curso de treinamento te 82% de probabilidade de cumprir sua quota de produção. Por outro lado, um operário, também recentemente admitido, que não tenha frequentado o mesmo curso de treinamento, tem apenas 35% de probabilidade de cumprir com sua quota de produção. Dos operários recentemente admitidos, 80% frequentaram o curso de treinamento. Selecionando-se, aleatoriamente, um operário recentemente admitido na companhia, a probabilidade de que ele não cumpra sua quota de produção é:
a) 11,70%
b) 27,40%
c) 35%
d) 83%
e) 85%
59-) Uma companhia preocupada coma sua produtividade costuma oferecer cursos de treinamento a seus operários. A partir da experiência, verificou-se que um operário, recentemente admitido, que tenha frequentado o curso de treinamento te 82% de probabilidade de cumprir sua quota de produção. Por outro lado, um operário, também recentemente admitido, que não tenha frequentado o mesmo curso de treinamento, tem apenas 35% de probabilidade de cumprir com sua quota de produção. Dos operários recentemente admitidos, 80% frequentaram o curso de treinamento. O presidente da companhia acaba de se encontrar com um operário recentemente admitido que cumpriu sua cota de produção. Calcule a probabilidade de que ele não tenha frequentado o curso de treinamento.
a) 9,64%
b) 65,60%
c) 7,50%
d) 73,70%
e) 85,70%
60-) Os arquivos levantados pelo censo da cidade de São Paulo em 1998 revelaram que, apenas 40% das mulheres possuem casa própria, enquanto que essa incidência nos homens é de 80%. Estima-se em 70% a porcentagem das mulheres nessa população. Um pesquisador do censo de 1998 de São Paulo, acaba de se encontrar com uma pessoa que possui casa própria. Calcule a probabilidade aproximadamente desta pessoa ser do sexo feminino.
a) 18,4%
b) 24%
c) 28%
d) 52%
e) 53,8%
GABARITO
51) D 52) C 53) A 54) E 55) E 56) A 57) A 58) B 59) A
60) E
Distribuição
As distribuições são modelos matemáticos que tem por objetivo resolver certos problemas probabilísticos.
As principais distribuições são as seguintes:
1) Distribuição Binomial
2) Distribuição Multinomial	variáveis descontínuas
3) Distribuição Hipergeométrica	(no ponto)
4) Distribuição de Poisson
5) Distribuição Normal	variável contínua (no intervalo)
1. Distribuição Binomial
Se p é a probabilidade de um evento acontecer em uma tentativa única (denominada probabilidade de um sucesso) e q = 1 – p é a de que o evento não ocorra em qualquer tentativa única (denominada probabilidade de insucesso), então a probabilidade do evento ocorrer exatamente X vezes, em N tentativas (isto é, de que haja X sucessos e N – X insucessos), é dada por:
 (
P
(X)
 
=
∁ 
N,X 
.p
X
 .
 
q
N-X
) (
∁
 
N,X
 
=
 
N!_
X! . (N-X)!
)
Exemplo: A probabilidade de obter exatamente 2 caras em 6 lances de moeda não viciada é:
Solução:	n = 2
P(2) =	∁ 6,2 .(1/2)2. (1/2)6-2
P(2) = 	6!	. . (1/4).(1/16)	P(2) = 15/64	P(2) = 23,44%
2! . 4!
Exercícios de sala:
1) Jogando-se um dado 3 vezes, qual a probabilidade de se obter a face 5, apenas uma vez?	34,72%
2) A probabilidade de obter ao menos 4 caras em 6 lances de uma moeda não viciada é:	34,38%
3) A probabilidade de que um presumível cliente aleatoriamente escolhido faça uma compra é de 20%. Se um vendedor visita 6 presumíveis clientes, a probabilidade de que ele fará exatamente 4 vendas será igual a:	1,54%
4) Devido as altas taxas de juros, uma firma informa que 30% de suas contas a receber encontram-se vencidas. Se um contador escolhe aleatoriamente uma amostra de 5 contas, determinar a probabilidade de cada um dos dos seguintes eventos:
	a) Nenhuma das contas está vencida.
	16,81%
	b) Exatamente 2 contas estão vencidas.
	30,8%
	c) A maioria das contas estão vencidas.
	16,31%
	d) Exatamente 20% das contas estão vencidas.
	36,01%
Exercícios do trabalho.
1) Sorteando-se uma família com 5 crianças. Determinar a probabilidade de que ela esteja composta por:
	a) Exatamente um menino.
	15,63%
	b) No máximo 1 menino.
	18,75%
	c) No mínimo 1 menino.
	96,88%
	d) Ao menos duas meninas.
	81,25%
2) Na venda de um certo produto tem-se 2 opções:
a) Cobrar R$ 1,00 por peça, sem inspeção;
b) Classificar o lote em produto de primeira e de segunda, mediante a seguinte inspeção: retiramos 5 peças do lote e se não encontrarmos mais que uma defeituosa, o lote será de primeira qualidade; sendo de segunda qualidade o lote que não satisfizer tal condição.
O preço de venda é R$ 1,20 por peça do lote de primeira e R$ 0,80 por peça do lote de segunda.
Sabendo-se que cerca de 10% das peças produzidas são defeituosas, analisar qual das duas opções é a mais vantajosa para o vendedor.
R: segunda opção é mais vantajosa para o vendedor.
3) Em uma prova de múltipla escolha, com 5 opções das quais só uma é verdadeira. Calcule a chance de um aluno acertar 3 das 25 questões, sabendo-se que o mesmo nada sabe do assunto.	13,57%
Algumas Propriedades da Distribuição Binomial
	MÉDIA
	µ = N.p
	VARIÂNCIA
	  N.p.q
	DESVIO PADRÃO
	 √N.p.q
No problema anterior,