Prévia do material em texto
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI
SILVA SANTOS
FACULDADE CATÓLICA PAULISTA
Prof. Jonas Borsetti Silva Santos
PROBABILIDADE
E ESTATÍSTICA
“A Faculdade Católica Paulista tem por missão exercer uma
ação integrada de suas atividades educacionais, visando à
geração, sistematização e disseminação do conhecimento,
para formar profissionais empreendedores que promovam
a transformação e o desenvolvimento social, econômico e
cultural da comunidade em que está inserida.
Missão da Faculdade Católica Paulista
Av. Cristo Rei, 305 - Banzato, CEP 17515-200 Marília - São Paulo.
www.uca.edu.br
Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma
sem autorização. Todos os gráficos, tabelas e elementos são creditados à autoria,
salvo quando indicada a referência, sendo de inteira responsabilidade da autoria a
emissão de conceitos.
Diretor Geral | Prof. Valdir Carrenho Junior
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 5
SUMÁRIO
CAPÍTULO 01
CAPÍTULO 02
CAPÍTULO 03
CAPÍTULO 04
CAPÍTULO 05
CAPÍTULO 06
CAPÍTULO 07
CAPÍTULO 08
CAPÍTULO 09
CAPÍTULO 10
CAPÍTULO 11
CAPÍTULO 12
CAPÍTULO 13
CAPÍTULO 14
CAPÍTULO 15
07
17
27
36
45
55
64
76
88
98
107
117
125
137
146
ESTATÍSTICA
DISTRIBUIÇÃO DE FREQUÊNCIAS
DISTRIBUIÇÃO DE FREQUÊNCIA: VARIÁVEL
CONTÍNUA
MEDIDAS DE TENDÊNCIA CENTRAL
MEDIDAS DE TENDÊNCIA CENTRAL -
VARIÁVEL CONTÍNUA
MEDIDAS SEPARATRIZES
MEDIDAS DE DISPERSÃO
GRÁFICOS ESTATÍSTICOS
PROBABILIDADE
DISTRIBUIÇÃO BINOMIAL
DISTRIBUIÇÃO NORMAL
AULA PRÁTICA - VARIÁVEL DISCRETA
AULA PRÁTICA - VARIÁVEL CONTÍNUA
VARIÁVEL DISCRETA NO EXCEL
VARIÁVEL CONTÍNUA USANDO O EXCEL
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 6
INTRODUÇÃO
Caro estudante. Seja bem vindo ao curso de Indicadores educacionais, que na
verdade é um curso de estatística, uma disciplina que permeia praticamente todos
os aspectos da nossa vida moderna. Da ciência à economia, da saúde às ciências
sociais, a estatística desempenha um papel crucial na compreensão e interpretação
dos dados que encontramos em nosso dia a dia.
Este livro é um convite para explorar os conceitos fundamentais da estatística de
forma clara e acessível. Ao longo das próximas páginas, vamos mergulhar nas técnicas
e ferramentas estatísticas que nos permitem extrair significado dos dados, identificar
padrões, tomar decisões informadas e fazer previsões sobre o futuro.
Começaremos nossa jornada aprendendo sobre os princípios básicos da estatística
descritiva, que nos ajudam a resumir e visualizar conjuntos de dados, fornecendo uma
compreensão inicial de sua estrutura e características.
À medida que avançamos, discutiremos diferentes métodos de coleta de dados,
técnicas de amostragem, distribuições de probabilidade e muito mais. Veremos
como esses conceitos podem ser aplicados em uma variedade de contextos, desde
pesquisas científicas até análises de mercado, passando por estudos epidemiológicos
e planejamento financeiro.
Prepare-se para desvendar os mistérios dos números, desafiar suas intuições e
descobrir o poder transformador da estatística. Vamos começar essa jornada juntos!
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 7
CAPÍTULO 1
ESTATÍSTICA
Caro estudante. Seja bem vindo ao curso de Indicadores Educacionais. Esse curso
é um curso em que usaremos a estatística como base. Ou seja, iremos trabalhar
com a estatística em suas mais diferentes vertentes e formas. Esperamos que seja
um curso proveitoso e que consigam compreender tudo aquilo que aqui tentaremos
transmitir. Tenham um bom curso
1.1 O que é Estatística
O termo Estatística provém da palavra Estado e foi utilizado originalmente para
denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas
decisões.
Neste sentido foi utilizado em épocas remotas para determinar o valor dos
impostos cobrados dos cidadãos, para determinar a estratégia de uma nova batalha
em guerras que se caracterizavam por uma sucessão de batalhas. (Era fundamental
aos comandantes saber de quantos homens, armas, cavalos etc. dispunham após a
última batalha.) Atualmente, a estatística é definida da seguinte forma:
Estatística é um conjunto de métodos e processos quantitativos que serve para
estudar e medir os fenômenos coletivos.
A estatística teve acelerado desenvolvimento a partir do século XVII, com os estudos
de BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON, FISHER,
POISSON e outros que estabeleceram suas características atuais.
Ela não alcançou ainda um estado definitivo. Continua a progredir na razão direta
do desejo de investigação dos fenômenos coletivos.
A Estatística é considerada por alguns autores como Ciência no sentido do estudo
de uma população. É considerada como método quando utilizada como instrumento
por outra Ciência.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 8
A Estatística mantém com a Matemática uma relação de dependência, solicitando-
lhe auxílio, sem o qual não poderia desenvolver-se.
Com as outras Ciências mantém a relação de complemento, quando utilizada como
instrumento de pesquisa.
1.2 Conceitos fundamentais
OBJETIVO: Estatística tem como objetivo o estudo dos fenômenos coletivos.
POPULAÇÃO E AMOSTRA
Conceituaremos População como sendo o conjunto de todos os itens (pessoas,
coisas, objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma
característica.
Entenderemos por Amostra, qualquer subconjunto não vazio de uma população.
Uma característica numérica estabelecida para toda uma população é denominada
parâmetro.
Uma característica numérica estabelecida para uma amostra é denominada
estimador.
Por exemplo: no fenômeno coletivo eleição para governador no Estado de São Paulo,
a população é o conjunto de todos os eleitores habilitados no Estado de São Paulo.
Um parâmetro é a proporção de votos do candidato A. Uma amostra é um grupo de
1000 eleitores selecionados em todo o Estado. Um estimador é a proporção de votos
do candidato A obtida na amostra.
Em aplicações efetivas, o número de elementos componentes de uma amostra é
bastante reduzido em relação ao número de elementos componentes da população.
Processos Estatísticos de Abordagem
Quando solicitados a estudar um fenômeno coletivo podemos optar entre os
seguintes processos estatísticos:
a) Estimação.
b) Censo.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 9
Censo: é uma avaliação direta de um parâmetro, utilizando-se todos os componentes
da população.
Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador
através do cálculo de probabilidades.
Propriedades Principais do Censo:
• Admite erro processual zero e tem confiabilidade 100%.
• É caro.
• É lento.
• É quase sempre desatualizado.
• Nem sempre é viável.
Propriedades Principais da Estimação:
• Admite erro processual positivo e tem confiabilidade menor que 100%.
• É barata.
• É rápida.
• É atualizada.
• É sempre viável.
Se admitirmos que podemos retirar do Censo todo tipo de erro de natureza humana
(erro de cálculo de avaliação, de anotação etc.), restará apenas outro tipo de erro
devido ao procedimento empregado.
Este erro é chamado erro processual. No caso de um Censo, o erro processual é
zero, pois avaliamos um por um, todos os elementos componentes da População.
Como o erro processual na avaliação é zero, a confiabilidade no parâmetro obtido
é 100%. A precisão, no Censo, é total.
Na estimação, como avaliamos apenas parte e não todos os elementos que
compõem a população, admitimos um erro processual positivo na avaliação do valor
numérico e por consequência uma confiabilidade menor que 100%, sendo, portanto,
menos precisa que o Censo.Determine a amplitude total da sequência X: 11, 12, 9, 10, 10, 15.
Solução: O maior valor desta sequência é 15 e o menor valor é 9. Portanto, a
amplitude total da sequência é At = 15 - 9 = 6 unidades.
2º Caso - VARIÁVEL DISCRETA
Como os valores já se apresentam ordenados, a amplitude total é a diferença entre
o último e o primeiro elemento da série.
Exemplo: Determine a amplitude total da série.
Solução: O maior valor da série é 7 e o menor valor da série é 2. Portanto, a amplitude
total da série é A, = 7 - 2 = 5 unidades.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 65
3º Caso - VARIÁVEL CONTÍNUA
Nesta situação, por desconhecer o maior e o menor valor da série, devemos fazer
um cálculo aproximado da amplitude total da série.
Consideraremos como maior valor da série o ponto médio da última classe e como
menor valor da série o ponto médio da primeira classe. A amplitude total é a diferença
entre estes valores.
Exemplo: Determine a amplitude total da série:
Solução: O ponto médio da última classe é 11 e o ponto médio da primeira classe
é 3. Portanto, At = 11 - 3 = 8 unidades.
COMENTÁRIO:
Apesar da facilidade de obtenção da amplitude total, esta medida apresenta a
inconveniência de depender apenas de dois valores da série. É possível modificar
completamente a dispersão ou a concentração dos elementos em torno da média,
sem alterar a amplitude total da série. É uma medida que tem pouca sensibilidade
estatística.
Desvio Médio Simples
O conceito estatístico de desvio corresponde ao conceito matemático de distância.
A dispersão dos dados em relação a média de uma sequência pode ser avaliada
através dos desvios de cada elemento da sequência em relação a média da sequência.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 66
O desvio médio simples que indicaremos por DMS é definido como sendo uma
média aritmética dos desvios de cada elemento da série para a média da série.
Cálculo do Desvio Médio Simples
1º Caso - DADOS BRUTOS OU ROL
Calculamos inicialmente a média da sequência. Em seguida identificamos a distância
de cada elemento da sequência para sua média. Finalmente, calculamos a média
destas distâncias.
Se a sequência for representada por X: x1, x2, ..., xn, então o DMS admite como
fórmula de cálculo:
Exemplo: Calcule o DMS para a sequência: X:2, 8, 5, 6.
Solução: Determinamos inicialmente a média da série:
em seguida determinamos as distâncias de cada elemento da série para a média
da série:
O DMS é a média aritmética simples destes valores.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 67
Interpretação: Em média, cada elemento da sequência está afastado do valor 5,25
por 1,75 unidades.
2º Caso - VARIÁVEL DISCRETA
No caso da apresentação de uma variável discreta, lembramos que a frequência
simples de cada elemento representa o número de vezes que este valor figura na série.
Consequentemente, haverá repetições de distâncias iguais de cada elemento distinto
da série para a média da série. Assim, a média indicada para estas distâncias é uma
média aritmética ponderada.
Exemplo: Determine o DMS para a série:
Solução: O número de elementos da série é n = fi = 10. A média da série é:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 68
O DMS é dado por:
Incluiremos outra coluna para efetuar estes cálculos:
O desvio médio simples é:
Interpretação: Em média, cada elemento da série está afastado do valor 3 por 0,8
unidade.
3º Caso - VARIÁVEL CONTÍNUA
Nesta situação, por desconhecer os valores individuais dos elementos componentes
da série, substituiremos estes valores Xi, pelos pontos médios de classe. Desta forma,
o desvio médio simples tem por cálculo a fórmula:
onde Xi é o ponto médio da classe i.
Exemplo: Determine o DMS para a série.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 69
Solução: O número de elementos da série é n = fi = 20.
Usaremos a disposição da tabela acrescentando as colunas necessárias para a
resolução dos cálculos.
Inicialmente acrescentamos a coluna dos pontos médios das classes:
Em seguida, calculamos a média da série:
A média da série é:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 70
O DMS então será:
Interpretação: Em média, cada elemento da série está afastado de 5.1 por 1,15
unidades.
COMENTÁRIO: O desvio médio simples depende de cada componente da série. Se
mudarmos o valor de um único elemento da série, mudaremos também o DMS. Portanto,
o desvio médio simples tem perfeita sensibilidade estatística. A maior dificuldade desta
medida é envolver módulos, cujas propriedades, em geral, não são suficientemente
conhecidas pelas pessoas que normalmente desenvolvem estes cálculos.
Variância e Desvio Padrão
Observamos no item anterior que a dificuldade em se operar com o DMS se deve
a presença do módulo, para que as diferenças xi - x possam ser interpretadas como
distâncias.
Outra forma de se conseguir que as diferenças xi - x se tornem sempre positivas
ou nulas é considerar o quadrado destas diferenças, isto é: (xi - x)².
Se substituirmos, nas fórmulas do DMS a expressão |xi - x| por (xi - x)², obteremos
uma nova medida de dispersão chamada variância.
Portanto, variância é uma média aritmética calculada a partir dos quadrados dos
desvios obtidos entre os elementos da série e a sua média.
O desvio padrão é a raiz quadrada positiva da variância.
Em particular, para estas medidas levaremos em consideração o fato de a sequência
de dados representar toda uma população ou apenas uma amostra de uma população.
Cálculo da Variância e Desvio Padrão
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 71
Essa é a fórmula para o cálculo da variância independentemente se forem dados
brutos, uma variável discreta ou uma variável contínua.
Vejamos como calcular então usando uma variável discreta.
Primeiramente, devemos calcular a média dessa distribuição
A média dessa distribuição será:
Desenvolvendo nova coluna para os cálculos, obtém-se:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 72
Assim, a variância será:
e o desvio padrão correspondente é
Observação. Caso estejamos lidando com uma amostra, ou seja, se o exercício
disser que nossa distribuição representa uma amostra da população, então a fórmula
da variância ficaria
Já o desvio padrão permanece inalterado.
Vejamos um exemplo de uma variável contínua. Partindo de uma tabela mais
completa, teremos:
A média dessa distribuição é
Calculando-se agora mais uma coluna, para o cálculo da variância, teremos:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 73
e o desvio padrão será
COMENTÁRIOS:
1. No cálculo da variância, quando elevamos ao quadrado a diferença (xi - x), a
unidade de medida da série fica também elevada ao quadrado. Portanto, a
variância é dada sempre no quadrado da unidade de medida da série. Se os
dados são expressos em metros, a variância é expressa em metros quadrados.
Em algumas situações, a unidade de medida da variância nem faz sentido. É
o caso, por exemplo, em que os dados são expressos em litros. A variância
será expressa em litros quadrados. Portanto, o valor da variância não pode
ser comparado diretamente com os dados da série, ou seja: variância não tem
interpretação.
2. Exatamente para suprir esta deficiência da variância é que se define o desvio
padrão. Como o desvio padrão é a raiz quadrada da variância, o desvio padrão terá
sempre a mesma unidade de medida da série e portanto admite interpretação.
Interpretação do Desvio Padrão
O desvio padrão é, sem dúvida, a mais importante das medidasde dispersão.
É fundamental que o estudante consiga relacionar o valor obtido do desvio padrão
com os dados da série.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 74
Quando uma curva de frequência representativa da série é perfeitamente
simétrica como a curva abaixo, podemos afirmar que o intervalo [x - σ, x + σ] contém
aproximadamente 68% dos valores da série.
O intervalo [x - 2 σ, x + 2 σ] contém aproximadamente 95% dos valores da série.
O intervalo [x - 3 σ, x + 3 σ] contém aproximadamente 99% dos valores da série.
Estes percentuais 68%, 95% e 99% que citamos na interpretação poderão mais
tarde ser comprovados, com maior precisão, no estudo da distribuição normal de
probabilidades.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 75
Para uma compreensão inicial do desvio padrão, estas noções são suficientes.
Quando a distribuição não é perfeitamente simétrica estes percentuais apresentam
pequenas variações para mais ou para menos, segundo o caso.
De modo que, quando se afirma que uma série apresenta média x = 100 e desvio
padrão σ(x) = 5, podemos interpretar estes valores da seguinte forma:
1. Os valores da série estão concentrados em torno de 100.
2. O intervalo [95, 105] contém aproximadamente, 68% dos valores da série. O
intervalo [90, 110] contém aproximadamente 95% dos valores da série. O intervalo
[85, 115] contém aproximadamente 99% dos valores da série.
É importante que se tenha percebido que, ao aumentar o tamanho do intervalo,
aumenta-se o percentual de elementos contido no intervalo.
3. As medidas de dispersão vistas até agora são medidas absolutas e portanto
avaliam a dispersão absoluta da série. Todas elas são diretamente proporcionais
à dispersão absoluta.
Assim, se a série X apresenta x = 20 e σ(x) = 3 e se a série Y apresenta y= 22 e
σ(y) = 2, podemos afirmar, comparando os desvios padrão, que a série X apresenta
maior dispersão absoluta.
7.2 Conclusão
Neste capítulo, estudamos medidas de dispersão, importantes medidas que nos
falam sobre a dispersão, ou seja, o afastamento dos dados com relação à média
calculada. Estas medidas devem ser apresentadas juntamente da média, para que a
interpretação seja feita de forma mais correta.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 76
CAPÍTULO 8
GRÁFICOS ESTATÍSTICOS
Caro estudante. Vamos a mais um capítulo do nosso curso de Indicadores
educacionais. Neste capítulo, iremos tratar dos gráficos estatísticos, como são feitos
e as particularidades de cada um deles. Como sempre, havendo dúvidas, recorra a
esse material
8.1 Gráficos
Os gráficos são representações que facilitam a análise de dados, os quais costumam
ser dispostos em tabelas quando se realiza pesquisas estatísticas. Eles trazem muito
mais praticidade, principalmente quando os dados não são discretos, ou seja, quando
são números consideravelmente grandes. Além disso, os gráficos também apresentam
de maneira evidente os dados em seu aspecto temporal.
Elementos do gráfico
Ao construirmos um gráfico em estatística, devemos levar em consideração alguns
elementos que são essenciais para sua melhor compreensão. Um gráfico deve ser
simples devido à necessidade de passar uma informação de maneira mais rápida e
coesa, ou seja, em um gráfico estatístico, não deve haver muitas informações, devemos
colocar nele somente o necessário.
As informações em um gráfico devem estar dispostas de maneira clara e verídica
para que os resultados finais sejam dados de modo coeso com a finalidade da pesquisa.”
8.2 Tipos de Gráficos
Em estatística é muito comum a utilização de diagramas para representar dados,
diagramas são gráficos construídos em duas dimensões, isto é, no plano. Existem
vários modos de representá-los, as principais são: gráfico de pontos, gráfico de linha,
gráfico de barra, gráfico de coluna e gráfico de setor.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 77
8.2.1 Gráfico de pontos
Também conhecido como Dotplot, é utilizado quando possuímos uma tabela de
distribuição de frequência, sendo ela absoluta ou relativa. O gráfico de pontos tem
por objetivo apresentar os dados das tabelas de forma resumida e que possibilite a
análise das distribuições desses dados.
Exemplo
Suponha uma pesquisa, realizada em uma escola de educação infantil, na qual
foram coletadas as idades das crianças. Nessa coleta foi organizado o seguinte rol:
Rol: {1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 6}
Podemos organizar esses dados utilizando um Dotplot
8.2.2 Gráfico de linhas
É utilizado em casos que existe a necessidade de analisar dados ao longo do tempo,
esse tipo de gráfico é muito presente em análises financeiras. O eixo das abscissas
(eixo x) representa o tempo, que pode ser dado em anos, meses, dias, horas etc.,
enquanto o eixo das ordenadas (eixo y) representa o outro dado em questão.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 78
Uma das vantagens desse tipo de gráfico é a possibilidade de realizar a análise de
mais de uma tabela, por exemplo.
Exemplo
Uma empresa deseja verificar seu faturamento em determinado ano, os dados
foram dispostos em uma tabela:
Mês Faturamento Mês Faturamento
Janeiro R$ 10.000,00 Julho R$ 8.000,00
Fevereiro R$ 15.000,00 Agosto R$ 16.000,00
Março R$ 8.000,00 Setembro R$ 10.000,00
Abril R$ 15.000,00 Outubro R$ 11.000,00
Maio R$ 20.000,00 Novembro R$ 11.000,00
Junho R$ 24.000,00 Dezembro R$ 20.000,00
Veja que nesse tipo de gráfico é possível ter uma melhor noção a respeito do
crescimento ou do decrescimento dos rendimentos da empresa.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 79
8.2.3 Gráfico de barras
Tem como objetivo comparar os dados de determinada amostra utilizando retângulos
de mesma largura e altura. Altura essa que deve ser proporcional ao dado envolvido,
isto é, quanto maior a frequência do dado, maior deve ser a altura do retângulo.
Exemplo
Imagine que determinada pesquisa tem por objetivo analisar o percentual de
determinada população que acesse ou tenha: internet, energia elétrica, rede celular,
aparelho celular ou tablet. Os resultados dessa pesquisa podem ser dispostos em
um gráfico como este:
Os gráficos de barras, normalmente, são colocados em barras horizontais, como o
exemplo abaixo, mas podem ser barras verticais, porém esses são mais conhecidos
como gráfico de colunas, como veremos mais adiante:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 80
8.2.4 Gráfico de colunas
Seu estilo é semelhante ao do gráfico de barras, sendo utilizado para a mesma
finalidade. O gráfico de colunas então é usado quando as legendas forem curtas, a
fim de não deixar muitos espaços em branco no gráfico de barra.
Exemplo
Este gráfico está, de forma genérica, quantificando e comparando determinada
grandeza ao longo de alguns anos.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 81
8.2.5 Gráfico de setor
É utilizado para representar dados estatísticos com um círculo dividido em setores,
as áreas dos setores são proporcionais às frequências dos dados, ou seja, quanto
maior a frequência, maior a área do setor circular.
Exemplo
Este exemplo, de forma genérica, está apresentando diferentes variáveis com
frequências diversas para determinada grandeza, a qual pode ser, por exemplo, a
porcentagem de votação em candidatos em uma eleição.
No gráfico de setores, podem aparecer as porcentagens ou a quantidade de cada
uma de suas fatias.
8.2.6 Histograma
Um histograma é uma espécie de gráfico de barras que demonstra uma distribuição
de frequências. No histograma, a base de cada uma das barras representa uma classe
e a altura representa a quantidadeou frequência absoluta com que o valor de cada
classe ocorre. Ao mesmo tempo, ele pode ser utilizado como um indicador de dispersão
de processos.
Quando você precisa apresentar ou tirar conclusões de um grande conjunto de
dados e está trabalhando com conceitos envolvendo frequências, sejam absolutas
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 82
ou relativas, o histograma é o melhor caminho a se tomar. Ele nos auxilia com a
representação gráfica dos conjuntos de dados de forma mais amigável, tornando
mais fácil a visualização de onde a maioria dos valores se concentram.
É útil construir um histograma quando você deseja:
• Resumir grandes conjuntos de dados de forma visual: Muitas vezes quando
utilizamos tabelas não é tão fácil tirar conclusões. Nós podemos facilitar nosso
trabalho e ganhar muito mais tempo e eficiência utilizando um histograma.
• Comparar os resultados: É possível, com o auxílio do histograma, rapidamente
comparar os resultados e, com o auxílio do eixo y, conhecer, se houver, quais
colunas ultrapassaram os limites que você precisava ou não.
• Comunicar as informações graficamente: Tanto as pessoas da sua equipe, quanto
os clientes, podem ver facilmente os valores que ocorrem com mais frequência.
Quando você usa um histograma para resumir grandes conjuntos de dados ou
para comparar resultados você está utilizando uma poderosa ferramenta de
comunicação.
Assim que coletamos os dados, o primeiro passo que vamos dar é obter o melhor
entendimento deles, já que nosso cérebro pode ter dificuldade para compreender um
extenso conjunto de dados de forma automática. Dessa forma, nossa missão é deixar
a visualização dos dados mais inteligível e explícita.
É aqui que entra o histograma, pois permitirá a obtenção das seguintes informações
sobre o nosso processo:
• Centralidade: qual é o centro da distribuição? Onde é esperado que esteja a
maioria das observações?
• Amplitude: a distribuição normalmente contém observações entre quais valores?
Qual é o ponto de máximo e o ponto de mínimo?
• Simetria: será que devemos esperar a mesma frequência de pontos com valor
alto e com valor baixo? Será que o processo é simétrico ou valores mais altos
são mais raros?
Os histogramas às vezes são confundidos com gráficos de barras. Um histograma
é usado para dados contínuos, em que os intervalos de classe representam a extensão
dos dados. Já um gráfico de barra é um gráfico de variáveis categóricas ou discretas.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 83
Alguns autores recomendam que os gráficos de barras tenham espaços entre os
retângulos para esclarecer a diferença.
O objetivo de um histograma é ilustrar como uma determinada amostra de dados ou
população está distribuída, dispondo as informações de modo a facilitar a visualização
da distribuição dos dados. Ao mesmo tempo, ressalta a localização do valor central
e da distribuição dos dados em torno deste valor central.
TIPOS DE HISTOGRAMA
Simétrico
Um histograma simétrico (ou unimodal) centraliza os dados na média (medida
central) e possui características por meio da distribuição da média e do desvio padrão.
Uma característica do histograma simétrico é conter a partir do centro do gráfico o
maior número de dados. Em estatística, este modelo é chamado de normal e permite
analisar o quanto outros dados se afastam desse modelo.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 84
Distorcido à direita
Um histograma é distorcido à direita quando a distribuição de dados indica a
ocorrência de altos valores com baixa frequência. Este modelo também é comumente
chamado de modelo com “cauda à direita”, pois ele vai “afinando” conforme percorremos
o eixo x, indicando que a frequência vai diminuindo.
Portanto, se você se deparar com um gráfico desse tipo, rapidamente vai ser capaz
de identificar o comportamento dos dados.
Distorcido à esquerda
Dessa vez vamos chamar o histograma de distorcido à esquerda quando a frequência
dos dados está concentrada nos altos valores, do lado esquerdo, conforme percorremos
o eixo x. Podemos, então, também chamá-lo de histograma com “cauda à esquerda”,
pelo mesmo motivo anterior, já que à esquerda formamos uma espécie de cauda
devido à baixa frequência dos dados no início. Observa-se que há mais informações
acima da média devido a falta de simetria.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 85
Bimodal
Vamos chamar o histograma de bimodal quando há o aparecimento de dois picos.
Dessa forma sabemos que em dois momentos diferentes há uma concentração de
frequência que se destaca.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 86
Multimodal
Um histograma é multimodal quando há o aparecimento de vários picos. Os picos
vão nos indicar o maior número de ocorrências.
Platô (Achatado)
Muito tem se falado atualmente do “efeito platô”. Essa palavra, “platô”, nos remete
a um certo tipo de achatamento, de igualdade constante dos dados. Um histograma
tem o formato Platô quando suas barras têm praticamente as mesmas alturas. Isto
ocorre quando existem várias distribuições juntas com médias diferentes.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 87
8.3 Conclusão
Neste capítulo, estudamos os gráficos e seus diferentes tipos. Mais à frente, veremos
como podemos construir esses gráficos usando uma planilha eletrônica, como o
Excel ou o app Planilhas, do Google. Quanto mais conhecimento tivermos da análise
de dados, principalmente com o auxílio de gráficos, nosso trabalho será muito mais
simples e mais visual, ou seja, poderemos explicar de maneira mais prática nossas
decisões.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 88
CAPÍTULO 9
PROBABILIDADE
Caro estudante. Vamos a mais um capítulo do nosso curso de Indicadores
educacionais. Neste capítulo, trataremos do estudo da probabilidade. Veremos como
podemos calcular uma probabilidade e como podemos usá-la no nosso cotidiano.
9.1 Probabilidade
Quando solicitados a estudar um fenômeno coletivo, verificamos a necessidade de
descrever tal fenômeno por um modelo matemático que permita explicar da melhor
forma possível este fenômeno.
A teoria das probabilidades permite construir modelos matemáticos
que explicam um grande número de fenômenos coletivos e fornecem estratégias
para a tomada de decisões.
Iniciaremos o estudo da teoria das probabilidades enfocando o objeto
de estudo do cálculo de probabilidades.
FENÔMENOS ALEATÓRIOS
Entendemos por fenômeno qualquer acontecimento natural.
Se observarmos os fenômenos com respeito a seus possíveis resultados, podemos
classificá-los em dois tipos:
a) determinísticos;
b) aleatórios.
a) Fenômenos determinísticos - são aqueles que repetidos sob mesmas condições
iniciais conduzem sempre a um só resultado. As condições iniciais determinam
o único resultado possível do fenômeno.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 89
b) Fenômenos aleatórios - são aqueles que repetidos sob mesmas condições iniciais
podem conduzir a mais que um resultado. As condições iniciais não determinam
o resultado do fenômeno.
Embora teoricamente tenhamos exigido as repetições, nas mesmas condições
iniciais, isto na prática dificilmente ocorre. Mesmo quando procuramos manter as
mesmas condições iniciais, pequenas variações certamente ocorrerão. Isto provocará
alterações no resultado final.
• Se estas alterações forem mínimas, para a maioria das aplicações práticas elas
poderão ser desprezadas. Poderemos afirmar que o resultado final é único, e
classificar o fenômeno como determinístico.
• Se estas alterações forem significativas, então o fenômeno será classificadode aleatório.
Exemplos:
a. Se deixarmos uma massa M cair em queda livre de uma altura de 1 metro sobre
uma superfície, poderemos anotar o tempo t, de queda livre.
Ao tentarmos repetir o fenômeno, dificilmente conseguiremos as mesmas condições
iniciais. Certamente repetiremos o fenômeno em condições muito próximas das iniciais.
Estas pequenas alterações nas condições iniciais provocarão pequenas alterações
no tempo de queda. Para a maioria das aplicações, estas pequenas alterações no
tempo de queda podem ser desprezadas e afirmamos que o resultado é único. O
fenômeno é classificado como determinístico.
b. Se lançarmos um dado sobre uma superfície, podemos anotar o número de
pontos da face superior do dado.
Da mesma forma que no exemplo anterior, dificilmente conseguiremos repetir o
lançamento nas mesmas condições anteriores.
Estas pequenas variações que certamente ocorrerão na repetição do lançamento
podem provocar substanciais mudanças no número de pontos apresentados na face
superior do dado.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 90
Estas mudanças não podem em geral ser desprezadas e consequentemente o
fenômeno admitirá, por repetição, mais que um resultado. Desta forma, este fenômeno
é classificado como aleatório.
Quando um fenômeno é determinístico, a teoria das probabilidades não fornece
um modelo adequado para a explicação do fenômeno.
A teoria das probabilidades só é útil e deve ser aplicada quando lidarmos com um
fenômeno aleatório.
Portanto, o objeto de estudo da teoria das probabilidades são os fenômenos
aleatórios.
Para facilitar o desenvolvimento da teoria sem usar recursos matemáticos mais
sofisticados, vamos restringir nosso estudo a uma classe de fenômenos aleatórios
chamados experimentos.
Os experimentos são fenômenos aleatórios que possuem as seguintes
características:
a) repetitividade;
b) regularidade.
a) Repetitividade: é a característica de um fenômeno de poder ser repetido quantas
vezes quisermos. Se por algum motivo não pudermos repetir sistematicamente
o fenômeno, ele não será classificado como experimento.
b) Regularidade: é a característica que diz respeito à possibilidade da ocorrência dos
resultados do fenômeno. A avaliação numérica da possibilidade de ocorrência
destes resultados dará origem às probabilidades.
ESPAÇO AMOSTRAL
Como o objeto de nosso estudo são os experimentos e eles admitem mais do
que um resultado, faz sentido definir o conjunto de todos os possíveis resultados do
experimento.
Este conjunto será denotado por S e denominado espaço amostral do experimento.
Exemplos: O experimento consiste em:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 91
1. Lançar uma moeda e anotar a face superior.
Se representamos cara com a letra c e coroa com a letra k, então o espaço amostral
do experimento é S = {c, k}
Para evitar complicações, recomendamos que o interessado sempre raciocine em
termos de materiais ideais.
A moeda que utilizamos no caso anterior deve ser imaginada como duas calotas
coladas adequadamente com as faces cara e coroa convencionadas por duas cores
distintas. O material, é claro, deve ser homogêneo. O que queremos dizer é que a
moeda não pode ser uma moeda “viciada”.
O dado idealizado, com o qual trabalharemos no próximo exemplo, deve ser um
cubo perfeito com o número de pontos convencionado por cores.
2. Lançar um dado e anotar o número de pontos da face superior. O espaço amostral
é: S = (1, 2, 3, 4, 5, 6).
3. Retirar uma carta de um baralho comum de 52 cartas e anotar o naipe da carta
selecionada. O espaço amostral é: S = {paus, copas, ouros, espadas}
4. Lançar duas moedas e observar as faces superiores. 1 O espaço amostral é: S
= {cc, ck, kc, kk}.
5. Lançar uma moeda sucessivamente, até que se obtenha a primeira face cara.
Anota-se como resultado do experimento a sequência de caras e coroas do primeiro
ao último lançamento. O espaço amostral é: S = {c, kc, kkc, kkkc, ...}.
Os espaços amostrais podem ser finitos ou infinitos. Os exemplos 1, 2, 3 e 4
apresentam espaços amostrais finitos. O exemplo 5 apresenta espaço amostral infinito.
Para evitar recursos matemáticos mais sofisticados, vamos estudar apenas os
espaços amostrais finitos.
Uma excelente técnica para não omitirmos resultados do experimento na construção
de seu espaço amostral está baseada no princípio fundamental da contagem, que
estabelece: Se um procedimento A pode ser realizado de n maneiras diferentes e um
procedimento B pode ser realizado de rn maneiras diferentes, então o encadeamento
dos procedimentos A e B pode ser feito de n.m maneiras diferentes.
Isto sugere uma disposição gráfica chamada diagrama de árvore.
O espaço amostral do exemplo 4, lançamento de duas moedas e observação das
faces superiores, pode ser obtido utilizando-se esta técnica.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 92
Para efeito da observação das faces superiores, lançar simultaneamente duas
moedas é o mesmo que lançar uma moeda duas vezes.
No primeiro lançamento há duas ocorrências possíveis. No segundo lançamento há
também duas ocorrências possíveis. A sequência dos dois lançamentos terá 2.2 = 4
ocorrências possíveis, que podem ser representadas na forma do diagrama de árvore:
0s possíveis resultados estão estabelecidos em cada ramo da árvore:
S = {cc, ck, kc, kk}.
EVENTO
Evento é qualquer subconjunto do espaço amostral do experimento.
Exemplo: Se considerarmos o lançamento de um dado e a observação da face
superior, então o espaço amostral do experimento é: S = (1, 2, 3, 4, 5, 5).
Note que A = {I, 2); B = (2, 4, 6); C = { }; S são subconjuntos de S e portanto são
eventos.
Os eventos podem ser enunciados na linguagem usual. Assim, enunciaremos A
como: sair face 1 ou face 2 no lançamento de um dado.
Há, normalmente, várias maneiras equivalentes de se enunciar um mesmo evento.
O evento A também poderia ser enunciado como: sair face menor que 3 no lançamento
de um dado.
O evento B é enunciado como: sair face 2 ou face 4 ou face 6 no lançamento de
um dado. Isto é equivalente a afirmar: sair face par no lançamento de um dado.
Para enunciar o evento C, basta usar qualquer propriedade que não caracterize
nenhum dos valores de S.
Deste modo, C pode ser enunciado como: sair face 8 no lançamento de um dado.
Note que cada elemento que constitui o evento é um possível resultado do experimento.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 93
Assim sendo, quando realizamos o experimento uma só vez, apenas um dos
elementos do espaço amostral irá ocorrer não ocorrendo os demais.
Diremos então que um evento A ocorre quando ocorrer, como resultado do
experimento, um dos elementos de A.
De modo resumido, podemos afirmar que um evento A ocorre quando ocorrer um
de seus pontos.
No exemplo inicial, se lançarmos o dado e sair face 4, diremos que: não ocorreu o
evento A; ocorreu o evento B; não ocorreu o evento C; ocorreu o evento S.
O conjunto vazio é subconjunto de qualquer conjunto. Portanto, em qualquer espaço
amostral C = { } é sempre um evento.
Observe que o evento C = { ) não possui elementos, portanto este evento nunca
ocorrerá.
Neste sentido, C é denominado evento impossível.
Note também que todo conjunto é subconjunto de si próprio. Desta forma, o próprio
espaço amostral S é sempre um evento.
Como S contém todos os possíveis resultados do experimento, S certamente
ocorrerá. Neste sentido, S é denominado evento certo.
9.2 Cálculo de Probabilidade
A forma mais simples de se calcular uma probabilidade é o uso da probabilidade
clássica, que veremos a seguir.
PROBABILIDADE CLÁSSICA
Aplica-se às situações em que os resultados que compõem o espaço amostral
ocorrem com mesma regularidade, ou seja, os resultados são equiprováveis. Deste
modo definimos:
Tambémpodemos definir como sendo:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 94
Existem outras formas de calcular uma probabilidade, que veremos em outros
capítulos.
Vejamos alguns exemplos:
O experimento consiste no lançamento de uma moeda e na observação da face
superior. Determine o espaço amostral do experimento e a probabilidade de cada um
desses elementos.
Solução: O espaço amostral é S = {c, k}. Os elementos c e k que compõem o espaço
amostral são equiprováveis. Usando o conceito clássico de probabilidades, avaliamos:
2. O experimento consiste no lançamento de um dado e na observação da face
superior. Determine o espaço amostral do experimento e a probabilidade de cada
elemento.
Solução: O espaço amostral é S = {I, 2, 3, 4, 5, 6). Os elementos que compõem o
espaço amostral são equiprováveis.
3. O experimento consiste no lançamento de duas moedas e na observação do
número de caras obtidas neste lançamento. Determine o espaço amostral e a função
de probabilidade.
Solução: O espaço amostral do experimento é S = {0, 1,2}. O resultado 0 (zero)
caras só ocorre quando ocorrer (k, k) no lançamento das moedas. O resultado 2 só
ocorre quando ocorrer (c, c) no lançamento das moedas. O resultado 1 ocorre quando
ocorrer (c, k) ou (k, c) no lançamento das moedas. Portanto, o resultado 1 tem o dobro
de possibilidade de ocorrer que o resultado 2 ou o resultado zero.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 95
4. O experimento consiste no lançamento de dois dados e na observação da soma
dos pontos das faces superiores. Determine o espaço amostral do experimento e a
função de probabilidade.
Solução: O espaço amostral do experimento é S = (2, 3, 4, 5, 6, 7, 8, 9, 10,11,12}.
Estes resultados não são equiprováveis, pois há várias combinações que conduzem
a soma 6, enquanto apenas uma combinação conduz a soma 2.
O experimento anterior pode ser colocado em uma tabela, que nos auxilia na
visualização dos resultados
SOMA 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 96
Perceba que, além de obtermos todos os resultados possíveis, que no caso seriam
36, obtemos também as diferentes somas que podem ser obtidas nesse evento.
Esse tipo de tabela é muito útil quando temos repetição de eventos, como por
exemplo o lançamento de 2 dados.
PROBABILIDADE CONJUNTA E TOTAL
Um mesmo espaço amostral pode ser analisado de diversas formas. Por exemplo,
das respostas de 1.000 funcionários a uma pesquisa interna da empresa de serviços,
na tabela seguinte foram registrados os resultados do hábito de fumar dos funcionários
classificados por sexo, mulher e homem.
Para analisar as informações dessa tabela é melhor construir a tabela a seguir
com os mesmos resultados, porém considerando a população de 1.000 funcionários,
registrando os valores unitários ou como porcentagens. À primeira tabela, foram
adicionados outros resultados obtidos dos anteriores e registrados nas novas coluna
e linha adicionadas.
A tabela construída é denominada tabela de probabilidades conjuntas e marginais e
é uma forma prática de calcular a probabilidade condicional de dois eventos. Entretanto,
analisemos primeiro os resultados:
• O primeiro resultado 0,068 indica que 6,8% das mulheres fumam. Esse resultado
representa a probabilidade conjunta: Fuma e é Mulher.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 97
• Da mesma forma, 38,8% dos homens não fumam. Esse resultado representa a
probabilidade conjunta: não Fuma e é Homem.
• O total 0,15 da coluna Total é o resultado da soma das probabilidades conjuntas
0,068 mais 0,082. O resultado 0,15 ou 15% é a probabilidade total, ou marginal,
de Fuma ou, de outra maneira, 15% dos que responderam tem o hábito de fumar.
• Da mesma forma, o total 0,53 da linha Total é o resultado da soma das
probabilidades conjuntas 0,068 mais 0,462. O resultado 0,53 ou 53% é a
probabilidade total de Mulher ou, de outra maneira, 53% dos que responderam
são mulheres.
• Como controle, a soma das quatro probabilidades conjuntas deve ser sempre
igual a 1 ou 100% e, da mesma maneira, a soma das probabilidades da linha
Total e da coluna Total deve ser sempre igual a 1 ou 100%.
Com os resultados dessa tabela é possível obter probabilidades condicionais, por
exemplo, a probabilidade de que o respondente da pesquisa seja mulher sabendo que
não fuma. Essa pergunta pode ser representada da seguinte forma P(Mulher/Não fuma).
Como o evento conhecido é Não fuma, primeiro, na tabela selecionamos a linha Não
fuma, que representa o espaço amostral reduzido, depois de ter tomado conhecimento
do evento Não fuma. Depois, calculamos a probabilidade P(Mulher/Não fuma)=0,5435
ou 54,35%, dividindo a probabilidade conjunta 0,462 pela probabilidade total 0,85.
9.3 Conclusão
Neste capítulo começamos a estudar o cálculo de probabilidades. Existem outros
métodos de cálculo de probabilidade, que veremos em capítulos posteriores. Esperamos
que tenham compreendido e que possam usar esses conhecimentos para as tomadas
de decisões.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 98
CAPÍTULO 10
DISTRIBUIÇÃO BINOMIAL
Caro estudante. Vamos ao nosso próximo capítulo no curso de indicadores
educacionais. Neste capítulo, trataremos de uma distribuição de probabilidade, chamada
de distribuição binomial.
10.1 Distribuição Binomial
A distribuição binomial é uma distribuição de probabilidade que é calculada quando
aparecem apenas dois resultados possíveis em um evento: um resultado que seria o
sucesso e o resultado que seria o fracasso (ou falha).
Para que ocorra, então, devemos ter uma variável aleatória e apenas dois resultados
possíveis. Vejamos alguns exemplos:
• O técnico do controle de qualidade sempre retira uma amostra de dez peças
de cada lote recebido do fornecedor. O número de peças que não atendem à
especificação é uma variável aleatória X.
• O número de respostas sim a uma pergunta da pesquisa aplicada em 1.800
pessoas é uma variável aleatória X.
• O número de ações que ontem subiram comparadas com as 50 ações mais
negociadas é uma variável aleatória X.
Nos três exemplos, o número de vezes em que um resultado ocorre durante um
determinado número de repetições do experimento é a variável aleatória X.
Premissas de um experimento binomial
• O experimento é repetido n vezes, e os n resultados do experimento são
independentes.
• O experimento tem apenas dois possíveis resultados ou eventos mutuamente
excludentes: sucesso ou falha.
• A probabilidade de sucesso do experimento é p e se mantém constante durante
as n repetições do experimento. A probabilidade de falha do experimento é (1 - p).
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 99
Vejamos um exemplo
O gerente da loja estima que de dez vendas realizadas, três são microcomputadores
e sete equipamentos eletrônicos. Qual a probabilidade de que uma das quatro próximas
vendas seja um microcomputador?
Solução.
Começamos por determinar as quatro próximas vendas e depois suas probabilidades
de ocorrência.
• Sendo E a venda de um equipamento eletrônico e M a de um microcomputador,
os quatro possíveis resultados (eventos elementares) são: EEEM, EEME, EMEE
e MEEE.
• Dos dados do gerente, deduzimos que 70% das vendas realizadas são de
equipamentos eletrônicos E e 30% de microcomputadores M. Se a sequência
de venda de um M for EEEM, sua probabilidade será igual a:
P (EEEM) = 0,70 x 0,70 x 0,70 x 0,30
P (EEEM) = 0,70³ x 0,30 = 0,1029
O resultado P(EEEM) = 10,29% foi obtido multiplicando-se todas as probabilidades,
pois os eventos são independentes. Repetindo o mesmo procedimentopara a sequência
de venda EEME, sua probabilidade será igual a:
P (EEME) = 0,70 x 0,70 x 0,30 x 0,70
P (EEME) = 0,70² x 0,30 x 0,70 = 0,1029
As probabilidades das duas sequências restantes têm o mesmo valor obtido das
seguintes fórmulas:
P (EMEE) = 0,70 x 0,30 x 0,70 x 0,70
P (EMEE) = 0,70 x 0,30 x 0,70² = 0,1029
P (MEEE) = 0,30 x 0,70 x 0,70 x 0,70
P (MEEE) = 0,30 x 0,70³ = 0,1029
Considerando que os quatro eventos são mutuamente excludentes, a probabilidade
de que uma das quatro próximas vendas seja um microcomputador é igual a 41,16%,
resultado obtido da regra da soma com a seguinte fórmula:
P (final) = P (EEEM) + P (EEME) + P (EMEE) + P (MEEE)
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 100
P (final) = 0,1029 + 0,1029 + 0,1029 + 0,1029
P (final) = 0,4116
10.1.1 Fórmula da Distribuição Binomial
Perceberam que fazer esse tipo de probabilidade, dependendo da quantidade de
repetições, começa a ficar cada vez maior?
Por esse motivo, usaremos uma fórmula que nos auxiliará a calcular essa
probabilidade.
De forma geral, a probabilidade P(x) de conseguir em n experiências k sucessos
com probabilidade p é medida pela fórmula:
Onde q = 1 - p
Mas o que seria esse ?
Isso é o que chamamos de binômio de Newton. Daí vem o nome de distribuição
binomial. O binômio de Newton é calculado da seguinte forma:
=
Já esse ponto de exclamação, em um número, refere-se ao cálculo de um fatorial.
Um fatorial é uma multiplicação sucessiva onde os números vão diminuindo.
Por exemplo, 5! = 5 x 4 x 3 x 2 x 1 = 120;
7! = 7 x 6 x 5 x 4 x 3 x 2 x 1 = 5 040
Sabendo, então, o que é o fatorial e a fórmula do número binomial, podemos calcular
alguns casos, para podermos nos aprofundar na distribuição binomial.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 101
Vejamos, agora, alguns exemplos da distribuição binomial:
Uma moeda é lançada dez vezes seguidas. Calcule a probabilidade de conseguir
três caras.
Solução.
A probabilidade de conseguir três caras é 0,3125 ou 31,25%, resultado obtido com
a fórmula:
Podemos usar o Excel, que veremos mais a fundo em próximos capítulos, para
calcular essas probabilidades.
Por exemplo, no caso anterior, esse resultado pode ser obtido com a função estatística
DISTRBINOM do Excel registrando a fórmula =DISTRBINOM(3;5;0,5;FALSO) em uma
célula vazia de qualquer planilha.
DISTRBINOM(núm_s; tentativas; probabilidade_s; cumulativo)
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 102
A função estatística DISTRBINOM retorna a probabilidade ou a probabilidade
acumulada do número de tentativas bem-sucedidas núm_s, conforme o valor do
argumento cumulativo.
• Se o argumento cumulativo for FALSO, a função retornará a probabilidade do
número de sucessos núm_s com probabilidade_s de sucesso para um número
de tentativas independentes. Neste exemplo, a função retorna a probabilidade
0,3125 de conseguir três sucessos com probabilidade 0,5 em um experimento
com cinco tentativas.
• Se o argumento cumulativo for VERDADEIRO, a função retornará a probabilidade
acumulada do número máximo de sucessos núm_s com probabilidade_s de
sucesso para um número de tentativas independentes.
Vejamos um exemplo usando o Excel.
Uma experiência com distribuição binomial foi repetida quatro vezes seguidas.
Considerando a probabilidade de sucesso p=0,50:
a) Calcule as probabilidades de todos os possíveis sucessos x.
b) Construa o gráfico da distribuição de probabilidades.
Numa planilha, foi construída a tabela de probabilidades com a fórmula
e ao lado foi construído o histograma.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 103
O primeiro resultado da tabela, probabilidade de x=0, pode ser obtido com a função
estatística DISTRBINOM do Excel, registrando em uma célula vazia de qualquer planilha a
fórmula =DISTRBINOM(0;4;0,5;FALSO), resultando no valor 0,0625. O segundo resultado,
probabilidade de x=1, pode ser obtido com a fórmula =DISTRBINOM(1;4;0,5;FALSO),
resultando no valor 0,25. Da mesma forma, os demais resultados da tabela.
Usando esse mesmo caso, vejamos as seguintes situações:
• A probabilidade que x seja menor do que 2.
• A probabilidade que x seja menor ou igual a 2.
Solução. Na planilha foi construída a tabela utilizando a função DISTRBINOM. Na
célula C6, foi registrada a fórmula =DISTRBINOM(B6;$C$4;$C$3;VERDADEIRO) com
o argumento cumulativo igual a VERDADEIRO. Depois essa fórmula foi copiada até a
célula C10. A figura seguinte mostra também o gráfico de probabilidades acumuladas.
Vejamos as respostas.
• A probabilidade que x seja menor do que 2 é a probabilidade acumulada até
x=1, pois não deve ser incluída a probabilidade quando x=2. Esse resultado
P(xum
dado. Para obter P(x>3), aplicamos a regra do complemento P(x>3)=1-P(x≤3)=0,4335.
Exemplo 4
Uma urna contém 10 bolas, sendo 2 verdes e 8 brancas. Realizando 15 retiradas
com reposição, calcule:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 106
• A probabilidade de retirar cinco bolas verdes.
• A probabilidade de conseguir até cinco bolas verdes.
• A média e a variância desse experimento.
Solução.
A probabilidade de sucesso de retirar uma bola branca é 0,20. Utilizando a função
DISTRBINOM:
Registrando a fórmula =DISTRBINOM(5;15;0,2;FALSO), temos a probabilidade
P(x=5)=0,1032 de conseguir cinco bolas verdes em um experimento de 15 retiradas
com reposição.
Registrando a fórmula =DISTRBINOM(5;15;0,2;VERDADEIRO), temos a probabilidade
P(x≤5)=0,9389 de conseguir até cinco bolas verdes em um experimento de 15 retiradas
com reposição.
A média é igual a 3, e a variância, igual a 2,4.
10.2 Conclusão
Neste capítulo, vimos a distribuição binomial e como podemos usar o Excel para
fazer alguns desses cálculos de probabilidade. O Excel é uma poderosa ferramenta,
que usaremos em aulas futuras para podermos fazer os cálculos de estatística e
probabilidade de um jeito mais rápido e prático.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 107
CAPÍTULO 11
DISTRIBUIÇÃO NORMAL
Caro estudante. Neste capítulo, trataremos da distribuição normal. Essa é uma das
distribuições mais usadas para o cálculo de probabilidade. Veremos também como
podemos usar o Excel para esses cálculos.
11.1 A distribuição normal
A distribuição normal é uma das distribuições fundamentais da moderna teoria
estatística. A vantagem da distribuição normal reside na facilidade de defini-la com
apenas dois parâmetros, a média μ e o desvio padrão σ da distribuição, por exemplo,
a curva da distribuição normal f(x) para μ=40, σ=10 e valores da variável aleatória no
intervalo (10, 70) é mostrada na figura abaixo. Uma das características importantes é
que a partir desses dois parâmetros será possível calcular, por exemplo, a porcentagem
de valores que deverão estar acima ou abaixo de um determinado valor da variável
aleatória, ou entre esses dois valores definidos etc.
Existe uma fórmula para calcular essa probabilidade.
A variável aleatória X tem distribuição normal de probabilidades com parâmetros
média –∞a. O procedimento de cálculo passa pela integração da
função f(x) no intervalo (a,b), procedimento bastante trabalhoso. Todavia, utilizando a
função estatística DIST.NORM do Excel, esse cálculo se tornará mais simples e, neste
momento, nos permitirá compreender o processo de cálculo da probabilidade P(X) da
variável aleatória contínua X com distribuição normal. Os exemplos a seguir mostram
os procedimentos básicos de cálculo com a distribuição normal.
Os resultados do experimento formam uma variável aleatória X com distribuição
normal N(40, 10). Qual a probabilidade de um resultado do experimento ser menor ou
igual a 50? Solução. Os resultados do experimento têm distribuição normal com média
μ=40 e desvio padrão σ=10. Estamos procurando o valor da probabilidade P(X≤50), a
área sob a curva da distribuição normal no intervalo (–∞, 50), como mostra a figura
seguinte.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 110
O valor dessa área é o resultado da integração da função f(x) entre menos infinito
e 50. Uma forma prática de calcular a probabilidade P(X≤50) é utilizando a função
estatística DIST.NORM do Excel.
DIST.NORM(x; média; desv_padrão; cumulativo)
A função DIST.NORM retorna a função densidade da distribuição normal ou a
probabilidade acumulada de menos infinito até o valor do argumento x, conforme o
valor registrado no argumento cumulativo.
Se no argumento cumulativo for registrado o valor FALSO, a função estatística DIST.
NORM retornará a valor f(x) para o valor x informado no primeiro argumento da função,
considerando os parâmetros média e desvio padrão da distribuição, registrados no
argumento média e no argumento desv_padrão.
Se no argumento cumulativo for registrado o valor VERDADEIRO, a função DIST.
NORM retornará a probabilidade acumulada de menos infinito até x, considerando os
parâmetros média e desvio padrão da distribuição, registrados no argumento média
e no argumento desv_padrão. Nesse caso, a função DIST.NORM calcula a integral da
função f(x) no intervalo (–∞, x).
Neste exemplo, a probabilidade P(X≤50) é igual a 84,13%, resultado obtido com
a fórmula =DIST.NORM(50;40;10;VERDADEIRO), registrada em uma célula vazia de
qualquer planilha Excel. Esse resultado tem o seguinte significado:
• A probabilidade de um resultado do experimento (ou valor da variável aleatória
X) com distribuição normal N(40, 10) ser menor ou igual a 50 é 84,13%.
• Ou podemos dizer que 84,13% dos resultados do experimento (ou valores da
variável aleatória X) com distribuição normal N(40, 10) estão dentro do intervalo
(–∞, 50).
Continuando com a distribuição normal do exemplo acima, qual a probabilidade de
um resultado do experimento ser igual ou menor do que 35?
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 111
Solução.
Este problema é parecido com o anterior, pois devemos calcular a probabilidade
P(X≤35) obtida da área sob a curva no intervalo (–∞, 35), como mostra a figura a seguir.
A probabilidade P(X≤35) é igual a 30,85%, resultado obtido com a fórmula =DIST.
NORM(35;40;10;VERDADEIRO), registrada em uma célula vazia de qualquer planilha
Excel. Ou seja, a probabilidade de um resultado do experimento (ou valor da variável
aleatória X) com distribuição normal N(40, 10) ser menor ou igual a 35 é 30,85%,
ou 30,85% dos resultados do experimento (ou valores da variável aleatória X) com
distribuição normal N(40, 10) estão dentro do intervalo (–∞, 35).
Distribuição normal padronizada
Na primeira parte da apresentação da distribuição normal foi mostrado que:
• A probabilidade P(X≤a) é o resultadode integrar a função f(x) da distribuição
normal N(μ,σ) entre os limites (–∞, a).
• O cálculo de probabilidades é bastante trabalhoso, pois não há apenas uma
única distribuição normal e sim uma família de distribuições normais N(μ,σ).
A função estatística DIST.NORM do Excel reduz sensivelmente o procedimento
de cálculo; entretanto, o procedimento clássico de cálculo de probabilidades
utiliza a distribuição normal padronizada obtida da distribuição normal N(μ, σ),
realizando a mudança da variável X.
A variável aleatória desvio padrão normalizado Z de uma distribuição normal
padronizada é definida pela expressão .
A nova variável Z realiza cálculos de probabilidades com uma única curva de
distribuição denominada distribuição normal padronizada N(0, 1).
Propriedades da Distribuição Normal Padronizada
A distribuição normal da variável aleatória Z com média μZ e variância σ2 Z tem
as seguintes propriedades:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 112
• μ Z = 0 e σ² Z = 1
• f(Z) → 0 quando Z → ± ∞
• A curva é simétrica ao redor da média μ Z = 0. A área total sob a curva é 100%,
e cada metade da curva tem 50% da área total.
• A probabilidade P(Z1≤Z≤ Z2) é a área sob a curva no intervalo (Z1,Z2).
Uma das vantagens da distribuição normal padronizada é a facilidade de visualizar
resultados como, por exemplo, a percentagem de valores da variável Z com um, dois
e três desvios padrão ao redor da média. Outra vantagem é que, com a passagem
para o desvio padrão normalizado Z, a distribuição Z agrupa a família da distribuição
normal em uma única distribuição, o desvio padrão normalizado.
Depois de realizar a transformação, a curva da distribuição normal padronizada Z
tem a mesma forma que a da distribuição normal, porém com média e desvio padrão,
respectivamente, zero e um, representada como N(0, 1). A seguir, será mostrado o
procedimento de cálculo de probabilidade utilizando a distribuição Z.
Tabela Z
Essa tabela é usada com a distribuição normal padronizada. Ela começa no valor
z=0, com o valor 0,5000 correspondente à probabilidade acumulada da metade negativa
da curva, região de valores de z negativos. Tanto a primeira coluna quanto os títulos
dos cabeçalhos das demais colunas registram valores de z. Na primeira coluna, são
registrados os valores de z, variando com intervalo de um décimo, por exemplo, 0; 0,10;
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 113
0,20, e assim por diante, até o valor z=4. Nos cabeçalhos das colunas, são registrados
os valores de z variando com intervalo de um centésimo, por exemplo, 0,00; 0,01; 0,02,
e assim por diante, até o valor z=0,09.
Vejamos como se procura o valor da probabilidade P(Z≤1,24) na tabela Z. A
localização do valor z na tabela começa pela seleção da linha 1,20 e depois da coluna
0,04. Na interseção dessa linha e dessa coluna, tem-se z=1,24 e, nessa célula, o valor
procurado P(Z≤1,24)=0,8925, como mostra a Figura 8.11. Qual o significado do resultado
P(Z≤1,24)? O resultado 0,8925 é a probabilidade P(–∞≤Z≤1,24), correspondente à área
da curva de Z no intervalo (-∞, +1,24). Quando o valor de z não estiver explicitamente
registrado na planilha, deverá ser realizada uma interpolação linear entre os dois valores
mais próximos, um deles o maior seguinte, e o outro, o menor anterior ao valor de z
procurado.
Colocaremos abaixo um recorte dessa tabela, para podermos entender como
procurar os valores e como usar a tabela em si.
A curva da distribuição Z tem a mesma forma que a curva da distribuição X, com
a mudança dos valores do eixo X para o eixo Z. Sugerimos que você tente visualizar
a mesma curva de distribuição normal com os dois eixos X e Z. Como há diversos
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 114
cálculos de probabilidade, a tabela abaixo apresenta o resumo dos procedimentos
de cálculo de probabilidade utilizando a tabela da distribuição normal padronizada Z.
A tabela acima mostra como operar com a tabela quando se procura o valor de
probabilidade diferente do registrado na tabela. Essas regras registradas na tabela
utilizam a propriedade de simetria da distribuição normal. Por exemplo, a probabilidade
P(Z ≥ a), sendo a positivo, corresponde à cauda superior da curva a partir do valor a.
A área que procuramos é a área complementar de P(Z ≤ a), que pode ser obtida da
tabela. Portanto, o valor de P(Z ≥ a) procurado é o resultado de (1–P(Z ≤ a)).
Vejamos alguns exemplos:
Se a variável X tem distribuição normal com parâmetros N(40, 10), qual a probabilidade
P(X≤50)?
Solução.
O valor equivalente de X=50 na distribuição normal padronizada é Z=+1, resultado
obtido com a fórmula . Da tabela Z, para Z=+1, obtém-se
P(X≤50)=P(Z≤1)=0,8413 ou 84,13%.
Continuando com a variável X do Exemplo acima qual a probabilidade P(X≤35)?
Solução.
Para X=35, obtém-se Z=-0,50, porém na tabela não podemos procurar P(Z≤–0,50).
Contudo, a terceira linha da tabela de procedimentos registra que a probabilidade
P(Z≤a), sendo a negativo, deve ser calculada como complemento utilizando a fórmula
1 – P(Z≤|a|), onde |a| significa que deve ser utilizado o valor a como positivo. Nesse
caso, 1 – P(Z≤|a|) = 1 – P(Z≤+0,50) = 1 – 0,6915=0,3085.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 115
Continuando com a variável X do Exemplo acima, qual a probabilidade P(25≤X≤60)?
Solução.
Os valores de Z para X=25 e X=60 são Z1=–1,50 e Z2=+2,0. Como a probabilidade
P(–1,5≤Z≤+2,0) não é obtida diretamente da tabela Z, ela será o resultado da diferença
P(Z≤+2) – P(Z≤ –1,5), procedimento que deve ser realizado por partes:
• A probabilidade P(Z≤+2,0) é igual a 0,9772, obtida diretamente da tabela.
• A segunda parte é P(Z≤–1,5)=1–P(Z≤+1,5)=1-0,9332=0,0668.
• Finalmente, P(–1,5≤Z≤+2,0)=0,9772–0,0668=0,9104 ou 91,04%.
Mais um exemplo:
Jota afirma que está entre os 5% maiores vendedores da empresa, pois seu total de
vendas no ano passado foi de $1.350.000. Considerando que as vendas de todos os
vendedores têm a distribuição normal N($1.250000, $100.000), verifique se a afirmação
do vendedor Jota é correta.
Solução.
Os 5% maiores vendedores da empresa estão localizados no final da cauda superior
da distribuição normalizada da figura acima. Qual o valor Z1 que verifica a relação
P(Z≥Z1)=5%? Como a tabela não tem registrada essa parte da área da curva, deveremos
procurar a probabilidade complementar 0,95 obtida como resultado da diferença (1-
0,05). Procurando no miolo da tabela Z, verificamos que o valor 0,95 não coincide
com nenhum dos valores registrados na tabela Z, pelo que será necessário realizar
uma interpolação. Como o valor 0,95 situa-se entre 0,9495 (Z=1,64) e 0,9505 (Z=1,65),
interpolando entre esses valores obtém-se Z=1,645, que corresponde à probabilidade
P(Z≥1,645)=0,05. Com os dados disponíveis, a N($1.250000, $100.000) e o valor
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 116
Z=1,645, calculamos o valor de venda mínimo x correspondente a 5% dos maiores
vendedores, utilizando a fórmula do desvio padrão normalizado Z:
Dessa expressão, temos que o valor de venda mínimo x correspondente a 5% dos
maiores vendedores é x=$1.414.500, como mostra a fórmula:
x = 1,645 × $ 100.000 + $ 1.250.000 = $ 1.414.500
Concluindo, para pertencer ao grupo dos 5% maiores vendedores da empresa, seria
necessário vender pelo menos $1.414.500. Como o vendedor Jota vendeu $1.350.000,
ele não pertence ao grupo dos 5% maiores vendedores.
11.2 Conclusão
Neste capítulo, estudamos a distribuição normal, uma das principais distribuições
de probabilidade que usamos para a tomada de decisões. Essa distribuição é muito
usada no cotidiano de empresas quando estas querem tomar decisões sobre assuntos
relacionados a suas vendas, a suas compras, etc.PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 117
CAPÍTULO 12
AULA PRÁTICA -
VARIÁVEL DISCRETA
Caro estudante. Estamos quase chegando ao final de nosso curso de indicadores
educacionais. Nesta aula, faremos uma aula prática, retomando alguns conceitos
importantes já vistos anteriormente. Vamos a ela?
12.1 Aula prática - Retomada de conteúdos
Relembrando…
As variáveis quantitativas discretas são um tipo de variável estatística que podem
ser medidas numericamente e que possuem um conjunto finito ou enumerável de
valores possíveis, com pouca variabilidade de dados.
Por serem valores distintos e finitos, é possível realizar uma enumeração completa
de todos os valores possíveis da variável.
Essa variável é amplamente útil em diversas áreas, como nas ciências sociais, na
saúde, nas finanças e em muitas outras áreas que envolvem a coleta e análise de
dados.
A análise estatística dessas variáveis pode fornecer informações importantes para
a tomada de decisão em diversas áreas, como previsões e estimativas, análises de
tendências, comparações entre grupos, entre outras aplicações.
Vejamos, então, um exemplo de uma variável discreta e como vamos fazer os
cálculos usando uma tabela de distribuição de frequências.
Foi publicado, no jornal Diário de Marília, as idades dos 25 alunos do 1º semestre
A, do curso de Ciência da Computação, da faculdade Kinquina, como vistas abaixo:
Dados Brutos:
20 - 20 - 24 - 25 - 23
20 - 21 - 25 - 21 - 22
24 - 21 - 22 - 25 - 20
21 - 25 - 21 - 22 - 23
22 - 21 - 21 - 20 - 24
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 118
Podemos, primeiramente, organizar esses dados em um Rol, que são os dados
acima em ordem crescente.
Rol:
20 - 20 - 20 - 20 - 20
21 - 21 - 21 - 21 - 21
21 - 21 - 22 - 22 - 22
22 - 23 - 23 - 24 - 24
24 - 25 - 25 - 25 - 25
Vamos, agora, construir a tabela de distribuição de frequência, que nos auxiliará
nos cálculos que faremos:
Construção da tabela da variável discreta
Xi = O que vou observar, no caso, as idades dos alunos da menor para maior. Nesta
situação, a variável em estudo é a idade.
Fi = Frequência simples ou frequência absoluta, significa quantas vezes ocorreu cada
idade. Por exemplo: quantos alunos possuem 24 anos; quantos possuem 25 anos.
Fa = Frequência acumulada, é o acúmulo das frequências simples, a partir da primeira.
Para completar a coluna de frequência acumulada, basta repetir o primeiro elemento
da primeira linha da frequência simples e somar com o próximo elemento dessa coluna
sucessivamente, ou seja, somar na diagonal.
A última frequência acumulada deverá ser igual a somatória de Fi.
Fr = Frequência relativa, é o Fi dividido por N linha a linha; a somatória tem que dar 1.
F% = Frequência percentual é igual a frequência relativa multiplicada por 100 (Fr
vezes 100), O total da somatória tem que ser igual a 100%.
Xi . Fi = é uma coluna que é usada para o cálculo da média. Basta multiplicar linha
a linha o elemento da coluna Xi pelo elemento da coluna Fi.
N = Somatória do Fi
Vejamos como ficaria a tabela
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 119
Agora, podemos começar a fazer alguns cálculos e retomar alguns conteúdos.
12.1.1 Média aritmética simples
Para uma sequência numérica X: x1, x2, ......, xn, a média aritmética simples, que
designaremos por é definida por:
No caso de estarmos trabalhando com a tabela da variável discreta, teremos:
Assim, no nosso exemplo,
Ou seja, a idade média dos estudantes é de 22,12 anos.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 120
12.1.2 Mediana
É o valor central, aquele que divide a distribuição em duas partes iguais. No nosso
caso, como temos uma tabela, podemos proceder da seguinte forma:
Se n é impar - admite apenas um termo central que ocupa a posição . 0 valor
do elemento que ocupa esta posição é a mediana.
Se n é par - Neste caso, admite dois termos centrais que ocupam as posições
e . A mediana é convencionada como sendo a média dos valores que ocupam
estas posições centrais.
Como temos 25 elementos, então vamos proceder com n sendo ímpar.
Olhamos agora na coluna da frequência acumulada (Fa) para sabermos qual o
elemento que ocupa a 13ª posição. No nosso caso, é o 22, basta ver que para o
elemento 21, temos até 12 elementos. Então o 13º seria o próximo, no caso, o 22.
12.1.3 Moda
É o valor de maior frequência em um conjunto de dados.
Quando trabalhamos com uma tabela, é muito simples identificar a moda desta
distribuição. Basta verificar qual o elemento que possui a maior frequência.
No nosso exemplo, teremos que Mo = 21.
Vamos agora calcular as medidas de dispersão
12.1.3 Medidas de Dispersão
DESVIO MÉDIO SIMPLES
O conceito estatístico de desvio corresponde ao conceito matemático de distância.
A dispersão dos dados em relação a média de uma sequência pode ser avaliada
através dos desvios de cada elemento da sequência em relação a média da sequência.
O desvio médio simples que indicaremos por DMS é definido como sendo uma
média aritmética dos desvios de cada elemento da série para a média da série.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 121
No nosso exemplo:
Xi Fi Fa F% Xi . Fi
20 5 5 0,20 20 100 2,12 10,6
21 7 12 0,28 28 147 1,12 7,84
22 4 16 0,16 16 88 0,12 0,48
23 2 18 0,08 8 46 0,88 1,76
24 3 21 0,12 12 72 1,88 5,64
25 4 25 0,16 16 100 2,88 11,52
N=25 1,00 100% 553 34,84
COMENTÁRIO: O desvio médio simples depende de cada componente da série. Se
mudarmos o valor de um único elemento da série, mudaremos também o DMS. Portanto,
o desvio médio simples tem perfeita sensibilidade estatística. A maior dificuldade desta
medida é envolver módulos, cujas propriedades, em geral, não são suficientemente
conhecidas pelas pessoas que normalmente desenvolvem estes cálculos.
Observamos no item anterior que a dificuldade em se operar com o DMS se deve
a presença do módulo, para que as diferenças xi - possam ser interpretadas como
distâncias.
Outra forma de se conseguir que as diferenças xi - se tornem sempre positivas
ou nulas é considerar o quadrado destas diferenças, isto é: (xi - )².
Se substituirmos, nas fórmulas do DMS a expressão |xi - | por (xi - )², obteremos
uma nova medida de dispersão chamada variância.
Portanto, variância é uma média aritmética calculada a partir dos quadrados dos
desvios obtidos entre os elementos da série e a sua média.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 122
Xi Fi Fa Fr F% Xi . Fi
20 5 5 0,20 20 100 22,47
21 7 12 0,28 28 147 8,78
22 4 16 0,16 16 88 0,04
23 2 18 0,08 8 46 1,55
24 3 21 0,12 12 72 10,60
25 4 25 0,16 16 100 33,18
N=25 1,00 100% 553 76,62
Observação: na tabela, os valores da última coluna estão aproximados para duas
casas decimais.
Assim, a variância será:
Agora vamos calcular o Desvio Padrão
O Desvio Padrão é a raiz quadrada da variância. Assim:
COMENTÁRIOS:
1. No cálculo da variância, quando elevamos ao quadrado a diferença (xi - ),
a unidade de medida da série fica também elevada ao quadrado. Portanto, a
variância é dada sempre no quadrado da unidade de medida da série. Se os
dados são expressos em metros, a variância é expressa em metros quadrados.
Em algumas situações, a unidade de medida da variância nem faz sentido. É
o caso, por exemplo, em que os dados são expressos em litros. A variância
será expressa em litros quadrados. Portanto, o valor da variância não pode
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 123
ser comparado diretamente com os dados da série, ou seja: variância não tem
interpretação.
2. Exatamente para suprir esta deficiência da variância é que se define o desvio
padrão. Como o desvio padrão é a raiz quadrada da variância,o desvio padrão terá
sempre a mesma unidade de medida da série e portanto admite interpretação.
Interpretação do Desvio Padrão
O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão.
É fundamental que o estudante consiga relacionar o valor obtido do desvio padrão
com os dados da série.
Quando uma curva de frequência representativa da série é perfeitamente simétrica
como a curva abaixo, podemos afirmar que o intervalo [x - , x + ] contém
aproximadamente 68% dos valores da série.
O intervalo [x - 2 , x + 2 ] contém aproximadamente 95% dos valores da série.
O intervalo [x - 3 , x + 3 ] contém aproximadamente 99% dos valores da série.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 124
Estes percentuais 68%, 95% e 99% que citamos na interpretação poderão mais
tarde ser comprovados, com maior precisão, no estudo da distribuição normal de
probabilidades.
Quando a distribuição não é perfeitamente simétrica estes percentuais apresentam
pequenas variações para mais ou para menos, segundo o caso.
Vimos, no capítulo anterior, a distribuição normal. Agora, podemos interpretar de
modo mais amplo esse conceito do desvio padrão e seus intervalos em torno da
média. Perceba que o gráfico é exatamente o gráfico de uma distribuição normal.
Essas porcentagens são obtidas da tabela Z, vista no capítulo 11.
12.2 Conclusão
Procuramos nesta aula retomar os conteúdos vistos quando trabalhamos como uma
variável discreta. Retomamos os conceitos de média, mediana, moda, desvio médio
simples, variância e desvio padrão e pudemos conferir de modo mais aprofundado
os conceitos deste desvio padrão.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 125
CAPÍTULO 13
AULA PRÁTICA -
VARIÁVEL CONTÍNUA
Caros estudantes. Nesta aula, iremos retomar alguns conteúdos referentes à
variável contínua. Vamos relembrar as fórmulas e como fazemos para criar a tabela
de distribuição de frequências com variável contínua.
13.1 Variável contínua
Uma variável quantitativa será considerada contínua quando a variabilidade dos
dados é muito grande. Ou seja, podemos ter um rol com mais de 1 000 números,
mas com uma variabilidade muito baixa, por exemplo apenas 5 diferentes. Neste caso,
essa variável é considerada discreta.
Vejamos como podemos criar a tabela. Vamos a um exemplo.
Uma empresa náutica selecionou ao acaso, uma amostra de 40 revendedores
autorizados no litoral e anotou em determinado mês o número de unidades adquiridas
por estes revendedores. Obteve os seguintes dados:
Dados Brutos
9 14 19 20 32 18 16 26 24 20
7 18 17 28 35 22 19 39 18 21
15 18 22 20 25 28 30 16 12 20
10 15 25 21 5 23 15 21 26 32
1º passo: Encontrar os possíveis valores de K.
Já sabemos que a tabela terá 5,6, ou 7 classes.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 126
2º passo: Encontrar a amplitude total.
Li=5
Ls=39
(Não esqueça que precisamos ajustar os limites)
3º passo: Encontrar a amplitude de classe, dividindo pelos três possíveis valores de K.
A divisão deu um número inteiro para K=5 e K=7, logo vamos trabalhar com o
maior número de K.
Neste caso trabalhamos com K=7, hc=5 , Li=5 e Ls=40.
Classe Intervalo de classe Fi Fac Ponto central (Pmi) Pmi . Fi
1 5 |------ 10 3
2 10 |----- 15 3
3 15 |----- 20 12
4 20 |----- 25 11
5 25 |----- 30 6
6 30 |----- 35 3
7 35 |----- 40 2
TOTAL 40
Vamos agora calcular a frequência acumulada e o ponto central.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 127
Classe Intervalo de classe Fi Fac Ponto central (Pmi) Pmi . Fi
1 5 |------ 10 3 3 7,5
2 10 |----- 15 3 6 12,5
3 15 |----- 20 12 18 17,5
4 20 |----- 25 11 29 22,5
5 25 |----- 30 6 35 27,5
6 30 |----- 35 3 38 32,5
7 35 |----- 40 2 40 37,5
N=40
Por fim, vamos fazer o cálculo do ponto central multiplicado pela frequência simples,
para podermos fazer o cálculo da média.
Classe Intervalo de classe Fi Fac Ponto central (Pmi) Pmi . Fi
1 5 |------ 10 3 3 7,5 22,5
2 10 |----- 15 3 6 12,5 37,5
3 15 |----- 20 12 18 17,5 210
4 20 |----- 25 11 29 22,5 247,5
5 25 |----- 30 6 35 27,5 165
6 30 |----- 35 3 38 32,5 97,5
7 35 |----- 40 2 40 37,5 75
N=40 855
Agora vamos começar alguns cálculos:
Média:
Podemos também calcular a mediana e a moda:
Mediana:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 128
Moda: (aqui calcularemos apenas a Moda de Czuber, pois é a mais completa)
Agora, vamos partir para as medidas de dispersão, mais precisamente a variância
e o desvio padrão:
Para isso, precisamos criar algumas colunas que nos facilitarão o cálculo.
Primeiro, vamos criar a coluna que subtrai cada um dos pontos médios da média
calculada.
Classe
Intervalo de
classe
Fi Fac
Ponto
central (Pmi)
Pmi . Fi
1 5 |------ 10 3 3 7,5 22,5 -13,875
2 10 |----- 15 3 6 12,5 37,5 -8,875
3 15 |----- 20 12 18 17,5 210 -3,875
4 20 |----- 25 11 29 22,5 247,5 1,125
5 25 |----- 30 6 35 27,5 165 6,125
6 30 |----- 35 3 38 32,5 97,5 11,125
7 35 |----- 40 2 40 37,5 75 16,125
N=40 855
Agora, vamos calcular cada um desses valores ao quadrado
Classe
Intervalo
de classe
Fi Fac
Ponto
central (Pmi)
Pmi . Fi
1 5 |------ 10 3 3 7,5 22,5 -13,875 192,515625
2 10 |----- 15 3 6 12,5 37,5 -8,875 78,765625
3 15 |----- 20 12 18 17,5 210 -3,875 15,015625
4 20 |----- 25 11 29 22,5 247,5 1,125 1,265625
5 25 |----- 30 6 35 27,5 165 6,125 37,515625
6 30 |----- 35 3 38 32,5 97,5 11,125 123,765625
7 35 |----- 40 2 40 37,5 75 16,125 260,015625
N=40 855
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 129
Por fim, vamos multiplicar cada um dos elementos dessa coluna pela frequência
simples (ou absoluta) de cada uma de suas linhas correspondentes.
Classe Intervalo de classe Fi Fac Ponto central (Pmi) Pmi . Fi
1 5 |------ 10 3 3 7,5 22,5 -13,875 192,515625 577,546875
2 10 |----- 15 3 6 12,5 37,5 -8,875 78,765625 236,296875
3 15 |----- 20 12 18 17,5 210 -3,875 15,015625 180,1875
4 20 |----- 25 11 29 22,5 247,5 1,125 1,265625 13,921875
5 25 |----- 30 6 35 27,5 165 6,125 37,515625 225,09375
6 30 |----- 35 3 38 32,5 97,5 11,125 123,765625 371,296875
7 35 |----- 40 2 40 37,5 75 16,125 260,015625 520,03125
N=40 855 2124,375
Então, agora, podemos calcular a variância e o desvio padrão:
Variância:
Já o desvio padrão, que é a raiz quadrada da variância, será:
Desvio Padrão:
Esses são os cálculos que fazemos para variáveis contínuas.
ISTO ESTÁ NA REDE
Em um mundo repleto de variabilidade e incerteza, o desvio padrão surge como um
guia confiável — ele representa uma das ferramentas mais usadas e fundamentais
em estatística e análise de dados.
Pontos-chave
O desvio padrão quantifica a variação de um conjunto de dados.
Outliers podem influenciar significativamente o valor do desvio padrão.
A regra empírica (68-95-99,7) se aplica a dados com distribuição normal.
O coeficiente de variação relaciona o desvio padrão à média do conjunto.
O desvio padrão pressupõe observações independentes e distribuição normal.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 130
O que é o Desvio Padrão?
O desvio padrão é uma medida estatística que quantifica a variação ou dispersão
de um conjunto de dados — em outras palavras, ele indica o grau de variação dos
valores de um conjunto em relação à sua média.
Esta medida serve para expressar o quão “espalhados” ou “concentrados” estão os
dados em um conjunto.
Imagine que você queira saber o quão similares ou distintos são os resultados de
um grupo de estudantes em um teste.
O desvio padrão fornece uma resposta quantitativa, esclarecendo se os escores são
consistentemente próximos da média ou variamComo o número de elementos que compõem uma amostra é consideravelmente
menor que o número de elementos que compõem uma População, a Estimação é
sempre bem mais barata que o Censo, é concluída mais rapidamente que o Censo e,
portanto, mais atualizada.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 10
Se a maneira de avaliar um elemento é um teste destrutivo, o Censo se torna um
processo inviável, pois destruiria a população objeto do estudo.
Entretanto, na maioria das vezes em que o Censo é considerado inviável é por
razões econômicas e de tempo.
Na sociedade moderna, a maioria dos problemas exigem decisões de curto prazo.
Por isso, as informações estatísticas úteis à resolução destes problemas devem ser
obtidas rapidamente.
Pela rapidez e facilidade da obtenção destas informações, a estimação tem sido
cada vez mais utilizada como procedimento estatístico.
1.3 Dados Estatísticos
Normalmente, no trabalho estatístico, o pesquisador se vê obrigado a lidar com
grande quantidade de valores numéricos resultantes de um Censo ou de uma estimação.
Estes valores numéricos são chamados dados estatísticos.
No sentido de disciplina, a Estatística ensina métodos racionais para a obtenção de
informações a respeito de um fenômeno coletivo, além de obter conclusões válidas
para o fenômeno e também permitir tomada de decisões, através de dados estatísticos
observados.
Desta forma, a estatística pode ser dividida em duas áreas:
a) Estatística Descritiva - é a parte da Estatística que tem por objeto descrever os
dados observados.
b) Estatística Indutiva - é a parte da Estatística que tem por objetivo obter e
generalizar conclusões para a população a partir de uma amostra, através do cálculo
de probabilidade.
O cálculo de probabilidade é que viabiliza a inferência estatística.
1.3.1 Estatística Descritiva
A Estatística Descritiva, na sua função de descrição dos dados, tem as seguintes
atribuições:
a) A obtenção dos dados estatísticos.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 11
b) A organização dos dados.
c) A redução dos dados.
d) A representação dos dados.
e) A obtenção de algumas informações que auxiliam a descrição do fenômeno
observado.
• A obtenção ou coleta de dados é normalmente feita através de gm questionário
ou de observação direta de uma população ou amostra.
• A organização dos dados consiste na ordenação e crítica quanto a correção dos
valores observados, falhas humanas, omissões, abandono de dados duvidosos
etc.
• Redução dos dados - O entendimento e compreensão de grande quantidade
de dados através da simples leitura de seus valores individuais é uma tarefa
extremamente árdua e difícil mesmo para o mais experimentado pesquisador.
A Estatística descritiva apresenta duas formas básicas para a redução do número de
dados com os quais devemos trabalhar, chamadas variável discreta e variável contínua.
• A representação dos dados - 0s dados estatísticos podem ser mais facilmente
compreendidos quando apresentados através de uma representação gráfica, o
que permite uma visualização instantânea de todos os dados.
Os gráficos, quando bem representativos, tornam-se importantes instrumentos de
trabalho.
É ainda atributo da Estatística Descritiva a obtenção de algumas informações como
médias, proporções, dispersões, tendências, índices, taxas, coeficientes, que facilitam
a descrição dos fenômenos observados. Isto encerra as atribuições da Estatística
Descritiva.
Completando o processamento estatístico, no caso de uma Estimação, a
Estatística Indutiva estabelece parâmetros a partir de estimadores usando o cálculo
de probabilidade. Esta última etapa será desenvolvida posteriormente.
1.3.2 Variáveis
Como o procedimento estatístico a ser aplicado dependerá da natureza dos dados
ou das observações de cada variável, deve-se desenvolver a habilidade de distinguir
os tipos de dados possíveis e suas unidades de medida. Quanto a sua natureza,
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 12
as observações ou dados se classificam em quantitativas discretas e contínuas,
qualitativas nominais e ordinais, de corte transversal e séries temporais.
• Dados quantitativos. Refere-se a quantidades medidas numa escala numérica, em
geral, acompanhadas de alguma unidade de medida e podem ser de dois tipos:
• Dados discretos. Referem-se aos valores numéricos que assumem somente
números inteiros positivos 0, 1, 2, 3 .... Os dados discretos resultam, em geral,
de contagens: a quantidade de vendas diárias de uma empresa, o número
de filhos das famílias de uma região do país, o número de movimentos da
conta corrente dos clientes de um banco comercial, a quantidade de peças
defeituosas em um lote de produção, o número de transações financeiras
com erro de lançamentos, o número de acidentes nas estradas durante as
férias anuais de verão etc.
• Dados contínuos. Referem-se aos valores numéricos que assumem qualquer
valor do conjunto dos números reais. Os dados contínuos resultam, em geral,
de medições que podem ter grande precisão: o valor das vendas diárias de
uma empresa, a estatura dos alunos da terceira série, o valor dos depósitos e
retiradas da conta corrente dos clientes de um banco comercial, o consumo
mensal de energia elétrica, o tempo necessário para realizar uma tarefa
repetitiva, o tempo de espera para ser atendido em um serviço de saúde
pública etc.
• Dados qualitativos. Refere-se às observações não numéricas e são classificados
em nominais e ordinais:
• Dados nominais. Esses dados não têm ordenamento nem hierarquia. Por
exemplo, o sexo dos funcionários registrados no cadastro da empresa, o
estado civil, o nome das empresas que têm ações negociadas na Bolsa de
Valores, cidade de residência do respondente etc.
• Dados ordinais. Esses dados são equivalentes aos nominais, porém incluindo
uma ordem, uma hierarquia. Por exemplo, o cargo dos funcionários registrados
no cadastro da empresa: presidente, diretor, gerente etc.; a resposta a um
questionário de pesquisa onde há uma escala para escolher: bom, regular e
ruim; as posições das cinquenta maiores empresas por vendas durante um
ano: primeira, segunda etc.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 13
1.4 Exemplo de análise estatística
Um exemplo de Estatística é o Censo 2000 realizado pelo IBGE cujo primeiro resultado
mostra que a população do Brasil no ano 2000 era de 169.799.170 pessoas. Depois,
a população nos anos 1980, 1990, 1996 e 2000 classificadas por sexo, por grandes
grupos de idade e por situação de domicílio em % está registrada na tabela.
Dos resultados registrados na tabela, pode-se deduzir como essas proporções
evoluíram com o passar do tempo, as tendências de crescimento, mas não permitem
medir a força dessas tendências. Uma forma de analisar essas tendências é medir
a variação desses crescimentos durante os anos definidos nas colunas da tabela.
Podemos, por exemplo, calcular a taxa de crescimento, usando a média geométrica
(não se preocupe com o cálculo, procure entender o que estamos mostrando).
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 14
Análise dos resultados
Os resultados da tabela acima mostram que:
• A população total continua crescendo, entretanto a média geométrica da taxa de
crescimento anual diminui, pois durante os anos 1980 e 1990 a média geométrica
foi de 2,12% ao ano e durante os anos 1990 e 2000 foi de 1,5% ao ano.
• Quanto à classificação por sexo, a população de mulheres continua sendo maior
que a dos homens com tendência de aumentar essa diferença. De 1980 a 2000
a população de homens tem diminuído com taxa média geométrica de –0,047%
ao ano, e a população de mulheres tem aumentado, curiosamente, com taxa
média geométrica +0,047% ao ano.amplamente.
Importância do Desvio Padrão
O Desvio Padrão é uma métrica essencial na estatística e análise de dados, atuando
como uma lente pela qual podemos avaliar a consistência e confiabilidade de um
conjunto de dados.
Uma das suas funções primárias é permitir a identificação de tendências e padrões
significativos, ajudando os pesquisadores a discernir se um padrão é resultado de
uma variação aleatória ou se é indicativo de uma tendência subjacente.
Além disso, oferece uma maneira robusta de comparar a variabilidade entre
diferentes conjuntos de dados, fornecendo insights sobre a dispersão e centralidade
dos pontos de dados em relação às médias.
No mundo das finanças e outros campos que lidam com incertezas, o desvio
padrão é inestimável na avaliação de riscos, permitindo que os profissionais
prevejam a volatilidade e planejem de acordo.
Ele também é a pedra angular de muitos testes estatísticos, influenciando decisões
sobre a validade e confiabilidade dos resultados.
Por último, mas não menos importante, quando os dados são apresentados,
seja em pesquisa, negócios ou ciência, o desvio padrão ajuda a contextualizar os
resultados, oferecendo uma imagem mais completa da situação em análise.
Aplicações do Desvio Padrão
O Desvio Padrão, pela sua capacidade de quantificar a variabilidade dos dados,
encontra aplicação em inúmeros campos e indústrias.
O desvio padrão é usado no setor financeiro para avaliar a volatilidade dos
investimentos. Ele ajuda investidores e gestores a comparar a volatilidade de ativos
com a média do mercado ou benchmarks. Um desvio padrão elevado pode sinalizar
tanto riscos mais altos quanto potencial para maiores retornos.
Em ciências sociais e pesquisa de mercado, o desvio padrão auxilia na análise
de dados coletados de pesquisas ou experimentos, destacando variações nas
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 131
respostas e ajudando a identificar segmentos de população ou comportamentos de
consumo.
Na manufatura, é usado para monitorar a qualidade do produto. Processos de
fabricação que produzem itens com baixo desvio padrão são considerados
confiáveis e consistentes.
Na medicina, ele pode avaliar a eficácia de tratamentos, onde um baixo desvio
padrão pode indicar que um tratamento produz resultados consistentes e positivos.
Em meteorologia e análise climática, ajuda a identificar padrões e tendências,
fornecendo insights sobre variabilidades climáticas e previsões.
No esporte, treinadores e cientistas do esporte o usam para avaliar o desempenho
de atletas, identificando consistência e áreas de melhoria.
Como Calcular o Desvio Padrão
Calcular o desvio padrão pode parecer complexo à primeira vista, mas ao dividir o
processo em etapas sequenciais, ele se torna mais compreensível.
Exemplo de Cálculo do Desvio Padrão
Entender o desvio padrão por meio de um exemplo prático é uma abordagem eficaz
para consolidar o conceito.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 132
O processo de cálculo pode ser um pouco diferente dependendo se você está
lidando com dados de uma população inteira ou apenas uma amostra dessa
população.
A seguir, apresentamos um exemplo detalhado, mostrando cada passo do cálculo
do desvio padrão para um conjunto de dados.
Interpretação do Desvio Padrão
Veja algumas diretrizes para uma interpretação eficaz do desvio padrão:
Medida de dispersão: O desvio padrão evidencia a dispersão dos valores em um
conjunto. Quanto maior o desvio padrão, maior a dispersão ou variabilidade dos
dados. Já um desvio padrão menor indica que os valores estão mais agrupados em
torno da média.
Regra empírica: Para dados que seguem uma distribuição normal, a regra empírica
(ou regra 68-95-99,7) é uma ferramenta valiosa. Ela estabelece que cerca de 68%
dos dados estão a um desvio padrão da média, 95% a dois desvios padrão, e
aproximadamente 99,7% a três desvios padrão.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 133
Identificando outliers: Ao analisar o desvio padrão, é crucial estar atento à presença
de outliers. Estes são valores que se distanciam significativamente da média e
podem influenciar consideravelmente o desvio padrão. Muitas vezes, é necessário
investigar mais profundamente para entender a origem desses outliers.
Interpretação conforme o contexto: A relevância e aceitabilidade do valor do desvio
padrão variam conforme o campo de aplicação. Em algumas áreas, um desvio
padrão alto pode ser indicativo de maior risco, como nas finanças. Já em processos
de controle de qualidade, um desvio padrão baixo é sinônimo de consistência e
padronização.
Relativo à média: É importante interpretar o desvio padrão em relação à média
do conjunto de dados. Em certos contextos, o coeficiente de variação (CV) — que
relaciona o desvio padrão à média — pode ser uma ferramenta útil. O CV, sendo
uma medida adimensional, permite comparar a variabilidade entre conjuntos de
dados de diferentes magnitudes ou unidades.
Limitações do Desvio Padrão
Relevância da Média: Para que o desvio padrão seja uma medida válida de
dispersão, a média do conjunto de dados deve ser a representação adequada do
centro dos dados.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 134
Observações Independentes: A correlação ou dependência entre pontos de dados
pode distorcer o desvio padrão. Assim, é essencial garantir que as observações
sejam independentes para uma análise correta.
Escala de Medição: É crucial reconhecer se os dados estão em uma escala
intervalar ou de razão. Essas escalas permitem cálculos de desvio padrão
relevantes, ao contrário das escalas nominal e ordinal.
Distribuição Normal dos Dados: Em certos contextos, a aplicação do desvio padrão
pressupõe que os dados sejam normalmente distribuídos. A não conformidade com
essa distribuição pode levar a interpretações imprecisas.
Considerações Sobre o Desvio Padrão
O desvio padrão é utilizado como uma ferramenta estatística para quantificar a
dispersão de um conjunto de dados.
Ele oferece insights valiosos sobre a variabilidade dos dados.
No entanto, é essencial reconhecer suas limitações ao usá-lo como uma métrica de
análise:
Incomparabilidade entre Unidades Diferentes: O desvio padrão, sendo uma medida
de dispersão, é expresso na mesma unidade que os dados originais. Isso pode
tornar difícil a comparação da variabilidade entre conjuntos de dados que têm
diferentes unidades de medida.
Desafios na Interpretação: Embora o desvio padrão forneça uma medida
quantitativa da dispersão, sua interpretação pode ser desafiadora, especialmente
para aqueles que não estão familiarizados com estatísticas. Sem o devido contexto,
pode ser difícil discernir se um desvio padrão é considerado alto ou baixo para um
determinado conjunto de dados.
Suposição de Distribuição Normal: Em muitos contextos, o desvio padrão é mais
relevante quando os dados têm uma distribuição normal. No entanto, nem todos
os conjuntos de dados seguem essa distribuição. Quando aplicado a dados
que não são normalmente distribuídos, o desvio padrão pode não fornecer uma
representação precisa da dispersão.
Alternativas ao Desvio Padrão: Dependendo da natureza e da distribuição dos dados,
outras medidas de dispersão, como a amplitude, o intervalo interquartil ou o desvio
médio absoluto, podem ser mais apropriadas. Além disso, ferramentas gráficas,
como histogramas e box plots, podem complementar o desvio padrão ao oferecer
uma visualização mais intuitiva da dispersão dos dados.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 135
Sensibilidade a Outliers: O desvio padrão pode ser significativamente influenciado
por outliers ou valores extremos. Um único valor atípico pode distorcer a percepção
da dispersão geral de um conjunto de dados. Por exemplo, emum conjunto onde
a maioria dos valores está agrupada em torno de uma média, um outlier extremo
pode aumentar o desvio padrão, dando a impressão de que os dados são mais
dispersos do que realmente são.
Quando Usar o Desvio Padrão
Quantificação da Dispersão: Uma das principais funções do desvio padrão é
quantificar o quanto os dados se dispersam em relação à média. Isso permite
entender o grau de variabilidade ou consistência em um conjunto de dados.
Dados com Distribuição Normal: Se seus dados seguem uma distribuição normal,
o desvio padrão se torna ainda mais relevante, permitindo insights mais precisos
sobre a variabilidade dos dados.
Limitações a Considerar: O desvio padrão tem suas restrições. Em dados
enviesados ou que não estão em uma escala intervalar, outras medidas de
dispersão, como o intervalo interquartil, podem ser mais apropriadas.
Comparando Variabilidade: Em situações onde dois ou mais conjuntos de dados
têm médias parecidas, o desvio padrão pode ser uma ferramenta valiosa para
comparar a variabilidade entre eles.
Avaliação em Finanças: No campo financeiro, o desvio padrão é frequentemente
usado para avaliar riscos ou volatilidade de investimentos. Um desvio padrão mais
alto pode indicar um investimento mais arriscado.
Uso Integrado com Outras Ferramentas: O desvio padrão não deve ser a única
ferramenta em sua caixa de ferramentas estatísticas. Combiná-lo com outras
métricas e técnicas pode proporcionar uma compreensão mais rica e abrangente
dos seus dados.
fonte: https://estatisticafacil.org/desvendando-o-desvio-padrao/
13.2 Conclusão
Neste capítulo, revisamos conceitos fundamentais referentes à variável contínua,
seus cálculos e mais algumas considerações acerca do desvio padrão, uma das mais
(se não a mais importante) medida de dispersão que usamos na estatística. Nos dois
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 136
últimos capítulos, veremos como podemos fazer os cálculos usando uma planilha
eletrônica, como o MS Excel ou o Planilhas Google.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 137
CAPÍTULO 14
VARIÁVEL DISCRETA NO EXCEL
Caro estudante, neste penúltimo capítulo, iremos estudar como podemos usar o
MS Excel ( ou o Planilhas Google ) para fazer os cálculos de variável discreta.
14.1 O MS Excel
O Microsoft Excel é um software utilizado para elaboração, edição e gerenciamento
de planilhas eletrônicas. Este software permite a criação e organização de dados a
partir da criação e edição de planilhas onde os dados principais a serem trabalhados
são números.
A tela inicial do Microsoft Excel permite a escolha de uma planilha em branco, ou
de planilhas já pré-formatadas em um modelo. O usuário pode escolher se deseja
iniciar a sua planilha a partir de uma planilha em branco ou de um modelo que já
possui algumas formatações pré-definidas
Na tela inicial começamos pela barra de menus onde precisamos salvar a nossa
pasta de trabalho no Microsoft Excel.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 138
Essa barra é composta pelos seguintes menus: Arquivo, Página Inicial, Inserir, Layout
da Página, Fórmulas, Dados, Revisão, e Exibir.
No menu Arquivo é possível realizar as funções de gerenciamento dos arquivos
do Microsoft Excel como iniciar uma nova pasta, salvar uma pasta, salvar uma pasta
com um nome diferente, abrir uma pasta existente, imprimir uma pasta ou planilha,
compartilhar, exportar, publicar e fechar a pasta. É importante salvar a pasta com um
nome antes de iniciar a inserção dos dados na planilha.
Para começarmos a inserir os dados em uma planilha, primeiramente, vamos
compreender como a área de trabalho da planilha está organizada.
Esta área de trabalho inicia com linhas e colunas formando uma grande matriz,
com linhas identificadas por números, e colunas identificadas por letras do alfabeto. O
encontro de uma linha e uma coluna é chamado de célula e esta célula é identificada
com a letra da coluna seguida pelo número da linha, como por exemplo, coluna A e linha
1 é identificada como célula A1, e assim por diante para todas as células da planilha.
Vale frisar que o Excel não é um editor de texto, portanto não é possível que
criemos determinados padrões de texto nas colunas de nossa tabela, como símbolos
matemáticos ou sobrescrito ou subscrito.
Vamos conhecer algumas funções do Excel que nos auxiliarão nos cálculos da
tabela discreta ( e mais à frente, na variável contínua ).
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 139
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 140
Essas são algumas das funções estatísticas que o Excel apresenta. Existem muitas
outras, mas que não fazem parte do escopo de nossa aula.
Vamos a um exemplo, onde colocaremos os valores no Excel para fazermos os
cálculos apropriados
Foram inseridos os dados em cada uma das células. Para contar qual a frequência
do valor 1, vamos usar a função cont.se. Veja na figura como fazemos isso.
Toda função do Excel deve ser precedida do sinal de igual ( = ).
Uma outra coisa importante é que podemos copiar a função, basta posicionar o
cursor do mouse nesse ponto azul da célula B8. Ele faz com que, ao arrastarmos o
cursor para baixo, a função seja copiada.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 141
Agora, vamos calcular a frequência acumulada. Basta copiar a primeira célula da
frequência simples e ir somando as frequências subsequentes.
Usamos ainda a função SOMA, para somarmos os valores da coluna da frequência
simples.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 142
Vamos criar uma outra coluna, agora fazendo a multiplicação da coluna xi pela
coluna Fi.
E, aproveitando, vamos calcular a soma dessa coluna.
Agora, podemos calcular a média dessa distribuição, vamos fazer esse cálculo na
célula C16.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 143
Agora, vamos fazer a coluna que usamos para calcular a variância e o desvio padrão.
Primeiro, vamos criar a coluna que subtrai cada um dos valores da coluna xi da média.
Agora, vamos elevar essa coluna ao quadrado.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 144
Por fim, vamos fazer essa última coluna multiplicada pela frequência simples ( ou
absoluta). Aproveitamos e já fazemos a somatória dessa coluna.
Podemos, agora, calcular a variância e o desvio padrão. Para calcular o desvio padrão,
podemos usar a função RAIZ, que retorna a raiz quadrada de um determinado valor.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 145
Neste exemplo, podemos, simplesmente observando, dizer que a moda Mo = 5.
E a mediana, podemos usar uma função chamada MED ou podemos usar a fórmula
vista em nossas aulas.
Neste caso, usamos a função MED.
14.2 Conclusão
Neste capítulo, começamos a entender um pouco mais como usamos o Excel para
nos auxiliar na construção de uma variável discreta. O uso de uma ferramenta desse
tipo, além de ser muito mais rápido, faz com que, se tivermos que mudar um valor,
todos os valores seriam modificados. Isso nos facilita sobremaneira os cálculos, caso
um dos valores seja alterado.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 146
CAPÍTULO 15
VARIÁVEL CONTÍNUA
USANDO O EXCEL
Caro estudante, chegamos ao último capítulo do nosso curso de Indicadores
Educacionais. Esperamos que tenham gostado do curso e que tenham compreendido
a importância e os cálculos usados na estatística. Neste último capítulo, usaremos o
Excel para tratarmos de uma variável contínua.
15.1 Usando o Excelpara tratamento de variável contínua
Vamos ver como podemos usar o Excel para nos auxiliar no tratamento de dados
de uma variável contínua. Vejamos o exemplo abaixo, onde já começamos usando a
função MÁXIMO, que retorna o maior valor dentro de um intervalo de dados.
Agora, logo abaixo, vamos usar a função MÍNIMO, para nos indicar qual o menor
valor dessa distribuição.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 147
Podemos ver que temos 50 dados, pois temos até a linha 10 e até a coluna E (5ª
coluna). Então, vamos ver quais são os possíveis valores de k (basta usar a regra da raiz).
Lembrando ainda que precisamos ajustar os valores para calcular a amplitude total.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 148
Então, teremos 7 linhas, com uma amplitude de intervalo de classe de 5110.
Podemos, portanto, criar nossa tabela.
Para criarmos nossa tabela, criamos duas colunas, uma com o limite inferior da
classe e uma com o limite superior da classe.
Além disso, usamos a função CONT.SES, onde podemos colocar vários critérios
para a contagem dos termos.
Perceba que, primeiramente, colocamos essa tabela mais para a direita, para que
não apagássemos os dados, obviamente. Poderíamos fazer mais para baixo também,
ou ainda, colocar em uma outra aba, uma outra planilha.
Perceba, ainda, na figura, como foi criada a função CONT.SES, para a contagem da
frequência simples. Colocamos “>37210”, mas o limite inferior é 37211, para que ele
comece a contar a partir do 37211, que é o menor valor dessa linha. Quando usamos
o sinal de maior ou menor no Excel, ele pega estritamente os valores maiores ou
menores, não os que são iguais.
Agora, vamos fazer a frequência acumulada, como fizemos para a variável discreta.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 149
E, agora, vamos achar o ponto médio de cada classe.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 150
Verifique na figura como ficou a função que calcula esse ponto médio. Poderíamos
também ter usado a função MÉDIA.]
Criamos agora a coluna que faz a multiplicação de cada Ponto Médio por sua
frequência simples
Vamos calcular a média:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 151
Neste caso, calculamos a média real, usando a função MÉDIA, para podermos
comparar com a média calculada usando a tabela, que é o quociente entre a somatória
da coluna da multiplicação do ponto médio multiplicado pela frequência e o total de
elementos.
Sempre haverá um erro, pois na tabela estamos usando um valor aproximado para
representar a classe.
Vamos agora partir para o cálculo da variância e do desvio padrão.
Já criamos as colunas, e já fizemos a subtração de cada ponto médio pela média,
nesse caso a média calculada pela tabela. Vamos completar as colunas.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 152
E por fim, a coluna que usamos no cálculo da variância e do desvio padrão.
Colocamos os números dessa última coluna com 3 casas decimais, para mostrar
a você como ficaram essas multiplicações. Mas isso não é necessário, pois o Excel
fará as contas usando os valores que estão efetivamente em cada célula, não o valor
que está aparecendo para nós.
Calculamos a variância e, por fim, calcularemos o desvio padrão, usando a função
RAIZ.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 153
Para efeitos de comparação, vamos calcular o desvio padrão dos dados brutos, ou
seja, dos dados que foram coletados, usando a função DESPAD.
Perceba que há uma grande diferença entre o desvio padrão calculado com os dados
brutos e o calculado usando a tabela. Isso se dá, novamente, pelo fato de usarmos
um valor aproximado para representar os dados dentro de uma classe.
Não entraremos aqui no mérito do cálculo na Moda e da Mediana, pois já vimos
anteriormente, basta utilizarmos as fórmulas já vistas nos capítulos anteriores.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 154
15.2 Conclusão
Chegamos ao fim do nosso curso de Indicadores Educacionais. Esperamos que
tenham gostado do curso, que tenham compreendido aquilo que aqui tentamos
transmitir e mais ainda, que possam utilizar esses conhecimentos no seu dia a dia.
O uso da Estatística é muitas vezes relegado, porém, devemos ter em mente que, por
ser uma ciência exata, ela pode (e deve) nos auxiliar na tomada de decisões. Muito
obrigado.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 155
CONCLUSÃO
Chegamos ao final desta jornada pelo mundo da estatística, uma jornada repleta
de descobertas, desafios e insights reveladores. Ao longo deste livro, exploramos
os fundamentos da estatística, desde os conceitos básicos até as técnicas mais
avançadas, e espero que você tenha adquirido uma compreensão mais profunda e
uma apreciação pelo poder analítico que a estatística oferece.
A estatística é muito mais do que apenas números e fórmulas; é uma ferramenta
poderosa que nos permite fazer sentido dos dados, encontrar padrões ocultos e tomar
decisões informadas em face da incerteza. Através da estatística, somos capazes
de explorar o desconhecido, testar hipóteses e revelar as verdades subjacentes que
moldam o nosso mundo.
Ao longo deste livro, discutimos como a estatística é aplicada em uma ampla gama
de campos, desde a ciência e a medicina até a economia e os negócios. Vimos como
as técnicas estatísticas são usadas para entender o comportamento humano, prever
tendências futuras, melhorar processos e informar políticas públicas. Em essência, a
estatística é uma linguagem universal que transcende fronteiras disciplinares e nos
permite comunicar e compreender o mundo de maneiras novas e empolgantes.
No entanto, é importante lembrar que a estatística é uma ferramenta poderosa, mas
não é infalível. Devemos sempre estar cientes de suas limitações e das armadilhas
que podem surgir ao interpretar dados. A incerteza e a variabilidade são inerentes à
natureza dos dados, e é nossa responsabilidade como estatísticos e analistas exercer
o devido cuidado e rigor em nossas análises.
À medida que encerramos este livro, espero que você se sinta capacitado a utilizar os
princípios da estatística de forma crítica e eficaz em sua vida pessoal e profissional. Que
você seja capaz de questionar, explorar e descobrir, sempre usando a estatística como
uma bússola confiável em seu caminho em direção ao conhecimento e à compreensão.
A estatística é uma jornada sem fim, e espero que este livro tenha sido apenas
o começo de uma jornada emocionante e gratificante rumo ao domínio da análise
de dados. Que você continue explorando, aprendendo e aplicando os princípios da
estatística com entusiasmo e determinação.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 156
Obrigado por acompanhar esta jornada conosco. Que seus futuros empreendimentos
estatísticos sejam prósperos e repletos de descobertas fascinantes!
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 157
ELEMENTOS COMPLEMENTARES
LIVRO
Título: Estatística Aplicada à Educação com Abordagem
Além da Análise Descritiva - Volume 1
Autor: Giovani Glaucio de Oliveira Costa
Editora: Ciência Moderna
Sinopse: Estatística Aplicada à Educação com
Abordagem além da Análise Descritiva’ não pressupõe
conhecimentos anteriores do assunto, pois foi escrito
para quem se inicia no aprendizado dessa matéria. Este
livro enfatiza a relação das técnicas estatísticas com
a educação, com análises descritivas e também com
a introdução de técnicas inferenciais, o que diferencia
dos livros-textode estatística educacional, que tem foco
basicamente em estatística descritiva. Decorre que é uma obra que serve tanto aos
graduandos quanto aos pós-graduandos de áreas educacionais. É uma obra fácil de
ler e explora o uso efetivo de técnicas estatísticas nas áreas educacionais e ciências
humanas, incluindo solução de problemas que envolvem aplicação da estatística na
administração escolar, na elaboração de testes e provas, e na pesquisa educacional de
produção de novas teorias, usando exemplos do cotidiano do profissional de educação.
O texto é repleto de exemplos e exercícios, extraídos da vida real do profissional
de educação. Para facilitar a fixação de conceitos, logo após a explicação teórica é
apresentado um ou mais exemplos. O livro propõe todos os exercícios na área de
educação resolvidos. Também são apresentados textos com projetos e/ou pesquisas
em ‘cases’ na área de educação. O leitor encontrará neste livro um texto de leitura
simples, agradável, aplicada e ‘antenada’ com a vida cotidiana, e com as necessidades
de administradores, professores e pesquisadores em educação.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 158
FILME
Título: Quebrando a Banca
Ano: 2008
Sinopse: Ben Campbell (Jim Sturgess) é um jovem
tímido e superdotado do MIT que, precisando pagar
a faculdade, busca a quantia necessária em jogos de
cartas. Ele é chamado para integrar um grupo de alunos
que, todo fim de semana, parte para Las Vegas com
identidades falsas e o objetivo de ganhar muito dinheiro.
O grupo é liderado por Micky Rosa (Kevin Spacey), um
professor de matemática e gênio em estatística, com
quem consegue montar um código infalível. Contando
cartas e usando um complexo sistema de sinais,
eles conseguem quebrar diversos cassinos. Até que,
encantado com o novo mundo que se apresenta e também por sua colega Jill Taylor
(Kate Bosworth), Ben começa a extrapolar seus próprios limites. Ótimo filme para
entendermos a importância da probabilidade na tomada de decisões
WEB
No site do INEP, podemos ter acesso a diversas informações e estatísticas acerca do
censo escolar que é feito anualmente. Ótimo para termos referências dos problemas
que ocorrem em nosso país sobre essa área.
https://www.gov.br/inep/pt-br/areas-de-atuacao/pesquisas-estatisticas-e-indicadores/censo-escolar/resultados
https://www.gov.br/inep/pt-br/areas-de-atuacao/pesquisas-estatisticas-e-indicadores/censo-escolar/resultados
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 159
REFERÊNCIAS
BOLFARINE, Heleno & BUSSAB, Wilton O. Elementos de Amostragem. 1. ed. São
Paulo: Edgard Blücher, 2005.
LAPONNI Juan Carlos Estatística usando Excel / Juan Carlos Lapponi. – Rio de
Janeiro: Elsevier, 2005 – 8a reimpressão.
MEDEIROS, et al. - Estatística para os cursos de economia, administração e ciências
contábeis - São Paulo: Ed. Atlas, 1999
MORETTIN, L. G. Estatística Básica Probabilidade. São Paulo: Makron Books, 1993.
SPIEGEL MR. Estatística. Coleção Schaum. São Paulo: Editora Afiliada, 1993.
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.vf0btp5vqohw
_heading=h.5m1ho8r3ejw1
_heading=h.of0aem38qmxh
_heading=h.1fob9te
_heading=h.wsbqyu6garls
_heading=h.52r5clu29piy
_heading=h.i4bac6im4zym
_heading=h.x0b4cfcio6bc
_heading=h.6qc2q3ybs1zw
_heading=h.pjfexl30mwgt
_heading=h.b16td820jf5l
_heading=h.hcte2ga302bw
_heading=h.b4l80urt7am
_heading=h.f1mwyhk0i03o
_heading=h.q4juy47iy4g9
_heading=h.dkpf7hb65rm6
_heading=h.1s6tt44uae57
_heading=h.gjdgxs
_heading=h.2vbgltnclglc
_heading=h.si505qr36ggi
_heading=h.v5lhaqyn5g22
_heading=h.amgey97p5suk
_heading=h.1fob9te
_heading=h.tvcj704nfw8z
_heading=h.twc7kkgv6qxx
_heading=h.2gwxs51gr4jl
_heading=h.7p5vmc1k21ce
_heading=h.7nmg662sddhm
_heading=h.mx1g434r89uh
_heading=h.k731ab4t2w2y
_heading=h.yfgjgaspfswn
_heading=h.n19idcfp6ttj
_heading=h.3l6vbqttirv
_heading=h.5h1bg7hcxo65
_heading=h.zh7yh3xwciad
_heading=h.kmdo40gv1dc3
_heading=h.sktfyljb07pm
_heading=h.pkxmna6c2pmn
_heading=h.pgr5my69iqgl
_heading=h.ab00vxvcyzxq
_heading=h.8g58gg6ql680
_heading=h.yh4zljhxbjt6
_heading=h.7izok4t7anry
_heading=h.w2mri6k17ipl
_heading=h.xigqa83zsy70
_heading=h.9u9247xo98zy
_heading=h.4nvnnuq5p5pk
_heading=h.h1ei0ilr23qt
_heading=h.dwatgu451mt8
_heading=h.etehndy3f9qr
_heading=h.ayabkeyqdaf4
_heading=h.n9yoi3orlhhh
_heading=h.tyi5eknb791g
_heading=h.8ntbhcdflvm3
_heading=h.sprxwomlboa6
_heading=h.sotru58l7oo4
_heading=h.p3hf8tqfiqiv
_heading=h.ad11m7rlux1v
_heading=h.kbzrnxwiwf7p
_heading=h.yd2p9ii52fq5
_heading=h.s9ll2jkrvdaq
_heading=h.87anfcdeyhxc
_heading=h.uzegnonivhq2
_heading=h.igcbzdf9tbmm
_heading=h.r97fm2qabocj
_heading=h.brr3alhw4i5p
_heading=h.gkm40b3vev9k
_heading=h.c5iya421akot
_heading=h.dn57w1j0z2rn
_heading=h.o0qosz8opeov
_heading=h.1v7miziwtkao
_heading=h.on23q9gwntxd
_heading=h.l40u85nbu78c
_heading=h.tnumr4x6jzfw
_heading=h.cwursi8ex6t8
_heading=h.ww15werrasfi
_heading=h.ygxjnwd4vvlc
_heading=h.mrwzpwyzzsta
_heading=h.wvyl2t2q4osb
_heading=h.e83923uam
_heading=h.p8pejk85gli3
_heading=h.6hyztu7nwx72
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.7mv301sykpkh
_heading=h.1fob9te
_heading=h.mbwnrnlidkj2
_heading=h.n5eu30yymxhr
_heading=h.8f3gbdg6bw4q
_heading=h.bd7c4jdokdr
_heading=h.a3cuye3grkvv
_heading=h.y2lrxo2wp72v
_heading=h.5spez1bieivx
_heading=h.hfd63raiou6k
_heading=h.3hacpvdh5shb
_heading=h.gv2vrtqkiop3
_heading=h.oexge4o4q3fg
_heading=h.ww143lsu4lw5
_heading=h.85wc0uxw6jf6
_heading=h.gj8euuuw7ga0
_heading=h.ji505wvivxlp
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.1fob9te
_heading=h.y8yzxh3l0fcp
_heading=h.2usj3jn3p5tp
_heading=h.4n9hqc70p9j
_heading=h.2vpz8g9bzx69
_heading=h.vp7cinzd18qy
_heading=h.yunz054m977s
_heading=h.siujrpp57a1a
_heading=h.de6rme3ldbb2
_heading=h.xxjjacpy3ujh
_heading=h.e552cftjlb7a
_heading=h.edpvn3y5e78a
_heading=h.9nuq8st53myl
_heading=h.7t1rfxb89ip8
_heading=h.m9bwnqkmoj9h
_heading=h.kodo0stgzvnx
_heading=h.t9lex5pbl8h6
_heading=h.yvq55cqs71fc
_heading=h.j93j6w4yqomf
_heading=h.c6gwlu2wuzqu
_heading=h.dkjmd9cvt2bx
_heading=h.nqabqg33vu3n
_heading=h.xxhasoqne059
_heading=h.x6g7d1l2pxex
_heading=h.iww2otusx6w
_heading=h.ynek02fwvv7x
_heading=h.rimwkoyvaf7r
_heading=h.7fjr7vpxhz83
_heading=h.sl0kb1ienud4
_heading=h.kqf0jtpfl2wz
_heading=h.j89g0wszib16
_heading=h.ymly3r7022l3
_heading=h.w004kk90qdxa
_heading=h.k0b2zvg2z0zr
_heading=h.mywrby8317c3
_heading=h.xiyuvx62p9e7
_heading=h.9phpxvrbuja5
_heading=h.e98tqv6kaspb
_heading=h.rsywqw3cksix
_heading=h.m0dhnk9fq98
_heading=h.b0djipsl86v8
_heading=h.wzh5isd2jjmg
_heading=h.eh1nugs91p0f
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.u23pz2y3goz2
_heading=h.1fob9te
_heading=h.jtdwtb7sit42
_heading=h.cf8wcunhtar1
_heading=h.hf7ikkibg2xp
_heading=h.uawpzn99ldyg
_heading=h.67ke36jd8ojy
_heading=h.fs9mqs6fkkjd
_heading=h.lqlp3ets8wbp
_heading=h.lse8t7esqoh4
_heading=h.fkk3dnsd6scc
_heading=h.u06hxh70nnmn
_heading=h.cdja8ikeqwq5
_heading=h.3znysh7
_heading=h.jg78hc7ti1t7
_heading=h.sfq5ont0cy88
_heading=h.x0v61iedwcwz
_heading=h.8a69d0mlzfjs
_heading=h.oectljn6jo41
_heading=h.2m3hvf81ujo7
_heading=h.k3fnh5xvdr64
_heading=h.yfdjqeirj8tw
_heading=h.tqjdgmbzon41
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.1fob9te
_heading=h.2kfwcr6xv7gt
_heading=h.q6nuf0ibi0g9
_heading=h.467tzgsy05y6
_heading=h.mnyfyls1k2qh
_heading=h.ltqvmt8q4brg
_heading=h.gxeuihb4sofn
_heading=h.oi71ful63hxi
_heading=h.my2mr1wxrrxr
_heading=h.d14po6rahfvs
_heading=h.evevnjfkoktx
_heading=h.b0z4spradvsp
_heading=h.hfu2lvq5svf9
_heading=h.ffbrtacg61ub
_heading=h.glymvb9onbkx
_heading=h.3qmnz7yiff1s
_heading=h.nqfcdmvdulwz
_heading=h.ccwl9o1fzk68
_heading=h.lrmqp066nzkh
_heading=h.deow0jgqa6t0
_heading=h.z28wh855yc9w
_heading=h.zf94598udoze_heading=h.b1b2y7um1gu
_heading=h.qorhd17raes5
_heading=h.f0sq4oeww7ij
_heading=h.dw8m9ff4mlwm
_heading=h.xctm446rl82c
_heading=h.4vbeaqm1125h
_heading=h.emdyj4v7iu4
_heading=h.504l6muybeqy
_heading=h.2n7e8h5tr72j
_heading=h.r1b6s9woqive
_heading=h.glymvb9onbkx
_heading=h.ma2or1gskizc
_heading=h.ktdnl8ui8d3t
_heading=h.udmsbphy46su
_heading=h.ao9hoy8jnc31
_heading=h.4tuvtslriei3
_heading=h.1wbwayqov0fe
_heading=h.rpnie3makfa5
_heading=h.pp9kr876gpkz
_heading=h.5r463zly4sd5
_heading=h.emg3ibjz6nli
_heading=h.ri9pw9k3uyg1
_heading=h.orora91xe2j6
_heading=h.r40ur931v1t6
_heading=h.f76fqsax9arf
_heading=h.8atte3l5xsv9
_heading=h.ibcyl0uv3czl
_heading=h.7a53ufie0ssp
_heading=h.l2943zvh3v6x
_heading=h.rh8d6khkipxi
_heading=h.e42g2tg8t1y1
_heading=h.lnfqki8d5o9g
_heading=h.wxkkhvgmr218
_heading=h.jgmv1ci24xxg
_heading=h.v0pun9y5of4u
_heading=h.2jk63jdvjy4v
_heading=h.17f8uy7q7mb2
_heading=h.2x2428nafktv
_heading=h.z486vc3dq51h
_heading=h.gd0p1ddduws8
_heading=h.qknmlbun47gr
_heading=h.em0awlwfwjgm
_heading=h.vhswrondfiui
_heading=h.yd5ktwsvkfhb
_heading=h.v5zh8366hnr4
_heading=h.f0q0y12a5emp
_heading=h.h3lrefhj3x6c
_heading=h.fngauqw7m3wu
_heading=h.31ninqpf1qmi
_heading=h.rtcdda5y44n2
_heading=h.rfssg7tyb35m
_heading=h.18jjxtmhrx4c
_heading=h.3rcsmvi1fqk1
_heading=h.5bkevh17nrcy
_heading=h.xjdhbzlxhtlj
_heading=h.ofdji7s7tmt3
_heading=h.atfgu9erf55r
_heading=h.nurf9xx9sapa
_heading=h.vdj14x54rlvj
_heading=h.d6yoqrlxalue
_heading=h.ut0np3vrfc7t
_heading=h.dq7sapew66i4
_heading=h.3xs1rfanu6mz
_heading=h.dbianupfsf1n
_heading=h.sckm2kgfg8ap
_heading=h.6aw4rvhccn64
_heading=h.8znzdaj9erd5
_heading=h.n3jmc917ti73
_heading=h.d0g5c66txts1
_heading=h.sdmwz2u2hrlx
_heading=h.2sy2ybu9dwpf
_heading=h.6midc7eg8lqf
_heading=h.tbq4mc5a7ota
_heading=h.wgt1g0z60rsn
_heading=h.dbianupfsf1n
_heading=h.sfsapsai7hlx
_heading=h.3pvvmgpab1wx
_heading=h.f76fqsax9arf
_heading=h.tiroja86ab2a
_heading=h.keawezk4brwb
_heading=h.2kwd7guhb43
_heading=h.25zmttf58qjt
_heading=h.us24fdmq7o5b
_heading=h.rl9r2cpm8pdk
_heading=h.aulc0cws17s5
_heading=h.i2txq189s51s
_heading=h.x4jwxjb3poyq
_heading=h.t9ni0pcdvxsg
_heading=h.n9o7fx3tmw74
_heading=h.uw3l5ov2dxh4
_heading=h.o3k1shjvfj04
_heading=h.1omn3v8gupm
_heading=h.jlnt67qhdxlj
_heading=h.54fa3ni2332y
_heading=h.wgt1g0z60rsn
_heading=h.dbianupfsf1n
_heading=h.sfsapsai7hlx
_heading=h.3pvvmgpab1wx
_heading=h.f76fqsax9arf
_heading=h.tiroja86ab2a
_heading=h.keawezk4brwb
_heading=h.2kwd7guhb43
_heading=h.25zmttf58qjt
_heading=h.us24fdmq7o5b
_heading=h.rl9r2cpm8pdk
_heading=h.aulc0cws17s5
_heading=h.i2txq189s51s
_heading=h.x4jwxjb3poyq
_heading=h.t9ni0pcdvxsg
_heading=h.n9o7fx3tmw74
_heading=h.trpfvbyumwhj
_heading=h.cso5358jpcuo
_heading=h.km4lqam4oppd
_heading=h.jlnt67qhdxlj
_heading=h.54fa3ni2332y
_heading=h.wgt1g0z60rsn
_heading=h.dbianupfsf1n
_heading=h.sfsapsai7hlx
_heading=h.3pvvmgpab1wx
_heading=h.f76fqsax9arf
_heading=h.tiroja86ab2a
_heading=h.keawezk4brwb
_heading=h.2kwd7guhb43
_heading=h.25zmttf58qjt
_heading=h.us24fdmq7o5b
_heading=h.rl9r2cpm8pdk
_heading=h.aulc0cws17s5
_heading=h.i2txq189s51s
_heading=h.x4jwxjb3poyq
_heading=h.t9ni0pcdvxsg
_heading=h.n9o7fx3tmw74
_heading=h.uvlivnejrktl
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.ty1y4pq1nim6
_heading=h.1fob9te
_heading=h.dbozi3b1gy5r
_heading=h.dki137lgwu3z
_heading=h.a9alwq6ds9ap
_heading=h.n0rmi2n5x6pa
_heading=h.2txiwm56rhmi
_heading=h.8tgactz3ydxz
_heading=h.qhr8f9bwqlo3
_heading=h.orzb1fa7lbv1
_heading=h.bhfjdf99vjnm
_heading=h.ed3rrzrl55t8
_heading=h.bp3mqm3cm87b
_heading=h.jqjh6m533z57
_heading=h.cpmg3fd1laxe
_heading=h.6pxizgofltmj
_heading=h.7u92f2e7zz09
_heading=h.cbx1f08pvw0q
_heading=h.twdq64g3lggf
_heading=h.di8ocg5ylz12
_heading=h.k8pjyz1ig1lc
_heading=h.c271zpu5t4hi
_heading=h.iac6m2v9gk76
_heading=h.s3kydh2os9w9
_heading=h.t5bxj93gfwav
_heading=h.acypje8hm7qn
_heading=h.zd7j8qg6fi9m
_heading=h.hj5t33t30pbc
_heading=h.fndzpbo1559c
_heading=h.hh24ia88x3lk
_heading=h.ufuuw1d4te7q
_heading=h.n8uy81q8t9d4
_heading=h.xhss8jr5jtyz
_heading=h.g0071nbbh5gi
_heading=h.4ya3hth3o3d5
_heading=h.ufl2j3ecv9cg
_heading=h.uqchhc5pmmlh
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.jkf9oacpmy3p
_heading=h.9b3hi4pk9nm0
_heading=h.3znysh7
_heading=h.3znysh7
_heading=h.3znysh7
_heading=h.3znysh7
_heading=h.3znysh7
_heading=h.3znysh7
_heading=h.3znysh7
_heading=h.3znysh7
_heading=h.3znysh7
_heading=h.3znysh7
_heading=h.cxg240gb1oi2
_heading=h.8l8c9s8c82px
_heading=h.ufvmwwgk1rpl
_heading=h.ufvmwwgk1rpl
_heading=h.ufvmwwgk1rpl
_heading=h.rt79mogl4bfp
_heading=h.qj7sm6f01guq
_heading=h.8leb2vdkcnxq
_heading=h.t9ismm2d4h9x
_heading=h.2ycwc0u9vekw
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.ioo7eawhp74p
_heading=h.1fob9te
_heading=h.b5kqo05tt3ca
_heading=h.bp3xyhi6tpm9
_heading=h.itqx4gp6f1cc
_heading=h.td5doacqgb5u
_heading=h.w4umz9rxpbec
_heading=h.bz4jdfa3mm7t
_heading=h.uqhy1dk4h0hl
_heading=h.bnzw0uja2zpv
_heading=h.miv5wvocxjnv
_heading=h.wbtinkkeop3x
_heading=h.s2m945hv8om4
_heading=h.o08a02fin8l7
_heading=h.tg7llnbg4pi9
_heading=h.iquehejiqxvb
_heading=h.zcli4t66gqll
_heading=h.o08a02fin8l7
_heading=h.tg7llnbg4pi9
_heading=h.i9hstf4h9kfa
_heading=h.j5mwxxo1agnj
_heading=h.o08a02fin8l7
_heading=h.tg7llnbg4pi9
_heading=h.o08a02fin8l7
_heading=h.tg7llnbg4pi9
_heading=h.f057dp3lnxiv
_heading=h.l2fkddv9y15c
_heading=h.hm04ogqbr3fc
_heading=h.9hl9jg9pjdp8
_heading=h.ja0jrghbinpm
_heading=h.q9zby2r2oov3
_heading=h.lkflovl4ndm3
_heading=h.p4jv9s2mtdcr
_heading=h.mt1fe6k446q3
_heading=h.c87dykbx7i0n
_heading=h.awfytkplydo
_heading=h.ox3uocvlrf6o
_heading=h.jccq0xtx06h3
_heading=h.t7efmk4dt43h
_heading=h.1opbyvh085et
_heading=h.yz947bbe4fgo
_heading=h.i8w2i5hudnaj
_heading=h.rq3x0ufbg6xp
_heading=h.7nbbgaewznox
_heading=h.hf3gftglcuz5
_heading=h.uap9myzfyjy0
_heading=h.u6cpbtgb0g2
_heading=h.bjheq34v014l
_heading=h.1tynaf2ic3x7
_heading=h.h9efc9pzypw
_heading=h.741ze5gf6h5v
_heading=h.umkjpqsdxv9
_heading=h.xmiergvgz9vd
_heading=h.n8eyjpx51qje
_heading=h.633mw42bq0i9
_heading=h.ycxss0zh5h61
_heading=h.qtwamrfcf9e1
_heading=h.7tbkl1o4p91s
_heading=h.fy2k52qv5kqc
_heading=h.qi8qs78dr0kl
_heading=h.ab14exycn7fj
_heading=h.mf1nbsjms09a
_heading=h.dcv15h465ke8
_heading=h.f505i2i7lfoo
_heading=h.csa587f36w46
_heading=h.sgp8ohq9cntu
_heading=h.iptsjqciyqvg
_heading=h.pn8jf3howrbb
_heading=h.gtvhnsoybam7
_heading=h.lg26ksanmh2d
_heading=h.3znysh7
_heading=h.kuvil4sw4vsw
_heading=h.uwkfir38pki1
_heading=h.5tdv2ep0eygu
_heading=h.dws5dlshtii7
_heading=h.eo3ugt9f8a2z
_heading=h.e3aytygfpjoc
_heading=h.d04u3wnms5e6
_heading=h.c9o1rpx3eghs
_heading=h.z225ilmhqyxh
_heading=h.l5dm8mjpd3de
_heading=h.kwn3otif9tic
_heading=h.t16ul3o0fb4m
_heading=h.dws5dlshtii7
_heading=h.7wwii4vxsra8
_heading=h.2229hv40eyqm
_heading=h.xt4l2j5qzvyj
_heading=h.htg8fmwh38vz
_heading=h.r3px5e5r5e3b
_heading=h.kbab9br9tgri
_heading=h.lyyltfqqzvpt
_heading=h.dws5dlshtii7
_heading=h.pt9r04s1ggd3
_heading=h.bisqdgr6ztg
_heading=h.vsqcyn677luh
_heading=h.49tpdbypxy6
_heading=h.lf8j6hq73wz4
_heading=h.2ifcm2tp02ss
_heading=h.y0m4s6rsdf95
_heading=h.1g4lilcxsw9w
_heading=h.fz1scp2q7z8i
_heading=h.g4es1ohncrs8
_heading=h.ynbx2hgfjxf2
_heading=h.xlfndn91ez9a
_heading=h.mq8w8fv5j6wm
_heading=h.orqw1qk3qbk0
_heading=h.wjen685sbjok
_heading=h.cykbekxvoke2
_heading=h.q3l1cm7b4217
_heading=h.69zgubatd9nc
_heading=h.kn9mkhxeqox1
_heading=h.kzw704rsrm7m
_heading=h.n902mnruv8e7
_heading=h.7h3ht9cjt6b2
_heading=h.nq7masq5k3r5
_heading=h.5lu39imws1fe
_heading=h.p86nr374qxrx
_heading=h.cf75zrm3v24u
_heading=h.h0z1reou7dwp
_heading=h.75ryqxmx0u6j
_heading=h.txraymc130w6
_heading=h.qtya4njuh9li
_heading=h.70kirfn7wxcn
_heading=h.q6bp2mt0qacv
_heading=h.ywiuj5v7h6il
_heading=h.r6a3q7drsxml
_heading=h.9ws57kjdd1s1
_heading=h.z94pzk6ak1e4
_heading=h.ewdzt01cmhf9
_heading=h.gjdgxs_heading=h.30j0zll
_heading=h.fmv4jfqyws48
_heading=h.1fob9te
_heading=h.wywpf1oxdfco
_heading=h.24niy3rvimpo
_heading=h.lgjkbhfbt3s4
_heading=h.l09dyv39q6ap
_heading=h.u496t7rgitem
_heading=h.upou9y3qin25
_heading=h.4xdi7779ki4f
_heading=h.6py798rxpea1
_heading=h.8e9w8nazxjcb
_heading=h.9c39bshyf0n
_heading=h.e9yvf66kahw6
_heading=h.9m73e2u0eo8u
_heading=h.ene8o4k6qlax
_heading=h.4btqthkp45w2
_heading=h.why3ytx30sxc
_heading=h.ga6yuuhssfju
_heading=h.axvnmv1kpkye
_heading=h.9p1zcnl9a9qo
_heading=h.l7vyu07k1v9m
_heading=h.26itxd182n1h
_heading=h.qunlb72uvgrc
_heading=h.wh7b5423o5ds
_heading=h.s2igjupupigg
_heading=h.pfvqryoj03cr
_heading=h.i0x4l2nppr59
_heading=h.n368yjalh3i2
_heading=h.v6f0y5i84gt1
_heading=h.t9fudqcsptwz
_heading=h.jt7suebw3x1g
_heading=h.wqiiuaa2og1h
_heading=h.gogg5rojg8hx
_heading=h.vxm0f2tou5ez
_heading=h.q9mwlqez822h
_heading=h.uk24id8dbhfr
_heading=h.3xisq2caad48
_heading=h.9mtd7mu86yho
_heading=h.qr0btnol73vy
_heading=h.tl6i5x80dtx4
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.m0dhnk9fq98
_heading=h.zg9mcc51enn1
_heading=h.wzh5isd2jjmg
_heading=h.8pyxfso9aztp
_heading=h.cbx1f08pvw0q
_heading=h.5tkjoeidqawf
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.1fob9te
_heading=h.7j67bbtn0eh2
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.1fob9te
_heading=h.70irgov3t5wt
_heading=h.h2vz6sffll29
_heading=h.irkop9j7jam3
_heading=h.dpn4q5r1duv2
_heading=h.9y5n2x80dmc
_heading=h.jvi2f1x3g1xc
_heading=h.gjdgxs
_heading=h.30j0zll
_heading=h.pqzavjyp2bt4
Estatística
Distribuição de frequências
Distribuição de frequência: variável contínua
Medidas de tendência central
Medidas de tendência central - variável contínua
Medidas separatrizes
Medidas de dispersão
Gráficos estatísticos
Probabilidade
Distribuição Binomial
Distribuição Normal
Aula prática - Variável discreta
Aula prática - Variável contínua
Variável discreta no Excel
Variável contínua usando o Excel
_heading=h.30j0zll
_heading=h.gjdgxs• Quanto à classificação por grandes grupos de idade entre 1980 e 2000, a
população entre 0 e 14 anos diminuiu com taxa média geométrica de –1,27%
ao ano, a população entre 15 e 64 anos aumentou com taxa média geométrica
de 0,56% ao ano, e a população com mais de 65 anos aumentou com taxa
média geométrica 1,91% ao ano.
• Quanto à classificação por situação de domicílio 1980 e 2000, a população com
domicílio urbano aumentou com taxa média geométrica de crescimento positiva
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 15
de 0,9% ao ano e a população com domicílios rurais diminuiu com taxa média
geométrica de crescimento negativa de –2,7% ao ano.
Projeções
A análise desses resultados não se esgota nas poucas medidas que realizamos na
tabela, pois a partir desses resultados surgem perguntas relacionadas, primeiro, com
as causas que vêm provocando esses resultados e, depois, com as projeções futuras
que se podem extrair desses resultados. Por exemplo, enumerando as causas que
vêm provocando a diminuição da população jovem e aumentando a população adulta
com destaque às pessoas com mais de 65 anos e, olhando para o futuro, também
poderiam ser enumeradas as possíveis consequências dessas tendências. Um resultado
rápido das consequências futuras pode-se resumir da seguinte forma: em longo prazo
a população será mais velha e crescerá menos como mostra a projeção abaixo:
Decisões
Os resultados estatísticos ajudam a tomar decisões com base em poucos dados.
O processo estatístico de amostragem ou censo gera informações que auxiliam na
realização de previsões ou projeções e é, ou deve ser, uma das preocupações das
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 16
atividades de negócios e governamentais. Nas empresas é necessário prever as vendas,
os estoques, os custos, o fluxo de caixa etc. para um determinado período como é o
orçamento anual do próximo ano. Na administração pública faz-se necessário prever o
número de habitantes, a arrecadação, os custos dos serviços prestados etc. Voltando
ao Censo 2000, o seguinte trecho é um exemplo do que dizemos “...O estadista tem o
dever de governar com olho no futuro, antecipando-se em dar respostas a problemas
que explodirão depois de seu mandato....”
Nas empresas que desejarem continuar crescendo no mercado em que atuam
os desafios não são muito diferentes. As tendências dos índices mostram riscos,
oportunidades e desafios. Enquanto o cliente dos serviços da administração pública
é formado praticamente por todos os habitantes do país, o cliente das empresas
privadas é uma parte desses habitantes. Por exemplo, o gerente de marketing necessita
determinar o tamanho do mercado de seu novo produto, mas a população desse
produto nem sempre coincide com a população do país, como descreve o seguinte
trecho de um editorial: “Que a afirmação, repetida à exaustão, de que o Brasil é um
mercado constituído por 170 milhões de consumidores é uma falácia não é novidade. ...
40 milhões de pessoas, ou 23,5% da população do País, com rendas média e alta, que
participam plenamente do mercado consumidor. ... Do consumo depende o crescimento
sustentado da economia. As pessoas com rendas média e alta, segundo a pesquisa,
já atingiram o limite de sua capacidade de consumo. A expansão das atividades
dependeria, portanto, dos 130 milhões de pessoas que compõem as faixas mais
baixas de rendimento ...”.
1.5 Conclusão
Neste primeiro capítulo, começamos a ver o que é a estatística, qual a diferença
entre população e amostra e quais os tipos de variáveis que existem e como podemos
começar a entender uma análise estatística. Esperamos que tenham gostado e, caso
tenham alguma dúvida, recorram a esse material. Bons estudos.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 17
CAPÍTULO 2
DISTRIBUIÇÃO DE
FREQUÊNCIAS
Caro estudante. Vamos continuar nossos estudos com relação à estatística. Neste
capítulo, vamos estudar como funciona a distribuição de frequências, mais precisamente
das variáveis discretas. Veremos como podemos começar a preencher essa tabela
que nos auxiliará na tomada de decisões.
2.1 A tabela de distribuição de frequências
Quando lidamos com poucos valores numéricos, o trabalho estatístico fica
sensivelmente reduzido. No entanto, normalmente teremos que trabalhar com grande
quantidade de dados.
Um dos objetivos da Estatística Descritiva neste caso, é obter uma significativa
redução na quantidade de dados com os quais devemos operar diretamente. Isto pode
ser conseguido modificando-se a forma de apresentação destes dados.
Suponha que observamos as notas de 30 alunos em uma prova e obtivemos os
seguintes valores:
Se entendermos como frequência simples de um elemento o número de vezes
que este elemento figura no conjunto de dados, podemos reduzir significativamente
o número de elementos com os quais devemos trabalhar.
Para isso organiza-se o conjunto de dados na forma de uma série estatística
chamada variável discreta.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 18
Distribuição de Frequência - Variável Discreta
É uma representação tabular de um conjunto de valores em que colocamos na
primeira coluna em ordem crescente apenas os valores distintos da série e na segunda
coluna colocamos os valores das frequências simples correspondentes.
Se usarmos f para representar frequência simples, a sequência pode ser representada
pela tabela:
OBSERVAÇÕES:
(1) Note que a colocação de um índice i para x e para f tem a finalidade de referência.
Deste modo, x1 representa o primeiro valor distinto da série, x2 representa o segundo
valor distinto da série, f1 representa a frequência simples do primeiro valor distinto
da série, f2 representa a frequência simples do 2º valor distinto da série e assim
sucessivamente.
(2) Note que conseguimos reduzir de 30 elementos que constituíam a série original
para apenas 12 elementos.
(3) Note também que a variável discreta só é uma forma eficiente de redução dos
dados, quando o número de elementos distintos da série for pequeno.
Devemos optar por uma variável discreta na representação de uma série de valores
quando o número de elementos distintos da série for pequeno.
2.1.1 Construção da variável discreta
A construção de uma variável discreta é bastante simples. Basta observar quais
são os elementos distintos da sequência, ordená-los, e colocá-los na primeira coluna
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 19
da tabela. Em seguida, computar a frequência simples de cada elemento distinto e
colocá-la na segunda coluna da tabela.
Exemplo de construção de uma variável discreta: A sequência abaixo representa a
observação do número de acidentes por dia, em uma rodovia, durante 20 dias.
Os valores distintos da sequência são: 0, 1, 2, 3.
As frequências simples respectivas são: 8, 5, 5, 2.
Portanto, a variável discreta representativa desta sequência é:
2.1.2 Frequência relativa de um elemento da série - fr
É a divisão da frequência simples deste elemento pelo número total de elementos
da série.
Exemplo: Considere a variável discreta:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 20
O total de elementos desta série é 25. Portanto, a frequência relativa 30 primeiro
elemento distinto da série, que é 2, vale:
A frequência relativa do segundo elemento distinto, que é 3, vale:
Da mesma forma determinamos a frequência relativa dos elementos seguintes da
série:
Note que estes valores representam a participação percentual de cada elemento
distinto na série. Assim, podemos fazer a interpretação: 12% dos valores da série são
iguais a 2; 28% dos valores da série são iguais a 3; 32% dos valores da série são iguais
a 4; 24% dos valoresda série são iguais a 6; e 4% dos valores da série são iguais a 7.
2.1.3 Frequência acumulada de um elemento da série - fac
ou Fi
É a soma da frequência simples deste elemento com as frequências simples dos
elementos que o antecedem.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 21
Desta forma, a frequência acumulada para os elementos 2, 3, 4, 6 e 7 valem
respectivamente:
Estes valores podem ser interpretados da seguinte forma:
• 3 elementos componentes da série são valores menores ou iguais a 2.
• 10 elementos componentes da série são valores menores ou iguais a 3.
• 18 elementos componentes da série são valores menores ou iguais a 4.
• 24 elementos componentes da série são valores menores ou iguais a 6.
• 25 elementos componentes da série são valores menores ou iguais a 7.
2.1.4 Frequência acumulada relativa de um elemento da série - fac ri
ou Fri
É a divisão da frequência acumulada deste elemento, pelo número al de elementos
da série:
Assim, a frequência acumulada relativa dos elementos 2, 3, 4, 6 e 7 valem
respectivamente:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 22
Estes valores podem ser interpretados da seguinte forma:
• 12% dos valores da série são menores ou iguais a 2.
• 40% dos valores da série são menores ou iguais a 3.
• 72% dos valores da série são menores ou iguais a 4.
• 96% dos valores da série são menores ou iguais a 6.
• 100% dos valores da série são menores ou iguais a 7.
Quando acrescentamos estes valores a tabela original, esta passa a se chamar
distribuição de frequências. Para o exemplo estabelecido, a distribuição de frequências é:
Vejamos mais um exemplo, para entendermos melhor
O gerente do departamento de uma instituição financeira deseja analisar o
número diário de operações fechadas nos últimos dois anos por um operador de
seu departamento de opções de ações negociadas na Bolsa de Valores. Na tabela
a seguir foi registrada uma amostra probabilística simples de tamanho 26, extraída
das operações diárias fechadas pelo Operador B nos últimos dois anos. O objetivo é
obter as possíveis conclusões dos registros dessa tabela.
Solução.
Aplicando inicialmente apenas o bom senso, pode-se constatar que:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 23
• O número de operações fechadas por dia é um número do conjunto {11, 12, 13,
14, 15, 16, 17}.
• O Operador B fechou entre 11 e 17 operações por dia.
• O número diário máximo de operações fechadas pelo Operador B é 17, e o
número mínimo é 11.
Embora tenham sido obtidas algumas conclusões, o simples ordenamento dos
dados não permite obter maiores conclusões, pois ainda nos deparamos com a mesma
quantidade de dados. Necessitamos agrupar os dados de alguma maneira, tendo em
mente que esse procedimento não deve interferir na obtenção de conclusões.
Vejamos agora como ficariam as frequências relativas desta distribuição
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 24
Da tabela de frequências relativas, chegamos a estas conclusões:
• Em 3,85% dos 26 dias amostrados, o Operador B fechou 17 negócios por dia.
• Em 7,69% dos dias amostrados, o Operador B fechou 11 negócios por dia.
• Durante 26,92% dos dias da amostra, o Operador B fechou 14 negócios.
Vejamos por fim como ficam as frequências acumuladas:
Das tabelas de frequências acumuladas absolutas e relativas acima, temos as
seguintes conclusões:
• Ao afirmar que o operador B fechou 14 ou menos operações por dia em 76,92%
dos dias da amostra, foi incluído nessa afirmativa o fechamento de 14 operações
por dia. Diferente das seguintes declarações:
• O operador B fechou menos de 14 operações por dia em 50% dos dias da
amostra; o fechamento de 14 operações não está incluído.
• O operador B fechou menos de 15 operações por dia em 76,92% dos dias da
amostra; o fechamento de 15 operações por dia não está incluído.
• Ao afirmar que em 23,08% dos dias o operador B fechou 15 ou mais operações
por dia, está incluído nesse resultado o fechamento de 15 operações por dia.
Verifique que esse último resultado (23,08%) é o complemento do operador ter
fechado menos de que 15 operações por dia (76,92%), pois o resultado da soma
desses dois valores é 100%.
• Ao afirmar que em 61,54% dos dias o operador B fechou entre 13 e 15 operações,
incluindo esses valores, estamos realizando os seguintes cálculos:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 25
• Em 88,46% dos dias, o operador B fechou 15 ou menos operações.
• Em 26,92%, fechou 12 ou menos operações, ou fechou menos de 13 operações.
• Portanto, em 61,54%=88,46% – 26,92% dos dias o operador B fechou entre
13 e 15 operações, incluindo esses valores.
Outro ponto importante a ser destacado é que, analisando o procedimento da
construção dessa tabela, observamos que:
• A construção da tabela de frequências acumuladas absolutas é realizada com
os dados registrados na tabela de frequências absolutas. No sentido inverso,
a construção da tabela de frequências absolutas poderá ser realizada com os
dados registrados na tabela de frequências acumuladas absolutas. E da mesma
maneira para as frequências relativas.
• A construção da tabela de frequências acumuladas relativas pode ser realizada
com os dados registrados na tabela de frequências acumuladas absolutas se for
conhecido o tamanho da amostra. No sentido inverso, a tabela de frequências
acumuladas absolutas poderá ser construída com os dados registrados na tabela
de frequências acumuladas relativas se for conhecido o tamanho da amostra.
2.2 Conclusão
Neste capítulo começamos a construir a tabela de distribuição de frequências de
uma variável discreta. Vimos também como calculamos as frequências relativa e
acumulada. Essa construção já nos auxilia na tomada de decisões e na análise das
variáveis trabalhadas.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 26
CAPÍTULO 3
DISTRIBUIÇÃO DE FREQUÊNCIA:
VARIÁVEL CONTÍNUA
Caro estudante. Neste capítulo, veremos como fazemos a construção de uma tabela
de distribuição de frequências usando uma variável contínua. Temos que tomar um
certo cuidado com essa construção, como veremos a seguir.
3.1 A variável contínua
Uma variável quantitativa será considerada contínua quando a variabilidade dos
dados é muito grande. Ou seja, podemos ter um rol com mais de 1 000 números, mas
com uma variabilidade muito baixa, por exemplo apenas 5 diferentes. Neste caso, essa
variável é considerada discreta, como vimos no capítulo anterior.
Vejamos como construímos então a variável contínua.
Suponha que a observação das notas de 30 alunos em uma prova nos conduzisse
aos seguintes valores:
Observando estes valores notamos grande número de elementos distintos, o que
significa que neste caso a variável discreta não é aconselhável para a redução de dados.
Nesta situação é conveniente agrupar os dados por faixas de valores, ficando a
série com a seguinte apresentação:
A construção da variável contínua requer o conhecimento de alguns conceitos que
vamos estabelecer aproveitando a tabela acima como exemplificação:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 27
1. AMPLITUDE TOTAL DE UMA SEQUÊNCIA é a diferença entre o maior e o menor
elemento de uma sequência. Representando a amplitude total por At, o maior elemento
da sequência Xmáx , e o menor elemento por Xmín, a amplitude total é denotada por:
No exemplo da sequência que deu origem à tabela, Xmáx = 9,5 e Xmín = 2, portanto:
A amplitude total representa o comprimento total da sequência e é dada na mesma
unidade de medida dos dados da sequência.
2. INTERVALO DE CLASSE é qualquer subdivisão da amplitude total de uma série
estatística.No exemplo da tabela, subdividimos a amplitude total em quatro classes, obtendo
os intervalos de classe 2 |-- 4, 4 |-- 6, 6 |-- 8, 8 |-- 10.
Note que na realidade não trabalhamos com a At = 7,5 e sim com a amplitude total
ajustada para 8 como justificamos adiante.
3. LIMITE DE CLASSE: cada intervalo de classe fica caracterizado por dois números
reais. O menor valor é chamado limite inferior da classe e será indicado por I. O maior
valor é chamado limite superior da classe e será indicado por L. Por exemplo, na
Classe 2 |-- 4, I= 2 e L = 4.
4. AMPLITUDE DO INTERVALO DE CLASSE é a diferença entre o limite superior e
o limite inferior da classe. Se usarmos h para representar a amplitude do intervalo de
classe podemos estabelecer:
OBSERVAÇÕES:
(1) Na realidade, as classes não precisam necessariamente ter a mesma amplitude
como no exemplo acima. Porém, sempre que possível, devemos trabalhar com classes
de mesma amplitude. Isto facilita sobremaneira os cálculos posteriores.
(2) Note que usamos para representar as classes, intervalos reais semiabertos
à direita. Isto significa que o intervalo contém o limite inferior, mas não contém o
limite superior, ou seja, o intervalo de classe 2 |-- 4 contém os valores reais maiores
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 28
ou iguais a 2 e menores que 4. Desta forma, o último intervalo da série que é 8 |-- 10
não contém o valor 10. É por isso que não utilizamos a amplitude 7,5, pois se isto
fosse feito, o limite superior da última classe seria 9,5 e como o limite superior não
deve pertencer a classe, o elemento 9,5 da sequência estatística original ficaria sem
classificação. Como vamos utilizar este critério, precisaremos ajustar sempre o valor
máximo da série ao definir a amplitude total. Outros critérios poderiam ser adotados
como o intervalo real semiaberto à esquerda ou mesmo o intervalo real aberto, mas
nenhum destes critérios é melhor que o critério adotado.
5. NÚMERO DE CLASSES: o número de classes a ser utilizado depende muito da
experiência do pesquisador e das questões que ele pretende responder com a variável
contínua.
Isto pode ser verificado facilmente pelo próprio interessado ao longo desta exposição.
Para efeito de nossos exemplos, utilizaremos o critério da raiz para a determinação
do número de classes.
CRITÉRIO DA RAIZ
Se a sequência estatística contém n elementos e se indicarmos por K o número
de classes a ser utilizado, então pelo critério da raiz:
Como o número K de classes deve ser necessariamente um número inteiro e como
dificilmente √n, é um número inteiro, deixaremos como opção para o valor de K o
valor inteiro mais próximo de √n, uma unidade a menos ou a mais que este valor.
Vejamos na prática:
No exemplo da tabela, n = 30 e consequentemente k = √30 = 5,477, portanto o valor
inteiro mais próximo de √30 é 5. As opções para k então são: 4 ou 5 ou 6.
A amplitude do intervalo de classe que designamos por h é determinada da seguinte
forma:
Portanto,
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 29
Observe que a opção por quatro classes, foi feita em função de um valor de h mais
fácil de se operar.
Se tivéssemos optado por cinco classes, o valor de h seria 8/5 = 1,6; se tivéssemos
optado por seis classes, o valor de h seria 8/6 = 1,3333 …
Veja que o melhor valor para se trabalhar em cálculos é o h = 2. Foi por isto que
optamos por quatro classes.
Conhecendo-se o valor Xmin = 2 e a amplitude de classe h = 2, concluímos que o
limite superior da primeira classe é 4. Portanto, a primeira classe é o intervalo 2 |-- 4. O
limite inferior da segunda classe é 4. Somando-se a amplitude de classe obteremos 6.
Portanto, a segunda classe é 4 |-- 6. A terceira classe por analogia é 6 |-- 8 e a quarta
classe é 8 |-- 10.
6. FREQUÊNCIA SIMPLES DE UMA CLASSE fi: chama-se frequência simples de
uma classe ao número de elementos da sequência que são maiores ou iguais ao limite
inferior desta classe e menores que o limite superior desta classe.
No exemplo, a frequência simples da primeira classe é o número de elementos da
sequência que são maiores ou iguais a 2 e menores que 4.
Note que os valores da sequência nestas condições são os valores 3, 2,5, 2, 3,5.
Portanto, a frequência simples da primeira classe é 4.
Da mesma forma determinamos as frequências simples das demais classes,
completando o quadro representativo da variável contínua.
Existem outros critérios para a determinação do número de classes, como por
exemplo a fórmula de STURGES. Segundo STURGES, O número K de classes é dado por:
Para valores de n muito grandes, esta fórmula apresenta mais vantagens que o
critério da raiz, embora apresente o mesmo problema de aproximação do valor de K.
Como acreditamos que na prática a experiência do pesquisador é que na verdade
vai determinar o número de classes, optamos pelo método mais simples que é o
critério da Raiz.
Vejamos um exemplo na prática de construção de uma variável contínua:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 30
Um teste para aferir o Quociente de Inteligência em determinada classe de alunos
de uma Faculdade deu origem a sequência de valores
Para a construção da variável contínua, devemos determinar o número de elementos
da sequência. Verificamos que a sequência possui n = 70 elementos.
Pelo critério da raiz K = √n. No caso, K = √70 = 8,37. O valor inteiro mais próximo é
8. Portanto, temos opção para construir a variável contínua com 7 ou 8 ou 9 classes.
O maior valor da sequência é Xmax = 139 e o menor valor da sequência é Xmin=61.
Portanto, a amplitude total da sequência é At = 139 - 61 = 78. No entanto, sabemos
que pelo fato de o critério adotado do intervalo de classe ser semiaberto à direita,
devemos ajustar o valor Xmax. Se ajustássemos Xmax para 140, a amplitude ajustada
passaria a ser At = 140 - 61 = 79. Este valor não é divisível de forma inteira nem por
7 nem por 8 e nem por 9, que são nossas opções de classes.
Nesta situação devemos ajustar Xmax para 141 obtendo a At = 141 - 31 = 80 que é
divisível exatamente por 8, obtendo-se uma amplitude do intervalo de classe h dada por:
Observe que o ajuste do valor Xmax foi de duas unidades, passando de 139 para 141.
A experiência do pesquisador, nesta situação, o levaria a distribuir este erro de duas
unidades, iniciando a representação da série em 60 e terminando em 140. A amplitude
total ajustada para a série é: At = 140 - 60 = 80.
Ou seja, quando devemos ajustar mais de duas vezes a Amplitude total, devemos
distribuir o erro, de modo que este não fique pendendo apenas para um lado.
O comprimento do intervalo de classe é h = 10 e o número de classes é K=8.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 31
Computando as frequências simples de cada classe, construímos a variável contínua
representativa desta série.
Vejamos agora como ficam as demais frequências, já vistas no capítulo anterior,
para a variável contínua:
FREQUÊNCIA RELATIVA DE UMA CLASSE - fri
É a divisão da frequência simples desta classe pelo número total de elementos da
série.
O total de elementos desta série é 40. Portanto, a frequência relativa da primeira
classe é:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 32
A frequência relativa da segunda classe é:
A frequência relativa da terceira classe é:
e a frequência relativa da quarta classe é:
Observe que estes valores representam a participação percentual dos elementos
por classe. A interpretação para estes valores é:
- 15% dos valores da série são maiores ou iguais a 2 e menores que 4.
- 45% dos valores da série são maiores ou iguais a 4 e menores que 6.
- 25% dos valores da série são maiores ou iguais a 6 e menores que 8.
- 15% dos valores da série sãomaiores ou iguais a 8 e menores que 10.
FREQUÊNCIA ACUMULADA DE UMA CLASSE - Fi
É a soma da frequência simples desta classe com as frequências simples das
classes anteriores.
Desta forma, as frequências acumuladas para estas classes são:
Estes valores podem ser interpretados da seguinte forma, lembrando que são todos
maiores ou iguais a 2.
- 6 elementos da série são valores menores que 4.
- 24 elementos da série são valores menores que 6.
- 34 elementos da série são valores menores que 8.
- 40 elementos da série são valores menores que 10.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 33
FREQUÊNCIA ACUMULADA RELATIVA DE UMA CLASSE - FRi
É a divisão da frequência acumulada desta classe pelo número total de elementos
da série.
Assim, teremos:
Estes valores podem ser interpretados da seguinte forma, lembrando que são todos
maiores ou iguais a 2:
- 15% dos valores da série são menores que 4.
- 60% dos valores da série são menores que 6.
- 85% dos valores da série são menores que 8.
- 100% dos valores da série são menores que 10.
Perceba que em nada muda o que vimos com relação à variável discreta.
A tabela completa ficaria assim:
3.2 Conclusão
Neste capítulo, vimos a construção da variável contínua e como completamos a
tabela da mesma. Para que isso fique muito bem guardado, devemos treinar esses
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 34
passos, para que não sejam cometidos erros em sua construção. Havendo dúvidas,
recorra a esse material. Bons estudos.
3.3 Referências bibliográficas
BOLFARINE, Heleno & BUSSAB, Wilton O. Elementos de Amostragem. 1. ed. São
Paulo: Edgard Blücher, 2005.
LAPONNI Juan Carlos Estatística usando Excel / Juan Carlos Lapponi. – Rio de
Janeiro: Elsevier, 2005 – 8a reimpressão.
MEDEIROS, et al. - Estatística para os cursos de economia, administração e ciências
contábeis - São Paulo: Ed. Atlas, 1999
MORETTIN, L. G. Estatística Básica Probabilidade. São Paulo: Makron Books, 1993.
SPIEGEL MR. Estatística. Coleção Schaum. São Paulo: Editora Afiliada, 1993.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 35
CAPÍTULO 4
MEDIDAS DE
TENDÊNCIA CENTRAL
Caro estudante. Como estão indo em suas aulas? Esperamos que estejam
conseguindo entender tudo que estamos transmitindo aqui. Neste capítulo, iremos
começar a aprender como calculamos as medidas de tendência central. Vamos
começar com as variáveis discretas.
4.1 Medidas de tendência central
No estudo de uma série estatística é conveniente o cálculo de algumas medidas
que a caracterizam.
Estas medidas, quando bem interpretadas, podem fornecer-nos informações muito
valiosas com respeito à série estatística.
Em suma, podemos reduzi-la a alguns valores, cuja interpretação fornece-nos uma
compreensão bastante precisa da série.
Um destes valores é a medida de tendência central.
É um valor intermediário da série, ou seja, um valor compreendido entre o menor
e o maior valor da série. É também um valor em torno do qual os elementos da série
estão distribuídos e a posiciona em relação ao eixo horizontal.
Em resumo, a medida de tendência central procura estabelecer um número no eixo
horizontal em torno do qual a série se concentra.
As principais medidas de tendência central são: média, mediana e moda.
No cálculo de várias medidas estatísticas, vamos utilizar somas de um grande
número de parcelas.
Para facilitar a representação destas somas, introduziremos o conceito de somatório.
Somatório - Notação Sigma (Σ)
Quando queremos representar uma soma de n valores do tipo x1 + x2 + ... + xn,
podemos codificá-la através da expressão:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 36
onde:
Σ - é utilizada para representar as operações de adição entre as parcelas.
xi - é a parcela genérica
A parcela genérica é obtida tomando-se os termos constantes em todas as parcelas,
no caso x. Para representar a parte variável em cada parcela, no caso os índices,
utilizamos a letra i e indicamos a variação de i. (No exemplo i varia, segundo números
inteiros consecutivos de 1 até n.)
A expressão
deve ser lida “soma dos valores xi, para i variando de 1 até n.”
Para que uma soma possa ser representada por esta notação é fundamental que i
assuma todos os valores inteiros consecutivos entre dois valores dados. Assim, a soma:
Exemplos:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 37
Da mesma forma que codificamos a soma através da notação Sigma, podemos
decodificar obtendo as parcelas componentes.
Para obter a primeira parcela da soma:
basta substituir na parcela genérica 3xi, a variável i pelo valor indicado no extremo
inferior, i = 2.
A primeira parcela da soma é 3x2.
Para obter a segunda parcela, basta substituir na parcela genérica 3x, a variável i por
3. A segunda parcela vale 3x3. A última parcela da soma é obtida quando substituímos
na parcela genérica 3xi o valor de i por 4, que é o valor indicado no extremo superior.
A última parcela é 3x4.
Portanto,
Exemplos:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 38
Apesar de ser apenas um código e não uma operação, a notação Sigma tem algumas
propriedades que podem simplificar operações. Entre elas destacamos:
1. O somatório de uma soma é a soma dos somatórios.
2. O somatório de uma diferença é a diferença dos somatórios.
3. O somatório do produto de uma constante por uma variável é o produto da
constante pelo somatório da variável.
4. O somatório da divisão de uma variável por uma constante é a divisão do
somatório da variável pela constante.
4.1.1 Média aritmética simples
Para uma sequência numérica X: x1, x2, ......, xn, a média aritmética simples, que
designaremos por é definida por:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 39
No caso de estarmos trabalhando com a tabela da variável discreta, teremos:
Exemplo: Determinar a média da distribuição:
Solução: Inicialmente devemos somar a coluna de frequências simples para obter
o número total de elementos da série: Σ fi = 10 elementos. Em seguida, utilizamos a
própria disposição da tabela para efetuar os produtos xi . fi acrescentando estes valores
dispostos em uma nova coluna. Em seguida, somamos os valores desta coluna.
Na sequência substituímos esses valores na expressão obtendo:
4.1.2 Mediana
1º Caso - DADOS BRUTOS OU ROL
Inicialmente devemos ordenar os elementos caso sejam dados brutos, obtendo o
Rol. Em seguida determinamos o número n de elementos do Rol.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 40
Se n é impar - O Rol admite apenas um termo central que ocupa a posição
. 0 valor do elemento que ocupa esta posição é a mediana.
Exemplo: Determinar a mediana do conjunto:
Solução: Ordenando estes elementos obtemos o rol. X: 2, 8, 12, 12, 20, 20,23.
O número de elementos é n = 7 (ímpar), a posição do termo central é .
A mediana é o quarto elemento do Rol: md = 12.
O valor 12 deixa a sua esquerda e à sua direita o mesmo número de elementos,
sendo, portanto, o elemento central da série.
Quando lidamos com séries com urn grande número de elementos, a quantidade
de elementos à esquerda e à direita é aproximadamente 50% do total de elementos,
o que conduz à seguinte interpretação genérica para a mediana: “50% dos valores
da série são valores menores ou iguais a 12 e 50% dos valores da série são valores
maiores ou iguais a 12”.
Se n é par - Neste caso, o rol admite dois termos centrais que ocupam as posições
e . A mediana é convencionada como sendo a média dos valores que
ocupam estas posições centrais.
Exemplo: Determinar a mediana da série: X: 7, 21, 13, 15, 10, 8, 9, 13.Solução: Ordenando estes elementos, obtemos o rol: X: 7, 8, 9, 10, 13, 13, 15, 21.
O número de elementos é n = 8 (par).
As posições dos termos centrais são: .
O elemento que ocupa a quarta posição na série é 10 e o elemento que ocupa a
quinta posição é 13. Portanto,
Interpretação: 50% dos valores do rol são valores menores ou iguais a 11,5 e 50%
dos valores do rol são valores maiores ou iguais a 11,5.
2º Caso - VARIÁVEL DISCRETA
Se os dados estão apresentados na forma de uma variável discreta, eles já estão
naturalmente ordenados.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 41
Assim, basta verificar se o número de elementos da série é ímpar ou par e aplicar
o mesmo raciocínio do caso anterior.
Para facilitar a localização dos termos centrais, construímos a frequência acumulada
da série.
Solução: O número de elementos da série é n = fi = 23 (ímpar).
Portanto, a série admite apenas um termo central que ocupa a posição
.
Construindo a frequência acumulada podemos localizar com facilidade o décimo
segundo elemento da série.
Note que o elemento que ocupa a primeira posição na série é 2. Em seguida aparecem
quatro elementos iguais a 5. Estes elementos ocupam na série as posições de segundo
a quinto. Depois aparecem mais dez elementos iguais a 8 que ocupam na série as
posições de sexto a décimo quinto.
Consequentemente, o elemento que ocupa a décima segunda posição vale 8, e
podemos afirmar que md= 8.
Interpretação: 50% dos valores da série são menores ou iguais a 8 e 50% dos valores
da série são maiores ou iguais a 8.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 42
Outro exemplo:
Solução: O número de elementos da série é 32 (par) e a série admite dois termos
centrais que ocupam as posições: (32/2)º = 16º e (32/2 + 1)º = 17°. Para localizar
estes elementos, construímos a frequência acumulada da série.
As três primeiras posições da série são ocupadas por elementos iguais a 3.
Da quarta a oitava posição os elementos são iguais a 1. Da nona à décima sexta
posição os elementos são iguais a 2. Da décima sétima à vigésima sexta posição os
elementos valem 3.
Portanto, o elemento que ocupa a décima sexta posição é 2 e o elemento que ocupa
a décima sétima posição é 3 e, consequentemente, a mediana é:
Interpretação: 50% dos valores da série são valores menores ou iguais a 2,5 e 50%
dos valores da série são valores maiores ou iguais a 2,5.
4.1.3 Moda
É o valor de maior frequência em um conjunto de dados.
Notação: A moda será denotada por mo.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 43
Quando trabalhamos com uma tabela, é muito simples identificar a moda desta
distribuição. Basta verificar qual o elemento que possui a maior frequência.
Assim, vejamos no exemplo:
Neste exemplo, a moda seria mo = 3, que é o elemento que possui a maior frequência
(fi = 8).
A maior frequência observada na segunda coluna é 5 e corresponde aos valores 2
e 4. Portanto, é uma série bimodal com mo = 2 e mo= 4.
Observe que todos os elementos da série possuem a mesma frequência. Portanto,
a série é amodal.
4.2 Conclusão
Neste capítulo, começamos a estudar as medidas de tendência central e como
podemos calculá-las usando uma variável discreta. No próximo capítulo, veremos
essas mesmas medidas agora em uma variável contínua. Havendo dúvidas, consulte
sempre esse material.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 44
CAPÍTULO 5
MEDIDAS DE TENDÊNCIA
CENTRAL - VARIÁVEL CONTÍNUA
Caro estudante. Neste capítulo, veremos como calculamos as medidas de tendência
central agora em uma tabela de distribuição contínua. Devemos prestar atenção pois,
apesar da teoria ser a mesma, os cálculos e fórmulas são diferentes. Todo cuidado
é pouco. Bons estudos.
5.1 Medidas de tendência central na variável contínua
Quando trabalhamos com as variáveis contínuas, devemos lembrar, primeiramente,
que a distribuição na tabela é feita usando os intervalos de classe. Dessa forma,
devemos ficar atentos aos cálculos que deverão ser feitos.
Vejamos cada uma delas
5.1.1 Média aritmética simples
Antes de vermos como calculamos a média, vejamos como calculamos a média
aritmética ponderada.
Para uma sequência numérica X: x1, x2: ...... , xn afetados de pesos p1, p2, ......., pn,
respectivamente, a média aritmética ponderada, que designaremos por , é definida por:
Exemplo: Se X: 2, 4, 5, com pesos 1, 3, 2 respectivamente, então:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 45
Se os dados estão apresentados na forma de uma variável contínua, utilizaremos a
média aritmética ponderada, considerando as frequências simples das classes como
sendo as ponderações dos pontos médios destas classes. O ponto médio, de cada
classe é definido por:
, onde:
l = limite inferior da classe
L = limite superior da classe
A fórmula de cálculo de X que originalmente era
passa a ser escrita como:
Exemplo: Determinar a média da distribuição:
Solução:
Inicialmente, devemos somar a coluna das frequências simples, obtendo fi = 20.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 46
Na sequência, calculamos os pontos médios de classe: o ponto médio da primeira
classe é = 3,5; O ponto médio da segunda classe é = 6,5; o ponto médio da
terceira classe é = 9,5 e o ponto médio da quarta classe é = 12,5.
Estes valores serão dispostos em uma nova coluna na tabela. Como no caso anterior,
da variável discreta, usaremos a própria tabela para a sequência de cálculos.
Portanto,
Interpretação: O valor médio desta série é 7,85, isto é, 7,85 é o valor em torno do
qual os elementos desta série se concentram.
COMENTÁRIO: Quando agrupamos os dados na disposição de uma variável contínua,
passamos a trabalhar com os dados sem conhecimento de seus valores individuais.
Note no exemplo acima, que o máximo que podemos afirmar com respeito ao
menor valor desta série é que ele é um valor maior ou igual a 2 e menor que 5. Mas
não conhecemos seu valor individualizado.
O mesmo ocorre com todos os outros valores da série.
Este fato é que nos leva a substituir as classes pelos seus pontos médios ao
calcular a média da série.
5.1.2 Mediana
Se os dados são apresentados na forma de uma variável contínua, o raciocínio
usado na variável discreta não pode ser utilizado, uma vez que mesmo identificada
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 47
a posição da mediana na série, o valor do elemento da série que ocupa esta posição
não é identificável.
Utilizaremos um exemplo, para generalizar a fórmula de cálculo da mediana.
Considere a distribuição de frequência:
O número de elementos da série é n = Σ fi = 19.
A mediana, por definição, separa o número de elementos da série em dois grupos,
contendo cada um deles 50% dos elementos.
Portanto, a posição da mediana na série é n/2. No exemplo (19/2)º = 9,5º.
O valor decimal 9,5 indica que a mediana é um elemento posicionado entre o nono
e o décimo elemento da série.
Construiremos a frequência acumulada para identificar em qual classe estão situados
o nono e o décimo elemento da série.
Note que o nono e o décimo elementos estão posicionados na terceira classe, o
que indica que a mediana é um valor compreendido entre 9 e 12. A classe que contém
a mediana será identificada como classe mediana.
Este intervalo de três unidades contém oito elementos. Supondo que eles estão
uniformemente distribuídos neste intervalo, então poderemos dividir este intervalo de
modo proporcional a posição da mediana na série.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 48
Ou seja:
Simplificando:
Portanto:
md = 9 + x.
md = 9,9375Observando na fórmula em destaque acima que:
- 9 é o limite inferior da classe mediana.
- 9,5 é a metade dos elementos da série, isto é, n/2.
- 7 é a frequência acumulada da classe anterior a classe mediana.
- 8 é a frequência simples da classe mediana.
- 3 é a amplitude do intervalo de classe, poderemos generalizar a fórmula de cálculo
da mediana para variável contínua:
onde:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 49
COMENTÁRIO:
Devido às condições impostas na obtenção da fórmula da mediana, fica evidente
que o valor obtido pela fórmula é um valor aproximado do verdadeiro valor da mediana
da série.
De modo geral, todas as medidas calculadas para uma variável contínua serão valores
aproximados para estas medidas, uma vez que ao agruparmos os dados segundo
uma variável contínua, há perda de informações quanto a identidade dos dados.
5.1.3 Moda
Para determinar a moda de uma variável contínua, podemos optar por vários
processos. Daremos destaque para a moda de Pearson, a moda de King e a moda
de Czuber.
1º Processo: MODA DE PEARSON
Segundo PEARSON, a moda de uma variável contínua pode ser obtida através do
valor da média e da mediana:
Exemplo:
Solução:
Cálculo da média:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 50
• Cálculo da mediana:
A mediana corresponde ao sexto elemento da série. O sexto elemento da série está
na terceira classe. Esta é a classe mediana. A mediana vale:
Consequentemente:
mo = 25
Note que a moda está situada na terceira classe, que é a classe de maior frequência
da série. A classe de maior frequência será chamada de classe modal.
2º Processo: MODA DE KING
KING levou em consideração, em sua fórmula, a frequência simples da classe anterior
e a frequência simples da classe posterior a classe modal.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 51
onde:
Exemplo: Calcule a moda de King para a distribuição:
Solução: A classe modal é a de maior frequência portanto é a terceira classe e a
moda vale:
Interpretação: 24 é o valor mais frequente nesta distribuição.
3º Processo: MODA DE CZUBER
CZUBER levou em consideração, em sua fórmula, a frequência simples da classe
anterior, a frequência simples da classe posterior, além da frequência simples da
classe modal.
É, portanto, uma fórmula mais completa que a fórmula de King.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 52
onde:
Exemplo: Calcule a moda de Czuber para a distribuição:
Solução: A classe modal é a terceira classe, portanto, a moda vale:
Interpretação: 24,29 é o valor mais frequente nesta distribuição.
COMENTÁRIO:
A fórmula de Pearson tem normalmente interesse teórico. Se não dispusermos da
média e da mediana da distribuição, a fórmula de Pearson é a mais trabalhosa.
A fórmula de King é a mais simples delas, mas não é a mais precisa.
A fórmula de Czuber é mais precisa que a fórmula de King, pois leva também em
consideração a frequência da classe modal.
OBSERVAÇÃO: Se a classe modal for a primeira classe, então fant = 0 e se a classe
modal for a última então fpost = 0.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 53
5.2 Conclusão
Neste capítulo, estudamos as medidas de tendência central para a variável contínua.
Devemos ficar atentos, primeiramente, ao tipo de variável que estamos trabalhando,
se é uma variável discreta ou contínua e, sendo do tipo contínua, ter muito cuidado
com as aplicações das fórmulas. Havendo dúvidas, consulte sempre esse material
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 54
CAPÍTULO 6
MEDIDAS SEPARATRIZES
Caros estudantes, esperamos que estejam curtindo essas aulas e conseguindo
compreender tudo que aqui estamos transmitindo. Nesta aula, iremos aprender as
medidas separatrizes. Vamos a elas?
6.1 Medidas separatrizes
São números reais que dividem a sequência ordenada de dados em partes que
contêm a mesma quantidade de elementos da série.
Desta forma, a mediana que divide a sequência ordenada em dois grupos, cada
um deles contendo 50% dos valores da sequência, é também uma medida separatriz.
Além da mediana, as outras medidas separatrizes que destacaremos são: quartis,
quintis, decis e percentis.
Se dividirmos a série ordenada em quatro partes, cada uma ficará com 25% de
seus elementos.
Os elementos que separam estes grupos são chamados quartis. Assim, o primeiro
quartil, que indicaremos por Q1, separa a sequência ordenada deixando 25% de seus
valores à esquerda e 75 % de seus valores à direita.
O segundo quartil, que indicaremos por Q2, separa a sequência ordenada, deixando
50% de seus valores à esquerda e 50% de seus valores à direita. Note que o Q2 é a
mediana da série.
O terceiro quartil, que indicaremos por Q3, separa a sequência ordenada deixando
à sua esquerda 75% de seus elementos e 25% de seus elementos à direita.
Se dividirmos a sequência ordenada em cinco partes, cada uma ficará com 20%
de seus elementos.
Os elementos que separam estes grupos são chamados quintis.
Assim, o primeiro quintil, que indicaremos por K1, separa a sequência ordenada,
deixando à sua esquerda 20% de seus valores e à sua direita 80% de seus valores.
De modo análogo são definidos os outros quintis.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 55
Se dividirmos a sequência ordenada em dez partes, cada uma ficará com 10% de
seus valores.
Os elementos que separam estes grupos são chamados decis.
Assim, o primeiro decil, que indicaremos por D1 separa a sequência ordenada,
deixando à sua esquerda 10% de seus valores e 90% de seus valores à direita. De
modo análogo são definidos os outros decis.
Se dividirmos a sequência ordenada em 100 partes, cada uma ficará com 1% de
seus elementos.
Os elementos que separam estes grupos são chamados centis ou percentis.
Assim, o primeiro percentil, que indicaremos por P1, separa a sequência ordenada
deixando à sua esquerda 1% de seus valores e 99% de seus valores à direita. De modo
análogo são definidos os outros percentis.
Note que o Q4, K5, D10 e P100 são elementos que deixam à sua esquerda 100%
dos valores da sequência ordenada e correspondem diretamente ao último valor da
sequência.
Se observarmos que os quartis, quintis e decis são múltiplos dos percentis, então
basta estabelecer a fórmula de cálculo de percentis. Todas as outras medidas podem
ser identificadas como percentis. Desta forma:
6.2 Cálculo das medidas separatrizes
1º Caso - DADOS BRUTOS OU ROL
Devemos ordenar os elementos, caso sejam Dados Brutos obtendo o Rol.
Identificamos a medida que queremos obter com o percentil correspondente, Pi.
Calculamos i% de n, ou seja, para localizar a posição do percentil i do Rol.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 56
Em seguida, identificamos o elemento que ocupa esta posição.
Note que se for um número inteiro, então Pi que estamos procurando identificar
é um dos elementos da sequência ordenada.
Se não for um número inteiro, isto significa que o Pi é um elemento intermediário
entre os elementos que ocupam as posições aproximadas por falta e por excesso do
valor . Neste caso, o Pi é definido como sendo a média dos valores que ocupam
estas posições aproximadas.
Exemplo 1.
Calcule o Q1 da sequência X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.
Solução:
Ordenando a sequência, obtemos o Rol: X: 1,2, 5, 5,5, 8, 10, 11, 12, 12, 13, 15.
Identificamos Q1 = P25.
Calculamos 25% de 12 que é o número de elementos da série obtendo:
Este valor indica a posição do P25 no Rol, isto é, o P25 é o terceiro elemento do Rol.
Observando o terceiro elemento do Rol obtém-se 5.
Portanto, Q1= P25 = 5.
Interpretação: 25% dos valores desta sequência são valores menores ou iguais a 5
e 75 % dos valores desta sequência são valores maiores ou iguais a 5.
Exemplo 2. Calcule o K3 da sequência X: 2; 8; 7,5; 6; 10; 12; 2; 9.
Solução: Ordenando a sequência, obtemos: X: 2; 2; 6; 7,5; 8; 9; 10; 12.
Identificamos K3 = P60. Calculamos 60% de 8, que é o número de elementos da
série, obtendo:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 57
Este valor não-inteiro indica que o P60 é um valor situado entre o quarto e o quinto
elemento da sequência.
Observando diretamente no Rol, os elementos que ocupam a quarta e a quinta
posição obtemos 7,5 e 8. Portanto,
K3 = P60 = = 7,75
Interpretação: 60% dos valores da sequência são valores menores ou iguais a 7,75
e 40% dos valores da sequência são valores maiores ou iguais a 7,75.
Note que se o número de elementos da sequência for menor que 100, alguns
percentis podem coincidir em valores tornando estas interpretações não totalmente
verdadeiras.
2º caso - VARIÁVEL DISCRETA
Se os dados estão apresentados na forma de uma variável discreta, eles já estão
naturalmente ordenados.
Identifica-se a medida que queremos obter com o percentil correspondente: Pi.
Calcula-se i% de n ou seja para localizar a posição do percentil i na série.
Em seguida utilizamos a frequência acumulada da série para localizar o elemento
que ocupa esta posição. O valor deste elemento é o Pi.
Exemplo: Calcule o D4 para a série:
Solução:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 58
O número de elementos da série é Σ fi = 24.
Identificamos D4 = P40 e calculamos 40% de 24, ou seja, .
Esta posição não-inteira significa que o P40 é um valor compreendido entre o nono
e o décimo elemento da série. Construindo a frequência acumulada:
observamos que o nono elemento é 5, e o décimo elemento também é 5.
Assim,
D4 = P40 = .
Interpretação: 40% dos valores desta série são valores menores ou iguais a 5 e
60% dos valores desta série são valores maiores ou iguais a 5.
3º Caso - VARIÁVEL CONTÍNUA
Se os dados estão apresentados na forma de uma variável contínua, eles já estão
naturalmente ordenados e o número de elementos da série é n = Σ fi.
Para se obter uma fórmula geral para o cálculo dos percentis, vamos generalizar
a fórmula da mediana:
Identificando md = P50, podemos obter uma fórmula particular para o P50.
Note que a classe que contém a mediana é a mesma que contém o P50.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 59
Portanto, identificamos o limite inferior da classe que contém a Mediana (Imd) com
o limite inferior da classe que contém o P50 (I50).
O termo n/2 pode ser representado na linguagem do P50 como .
A frequência simples da classe mediana (fmd ) é a mesma frequência simples da
classe que contém o P50 (f50).
A frequência acumulada da classe anterior a classe mediana (Fant) é a frequência
acumulada da classe anterior a classe que contém o P50. Este termo não se modifica,
assim como h, que é a amplitude do intervalo de classe.
Assim, a fórmula da mediana, adaptada para a linguagem do P50 pode ser escrita:
Substituindo-se 50 pelo índice i, generalizamos a fórmula para o cálculo de qualquer
percentil:
onde:
Exemplo: Calcule o Q3 da série:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 60
O número de elementos da série é dado por Σ fi= 105. Identificamos Q3 = P75.
Iniciamos o cálculo do valor P75 lembrando que neste caso i = 75 e que:
.
Isto nos dá a posição do P75 na série.
Construindo a frequência acumulada da série obtemos:
A classe que contém o elemento que ocupa a posição 78,75 na série é a quarta
classe. Esta é a classe que contém o P75.
Substituindo os valores indicados na fórmula, obtém-se:
Portanto Q3 = P75 = 35,93
Interpretação: 75% dos valores da série são menores ou iguais a 35,93 e 25% dos
valores da série são maiores ou iguais a 35,93.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 61
Vejamos mais um exemplo relacionado a esta tabela.
Vamos calcular o P85.
O número de elementos da série é dado por fi= 105.
Iniciamos o cálculo do valor P85 lembrando que neste caso i = 85 e que:
.
Isto nos dá a posição do P85 na série.
Construindo a frequência acumulada da série obtemos:
A classe que contém o elemento que ocupa a posição 89,25 na série é a quarta
classe. Esta é a classe que contém o P85.
Substituindo os valores indicados na fórmula, obtém-se:
Portanto P85 = 38,92
Interpretação: 85% dos valores da série são menores ou iguais a 38,92 e 15% dos
valores da série são maiores ou iguais a 38,92.
Vejamos mais um exemplo:
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 62
Vamos calcular o P35.
O número de elementos da série é dado por Σ fi= 105.
Iniciamos o cálculo do valor P35 lembrando que neste caso i = 35 e que:
.
Isto nos dá a posição do P35 na série.
Construindo a frequência acumulada da série obtemos:
A classe que contém o elemento que ocupa a posição 36,75 na série é a terceira
classe. Esta é a classe que contém o P35.
Substituindo os valores indicados na fórmula, obtém-se:
Portanto P35 = 21,15
Interpretação: 35% dos valores da série são menores ou iguais a 21,15 e 15% dos
valores da série são maiores ou iguais a 21,15.
6.3 Conclusão
Neste capítulo, estudamos as medidas separatrizes. Perceba que a teoria tanto
para as variáveis discretas quanto contínuas é a mesma. O que muda é a forma como
calculamos para cada uma das variáveis. Como sempre, lembrem-se de diferenciar
as variáveis discretas das contínuas e as suas diferentes fórmulas.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 63
CAPÍTULO 7
MEDIDAS DE DISPERSÃO
Caro estudante. Vamos a mais um capítulo no nosso curso de Indicadores
Educacionais. Neste capítulo, vamos estudar as medidas de dispersão. Vamos entender
o que são essas medidas, como podemos calculá-las e o que elas significam.
7.1 Medidas de dispersão
Uma breve reflexão sobre as medidas de tendência central permite-nos concluir
que elas não são suficientes para caracterizar totalmente uma sequência numérica.
Se observarmos as sequências:
concluiremos que todas possuem a mesma média 13.
No entanto, são sequências completamente distintas do ponto de vista da variabilidade
de dados.
Na sequência Z não há variabilidade de dados.
A média 13 representa bem qualquer valor da série.
Na sequência Y, a média 13 representa bem a série, mas existem elementos da
série levemente diferenciados da média 13.
Na sequência X existem muitos elementos bastante diferenciados da média 13.
Concluímos que a média 13 representa otimamente a sequência Z, representa bem
a sequência Y, mas não representa bem a sequência X.
O nosso objetivo é construir medidas que avaliem a representatividade da média.
Para isto usaremos as medidas de dispersão.
Observe que na sequência Z os dados estão totalmente concentrados sobre a
média 13.
PROBABILIDADE
E ESTATÍSTICA
PROF. JONAS BORSETTI SILVA SANTOS
FACULDADE CATÓLICA PAULISTA | 64
Não há dispersão de dados. Na sequência Y há forte concentração dos dados sobre
a média 13, mas há fraca dispersão de dados. Já na série X há fraca concentração
de dados em torno da média 13 e forte dispersão de dados em relação à média 13.
7.1.1 Medidas de dispersão absoluta
As principais medidas de dispersão absolutas são: amplitude total, desvio médio
simples, variância e desvio padrão.
Amplitude Total
É a diferença entre o maior e o menor valor da sequência.
Cálculo da Amplitude Total
1º Caso - DADOS BRUTOS OU ROL
Basta identificar o maior e o menor valor da sequência e efetuar a diferença entre
estes valores.
Exemplo: