Prévia do material em texto
Estatística Aplicada
à Gestão
Elisângela Zarpelon Aksenen
Licenciada em Matemática pela Universidade Estadual do Centro-Oeste (Unicentro).
Especialista em Métodos Estatísticos pela Universidade Regional
Integrada do Alto Uruguai e das Missões (URI).
Professora da disciplina de Matemática do Ensino Fundamental,
Médio e Superior para cursos de Informática.
Autora de conteúdos didáticos para EaD.
Paulo Martinelli
Licenciado em Ciências Matemáticas pela Pontifícia
Universidade Católica do Paraná (PUCPR).
Pós-graduado em Processamento de Dados e em Organização, Sistemas e
Métodos pelo Instituto Superior de Pós-Graduação (ISPG/PR).
Pós-graduado em Metodologia do Ensino Superior pela Universidade Positivo.
Mestre em Informática Aplicada com ênfase em Análise e
Reconhecimento de Documentos pela PUCPR.
Professor das disciplinas de Matemática, Matemática Financeira, Estatística e Informática
para os cursos de Administração, Economia, Ciências Contábeis e Informática.
Professor de Matemática Financeira Avançada para pós-graduação – MBA.
Professor tutor de EaD.
Autor de conteúdos didáticos para EaD.
A315 Aksenen, Elisângela Zarpelon.
Estatística aplicada à gestão / Elisângela Zarpelon
Aksenen, Paulo Martinelli ; ilustrações Felipe Grosso. —
Curitiba : Aymará , 2009.
: il. — (Série EAD).
ISBN 978-85-7841-359-0 (Material impresso).
ISBN 978-85-7841-360-6 (Material virtual).
1. Estatística. 2. Administração de empresas.
I. Martinelli, Paulo. II. Grosso, Felipe. III. Título. IV. Série.
CDU 519.22
Dados internacionais para Catalogação na Publicação (CIP)
(Mônica Catani M. de Souza , CRB-9/807, PR, Brasil)
SOCIEDADE BAIANA DE EDUCAÇÃO E CULTURA – ASBEC
Presidência do Conselho de Administração
José Eugênio Barreto da Silva
Presidência
Viviane Brito de Lucca Silva
Direção de Operações e Expansão
Lila Lopes
Direção Administrativo-Financeira
Marcelo Adler
Assessoria de Governança
Silvio Bello
CENTRO UNIVERSITÁRIO JORGE AMADO – UNIJORGE
Reitoria
Viviane Brito de Lucca Silva
Pró-Reitoria de Educação a Distância
Simone de Oliveira Branco
Coordenação Acadêmica
Arturo Cavalcanti Catunda
Coordenação de Tecnologia Educacional
José Maria Nazar David
Coordenação de Desenvolvimento e Produção de Conteúdos
Karen Sasaki
Coordenação de Tutoria
Daniel Magnavita
Revisão Técnica
Carlos Alberto Ferreira Danon
AYMARÁ EDIÇÕES E TECNOLOGIA LTDA.
Diretoria-Geral
Áureo Gomes Monteiro Júnior
Diretoria de Produção Editorial
Júlio Röcker Neto
Gerência de Produção Editorial
Jurema Ortiz
Gerência de Produção Gráfica
Hildevar Munin Junior
Gerência de Produção Visual
Cynthia Amaral
Gerência de Patrimônio Intelectual
Célia Suzuki
Consultoria de Conteúdo
Prof.a Me. Aliger dos Santos Pereira
Edição
Giórgia Hellou
Revisão
Fabiane Ariello
Isabela Domingues
Pesquisa de Imagens
Marina Gonçalves
Projeto Gráfico
Cynthia Amaral
Diagramação
Fabio Rocha
Tatiana Tamy Murakami
Ilustração
Felipe Grosso
Tratamento de Imagens
Sandra Ribeiro
Prefácio
A estatística está muito presente em nossas vidas. Basta abrirmos os
jornais, as revistas e até mesmo assistirmos aos telejornais para que aflorem
dados estatísticos nesses meios midiáticos. Essas informações nos ajudam a
compreender e a “modelar” a realidade. Por isso, sua importância é fundamen-
tal para todo aquele que pretende compreender o contexto social em que vive.
O livro Estatística aplicada à gestão reúne com clareza e objetividade os
principais fundamentos da estatística. A utilização de modelos probabilísticos
e métodos estatísticos para a análise e tomada de decisões está presente em
diversas áreas de estudo. Por isso, a estatística é uma ferramenta fundamental
no competitivo âmbito da gestão empresarial.
O desenvolvimento da informática, por sua vez, permite acesso facilitado
aos cálculos estatísticos, proporcionando maior compreensão e interpretação
dos resultados.
Por meio do estudo deste livro, você terá acesso a vários conceitos (des-
de os básicos até alguns mais complexos) e a aplicações práticas sobre como
obter dados, como fazer a sua apuração e – talvez o mais importante –, como
analisar e avaliar os resultados a fim de tomar decisões adequadas na solução
de problemas específicos.
Esta obra, elaborada pelos professores Paulo Martinelli e Elisângela Zar-
pelon Aksenen, demonstra a competência necessária para conduzir os alunos-
-leitores ao mundo das estatísticas e as suas aplicações na área empresarial.
Boa leitura!
Adélia Onay Ribeiro de Mello
Especialista em Controle Estatístico de Qualidade pela Universidade Federal do Paraná (UFPR)
e professora de Estatística para os cursos de Administração, Sistemas de Informação, Economia
e Turismo.
Apresentação
Esta obra tem por finalidade mostrar aos leitores a estatística de uma ma-
neira de fácil compreensão, apresentando, de forma clara e lógica, definições e
exemplos de aplicações práticas à gestão.
A estatística é normalmente considerada uma disciplina complexa, mas
que exerce fascínio pela busca de resultados por meio de levantamentos de
dados pesquisados.
Neste livro, abordamos os principais conceitos desta disciplina. O con-
teúdo está distribuído em quatro capítulos. Em cada um deles, apresentamos
uma breve explicação da teoria, algumas aplicações, curiosidades, sínteses
dos conteúdos desenvolvidos nas aulas, leituras complementares e, por vezes,
sugestões de leitura. As atividades do final de cada capítulo têm o objetivo de
fixar os conceitos trabalhados.
No primeiro capítulo, ressaltamos a importância da estatística aplicada à
gestão nos dias atuais; trazemos, também, um resumo dos principais conceitos
necessários para a compreensão da disciplina, incluindo representação gráfica
de dados.
Já no capítulo 2, demonstramos como fazer a análise dos dados cole-
tados através dos cálculos de medidas, média, moda, mediana, assimetria e
curtose.
No capítulo 3, desenvolvemos a teoria das probabilidades e, no quarto
capítulo, nos referimos à regressão linear e à correlação.
Procuramos sempre demonstrar, por meio de exemplos e exercícios, as
mais variadas aplicações da estatística direcionada à gestão.
Como em estatística é comum a utilização de letras gregas, siglas e sím-
bolos, há uma lista no início do material contendo seus significados, para que
o estudante se familiarize com eles.
É importante dizer, ainda, que o uso de calculadora ou de um computador
constitui ferramenta importantíssima para facilitar e agilizar o trabalho do esta-
tístico atualmente.
Bom estudo!
Conteúdos da disciplinaConteúdos da disciplina
CAPÍTULO 1
NOçõEs GErAis dE EsTATÍsTiCA
Estatística e suas aplicações ����������������������������������� 15
População e amostra estatística descritiva e indutiva ����������������� 27
Distribuição de frequências ������������������������������������� 37
Aplicações da estatística ��������������������������������������� 49
CAPÍTULO 2
MéTOdOs PArA ANáLisE dE dAdOs
Medidas de tendência central ����������������������������������� 71
Medidas de dispersão ����������������������������������������� 87
Medidas de assimetria e curtose ������������������������������� 105
Medidas de dispersão entre duas variáveis ����������������������� 115
CAPÍTULO 3
PrObAbiLidAdE E sUAs APLiCAçõEs
Conceitos básicos de probabilidade ����������������������������� 131
Probabilidade ���������������������������������������������� 141
Variáveis aleatórias ������������������������������������������ 157
Distribuições de probabilidade ��������������������������������� 169
CAPÍTULO 4
COrrELAçãO E rEGrEssãO LiNEArI
Correlação ������������������������������������������������� 183
Regressão linear e correlação ���������������������������������� 189
Análise de variância do modelode regressão linear ����������������� 199
Intervalos de variação e predição ������������������������������� 209
Lista de abreviaturas,
siglas e símbolos
α – Usada na definição de grau de confiança para descrever a probabilidade corres-
pondente a uma área
ƒ(x) – Função de x
Λ ou λ – Lambda
Ω – Ômega
Є – Pertence
∪ − Soma (aritmética)
∪ − União (álgebra booleana)
≠ – Diferente
% – Porcentual
∩ – Interseção
∅ ou { } – Vazio
{ } – Símbolo de conjuntos
| – Tal que
| | – Valor absoluto
~ – Aproximadamente
< – Menor que
> – Maior que
≤ – Menor ou igual
≥ – Maior ou igual
± – Mais ou menos
∑ – Sigma maiúsculo (somatório)
√ – Raiz quadrada
∫ – Integral
oC – Graus Celsius
16PF – Instrumento para avaliação de traços de personalidade
–
A ou Abarra – Evento complementar de A
A – Amplitude
A – Evento aleatório
A – Evento possível
Agrianual – Anuário da Agricultura Brasileira
Lista de abreviaturas,
siglas e símbolos
Analf. – Analfabetismo
Anfavea – Associação Nacional dos Fabricantes de Veículos Automotores
As – Assimetria
Atl. – Atletismo
BN – Brancos e nulos
BPR-5 – Instrumento para mensuração de aptidões de raciocínio verbal e espacial
CAPM – Capital Asset Pricing Model
CDI – Certificados de Depósito Interbancário
CEP – Controle Estatístico de Processo
Cesat – Centro de Estudos da Saúde do Trabalhador
cm – Centímetros
Conama – Conselho Nacional do Meio Ambiente
Copeve – Comissão Permanente do Vestibular
Copom – Comitê de Política Monetária
Cov – Covariância
d – Decil
D
a – Desvio absoluto
Dm – Desvio médio
Dma – Desvio médio absoluto
Dp (S ou σ) – Desvio padrão
Dq – Desvio quartil
ε – Margem de erro
E – Espaço amostral
E – Esperança matemática
∈– Pertence
Empa – Swiss Federal Laboratories for Materials Testing and Research
EUA – Estados Unidos da América
f – Frequência
FA – Frequência absoluta
fa – Frequência acumulada
fant – Frequência da classe anterior à classe que contém a moda
Lista de abreviaturas,
siglas e símbolos
fdp – Função densidade de probabilidade
Feam – Fundação Estadual do Meio Ambiente de Minas Gerais
fi ou FR– Frequência relativa
fpost – Frequência da classe posterior à classe que contém a moda
Fundap – Fundação do Desenvolvimento Administrativo
G – Força gravitacional que age sobre um corpo ao nível do mar
g – Grama
Gin. – Ginástica
h – Hora
Hab. – Habitantes
i – Índice
IBGE – Instituto Brasileiro de Geografia e Estatística
Icex – Instituto de Ciências Exatas
Inep – Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira
IPI – Imposto sobre Produtos Industrializados
K – Coeficiente de curtose
kg – Quilograma
km – Quilômetro
l – Limite inferior da classe modal
L – Limite superior da classe modal
LabAPE – Laboratório de Avaliação Psicológica e Educacional
LDB – Lei de Diretrizes e Bases da Educação Brasileira
L
i – Limite inferior da classe que contém a moda
ln – Logaritmo natural ou logaritmo neperiano
m – Metros
MA – Média aritmética
MAp – Média aritmética ponderada
Md – Mediana
MEC – Ministério da Educação e Cultura
min – Minuto
mmc – Mínimo múltiplo comum
Lista de abreviaturas,
siglas e símbolos
Mo – Moda ou Modal
n – Número de elementos de uma amostra
N – Número de elementos de uma população
N! – Fatorial de um número (N)
ni – Frequência absoluta
P – Percentil
P – Peso / fator de ponderação
P – Probabilidade
PNADE – Pesquisa Nacional por Amostra de Domicílios
PNUD – Programa das Nações Unidas para o Desenvolvimento
Pop. – População
ppm – Parte por milhão
Q – Probabilidade do não acontecimento
Q – Quartil
r – Coeficiente da correlação de Pearson
rXY – Coeficiente de correlação
R2 – Coeficiente de determinação
ℜ – Conjunto dos números reais
R$ – Reais
REEs – Resíduos eletroeletrônicos
RMBH – Região Metropolitana de Belo Horizonte
ROA – Return On Assets
S – Desvio padrão
S – Espaço amostral
S/C – Sociedade Civil
S2 – Variância amostral
SAS – Statistical Analysis Software
t – Tonelada
TRF 4R – Tribunal Regional Federal da 4.a Região
UF – Unidade da Federação
UFMG – Universidade Federal de Minas Gerais
UFPR – Universidade Federal do Paraná
US$ – Dólar
v.a. – Variável aleatória
VAR – Variância
x – Variável independente
xi – Ponto médio
–x – Média amostral, média aritmética ou média
Xm – Ponto médio
y – Variável independente
–y – Média da variável 2
y^ – Valor estimado da variável y
Z – Valor critico, ou seja, número de fronteira que separa os valores das estatísticas
amostrais prováveis de ocorrerem dos valores que têm pouca chance de ocorrer
∴ – Portanto
Lista de abreviaturas,
siglas e símbolos
Lista de ilustrações
Figura 1 – Veículos cadastrados em Curitiba
Figura 2 – Os preços de cyber cafés no mundo I
Figura 3 – Os preços de cyber cafés no mundo II
Figura 4 – Gráfico de eleição
Figura 5 – Histograma correspondente às frequências absolutas
Figura 6 – Histograma correspondente às frequências relativas
Figura 7 – Estado civil dos acadêmicos de Administração
Figura 8 – Renda familiar mensal dos alunos do curso de Administração
Figura 9 – Tempo de afastamento dos estudos dos acadêmicos de Administração
Figura 10 – Brasil 1981 – 2005: Número de analfabetos e taxa de analfabetismo
na faixa etária de 15 a 60 anos
Figura 11 – População de 15 a 60 anos de idade: analfabetismo por gênero
Figura 12 – Taxa de analfabetismo da população entre 15 e 60 anos de idade por
unidade da Federação – 2005
Figura 13 – Porcentual de respostas (de ambos os sexos) que não gostam do
conteúdo ou o detestam
Figura 14 – Porcentual de respostas dos meninos que não gostam do conteúdo
ou o detestam
Figura 15 – Porcentual de respostas das meninas que não gostam do conteúdo
ou o detestam
Figura 16 – Indústria de alta tecnologia I
Figura 17 – Licenciamento de veículos novos no Brasil – 2002/2008
Figura 18 – Licenciamento de veículos novos importados no Brasil – 2002/2008
Figura 19 – Gráfico venda de televisores
Figura 20 – Gráfico escola de idiomas
Figura 21 – Gráfico de altura dos alunos da Faculdade Livre
Figura 22 – Distribuição simétrica
Figura 23 – Curva assimétrica positiva
Figura 24 – Curva assimétrica negativa
Figura 25 – Curva mesocúrtica
Figura 26 – Curva platicúrtica
Lista de ilustrações
Figura 27 – Curva leptocúrtica
Figura 28 – Como os comerciais influenciam as vendas
Figura 29 – Renda bruta mensal familiar e % de gasto com saúde
Figura 30 – Avaliação física e tempo de resolução de um teste de matemática
Figura 31 – Espaço amostral
Figura 32 – Probabilidade de casos favoráveis
Figura 33 – Representação do complementar de A
Figura 34 – Espaço amostral no lançamento de um dado
Figura 35 – Variável aleatória
Figura 36 – Função de probabilidade
Figura 37 – Distribuição normal
Figura 38 – Correlação positiva
Figura 39 – Correlação perfeita positiva
Figura 40 – Correlação negativa
Figura 41 – Correlação perfeita negativa
Figura 42 – Correlação nula
Figura 43 – Gráfico de dispersão
Figura 44 – Gráfico de dispersão: renda familiar e número de filhos
Figura 45 – Gráfico de dispersão (modelo ajustado)
Figura 46 – Gráfico unidades vendidas e preço por unidade
Figura 47 – Reta de regressão e resíduos – modelo ajustado
Figura 48 – Representação gráfica dos desvios
Figura 49 – Unidades vendidas e preço por unidade
Figura 50 – Venda de veículos 1.0 em função do preço
Capítulo 1
Noções gerais de estatística
Estatística e suas aplicações
População e amostra estatística descritiva
e indutiva
Distribuição de frequências
Aplicações da estatística
Estatística e suas aplicações
Conteúdo programático
Estatística: aplicações e conceitos
Variável
Universo, população, amostra e amostragem
Rol e classes
Frequência absoluta e frequência relativa
Representação gráfica
Gráfico de segmentos ou gráfico de linhas
Gráfico de barras
Gráfico de setores(ou, popularmente, gráfico “pizza”)
Histograma
Objetivos
Entender a importância da estatística na atualidade.
Conhecer os principais conceitos da estatística.
Analisar as informações expressas graficamente, assim como identificar
os diversos tipos de gráficos.
16
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Estatística: aplicaçõEs E concEitos
A estatística é tão antiga quanto o primeiro
ser humano, pois a necessidade de contar surgiu
com ele. A vontade de saber é uma das tendências
congênitas ao ser humano, o qual, vendo cons-
tantemente, ao redor de si, acontecimentos cuja
grandeza e causa desconhece, experimenta um
sentimento de admiração e, em seguida, de curio-
sidade.
Nascida como simples compilação de núme-
ros, a estatística tem evoluído até nossos dias
como um poderoso instrumento destinado a pes-
quisar as ligações de causalidade entre os fenô-
menos.
Quando procuramos um conceito para estatística, imediatamente associamos esse termo com pesqui-
sa. Entretanto, é possível dizer algo mais: trata-se de uma ciência de grande aplicabilidade nas diversas
áreas do conhecimento. A estatística captura informações da coletividade e utiliza variados métodos e
procedimentos quantitativos para avaliar, analisar, medir acontecimentos e fazer projeções sobre eles.
A esse respeito, leia um trecho do artigo “Estatística: a Tecnologia da Ciência”, escrito por Basílio de
Bragança Pereira (1997) e publicado no Boletim da Associação Brasileira de Estatística:
A pesquisa científica é um processo interativo de acumulação de conhecimento e
envolve a formulação de hipóteses, modelos e teorias, a observação de fenômenos
e a verificação e rejeição de hipóteses sobre os mesmos. A estatística procura tor-
nar esse processo o mais eficiente possível, através de suas técnicas de coletas de
dados (amostragem e planejamento de experimentos); da apresentação de dados
(análise exploratória e descrição: gráficos e tabelas); da modelagem (probabilidade
e processos estocásticos); da análise indutiva (inferência: testes de estimação) e
da verificação (ajustamento, previsão e controle).
Muito além do trabalho de coletar e armazenar dados, a estatística envolve experimentação e análise
dos dados observados. Por meio dela, obtemos uma avaliação quantitativa dos fenômenos estudados,
por isso a sua importância na pesquisa científica. Em casos de discordância entre as consequências e os
dados, ocorre modificação das hipóteses e o consequente ganho de conhecimento. A estatística permite ao
cientista, portanto, verificar se sua teoria “modela” a realidade de acordo com os fatos observados.
Basicamente, dizemos que estatística é uma ciência que possibilita organizar a geração de dados e
transformá-los em informação necessária para estudos científicos e tecnológicos das mais variadas áreas.
É, ainda, ferramenta fundamental para as instituições governamentais traçarem planos sociais e econômi-
cos e projetarem metas. Técnicas estatísticas permitem prever dados como tamanho da população e taxa
de desemprego, o que possibilita formular planos para obter progresso e melhoria na qualidade de vida da
população. A grande quantidade de dados e de indicadores socioeconômicos e demográficos coletados pe-
los institutos de pesquisa (públicos e privados), aliada ao grau de sofisticação a que chegaram as técnicas
estatísticas, possibilitam tomadas de decisão cada vez mais precisas.
As técnicas estatísticas, quando usadas na indústria, auxiliam a preservar a qualidade dos produtos e a
aumentar a produção. É um recurso “barato”, pois não exige grandes investimentos e proporciona grandes
Estatística Aplicada à Gestão – Capítulo 1
17
Estatística Aplicada à Gestão – Capítulo 1
resultados. Há quem diga que o controle estatístico de qualidade foi uma das grandes invenções tecnoló-
gicas do século XX.
Conheça algumas aplicações da estatística em diversos setores da sociedade.
Perceba, portanto, que a estatística é ferramenta essencial nas mais diversas atividades humanas,
podendo melhorar a eficiência de qualquer planejamento pela análise de dados.
Dessa forma, a estatística “é uma parte da matemática aplicada que fornece métodos para a coleta,
organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de
decisões” (CRESPO, 2002).
A coleta, a organização e a descrição dos dados estão a cargo da estatística descritiva, enquanto
a análise e a interpretação desses dados ficam a cargo da estatística indutiva ou inferencial.
Variável
Variável pode ser definida como cada um dos diferentes objetos estudados, os quais permitem realizar
a análise desejada.
As indústrias utilizam pesquisas entre os consumidores para identificar a demanda de novos
produtos e para prever a sua aceitação.
As estimativas feitas pela estatística são largamente utilizadas no mercado financeiro, a fim de contri-
buir com o desenvolvimento de estratégias de investimentos que potencializem os lucros. Essas es-
timativas são também exploradas no comércio para o melhor planejamento da produção em função
da demanda, assim como para instituir técnicas administrativas que garantam mais lucro.
A medicina utiliza a estatística nas análises de drogas, tendo em vista que as informações
obtidas por meio de testes e pesquisas ampliam diagnósticos.
Órgãos da Justiça usam dados estatísticos, muitas vezes apresentados através da teoria de
probabilidade, a fim de elucidar alguns casos.
Na administração, as pesquisas estatísticas indicam problemas de gerenciamento e propõem
possíveis soluções.
Nos esportes, as pesquisas de desempenho dos atletas ou das equipes em uma partida inter-
ferem no planejamento dos treinos.
Emissoras de TV e rádio reorganizam sua programação considerando pesquisas que mostram
a preferência dos telespectadores ou ouvintes.
As pesquisas eleitorais fornecem dados para que os candidatos direcionem suas campanhas e
para que os cidadãos possam votar mais adequadamente.
Em relação à gestão empresarial, salientamos, ainda, que a estatística voltada ao controle de
qualidade vem ganhando cada vez mais espaço na atualidade, visto que são evidentes as mu-
danças no sistema de produção, como: soluções na redução de custos e/ou de desperdícios,
na uniformização e na normalização da produção, auxiliando as empresas a racionalizar e ma-
ximizar os seus recursos, tornando-as mais competitivas e sólidas. Um conjunto de ferramentas
essencial no controle de qualidade é o CEP (Controle Estatístico de Processo), que utiliza a
metodologia estatística para fazer com que o processo de uma empresa possa ser visualizado,
avaliado e melhorado. O gráfico de controle é a ferramenta mais importante nesse processo, já
que aponta o monitoramento da produção, tendo em vista o seu controle.
18
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Algumas variáveis apresentam como resultado uma qualidade, um atributo ou uma preferência da
pessoa entrevistada. São as chamadas variáveis qualitativas, como: sexo, cor do cabelo, esporte favorito
ou grau de instrução.
As variáveis qualitativas podem ser ordinais ou nominais.
Ordinais – Existe uma ordem nos seus valores. Por exemplo: grau de instrução (Fundamental,
Médio, Superior).
Nominais – Não existe ordem nos valores. Por exemplo: esporte favorito.
Quando as variáveis de uma pesquisa são, por exemplo, altura, peso, idade, número de irmãos, dize-
mos que elas são quantitativas, pois seus resultados são números.
As variáveis quantitativas podem ser discretas ou contínuas.
Discretas – Quando se trata de contagem (números inteiros), como número de irmãos.
Contínuas – Quando se trata de medida (números reais), como altura.
Universo, população, amostra e amostragem
Universo da pesquisa étudo aquilo que pode ser mensurado ou que é possível adquirir dados para
futuras conclusões, como a totalidade de pessoas, animais, plantas ou objetos.
População é o conjunto de todos os objetos que possam oferecer dados referentes ao estudo em
questão. Já a amostra é qualquer subconjunto da população. Em uma amostra, observamos somente uma
fração representativa do todo, da qual tiramos conclusões a respeito do todo.
A amostragem, por sua vez, é o processo de obtenção da amostra. É preferível uma amostra a uma
contagem completa pelas seguintes razões:
Praticidade
Rapidez
Precisão
Custo
A escolha aleatória é o melhor método em uma amostra, pois qualquer um dos dados tem a mesma
chance de ser escolhido.
Universo de pesquisa:
estudantes do Brasil
População: estudantes
da Bahia
Amostra: estudantes da
Escola Bom Estudo
Estatística Aplicada à Gestão – Capítulo 1
19
Estatística Aplicada à Gestão – Capítulo 1
rol e classes
Rol é a sequência ordenada dos dados numéricos coletados, seja em ordem crescente (mais comum)
ou decrescente.
Classe é um intervalo real que contenha um rol da amostra. Por exemplo: em uma amostra de pacotes
de farinha, foram constatadas as seguintes massas em gramas: 980; 990; 1000; 960; 980; 1000; 1010; 950;
970; 940; 1020; 1010; 920; 990; 950; 900; 1000; 950; 970; 1010. Podemos separar os elementos dessa
amostra em rols, conforme exemplo:
900; 920I.
940II.
950; 950; 950III.
960; 970; 970; 980; 980IV.
990; 990; 1000; 1000; 1000V.
1010; 1010; 1010; 1020VI.
Formamos as seguintes classes com os elementos dessa amostra, conforme exemplo:
O intervalo [900,940[ contém o rol I
O intervalo [940,950[ contém o rol II
O intervalo [950,960[ contém o rol III
O intervalo [960,990[ contém o rol IV
O intervalo [990,1010[ contém o rol V
O intervalo [1010,1020] contém o rol VI
Os principais intervalos são:
iNTErVALOs POssÍVEis rEPrEsENTAçõEs siGNifiCAdO
x1 | x2
[ ; [
[ ; )
Inclui o extremo inferior (x1) e exclui o extremo
superior (x2).
x1 | x2
] ; ]
( ; ]
Exclui o extremo inferior (x1) e inclui extremo
superior (x2).
x1 x2
] ; [
( ; )
Exclui o extremo inferior (x1) e exclui o extremo
superior (x2).
x1 | | x2 [ ; ] Inclui o extremo inferior (x1) e inclui o extremo superior (x2).
A diferença entre o maior e o menor elemento de uma classe, nessa ordem, é chamada de amplitude
da classe. Dessa forma:
frequência absoluta e frequência relativa
Supondo que, entre um grupo de estudantes, tenha sido feita uma pesquisa sobre a idade de cada um
e que o resultado tenha sido o seguinte: Pedro: 15 anos; Ana: 15 anos; Lucas: 14 anos; Antonio: 14 anos;
Vagner: 15 anos; Sílvia: 15 anos; Bruno: 16 anos; Neli: 15 anos; Sueli: 15 anos; Mário: 14 anos.
O número de vezes que um valor da variável é citado representa a frequência absoluta daquele valor.
Nesse exemplo, a variável é “idade”, e a frequência absoluta de cada um de seus valores é: 15 anos: 6; 14
anos: 3; e 16 anos: 1.
Amplitude = Maior – Menor
20
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Existe também a frequência relativa, que registra a frequência absoluta em relação ao total de cita-
ções. Nesse exemplo, temos:
Frequência relativa da idade 15 anos: 6 em 10 ou 6
10
ou 3
5
ou 0,6 ou 60%.
Frequência relativa da idade 14 anos: 3 em 10 ou 3
10
ou 0,3 ou 30%.
Frequên cia relativa da idade 16 anos: 1 em 10 ou 1
10
ou 0,1 ou 10%.
A palavra “absoluta” significa que o resultado é numérico, já a palavra “relativa” significa que o resultado
é em porcentual.
representação gráfica
A representação gráfica apresenta a ideia de conjunto de forma mais eficaz e rápida que a observação
direta dos dados numéricos. Por isso, é largamente utilizada.
Gráfico de segmentos ou gráfico de linhas
Comecemos a explicação com um exemplo. Leia a tabela a seguir, que mostra a frota de veículos ca-
dastrados em Curitiba no primeiro semestre de 2009:
A situação apresentada no exemplo estabelece uma correspondência, que pode ser representada por
pares ordenados (janeiro, 1 101 123), (fevereiro, 1 104 151), etc. Usando eixos cartesianos, localizamos os
seis pares ordenados e construímos um gráfico de segmentos.
Fonte: Detran-PR.
MEsEs dO PriMEirO sEMEsTrE NúMErO dE AUTOMóVEis
Janeiro 1 101 123
Fevereiro 1 104 151
Março 1 107 713
Abril 1 111 013
Maio 1 116 018
Junho 1 121 897
Fonte: Os autores.
Figura 1 – Veículos cadastrados em Curitiba.
1 125 000
1 120 000
1 115 000
1 110 000
1 105 000
1 100 000
1 095 000
1 090 000 Janeiro Fevereiro Abril
Meses/2009
Ve
íc
ul
os
Março Maio Junho
Estatística Aplicada à Gestão – Capítulo 1
21
Estatística Aplicada à Gestão – Capítulo 1
Os gráficos de segmentos são utilizados principalmente para mostrar a evolução das frequências dos
valores de uma variável durante certo período.
A posição de cada segmento indica crescimento, decrescimento ou estabilidade. A inclinação dos seg-
mentos indica a intensidade do crescimento ou decrescimento.
Da leitura do gráfico anterior, concluímos que, entre os meses de janeiro a junho, os veículos cadastra-
dos em Curitiba aumentaram consideravelmente.
Gráfico de barras
Este tipo de gráfico apresenta os dados em forma de barras. Vamos a um exemplo. Com base nos
preços de cyber cafés em algumas cidades do mundo, elaboramos uma tabela comparativa para perceber
quanto custa ficar conectado à Internet por uma hora em diferentes cidades do mundo.
Com os dados da tabela, foi possível construir estes gráficos de barras verticais e horizontais:
Fonte: IEZZI, 2007.
CidAdE PrEçO (EM Us$)
Nova York 12,80
Paris 4,86
Montreal 4,38
Praga 3,81
Rio de Janeiro 3,71
Tóquio 3,41
Sydney 2,21
Londres 1,78
Moscou 1,50
Cidade do México 1,39
Jacarta 0,86
Lagos 0,77
Bagdá 0,68
Nova Déli 0,45
La Paz 0,38
Cidade
Fonte: Os autores.
Figura 2 – Os preços de cyber cafés no mundo I.
No
va
Yo
rk
Pa
ris
Mo
ntr
eal
Pra
ga
Rio
de
Ja
ne
iro
Tó
qui
o
Syd
ney
Lon
dre
s
Mo
sco
u
Cid
ade
do
Mé
xic
o
Jac
ar
ta
Lag
os
Ba
gdá
No
va
Dé
li
La
Pa
z
Pr
eç
o
(U
S$
)
14
12
10
8
6
4
2
0
22
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Gráfico de setores (ou, popularmente, gráfico “pizza”)
No gráfico “pizza”, o círculo é dividido em setores, com ângulos proporcionais às frequências das
classes. Exemplo: os candidatos A, B e C concorreram em uma eleição. Apurada a primeira urna, os votos
foram os seguintes: A, 50 votos; B, 80 votos; C, 60 votos; brancos e nulos (BN), 10 votos.
Observe a representação da situação em um quadro de frequências e, em seguida, em um gráfico de
setores:
Fonte: Os autores.
Figura 3 – Os preços de cyber cafés no mundo II.
Ci
da
de
Preço (US$)
La Paz
Nova Déli
Bagdá
Lagos
Jacarta
Cidade do México
Moscou
Londres
Sydney
Tóquio
Rio de Janeiro
Praga
Montreal
Paris
Nova York
0 2 4 6 8 10 12 14
CANdidATO fA fr
A 50 50200
=
1
4
= 25%
B 80 80200
=
2
5
= 40%
C 60 60200
=
3
10
= 30%
BN 10 10200
=
1
20
= 5%
B
40%
C
30%
A
25%
BN
5%
Fonte: Os autores.
Figura 4 – Gráfico de eleição.
Estatística Aplicada à Gestão – Capítulo 1
23
Estatística Aplicada à Gestão – Capítulo 1
Em cada gráfico de setores, o círculo todo indica o total (200 votos ou 100%), e cada setor indica os
votos relativos a cada candidato. Na construção do gráfico de setores, determinamos, por regra de três, o
ângulo correspondente a cada setor. Veja, como exemplo, a situação do candidato A.
Histograma
Quando uma variável tem seus valoresindicados por classes (intervalos), é comum a utilização de um
tipo de gráfico conhecido por histograma.
Considere a altura (em centímetros) dos alunos de uma sala de aula, agrupada em intervalos. Depois,
verifique os histogramas correspondentes às frequências absolutas e relativas.
50
200
= x
360
200x = 18 000 x = 90
o
o o® ®
ALTUrA (cm) fA fr
140 a 150 6 15%
151 a 160 10 25%
161 a 170 12 30%
171 a 180 8 20%
181 a 190 4 10%
Fonte: Os autores.
Histograma com as classes relacionadas às frequências absolutas:
140 a 150 151 a 160 161 a 170 171 a 180 181 a 190
Altura (cm)
FA
14
12
10
8
6
4
2
0
Fonte: Os autores.
Figura 5 – Histograma correspondente às frequências absolutas.
Histograma com as classes relacionadas às frequências relativas (porcentagem):
Altura (cm)
35%
30%
25%
20%
15%
10%
5%
0%
140 a 150 151 a 160 161 a 170 171 a 180 181 a 190
FR
(%
)
Fonte: Os autores.
Figura 6 – Histograma correspondente às frequências relativas.
24
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Entendendo a importância da estatística sem ser gênio,
matemático ou bruxo
Jornais, televisão, rádio, revistas e outros meios de comunicação nos
bombardeiam, diariamente, com notícias, baseadas em estatísticas,
como se fossem verdades absolutas. Nessa hora, provavelmente, você
sente a importância de ser capaz de avaliar corretamente o que lhe
dizem. Todavia, será que os números apresentados resultam de uma
análise estatística cuidadosa? O perigo está no fato de que, se não con-
segue distinguir as afirmações falsas das verdadeiras, então você está
vulnerável à manipulação por outras pessoas, cujas conclusões podem
conduzi-lo a decidir contra os interesses seus e, depois, arrepender-
-se. Por estas razões, conhecer estatística é um grande passo no sen-
tido de você tomar controle da sua vida (embora não seja, obviamente,
a única maneira necessária).
LOPES, Paulo Afonso. Entendendo a importância da estatística sem ser gênio,
matemático ou bruxo. Disponível em: <http://www.administradores.com.br/artigos/
entendendo_a_importancia_da_estatistica_sem_ser_genio_matematico_ou_bruxo/11591/>.
Acesso em: 24 ago. 2009.
fLOrENCE NiGHTiNGALE E Os GráfiCOs EsTATÍsTiCOs
É inegável a importância que os gráficos estatísticos adquiriram nos dias de hoje, nas mais varia-
das áreas do conhecimento, principalmente em virtude da existência de diversos aplicativos compu-
tacionais relativamente simples de serem operados. Isso se deve ao seu grande poder de concisão e
forte apelo visual.
Nos livros, revistas, jornais e relatórios, os gráficos são de fácil entendimento para a maior parte
das pessoas. Geralmente, são considerados até mais compreensíveis que as tabelas.
Além de serem utilizados como meio rápido e fácil de comunicação, os gráficos estatísticos tam-
bém são úteis na busca de padrões de comportamento em relações entre variáveis, na descoberta de
novos fenômenos, na aceitação ou rejeição de hipóteses, etc.
Florence Nightingale foi uma das pioneiras na utilização dos gráficos estatísticos. Nasceu em Villa
Colômbia, próximo de Florença, na Itália, em maio de 1820. Seus pais eram de origem britânica e es-
tavam viajando pela Europa quando ela nasceu.
Apresentou, desde cedo, uma forte inclinação para o estudo da matemática. Gostava de indicar
por números tudo que pudesse ser registrado, tal como distâncias, tempos de viagem, orçamentos,
etc. No entanto, Nightingale sofreu forte oposição dos pais, que, por fim, cederam aos anseios da
filha. Assim, ela conseguiu realizar seus sonhos de estudo e ainda preparou-se para exercer a en-
fermagem.
É frequentemente lembrada como uma das fundadoras da profissão de enfermeira e reformadora
dos sistemas de saúde. Atuou como enfermeira-chefe do exército britânico de 1854 a 1856, durante a
Guerra da Crimeia (Inglaterra, França e Turquia se uniram contra a Rússia por problemas territoriais),
na qual constatou que a falta de higiene e as doenças hospitalares matavam grande número de solda-
dos internados.
Leitura complementar
Estatística Aplicada à Gestão – Capítulo 1
25
Estatística Aplicada à Gestão – Capítulo 1
Conseguiu, com suas reformas, reduzir significativamente a taxa de mortalidade no hospital onde
atuou. Famosa pelo seu talento profissional, passou a trabalhar ativamente pela reforma dos sistemas
de saúde e pelo desenvolvimento da enfermagem. Em 1860, publicou seu livro mais importante, Notas
sobre enfermagem, no qual enfatizou os modernos princípios da enfermagem.
Florence Nightingale utilizou-se dos dados estatísticos, quer em forma de tabelas, quer em forma
de gráficos, como ferramenta para suas atividades de reforma da área da saúde. A base para a utili-
zação do ferramental estatístico ela já possuía, em virtude do conhecimento prévio de matemática e
da habilidade para trabalhar com os números, além do conhecimento dos aspectos médicos ligados à
sua atividade.
Ela utilizou os gráficos estatísticos (gráficos de frequência, frequências acumuladas, histogramas
e outros) com a finalidade de expressar suas ideias para membros do exército e do governo. Seus
gráficos foram tão criativos que se constituíram em um marco de desenvolvimento da estatística. Seu
trabalho foi tão importante que, em 1858, ela foi a primeira mulher eleita membro da Associação Ingle-
sa de Estatística.
Durante a Guerra Civil Americana, Nightingale foi conselheira de saúde nos Estados Unidos, na
área militar. Também trabalhou como conselheira de saúde do governo britânico no Canadá.
Em 1883, recebeu uma condecoração (Cruz Vermelha Real) da rainha Vitória por seus relevantes
serviços prestados à saúde.
Em 1907, foi a primeira mulher a receber das mãos do rei Eduardo VII a Ordem do Mérito. Faleceu
em Londres, em agosto de 1910, aos 90 anos.
IEZZI, Gelson et al. Matemática: ciência e aplicações. 2. ed. São Paulo: Atual, 2004.
Você estudou:
A estatística está intimamente ligada com a vida das pessoas e, atualmente, é essencial nas mais va-
riadas áreas do conhecimento: ciência, política, economia e saúde.
Para apropriar-se dessa ciência, é fundamental conhecer alguns conceitos básicos: variável, população,
amostra, amostragem, rol, classes, distribuição de frequências.
A utilização de gráficos é muito comum na estatística. Eles podem ser de linhas, de barras (horizontais
ou verticais) e de setores (“pizza”).
síntese
DANTE, Luiz Roberto. Matemática. 1. ed. São Paulo: Ática, 2009.
DETRAN. Disponível em: <http://www.detran.pr.gov.br/modules/conteudo/conteudo.php?conteudo=286>. Acesso em:
28 ago. 2009.
IEZZI, Gelson et al. Matemática: ciência e aplicações. 2. ed. São Paulo: Atual, 2004.
PAIVA, Manoel Rodrigues. Matemática. 1. ed. São Paulo: Moderna, 1999.
PEREIRA, Basílio de Bragança. Estatística: a tecnologia da ciência. Boletim da Associação Brasileira de Estatística,
São Paulo, ano XIII, n. 37, 2. quadrim. 1997.
RUSSO, Suzana. Curso de estatística II. Santo Ângelo: URI, 1999.
referências
26
Anotações
População e amostra estatística
descritiva e indutiva
Conteúdo programático
População
Amostra
Estatística descritiva e estatística indutiva
Fases do método estatístico (estatítica descritiva)
Definição do problema
Delimitação do problema
Planejamento para obtenção dos dados
Coleta dos dados
Apuração dos dados
Apresentação dos dados
Análise dos dados
Interpretação dos dados
Objetivos
Entender os conceitos de “população” e “amostra”.
Diferenciar estatística descritiva de indutiva.
28
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
população
Em estatística, a população é definida como um conjunto de dados que serão estudados dentro de uma
pesquisa. Nesse conceito, há duas divisões:população finita e infinita.
Uma população finita é aquela em que se conhece o número total de elementos. Exemplo: uma classe
de determinado cursinho preparatório para o vestibular tem cem alunos. Portanto, sendo possível precisar
o número total, a população é finita. Outro exemplo comum são as eleições do nosso município, estado ou
país, em que se tem número finito de eleitores em cada seção ou zona eleitoral, totalizando com precisão
a quantidade de votos para cada candidato.
Já a população infinita é quando não existem condições de precisar o número finito dos elementos
que a compõem. Exemplo: numa determinada flor existe um número finito de pétalas, mas não se sabe a
quantidade dessa flor que desabrocha no nosso estado, portanto, a população de pétalas da mesma espé-
cie de flor é infinita. Dessa forma, só é possível estimar a média de pétalas por flor, então, esta população
é considerada infinita.
Outro importante conceito é o de universo da pesquisa, que é tudo aquilo que pode ser mensurado ou
de que é possível adquirir dados para futuras conclusões, como a totalidade de pessoas, animais, plantas
ou objetos.
amostra
É uma parte da população ou do universo. Quando o número a ser estudado é muito grande, e é difícil
(ou quase impossível) a observação ou a contagem de determinada característica de todos os seus ele-
mentos, é utilizada a amostra.
Retomando o exemplo das flores, seria impossível fazermos uma contagem total
de todas as flores que nascem no estado, cujo total de pétalas constitui a população
ou universo, estatisticamente falando. Nesse caso, es-
colhemos uma parcela das flores, a qual chamamos
de amostra da população ou universo. Na sequência,
fazemos a contagem das
pétalas das flores. Supon-
do que o trabalho seja re-
alizado com uma amostra
finita de 50 flores, obtemos
a média de pétalas por flor
dividindo o total de pétalas
por cinquenta. Assim, po-
demos ter ideia do número
de pétalas dessa flor em
todo estado.
Outro exemplo: um
carregamento de 20 tone-
ladas de açúcar, em unida-
des de 1 kg, estava sendo
Caminhão na central de distribuição para descarregar a mercadoria, ou seja, a
população.
Sh
ut
te
rs
to
ck
/A
nt
on
F
o
lti
n
Pacote de açúcar que foi repesa-
do para verificação da quantida-
de existente, ou seja, a amostra.
Ay
m
ar
á
In
te
le
ct
o/
Ro
ni
so
n
Ha
id
uc
ki
Estatística Aplicada à Gestão – Capítulo 1
29
Estatística Aplicada à Gestão – Capítulo 1
Estatística dEscritiva E
Estatística indutiva
A estatística descritiva ou dedutiva tem por objetivo descrever e analisar determinada população
sem tirar conclusões de caráter genérico. É a parte da estatística referente à coleta e à tabulação dos dados
(MARTINS & DONAIRE, 1979).
É comum o estatístico se deparar com a situação de dispor de muitos dados, o que torna difícil absor-
ver completamente a informação que está investigando. É extremamente complicado captar intuitivamente
todas as informações que os dados contêm. Então, as informações devem ser reduzidas até o ponto em
que se possa interpretá-las de forma clara.
A estatística descritiva é um número que, sozinho, descreve uma característica de um conjunto de
dados, ou seja, é um número-resumo que possibilita reduzir os dados a proporções mais facilmente inter-
pretáveis. Por exemplo, suponha que o dono de um restaurante que gerencia todas as vendas feitas dos
principais pratos à la carte observou as seguintes quantidades diárias vendidas de um determinado prato
durante uma semana: 75, 59, 63, 72, 45, 56, 49. Em função desses dados, ele terá a média desse prato
vendido por semana e a quantidade de ingredientes necessários, podendo tomar precauções para a próxi-
ma semana (TOLEDO & OVALLE, 1995).
A tabela seguinte diz respeito ao número de alunos matriculados na
disciplina de Matemática II do curso de Administração da Faculdade
Provinciana.
ANO NúMErO dE ALUNOs
2002
2003
2004
2005
2006
2007
2008
2009
60
100
90
90
110
105
85
50
Fonte: Os autores.
descarregado numa central de logística de um supermercado. Foram feitos testes de pesagem em alguns
pacotes, para ter uma garantia da veracidade dos quilogramas que constam nos pacotes. Na amostra
foram constatados os seguintes volumes, expressos em gramas: 980, 990, 1000, 970, 980, 1000, 1010,
950, 970, 940, 1020, 1010, 920, 990, 950, 900, 1000, 950, 970, 1010. Observamos, por essas amostras,
que as quantidades em quilogramas em cada pacote não são confiáveis. Portanto, não é preciso fazer a
pesagem de toda a carga para reclamar junto ao fornecedor. Seria o caso, inclusive, de devolução de toda
a mercadoria.
30
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Observe, na tabela abaixo, os veículos implantados por tipo no estado
do Ceará até maio (2008-2009). A coluna VAR apresenta a diferença de
2009 em relação a 2008, em %, dos veículos implantados no estado.
TiPO 2008 2009 VAr (%)
Automóvel 17 632 18 206 3,26
Camioneta 1 045 969 –7,27
Caminhonete 2 052 2 332 13,65
Motocicleta 27 174 29 842 9,82
Micro-ônibus 163 196 20,25
Ônibus 225 242 7,56
Caminhão 712 719 0,98
Reboque 541 679 25,51
Semirreboque 155 166 7,10
Motoneta 3 433 3 717 8,27
Outros (*) 855 1 173 37,19
Total 53 987 58 241 7,88
FONTE: Detran/CE, 2009.
(*) Inclui: ciclomotor, triciclo, caminhão trator, trator de rodas, trator de
esteiras, trator misto, quadriciclo, motor home, sidecar, utilitário.
A estatística indutiva ou inferência estatística é a parte da estatística que, baseada em resultados ob-
tidos na análise de uma amostra da população, procura inferir, induzir ou estimar as leis de comportamento
da população da qual a amostra foi tirada. Diz respeito a um processo de generalização que parte de resulta-
dos particulares. É, portanto, a parte da estatística referente às conclusões sobre as fontes de dados.
Observe este exemplo:
Deseja-se conhecer o grau de umidade na soja que será recebida por uma indústria de óleo. Como
não é possível verificar esse grau de umidade em toda a população da soja, é escolhida uma parte dessa
população como amostra e são realizados os testes necessários. Supõe-se que o resultado obtido nesse
teste seja válido para toda a população em questão.
Esse processo de generalização, característico do método indutivo, está associado a uma margem de
incerteza. Essa se deve ao fato de que a conclusão, obtida para toda a população analisada, baseia-se em
uma amostra do total de observações. A medida da incerteza é tratada mediante técnicas e métodos que
se fundamentam na Teoria das Probabilidades.
Na sequência, você vai estudar a Teoria das Probabilidades. O que po-
demos adiantar é que a probabilidade e a estatística estão relaciona-
das. Na estatística, não se sabe como um processo funciona, mas, por
meio das observações e dos resultados obtidos, pode-se conhecer a
sua natureza; na probabilidade, conhece-se o processo, sabe-se como
funciona e pode-se ter noção antecipada dos futuros resultados.
INFERÊNCIA ESTATÍSTICA é o fato de admitir que os resultados obtidos na análise dos
dados de uma amostra são válidos para toda a população da qual aquela amostra foi retirada. Consiste
em obter e generalizar conclusões.
Em resumo:
Estatística Aplicada à Gestão – Capítulo 1
31
Estatística Aplicada à Gestão – Capítulo 1
FasEs do método Estatístico
(Estatística dEscritiva)
Quando pretendemos realizar um estudo estatístico completo em determinada população ou em deter-
minada amostra, o trabalho a ser realizado passa por várias fases, que devem ser desenvolvidas até chegar
aos resultados finais procurados.
As principais fases são:
Definição do problemaa)
Delimitação do problemab)
Planejamento para obtenção dos dadosc)
Coleta dos dadosd)
Apuraçãodos dadose)
Apresentação dos dadosf)
Análise dos dadosg)
Interpretação dh) os dados
definição do problema
Nessa fase, é preciso definir claramente o que pretendemos pesquisar, o objeto de estudo e o objetivo
a ser alcançado pela pesquisa.
delimitação do problema
A pesquisa deve ser delimitada: saber com clareza onde será realizada, com que tipo de pessoas (ou
coisas), em que dias (e horários) e assim por diante.
Planejamento para obtenção dos dados
É o momento de fazermos o planejamento, ou seja, de estabelecermos as regras de como proceder
para resolver o problema. Trata-se da fase de normatizar a pesquisa, respondendo à pergunta: Que dados
serão necessários e como obtê-los?
Quando a observação não for suficiente, precisamos elaborar um questionário ou um roteiro de entre-
vista. Para esse tipo de trabalho, é necessária a colaboração de pessoas contratadas para a distribuição
dos questionários ou para elaboração das entrevistas. Aqui reside a maior preocupação do estatístico (ou
pesquisador). Que tipo de pessoas deverão ser contratadas? Que tipo de treinamento deverão receber?
Ainda nessa fase, deve estar bem claro:
o cronograma das atividades;
o tamanho da população ou da amostra a ser pesquisada;
o quanto se pretende gastar para realizar a pesquisa.
Coleta dos dados
É provavelmente a fase mais importante da pesquisa. Consiste em obtermos os dados propriamente
ditos, seja pela observação ou mediante a utilização da ferramenta definida no planejamento (questionário
ou roteiro de entrevista).
32
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Apuração dos dados
Esta etapa consiste em resumir os dados por meio de sua contagem, da separação por tipo de resposta
e do agrupamento de dados semelhantes. É a fase de tabulação dos dados, em que fazemos a seleção crí-
tica das informações coletadas, descartando dados que foram fornecidos de forma errônea (questionários
mal respondidos, por exemplo, não deverão ser levados em consideração).
Apresentação dos dados
Depois de apurados, os dados podem ser apresentados em forma de tabelas ou gráficos. Uma tabela
consiste em distribuir os dados dispostos em linhas e colunas, ordenadamente, exibindo, num único local,
todos os resultados obtidos na pesquisa. Isso facilita a análise e a interpretação desses resultados. Para
que o resultado fique ainda mais claro, podemos transformar os dados tabulados em gráficos.
Análise dos dados
Esta é a fase crítica do processo; devemos tirar conclusões que auxiliem na solução do problema que
nos levou a executar a pesquisa. A análise dos dados está relacionada ao cálculo de medidas, ou seja, às
médias, moda ou mediana que permitem descrever, com detalhes, o fenômeno sob análise.
interpretação dos dados
Na interpretação dos dados analisados, devemos ter disponíveis todas as informações relativas à pes-
quisa realizada, tais como: dados tabulados, gráficos e cálculos das medidas estatísticas. De posse dos
dados, é possível fazermos algumas generalizações, que são acompanhadas de um grau de incerteza, pois
não podemos garantir, cem por cento, que os resultados obtidos numa amostra sejam totalmente verdadei-
ros para toda a população à qual aquela amostra pertence.
Estes exemplos evidenciam a diferença entre estatística dedutiva e in-
dutiva.
Um lote de 100 aparelhos de televisão é considerado em bom es-1.
tado para venda se, quando testados, 10 deles não apresentarem
deficiências. Esse é um exemplo de inferência estatística. Com base
na teoria da inferência estatística, acredita-se que se 10 televisores
selecionados ao acaso estiverem bons, então o mesmo deve aconte-
cer com o restante.
Para conhecer a estatura média da mulher brasileira, adota-se o crité-2.
rio de pesquisa aleatória, que, neste caso, foi realizado num shopping
center da capital baiana, obtendo os seguintes dados (fictícios):
1,59 1,60 1,65 1,72 1,58
1,50 1,48 1,62 1,65 1,65
1,70 1,58 1,45 1,63 1,65
1,68 1,50 1,43 1,49 1,56
Fonte: Os autores.
Com base nessas estaturas e por meio da inferência estatística, pode-
-se definir a estatura média da mulher brasileira.
Estatística Aplicada à Gestão – Capítulo 1
33
Estatística Aplicada à Gestão – Capítulo 1
100% dE CHANCE dE sUCEssO
Da medicina à segurança pública, não há área que prescinda de análises de números, gráficos e
tabelas, o que cria um grande mercado de trabalho
Há quase três anos, para decidir se queria mesmo fazer Estatística, curso que só conheceu quan-
do estava no pré-vestibular, Talita Fernanda Dias, 20 anos, foi procurar informação no lugar mais óbvio,
mas nem por isso muito procurado pelos estudantes. Junto com duas colegas, ela passou algumas
horas no Instituto de Ciências Exatas (Icex) da UFMG, conversando com a coordenadora do colegiado
de curso. “Naquele dia, não tive mais dúvidas”, lembra.
Entretanto, as precauções não livraram Talita de alguns sustos. Ela diz que ficou um pouco de-
cepcionada, no início, porque não esperava que o curso fosse “tão difícil” e que ela tivesse que perder
muitas horas de sono estudando. “E nem se fala quando tenho prova. Aí é que tudo aperta mesmo”,
afirma. Nem mesmo as dificuldades a desestimularam e, no 1.o período, Talita já se colocou atrás de
oportunidades de estágio. “Eu queria ver tudo rapidamente”, recorda.
Talita teve, porém, que esperar algum tempo, até que, no 4.o período, se tornou estagiária da Co-
missão Permanente do Vestibular (Copeve). Ela trabalha com os dados de questionários que são res-
pondidos pelos alunos que prestam o vestibular na UFMG. A partir das informações contidas nos
questionários, professores da Universidade traçam o perfil do vestibulando da UFMG. “Foi aí que fiquei
mais apaixonada pelo curso”, diz, lembrando que são poucos os alunos que resistem aos inúmeros
estágios que são oferecidos na Universidade e fora dela.
Francisco Oliveira Júnior, 21 anos, é também a prova de uma máxima do curso: “só não atua na
área quem não quer”. Apesar de estar apenas no 3.o período, ele atua na Comissão de Controle de
Infecção Hospitalar do Hospital da Clínicas da UFMG. “Fazemos relatórios periódicos, que são ana-
lisados por duas epidemiologistas que controlam os índices de ocorrência de doenças no hospital”,
conta. Vi logo de cara que seria um profissional valorizado, porque o estatístico tem muitas opções e eu
aproveito tudo que posso”, afirma. Além desse estágio, ele se envolveu com a iniciação científica.
Leitura complementar
3. Uma fábrica de cosméticos tem, em seu cadastro, 10 000 clientes e
fez uma pesquisa sobre a preferência pelos produtos A, B e C para
lançamento da linha feminina. Foram consultadas 510 clientes. Com
base nessa amostra, a empresa acredita ter informações suficientes
para determinar qual produto poderá ser lançado no mercado no pró-
ximo semestre.
4. “Os 150 empregados de uma determinada fábrica ganham, em mé-
dia, R$ 1.000,00 por mês”. Neste caso, temos um problema de esta-
tística descritiva, visto que a informação foi feita com base nos dados
relativos ao salário de todos os empregados da empresa.
4. Na capital paranaense, o número total de veículos registrados no
Detran até junho de 2009 é de 1 121 897; desses, 804 241 são veí-
culos de passeio (automóvel). Temos aqui outra aplicação prática da
estatística descritiva, com as informações totais de veículos automo-
tores de Curitiba.
6. Um aluno do Ensino Médio apresentou, durante o ano letivo de 2008,
as seguintes médias bimestrais em Matemática: 6,5; 6,0; 8,5; 9,0.
Com esses dados podemos concluir que a média anual do aluno foi
de 7,5.
34
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Ela Mercedes, coordenadora do colegiado do curso, assinala que, se por um lado, o assédio aos
estudantes pelo mercado de trabalho éalgo positivo – porque demonstra que eles têm uma formação
muito boa –, por outro lado, os estudantes tendem a se entregar aos estágios precocemente e correm o
risco de prejudicar os estudos. “É bom lembrar que utilizar bem as diversas metodologias e ferramentas
da Estatística não é algo muito simples. É como comprar uma blusa e escolher a melhor forma de usá-
la. Tem sempre um modelo que se adapta melhor a cada pessoa.”
Segundo Ela, o curso de Estatística é visto como difícil porque sua base teórica é muito densa. “Os
alunos estranham por causa da matemática, mas não temos como fugir dela. O candidato que não gos-
tar de números não tem jeito, porque estes são a base do nosso trabalho. Além disso, é melhor que eles
conheçam um pouco de computação, já que a principal ferramenta da estatística é o computador”.
O curso de Estatística está flexibilizado e oferece formação complementar em Economia, Biologia,
Ciências Sociais e Industrial. As opções são reflexo da grande interdisciplinaridade desta ciência. Talita
Dias, entretanto, vai optar em fazer o curso apenas em Estatística. Essa alternativa, explica a coordena-
dora, atende melhor ao aluno que pretende fazer pós-graduação na própria área. Mas é muito comum
os profissionais escolherem outras ciências para continuar os estudos, por causa da associação da
estatística com outras áreas de conhecimento.
suporte técnico
“Não existe pesquisa quantitativa que não utilize a estatística”, exemplifica Ela Mercedes. “O mun-
do todo está muito competitivo. Então, todas as áreas, todas as indústrias, precisam fazer pesquisas. E
todas as pesquisas fazem coletas de dados e, onde há dados, há trabalho para o estatístico organizá-
los, analisá-los e apresentá-los”, completa a coordenadora.
A engenheira de Minas Jacqueline Tibúrcio foi buscar na estatística o suporte para melhor atuar
na sua área. “Mas se hoje me oferecerem um emprego na Engenharia, eu não quero”, avisa. “Quando
entrei na Estatística, deparei-me com um curso excelente. Formei-me em 2001, fiz mestrado e não saí
mais da área”, conta.
Jacqueline trabalha atualmente como consultora na Superintendência de Epidemiologia, na Secre-
taria de Estado da Saúde. “A estatística é uma ferramenta imprescindível nessa área, porque ajuda a
estabelecer o perfil das doenças, a distribuição delas por áreas e os fatores determinantes. São infor-
mações básicas que subsidiam políticas públicas de saúde”, explica.
A professora Mayra Alves Stradioto, 27 anos, optou por Estatística folheando um manual do ves-
tibular. “Como gostava muito de gráficos, tabelas e números, achei que daria certo”, lembra. A aposta
na UFMG foi acertada.
Depois do mestrado, Mayra decidiu que se dedicaria ao ensino: “Descobri que gostava de dar aula,
apesar de sempre ter alimentado a ideia de trabalhar numa multinacional e ganhar muito dinheiro”.
UFMG DIVERSA. Disponível em: <http://www.ufmg.br/diversa/7/estatistica.htm>.
Acesso em: 7 ago. 2009.
Para obter mais informações a respeito do assunto abordado neste ca-
pítulo, recomendados que você acesse o site http://www.cultura.ufpa.
br/dicas/biome/bioconba.htm. Nele, você encontra os conceitos bási-
cos da área de estatística apresentados de forma clara. Vale a pena
consultá-lo.
Estatística Aplicada à Gestão – Capítulo 1
35
Estatística Aplicada à Gestão – Capítulo 1
Você estudou:
População é o conjunto total ou de parte de elementos que se deseja observar para obter determinada
informação.
Amostra é uma parte ou um subconjunto dos elementos que foram retirados da população ou universo
observado, para futuramente obter determinada informação.
Estatística descritiva é a fase em que se procura descrever e estudar uma determinada amostra.
Estatística indutiva (inferência estatística) é a fase em que se procura tirar as conclusões sobre a popu-
lação que está sendo estudada.
síntese
CASTANHEIRA, Nelson Pereira. Estatística aplicada a todos os níveis. 2. ed. Curitiba: Ibpex, 2005.
DANTE, Luiz Roberto. Matemática: contexto e aplicações. São Paulo: Ática, 2001.
DETRAN/CE. Disponível em: <http://www.detran.ce.gov.br/site/arquivos/estatisticas/Veículos/2009>. Acesso em: 9 set.
2009.
MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1979.
PAIVA, Manoel Rodrigues. Matemática. São Paulo: Moderna, 1999.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. Atlas: São Paulo, 1995.
UFMG DIVERSA. Disponível em: <http://www.ufmg.br/diversa/7/estatistica.htm>. Acesso em: 7 ago. 2009.
referências
Anotações
36
distribuição de frequências
Conteúdo programático
Distribuição de frequências
Frequência absoluta e frequência relativa
Variável
Tabelas de frequência
Objetivos
Trabalhar dados estatísticos por meio das tabelas de frequências.
Construir gráficos e interpretá-los.
38
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Quando há a intenção de se fazer uma pesquisa, é preciso, em primeiro lugar, dimensionar uma amostra
da população. Depois, os dados são coletados, levando em conta o tempo e o custo da pesquisa. Então,
é preciso organizar os dados em tabelas ou gráficos, associando o conjunto de informações a medidas
de tendência central e a medidas de variabilidade. Finalmente, os dados são analisados e interpretados
utilizando métodos e técnicas que serão demonstrados mais adiante.
É esse o trabalho da estatística. As etapas mencionadas se referem às técnicas de amostragem, à
estatística descritiva e, finalmente, à inferência estatística.
Os levantamentos estatísticos são, normalmente, divulgados nos meios de comunicação (televisão,
jornais, revistas, Internet) e têm relação com a vida cotidiana, pois tratam de assuntos como saúde, com-
portamento, educação, economia, etc.
A seguir, serão detalhados alguns conceitos, ilustrados com exemplos práticos. Mas, antes de che-
garmos aos exemplos, precisamos ver e rever alguns conceitos, como tabulação dos dados brutos, rol e
frequência.
Dados brutos são aqueles obtidos em uma pesquisa e transcritos aleatoriamente, ou seja, fora de uma
ordem crescente ou decrescente.
Segue um exemplo:
Pretendemos saber as médias semestrais de Estatística de uma turma qualquer na Faculdade Y,
buscando-as numa base de dados existente. Podemos obter os dados na ordem a seguir:
7 6 8 9 6 5 7 4 6 8
9 8 7 6 10 8 4 5 6 10
5 8 4 3 8 7 9 6 10 7
7 7 9 5 4 5 9 10 8 8
6 7 5 10 8 6 7 7 10 6
Tais informações não deixam clara a pretensão, por isso precisamos que as informações sejam coloca-
das em ordem. Podemos dizer que os dados apresentados na tabela estão brutos, fora de uma determinada
ordem.
Esses dados podem ser colocados numa ordem, conhecida como rol. Como são notas, ou seja, núme-
ros, essa ordem numérica será crescente ou decrescente.
3 4 4 4 4 5 5 5 5 5
5 6 6 6 6 6 6 6 6 6
7 7 7 7 7 7 7 7 7 7
8 8 8 8 8 8 8 8 8 9
9 9 9 9 10 10 10 10 10 10
Ainda que a tabela já seja interessante, precisamos refinar mais os resultados, pois ainda apresentam
confusão para chegar ao resultado esperado.
Para deduzirmos alguma informação da tabela, os valores iguais são agrupados. Essa técnica é usada
com as notas que aparecem uma ou mais vezes. O número de vezes que cada nota aparece é determinado
como “frequência” e é representado por f. A nova tabela com os dados analisados fica assim:
Estatística Aplicada à Gestão – Capítulo 1
39
Estatística Aplicada à Gestão – Capítulo 1
NOTAs frEqUêNCiA (f)
3 1
4 4
5 6
6 9
7 10
8 9
9 5
10 6
Fonte: Os autores.
Coluna
indicadora Coluna
CélulaLinha
RODAPÉ
CENTRO
TOPO DA TABELA
CabeçalhosériE frEqUêNCiA
xxx yyy
sOMATóriO VALOr dO sOMATóriO
Rodapé
Título
Topo – Espaço superior de uma tabela, destinado ao seu número e ao seutítulo.a)
Centro ou corpo – Espaço central de uma tabela, destinado à moldura, aos dados numéricos e b)
aos termos necessários à sua compreensão. No centro, identificam-se quatro espaços menores: o
espaço do cabeçalho, as colunas, as linhas e as células.
Espaço do cabeçalho – Espaço superior do centro de uma tabela, destinado à indicação do
conteúdo de uma coluna.
Coluna indicadora – Espaço vertical do centro de uma tabela, que contém informações sobre o
conteúdo das colunas ou dados numéricos de uma mesma direção vertical.
Linha – Informações contidas em uma mesma direção horizontal.
Célula – Espaço mínimo no centro de uma tabela, resultante do cruzamento de uma linha com
uma coluna, destinado a um dado numérico ou a um sinal convencional.
Pela tabela, verificamos com mais clareza os resultados obtidos, como as informações da menor mé-
dia, a maior média e quantas vezes cada média está repetida. Conforme está no exemplo, a maior repetição
foi a média 7, aparecendo 10 vezes.
Após a coleta dos dados de uma pesquisa, os dados são colocados em ordem, apresentados de forma
que o leitor possa rapidamente identificar e interpretar as informações.
Tabelas e gráficos, derivados da pesquisa, são as ferramentas que a estatística utiliza para melhor
apresentar os resultados obtidos.
Há diferença entre tabela e quadro. A tabela é usada para representação numérica e não há linhas
fechadas nem do lado direito nem esquerdo, enquanto o quadro apresenta texto e linhas, que fecham do
lado direito e esquerdo. Observe os elementos da tabela:
40
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Rodapé – Espaço inferior de uma tabela, destinado à fonte, à nota geral e à nota específica.c)
Na tabela seguinte, baseada na pesquisa das notas da turma de Estatística, observe a identificação
desses elementos:
distribuição dE FrEquências
A distribuição de frequência é a apresentação dos resultados do comportamento de uma variável em
uma tabela. Nela constam os dados obtidos em uma pesquisa e o número de vezes da ocorrência de cada
resultado, conforme mostrado na tabela que aparece no item seguinte.
Distribuição de frequência é a tabela mais utilizada na estatística
descritiva. É importante recordar os conceitos de “população” e de
“amostra”, para melhor entender as variáveis que compõem uma ta-
bela.
frequência absoluta e frequência relativa
Leia o exemplo a seguir, que irá ajudá-lo a entender os conceitos de “frequência absoluta” e de “frequ-
ência relativa”.
Num grupo de estudantes de Medicina da UFPR, foi feita uma pesquisa sobre a nacionalidade de cada
um. O resultado final apresentado foi: Paula, brasileira; Ane, brasileira; Ramires, espanhol; Lívia, espanhola;
Claudete, brasileira; Solange, brasileira; Raul, argentino; Nélio, brasileiro; Sibila, brasileira; Pablito, espa-
nhol.
A frequência absoluta é o número de vezes que um valor da variável é citado. Nesse exemplo, a
variável é nacionalidade, e a frequência absoluta de cada um de seus valores é: brasileira, 6; espanhola,
3; e argentina, 1.
A frequência relativa é o que se pode registrar comparando a frequência absoluta em relação ao total
pesquisado. Temos, então:
CABEÇALHO
COLUNA
LINHA
MédiAs dA TUrMA dE GEsTãO fiNANCEirA
1.O sEMEsTrE dE 2009
NOTAs frEqUêNCiA (f)
3 1
4 4
5 6
6 9
7 10
8 9
9 5
10 6
CORPO
RODAPÉ
CE
NT
RO
TOPO TÍTULO
Fonte: Os autores.
Estatística Aplicada à Gestão – Capítulo 1
41
Estatística Aplicada à Gestão – Capítulo 1
NACiONALidAdE fA fr
Brasileira 6 60%
Espanhola 3 30%
Argentina 1 10%
Total 10 100%
Fonte: Os autores.
Fonte: Os autores.
frequência relativa brasileira: 6 em 10 ou 6/10 ou 3/5 ou 0,6 ou 60%;
frequência relativa espanhola: 3 em 10 ou 3/10 ou 0,3 ou 30%;
frequência relativa argentina: 1 em 10 ou 1/10 ou 0,1 ou 10%.
Tabela de frequências
Variável
As variáveis permitem relacionar os possíveis valores que elas podem assumir. Observe o exemplo a
seguir.
Para conhecer o perfil dos novos acadêmicos de um curso de Administração, a coordenação de uma
universidade resolveu elaborar questões a fim de reunir as informações procuradas. Numa das aulas, 20
acadêmicos foram entrevistados e cada um respondeu a questões para identificar sexo, idade, estado civil,
meio de transporte usado para chegar à universidade, tempo (em anos) que esteve afastado dos estudos e
renda familiar mensal (em salários mínimos). Os resultados são mostrados a seguir:
sExO idAdE EsTAdO CiViL
MEiO dE
TrANsPOrTE
TEMPO dE
AfAsTAMENTO
rENdA
fAMiLiAr
Masculino 23 Solteiro Carro 3 18
Masculino 18 Solteiro Ônibus 0 12
Feminino 20 Solteira A pé 2 8
Masculino 41 Casado Carro 20 15
Masculino 27 Separado Ônibus 7 5
Feminino 48 Viúva Carro 25 7
Feminino 33 Casada Carro 15 10
Feminino 29 Separada A pé 10 6
Masculino 44 Casado Ônibus 18 12
Feminino 24 Solteira Ônibus 3 5
Feminino 38 Separada A pé 12 11
Masculino 20 Solteiro A pé 1 8
Feminino 19 Solteira Ônibus 0 7
Masculino 53 Viúvo Carro 23 14
Masculino 36 Solteiro Carro 5 12
Feminino 30 Solteira Ônibus 7 8
Feminino 25 Casada Carro 3 9
Masculino 40 Casado Carro 4 11
Masculino 28 Solteiro A pé 2 10
Feminino 39 Casada Ônibus 6 5
42
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Cada um dos aspectos pesquisados, os quais permitem fazer a análise desejada, é denominado variável.
Algumas variáveis, como sexo, estado civil e meio de transporte utilizado para chegar à universidade,
apresentam como resposta um atributo ou preferência do entrevistado. São as chamadas variáveis quali-
tativas nominais.
Outras variáveis, como idade, renda familiar e tempo de afastamento, apresentam como resposta um
valor numérico. São as chamadas variáveis quantitativas e são classificadas em dois grupos:
Variáveis quantitativas discretas : seus valores são obtidos por contagem e representados por
elementos de um conjunto finito ou enumerável. Por exemplo, o número de pessoas de um depar-
tamento público, a quantidade de livros da biblioteca pública, etc.
Variáveis quantitativas contínuas : seus valores são obtidos por mensuração e representados por
valores pertencentes a um intervalo real. Por exemplo, o tempo de duração de uma pilha de relógio,
as médias de uma determinada turma numa determinada disciplina no 2.o semestre de 2009, a
frequência semanal dos frequentadores de um parque, etc.
Tabelas de frequência
Retomando o exemplo anterior, percebemos que somente a leitura e observação dos dados brutos
da tabela do curso de Administração não fornecem as condições necessárias à determinação do perfil do
acadêmico, pois as informações não estão organizadas.
O primeiro procedimento que possibilita uma leitura mais resumida dos dados é a construção de tabe-
las de frequência. Para cada variável estudada, é contado o número de vezes que ocorre cada um de seus
valores. O número obtido é a frequência absoluta e é indicado por ni (cada valor assumido pela variável
aparece um determinado número de vezes, justificando o uso do índice i ). Vejamos:
Dentre 20 entrevistados, foram encontrados os seguintes resultados para a frequência absoluta dos
valores assumidos pela variável estado civil:
separado (n 1 = 3)
solteiro (n 2 = 9)
casado (n 3 = 6)
viúvo (n 4 = 2)
Percebemos, então, que:
Normalmente, quando os resultados de uma pesquisa são divulgados em jornais e revistas, os valores
referentes à frequência absoluta aparecem acompanhados do número total de valores colhidos, para que
a análise seja mais significativa.
Caso a pesquisa fosse repetida com uma amostra de 30 entrevistados, em vez dos 20, no momento de com-
parar os resultados obtidos nas duas amostras deveria ser considerado que elas têm “tamanhos” diferentes.
Então, para cada valorassumido por uma variável, a frequência relativa (fi) é a razão entre a frequência
absoluta (ni) e o número total de dados (n):
n + n + n + n = n = 201 2 3 4 i
i=1
4
å
fi =
n
n
i
Estatística Aplicada à Gestão – Capítulo 1
43
Estatística Aplicada à Gestão – Capítulo 1
Para a variável “estado civil”, foi construída a seguinte tabela de frequência:
EsTAdO
CiViL
frEqUêNCiA
AbsOLUTA (ni)
frEqUêNCiA
rELATiVA (fi)
POrCENTAGEM
(%)
Separado 3 320
= 0,15 15
Solteiro 9 920
= 0,45 45
Casado 6 620
= 0,3 30
Viúvo 2 220
= 0,1 10
Total 20 1,0 100
Tabela com as frequências em ordem crescente:
EsTAdO
CiViL
frEqUêNCiA
AbsOLUTA
(ni)
frEqUêNCiA
rELATiVA
(fi)
frEqUêNCiA
AbsOLUTA
ACUMULAdA (fi)
frEqUêNCiA
rELATiVA
ACUMULAdA (fri)
POrCENTAGEM
(%)
Viúvo 2 220
= 0,1 2 0,1 10
Separado 3 320
= 0,15 5 0,25 15
Casado 6 620
= 0,3 11 0,55 30
Solteiro 9 920
= 0,45 20 1,0 45
Total 20 1,0 100
f =
n
n
= 1
n
n = 1
n
. n = 1 i
i
i
i
i
i
å å å
Fonte: Os autores.
Fonte: Os autores.
Como n nn £ , para cada i, 0£ fi£ 1. Por isso, é usual a frequência
relativa ser expressa em porcentagem.
A soma das frequências relativas dos valores assumidos por determi-
nada variável é sempre igual a 1:
44
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Tabela com as frequências em ordem decrescente:
EsTAdO
CiViL
frEqUêNCiA
AbsOLUTA
(ni)
frEqUêNCiA
rELATiVA
(fi)
frEqUêNCiA
AbsOLUTA
ACUMULAdA (fi)
frEqUêNCiA
rELATiVA
ACUMULAdA (fri)
POrCENTAGEM
(%)
Solteiro 9 920
= 0,45 20 1,0 45
Casado 6 620
= 0,3 11 0,55 30
Separado 3 320
= 0,15 5 0,25 15
Viúvo 2 220
= 0,1 2 0,1 10
Total 20 1,0 100
Para a construção das tabelas de frequência em relação às outras va-
riáveis, como sexo e meio de transporte, a metodologia utilizada será
a mesma.
É possível transformar a tabela em uma representação gráfica. Para o exemplo dado, aplicamos um
gráfico de setores. Veja:
Casado
30%
Solteiro
45%
Viúvo
10% Separado
15%
Fonte: Os autores.
Figura 7 – Estado civil dos acadêmicos de Administração.
Em alguns casos, no entanto, pode ocorrer que os valores assumidos por uma variável pertençam a
determinado intervalo real, praticamente não existindo repetição de valores. Isso ocorre com as variáveis:
idade, tempo de afastamento dos estudos e renda familiar. Esta última tem seus valores variando no inter-
valo [5,18[. Nesse caso, é construída uma tabela de frequência em que os dados estarão agrupados em
classes ou intervalos de valores.
Fonte: Os autores.
Fica convencionado que cada intervalo construído é fechado à es-
querda e aberto à direita, isto é, a notação a –| b refere-se ao intervalo
real [a, b[, que inclui a e não inclui b, isto é:
Estatística Aplicada à Gestão – Capítulo 1
45
Estatística Aplicada à Gestão – Capítulo 1
A amplitude do intervalo a –| b é dada pela diferença b – a.
Não há regras fixas para a construção dos intervalos usados para
agrupar as informações dos dados brutos. Dependendo da natureza
dos dados, pode-se ter um número maior ou menor de classes. É
recomendado, no entanto, sempre que possível, construir classes de
mesma amplitude. Além disso, convém evitar classes de amplitude
muito grande ou muito pequena, para que a análise não fique com-
prometida.
Retomando o exemplo, verifique os gráficos referentes às variáveis renda mensal familiar e tempo de
afastamento dos estudos.
Considerando a variável renda mensal familiar, podemos agrupar os dados brutos nas seguintes a)
classes de amplitude igual a 3.
rENdA fAMiLiAr
MENsAL (EM sALáriOs MÍNiMOs)
frEqUêNCiA
AbsOLUTA (ni)
frEqUêNCiA
rELATiVA (fi)
POrCENTAGEM
(%)
5 – 8 9 920
= 0,45 45
9 – 12 6 820
= 0,4 40
13 – 16 5 220
= 0,1 10
17 – 20 2 120
= 0,05 5
Total 20 1,0 100
Para a variável tempo de afastamento dos estudos, construímos um de frequência de amplitude b)
igual a 4.
TEMPO dE
AfAsTAMENTO (EM ANOs)
frEqUêNCiA
AbsOLUTA (ni)
frEqUêNCiA
rELATiVA (fi)
POrCENTAGEM
(%)
0 – 4 9 920
= 0,45 45
5 – 9 4 420
= 0,2 20
10 – 14 2 220
= 0,1 10
15 – 19 2 220
= 0,1 10
20 – 24 3 320
= 0,15 15
Total 20 1,0 100
A leitura permite concluirmos que:
a grande maioria (85% dos entrevistados) tem renda familiar entre 5 e 12 salários mínimos;
onze em vinte acadêmicos ficaram afastados dos estudos por mais de 5 anos.
[a . b[ = { | }x a x bÎÂ £ <
Fonte: Os autores.
Fonte: Os autores.
46
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Das informações apresentadas nas tabelas, construímos os seguintes histogramas:
0 a 4 5 a 9 10 a 14 15 a 19 20 a 24
Tempo (anos)
N
úm
er
o
d
e
al
un
os
10
9
8
7
6
5
4
3
2
1
0
Fonte: Os autores.
Figura 9 – Tempo de afastamento dos estudos dos acadêmicos de Administração.
JErZy NEyMAN E Os iNTErVALOs dE CONfiANçA
Quando estamos às vésperas de uma eleição é comum ouvirmos notícias do tipo: a porcentagem
de votos de fulano é 32%, com margem de erro de 3 pontos percentuais para mais ou para menos (ou
seja, a porcentagem está dentro do intervalo: 32 ± 3%). Esses intervalos, chamados de intervalos de
confiança, são obtidos em pesquisas de opinião feitas por amostragem, selecionando-se alguns milha-
res de pessoas, mesmo que o conjunto de todos os eleitores seja na ordem de milhões.
Existem intervalos de confiança para diversos parâmetros populacionais, tais como porcentagem,
média, variância, diferença de médias, etc. Por exemplo: a fórmula que oferece (sob determinadas
condições) o intervalo de confiança de uma média populacional é x
n
± s , em que x é a média da
amostra, s o desvio padrão e n o número de elementos selecionados para a amostra.
Um dos pioneiros no estudo de intervalos de confiança foi Jerzy Neyman, ao lado de estatísticos
renomados como Karl Pearson, Sir Ronald A. Fischer e Egon Pearson.
Leitura complementar
5 a 8 9 a 12 13 a 16 17 a 20
Renda (salários mínimos)
N
úm
er
o
d
e
al
un
os
9
8
7
6
5
4
3
2
1
0
Fonte: Os autores.
Figura 8 – Renda familiar mensal dos alunos do curso de Administração.
Estatística Aplicada à Gestão – Capítulo 1
47
Estatística Aplicada à Gestão – Capítulo 1
Você estudou:
A necessidade de organizar os dados após a sua coleta, a fim de facilitar a compreensão das informa-
ções e a análise dos dados.
A importância das tabelas de frequência, que precisam, necessariamente, conter cabeçalho, em que
constem as informações sobre os dados apresentados na tabela; corpo, composto por linhas e colunas,
nas quais são distribuídos os dados; e rodapé, em que deve constar a fonte, ou seja, a origem dos dados
apresentados.
síntese
Jerzy Neyman nasceu em abril de 1894, na cidade de Bendery, na atual Moldávia (ex-Rússia).
Seus pais eram de origem polonesa e, na época de seu nascimento, a Polônia não existia como país
independente (era dividida entre Alemanha, Áustria e Rússia).
Estudou em Kharkov, na Ucrânia, onde começou a interessar-se por matemática e estatística.
Obteve seu doutorado em 1924, na Universidade de Varsóvia, e sua tese versava sobre problemas
probabilísticos aplicados a experimentos agrícolas.
Trabalhou até 1938 na Polônia, antes de emigrar para os Estados Unidos, e fez viagens com obje-
tivos acadêmicos para a França e Inglaterra. Entre 1928 e 1933, desenvolveu, junto com Egon Pearson
(filho de Karl Pearson), os fundamentos da teoria dos testes de hipóteses.
Em 1934, Neyman desenvolveu a teoria de inspeção por amostragem, que ofereceu as bases
teóricas para a moderna teoria do controle de qualidade.
Em 1938, ingressouna Universidade da Califórnia, em Berkeley, onde fundou o Laboratório de
Estatística de Berkeley. Permaneceu como chefe do laboratório mesmo após aposentar-se, em 1961.
Apesar de sua aposentadoria, Neyman não diminuiu seu ritmo de trabalho. Permaneceu em ativi-
dade até o fim de sua longa vida, e um grande número de seus trabalhos foi publicado.
Em 1966, recebeu do Reino Unido a Medalha de Ouro da Sociedade Real de Estatística e, em
1969, recebeu do presidente Johnson a Medalha de Ciência dos Estados Unidos.
Neyman faleceu em agosto de 1981, em Berkeley, aos 87 anos.
IEZZI, Gelson; HAZZAN, Samuel; DEGENSZAJN, David.
Fundamentos da matemática elementar. 1. ed. São Paulo: Atual, 2004.
DANTE, Luiz Roberto. Matemática. 1. ed. São Paulo: Ática, 2009.
DOWNING, Douglas; CLARK, Jeffrey. Estatística aplicada. São Paulo: Saraiva, 1998.
IEZZI, Gelson; HAZZAN, Samuel; DEGENSZAJN, David. Fundamentos da matemática elementar. 1. ed. São Paulo:
Atual, 2004.
referências
Anotações
48
Aplicações da estatística
Conteúdo programático
A estatística e outras áreas do conhecimento
Estatística básica aplicada à gestão
Objetivos
Conhecer o instrumento quantitativo de análise para gestão de negócios.
Refletir sobre a modelagem adequada para prever e analisar variáveis
que permitam uma melhor gestão nas atividades empresariais.
50
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
a Estatística E outras árEas
do conhEcimEnto
Estatística é uma ciência que está presente em diversas áreas do conhecimento humano. Ela contribui
com informações valiosas tanto para o economista como para um psicólogo. A análise dos dados por ela
coletados influencia a tomada de decisões governamentais, empresariais e, muitas vezes, até pessoais.
Leia o texto seguinte, que traz mais algumas informações sobre o assunto:
POPULAçãO COM 15 ANOs dE idAdE OU MAis
ANALfAbETOs TAxA dE ANALfAbETisMO (%)
1981 17 041 167 22,7
1985 17 550 741 20,6
1990 17 347 042 18,6
1995 16 149 056 15,5
1999 15 106 263 13,3
2002 14 673 938 11,8
A estatística não é um ramo da matemática onde se investigam os processos de obtenção, organi-
zação e análise de dados sobre uma determinada população. A estatística também não se limita a um
conjunto de elementos numéricos relativos a um fato social, nem a números, tabelas e gráficos usados
para o resumo, a organização e apresentação dos dados de uma pesquisa, embora este seja um as-
pecto da estatística que pode ser facilmente percebido no cotidiano. Ela é uma ciência multidisciplinar,
que permite a análise estatística de dados de um físico. Poderia também ser usada por um economista,
agrônomo, químico, geólogo, matemático, biólogo, sociólogo psicólogo e cientista político. Segundo
Rao (1999), a estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com
a máxima quantidade de informação possível para um dado custo; o processamento de dados para
a quantificação da quantidade de incerteza existente na resposta para um determinado problema; a
tomada de decisões sob condições de incerteza, sob o menor risco possível. De fato, a estatística tem
sido utilizada na pesquisa científica para a otimização de recursos econômicos, para o aumento da
qualidade e produtividade, na otimização em análise de decisões, em questões judiciais, previsões e
em muitas outras áreas.
RAMOS, Edson Marcos Leal Soares. Estatística: poderosa ciência ao alcance de todos.
Disponível em: <http://www.ufpa.br/beiradorio/arquivo/Beira21/opiniao.html>. Acesso em: 26 ago. 2009.
A estatística é uma ferramenta indispensável, de forma especial para a educação brasileira, pois apon-
ta dados que revelam possíveis falhas e sucessos e mostra, de forma objetiva, os rumos a serem traçados
pelo poder público. A estatística possibilita, por exemplo, que se estabeleçam diretrizes para a melhoria da
educação brasileira, diminuindo os índices de analfabetismo, evasão, repetência e trazendo informações
sobre o perfil e a formação dos profissionais da educação.
A seguir, apresentamos uma análise de dados obtidos em pesquisa elaborada por órgãos oficiais de
pesquisa: Inep/MEC e IBGE. É importante lembrar que estas informações já foram tabuladas considerando
dados brutos adquiridos por meio do censo escolar. Observe os tratamentos diferenciados dados à infor-
mação pelo uso da tabela e do gráfico:
Estatística Aplicada à Gestão – Capítulo 1
51
Estatística Aplicada à Gestão – Capítulo 1
Fonte: PNADs/IBGE, 2005.
Nota: Excluiu-se, desta e das demais estatísticas,
a população rural da região Norte para os anos de 2004 e 2005
para a devida compatização com a série histórica.
Conforme apresentação das informações na tabela e no gráfico, podemos observar o analfabetismo
no Brasil. No período de 1981 a 2005, verificamos uma significativa redução do número de analfabetos
com 15 anos de idade ou mais. Nas tabelas, quadros e gráficos seguintes, obtemos mais informações
sobre o analfabetismo no Brasil. Observe a diferença no tratamento e na visuallização desses dados,
considerando os dois recursos utilizados:
POPULAçãO dE 15 A 60 ANOs dE idAdE: ANALfAbETisMO POr GêNErO
NúMErO AbsOLUTO
POrCENTUAL NO TOTAL
dE ANALfAbETOs (%)
POrCENTUAL dE ANALfAbETOs
POr GêNErO (%)
Feminino 4 430 097 46,2 7,2
Masculino 5 150 915 53,8 8,9
Total 9 581 012 100 –
Fonte: PNADs/IBGE, 2005.
Fonte: PNADs/IBGE, 2005.
Figura 10 – Brasil 1981 – 2005: Número de analfabetos e taxa
de analfabetismo na faixa etária de 15 a 60 anos.
N
úm
er
o
d
e
an
al
fa
be
to
s
20 000 000
18 000 000
16 000 000
14 000 000
12 000 000
10 000 000
8 000 000
6 000 000
4 000 000
2 000 000
0
25
20
15
10
5
0
1981 1985 1990 1995 1999 2002 2003 2004 2005
Pop. analfabeta Taxa analf.
Fonte: Os autores.
Figura 11 – População de 15 a 60 anos
de idade: analfabetismo por gênero.
Feminino
46,2%
Masculino
53,8%
2003 14 662 283 11,5
2004* 14 605 018 11,1
2005* 14 529 616 10,8
52
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
TAxA dE ANALfAbETisMO dA POPULAçãO ENTrE 15 E 60
ANOs dE idAdE POr UNidAdE dA fEdErAçãO – 2005
UF %
Rio de Janeiro 3,2
São Paulo 3,2
Distrito Federal 3,2
Rio Grande do Sul 3,2
Santa Catarina 3,4
Paraná 4,3
Amapá 4,6
Amazonas 4,7
Espírito Santo 5,9
Mato Grosso do Sul 6,0
Minas Gerais 6,3
Goiás 6,5
Rondônia 6,9
Mato Grosso 7,0
Roraima 9,9
Piauí 10,1
Tocantins 11,3
Bahia 14,2
Sergipe 15,5
Pernambuco 16,6
Rio Grande do Norte 16,7
Acre 17,4
Ceará 17,8
Maranhão 18,3
Paraíba 20,3
Piauí 23,0
Alagoas 24,5
Fonte: PNADs/IBGE, 2005.
Fonte: PNADs/IBGE, 2005.
Figura 12 – Taxa de analfabetismo da população entre 15 e 60 anos de idade por unidade da Federação – 2005.
A representação gráfica a seguir apresenta os mesmos dados em um gráfico de colunas:
0
5
10
15
20
25
ALPIPBMACEACRNPESEBATOPARRMTROGOMGMSESAMAPPRSCRSSPDFRJ
24,5
23,0
20,3
18,3
17,817,4
16,716,6
15,5
14,2
11,3
10,19,9
7,06,96,56,36,05,9
4,74,64,3
3,43,23,23,23,2
%
d
e
an
al
fa
be
to
s
UF
Estatística Aplicada à Gestão – Capítulo 1
53
Estatística Aplicada à Gestão – Capítulo 1
Leia mais um texto em que se destaca a importância da aplicação da estatística em nosso cotidiano,
observando que ele contém informações relevantes no contexto da estatística aplicada. Trata-se de um es-
tudo com o objetivo de identificar as causas da resistência de alguns alunos em relação à prática esportiva
nas aulas de Educação Física.
Em conformidade com a Lei de Diretrizes e Bases da Educação Nacional – LDB, a Educação Físi-
ca é componente curricular da educação básica, portanto, obrigatória em todo Ensino Fundamental e
Médio. Diante disso,tornam-se de absoluta importância os aspectos pedagógicos a serem abordados
nessa disciplina, bem como os conteúdos de ensino. Estes são apresentados nos projetos pedagógi-
cos, nos planos de ensino, durante as aulas e nas atividades e convicções.
Este estudo compreendeu a base populacional de 32 escolas que possuíam 7.a série do Ensino
Fundamental. Considerando o número aproximado de 40 estudantes em cada uma das 93 turmas de
7.a série existentes no total de escolas pesquisadas, para uma amostra aleatória com erro porcentual
de 4%, estudaram-se 535 casos. Assim, a amostra foi composta por 242 meninos e 293 meninas.
Objetivou identificar a quais conteúdos de ensino da Educação Física os escolares apresentam maior
resistência. Procurou-se, também, analisar o(s) porquê(s) dessa aversão a determinados conteúdos.
Os conteúdos de ensino presentes na Educação Física regional foram listados para que os es-
colares apontassem suas opiniões, com seis itens: “Nunca Pratiquei”, “Detesto”, “Não gosto”, “Sou
indiferente”, “Gosto” ou “Gosto muito”. Em sala de aula, os alunos responderam individualmente ao
questionário.
BARROS, José Maria de Camargo. Educação Física no Ensino de 1.o e 2.o graus:
um estudo dos conteúdos e natureza dos programas. Revista Kinesis, Santa Maria, v. 9, p.97–110, 1992.
Considerando os dados coletados, o texto apresenta as tabelas seguintes, a partir das quais elabora-
mos os alguns gráficos. Observe:
POrCENTUAL dE rEsPOsTA (dE AMbOs Os sExOs) qUE NãO GOsTAM
dO CONTEúdO OU O dETEsTAM
CONTEúdOs rEsULTAdO (% dAs rEsPOsTAs)
Alongamentos (Gin.)
Abdominais e Apoios (Gin.)
Corridas (Atl.)
27,7
26,5
25,0
Fonte: BARROS, 1992.
Fonte: Os autores.
Figura 13 – Porcentual de respostas (de ambos os sexos)
que não gostam do conteúdo ou o detestam.
Corridas (Alt.)
25%
Alongamentos (Gin.)
27,70%
Abdominais e apoios (Gin.)
26,50%
54
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
POrCENTUAL dE rEsPOsTAs dOs MENiNOs qUE NãO GOsTAM
OU dETEsTAM O CONTEúdO
Conteúdos Resultado (% das respostas)
Alongamentos (Gin.)
Corridas (Atl.)
Dança
29,3
26,4
26,4
Fonte: BARROS, 1992.
POrCENTUAL dE rEsPOsTAs dAs MENiNAs qUE NãO GOsTAM
dO CONTEúdO OU O dETEsTAM
Conteúdos Resultado (% das respostas)
Alongamentos e Apoios (Gin.)
Alongamentos (Gin)
Corridas (Atl.)
27,7
25,9
25,3
Fonte: BARROS, 1992.
Leia outro trecho desse estudo que comenta a tabela apresentada na sequência.
As respostas foram divididas em três grandes categorias, para facilitar a apresentação dos da-
dos. A primeira engloba as respostas dos escolares que fazem referência à didática adotada durante
Fonte: Os autores.
Figura 14 – Porcentual de respostas dos meninos que
não gostam do conteúdo ou o detestam.
Dança
26,40%
Corridas
26,40%
Alongamentos (Gin.)
29,30%
Fonte: Os autores.
Figura 15 – Porcentual de respostas das meninas que
não gostam do conteúdo ou o detestam.
Alongamentos (Gin.)
25,90%
Corridas (Atl.)
25,30%
Abdominais e apoios (Gin.)
27,70%
Estatística Aplicada à Gestão – Capítulo 1
55
Estatística Aplicada à Gestão – Capítulo 1
a aula e suas consequências, como, por exemplo, sentir dor, não conseguir executar o movimento
correto ou uma superestimação do potencial físico do aluno pelo professor.
A segunda categoria trata das questões subjetivas, que abarcam condições/ideias pessoais do
aluno ou da preferência destes. São exemplos dessa categoria o não gostar do conteúdo/modalidade
(como a ginástica, por exemplo), o relato de problemas físicos/respiratórios ou a expressão de não
vontade de fazer a tarefa proposta.
A terceira categoria envolve as questões de gênero, que refletem o preconceito cultural da socieda-
de, presente também nos alunos, os quais elegem determinados conteúdos característicos de um dos
sexos. Nesta, estão as clássicas “é coisa de menino” e “é coisa de menina”.
CONCLUsõEs fiNAis
CATEGOriA GErAL (%) MAsCULiNA (%) fEMiNiNA (%)
Alonga-
mento
Abd. e
Apoio Corrida
Alonga-
mento Corrida Dança
Abd. e
Apoio
Alonga-
mento Corrida
Didática 46 70 77 42 61 33 66 72 73
Subjetiva 51 28 22 54 36 47 32 28 27
Gênero 3 2 1 4 3 20 2 0 0
Total 100 100 100 100 100 100 100 100 100
Fonte: BARROS, 1992.
BARROS, José Maria de Camargo. Educação Física no Ensino de 1.o e 2.o graus: um estudo dos
conteúdos e natureza dos programas. Revista Kinesis, Santa Maria, v. 9, p. 97–110, 1992.
A estatística tem se revelado uma importante ferramenta também na área médica. O texto seguinte
apresenta uma aplicação da estatística na área de saúde, no estado da Bahia:
dOENçAs OCUPACiONAis EM PrOfEssOrEs ATENdidOs PELO CENTrO dE EsTUdOs dA
sAúdE dO TrAbALHAdOr (CEsAT)
[...]
O Centro de Estudos da Saúde do Trabalhador (Cesat) atendeu 235 professores de 1991 a 2001 (in-
clusive), sendo 228 mulheres e 7 homens. A idade mínima foi de 20 e a máxima de 61 anos, com média e
mediana de 42 e desvio padrão de 8. A residência de 159 deles era em Salvador (69% dos indivíduos com
informação); de 20, em outros municípios da região metropolitana de Salvador; e de 52, em outros municí-
pios da Bahia (23% dos indivíduos com informação). Quanto à escolaridade, 125 tinham o segundo grau
completo (54% das pessoas com informação) e 97, o curso superior completo (42% dos indivíduos com
informação). Os casados constituíam a maioria dos atendidos (62%). O tempo de trabalho como professor
variou de 1 a 35 anos, com média e mediana de 14 anos e desvio padrão de 7. Os sindicalizados eram
57% dos professores com informação. Daqueles cuja jornada de trabalho era conhecida, 27% tinham 20
horas de trabalho por semana e 58% tinham 40 horas semanais de trabalho; a jornada de trabalho variou
de 10 a 80 horas semanais de trabalho, com média de 35 horas, desvio padrão de 11 e mediana de 40
horas. A grande maioria (91%) tinha vínculo com instituições públicas.
As perdas de informação por ausência dos dados correspondentes nos prontuários foram de
um indivíduo para a idade e para o estado civil; de quatro indivíduos para a residência e para a
56
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
escolaridade; de dez indivíduos para o tempo de trabalho como professor; de treze indivíduos para a
sindicalização; de 57 indivíduos para o tipo de vínculo de trabalho e de 63 indivíduos para a jornada
de trabalho.
O total de trabalhadores atendidos no mesmo período foi de 10957, dos quais 6560 homens e 4390
mulheres (sete sem informação). A média de idade (igual à mediana) foi de 39 anos, com desvio padrão
de 8. Residiam em Salvador 78% dos trabalhadores, 11% em outros municípios da região metropolitana
de Salvador e 12% em outros municípios da Bahia. Eram casados 68% e 59% eram sindicalizados.
Dos 235 professores atendidos pelo Cesat no período estudado, 156 tiveram diagnóstico de do-
ença ocupacional, correspondendo a 66% do total de atendidos e 78% dos que tiveram diagnóstico
conclusivo; 105 tiveram diagnóstico de doença não ocupacional, equivalendo a 45% dos atendidos e
52% dos que tiveram diagnóstico conclusivo. O total de diagnósticos de doença ocupacional foi de 250
e o de diagnóstico de doença não ocupacional foi de 164. No período analisado, os atendimentos de
professores mostraram-se crescentes de 1991 a 1994, reduziram-se acentuadamente em 1995, voltan-
do a aumentar até 1998 e oscilando em um patamar inferior nos três anos seguintes.
Os 156 professores com diagnóstico de doença ocupacional apresentaram praticamente as mes-
mas características do conjunto dos professores atendidos em relação ao gênero, à idade, à residência,
ao estado civil, ao tempo de trabalho como professor, à jornada de trabalho e ao vínculo de trabalho.
Pequenas diferenças foram observadas quanto à escolaridade (47% tinhamo segundo grau completo
contra 54% do total de professores) e à sindicalização (62% contra 57% do total de professores).
As investigações de 201 professores foram concluídas com a definição de um diagnóstico (de
doença ocupacional ou não). Este número, assim como o número total de diagnósticos atribuídos
a todos os professores, acompanhou aproximadamente a variação dos atendimentos, exceto no
ano de 2000. Neste ano, foram poucas as investigações concluídas com o estabelecimento de um
diagnóstico.
Do total de trabalhadores atendidos pelo Cesat no período estudado, 53% tiveram diagnóstico de
doença ocupacional (5847 indivíduos) e 13% de doença não ocupacional (1418 indivíduos).
[...] Os gráficos seguintes agrupam estes diagnósticos [de doenças ocupacionais] em algumas
categorias.
Fonte: CESAT, 2003.
Principais grupos de doenças ocupacionais diagnosticadas nos professores atendidos pelo
CESAT de 1991 a 2001
Outros
diagnósticos
10%
Asma alérgica ou
não alérgica
4%
Neuropatias
10%
Rinite, sinusite e faringite
crônicas e alérgicas
12%Distúrbios
osleomusculares
26%
Doenças da laringe e
cordas vocais
30%
Estatística Aplicada à Gestão – Capítulo 1
57
Estatística Aplicada à Gestão – Capítulo 1
PORTO, Lauro Antonio; REIS, Israel Costa; ANDRADE, Jonathan Moura de Andrade;
NASCIMENTO, Carla Rebouças; CARVALHO, Fernando Martins. Doenças ocupacionais
em professores atendidos pelo centro de estudos da saúde do trabalhador (Cesat).
Disponível em: <http://www.sinpro-ba.org.br/saude/doc/doencas_ocupacionais.pdf>.
Acesso em: 30 set. 2009.
2001
Principais grupos de doenças ocupacionais diagnosticadas nos professores atendidos pelo
CESAT de 1991 a 2001, segundo o ano de atendimento
20
18
16
14
12
10
8
6
4
2
0
1993 1995 1997 19991991
Fonte: CESAT, 2003.
Legenda
distúrbios osteomusculares
doenças da laringe e das cordas vocais
neuropatias
rinusites, faringites e asma
O livro Estatística prática para as ciências da saúde é uma interes-
sante leitura para aqueles que desejam saber um pouco mais sobre
aplicações da estatística nessa área. Embora o livro se destine espe-
cialmente a profissionais da área de serviço, ele apresenta exercícios
resolvidos que envolvem conhecimentos práticos da estatística.
Estatística básica aplicada à gestão
A estatística aplicada à administração serve como instrumento para análise qualitativa ou quantitativa
do negócio que está sendo estudado para tomada de decisões. Por exemplo: a indústria de perfumes ABC
está se preparando para lançar um novo produto feminino no mercado e precisa saber a preferência dos
consumidores no mercado de interesse. Para tanto, pode fazer uma pesquisa entrevistando as pessoas na
rua ou nas residências de um determinado bairro (a escolha é feita aleatoriamente). Os resultados obtidos
poderão ser usados para estimar as preferências da população. Podemos citar vários outros exemplos,
como: saber as preferências das donas de casa sobre o tipo de sabão em pó mais usado no Brasil; o café
mais tomado em determinada região; o veículo mais vendido na Bahia; a quantidade de peças defeituosas
de uma indústria de autopeças (no dia, mês ou ano em uma); entre outros.
58
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
PrOdUçãO iNdUsTriAL fECHA sEMEsTrE COM qUEdA EM TOdAs As árEAs
Rio de Janeiro – A produção da indústria brasileira fechou o primeiro semestre do ano com queda
em todos os 14 locais pesquisados pelo Instituto Brasileiro de Geografia e Estatística (IBGE). Em cinco
deles, os resultados ficaram abaixo da média nacional (–13,4%) do período. A maior queda foi observa-
da no Espírito Santo (–29,3%), seguido por Minas Gerais (–21,3%), pelo Amazonas (–6,8%), por São
Paulo (–4,4%) e pelo Rio Grande do Sul (–13,5%).
De acordo com o documento do IBGE, que divulgou hoje (5) os dados da Pesquisa Industrial
Mensal Produção Física – Regional, os números “refletem o menor dinamismo das exportações e dos
setores produtores de bens de capital, confrontados com uma base elevada de comparação de junho
de 2008, quando a indústria nacional registrou 6,3% de crescimento”.
O levantamento destaca, no entanto, que houve redução do ritmo de queda na passagem do pri-
meiro trimestre deste ano (–14,6%) para o segundo (–12,3%), tendo sido observado este movimento
em dez dos 14 locais, principalmente no Rio Grande do Sul (de –16,8% para –10,5%), no Rio de Ja-
neiro (de –11,4% para –5,6%), em Minas Gerais (de –24,2% para –18,7%) e no Amazonas (de –19,4%
para –14,2%).
No mês de junho, em relação a maio, a produção industrial subiu em oito das 14 regiões anali-
sadas. As principais altas foram observadas no Pará (10,2%), em Goiás (7,4%) e na Bahia (7,2%).
Também subiram os níveis da atividade fabril em Minas Gerais (3,3%), na Região Nordeste (2,9%), em
Santa Catarina (1,4%), no Rio Grande do Sul (1,1%) e no Rio de Janeiro (0,5%). As principais quedas
foram as registradas no Paraná (–9,0%) e em São Paulo (–2,0%).
Na comparação com junho do ano passado, a atividade industrial caiu em 12 das 14 regiões. As
principais quedas foram verificadas no Espírito Santo (–25,2%), no Paraná (–16,5%), em Minas Gerais
(–15,1%) e em São Paulo (–13,4%). Em movimento oposto, foram observadas altas na produção indus-
trial nos seguintes locais: Bahia (2,4%) e Goiás (1,1%).
LEITÃO, Thaís. Produção industrial fecha semestre com queda em todas as áreas. Disponível em: <http://www.agenciabrasil.gov.br/noticias/
2009/08/05/materia.2009–08–05.9136728182/view>. Acesso em: 26 ago. 2009.
A tabela seguinte é mais um exemplo de estatística aplicada à gestão. Por meio dela, concluímos que
a exportação brasileira nos setores industriais cresceu de janeiro a junho de 2009 em relação ao mesmo
período de 2008. Abaixo está o quadro que demonstra esta variação. Observe, na sequência, os mesmos
dados em forma de gráfico.
ExPOrTAçãO brAsiLEirA dOs sETOrEs iNdUsTriAis POr iNTENsidAdE
TECNOLóGiCA JAN/JUN – 2009/2008 – Us$ MiLHõEs fOb
Indústria de alta tecnologia (I) 4 394 5 505
Aeronáutica e aeroespacial 2 268 2 833
Farmacêutica 765 699
Material de escritório e informática 85 106
Equipamentos de rádio, TV e comunicação 949 1 450
Instrumentos médicos de ótica e precisão 328 417
Fonte: http://www.desenvolvimento.gov.br/arquivos/dwnl�1247497465.xls.
O texto a seguir apresenta dados comparativos sobre a produção industrial por período em diversas
regiões ou estados brasileiros:
Estatística Aplicada à Gestão – Capítulo 1
59
Estatística Aplicada à Gestão – Capítulo 1
O texto a seguir mostra outra importante aplicação da estatística na gestão. Nele, constam dados sobre
a evolução da produção industrial de veículos automotores.
Para exemplificar, foram utilizados gráficos de colunas e linhas, que melhor mostram a evolução de
veículos novos licenciados no Brasil, em milhões de unidades e valores percentuais, no período de 2002
a 2008.
Fonte: Os autores.
Figura 16 – Indústria de alta tecnologia (I).
0
500
1000
1500
2000
2500
3000
In
st
ru
m
en
to
s
m
éd
ic
os
d
e
ót
ic
a
e
pr
ec
is
ão
Eq
ui
pa
m
en
to
s
de
rá
di
o,
TV
e
co
m
un
ic
aç
ão
M
at
er
ia
l d
e
es
cr
itó
rio
e
in
fo
rm
át
ic
a
Fa
rm
ac
êu
tic
a
Aé
ro
na
ut
ic
a
e
ae
ro
es
pa
ci
al
2008
2009
Va
lo
r e
m
U
S$
2268
2833
765
699
85 106
949
1450
328
471
iNdúsTriA AUTOMOTiVA TEM PiOr 1.º sEMEsTrE dA sériE, APONTA ibGE
Queda de 23,6% na produção de veículos no primeiro semestre de 2009 foi a mais
acentuada desde 1991
RIO DE JANEIRO – A queda de 23,6% na produção de veículos automotoresno primeiro semestre
deste ano ante igual período no ano passado foi a mais intensa para um primeiro semestre desde o
começo da série histórica atualizada pelo IBGE, iniciada em 1991. A informação é do economista da
coordenação de indústria do instituto, André Macedo, que observou ainda que o resultado de janeiro
a junho deste ano é o pior desempenho semestral da indústria automotiva desde o segundo semestre
de 1998 (–28,6%).
O segmento de veículos automotores pesquisado pelo IBGE engloba automóveis, autopeças, ôni-
bus, e caminhões, e estão presentes tanto na indústria de bens de capital (com caminhões, por exem-
plo) como na indústria de bens duráveis (com automóveis). Macedo comentou que, desde setembro
do ano passado, período em que os efeitos negativos da crise global se acirraram, esse setor teve de
lidar com um cenário de alto nível de estoques e recuo na demanda doméstica. Ele comentou ainda a
60
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
importância de veículos automotores para outras indústrias relacionadas, como metalúrgica; produtos
químicos; de borracha e de plásticos. “Por influência do recuo na produção da indústria automotiva,
a produção dessas outras indústrias, que participam da produção de veículos automotores, também
sofreram”, comentou.
Para a gerente de Análise e Estatísticas Derivadas do IBGE, Isabella Nunes, o nível da queda em
veículos automotores “não surpreende”, e foi originado basicamente da influência negativa da crise
global sobre a demanda. “Devido à crise, outros países também apresentaram números de quedas
na produção de veículos automotores semelhantes ao que apresentamos agora”, afirmou. Ela reiterou
ainda que a queda na produção de veículos automotores foi um dos fatores que mais contribuíram para
a queda de 13,4% na produção da indústria geral, no primeiro semestre.
Acomodação
O aumento de apenas 0,2% na produção industrial brasileira em junho ante maio não é preocu-
pante, na análise de Isabella Nunes. Para ela, o fato de a taxa de crescimento ter sido bem menos
intensa do que a apurada em maio (1,2%), nesse tipo de comparação de mês ante mês anterior, não
representa o início de uma retração no ritmo de recuperação da atividade industrial em junho. “É natural
que, depois das taxas anteriores, que foram de crescimento forte, ocorra uma acomodação”, explicou.
A economista comentou que o resultado de 0,2% veio depois de cinco taxas positivas mais elevadas,
nesse tipo de comparação, que foram influenciadas por fortes crescimentos nas indústrias de alimen-
tos e de farmacêutica. “Essas duas indústrias contaram com forte crescimento de produção industrial
por fatores pontuais”, disse. Isabella lembrou que, no caso da indústria de alimentos, houve uma forte
influência benéfica da indústria açucareira brasileira, que aproveitou oportunidades de exportação após
safras ruins na produção de açúcar em outros países, esse ano. “Essa taxa de 0,2% é um número
pontual”, frisou.
O fato de a indústria geral, mesmo em trajetória de recuperação, ainda apresentar, em junho, taxas
de variação negativas em sua produção, nas comparações de mês ante igual mês do ano anterior e
no acumulado do ano, também foi comentado pela economista. Ela lembrou que, no ano passado, a
produção industrial seguia ritmo muito forte, até o início do período mais agudo da crise global, em
setembro de 2008. Os números deste ano da produção industrial estão sendo comparados com um
patamar muito elevado, e muitos ainda estão abaixo dos níveis registrados em 2008. “O que nós temos
em 2009 é uma nova realidade de demanda, diferente do que observamos no ano passado. Por isso,
os números nessas comparações se mostram ainda negativos”, afirmou.
A queda da produção industrial acumulada em 12 meses até junho, de 6,5%, é a mais intensa da
série histórica, de acordo com o IBGE. Nos 12 meses até maio, a queda havia sido de 5%. De janeiro
a dezembro de 2008, a queda foi de 3,1%.
Na comparação entre trimestres, a produção industrial cresceu 3,4% no segundo trimestre de
2009 em relação ao primeiro trimestre, depois de ter caído duas vezes consecutivas na comparação de
trimestre ante trimestre imediatamente anterior. Já na comparação entre o segundo trimestre deste ano
e igual período de 2008, a produção industrial teve queda de 12,3%. O desempenho negativo, porém,
foi menor que no primeiro trimestre, quando houve taxa negativa de 14,6% na comparação com igual
período de 2008.
CHIARINI, Adriana; SARAIVA, Alessandra. Indústria automotiva tem pior 1.o semestre da série, aponta IBGE.
Disponível em: <http://www.estadao.com.br/noticias/economia,ibge-industria-automotiva-tem-pior-1-semestre-da-
serie,412776,0.htm>. Acesso em: 26 ago. 2009.
Estatística Aplicada à Gestão – Capítulo 1
61
Estatística Aplicada à Gestão – Capítulo 1
As tabelas e os gráficos seguintes também se referem à indústria automotiva. Observe-os atentamente:
LiCENCiAMENTO dE VEÍCULOs NOVOs NO brAsiL – 2002/2008
PErÍOdO (ANOs) MiLHõEs dE UNidAdEs PArTiCiPAçãO dOs iMPOrTAdOs %
2002 1 479 7,8
2003 1 429 5,2
2004 1 579 3,9
2005 1 715 5,1
2006 1 928 7,4
2007 2 463 11,2
2008 2 820 13,3
Fonte: FUNDAP, 2009.
Representando graficamente essas informações, temos:
Fonte: Os autores.
Figura 17 – Licenciamento de veículos novos no Brasil – 2002/2008.
0,0
2002 2003 2004 2005
Período
M
ilh
õe
s
de
u
ni
da
de
s
2006 2007 2008
0,5
1,0
1,5
2,0
2,5
3,0
Fonte: Os autores.
Figura 18 – Licenciamento de veículos novos importados no Brasil – 2002/2008.
7,8
5,2
3,9
5,1
7,4
11,2
13,3
4
6
2002
Período
2003 2004 2005 2006 2007 2008
8
10
12
14
0
2
Po
rc
en
tu
al
62
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
EsTATÍsTiCA APLiCAdA À AdMiNisTrAçãO E AO CONTrOLE dE qUALidAdE
A estatística é uma ciência importante para a administração e está presente em quase todas as
suas áreas. Com o passar do tempo, tanto a estatística como a administração vêm passando por evo-
luções e cada vez mais as técnicas estatísticas vêm colaborando com os estudos organizacionais. O
grande marco da sua colaboração foi no gerenciamento e controle de qualidade, sendo que o controle
estatístico de processo surgiu como uma solução para os problemas de qualidade revolucionando o
sistema de produção. Este trabalho se propõe a estudar a estatística aplicada à administração, de-
dicando maior atenção para a área da produção. A metodologia consiste em estudos teóricos sobre
a estatística na administração, estudo das abordagens da qualidade e das técnicas estatísticas no
controle de qualidade, e a exploração dos softwares estatísticos, SAS e Statistica. Como aplicações
foram utilizados dados de exemplos constantes na bibliografia. Dos estudos realizados observou-se
que o controle de qualidade nasceu como uma solução na redução de custos, de desperdícios, na uni-
formização e na normalização da produção, auxiliando as empresas a racionalizarem e maximizarem
os seus recursos tornando-as mais competitivas e sólidas. Um conjunto de ferramentas essencial no
controle de qualidade é o CEP (Controle Estatístico de Processo) que utiliza a metodologia estatística
para fazer com que o processo de uma empresa possa ser visualizado, avaliado, modificado e melho-
rado. Na literatura é comum encontrar as denominações “As 7 ferramentas da qualidade”, “Abordagens
5S”, “As 7 ferramentas do planejamento da qualidade”, todas centradas na melhoria da qualidade.
Percebe-se nestas que, a grande fundamentação vem das ideias do Dr. W. Eduards Deming, difundidas
no Japão em 1947 para reerguer a economia japonesa enfraquecida pela Segunda Guerra. Dentre
as ferramentas de qualidade,uma das mais importantes é o gráfico de controle, introduzido em 1934
por Shewhart. A sua principal função é a de monitorar a produção verificando se ela está ou não sob
controle estatístico. Estudos recentes na qualidade convergem para abordagem da Qualidade Total,
que tem como meta nenhum defeito, e para o Melhoramento Contínuo que defende o melhoramento
da produção através de ações de baixo impacto, simples e contínuas.
QUINTINO, Carleno Alcides Amorim. Estatística aplicada à administração e ao controle de qualidade.
Disponível em: <http://www.ppg.uem.br/Docs/pes/eaic/XI_EAIC/trabalhos/arquivos/11-0104-0.pdf>.
Acesso em: 25 ago. 2009.
Leitura complementar
Você estudou:
Os conhecimentos estatísticos são aplicados em diferentes áreas do saber.
As informações estatísticas são trabalhadas por meio de tabelas ou gráficos.
A análise de dados estatísticos auxilia a planejar melhor diversas condutas e a ter uma visão mais crítica
da realidade.
síntese
BUSSAB, Wilson de Oliveira; MORETTIN, Pedro Alberto. Estatística básica. 5. ed. São Paulo: Saraiva, 2003.
BARROS, José Maria de Camargo. Educação Física no Ensino de 1.o e 2.o graus: um estudo dos conteúdos e natureza
dos programas. Revista Kinesis, Santa Maria, v. 9, p. 97–110, 1992.
referências
Estatística Aplicada à Gestão – Capítulo 1
63
Estatística Aplicada à Gestão – Capítulo 1
Atividades do capítulo
Diante da considerável importância da estatística nos dias atuais, cite mais alguma utilização para ela.1.
Uma concessionária de automóveis tem 3 500 clientes cadastrados e fez uma pesquisa sobre a prefe-2.
rência de compra em relação à cor (branca, vermelha ou azul), ao preço, ao número de portas (duas ou
quatro) e ao estado de conservação (novo ou usado). Foram consultados 210 clientes. Diante dessas
informações, responda:
Qual é o universo estatístico (população) e qual é a amostra dessa pesquisa?a)
Quais são as variáveis e qual é o tipo de cada uma?b)
Quais os possíveis valores da variável “cor” nessa pesquisa?c)
As áreas construídas, medidas em metros quadrados, de vinte residências de uma região são:3.
250 280 330 402 385
302 290 270 310 304
407 380 295 283 402
390 300 283 250 265
CHIARINI, Adriana; SARAIVA, Alessandra. Indústria automotiva tem pior 1.o semestre da série, aponta IBGE. Disponível
em: <http://www.estadao.com.br/noticias/economia,ibge-industria-automotiva-tem-pior-1-semestre-da-serie,412776,0.
htm>. Acesso em: 26 ago. 2009.
CRESPO, Antonio Arnot. Estatística fácil. São Paulo: Saraiva, 2002.
EXPORTAçÃO brasileira dos setores industriais por Intensidade tecnológica jan/jun – 2009/2008 – US$ milhões FOB.
Disponível em: <http://www.desenvolvimento.gov.br/arquivos/dwnl_1247497465.xls>. Acesso em: 9 set. 2009.
FUNDAçÃO DO DESENVOLVIMENTO ADMINISTRATIVO (FUNDAP). 5.o Workshop – Crise econômica e impactos
setoriais: situação atual e perspectivas – setor automotivo. Disponível em: <http://www.fundap.sp.gov.br/debatesfundap/
ppt/quinto_workshop>. Acesso em: 13 set. 2009.
LAPPONI, Juan Carlos. Estatística usando Excel. Rio de Janeiro: Elsevier, 2005.
LEITÃO, Thaís. Produção industrial fecha semestre com queda em todas as áreas. Disponível em: <http://www.
agenciabrasil.gov.br/noticias/2009/08/05/materia.2009-08-05.9136728182/view>. Acesso em: 26 ago. 2009.
MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1979.
MEYER, Paul L. Probabilidade: aplicações à estatística. Rio de Janeiro: LTC, 1995.
PNADs/IBGE. Disponível em: <www.cgee.org.br/atividades/redirect.php?idProduto=5780>. Acesso em: 13 set. 2009.
PORTO, Lauro Antonio; REIS, Israel Costa; ANDRADE, Jonathan Moura de Andrade; NASCIMENTO, Carla Rebouças;
CARVALHO, Fernando Martins. Doenças ocupacionais em professores atendidos pelo centro de estudos da saúde do
trabalhador (Cesat). Disponível em: <http://www.sinpro-ba.org.br/saude/doc/doencas_ocupacionais.pdf>. Acesso em:
30 set. 2009.
QUINTINO, Carleno Alcides Amorim. Estatística aplicada à administração e ao controle de qualidade.
Disponível em: <http://www.ppg.uem.br/Docs/pes/eaic/XI_EAIC/trabalhos/arquivos/11-0104-0.pdf>. Acesso em: 25
ago. 2009.
RAMOS, Edson Marcos Leal Soares. Estatística: poderosa ciência ao alcance de todos. Disponível em: <http://www.
ufpa.br/beiradorio/arquivo/Beira21/opiniao.html>. Acesso em: 26 ago. 2009.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. Atlas: São Paulo, 1995.
64
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
Construa uma tabela de distribuição de frequência dessa amostra com seis classes de mesma ampli-
tude e o respectivo histograma.
(Univali) O gráfico a seguir mostra as vendas de televisores em uma loja:4.
De acordo com ele, é possível afirmar que:
As vendas aumentaram mês a mês.a)
Foram vendidos 100 televisores até junho.b)
As vendas do mês de maio foram inferiores à soma das vendas de janeiro e fevereiro.c)
Foram vendidos 90 televisores até abril.d)
Se cada televisor é vendido por R$ 240,00, em maio, a loja faturou, com as vendas desse produto, e)
R$ 7.200,00.
Em uma escola, os alunos devem optar por um, e somente um, dos três idiomas: inglês, espanhol ou 5.
francês. A distribuição da escolha de 180 alunos está indicada pelo gráfico a seguir.
Sabendo que o ângulo do setor representado pelos alunos que escolheram inglês é 252o e que apenas
18 alunos optaram por estudar francês, determine:
O ângulo do setor correspondente a francês.a)
O número de alunos que optaram por espanhol e o ângulo correspondente.b)
Fonte: IEZZI, Gelson. Matemática: ciência e aplicações. v. 3. São Paulo: Moderna, 2004.
Figura 20 – Gráfico escola de idiomas.
Espanhol
Francês
Inglês
60
0
10
20
Janeiro Fevereiro Março Abril
Mês
Un
id
ad
es
v
en
di
da
s
Maio Junho
30
40
50
Fonte: PAIVA, Manoel. Matemática. São Paulo: Moderna, 1999.
Figura 19 – Gráfico venda de televisores.
Estatística Aplicada à Gestão – Capítulo 1
65
Estatística Aplicada à Gestão – Capítulo 1
(Enade-2005) A legislação de trânsito brasileira considera que o condutor de um veículo está dirigindo 6.
alcoolizado quando o teor alcoólico de seu sangue excede 0,6 gramas de álcool por litro de sangue. O
gráfico abaixo mostra o processo de absorção e eliminação do álcool quando um indivíduo bebe, em
um curto espaço de tempo, de 1 a 4 latas de cerveja.
Considere as afirmativas a seguir.
O álcool é absorvido pelo organismo muito mais lentamente do que é eliminado.I)
Uma pessoa que vá dirigir imediatamente após a ingestão da bebida pode consumir, no máximo, II)
duas latas de cerveja.
Se uma pessoa toma rapidamente quatro latas de cerveja, o álcool contido na bebida só é com-III)
pletamente eliminado após se passarem cerca de 7 horas da ingestão.
Está (estão) correta(s) a(s) afirmativa(s):
( A ) II, apenas.
( B ) I e II, apenas.
( C ) I e III, apenas.
( D ) II e III, apenas.
( E ) I, II e III.
7. Conceitue “população finita” e “infinita” para a estatística descritiva, exemplificando por meio de uma
situação real.
8. De acordo com a situação descrita na questão anterior, defina as amostras possíveis.
9. Assinale a alternativa correta que define o que é estatística descritiva:
É o cálculo de medidas que permite descrever, com detalhes, o fenômeno que está sendo analisado.a)
É a parte da estatística referente à coleta e à tabulação dos dados.b)
É a parte da estatística referente às conclusões sobre as fontes de dados.c)
É a generalização das conclusões sobre as fontes de dados.d)
É a obtenção dos dados, por meio de simples observação ou mediante a utilização de alguma e)
ferramenta.
0,0
1 2 3 4 5 6 7 8
0,2
0,4
0,6
0,8
1,0
0,9
0,7
0,5
0,3
0,1
1 lata
2 latas
3 latas
4 latas
Tempo (horas)Ál
co
ol
n
o
sa
ng
ue
(g
/li
tro
)
66
Estatística Aplicada à Gestão – Capítulo 1Estatística Aplicada à Gestão – Capítulo 1
10. Assinale a alternativa correta que define o que é “estatística indutiva”:
É o cálculo de medidas que permitirá descrever, com detalhes, o fenômeno que está sendo analisado.a)
É a parte da estatística referente à coleta e à tabulação dos dados.b)
É a parte da estatística referente às conclusões sobre as fontes e os dados.c)
É a generalização das conclusões sobre as fontes de dados.d)
É a obtenção dos dados, por meio de simples observação ou mediante a utilização de alguma e)
ferramenta.
11. Assinale a alternativa correta que define as duas fases do método estatístico:
Criar um problema e coletar dados.a)
Criar um problema e analisar os dados.b)
Elaborar o planejamento de um problema e coletar os dados.c)
Coletar os dados e analisar os dados.d)
Apurar os dados e analisar um problema.e)
12. (Enade-2005) A tabela abaixo mostra como se distribui o tipo de ocupação dos jovens de 16 a 24 anos
que trabalham em 5 regiões metropolitanas e no Distrito Federal:
disTribUiçãO dOs JOVENs OCUPAdOs, dE 16 A 24 ANOs, sEGUNdO POsiçãO NA OCUPAçãO dE
rEGiõEs METrOPOLiTANAs E dO disTriTO fEdErAL – 2005
R
eg
iõ
es
m
et
ro
po
lita
na
s
e
D
is
tri
to
F
e
de
ra
l
Assalariado Autônomos
Em
pr
eg
ad
os
do
m
és
tic
os
O
ut
ra
s
To
ta
l
Setor privado
Se
to
r p
úb
lic
o
To
ta
l
Tr
a
ba
lh
a
pa
ra
o
p
úb
lic
o
Tr
a
ba
lh
a
pa
ra
e
m
pr
es
as
To
ta
l
Co
m
c
ar
te
ira
a
ss
in
ad
a
Se
m
c
ar
te
ira
a
ss
in
ad
a
Belo Horizonte 79,0 72,9 53,2 19,7 6,1 12,5 7,9 4,8 7,4 (1)
Distrito Federal 80,0 69,8 49,0 20,8 10,2 9,8 5,2 4,6 7,1 (1)
Porto Alegre 86,0 78,0 58,4 19,6 8,0 7,7 4,5 3,2 3,0 (1)
Recife 69,8 61,2 36,9 24,3 8,6 17,5 8,4 9,1 7,1 (1)
Salvador 71,6 64,5 39,8 24,7 7,1 18,6 14,3 4,3 7,2 (1)
São Paulo 80,4 76,9 49,3 27,6 3,5 11,3 4,0 7,4 5,3 (1)
Fonte: Convênio Dieese/Seade, MTE/FAT e convênios regionais. PED – Pesquisa de Emprego e Desemprego. Elaboração:
Dieese. Disponível em: <http://www.mp.rs.gov.br/areas/infancia/arquivos/dieese.pdf>. Acesso em: 9 set. 2009.
Nota: (1) A amostra não comporta a desagregação para esta categoria.
Das regiões estudadas, aquela que apresenta o maior porcentual de jovens sem carteira assinada,
dentre os jovens que são assalariados do setor privado, é:
Estatística Aplicada à Gestão – Capítulo 1
67
Estatística Aplicada à Gestão – Capítulo 1
Belo Horizonte.a)
Distrito Federal.b)
Recife.c)
Salvador.d)
São Pauloe)
13. Numa certa universidade, os calouros, ao se matricularem, respondiam a um questionário no qual
constavam, entre outras, as seguintes perguntas:
O que o levou a escolher o curso X?1.
Você cursou o Ensino Médio em escola particular ou pública?2.
Qual é a renda mensal familiar?3.
Qual é a sua disciplina favorita?4.
Quantos irmãos você tem?5.
Você é usuário da Internet?6.
Qual é, aproximadamente, a distância de sua casa até a universidade?7.
É a primeira vez que ingressa no Ensino Superior?8.
Cada uma dessas questões define uma variável.
Quantas questões definem variáveis qualitativas?a)
Quais questões definem uma variável quantitativa resultante de contagem?b)
As questões 14 e 15 referem-se ao exemplo citado na página 41, sobre a pesquisa entre os acadêmi-
cos do curso de Administração.
14. Construa uma tabela de frequência para a variável meio de transporte utilizado para ir à universida-
de.
15. Agrupando dados referentes à idade em classes de intervalos, construa uma tabela de frequência.
Sugestão: Você pode utilizar 6 classes de amplitude igual a 6.
16. A tabela a seguir é resultante de uma pesquisa sobre o tipo de lazer preferido por 50 adolescentes.
Complete os espaços.
LAZEr fA fr POrCENTAGEM
Praticar esportes com os amigos 30 %
computador e videogame 6
25
0 24= ,
Paquerar no shopping
Viajar para a praia 0,14
Total 50 1,0 100 %
68
Estatística Aplicada à Gestão – Capítulo 1
17. Dadas as tabelas, e com o uso do excel, monte um gráfico:
de colunas e outro de setores com o total das vendas de veículos no semestre.a)
de colunas com as vendas de veículos mês a mês no 1b) .o semestre e o tipo de combustível.
de setor com total das vendas de veículos no 1c) .o semestre por tipo de combustível.
de linha, no qual deverão aparecer as vendas por tipo de veículos mês a mês no 1d) .o semestre.
TAbELA 10 – PrOdUçãO dE AUTOVEÍCULOs POr TiPO E COMbUsTÍVEL – 2009
TOTAL GERAL
Janeiro Fevereiro Março Abril Maio Junho TOTAL
185.049 204.379 274.878 253.727 268.877 284.281 1.471.191
1. AUTOMÓVEIS
Total 146.457 164.096 227.021 209.855 220.126 231.950 1.199.505
GASOLINA 15.848 20.855 21.101 23.980 25.793 24.415 131.992
FLEX FUEL 130.195 142.818 205.185 184.757 193.232 206.701 1.062.888
DIESEL 414 423 735 1.118 1.101 834 4.625
2. COMERCIAIS
LEVES
Total 28.370 30.242 35.193 31.839 36.495 39.381 201.520
GASOLINA 3.653 4.189 5.771 4.595 5.197 5.175 28.580
FLEX FUEL 21.358 20.705 23.196 21.420 24.203 26.968 137.850
DIESEL 3.359 5.348 6.226 5.824 7.095 7.238 35.090
3. CAMINHÕES
Total 7.566 7.481 9.781 9.619 9.442 9.651 53.540
DIESEL 7.566 7.481 9.781 9.619 9.442 9.651 53.540
4. ÔNIBUS
Total 2.656 2.560 2.883 2.414 2.814 3.299 16.626
DIESEL 2.656 2.560 2.883 2.414 2.814 3.299 16.626
Janeiro Fevereiro Março Abril Maio Junho TOTAL
GASOLINA 19.501 25.044 26.872 28.575 30.990 29.590 160.572
FLEX FUEL 151.553 163.523 228.381 206.177 217.435 233.669 1.200.738
DIESEL 13.995 15.812 19.625 18.975 20.452 21.022 109.881
TOTAL GERAL 185.049 204.379 274.878 253.727 268.877 284.281 1.471.191
Anotações
Fonte: Anfavea, 2009.
Capítulo 2
Métodos para análise de dados
Medidas de tendência central
Medidas de dispersão
Medidas de assimetria e curtose
Medidas de dispersão entre duas variáveis
Medidas de tendência central
Conteúdo programático
Medidas de posição
Média aritmética (MA)
Dados não agrupados
Média aritmética ponderada
Dados agrupados
Sem intervalos de classe
Com intervalos de classe
Mediana (Md) com dados não agrupados
Mediana (Md) com dados agrupados
Moda (Mo)
Dados não agrupados
Dados agrupados
Sem intervalos de classe
Com intervalos de classe
Objetivos
Realizar cálculos com as medidas de posição central aplicadas à
estatística e identificar a aplicação das mesmas.
Desenvolver o estudo da tendência mais conhecida e importante,
a média aritmética, além de outras, como mediana e moda.
72
x somatório de x
n
i , em que i varia de 1 até n.
dados não agrupados
Quando desejamos conhecer a média de um conjunto de dados não agrupados, usamos a média
aritmética simples. Leia os exemplos a seguir.
mEdidas dE posição
As medidas de posição mostram o posicionamento dos elementos de uma amostra quando está dis-
posta em rol. A seguir, algumas delas serão apresentadas: média aritmética, mediana e moda.
Média aritmética (MA)
A média aritmética, ou simplesmente média, é representada pelo símbolo x e pode ser definida como
a soma de um conjunto de números ou de todos os valores, cujo resultado obtido é dividido pelo número
de elementos somados, representados por n. Inicialmente, estudaremos a média aritmética para dados não
agrupados e, posteriormente, para dados agrupados. Os elementos que serão somados são representados
por x1, x2, x3, ... , xn, e n é a quantidade de elementos que estão sendo calculados.
Dados agrupados
São utilizados sempre que houver uma grande quantidade de dados, os
quais podem ser separados em intervalos de classes,tendo por base
características comuns.
Por exemplo: a turma de 100 alunos do curso de Filosofia da Faculdade
YPE pode ser separada por faixa etária ou pelas notas obtidas numa
prova, concentrando o número de alunos pelo que eles têm em comum
(idade ou nota). As quantidades concentradas em cada classe são cha-
madas de frequência.
Dados não agrupados
São dados que não estão organizados por critérios comuns. Quando
há um conjunto de dados dessa natureza e se deseja conhecer a mé-
dia desses dados, é utilizada a média aritmética simples. Em função
disso, muitas vezes, a média desses dados pode ser um número dife-
rente de todos os elementos da série que ela representa. Quando isso
acontece, a média aritmética não tem existência concreta. Por exemplo:
dado um conjunto de valores ou números 7, 3, 4 e 6, a média aritmética
simples tem valor 5.
A fórmula para o cálculo da média aritmética é:
De forma geral, a média aritmética de dados não agrupados é representada assim:
x =
x + x + x + ... + x
n
1 2 3 n
73
Estatística Aplicada à Gestão – Capítulo 2
Sabendo que a produção diária de vinho caseiro, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 1.
10 litros, determinamos a produção média da semana da seguinte forma:
x = 10 + 14 + 13 + 15 + 16 + 18 + 10
7
= 13,7
Logo, a média aritmética diária semanal é 13,7 litros.
Os dados a seguir mostram as idades de um grupo de amigos do futebol com 22, 20, 21, 24 e 20 2.
anos:
MA = 22 + 20 + 21 + 24 + 20
5
= 107
5
= 21,4
Dizemos que a média aritmética ou, simplesmente, a média de idade do grupo é 21,4 anos.
É necessário determinar a temperatura média em um local, sendo que, medindo a temperatura de hora 3.
em hora, obtiveram-se os seguintes registros: 6h = 14°C, 7h = 15°C, 8h = 15°C, 9h = 18°C, 10h = 20°C,
11h = 23°C:
MA = 14 + 15 + 15 + 18 + 20 + 23
6
= 17,5
Após os cálculos, verificamos que a temperatura média entre o período de 6h até 11h foi de 17,5°C.
As alturas dos alunos da turma de Estatística são: 1,68 m; 1,70 m; 1,60 m; 1,74 m; 1,69 m; 1,77 m; 1,76 m; 4.
1,56 m; 1,74 m; 1,72 m; 1,74 m. Com esses dados, calculamos a média das alturas dos alunos:
MA = 1,68 + 1,70 + 1,60 + 1,74 + 1,69 + 1,77 + 1,76 + 1,74 + 1,72 + 1,74
11
= 1,70 m
A média de altura dos alunos da turma em estudo é 1,70 metros.
Na Empresa Faz Tudo S/C, alguns funcionários ganham, por mês, os seguintes salários em reais: 5.
R$ 880,00; R$ 760,00; R$ 984,00 e R$ 800,00. Para calcularmos a média salarial desses funcionários,
usamos:
MA = 880 + 760 + 984 + 800
4
= 3424
4
= 856
A média salarial paga pela empresa é de R$ 856,00.
As notas bimestrais: 8,0; 5,5; 6,5; 3,0; 4,5; 8,0; 5,5; 6,0; 6,5; 2,0; 4,0; 7,5; 6,5; 4,5; 5,0; 10,0; 4,0; 8,0; 7,0; 6.
8,0 pertencem a uma determinada turma da Faculdade Alfa. O somatório de todas essas notas é 120
e, ao dividir esse resultado pelo número de alunos, 20 no total, obtemos a média x = =120
20
6 0, como
média geral da turma.
MA ou x é a média aritmética simples de um conjunto de dados.
74
x =
x f
f
i i
i
å
å
x
x f
f
i i
i
=
( )
( )
å
å
Média aritmética ponderada
A média aritmética ponderada é calculada pelo somatório dos produtos dos valores pelos pesos de
cada um, dividido pelo somatório dos pesos. Segue um exemplo.
Vamos calcular a média anual de matemática do aluno Aristóteles, sabendo que no primeiro bimestre
a nota foi 5,0; no segundo, 8,0; no terceiro, 5,0; e no quarto, 6,0. Os pesos atribuídos são, respectivamente,
1, 2, 3 e 3.
MAp = 5,0 . 1 + 8,0 . 2 + 5,0 . 3 + 6,0 . 3
9
= 54,0
9
= 6,00
Portanto, a média final de Aristóteles é 6,0.
Seja n os números x1, x2, x3, ... , xn, aos quais são atribuídos fatores de ponderação, ou seja, pesos
P1, P2, P3, ... , Pn, respectivamente, a média aritmética ponderada dos números x1, x2, x3, ... , xn é o
número x, tal que: x =
x P + x P + x P + ... + x P
P + P + P + ... + P
1 1 2 2 3 3 n n
1 2 3 n
.
dados agrupados
sem intervalos de classe
Considerando a distribuição relativa de famílias e tendo como base a variável “número de filhos do sexo
masculino”, apresentamos a seguinte tabela:
N. dE fiLHOs fi
0
1
2
3
4
2
6
10
12
4
∑ = 34
Nesse caso, as frequências, representadas por (fi), são números indicadores da intensidade de cada
valor da variável, ou seja, representam o número de famílias que apresentam a variável indicada. Essas
frequências funcionam como fator de ponderação, que possibilitam calcular a média aritmética pondera-
da, dada pela fórmula:
Fonte: Os autores.
75
Estatística Aplicada à Gestão – Capítulo 2
xi = ponto médio da classe
Com intervalos de classe
Neste caso, o nosso estudo se inicia por meio do desenvolvimento de um exemplo.
Para este exemplo, foi usado como base um grupo de 40 alunos e suas respectivas estaturas. Foi con-1.
vencionado que todos os valores excluídos em um determinado intervalo de classe coincidem com o
seu ponto médio e foi determinada a média aritmética ponderada por meio da fórmula:
x
x f
f
i i
i
=
å
å
A fórmula do ponto médio com intervalo de classe é:
Considere, agora, esta distribuição:
i EsTATUrAs (cm) fi
1
2
3
4
5
6
150 |— 154
154 |— 158
158 |— 162
162 |— 166
166 |— 170
170 |— 174
4
9
11
8
5
3
∑ = 40
Na tabela seguinte, procedemos da mesma maneira da tabela anterior, ou seja, inserimos uma coluna
para os cálculos dos pontos médios (xi) e outra para o produto da frequência com o ponto médio (xifi):
Para obtenção da média ponderada de forma prática, completamos a tabela abrindo uma coluna cor-
respondente ao produto número de filhos e número de famílias (xifi):
xi fi xifi
0
1
2
3
4
2
6
10
12
4
0
6
20
36
16
∑ = 34 ∑ = 78
Fonte: Os autores.
Temos, então: ∑ xifi = 78 e ∑ fi = 34.
x
x f
f
i i
i
= = =
å
å
78
34
2 3,
Fonte: Os autores.
xm =
L + L
2
inf sup
76
i
EsTATUrAs
(cm)
fi xi xifi
1
2
3
4
5
6
150 |— 154
154 |— 158
158 |— 162
162 |— 166
166 |— 170
170 |— 174
4
9
11
8
5
3
152
156
160
164
168
172
608
1 404
1 760
1 312
840
516
∑ = 40 ∑ = 6 440
Com o somatório da coluna xifi = 6 440 e o somatório da coluna fi = 40, obtemos:
x
x f
f
cmi i
i
= = =
å
å
6 440
40
161
Logo, a estatura média dessa amostra é de 161 cm.
2. Observe um exemplo de aplicação com distribuição de frequência das estaturas em centímetros de
uma amostra de jogadores de Futsal da Faculdade Alfa.
CLAssE
(EsTATUrAs EM CENTÍMETrOs)
frEqUêNCiA (f)
(NúMErOs dE ALUNOs)
150,5 |— 156,5 4
156,5 |— 160,5 5
160,5 |— 168,5 8
168,5 |— 178,5 3
∑ 20
Vamos determinar a estatura média dos jogadores da amostra quando as classes não são unitárias.
Nesse caso, o procedimento para calcular a média é o seguinte:
1.o) Inserimos uma coluna no centro para os pontos médios (xm) e, em seguida, calculamos cada
ponto médio da classe.
CLAssE PONTO MédiO (xm) frEqUêNCiA (f)
150,5 |— 156,5 150,5 + 156,52 153 5= , 4
156,5 |— 160,5 156,5 + 160,52 158 5= , 5
160,5 |— 168,5 160,5 + 168,52 164,5= 8
168,5 |— 178,5 168,5 + 178,52 = 173,5 3
∑ 20
Fonte: Os autores.
Fonte: Os autores.
Fonte: Os autores.
77
Estatística Aplicada à Gestão – Capítulo 2
2.o) Multiplicamos o valor médio encontrado (xm) da classe pela respectiva frequência (f). O resultado
desse produto é o valor de (xm . f); isso deve ser feito para todas as classes da tabela.
xm= (153,5 . 4) + (158,5 . 5) + (164,5 . 8) + (173,5 . 3)
3.o) Fazemos o somatório dos produtos realizados no item anterior.
xm = ∑ = 3 243
4.o) Atribuímos à fórmula os valores encontrados, ou seja, o somatório do produto da coluna (xm . f) e
o somatório das frequências da coluna (f),obtemos:
x = 153,5 . 4 + 158,5 . 5 + 164,5 . 8 + 173,5 . 3
4 + 5 + 8 + 3
= 3 243
20
= 162,15
Assim, concluímos que a estatura média dos jogadores desta amostra é 162,15 cm.
Observe o exemplo a seguir, em que os procedimentos são idênticos ao anterior.
3. Veja, agora, o cálculo da média aritmética ponderada da turma de Turismo que realizou uma avaliação
de matemática, obtendo os seguintes resultados:
NOTAs frEqUêNCiA (f)
0 |— 1 4
1 |— 2 5
2 |— 3 7
3 |— 4 8
4 |— 5 9
5 |— 6 14
6 |— 7 8
7 |— 8 6
8 |— 9 5
9 |— 10 4
∑ 70
Os resultados da tabela estão representados em intervalos ou classes e, para calcular a média arit-
mética ponderada, procedemos da mesma maneira que anteriormente: calculamos o ponto médio de cada
classe; multiplicamos pela frequência da classe, respectivamente; e dividimos pelas frequências.
x = 0,5 . 4 + 1,5 . 5 + 2,5 . 7 + 3,5 . 8 + 4,5 . 9 + 5,5 .. 14 + 6,5 . 8 + 7,6 . 6 + 8,5 . 5 + 9,5 . 4
4 + 5 + 7 + 8 + 9 + 14 + 8 + 6 + 5 + 4
x = 2 + 7,5 + 17,5 + 28 + 40,5 + 77 + 52 + 45 + 42,5 + 38
70
x = =350
70
5
O valor obtido, 5, é a média aritmética ponderada das notas dessa classe.
Fonte: Os autores.
78
Mediana (Md) com dados não agrupados
A mediana acontece numa disposição em um conjunto de dados numéricos em rol, ou seja, em ordem
crescente: x1, x2, x3, ... , xn.
Se o número de elementos do rol for ímpar, chamamos de mediana (Md) o termo que estiver no centro
desse rol, calculado pela fórmula abaixo, em que n é o número de elementos do rol.
Agora, se o número de elementos for par, chamamos de mediana a média aritmética simples entre os
termos centrais do rol, isto é, xi e x(i+1), representada pela fórmula a seguir:
As estaturas dos atletas da equipe de futsal da faculdade, em centímetros, são: 190; 184; 179; 178; 1.
181.
O rol do conjunto desses atletas é: 178; 179; 181; 184; 190.
Como o número de atletas desse conjunto é ímpar, calculamos a mediana pela fórmula:
Md = 5 + 1
2
= 3
Observe que o atleta que está na terceira posição do rol será a mediana (Md) dessa amostra, isto é,
Md = 181 cm.
Neste exemplo, é apresentado o rol de notas dos alunos de uma turma de Engenharia Civil da Facul-2.
dade Alfa, na disciplina de Cálculo Numérico.
2,0 3,0 4,0 4,0 4,5 4,5 5,0 5,5 5,5 6,0 6,5 6,5 6,5 7,0 7,5 8,0 8,0 8,0 8,0 10,0
Md = n + 1
2
Md =
x + x
2
i i+1
A palavra “média” dá a ideia de meio, metade. Sendo assim, na lin-
guagem matemática e estatística, média se relaciona com a soma de
valores de um conjunto determinado de medidas, a qual é dividida pela
quantidade de valores presentes no referido conjunto, ou seja, a repre-
sentação da distribuição central dos valores num determinado conjunto
de amostras. Quando procedemos dessa forma, temos a média aritmé-
tica simples, cujo uso é comum nas estimativas diárias.
No entanto, em algumas situações, a média aritmética é atípica, dis-
torcendo a interpretação dos dados da realidade para mais ou para
menos. Por exemplo: se for feita a média aritmética dos salários de
uma empresa, o número resultante pode ser considerado aceitável ou
bom no sentido de que os ganhos estejam bem distribuídos. No en-
tanto, pode acontecer que haja um número pequeno de funcionários
ganhando muito bem e, em contrapartida, a grande maioria ganhando
salários muito baixos. Ou seja, a distribuição, que deveria ser por igual,
acontece de forma desequilibrada. Tal situação aparece muitas vezes
na realidade brasileira.
79
Estatística Aplicada à Gestão – Capítulo 2
Nem sempre o cálculo da média de números inteiros resulta em divisão
com resultado exato.
3. Observe o resultado da pesquisa feita na sala da turma de Biologia da Faculdade Livre, sobre o número
de irmãos de cada aluno:
NúMErO dE irMãOs fA
0 8
1 15
2 12
3 5
Total 40
Média aritmética ponderada:a)
MA = 8 . 0 + 15 . 1 + 12 . 2 + 5 . 3
40
= 0 + 15 + 24 + 15
400
= 54
40
= 1,7 irmão
Mediana – neste caso, como os dados estão em frequência, precisamos colocar em ordem cres-b)
cente (rol). Atenção, pois o número de elementos é par:
0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Os elementos centrais são o 20.o e o 21.o, conforme sinalizado na régua. Agora, utilizamos a fórmula do
exercício 2:
Md = 1 + 1
2
= 1
Logo, Md = 1 irmão.
Fonte: Os autores.
Mediana (Md) com dados agrupados
Para o cálculo seguinte, vamos aproveitar o mesmo exemplo utilizado na média aritmética para calcular 1.
a mediana com dados agrupados.
FA é frequência absoluta.
Md = 6,0 + 6,5
2
= 6,25
Como os elementos já estão na ordem crescente (rol) e o número de elementos é par, observamos que
os termos centrais são 6,0 e 6,5, portanto, a mediana será calculada pela fórmula:
80
1.o) Inserimos uma coluna para o cálculo da frequência acumulada.
i EsTATUrAs (cm) fi fac
1
2
3
4
5
6
150 |— 154
154 |— 158
158 |— 162
162 |— 66
166 |— 170
170 |— 174
4
9
11
8
5
3
4
13
24
32
37
40
∑ = 40
2.o) Determinamos o valor de n
2
utilizando o somatório das frequências. Não importa se o número é
par ou ímpar, neste caso, o valor é 40
2
20= .
3.o) Identificamos em que classe ou intervalo está contida a mediana. Para tanto, observamos, na ta-
bela anterior, que o valor de n, que é 20, encontra-se no 3.o intervalo ou classe, cujos valores estão
compreendidos entre 158 e 162 centímetros.
4.o) Utilizamos a fórmula para calcular a mediana e atribuímos os valores conforme solicitado.
Md = L +
n
2
f
fi
ant
Md
–å
æ
è
ççç
ö
ø
÷÷÷
. A
Li = limite inferior da classe que contém a mediana.
n = tamanho da amostra ou população que está sendo pesquisada.
∑fant = soma das frequências anteriores à classe que contém a mediana.
A = amplitude da classe que contém a mediana.
fMd = frequência da classe que contém a mediana.
Substituindo os valores, obtemos:
Md = 158 +
40
2
13
11
. 4 Md = 158 +
(20 13)
11
. 4 Md = 15
–
–( ) ® ® 88 + 28
11
= 160,54 cm
Moda (Mo)
É possível definir moda como: o uso, de acordo com o gosto do momento ou da época, de um deter-
minado tipo de roupa, calçado, corte de cabelo, etc.; a maneira ou modo segundo o qual cada um vive; as
músicas ou danças do momento. Num restaurante, normalmente, encontra-se um prato “à moda da casa”,
que é feito de maneira especial pelo estabelecimento ou por determinada pessoa.
Em estatística, moda é o valor central de uma classe de frequência máxima que está sendo analisada,
pesquisada para tomada de decisão. Isto é, a moda estatística é o valor que ocorre com maior frequência
ou número de vezes numa série de valores ou observações. A moda pode não ser única, diferentemente da
Fonte: Os autores.
81
Estatística Aplicada à Gestão – Capítulo 2
Dentro das pesquisas, pode acontecer que na amostra não exista
moda, isto é, nenhum dos valores aparece mais vezes que outros.
Em outros casos, podem existir dois ou mais valores de maior con-
centração. Assim, obtemos dois ou mais valores modais. Observe os
exemplos.
{–3, –1, 0, 3, 5, 8, 10, 12, 15} não apresenta nenhum número com a)
repetição, ou seja, não existe moda.
{1, 2, 2, 2, 3, 4, 4, 5, 6, 7, 7, 7, 8, 9, 10, 10} apresenta duas modas: b)
2 e 7.
dados agrupados
sem intervalos de classe
Quando os dados estão agrupados, basta verificar o valor da variável de maior frequência para deter-
minar imediatamente a moda ou modal.
Considere as temperaturas abaixo a fim de determinar a temperatura mais comum medida no mês 1.
julho de 2009 no sul do país.
TEMPErATUrAs – frEqUêNCiA AbsOLUTA
0°C → 3 3°C → 9 5°C → 12 9°C → 6
Logo, 5°C é a temperatura modal, pois é a que tem maior frequência.A tabela a seguir é referente às vendas diárias de impressoras jato de tinta, durante o mês de junho de 2.
2009, por uma loja de produtos específicos de informática. Vamos determinar a moda correspondente
ao número de vendas.
média aritmética e mediana. Quando a média ou a mediana não são bem-sucedidas ou definidas, a moda
será útil. Isso pode ser chamado de “modal da amostra pesquisada”.
dados não agrupados
A moda é facilmente reconhecida quando os dados estão colocados em ordem crescente ou
rol. De acordo com a definição, procuramos o valor que mais se repete na amostra. Seguem alguns
exemplos.
Na série {7, 8, 9, 10, 10, 10, 11, 12}, a moda é igual a 10.2.
Dados os valores, em reais, de uma amostra de impressoras jato de tinta, pesquisada nas lojas de 3.
equipamentos de informática, descobriremos a moda correspondente ao preço das impressoras.
250 344 437 348 342 240 344
A moda ou modal desta pesquisa é o valor R$ 344,00, que ocorre com mais frequência dentro da
amostra.
82
Amplitude é a diferença entre o limite superior e o limite inferior da
classe.
A moda ou modal é utilizada quando se pretende obter uma medida
rápida e aproximada de posição ou quando a medida de posição deva
ser o valor mais típico da distribuição.
NúMErO dE VENdAs fi
10 1
11 3
12 4
13 5
14 7
15 2
16 1
17 1
∑ fi = 24
O modal é 14, pois é o que tem maior frequência na amostra dessa tabela.
Com intervalos de classe
No estudo da moda numa classe de frequência, classe modal é aquela que se apresenta o maior nú-
mero de vezes. Conforme definição, moda é o valor dominante que está compreendido entre os limites da
classe modal e é semelhante ao cálculo utilizado na mediana. O mais simples (e mais impreciso) é o cálculo
do ponto médio da classe que contém a moda (ou classe modal). Esse valor é a moda bruta:
Mo = l*+ L*
2
l* = limite inferior da classe modal
L*= limite superior da classe modal
A moda também pode ser determinada por fórmulas ou gráficos. Há, ainda, o método de King e o de
Czuber. Utilizaremos o método de Czuber, porque é mais preciso nos cálculos:
Mo = L +
f . A
f + fi
post
ant post
Li = limite inferior da classe que contém a moda.
fpost = frequência da classe posterior à classe que contém a moda.
fant = frequência da classe anterior à classe que contém a moda.
A = amplitude da classe que contém a moda.
Fonte: Os autores.
83
Estatística Aplicada à Gestão – Capítulo 2
Determinaremos a moda da distribuição de frequências da tabela a seguir:1.
1.o) Inserimos uma coluna para o cálculo da frequência acumulada.
idAdEs frEqUêNCiA (f) frEqUêNCiA ACUMULAdA (fac)
15 |— 18 7 7
18 |— 21 9 16
21 |— 24 10 26
24 |— 27 11 37
27 |— 30 17 54
30 |— 33 16 70
33 |— 36 10 80
36 |— 39 11 91
39 |— 42 9 100
(∑) 100
2.o) Identificamos em que classe se encontra a moda ou classe modal, para depois realizarmos os cál-
culos. A maior frequência, ou seja, aquela em que encontramos a maior concentração de idades,
está presente na 5.a classe, no intervalo com idades de 27 a 30, com 17 ocorrências.
3.o) Substituímos os valores na fórmula:
Mo = 27 + 16 . 3
11 + 16
= 27 + 48
27
= 28,78 anos
Portanto, a moda neste exemplo é: Mo = 28,78 anos.
Determinaremos a moda (Mo) da pesquisa feita sobre o peso, em quilogramas, de um grupo de 2.
pessoas. O objetivo principal desse cálculo é a avaliação dos pesos dos integrantes deste grupo.
PEsO (Kg) fA
40 |— 44 1
44 |— 48 3
48 |— 52 7
52 |— 56 6
56 |— 60 3
Total 20
Fonte: Os autores.
Fonte: Os autores.
Já a média aritmética é a medida de posição central que possui maior
estabilidade e confiabilidade.
A frequência maior é 7, que aparece no intervalo 48 |— 52, representado por 50, que é o ponto médio.
Neste exemplo, está sendo utilizada a fórmula mais simples para o cálculo da moda; já no exemplo
anterior, a fórmula que foi utilizada é mais complexa, no entanto, mais precisa.
Mo = l* + L*
2
= 48 + 52
2
= 50
Logo, Mo = 50 kg.
84
O UsO dA MédiA COMO iNdiCAdOr
No Poder Judiciário como um todo, a celeridade no processamento judicial é um objetivo perma-
nente, inclusive para a redução do acervo pendente de julgamento. Dito de outra forma, além de dar
conta da demanda jurisdicional atual, há que diminuir os estoques remanescentes.
Para enfrentar esta questão, procura-se inicialmente fazer um levantamento da situação a fim
de diagnosticá-la e estabelecer ações. Normalmente, busca-se identificar o quantitativo de processos
julgados (ou baixados), relacionando-o ao tempo que cada um destes consumiu em sua tramitação ou,
se em relação ao acervo, ao tempo que o processo encontra-se no respectivo órgão.
Os dados que constituem a base de toda informação a ser analisada neste propósito precisam ser resu-
midos. Assim, são utilizados normalmente para a composição de médias (média aritmética ou ponderada),
estas de fácil obtenção. Basta que para cada processo seja verificada a data de autuação (ou distribuição)
e a data de julgamento (ou de baixa), somar todos estes intervalos em dias e dividir pelo quantitativo de
processos considerados, quando se estiver interessado no tempo de julgamento ou de baixa.
A partir daí, a média passa a ser considerada indicador gerencial, utilizada para avaliar sua ade-
quação frente às metas estabelecidas (quando existentes), possibilitando, então, ações de correção
que visem ao seu alcance ou, até mesmo, a ajustes em metas eventualmente submensuradas. De
qualquer forma, em ambos os casos, o indicador – gerado pela média – ocupa a centralidade da análi-
se, em caráter indispensável para o gerenciamento, de acordo com a máxima da administração: o que
não é medido não é gerenciado.
Ocorre que a média é uma medida de tendência central. Tal como a mediana, dá o valor do ponto
em torno do qual os dados se distribuem. Sabe-se também que a média é tanto mais apropriada para
descrever um conjunto de dados quanto mais simétrica for a distribuição, ou seja, a média pode repre-
sentar melhor a tendência central quando os valores estão distribuídos simetricamente em torno da
mesma, o que normalmente não ocorre quando se trata de processos julgados.
Assim, pode-se entender que a média tomada de forma isolada não permite uma boa interpretação
da situação e, por conseguinte, deixa de considerar aspectos relevantes, quiçá desconhecidos por
parte dos usuários que se valem desta informação.
Enfim, qual o problema?!
Ao saber que a média representa todos os valores de uma distribuição (quociente da soma de n
valores por n), pode-se dizer, em exemplo bem simples, que uma pessoa com a cabeça à temperatura
de 60°C e os pés à temperatura de –10°C apresenta uma temperatura corporal de 25°C. Nada mal! A
questão da média, portanto, é que, ao ser representativa de todos os valores, ao considerar os extre-
mos, pode distorcer a compreensão da real situação sob análise.
E no caso dos processos? Neste caso específico, há aqueles que foram solucionados rapidamente
e há os mais antigos que, por uma série de circunstâncias, tiveram a tramitação interrompida ou res-
taram muito tempo no aguardo do processamento. Isto certamente irá distorcer os cálculos em função
do grau de dispersão.
Quanto à dispersão, conhecê-la é medida complementar indispensável para qualificar a informa-
ção e, neste sentido, a estatística nos socorre com o cálculo de dispersões, como a variância, o desvio
padrão e o coeficiente de variação.
Dentre estas medidas, pode-se evidenciar o desvio padrão. Como regra, quanto maior o desvio
padrão, maior a dispersão das variáveis em torno da média, ou seja, mais os valores diferem da média.
Leitura complementar
85
Estatística Aplicada à Gestão – Capítulo 2
Logo, uma mesma média pode estar vinculada a situações totalmente diversas, estas sinalizadas pelo
desvio padrão correspondente.As inferências devem decorrer desta análise.
Exemplificando, ao considerar o tempo de 4 entregas de 3 empresas (A, B e C), conforme a tabela
abaixo, verifica-se que a média do tempo de entrega é a mesma. Porém, qual empresa tem todos os
tempos de entrega mais próximos da média? Se tivesse que optar por uma delas, sobre qual recairia
a escolha?
EMPrEsA TEMPO dAs ENTrEGAs (diAs) MédiA (diAs) dEsViO PAdrãO (diAs)
A 4 6 4 6 5 1,15
B 9 1 5 5 5 3,27
C 9 1 2 8 5 4,08
Como pode ser observado, o desvio padrão aumenta quando a dispersão das variáveis sob análise
(tempo de entrega) também aumenta, identificando a dispersão.
Um desvio padrão pode ser considerado elevado ou não dependendo da ordem de grandeza da
variável, isto é, um desvio padrão de 10 pode ser considerado pouco significativo se a média corres-
pondente for 100, mas muito expressivo se esta média for 8.
A questão posta, então, é a utilização da média com a complementação de outra medida que
informe a dispersão dos dados (desvio padrão) a fim de enriquecer e, mais que isso, assegurar um
diagnóstico mais preciso sobre o evento enfocado.
Ao trazer estas considerações para a realidade da movimentação processual, a média tomada
como medida exclusiva a informar o tempo de julgamento, quando o desvio padrão for elevado, deve
ser usada com certa reserva para comparações. Neste caso, o uso da mediana – outra medida de
tendência central, que indica o tempo médio de 50% dos valores analisados igual ou menor a média –
pode ser um importante complemento à análise.
Aplicando-se a um exemplo prático: ao levantar-se o tempo médio de julgamento dos processos no
TRF 4R, no 1.o semestre de 2008, chegou-se a 335 dias, considerados 50 906 processos no período.
Em complementação da análise, o desvio padrão calculado foi de 500 dias. Até aqui, estas informações
indicam a existência de um alto grau de dispersão, ou seja, a existência de muitos processos julgados
em tempos mínimos e outros tantos com elevados tempos de permanência nos órgãos julgadores.
Mas ao avançar na análise calculando a mediana, descobre-se que 25 509 processos (50,1% do
total de julgados) tiveram um tempo inferior ou igual a 106 dias para o julgamento.
Diante do exemplo, fica evidenciado que, enquanto a média nos informa de uma forma muito
abrangente que o tempo entre a autuação e o julgamento de um processo “típico” está próximo a 335
dias, a mediana especifica esta informação, conferindo-lhe maior qualidade, ao indicar que 50,1% (cer-
ca de metade) dos processos tiveram este mesmo tempo com valores iguais ou inferiores a 106 dias.
Enfim, é neste sentido que – com a disponibilidade de outras tantas medidas que a estatística
pode alcançar –, a utilização de medidas complementares à média no diagnóstico de situações, ainda
mais as relacionadas à movimentação processual, reveste-se de meio indispensável ao tratamento
de dados com a finalidade de gerar informações mais precisas e de maior qualidade, cujo objetivo é o
planejamento e a adoção de ações que visem ao aperfeiçoamento do atendimento ao jurisdicionado,
inclusive quanto à transparência, e, em última análise, ao cumprimento da missão constitucionalmente
instituída.
BONATO, José Carlos. O uso da média como indicador.
Disponível em: <http://www.ibrajus.org.br/revista/artigo.asp?idArtigo=97>. Acesso em: 19 ago. 2009.
86
BIANCHINI, Edwaldo; PACCOLA, Herval. Curso de matemática. 2. ed. São Paulo: Moderna, 1999.
BONATO, José Carlos. O uso da média como indicador. Disponível em: <http://www.ibrajus.org.br/revista/artigo.
asp?idArtigo=97>. Acesso em: 19 ago. 2009.
CASTANHEIRA, Nelson Pereira. Estatística aplicada a todos os níveis. 2. ed. Curitiba: Ibpex, 2005.
DANTE, Luiz Roberto. Matemática: contexto & aplicações. São Paulo: Ática, 2001.
DOWNING, Douglas; CLARK, Jeffrey. Estatística aplicada. São Paulo: Saraiva, 1998.
McCLAVE, James T.; BENSON, P. George; SINCICH, Terry. Estatística para administração e economia. 10. ed. São
Paulo: Pearson/Prentice Hall, 2008.
PAIVA, Manoel Rodrigues. Matemática. São Paulo: Moderna, 1995.
referências
Anotações
Você estudou:
As medidas de tendência central visam encontrar o valor do ponto em torno do qual os dados ou conjun-
to de dados e/ou objetos se distribuem numa amostra pesquisada, com objetivo de encontrar resultado
próximo da realidade esperada ou procurada.
A média aritmética e mediana são cálculos apropriados para descrever um conjunto de dados que preza
pela mais simétrica distribuição, ou seja, a média ou a mediana podem representar a melhor tendência
central.
A moda, por sua vez, pode não ser um valor exato, mas apresenta a tendência que está em torno de
determinados valores ou objetos mais comuns do grupo pesquisado ou analisado, podendo ter mais de
um modal.
síntese
Para aprofundamento das questões traba-
lhadas nesta disciplina, você pode ler o livro
Estatística aplicada à administração, de
William J. Stevenson. Nesta obra, o conteúdo
é exposto de forma didática e contém exem-
plos práticos. Ela é destinada justamente a
estudantes que buscam entender como a es-
tatística pode auxiliar na tomada de decisões
empresariais.
Medidas de dispersão
Conteúdo programático
Medidas de dispersão
Amplitude total ou intervalo total
Dados agrupados em classes ou intervalos
Amplitude semi-interquartílica
Quartis
Decis
Percentis
Desvio médio (D
m
)
Variância (S 2)
Desvio padrão (D p ou S)
Objetivos
Entender o conceito de “medidas de dispersão”, que procuram
apresentar como os elementos de um conjunto de dados se comportam
em torno da região central.
Verificar como essas medidas mostram se os elementos do conjunto
estão mais ou menos dispersos em relação à média.
Adquirir conhecimentos suficientes para realizar cálculos com as
principais medidas de dispersão e identificar suas aplicações.
88
mEdidas dE dispErsão
As medidas de dispersão são de extrema importância para análise de dados e caracterizam-se pela
aproximação ou pelo afastamento dos dados em relação à média. Essas medidas são meios estatísticos
utilizados para pesquisar ou verificar como os dados se dispersam em relação à média aritmética e/ou me-
diana, que representam os valores centrais encontrados na amostra, para depois tomar uma decisão.
Na medida de dispersão, são usadas as análises de:
desvio em relação à média;
desvio absoluto;
desvio médio absoluto;
variância;
desvio padrão.
As medidas podem se referir, por exemplo, à distribuição de notas para os alunos da turma de uma
escola ou faculdade em determinada disciplina, à altura das 30 alunas do curso de Pedagogia, etc. Analise
os exemplos a seguir.
Observe as seguintes situações:1.
Antônio tem R$ 15,00, e sua irmã também.a)
Antônio tem R$ 10,00, e sua irmã tem R$ 20,00.b)
Perceba que, em ambas as situações, a média é igual a R$ 15,00. Porém, na situação a, as variáveis se
concentram sobre a média. Já na situação b, dispersaram-se e os valores estão afastados da média.
Observe que a média é muito mais representativa na situação a do que na b. Em a, há uma homoge-
neidade financeira entre os irmãos, enquanto em b existe uma heterogeneidade.
Um professor de Educação Física é encarregado de organizar uma atividade de lazer no final de 2.
semana em um clube de campo para um grupo de seis pessoas. Ele recebe a informação da direção
do clube de que a média de idade do grupo é 18 anos. Essa informação não é suficiente para o pla-
nejamento das atividades, pois é possível ter características totalmente diferentes na média, conforme
demonstrado a seguir.
Grupo A: 18 anos, 18 anos, 18 anos, 18 anos, 18 anos, 18 anosa)
MA = 18 + 18 + 18 + 18 + 18 + 18
6
= 108
6
= 18 anos
Grupo B: 13 anos, 22 anos, 24 anos, 18 anos, 13 anos, 18 anos b)
MA = 13 + 22 + 24 + 18 + 13 + 186
= 108
6
= 18 anos
Grupo C: 2 anos, 42 anos, 40 anos, 5 anos, 9 anos, 10 anosc)
MA = 2 + 42 + 40 + 5 + 9 + 10
6
= 108
6
= 18 anos
Como a medida de tendência central não é suficiente para caracterizar os grupos, é conveniente utilizar
medidas que expressem o grau de dispersão de um conjunto de dados em estudo. As dispersões mais
utilizadas são a variância e o desvio padrão, apresentados mais adiante.
89
Estatística Aplicada à Gestão – Capítulo 2
Amplitude total ou intervalo total
Amplitude total ou intervalo total é a diferença entre o maior e o menor valor numa série de dados. Ou
seja, a diferença entre o último e o primeiro elemento do rol. Por exemplo, em 2, 5, 6, 8, 9, 11, 13, 18, 19,
26, a amplitude total será A = 26 – 2 = 24.
dados agrupados em classes ou intervalos
Quando os dados estão agrupados em classes ou intervalos, o cálculo da amplitude total pode ser feito
de duas formas, pelo(s):
ponto médio das classes: neste caso, a amplitude total é igual ao ponto médio da última classe
menos o ponto médio da primeira classe;
limites das classes: neste caso, a amplitude total é igual ao limite superior da última classe menos
o limite inferior da primeira classe.
Observe o exemplo de distribuição de frequências:
idAdEs frEqUêNCiA (f)
16 |— 19 9
19 |— 22 12
22 |— 25 12
25 |— 28 17
28 |— 31 16
31 |— 34 14
34 |— 37 11
37 |— 40 9
O cálculo da amplitude total pode ser feito em duas situações:
pelo ponto médio da última classe menos o ponto médio da primeira classe:a)
A = 38,5 – 17,5 = 21
pelo limite superior da última classe menos o limite inferior da primeira classe:b)
A = 40 – 16 = 24
A amplitude total ou intervalo total é a medida mais simples de dispersão, mas apresenta algumas
restrições quanto a sua utilização, pois é muito instável. Essa instabilidade ocorre porque a amplitude total
leva em consideração apenas os valores externos da série e não é afetada pela dispersão dos valores
internos.
Amplitude semi-interquartílica
Antes de explicarmos amplitude semi-interquartílica, é necessário esclarecer que as medidas de posi-
ção são semelhantes à mediana, apesar de não serem medidas de tendência central.
Separatrizes são conjuntos de parâmetros que subdividem uma série ordenada em várias partes iguais.
Verifique as nomenclaturas seguintes.
Quartis – Dividem a série em 4 partes iguais, cada parte representa 25%: Q 1, Q2 e Q3.
O segundo quartil (Qa) 2) coincide com a mediana (Q2 = Md).
Fonte: Os autores.
90
O terceiro quartil (Qb) 3) é o valor situado de tal modo que as três partes, 75% dos termos, são meno-
res que ele e uma quarta parte (25%) é maior.
Decis – Dividem em 10 partes iguais, cada parte representa 10%. D 1, D2 ......D9.
Percentis – Dividem em 100 partes iguais, cada parte representa 1%. P 1, P2, ...., P51, .......P99.
quartis
Q 1: 25% dos termos da série têm um valor menor do que o valor calculado pela fórmula.
Q 2: 50% dos termos da série têm um valor menor que o calculado.
Q 3: 75% dos termos da série têm um valor menor que o calculado.
decis
D 1: 10% dos termos da série têm um valor menor do que o valor calculado pela fórmula.
D 5: 50% dos termos da série têm um valor menor que o calculado.
D 7: 70% dos termos da série têm um valor menor que o calculado.
Percentis
P 1: 1% dos termos da série tem um valor menor do que o valor calculado pela fórmula.
P 35: 35% dos termos da série têm um valor menor que o calculado.
P 89: 89% dos termos da série têm um valor menor que o calculado.
P 99: 99% dos termos da série têm um valor inferior ao calculado.
Quartis, decis e percentis podem ser utilizados para definir: faixas de controle no CEP (Controle Es-
tatístico de Processo), faixas de premiação de comissões de vendedores, classes de salários de uma
empresa, etc. Exemplo: na série de 11 observações apresentada na tabela abaixo, vamos estabelecer as
observações em ordem crescente:
39 31 19 27 42 24 32 18 43 15 38
Fazendo o rol, ou seja, colocando em ordem crescente, temos:
15 18 19 24 27 31 32 38 39 42 43
1 2 3 4 5 6 7 8 9 10 11
P = x 1
n 1
. 100%–
–
x = n 1 . P
100
+ 1–( )
x = ordem ou posição ordinal na série
P = percentil
n = número de termos da série
Quando conhecemos a ordem ou a posição do termo, é possível conhecer a que porcentual ele se
refere. Se é conhecido, por exemplo, que a ordem é 2, ou seja, x = 2, aplicamos a fórmula substituindo o
valor de x e o valor de n.
P = x 1
n 1
. 100 2 1
11 1
. 100 = 10%–
–
–
–
®
91
Estatística Aplicada à Gestão – Capítulo 2
Com o resultado, obtemos a seguinte informação: 10% dos termos da série têm valor menor que o 2.o
termo da série. Para calcular as outras posições, basta repetirmos o procedimento e, ao final, encontrare-
mos os seguintes resultados:
Série 15 18 19 24 27 31 32 38 39 42 43
Ordem 1 2 3 4 5 6 7 8 9 10 11
Percentis 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Partindo dos quartis, representamos, a seguir, um conjunto de dados em que seus elementos foram
divididos em quatro partes iguais:
Q 1 = primeiro quartil
Q2 = segundo quartil (coincide com a mediana)
Q3 = terceiro quartil
A amplitude semi-interquartílica (intervalo semi-interquartílico ou desvio quartil) é utilizada para veri-
ficar a dispersão em relação à mediana. O cálculo leva em consideração o primeiro e o terceiro quartis. A
fórmula é:
D =
Q Q
2q
3 1–
Dq = desvio quartil
Q1 = primeiro quartil
Q3 = terceiro quartil
No desvio quartil, no intervalo definido pelos limites (Md – Dq) e (Md + Dq), são encontrados 50% dos
elementos da série, aproximadamente. No caso da distribuição ser simétrica, essa porcentagem será
exata.
Outra grande importância do desvio quartil é o fato de ser uma medida não afetada pelos valores extre-
mos da série, portanto, será útil quando esses valores extremos não forem representativos.
Md é a mediana.
Como exemplo, temos a aplicação de uma avaliação numa turma de alunos das disciplinas de Geogra-
fia e Português, com as seguintes medidas:
Geografia a) Md = 6; Q1 = 4,5; Q3 = 7,5
Português b) Md = 6; Q1 = 3,5; Q3 = 8,5
Percebemos que, nos dois testes, a mediana foi igual a 6,0. No entanto, as notas de Geografia apresen-
tam uma dispersão menor que as de Português, ou seja, a distância entre as notas é menor.
0% 25% 50% 75% 100%
Q1 Q2 Q3
92
desvio médio (dm)
Com o objetivo de analisar a dispersão ou o afastamento dos valores de uma série de dados em rela-
ção à média, é prudente que a análise seja feita na dispersão em cada um dos valores. Isso é chamado de
desvio médio (Dm), que pode ser calculado pela fórmula:
D =
x x . f
nm
–å
A representação |x – x| é o módulo de cada desvio em relação à média.
Trabalhamos com desvio médio porque, em conformidade com a pro-
priedade da média aritmética, a soma de todos os desvios em relação
à média é sempre zero. Portanto, ao trabalhar com o módulo (o valor
sempre é positivo), não se corre o risco de zerar a soma.
Sendo um conjunto com uma série de números, vamos calcular o desvio médio.1.
4 6 8 9 10 11
1.o) Calculamos a média aritmética dos dados somando o conjunto de números da amostra e dividindo
pela quantidade de elementos da amostra.
x = 4 + 6 + 8 + 9 + 10 + 11
6
= 8
2.o) Montamos uma tabela para melhor representar os dados, sendo que: na primeira coluna estão
apresentados os números da série; na segunda coluna, aparece o desvio relativo (que é o valor
de xi menos a média aritmética calculada acima); na terceira coluna, o desvio absoluto, ou seja,
em módulo:
x xi – y |xi – x|
4
6
8
9
10
11
4 – 8 = –4
6 – 8 = –2
8 – 8 = 0
9 – 8 = 1
10 – 8 = 2
11 – 8 = 3
4
2
0
1
2
3
∑ 0 12
3.o) Agora, é possível calcularmos o desvio médio absoluto, utilizando o somatório dos dadosda
terceira coluna da tabela anterior dividido pela quantidade de elementos, ou seja, n (número de
amostras):
D =
x x
n
= 12
6
= 2ma
–å
Portanto, o valor do desvio médio é 2.
Fonte: Os autores.
93
Estatística Aplicada à Gestão – Capítulo 2
Nesse exemplo, todos os valores ocorrem uma única vez, portanto, a
frequência (f) foi considerada igual a 1. Pode acontecer que os dados
estejam agrupados em classes ou intervalos e, nesse caso, é necessá-
rio substituir o x da fórmula pelo ponto médio de cada classe.
2. Observe a tabela de idades de um grupo de estudantes em classes ou intervalos, com suas respectivas
frequências. Em seguida, demonstraremos, passo a passo, como fazer o cálculo da média das idades
das classes e como calcular o desvio médio da distribuição de frequência.
idAdEs frEqUêNCiA (f)
16 |— 19 9
19 |— 22 12
22 |— 25 12
25 |— 28 17
28 |— 31 16
31 |— 34 14
34 |— 37 11
37 |— 40 9
∑ 100
1.o) Calculamos a média das classes ou intervalos, na terceira coluna, aplicando a fórmula abaixo:
MA ou x =
L + L
2
inferior superior para cada classe.
MA ou x = 16 + 19
2
= 19,5 e, assim, sucessivamente para todas as classes.
idAdEs frEqUêNCiA (f)
_
x
16 |— 19 9 17,5
19 |— 22 12 20,5
22 |— 25 12 23,5
25 |— 28 17 26,5
28 |— 31 16 29,5
31 |— 34 14 32,5
34 |— 37 11 35,5
37 |— 40 9 38,5
∑ 100
2.o) Para calcularmos a média aritmética das classes, multiplicamos a média de cada classe pela
respectiva frequência, fazemos o somatório e dividimos pelo número total de frequências.
x = 17,5 . 9 + 20,5 . 12 + 23,5 . 12 + 26,5 . 17 + 29,5 . 116 + 32,5 . 14 + 35,5 . 11 + 38,5 . 9
9 + 12 + 12 + 17 + 166 + 14 + 11 + 9
Fonte: Os autores.
Fonte: Os autores.
94
x = 157,5 + 246,00 + 282,00 + 450,5 + 472,00 + 455,00 + 39 00,5 + 346,5
9 + 12 + 12 + 17 + 16 + 14 + 11 + 9
x = 2 800
100
= 28
Portanto, a nova média aritmética das classes ou intervalos é: 28 anos.
3.o) Inserimos uma nova coluna para o desvio relativo. O cálculo é feito pela diferença da média de
cada classe pela média aritmética das classes (xm – x ).
idAdEs frEqUêNCiA (f) xm xm –
_
x
16 |— 19 9 17,5 17,5 – 28 = –10,5
19 |— 22 12 20,5 20,5 – 28 = –7,5
22 |— 25 12 23,5 23,5 – 28 = –4,5
25 |— 28 17 26,5 26,5 – 28 = –1,5
28 |— 31 16 29,5 29,5 – 28 = +1,5
31 |— 34 14 32,5 32,5 – 28 = +4,5
34 |— 37 11 35,5 35,5 – 28 = +7,5
37 |— 40 9 38,5 38,5 – 28 = +10,5
∑ 100
Podemos observar o quanto cada idade está afastada da média aritmética das classes.
4.o) Para completarmos a tabela, precisamos inserir uma nova coluna para |xm – x| . f, que é o módulo
ou valor absoluto da diferença de cada classe em relação à média aritmética das classes, encon-
trado no 2.o passo, multiplicado pela respectiva frequência de cada classe.
idAdEs frEqUêNCiA (f) xm xm –
_
x |xm –
_
x| . f
16 |— 19 9 17,5 17,5 – 28 = –10,5 10,5 . 9 = 94,5
19 |— 22 12 20,5 20,5 – 28 = –7,5 7,5 . 12 = 90,0
22 |— 25 12 23,5 23,5 – 28 = –4,5 4,5 . 12 = 54,0
25 |— 28 17 26,5 26,5 – 28 = –1,5 1,5 . 17 = 25,5
28 |— 31 16 29,5 29,5 – 28 = +1,5 1,5 . 16 = 24,0
31 |— 34 14 32,5 32,5 – 28 = +4,5 4,5 . 14 = 63,0
34 |— 37 11 35,5 35,5 – 28 = +7,5 7,5 . 11 = 82,5
37 |— 40 9 38,5 38,5 – 28 = +10,5 10,5 . 9 = 94,5
∑ 100 528
5.o) Aplicamos na fórmula o valor do somatório, encontrado na última coluna da tabela acima, dividido
pelo total de frequências.
D =
x x . f
n
= 528
100
= 5,28m
–å
Portanto, o valor do desvio médio é 5,28.
Fonte: Os autores.
Fonte: Os autores.
95
Estatística Aplicada à Gestão – Capítulo 2
Se a amostra a ser tratada for de população, o cálculo da variância terá uma alteração na fórmula,
precisamente no denominador, que passa a ser (n – 1). A nova fórmula fica assim:
S =
x MA . f
n 1
2
i
2
i=1
n
–
–
( )å
Numa amostra com cinco barras de chocolate, há os seguintes valores em gramas: 184, 179, 190, 181, 1.
178. Calculemos, então, a média aritmética dos dados.
x = 184 + 179 + 190 + 181 + 178
5
= 182,4
Após obtermos o cálculo da média, aplicamos a fórmula para calcular a variância:
Variância (s2)
A ideia de variância é tomar os desvios dos valores xi em relação à média aritmética, ou seja, (xi – x).
Mas a soma desses desvios é sempre igual a zero. Para evitar que isso aconteça (e que não interfira nos
cálculos), cada desvio deve ser elevado ao quadrado, pois o quadrado de qualquer número pertencente
aos reais é sempre positivo.
Variância é o nome dado à média aritmética da soma total dos quadrados dos desvios e é representada
por:
(x x)i
2
i=1
n
–å
Sua fórmula é:
S =
x x
n
2
i
2
i=1
n
–( )å
Na fórmula, o símbolo de somatório ∑ indica que o i varia de 1 até n.
Neste caso, a frequência é igual a 1.
S =
184 182,4 + 179 182,4 + 190 182,4 + 181 2
2 2 2
– – – –( ) ( ) ( ) 182,4 + 178 182,4
5
S =
1,6 + 3,4 + 7,6 + 1
2 2
2
2 2 2
( ) ( )
( ) ( ) ( )
–
– – ,,4 + 4,4
5
= 2,56 + 11,56 + 57,76 + 1,96 + 19,36
5
=
2 2( ) ( )–
118,64
S = 18,64 g2
x = 182,4 g
96
2. Agora, descobriremos a variância nos grupos A, B e C do exercício 2 da página 88.
Grupo A: 18 anos, 18 anos, 18 anos, 18 anos, 18 anos, 18 anosa)
MA = 18 anos
Desvios:
S2 =18 – 18 = 0; todos iguais a 0.
S2 = 0 Quando todos os valores são iguais, dizemos que não houve dispersão, por isso, a
variância é igual a 0.
Grupo B: 13 anos, 22 anos, 24 anos, 18 anos, 13 anos, 18 anos b)
MA = 18 anos
Desvios:
S =
13 18 + 22 18 + 24 18 + 18 18 + 13 12
2 2 2 2
– – – – –( ) ( ) ( ) ( ) 88 + 18 18
6
S =
5 + 4 + 6 + 0 + 5 + 0
2 2
2
2 2 2 2 2
( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
–
– –
22
2
6
= 25 + 16 + 36 + 0 + 25 + 0
6
= 17
S = 17
Grupo C: 2 anos, 42 anos, 40 anos, 5 anos, 9 anos, 10 anosc)
MA = 18 anos
S =
2 18 + 42 18 + 40 18 + 5 18 + 9 182
2 2 2 2
– – – – –( ) ( ) ( ) ( ) ( )22 2
2
2 2 2 2 2
+ 10 18
6
S =
16 + 24 + 22 + 13 + 9 +
–
– – – –
( )
( ) ( ) ( ) ( ) ( ) 88
6
= 256 + 576 + 484 + 169 + 81 + 64
6
= 271,67
S = 271
2
2
( )
,,67
A variância é suficiente para diferenciar a dispersão dos grupos: no grupo A não há dispersão (S2 = 0),
já o grupo C tem uma dispersão maior que a do grupo B (271,67 > 17).
A variância, portanto, mostra uma dispersão significativa quando os conjuntos de dados são heterogê-
neos, mas isso não é suficiente para tomar decisões de desvios sobre médias. Apresentaremos, a seguir,
meios que facilitam a interpretação dos dados, pois são expressos na mesma unidade dos valores obser-
vados nos conjuntos que chamamos de desvio padrão.
desvio padrão (dp ou s)
Para o cálculo do desvio padrão é utilizada a fórmula da variância. Ela é, na verdade, um passo in-
termediário para encontrar o desvio padrão, medida de dispersão muito utilizada na prática (como nas
eleições), que considera, tal qual o desvio médio, os desvios em relação à média.
O desvio padrão (Dp) tem que ter um significado quantitativo.
Em um conjunto de dados obtidos por amostragem de uma população denominada “normal”, é possível
verificar que quanto maior é a amostra, menor é o desvio padrão, ou seja, é possível chegar ao valor mais
próximo à realidade.
O intervalo compreendido entre os valores ( x – S) e ( x + S) inclui aproximadamente 68,26% dos
resultados obtidos na pesquisa, e o intervalo compreendido entre ( x – 2 . S) e ( x + 2 . S) inclui aproxima-
97
Estatística Aplicada à Gestão – Capítulo 2
damente 95,44% desses resultados. Agora, se for considerado o intervalo compreendido entre ( x – 3 . S) e
( x + 3 . S), teremos aproximadamente 99,71% dos resultados, isto é, quase a totalidade das observações
efetuadas.
Esse resultado é baseadona distribuição normal e é chamado de regra empírica, porque essas por-
centagens são observadas na prática.
Se optarmos por fazer o histograma correspondente aos dados da pesquisa, perceberemos que ele se
aproxima de uma curva em forma de sino ou curva normal, como usualmente e é chamada.
Para obtermos o cálculo do desvio padrão (Dp), basta extrairmos a raiz quadrada da variância:
S =
x MA
n
2
i
2
i=1
n
–( )å
D = Sp
2
Retomando e analisando os exemplos acima:
Grupo A: S2 = 0 Dp = 0 = 0 ano
Grupo B: S2 = 17 Dp = 17 = 4,1 anos
Grupo C: S2 = 271,67 Dp = 271 67 , = 16,5 anos
O cálculo da variância e o desvio padrão têm resultados positivos ou
nulos.
Resumindo n valores das variáveis quantitativas x, temos x1, x2, x3, ... , xn:
A média aritmética dos valores de x é: x =
x
n
i=1
n
å
A variância de x é: S =
x x
n
2
i
2
i=1
n
–( )å
O desvio padrão de x é: D = Sp
2
Se todos os valores das variáveis são iguais, o desvio padrão é igual
a zero.
Quanto mais próximo de zero o valor do desvio padrão, mais homogê-
nea será a distribuição da variável.
O desvio padrão é expresso na mesma unidade da variável.
98
O desvio padrão não tem uma interpretação física como no caso das medidas de tendência central
(medidas de posição), entretanto, é possível fazer uma interpretação analítica do desvio padrão, como será
visto nos exemplos seguintes.
No treinamento dos atletas da equipe de salto em altura, cada um realizou quatro saltos e obteve os 1.
seguintes resultados em centímetros:
João: 148 cm; 170 cm; 155 cm; 131 cm
Mauro: 145 cm; 151 cm; 150 cm; 152 cm
Renato: 146 cm; 151 cm; 143 cm; 160 cm
1.o) Calculamos a média aritmética dos saltos de cada atleta.
O valor da média aritmética é:a)
João: MA = 148 + 170 + 155 + 131
4
= 604
4
= 151 cm
Mauro: MA = 145 + 151 + 150 + 152
4
= 598
4
= 149,5 cm
Renato: MA = 146 + 151 + 143 + 160
4
= 600
4
= 150 cm
Portanto, João é o atleta que obteve a melhor média aritmética, 151 cm.
2.o) Com o cálculo da média aritmética individual, calculamos a variância de cada atleta aplicando a
fórmula e, em seguida, calculamos o desvio padrão Dp.
S =
x MA
n
2
i
2
i=1
n
–( )å
Verifique que o n, nesse caso, é o total da amostra.
Para calcularmos a variância, o procedimento é fazermos o somatório da diferença da média arit-b)
mética dos saltos, em relação a cada salto, elevado ao quadrado:
João:
S =
148 151 + 170 151 + 155 151 + 131 1512
2 2 2
– – – –( ) ( ) ( ) ( )22
4
= 9 + 361 + 16 + 400
4
= 786
4
= 196,5 cm
Mauro:
S =
145 149,5 + 151 149,5 + 150 149,5 + 152 2
2 2 2
– – – –( ) ( ) ( ) 149,5
4
= 20,25 + 2,25 + 0,25 + 6,25
4
= 29
4
= 7,25 cm
2( )
Renato:
S =
146 150 + 151 150 + 143 150 + 160 1502
2 2 2
– – – –( ) ( ) ( ) ( )22
4
= 16 + 1 + 49 + 100
4
= 166
4
= 41,5 cm
O cálculo do desvio padrão é obtido pelo cálculo da raiz quadrada da variância Sc) 2, em que o re-
sultado individual poderá ser comparado entre si. Percebemos a regularidade de cada atleta em
relação aos saltos:
99
Estatística Aplicada à Gestão – Capítulo 2
João: D = 196,5 = 14 cmp
Mauro: D = 7,25 = 2,7 cmp
Renato: D = 41,5 = 6,4 cmp
Portanto, o atleta Mauro foi o mais regular dos três, pois seu desvio padrão foi o menor entre os con-
correntes: aproximadamente 2,7 cm. Ou seja, quanto menor for o desvio padrão de uma amostra, mais
confiável será o resultado esperado.
Podemos considerar a tabela trabalhada anteriormente, da amostra de idades de um grupo de estu-2.
dantes, e calcular o desvio padrão da distribuição.
idAdEs frEqUêNCiA (f)
16 |— 19 9
19 |— 22 12
22 |— 25 12
25 |— 28 17
28 |— 31 16
31 |— 34 14
34 |— 37 11
37 |— 40 9
∑ 100
1.o) Considerando o conhecimento obtido nos exemplos anteriores, nesta tabela aparece o cálculo
da média de cada classe menos a média geral das classes em módulo absoluto, ou seja, valores
positivos.
idAdEs frEqUêNCiA (f) |xm –
_
x|
16 |— 19 9 17,5 – 28 = 10,5
19 |— 22 12 20,5 – 28 = 7,5
22 |— 25 12 23,5 – 28 = 4,5
25 |— 28 17 26,5 – 28 = 1,5
28 |— 31 16 29,5 – 28 = 1,5
31 |— 34 14 32,5 – 28 = 4,5
34 |— 37 11 35,5 – 28 = 7,5
37 |— 40 9 38,5 – 28 = 10,5
∑ 100
2.o) É preciso inserir uma nova coluna para calcularmos o desvio absoluto elevado ao quadrado e
multiplicado pela frequência de cada classe.
idAdEs frEqUêNCiA (f) |xm –
_
x| (xm –
_
x)2 . f
16 |— 19 9 17,5 – 28 = 10,5 10,52 . 9 = 992,25
19 |— 22 12 20,5 – 28 = 7,5 7,52 . 12 = 675
22 |— 25 12 23,5 – 28 = 4,5 4,52 . 12 = 243
25 |— 28 17 26,5 – 28 = 1,5 1,52 . 17 = 38,25
28 |— 31 16 29,5 – 28 = 1,5 1,52 . 16 = 36
Fonte: Os autores.
Fonte: Os autores.
100
31 |— 34 14 32,5 – 28 = 4,5 4,52 . 14 = 283,50
34 |— 37 11 35,5 – 28 = 7,5 7,52 . 11 = 618,75
37 |— 40 9 38,5 – 28 = 10,5 10,52 . 9 = 992,25
∑ 100 3 879
3.o) Agora, o trabalho é substituir na fórmula os valores encontrados, para determinarmos o desvio
padrão desta distribuição S =
x MA . f
n 1
2
i
2
i=1
n
–
–
( )å
, lembrando que nesses casos o valor n da fre-
quência é (n –1).
S = 3 879
100 1
= 3 879
99
= 39,182
–
4.o) Finalmente, calculamos o desvio padrão tirando a raiz quadrada de S2 pela função:
S = 39,18 = 6,26 ou D = S = 6,26p
2 .
O desvio padrão procurado é S = 6,26.
No histograma a seguir, temos uma amostra dos resultados de uma pesquisa sobre a altura, em centí-3.
metros, dos alunos de uma classe da Faculdade Livre. Desejamos determinar o desvio padrão.
Fonte: Os autores.
Primeiramente, montamos a tabela de classes e frequências em relação ao histograma.
ALTUrAs frEqUêNCiA (f)
153 |— 159 2
159 |— 165 5
165 |— 171 8
171 |— 177 6
177 |— 183 4
Fonte: Os autores.
Fonte: Os autores.
Figura 21 – Gráfico de altura dos alunos da Faculdade Livre.
9
8
7
6
5
4
3
2
1
Altura (cm)
N
úm
er
o
d
e
al
un
os
153 165 171 177 183
101
Estatística Aplicada à Gestão – Capítulo 2
x =
L + L
2
inferior superior
de cada classe.
ALTUrAs frEqUêNCiA (f) xm
153 |— 159 2 156
159 |— 165 5 162
165 |— 171 8 168
171 |— 177 6 174
177 |— 183 4 180
∑ 25
O cálculo da média aritmética ponderada das alturas é feito pelo somatório das frequências multiplica-
do pelas respectivas médias de classe e dividido pelo somatório das frequências.
MA = 2 156 + 5 162 + 8 168 + 6 174 + 4 180
2 + 5 + 8 + 6 + 44
= 4 230
25
= 169,2 cm
O cálculo dos desvios serve para verificar quanto cada altura está afastada da média. Verifique, a
seguir, os tipos de desvios.
Desvio relativo (x – x) é o valor da média de cada classe menos a média aritmética ponderada
das classes:
(156 – 169,2) = –13,2; (162 – 169,2) = –7,2; (168 – 169,2) = –1,2; (174 – 169,2) = 4,8; (180 – 169,2) = 10,8
Desvio absoluto (D a) é o módulo do respectivo desvio relativo das alturas de cada classe:
Da = |–13,2| = 13,2; |–7,2| = 7,2; |–1,2| = 1,2; |4,8| = 4,8; |10,8| = 10,8
Desvio médio absoluto (D ma) é o somatório dos módulos dos desvios absolutos, multiplicado pelas
respectivas frequências e dividido pelo somatório das frequências:
D =
2 . 13,2 + 5 . 7,2 + 8 . 1,2 + 6 . 4,8 + 4 .
ma
( ) ( ) ( ) ( ) 10,8
25
= 144
25
= 5,76 cm
( )
Variância é o somatório dos desvios relativos elevado ao quadrado, multiplicado pelas respectivas
frequências e dividido pelo somatório das frequências:
S =
2 . 13,2 + 5 . 7,2 + 8 . 1,2 + 6 . 4,8 + 4 2
2 2 2 2
– – –( ) ( ) ( ) ( ) .. 10,8
25
= 1 224
25
= 48,96 cm
2( )
Desvio padrão é a raiz quadrada da variância (S2):
D = S = 48,96 = 6,99 cmp
2
Fonte: Os autores.
Agora, calculamos o ponto médio de cada classe ouintervalo da tabela.
102
A diVErsifiCAçãO E O UsO dE dEriVATiVOs NA GEsTãO dE risCOs
O mercado de capitais certamente é um dos mercados com mais alto nível de risco para se investir,
porém, como sabemos, quanto mais alto o risco, mais alto deverá ser o retorno demandado pelo in-
vestidor. Os ativos negociados neste mercado, além de gerarem um bom retorno sobre o investimento,
também contribuem grandemente para o desenvolvimento das empresas que buscam, no mercado
de capitais, uma forma de financiar suas atividades e ampliar seus investimentos. Correndo o risco
de investir em renda variável, não só esperamos obter maiores retornos como também estimular o
crescimento econômico. Como disse Alan Greenspan: “Se todos os poupadores e seus intermediários
financeiros investissem somente em ativos livres de risco, o potencial de crescimento das empresas
jamais se realizaria”.
No entanto, para operar em um mercado com tão alto risco e conseguir maximizar o retorno,
devemos utilizar algumas ferramentas para gerir o risco do investimento, elevando o lucro ou mesmo
reduzindo perdas em momentos de alta volatilidade. Duas ferramentas que podem ser utilizadas para
gerir o risco da carteira de investimentos são: a teoria da diversificação de Markowitz e a utilização de
derivativos.
A teoria da diversificação consiste basicamente em obter uma carteira distribuída com diversos
ativos com características distintas. Nesta teoria, trabalha-se com o retorno esperado, como uma coisa
desejável, e com a variância deste retorno indesejável. A variância é uma medida estatística da oscila-
ção do rendimento em torno da média, conceito que está ligado diretamente ao desvio padrão. Quanto
maior a variância, ou desvio padrão, menos o retorno médio indicará qual deverá ser o resultado.
Diversificar investimentos constitui-se na melhor arma para reduzir a variância do retorno. A questão é
basicamente que, concentrando seus investimentos, será impossível prever o resultado, podendo obter
rendimentos extraordinários ou mesmo perder tudo. Porém, diversificando os papéis, alguns destes se
valorizarão mesmo quando outros se desvalorizarem, reduzindo a volatilidade da carteira. Pode ser
que os lucros sejam reduzidos pela diversificação, mas assim também será com as perdas. A questão
é puramente matemática: em uma carteira diversificada, o seu retorno equivalerá às médias das taxas
de retorno de seus componentes individuais, enquanto a volatilidade será inferior à volatilidade média
dos componentes. A teoria da diversificação de Markowitz foi tão inovadora em tantos níveis que lhe
rendeu o Nobel de ciência econômica em 1990 e, apesar de parecer simples, redigida desta maneira,
é extremamente complexa, já que incorpora as ideias da teoria das probabilidades, amostragem, curva
em sino e dispersão em torno da média, regressão à média e a teoria da utilidade.
Já os derivativos são os mais sofisticados instrumentos financeiros, os mais misteriosos e até mais
arriscados, porém, usados de maneira sensata podem trabalhar na remuneração da carteira e na redu-
ção do risco dos investimentos. Os derivativos são formados por duas modalidades: os contratos a ter-
mo (contratos de entrega futura a preços predeterminados) e opções, que fornecem a um lado a opção
de comprar ou vender para o outro lado a um preço predeterminado. Funcionam de certa forma como
um seguro em que, mediante o pagamento de um prêmio, o risco de determinada atividade é transfe-
rido para outra pessoa. Desta forma, o investidor ou mesmo uma empresa possuirá maior controle do
seu fluxo de caixa e reduzirá o risco de suas negociações, já que, de certa maneira, se protegerá das
flutuações do mercado. Por exemplo, uma empresa deseja adquirir certo equipamento que deverá ser
pago dentro de 6 meses, em moeda estrangeira, como o dólar, e não pretende ficar sujeita ao risco da
variação cambial. Nesse caso, a empresa poderá fechar um contrato em que, mediante o pagamento
Leitura complementar
103
Estatística Aplicada à Gestão – Capítulo 2
de um prêmio, a outra parte se predispõe a lhe vender uma certa quantidade de dólar por um preço
pré-fixado; neste caso, a empresa adquiriu uma opção de compra de dólar. O risco a que estará sujeita
agora será de a moeda nacional se valorizar e o preço do dólar cair; neste caso, ela pode escolher não
exercer sua opção de compra e perderá apenas o valor pago pelo prêmio. Já se a moeda nacional se
desvalorizar, a empresa poderá exercer sua opção e pagará pelo dólar o preço que fora anteriormen-
te acordado. O mesmo é aplicado no investimento em ações, podendo ser negociadas em bolsa as
opções de compra e venda de ações, além de mercadorias, commodities e até taxa de juros.
A diversificação e a utilização de derivativos são métodos que visam reduzir o risco de um investi-
mento, porém não o eliminam. Como já foi dito, o risco é inerente ao desenvolvimento, porém, isto não
é motivo para que nos arrisquemos sem nenhuma medida preventiva. Devemos sempre medir e avaliar
o risco a que estamos sujeitos e tentar controlá-lo e reduzi-lo.
SOARES, João Guilherme. A diversificação e o uso de derivativos na gestão de riscos.
Disponível em: <http://blog.campe.com.br/a-diversificacao-e-o-uso-de-derivativos-na-gestao-de-riscos/>.
Acesso em: 13 ago. 2009.
Os dois sites seguintes apresentam textos que demonstram aplicações
práticas dos conteúdos estudados neste capítulo. Vale a pena conferir.
http://www.agro.unitau.br/seer/ index.php/ambi-agua/ar t icle/
viewFile/176/296
http://www.seagri.ba.gov.br/pdf/5�pesquisa�agricolav8n2.pdf
Você estudou:
A amplitude total (ou intervalo total) de um conjunto de números ou dados pode ser definida como
sendo a diferença dos extremos do conjunto ou da classe, ou seja, o maior e o menor valor. Se for um
conjunto numérico, o cálculo é feito pela diferença dos extremos; mas, se for uma classe, pode ser feito
pela média da última classe menos a média da primeira classe, ou ainda, pelo limite superior da última
classe menos o limite inferior da primeira classe. Já a variância vai apontar a dispersão dos grupos que
estão sendo analisados pelos desvios médios em relação à média aritmética.
O desvio padrão nada mais é do que a raiz quadrada da variância, aplicado para facilitar a interpretação
dos dados, expresso na mesma unidade dos valores observados em um conjunto de informações. É a
medida de variação mais utilizada nos cálculos estatísticos por apresentar uma pequena dispersão de
um conjunto de dados, quando eles estão concentrados em torno da média, e uma maior dispersão,
quando os dados estão afastados da média, sendo usado principalmente para estimar o desvio padrão
populacional em problemas de inferência.
síntese
BIANCHINI, Edwaldo; PACCOLA, Herval. Curso de matemática. 2. ed. São Paulo: Moderna, 1999.
CASTANHEIRA, Nelson Pereira. Estatística aplicada. 2. ed. Curitiba: Ibpex, 2005.
referências
104
DANTE, Luiz Roberto. Matemática: contexto & aplicações. São Paulo: Ática, 2001.
DOWNING, Douglas; CLARK, Jeffrey. Estatística aplicada. São Paulo: Saraiva, 1998.
FREUND, John E.; SIMON, Gary A. Estatística aplicada. 9. ed. Porto Alegre: Bookman, 2000.
PAIVA, Manoel Rodrigues. Matemática. São Paulo: Moderna, 1995.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidor. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
Anotações
Medidas de assimetria e curtose
Conteúdo programático
Medidas de assimetria
Coeficiente de assimetria
Medidas de curtose
Como avaliar a curtose de uma variável
Objetivo
Identificar as medidas de assimetria e curtose, assim como saber
trabalhar com elas.
106
mEdidas dE assimEtria
Assimetria, como o próprio nome indica, significa desvio ou afastamento da simetria. É o grau de de-
formação da curva de frequências.
As medidas de assimetria possibilitam analisar uma distribuiçãode acordo com as relações entre suas
medidas de moda, média e mediana, quando observadas graficamente ou apenas por meio da análise dos
valores.
Uma distribuição é simétrica quando apresenta o mesmo valor para a moda, a média e a mediana.
Veja a representação abaixo:
Figura 22 – Distribuição simétrica.
–x = Mo = Md xi
fi
Uma distribuição é assimétrica quando a igualdade dos valores não ocorre. Nesse caso, ela pode ser
assimétrica positiva ou assimétrica negativa.
Quando a cauda da curva da distribuição declina para direita, a distribuição é considerada com curva
assimétrica positiva. O valor da média é maior que o valor da moda, e o coeficiente (que será tratado a
seguir) é positivo (> 0). Veja a representação gráfica abaixo:
Figura 23 – Curva assimétrica positiva.
xi
fi
Mo Md x
Quando a cauda da curva da distribuição declina para esquerda, a distribuição é considerada com
curva assimétrica negativa. O valor da média é menor que o valor da moda, e o coeficiente é negativo
(< 0). Observe a representação gráfica.
107
Estatística Aplicada à Gestão – Capítulo 2
Figura 24 – Curva assimétrica negativa.
xi
fi
x Md Mo
Coeficiente de assimetria
Para o cálculo do coeficiente de assimetria, é utilizado o primeiro ou o segundo coeficiente de Pearson,
dependendo dos dados oferecidos.
Quando se dispõe de valores da média e do desvio padrão, deve ser utilizado o primeiro coeficiente de
assimetria de Pearson:
A = x Mo
SS
– ou A = x MoS
–
s
AS = coeficiente de assimetria
x = média dos dados
Mo = moda
S = desvio padrão amostral
σ = desvio padrão populacional
Se AS = 0, a distribuição é simétrica.
Se AS > 0, a distribuição é assimétrica positiva.
Se AS < 0, a distribuição é assimétrica negativa.
Observação: O primeiro coeficiente de Pearson não é muito utilizado, pois o conjunto de dados pode
não ter apresentação modal.
Quando há condições de calcular a média e o desvio padrão, é utilizado o segundo coeficiente de
assimetria de Pearson:
A =
3 . x Md
SS
–( )
Se 0,15 < | As | < 1, ,a assimetria é moderada.
Se | As | >1, a assimetria é forte.
Vejamos um exemplo.
Determine o coeficiente de assimetria para as distribuições seguintes, que se referem à faixa salarial
(em salários mínimos) dos funcionários de determinadas empresas.
108
Empresa A
x = 12
Md = 12
Mo = 12
S = 4,42
Empresa B
x = 12,9
Md = 13,5
Mo = 16
S = 4,2
Empresa C
x = 11,1
Md = 10,5
Mo = 8
S = 4,2
Calculando o coeficiente de assimetria para as distribuições dadas, observamos:
A =
3 . 12 12
4,2
= 0 simetria
A =
3 . 12,9 13,5
4,
S
S
A
B
–
–
( )
®
( )
22
= 0,429 assimetria negativa
A =
3 . 11,1 10,5
4,SC
–
–
®
( )
22
= +0,429 assimetria positiva®
fAixA
sALAriAL
fi
2 |— 6 6
6 |— 10 12
10 |— 14 24
14 |— 18 12
18 |— 22 6
∑ 60
fAixA
sALAriAL
fi
2 |— 6 6
6 |— 10 12
10 |— 14 24
14 |— 18 30
18 |— 22 6
∑ 78
fAixA
sALAriAL
fi
2 |— 6 6
6 |— 10 30
10 |— 14 24
14 |— 18 12
18 |— 22 6
∑ 78
Na distribuição A, os valores da média, mediana e moda são iguais
(12), por isso, há simetria.
Na distribuição B, o valor da média (12,9) é menor que o valor da
moda (16), nesse caso, há assimetria negativa.
Já na distribuição C, o valor da média (11,1) é maior que o valor da
moda (8), o que faz com que a distribuição seja assimétrica positiva.
109
Estatística Aplicada à Gestão – Capítulo 2
mEdidas dE curtosE
Curtose é o grau de achatamento da distribuição ou o quanto uma curva de frequência será achatada
em relação a uma curva normal de referência.
De acordo com a curtose, a distribuição é classificada desta forma:
Mesocúrtica – Se a curva de frequências apresenta um grau de achatamento equivalente ao da
curva normal.
Platicúrtica – Se a curva de frequências apresenta-se mais aberta (ou mais achatada na parte
superior) que a curva normal.
Leptocúrtica – Se a curva de frequências apresenta-se mais fechada (ou mais afilada na parte
superior) que a curva normal.
Graficamente, é possível observar:
Figura 25 – Curva mesocúrtica.
Figura 26 – Curva platicúrtica.
Figura 27 – Curva leptocúrtica.
110
Como avaliar a curtose de uma variável
Para medir o grau de curtose, é utilizado o coeficiente de curtose (K ou C):
K =
Q Q
2 . P P
3 1
90 10
–
–( )
Curva normal K = 0,263
K = coeficiente de curtose
Q3 = terceiro quartil
Q1 = primeiro quartil
P90 = nonagésimo percentil
P10 = décimo percentil
K = 0,263 curva mesocúrtica
K < 0,263 curva leptocúrtica
K > 0,263 curva platicúrtica
Q quartil é calculado com as fórmulas:
Q = L +
n
4
. h
F1 Q Q1 1
– fåæè
ççç
ö
ø
÷÷÷
e Q = L +
3n
4
. h
F3 Q Q3 3
– fåæè
ççç
ö
ø
÷÷÷
P percentil é calculado com a fórmula:
P = L +
i
100
f . h
Fi P
n
P
i
i
– å
æ
è
ççç
ö
ø
÷÷÷÷
Os conceitos de assimetria e curtose são muito importantes na área de administração, pois permitem
perceber quando uma distribuição de dados está de acordo com a normalidade e estabelecer as relações
entre as suas medidas de moda, média ou mediana.
A tabela abaixo apresenta dados que possibilitam montar uma tabela com a curva correspondente a 1.
essa distribuição. Acompanhe:
Classes 3 |— 8 8 |— 13 13 |— 18 18 |— 23
fi 5 15 20 10
Para o cálculo do coeficiente K, precisamos saber o valor de Q1, Q3, P10 e P90. Então:
Classes 3 |— 8 8 |— 13 13 |— 18 18 |— 23
fi 5 15 20 10
f
ac
5 20 40 50
Classe P10 Classe Q1 Classe Q3 Classe P90
111
Estatística Aplicada à Gestão – Capítulo 2
Q = 8 +
(12,5 5) . 5
15
= 10,51
–
Q = 13 +
37,5 20 . 5
20
= 17,383
–( )
P = 3 +
5 0 . 5
5
= 810
–( )
P = 18 +
45 40 . 5
10
= 20,590
–( )
Portanto:
K =
Q Q
2 . P P
K = 17,38 10,5
2 . 20,5 8
= 3 1
90 10
–
–
–
–( )® ( ) 00,27. Logo, K > 0,263, então, a curva correspondente é
suavemente platicúrtica.
2. Observe a tabela de frequências:
CLAssEs fi
100 |— 200 2
200 |— 300 22
300 |— 400 52
400 |— 500 22
500 |— 600 2
Vamos calcular o coeficiente de curtose da distribuição.
CLAssEs fi f ACUMULAdAs
100 |— 200 2 2
200 |— 300 22 24
300 |— 400 52 76
400 |— 500 22 98
500 |— 600 2 100
Agora, calculamos o valor de Q1, Q3, P10 e P90:
Q = L +
n
4
. h
F
= 300 +
(25 24) . 100
1 Q
Q
1
1
–
–
fåæèçç
ö
ø
÷÷÷
552
= 300 + 100
52
= 300 + 1,923 = 301,923
Q = L +
3n
4
. h
F
= 300 +
75 24 . 1
3 Q
Q
3
3
– –få
æ
èçç
ö
ø
÷÷÷ ( ) 000
52
= 300 + 5 100
52
= 300 + 98,073 = 398,073
Fonte: Os autores.
Fonte: Os autores.
112
K =
Q Q
2 . P P
K = 398,073 301,923
2 . 463,636
3 1
90 10
–
–
–
( )® 236,363 =
96,153
454,546–( ) = 0,212
Como 0,212 < 0,263, a distribuição é leptocúrtica.
KArL PEArsON
Matemático britânico é conhecido como sendo o criador da Estatística Apli-
cada e defensor da introdução da estatística no nível secundário dos estudos
escolares. Fundador e editor da revista Biometrika, deu um grande contribu-
to à estatística, desenvolvendo um grande número de métodos estatísticos
padrões.
Matemático britânico, nasceu a 27 de março de 1857, em Londres. For-
mou-se na Universidade de Cambridge, em Matemática, em 1879. Depois
de formado, foi para a Alemanha, nomeadamente para Berlim e Heidelberg,
onde estudou literatura, física, filosofia, etc. De regresso à Inglaterra, em 1884, tornou-se professor de
Matemática Aplicada na Universidade de Londres (University College) e, em 1896, foi eleito membro
da Royal Society of London. Fundou o departamento de estatísticaaplicada (agora o departamento da
ciência estatística) na Universidade de Londres (University College) em 1911; era o primeiro depar-
tamento dos estatísticos em universidade no mundo. Com a morte do seu amigo Francis Galton, em
1911, passou a ser o primeiro professor a lecionar as aulas de eugenia de Galton até 1933.
Foi seguidor de Francis Galton (1822–1911) e interessou-se pelo desenvolvimento de métodos
matemáticos que explicassem a hereditariedade e a evolução humana. Foi a partir deste interesse que
Pearson impulsionou a estatística. Criou o método dos momentos e o sistema de curvas de frequência,
tão extensamente usado para a descrição matemática dos fenômenos naturais. Desenvolveu a teoria
da correlação aplicada aos problemas de hereditariedade e da evolução. Criou o teste do qui-quadrado
(X2), em 1900, para verificar a possibilidade de um ajustamento, e foi um dos defensores do reconheci-
mento da estatística como uma disciplina autônoma e introduzida no ensino secundário (1). O teste do
qui-quadrado constitui a base da estatística das pequenas amostras de populações normais, servindo
para medir a confiança de resultados estatísticos, testar hipóteses, etc. Inventou o termo desvio padrão
(1893).
Fundou a revista Biometrika (1901–1936), da qual era editor, em conjunto com o seu amigo
Francis Galton e Walter Weldon (1890–1906). Essa revista baseava-se em estudos estatísticos para
tentar resolver problemas biológicos. A maior parte dos artigos escritos por Pearson sobre Con-
Leitura complementar
Th
e
Ph
illi
ps
P
ub
lis
hi
ng
C
o
P = L +
i
100
f . h
F
= 400 +
(90
90 P
90
P
90
90
–
–
å
æ
è
ççç
ö
ø
÷÷÷÷ 776) . 100
22
= 400 + 1 400
22
= 400 + 63,636 = 463,636
P = L +
i
100
- f . h
F
= 200 +
10 - 2
10 P
10
P
10
10
å
æ
è
ççç
ö
ø
÷÷÷÷ ( )) . 100
22 = 200 + 800
22
= 200 + 36,363 = 236,363
113
Estatística Aplicada à Gestão – Capítulo 2
tributions to the Mathematical Theory of Evolution (1894) foram publicados na revista Biometrika.
Foi autor de muitos trabalhos, incluindo Vida de Galton (1914–1930) e a Gramática da ciência
(1892).
Morreu a 27 de abril de 1936 em Londres e ficou conhecido como o “criador da estatística aplicada”.
FERREIRA, Maria Isabel Garcia et al. Karl Pearson.
Disponível em: <http://alea-estp.ine.pt/html/nomesEdatas/swf/biografias.asp?art=13>.
Acesso em: 27 ago. 2009.
Você estudou:
Simetria é o grau de deformação de uma curva de frequências.
A classificação dos três tipos de curvas de frequências, quanto ao grau de deformação ou assimetria: si-
métrica, assimétrica positiva (desviada para direita) ou assimétrica negativa (desviada para esquerda).
A curtose ou excesso indica até que ponto a curva de frequências de uma distribuição se apresenta
mais afilada ou achatada do que uma curva padrão, denominada curva normal.
A classificação das curvas de frequência de acordo com o grau de curtose: mesocúrtica (achatada),
platicúrtica (excessivamente achatada) ou leptocúrtica (muito afilada).
síntese
FERREIRA, Maria Isabel Garcia et al. Karl Pearson. Disponível em: <http://alea-estp.ine.pt/html/nomesEdatas/swf/
biografias.asp?art=13>. Acesso em: 27 ago. 2009.
FONSECA, J. Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. 3. ed. São Paulo: Atlas, 1989.
TOLEDO, Geraldo L.; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1985.
referências
Anotações
114
Medidas de dispersão
entre duas variáveis
Conteúdo programático
Medidas de dispersão entre duas variáveis
Covariância
Gráfico de dispersão
Correlação
Coeficiente de correlação do momento Pearson
Objetivos
Perceber quanto e de que maneira duas variáveis se relacionam.
Interpretar a representação geométrica dessas informações dispostas
em um diagrama de dispersão.
116
mEdidas dE dispErsão EntrE
duas variávEis
Fazemos análises de dados de uma amostra ou variável pertencente a uma população. No entanto,
uma variável pode se relacionar com outras variáveis da mesma população. Tais relações se estabelecem
das mais diversas formas no cotidiano:
a gripe influenza A, por exemplo, fez as vendas de vitaminas, álcool em gel e máscaras dispara-
rem;
o faturamento das indústrias de eletrodomésticos foi influenciado pela redução do IPI;
a programação das televisões está intimamente relacionada com o índice de audiência de seus
programas.
Esses exemplos permitem estabelecer outras relações, como: reduzindo o custo, o preço do produto
será reduzido e a venda será maior; invernos rigorosos geram aumento no faturamento das indústrias de
energia, farmacêutica e têxtil; um aluno com um bom currículo terá mais chance de sucesso profissional,
etc.
Covariância
A covariância é uma medida de associação entre duas variáveis. Ela mede a tendência e a força de
relação linear entre as variáveis.
Para que se relacionem duas variáveis, é necessário que elas tenham o mesmo número de dados,
formando pares ordenados. Esses pares, por sua vez, não podem ser mudados. Quando for necessária, a
mudança de ordem deve ser realizada nas duas amostras.
A covariância, que pode ser nula, negativa ou positiva, é a medida do afastamento simultâneo das
respectivas médias. Se ambas as variáveis aleatórias tendem a estar simultaneamente acima ou abaixo
de suas respectivas médias, então a covariância tenderá a ser positiva e, nos outros casos, poderá ser
negativa.
Assim como a variância, a covariância é influenciada pelos valores dos extremos da variável e não é
uma medida resistente.
A covariância entre duas variáveis x e y, com média respectivamente x e y, é definida como:
Cov x,y =
x x y y
n 1
i i( ) ( )å ( )– –
–
x = observação da variável 1 (dado)
x = média da variável x
y = observação da variável 2 (dado)
y = média da variável 2
n = número de observações
Quando o resultado for 0 (zero), não há relação direta entre as duas variáveis; se ele for positivo
(> 0), há uma relação linear positiva entre as duas variáveis; se ele for negativo (< 0), há uma relação linear
negativa entre as variáveis. A unidade de medida é o resultado do produto das unidades dos valores das
variáveis. Observe o exemplo a seguir.
117
Estatística Aplicada à Gestão – Capítulo 2
Um gerente de determinada loja está interessado em investigar a relação entre o número de comerciais
mostrados no fim de semana e o volume de vendas ocorrido durante a semana seguinte. O resultado de sua
pesquisa está presente na tabela a seguir:
sEMANA NúMErO dE COMErCiAis (x) VOLUME dE VENdAs (Us$ 100,00)
1 2 50
2 5 57
3 1 41
4 3 54
5 4 54
6 1 38
7 5 63
8 3 48
9 4 59
10 2 46
Calculamos a média:
Média para x Þ x = 2 + 5 + 1 + 3 + 4 + 1 + 5 + 3 + 4 + 2
10
= 3
Média para y Þ y = 50 + 57 + 41 + 54 + 54 + 38 + 63 + 48 + 59 + 46
10
= 511
Construímos, então, uma tabela auxiliar para facilitar os cálculos.
x
i
y
i
x –
_
x y –
_
y (x –
_
x) . (y –
_
y)
2 50 –1 –1 1
5 57 +2 +6 12
1 41 –2 –10 20
3 54 0 +3 0
4 54 +1 +3 3
1 38 –2 –13 26
5 63 +2 +12 24
3 48 0 –3 0
4 59 +1 +8 8
2 46 –1 –5 5
∑ 30 510 0 0 99
Utilizando a equação:
Cov =
x x . y y
n 1
= 99
9
= 11xy
– –
–
( ) ( )å
Como a covariância resultou em um valor positivo, concluímos que os comerciais influenciam positiva-
mente as vendas.
Gráfico de dispersão
A forma mais utilizada de representar geometricamente dados bivariados é o diagrama de dispersão
ou scatterplot, um gráfico do tipo x – y. Essa representação contém uma coleção de pontos com os valores
Fonte: NASCIMENTO, 2009.
Fonte: NASCIMENTO, 2009.
118
de cada membro do par ordenado, no qual o eixo x corresponde aos valores de uma variável e o eixoy, aos
valores da outra variável.
Esse é o método mais apropriado para examinar os dados referentes à ocorrência de tendências (li-
neares ou não), agrupamentos de variáveis e mudanças de espalhamento de uma variável em relação a
outra.
Vamos observar, no gráfico de dispersão, a representação do exemplo anterior (sobre como os comer-1.
ciais influenciam as vendas). No eixo x do gráfico de dispersão, plotamos os valores da variável x; no
eixo y, plotamos os valores da variável y em forma de pares ordenados.
1.a linha da tabela: (2, 50)
2.a linha da tabela: (5, 57) e assim por diante...
Conforme já calculado, a variância resultou em um valor positivo, o que significa relação positiva entre as
variáveis. Isso pode, também, ser observado no gráfico, em que há um crescimento na disposição dos pontos.
Numa pesquisa feita com dez famílias com renda bruta mensal entre 10 e 60 salários mínimos, medi-2.
ram–se:
x: renda bruta mensal (expressa em números de salários mínimos);
y: porcentagem da renda bruta anual gasta com assistência médica.
Os dados foram dispostos na tabela abaixo:
Fonte: NASCIMENTO, 2009.
Figura 28 – Como os comerciais influenciam as vendas.
70
60
50
40
30
20
10
0
Comerciais
Ve
n
da
s
0 1 2 3 4 5 6
fAMÍLiA x y
A 12 7,2
B 16 7,4
C 18 7,0
D 20 6,5
E 28 6,6
F 30 6,7
G 40 6,0
H 48 5,6
I 50 6,0
J 54 5,5
Fonte: MORETTIN; BUSSAB, 2003.
119
Estatística Aplicada à Gestão – Capítulo 2
Fonte: MORETTIN; BUSSAB, 2003.
Figura 29 – Renda bruta mensal familiar e % de gasto com saúde.
8
7
6
5
4
3
2
1
0
Renda bruta
%
g
as
to
c
om
s
aú
de
0 10 20 30 40 50 60
Observe o gráfico de dispersão e perceba que existe uma associação “inversa” entre a renda bruta
familiar mensal e o porcentual gasto com saúde. Isto é, à medida que aumenta a renda bruta, diminui a
porcentagem gasta em assistência médica. Há um decrescimento na disposição dos pontos.
A construção do gráfico é feita marcando os pontos referentes aos dados x e y, nessa ordem, em forma
de par ordenado (x, y). No eixo das abscissas (horizontal) consta o valor x; no eixo das ordenadas (vertical)
consta o valor y. O ponto é marcado na intersecção das perpendiculares desses valores.
3. Dez pessoas foram submetidas a uma avaliação de aptidão física e, em seguida, foi medido o tempo
gasto para cada uma responder a um teste sobre conhecimentos de matemática. As variáveis foram:
x: resultado obtido na avaliação (máximo 100 pontos);
y: tempo, em minutos, necessário para concluir as questões de matemática satisfatoriamente.
PEssOAs x y
A 40 120
B 53 90
C 65 200
D 70 135
E 75 67
F 78 53
G 80 128
H 90 110
I 69 85
J 82 117
Fonte: Os autores.
Fonte: Os autores.
Figura 30 – Avaliação física e tempo de resolução de um teste de matemática.
250
200
150
100
50
0
Nota da avaliação física
Te
m
po
n
a
re
so
lu
çã
o
do
te
st
e
0 20 40 60 80 100
120
Conforme observamos no gráfico, não há associação entre as duas variáveis, pois o resultado da ava-
liação física não interfere na resolução de problemas matemáticos.
Correlação
Coeficiente de correlação do momento Pearson
O coeficiente de correlação de Pearson (ou coeficiente de correlação produto-momento ou r de
Pearson) mede o grau da correlação (e a direção dessa correlação – se positiva ou negativa) entre duas
variáveis.
Esse coeficiente, normalmente representado pela letra “r”, assume apenas valores entre –1 e 1.
Valores próximos a +1 indicam uma forte relação linear positiva.
Valores próximos a –1 indicam uma forte relação linear negativa, isto é, se uma aumenta, a outra
sempre diminui.
Valores próximos a zero indicam a falta de uma relação linear.
Esta é a fórmula para calcular o coeficiente de correlação de Pearson:
r =
(x x) (y y)
(x x) (y y)
i i
i=1
n
i
2
i=1
n
i
2
i=1
n
– –
– –
å
å × å
r =
Cov x, y
S Sx y
( )
x 1, x2, ..., xn e y1, y2, ..., yn são os valores medidos de ambas as variáveis.
x
e y são as médias aritméticas das variáveis calculadas pelas seguintes expressões, vistas
anteriormente:
x = 1
n
. x e y = 1
n
. yi
i=1
n
i
i=1
n
å å
S X e Sy são os respectivos desvios padrões, calculados pela seguinte expressão, vista anteriormen-
te:
S =
x
n
i
2
i=1
n
– x( )å
Utilizando as mesmas informações citadas no exemplo 1, sobre como os comerciais influenciam as
vendas, determinaremos o coeficiente de correlação e interpretaremos o dado obtido. Observe na próxima
página.
121
Estatística Aplicada à Gestão – Capítulo 2
sEMANA NúMErO dE COMErCiAis (x) VOLUME dE VENdAs (Us$ 100,00)
1 2 50
2 5 57
3 1 41
4 3 54
5 4 54
6 1 38
7 5 63
8 3 48
9 4 59
10 2 46
Covariância de x e y = Cov =
(x x) . (y y)
n 1
= 99
9
= 11xy
– –
–
å
Desvio padrão de x Þ S = 20
9
= 1,49x
Desvio padrão de y Þ S = 566
9
= 7,93y
Então:
r =
Cov(x, y)
S S
= 11
1,49 . 7,93
= 0,93
x y
Como o valor está próximo de 1, concluímos que existe uma relação linear positiva entre o número de
comerciais e o número de vendas nos finais de semana.
Fonte: NASCIMENTO, 2009.
iNTELiGêNCiA EMOCiONAL
Esse trabalho se propôs a investigar a validade e as propriedades psicométricas de um instrumento
para medida de um aspecto da inteligência emocional: a percepção de emoções. Para tanto, utilizou-se
a subescala de percepção de emoções da Escala Multifatorial de Inteligência Emocional (Mayer & cols.,
1997) como medida desse aspecto da inteligência emocional; e como medidas de critérios externos:
um instrumento para mensuração de aptidões de raciocínio verbal e espacial (BPR-5) capaz de avaliar
inteligência cristalizada, inteligência fluida e processamento visual; um instrumento para avaliação de
traços de personalidade (16PF); e um instrumento para coleta da avaliação do desempenho dos parti-
cipantes no estágio em Psicodiagnóstico.
Entre os três diferentes critérios utilizados para pontuação das subescalas de percepção de emo-
ções, os melhores resultados psicométricos (consistência interna) foram obtidos através da concor-
dância com o consenso, principalmente quando se utilizou a amostra brasileira como referência para
pontuação. Essa forma de pontuação apresentou-se, de modo geral, bastante similar à concordância
com o alvo, mas oposta à concordância com o julgamento de especialistas. Esta última, apesar dos re-
sultados contraditórios obtidos neste estudo, foi discutida como a forma de pontuação ideal para testes
de inteligência, constituindo-se num ponto que merece ser melhor investigado e desenvolvido, para que
o instrumento se aproxime de algo mais adequado para avaliação da inteligência.
Leitura complementar
122
Foram encontradas correlações significativas da pontuação total em percepção de emoções com
inteligência e traços de personalidade. Em relação à inteligência, correlacionou-se significativamente
apenas com raciocínio espacial, evidenciando certa covariância com inteligência fluida e processamen-
to visual, e independência em relação à inteligência cristalizada (raciocínio verbal). Em relação à per-
sonalidade, mostrou-se relacionada a um funcionamento mental baseado na praticidade e objetividade
na percepção do mundo, características extremamente desejáveis e indispensáveis para a acuidade
na percepção de emoções.
Notou-se ainda que houve diferença entre as associações de estímulos artísticos (quadros e mú-
sicas) e não artísticos (faces). Os primeiros apareceram associados tanto a indivíduos abertos aos
próprios sentimentos e que têm facilidade em falar sobre si mesmos genuinamente, quanto àqueles
que tendem a administrar a imagem de acordo com o socialmente aceito, enquanto que a acuidadeperceptual em estímulo não artístico apareceu mais associada à tradicionalidade e a um certo nível
intelectual.
A escala geral de percepção de emoções não foi capaz de predizer o desempenho em psicodiag-
nóstico; apenas a subescala faces se mostrou capaz de predizer o desempenho geral em psicodiag-
nóstico, e a subescala quadros, que mostrou correlação marginalmente significativa. Demonstrou-se
ainda que a covariância existente entre a percepção de emoções em faces e o desempenho geral no
psicodiagnóstico é única, pois mantém-se estatisticamente significativa mesmo quando controlada por
raciocínio espacial (outro aspecto relacionado à inteligência com a qual a percepção de emoção em
faces se correlacionou significativamente).
Esse conjunto de resultados, obtidos em relação ao aspecto percepção de emoções, confirma
o atual status da inteligência emocional. Alguns dados, tais como a unifatorialidade e as correlações
simultâneas com variáveis relacionadas à personalidade e à inteligência, apoiam sua permanência
como uma forma de inteligência; outros dados não apoiam, como a inexistência de correlação entre
o conjunto unifatorial de percepção de emoções e o desempenho numa atividade cuja percepção de
emoções é fundamental.
Nota-se que essa instabilidade vem se repetindo em pesquisas relacionadas à Inteligência Emo-
cional, isto é, os dados são muito instáveis e não se reproduzem com facilidade, como seria de se es-
perar. Além disso, algumas vezes, são até contraditórios de uma pesquisa para outra. Por isso, alguns
pesquisadores se apressam em condená-la para sempre, enquanto outros se esforçam para torná-la,
de alguma forma, aceitável.
É muito provável que esse impasse continue até que se desenvolva um critério de pontuação
mais adequado, capaz de proporcionar resultados mais estáveis e apropriados para uma avaliação
de inteligência. É esse exercício científico que pode conduzir à concordância entre os especialistas ou
demonstrar efetivamente que o construto em questão não é viável.
Sobre os autores
José Maurício Haas Bueno é mestre em Psicologia pela Universidade São Francisco. É professor
de disciplinas relacionadas à avaliação psicológica na Universidade São Francisco e Universidade
Presbiteriana Mackenzie. Ricardo Primi é doutor em Psicologia Escolar e do Desenvolvimento Humano
pela Universidade de São Paulo, com parte desenvolvida na Yale University (EUA). É coordenador do
Laboratório de Avaliação Psicológica e Educacional (LabAPE) e do Programa de Estudos Pós-Gradu-
ados em Psicologia da Universidade São Francisco.
BUENO, José Maurício Haas; PRIMI, Ricardo. Inteligência emocional.
Disponível em: <http://www.psicologiavirtual.com.br>. Acesso em: 21 ago. 2009.
123
Estatística Aplicada à Gestão – Capítulo 2
Você estudou:
Uma variável pode se relacionar com outras variáveis da mesma população, por isso a necessidade de
se conhecer as características dessa relação.
A covariância mede a tendência e a força de relação entre as variáveis, analisando o afastamento simul-
tâneo das respectivas médias. Ela pode ser positiva, negativa ou nula.
Para facilitar a relação entre duas variáveis e evitar a unidade de medida da covariância, foi definido o
coeficiente de correlação rxy. Os valores de rxy estão limitados entre os valores –1 e +1 e não apresentam
nenhuma unidade de medida.
Os gráficos de dispersão são valiosas ferramentas para a análise desses conceitos, em que as variáveis
são dispostas em pares ordenados e distribuídas nos eixos x e y, respectivamente.
síntese
BUENO, José Maurício Haas; PRIMI, Ricardo. Inteligência emocional. Disponível em: <http://www.psicologiavirtual.
com.br>. Acesso em: 21 ago. 2009.
MORETTIN, Pedro A.; BUSSAB, Wilton de O. Estatística básica. 5. ed. São Paulo: Saraiva, 2003.
NASCIMENTO, Marcelo. Apostila e exercícios. Disponível em: <http://www.cetes.com.br/professor/marcelo>. Acesso
em: 19 ago. 2009.
referências
Atividades do capítulo
Assinale a alternativa correta em relação ao uso da média aritmética:1.
É utilizada quando desejamos obter a medida de posição que possui a maior estabilidade.( )
É utilizada quando há a necessidade de um tratamento algébrico.( )
Complete o esquema para o cálculo da média aritmética da distribuição:2.
xi 450 − 550 − 650 − 750 − 850 − 950 − 1 050 − 1 150
fi 8 10 11 16 13 5 1
Temos:
i xi fi xifi
1
2
3
4
5
6
7
500
....
....
....
....
....
1 100
8
10
11
16
13
5
1
4 000
....
....
....
....
....
....
∑ = .... ∑ = ....
Logo: x = ÷ = R$ 755,00
Fonte: Os autores.
124
Fonte: Os autores.
Complete o esquema para o cálculo da média aritmética da distribuição:3.
xi 1 2 3 4 5 6
fi 2 4 6 8 3 1
Temos:
xi fi xifi
1
2
3
4
5
6
2
4
6
8
3
1
2
...
...
...
...
...
∑ = ... ∑ = ...
Como: ∑ xifi = , ∑ xifi = e x = (∑ xifi) ÷ (∑ fi)
Temos: x = ÷ = 3,4
A tabela abaixo corresponde ao tempo (em minutos) que 50 usuários de Internet gastaram durante sua 4.
conexão no mês de julho de 2009. Determine a moda dos minutos utilizando a fórmula de Czuber:
MiNUTOs dE CONExãO fi
6 |— 18 6
18 |— 30 10
30 |— 42 13
42 |— 54 8
54 |— 66 5
66 |— 78 6
78 |— 90 2
∑ fi = 50
Considere as tabelas de frequências seguintes e determine MA, Mo e Me.5.
Idade, em anos, de um grupo com 10 pessoas:a)
idAdE (EM ANOs) fA
13 3
14 2
15 4
16 1
Total 10
Altura, em metros, de um grupo composto de 21 pessoas:b)
ALTUrA (m) fA
1,61 |— 1,65 3
1,65 |— 1,69 6
1,69 |— 1,73 5
1,73 |— 1,77 4
1,77 |— 1,81 3
Total 20
Fonte: Os autores.
Fonte: Os autores.
Fonte: Os autores.
125
Estatística Aplicada à Gestão – Capítulo 2
Dados os valores a seguir, encontre a média aritmética e a mediana: 6.
9 – 6 – 5 – 4 – 8 – 9 – 10 – 4 – 7 – 8 – 5 – 6 – 10
O técnico de uma equipe de futsal, em vésperas de uma decisão, está numa difícil situação: precisa 7.
decidir se convoca o atleta Mauricinho ou o Ricardinho. As tabelas seguintes mostram o desempenho
de cada um dos jogadores nos últimos cinco jogos dos quais participaram:
Calcule a média aritmética de cada jogador.a)
Calcule o desvio padrão de cada um nesses cinco jogos.b)
Se você fosse o técnico desse time e tivesse que escalar um desses jogadores, num jogo em que c)
uma simples vitória lhe daria o título de campeão da Liga dos Minérios, qual você escolheria? Por
quê?
Dada a tabela abaixo com as notas dos 20 alunos da turma de Biologia da Faculdade Arizona, calcule:8.
a nota média desses alunos;a)
o desvio relativo de cada nota;b)
o desvio médio absoluto dessa amostra de notas;c)
a variância dessa amostra de notas;d)
o desvio padrão dessa amostra de notas.e)
CLAssE (NOTA) frEqUêNCiA (NúMErO dE ALUNOs)
2,0 1
3,0 1
4,0 2
4,5 2
5,0 1
5,5 2
6,0 1
6,5 3
7,0 1
7,5 1
8,0 4
10,0 1
Em uma fábrica, o tempo durante o qual uma máquina não está funcionando, em virtude de quebra 9.
ou falha, é chamado tempo parado. A distribuição na tabela abaixo é uma amostra da duração desses
tempos.
Fonte: Os autores.
Fonte: Os autores.Fonte: Os autores.
JOGAdOr riCArdiNHO
Jogo Número de pontos
1 30
2 14
3 20
4 12
5 24
JOGAdOr MAUriCiNHO
Jogo Número de pontos
1 20
2 22
3 18
4 20
5 20
126
TEMPO PArAdO (MiNUTOs) frEqUêNCiA
0 |— 9
10 |— 19
20 |— 29
30 |— 39
40 |— 49
2
15
17
13
3
∑ 125
Determine:
a média aritmética e a mediana;a)
o desvio padrão.b)
A tabela abaixo representa a distribuição de frequência dos salários de um grupo de 50 funcionários da 10.
empresa Camaquã, no mês de julho de 2009.
NúMErO dE CLAssE sALáriO dO Mês (r$) NúMErO dE EMPrEGAdOs
1 1000 |— 2000 20
2 2000 |— 3000 18
3 3000 |— 4000 9
4 4000 |— 5000 3
Determine:
a média aritméticados salários;a)
a mediana dos salários;b)
os desvios absolutos;c)
a variância;d)
o desvio padrão.e)
Verifique o tipo de assimetria das distribuições de frequências das seguintes tabelas:11.
Dada a amostra seguinte, faça o que se pede:12.
28 33 27 30 31 30 33 30 33 29 27 33 31 27 31 28 27 29 31 24 31 33 30 32 30 33 27 33
31 33 23 29 30 24 28 34 30 30 18 17 18 15 16 17 17 18 19 19 20 29
Construa a tabela com a distribuição de frequência.a)
Calcule a média.b)
Calcule a moda.c)
CLAssEs fi
10 |— 20 5
20 |— 30 10
30 |— 40 15
40 |— 50 20
50 |— 60 5
55
CLAssEs fi
10 |— 20 5
20 |— 30 20
30 |— 40 15
40 |— 50 10
50 |— 60 5
55
CLAssEs fi
10 |— 20 5
20 |— 30 10
30 |— 40 15
40 |— 50 10
50 |— 60 5
45
Fonte: Os autores.Fonte: Os autores.Fonte: Os autores.
Fonte: Os autores.
Fonte: Os autores.
127
Estatística Aplicada à Gestão – Capítulo 2
Calcule a mediana.d)
Calcule o coeficiente de variação.e)
Determine a curtose.f)
Determine os coeficientes de assimetria e de curtose para o tempo gasto na tarefa.13.
Distribuição de frequências tempo (em min) gasto na tarefa x.
TEMPO (min) f
20 |— 25 8
25 |— 30 12
30 |— 35 20
35 |— 40 8
40 |— 45 2
Com base no exemplo apresentado no item Medidas de dispersão entre duas variáveis, página 118, 14.
que se refere à pesquisa feita com dez famílias que relaciona a renda bruta mensal com a porcenta-
gem dessa renda gasta com assistência médica, determine o coeficiente de correlação e comente o
resultado.
Para os dados apresentado na tabela a seguir, determine:15.
o gráfico de dispersão entre as variáveis;a)
o coeficiente de covariância;b)
o coeficiente de correlação.c)
xi 5 3 4 10 14
yi 40 40 60 20 30
O departamento de vendas de determinada companhia analisou o desempenho em vendas de seus 15 16.
vendedores, relacionando-o com o tempo de experiência de cada um. As variáveis foram:
x: tempo de experiência, em anos;
y: volume de vendas, em salários mínimos.
Os resultados estão expressos na tabela abaixo.
VENdEdOr ExPEriêNCiA VENdAs
1 5 55
2 3 28
3 2 22
4 7 58
5 1 25
6 3 26
7 4 33
8 5 49
9 1 18
10 6 51
11 4 43
12 3 25
13 2 24
14 1 21
15 3 30
Fonte: www.famat.ufu.br/prof/rogerio.
Fonte: Os autores.
Fonte: Os autores.
128
I. Determine:
o gráfico de dispersão das variáveis;a)
o coeficiente de covariância;b)
o coeficiente de correlação.c)
II. Faça a interpretação da relação.
Anotações
Capítulo 3
Probabilidade e suas aplicações
Conceitos básicos de probabilidade
Probabilidade
Variáveis aleatórias
Distribuições de probabilidade
Conceitos básicos de probabilidade
Conteúdo programático
Teoria das probabilidades
Experimento aleatório
Espaço amostral e evento
Evento simples
Evento composto
Evento certo e evento impossível
Definição de probabilidade
Objetivos
Entender e diferenciar os conceitos de “variabilidade” e “incerteza”.
Entender os conceitos de “probabilidade” e “inferência estatística”.
Desenvolver o cálculo de probabilidade e reconhecer os modelos
probabilísticos e as distribuições de probabilidade.
Utilizar métodos estatísticos básicos e de modelagem estatística de
relações entre variáveis discretas e contínuas.
132
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
tEoria das probabilidadEs
“Probabilidade” é um termo muito usado na linguagem cotidiana. Veja alguns exemplos:
O serviço de meteorologia pode prever tempo ruim já que a probabilidade de chuvas é grande.
A probabilidade de meu time ganhar esta semana é grande.
Veja agora como a probabilidade é estudada em estatística.
Fenômenos, cujos resultados variam de uma observação para outra, são estudados pela estatística.
Para a explicação desses fenômenos, chamados de aleatórios, é adotado o modelo matemático denomina-
do teoria das probabilidades.
A probabilidade e a estatística estão estreitamente relacionadas, embora formulem tipos opostos de
questões. Em probabilidade, determinados processos ou experimentos são conhecidos, podendo até an-
tecipar alguns resultados. Já na estatística, não é possível precisar ou antecipar os resultados. Contudo,
pelas pesquisas e observações, é possível obter alguma informação sobre eventos ou amostras. Só então
podemos considerar conhecido o resultado de um processo ou experimento.
Cálculos de probabilidade são muito usados em situações que exigem tomadas de decisões. Um em-
presário, por exemplo, pode precisar de informações sobre a probabilidade de sucesso da exportação de
um produto x para um mercado y.
Em suma, os modelos probabilísticos são úteis em diversas áreas do conhecimento humano, como
Administração de Empresas, Ciências Econômicas ou Comércio Exterior.
Experimento aleatório
É aquele que, ao se repetir, sob as mesmas condições, oferece
variações nos resultados. A probabilidade é aplicada a fim de des-
crever todos os possíveis resultados. O lançamento de uma moeda
é um exemplo, pois esse experimento pode ser repetido quantas
vezes forem desejadas. Antes do lançamento, contudo, não se pode
dizer qual será o resultado, mas, sim, relatar os possíveis resulta-
dos: cara ou coroa.
Espaço amostral e evento
Espaço amostral é o conjunto de todos os resultados possí-
veis, mutuamente exclusivos e coletivamente exaustivos. Num ex-
perimento (ou fenômeno) aleatório, define-se o espaço amostral S.
Evento é qualquer conjunto de resultado de um experimento.
Sendo ele um subconjunto de S, indicaremos os eventos por letras maiúsculas: A, B, C e assim por diante.
A representação de um espaço amostral S e seus eventos (A e B) pode ser feita pelo diagrama de
Venn-Euler:
Figura 31 – Espaço amostral.
S
BA
Estatística Aplicada à Gestão – Capítulo 3
133
Estatística Aplicada à Gestão – Capítulo 3
No lançamento de um dado, por exemplo, o espaço amostral será o con-
junto formado por todas as faces. Cada uma delas é um resultado elementar.
Para melhor compreensão, veja alguns exemplos desses fenômenos ale-
atórios.
Lançar um dado e registrar o resultado. Os resultados possíveis são: {1, 2, 1.
3, 4, 5, 6}. O subconjunto {1, 3, 5} pode ser identificado quando ocorre um
número ímpar no lançamento do dado.
Espaço amostral: Ω = {1, 2, 3, 4, 5, 6}
Evento A: ocorrer número ímpar no lançamento de um dado → A = {1, 3, 5}
Retirar uma carta de um baralho de 52 cartas e registrar o seu naipe. 2.
Considerando C = copas, E = espada, O = ouros e P = paus, temos o conjunto de todos os resultados
possíveis: {C, E, O, P}.
Um subconjunto possível é {O}, que pode ser identificado ao retirar uma carta do naipe de ouros.
Espaço amostral: Ω = {C, E, O, P}
Evento A: retirar uma carta cujo naipe seja ouros → A = {O}
Evento simples
É o evento que possui um único elemento do espaço amostral.
Por exemplo, num experimento do lançamento de uma moeda, o evento A, definido como sair coroa, é
um evento simples, pois apresenta um só elemento.
A = {sair coroa}
Evento composto
É o evento que possui um conjunto com mais de um elemento. Perceba que o evento A = {2, 4, 6} é
composto.
Evento certo e evento impossível
Diante das explicações sobre eventos, note que S (espaço amostral) e ∅ (conjunto vazio) também são
eventos, chamados, respectivamente, de evento certo e evento impossível. Assim, por exemplo, no experi-
mento aleatório do conjunto dos números inteiros positivos, temos:
Espaço amostral: Ω = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15}
Evento A: a ocorrência de um número menor que 15 e maior que 0.
→ A = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15}
A = Ω
Evento B: a ocorrência de um número maior que 15 → não existe número maior que 15 no espaço
amostral, portanto B = 0.
Sh
ut
te
rs
tock
/H
om
e
St
ud
io
O jogo de dados é um
exemplo de experimento
aleatório.
Quando um evento coincide com o espaço amostral, é chamado de
evento certo, mas, se um evento é vazio, é chamado de evento impos-
sível.
134
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
definição de probabilidade
Para entender melhor a probabilidade, são utilizados os processos aleatórios comuns do dia a dia, tais
como:
jogar uma moeda dez vezes e observar quantas vezes saiu coroa;
retirar uma carta aleatoriamente de um baralho comum de 52 cartas e observar seu naipe;
jogar um dado vinte vezes e observar quantas vezes a face com o número cinco saiu voltada para
cima.
Os princípios da probabilidade aplicados em situações práticas ajudam a compreender como podemos
usar a inferência estatística para conhecer a natureza de um processo desconhecido.
Observe as conclusões que obtemos da análise dos exemplos anteriores.
Cada experimento pode ser repetido indefinidamente sob as mesmas condições.
Sabemos todos os resultados possíveis, ou seja, as probabilidades.
Repetindo inúmeras vezes o mesmo experimento, surge uma regularidade, ou seja, observamos
uma tendência. Essa regularidade é observada pela estabilidade da fração fr = f/n (frequência
relativa), em que f é o número de sucessos estabelecido antes do experimento e n é o número de
repetições.
Acompanhe agora outras situações que exemplificam a teoria da probabilidade:
Retirar, aleatoriamente, dez bolas sucessivas de uma urna que contém vinte bolas azuis e oitenta
bolas vermelhas. Pela teoria das probabilidades, podemos determinar que existe a probabilidade de
oito dessas bolas retiradas serem vermelhas e as outras duas serem azuis.
Uma situação bastante conhecida é a época de campanha eleitoral. Antes das eleições presiden-
ciais, normalmente é feita uma pesquisa de intenções. Na última eleição, um instituto de pesquisa
perguntou a 1850 pessoas, escolhidas aleatoriamente, o nome do seu candidato. Utilizando a
inferência estatística, foi possível prever as preferências presidenciais da população, tendo como
base os resultados obtidos na amostra.
Enquanto os cálculos da estatística se baseiam em experiências, a probabilidade se baseia em pos-
tulados lógicos e ligados por meio da lei do azar ou da lei dos grandes números, ou seja, numa situação
qualquer na qual existam diferentes alternativas para sua finalização, tem-se possibilidades de acontecer
ou não qualquer uma das referidas alternativas.
Então, designando por S o número de casos possíveis (todas as alternativas) e por A o número de
casos favoráveis (ou seja, a possibilidade do evento acontecer), temos a probabilidade P assim definida:
Figura 32 – Probabilidade de casos favoráveis.
A
SP(A) =
S
Número de casos favoráveis
Total de casos possíveis
P(A) = = 1
2
0,5 ou 50%=
Estatística Aplicada à Gestão – Capítulo 3
135
Estatística Aplicada à Gestão – Capítulo 3
O valor de P(A) é sempre uma fração compreendida entre zero e um, sendo que o número de casos
favoráveis nunca pode ser maior que o número de casos possíveis, ou seja, o evento tem que ser menor
ou igual ao espaço amostral (A ≤ S).
Obtemos os seguintes valores limites da probabilidade:
P(A) = 0, quando A = 0, isto é, não há casos favoráveis; há certeza de não acontecer.a)
P(A) = 1, quando A = S, isto é, todos os casos são favoráveis, havendo certeza do acontecimento.b)
A probabilidade do não acontecimento costuma ser simbolizada pela letra Q, sendo Q(A) = 1 – P(A).
Logo, P(A) + Q(A) = 1.
Se existirem n possibilidades igualmente prováveis, sendo que uma delas deva ocorrer, considerare-
mos S como favoráveis ou sucesso do evento. Então, a probabilidade de acontecer resultado com sucesso
é S/n.
Quando as tentativas ou os experimentos de uma situação são repeti-
dos inúmeras vezes, a probabilidade de um evento tende a um resulta-
do qualquer com sucesso.
A seguir são apresentados alguns exemplos para entender melhor a teoria.
No lançamento de dois dados, qual é a probabilidade de ocorrer a soma igual a seis nas faces volta-1.
das para cima?
O espaço amostral no lançamento dos dois dados é determinado pelo quadro a seguir, em que é pos-
sível observar os possíveis acontecimentos após os lançamentos:
1, 1 1, 2 1, 3 1, 4 1, 5 1, 6
2, 1 2, 2 2, 3 2, 4 2, 5 2, 6
3, 1 3, 2 3, 3 3, 4 3, 5 3, 6
4, 1 4, 2 4, 3 4, 4 4, 5 4, 6
5, 1 5, 2 5, 3 5, 4 5, 5 5, 6
6, 1 6, 2 6, 3 6, 4 6, 5 6, 6
As faces dos possíveis eventos com a soma é A = {(3, 3), (4, 2), (2, 4), (1, 5), (5, 1)}, ou seja, n(A) = 5.
Então, a probabilidade é:
P(A) = .5
36
Uma urna contém um conjunto de bolas de bilhar, numeradas de 1 a 15. Qual a probabilidade de, ao 2.
retirar-se uma bola aleatoriamente, o número ser divisível por três ou não? O espaço amostral é o
conjunto de todas as bolas, ou seja:
S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15}. Então, n(S) = 15.
O evento possível e divisível por três é:
A = {3, 6, 9, 12, 15}. Então, n(A) = 5.
P(A) = 5
15
= 1
3
, ou ainda P(A) = 33,33%.
136
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
O evento possível e não divisível por três é:
A = {1, 2, 4, 5, 7, 8, 10, 11, 13, 14}. Então, n(A) = 10.
P(A) = 10
15
, ou ainda P(A) = 66,67%.
Uma caixa contém etiquetas adesivas nas cores verde, vermelha, amarela e azul. Ao retirar-se aleato-3.
riamente uma etiqueta da caixa, a probabilidade de sair uma na cor azul é 7
19
.
Qual a probabilidade de sair uma etiqueta que não é azul?
Seja S o espaço amostral das etiquetas que estão na caixa, então, S = {x | x é etiquetas da caixa}.
Os eventos complementares são:
A = {y ∈ S | y é etiqueta azul} e A = {z ∈ S | z não é etiqueta azul}.
Pela propriedade, temos que: P(A) = 1 – P(A), então:
P(A) = 7
19
1 – = 12
19
A probabilidade de sair etiquetas azuis é de 12
19
.
Um contêiner contém faróis de neblina para automóveis, perfeitos e defeituosos. Ao retirar-se um farol 4.
ao acaso do contêiner, a probabilidade de se obter um farol perfeito é de n – 82
50
, sendo n o número
total de faróis.
Qual é o número máximo de faróis que o contêiner pode conter?
Seja S o espaço amostral dos faróis que estão no contêiner, então, S = {x | x é farol do contêiner}.
Seja A o evento, então, A = {y ∈ S | y é farol perfeito}.
A probabilidade é dada por: P(A) = n – 82
50
Sabemos que a propriedade é: 0 ≤ P(A) ≥ 1, então temos:
0 ≤ n – 82
50
≥ 1
Portanto, 82 ≤ n ≥ 132.
Então, 132 é o número máximo de faróis no contêiner.
Texto i
PrObAbiLidAdE
Incerteza é o nome que se dá à propriedade que as coisas têm de não serem completamente pre-
visíveis. Trata-se de uma característica fundamental do universo, podendo ser minimizada, mas nunca
completamente eliminada. As suas principais causas são:
Ignorância: Falta de conhecimento acerca de quais são os fatores relevantes ou de como eles
se relacionam.
Medição imprecisa: Conhecimento falso e/ou incorreto de qual o status dos fatores relevantes.
Princípio da incerteza de Heisenberg: O próprio processo de mensuração pode levar a alte-
rações substanciais naquilo que se quer medir, fazendo com que os dados levantados não
correspondam mais aos fatos.
Leituras complementares
.
Estatística Aplicada à Gestão – Capítulo 3
137
Estatística Aplicada à Gestão – Capítulo 3
Aleatoriedade: Variabilidade, instabilidade ou indeterminismo intrínseco do universo, isto é, um
misterioso e impenetrável acaso essencial da natureza.
Para todos os fins práticos, todos os quatro componentes estão sempre presentes em qualquer
situação, sendo bastante difícil, ou mesmo impossível, determinar qual o grau de influência específico
de cada um deles num dado instante.
Probabilidadeé um conceito filosófico e matemático que permite a quantificação da incerteza,
permitindo que ela seja aferida, analisada e usada para a realização de previsões ou para a orientação
de intervenções. É aquilo que torna possível se lidar de forma racional com problemas envolvendo o
imprevisível. Alguns dos seus princípios mais importantes são:
Valor numérico da probabilidade: Existem diferentes formas de se definir e compreender a pro-
babilidade, mas todas elas têm em comum a expressão do seu valor segundo o grau de certeza
de que um dado evento venha a ocorrer. Matematicamente, isso é representado por um número
real entre “0” (plena certeza de que não vai ocorrer) e “1” (plena certeza de que vai ocorrer).
Mecanismo probabilístico: É o conjunto das estruturas e dinâmicas que se acredita estarem
subjacentes às probabilidades observadas para um dado fenômeno qualquer. Em outras pa-
lavras, seria a causa do padrão de incerteza percebido num determinado instante. O conheci-
mento dos mecanismos probabilísticos permite não apenas o estabelecimento de expectativas
quanto às probabilidades de um evento específico, mas também a identificação de quais os
fatores que influem em tais probabilidades e como eles atuam.
Variável aleatória: É o resultado numérico da observação de um fenômeno influenciado por um
determinado mecanismo probabilístico. Trata-se da quantificação do resultado produzido por
um fenômeno incerto.
Amostra: É um conjunto de dados, produzidos por observação e/ou experimentação, relativos
ao comportamento de uma variável aleatória. O termo também é utilizado para designar o sub-
conjunto de uma população, ou seja, uma fração da totalidade dos casos.
Distribuição de probabilidade: Rigorosamente falando, o seu nome correto é densidade de pro-
babilidade, mas a expressão “distribuição de probabilidade” é de uso mais comum. Trata-se da
curva matemática que associa uma probabilidade a cada faixa de valores da variável aleatória.
O seu formato, determinado pelas propriedades matemáticas da equação que a define, esta-
belece quais as características do mecanismo probabilístico subjacente.
Curva normal: Existe literalmente uma infinidade de distribuições de probabilidade possíveis,
porém, algumas se destacam como sendo mais importantes, como é o caso da distribuição
normal ou gaussiana. Entre as suas características estão os fatos de ela ser simétrica (valores
altos ou baixos da variável aleatória são igualmente prováveis) e de ter um formato de “sino” (os
valores intermediários são mais prováveis do que os altos ou baixos).
Definição clássica de probabilidade: Baseada em simetria, essa foi a primeira definição formal
de probabilidade, sendo expressa como a razão entre o número de casos favoráveis a tal
evento e o número total de casos possíveis. Trata-se de um conceito puramente matemático e
formal que depende apenas da lógica, sem a necessidade de observações ou experimentos
que gerem uma amostra.
Frequência relativa: É uma variação da definição clássica, sendo que o número de casos favo-
ráveis é substituído pelo número de ocorrências, e o número de casos possíveis é substituído
138
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
pelo número total de observações. Diferentemente da definição clássica, o conceito aqui envol-
ve uma interação prática com o evento e a anotação dos resultados.
Lei dos grandes números: É o teorema de Jacob Bernoulli, o qual estabelece que, numa série
imensa de experimentos, a frequência relativa de um evento se aproxima cada vez mais da sua
probabilidade. Assim, dada uma longa série de experimentos, pode-se, com erro desprezível,
calcular a probabilidade de um evento, ou então, dada a probabilidade de um evento, pode-se
calcular o número de vezes que ele deve ocorrer numa longa série de tentativas.
Dependência/independência de eventos: Quando se quer determinar a probabilidade da ocor-
rência simultânea de dois eventos, é preciso considerar a relação entre eles. Quando a ocor-
rência de um dos eventos em nada interfere na ocorrência do outro, diz-se que os dois eventos
são independentes entre si e a probabilidade de ambos ocorrerem ao mesmo tempo é dada
pelo produto das probabilidades de cada um isoladamente. Quando a ocorrência de um evento
afeta a ocorrência do outro, diz-se que os dois eventos são dependentes e a probabilidade de
ambos ocorrerem ao mesmo tempo é dada pela Regra de Bayes.
Regra de Bayes: O reverendo Thomas Bayes demonstrou um procedimento bastante impor-
tante para se calcular a probabilidade de um evento dado que um outro tenha ocorrido. O
método permite que se ajuste uma probabilidade a priori (conhecida) de um dado evento à luz
de novas evidências, envolvendo um outro evento que apresenta relação de dependência com
o primeiro.
A partir da aplicação correta dos conceitos acima, além de muitos outros, é possível se estimar
a propensão que determinados eventos ou combinação de eventos tem de ocorrer. Com isso, tem-se
como determinar a chance de um determinado achado científico ter ocorrido ao acaso, de modo a se
calcular a precisão e a confiabilidade de um dado resultado experimental.
IATROS. Probabilidade.
Disponível em: <http://www.vademecum.com.br/iatros/incerteza.htm>. Acesso em: 2 set. 2009.
Texto ii
O qUE é PArAdOxO dO ANiVErsáriO?
O fenômeno do paradoxo do aniversário é útil em diversas áreas (por exemplo: criptografia e
algoritmos de hash). Você pode tentar: da próxima vez em que estiver junto de 20 ou 30 pessoas,
pergunte a todos quando fazem aniversário. É provável que, dentro do grupo, duas pessoas farão ani-
versário no mesmo dia. Isso sempre surpreende as pessoas.
O motivo disso ser tão surpreendente é porque estamos acostumados a comparar as datas de
nossos aniversários com outros. Por exemplo, ao conhecermos alguém aleatoriamente e perguntarmos
sua data de aniversário, a probabilidade de as datas de aniversário dos dois coincidirem é de apenas
1/365 (0,27%). Em outras palavras, a probabilidade de dois indivíduos quaisquer fazerem aniversário
no mesmo dia é extremamente baixa. Mesmo que você pergunte a 20 pessoas, a probabilidade ainda
é baixa – menos do que 5%. Por isso, sentimos como se fosse algo muito raro encontrar alguém que
faça aniversário no mesmo dia que nós.
Entretanto, quando você coloca 20 pessoas em uma sala, o que muda é o fato de que cada uma
dessas 20 pessoas fará a pergunta para as outras 19. Cada pessoa tem uma pequena probabilidade de
sucesso (menos de 5%), mas cada uma está tentando 19 vezes, aumentando essa probabilidade.
Estatística Aplicada à Gestão – Capítulo 3
139
Estatística Aplicada à Gestão – Capítulo 3
Se você deseja calcular a probabilidade exata, uma maneira de analisar é a seguinte: digamos que
você tenha um calendário na parede com os 365 dias do ano. Você marca um X no dia do seu aniver-
sário. A pessoa que vier a seguir tem apenas 364 dias em aberto disponíveis, portanto, a probabilidade
das duas datas não colidirem é de 364/365. A pessoa seguinte tem apenas 363 dias em aberto, o que
reduz a probabilidade das datas não colidirem a 363/365. Se você multiplicar as probabilidades das
datas de aniversários de todas as 20 pessoas não colidirem, você tem:
364 ÷ 365 . 363 ÷ 365 . 365 – 20 + 1 ÷ 365 = chances de não haver colisões
É essa a probabilidade de não haver colisões, portanto, a probabilidade de colisão é 1 menos esse
número.
Na próxima vez que estiver em um grupo de 30 pessoas, tente!
O QUE é o paradoxo do aniversário?
Disponível em: <http://pessoas.hsw.uol.com.br/questao261.htm>.
Acesso em: 5 set. 2009.
Você estudou:
Em estatística a palavra “experimento” é usada em um sentido amplo e não convencional e se refere a
qualquer processo de observação ou medida.
Para cada experimento aleatório, o conjuntode todos os resultados possíveis é chamado de “espaço
amostral”, representado pela letra S. Já o evento é qualquer conjunto de resultados de um experimento,
subconjunto do espaço amostral S.
Além do uso na interpretação de jogos de azar, a probabilidade é aplicada também em determinadas
combinações de julgamento, experiências, produção, plantio ou dados históricos, para prever a possibi-
lidade da ocorrência ou não de um determinado evento futuro.
síntese
BIANCHINI, Edwaldo; PACCOLA, Herval. Curso de matemática. 2. ed. São Paulo: Moderna, 1999.
CASTANHEIRA, Nelson Pereira. Estatística aplicada. 2. ed. Curitiba: Ibpex, 2005.
DANTE, Luiz Roberto. Matemática: contexto & aplicações. São Paulo: Ática, 2001.
DOWNING, Douglas; CLARK, Jeffrey. Estatística aplicada. São Paulo: Saraiva, 1998.
FREUND, John; SIMON, Gary A. Estatística aplicada. 9. ed. Porto Alegre: Bookman, 2000.
PAIVA, Manoel Rodrigues. Matemática. São Paulo: Moderna, 1995.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidor. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
referências
Anotações
140
Probabilidade
Conteúdo programático
Propriedades da probabilidade
Probabilidades finitas dos espaços amostrais finitos
Espaços amostrais finitos equiprováveis
Acontecimentos mutuamente excludentes
Regra da adição para eventos mutuamente excludentes
Acontecimentos não mutuamente excludentes
Regra da adição para eventos não mutuamente excludentes
Acontecimentos simultâneos e sucessivos
Probabilidade condicional
Regra da multiplicação
Regra geral da multiplicação
Independência estatística
Objetivos
Distinguir fenômenos determinísticos de fenômenos aleatórios.
Entender as propriedades e os conceitos da teoria de probabilidades.
Classificar os espaços amostrais.
Executar as operações entre eventos.
142
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
propriEdadEs da probabilidadE
Ao se fazer a análise de um fenômeno, é necessário representá-lo através de um modelo matemático,
a fim de explicá-lo da melhor maneira possível. Os fenômenos podem ser assim classificados:
Fenômenos determinísticos – Obtemos sempre os mesmos resultados ao repetirmos um fenô-
meno sob as mesmas condições iniciais. Exemplo: deixar uma massa M cair em queda livre de uma
altura de 1 metro sobre uma superfície e anotar tempo t de queda livre.
Fenômenos aleatórios – Obtemos mais de um resultado ao repetirmos um fenômeno sob as
mesmas condições. Exemplos: lançar uma moeda ou um dado, observar o tempo de vida útil de um
aparelho, contar o número de clientes que vão a uma loja em um determinado dia.
A teoria das probabilidades estuda os fenômenos aleatórios. Na sequência você estudará as proprie-
dades da probabilidade.
P1) Evento complementar: Se A é um evento aleatório, então, a probabilidade de A não ocorrer é
dada por P(Ac) = 1 – P(A) ou, ainda, P(A) = 1 – P(A) e P(A) = 1 – P(A).
Se E é um espaço amostral de um experimento aleatório; e A, um evento de E, então, o evento com-
plementar de A, que indicamos por A, é o evento que satisfaz:
A ∪ A = E
A ∩ A = ∅
O símbolo de união (∪) corresponde, na álgebra booleana, à união e,
na aritmética, corresponde à soma.
Veja a representação do complementar de A, no diagrama de Venn-Euler:
Figura 33 – Representação do complementar de A.
E
A
A
O círculo representa o evento A de E. A região verde é a representação do complementar de A. Note
que A é formado por todos os elementos de E que não pertencem ao círculo A. Observe o exemplo a se-
guir.
Ao lançarmos um dado não viciado e considerando o evento A formado pelos números menores do que
3, o complementar de A, A, serão todos os outros números maiores ou iguais a 3.
A = {1, 2}
A = {3, 4, 5, 6}
Estatística Aplicada à Gestão – Capítulo 3
143
Estatística Aplicada à Gestão – Capítulo 3
Podemos escrever o evento complementar das seguintes formas: Abarra
e A.
P2) Propriedades das probabilidades: Sendo E um espaço finito e não vazio, e sendo A um evento
aleatório, então, temos as seguintes possibilidades: P(∅) = 0, P(A) = 1 e 0 ≤ P(A) ≥ 1.
P(I) ∅) = 0
O evento A = 0 ou A = ∅ (vazio) é chamado de evento impossível. Nesse caso, há certeza
do não acontecimento.
Uma urna contém bolas numeradas de 1 a 10. Retiramos uma bola desta urna aleatoria-
mente. Qual é a probabilidade de obtermos uma bola com número maior que 10?
O espaço amostral do experimento é: E = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}.
O evento que queremos é A = {x ∈ E | x > 10} = ∅.
Logo, A é o evento impossível. Portanto, P(A) = 0.
P(A) = 1II)
Se o evento A = S, ou seja, o evento coincide com o espaço amostral, ele é denominado
de evento certo (os chamados casos favoráveis). Então, existe a certeza do evento ser
realizado.
Utilizando os mesmos dados do exemplo anterior, qual a probabilidade de um número
menor que 11?
O evento que queremos é B = {x ∈ E | x < 11} = E.
Logo, B é um evento certo, pois B = E. Portanto, P(B) = 1.
0 III) ≤ P(A) ≥ 1
A é um evento de E, isto é, A está contido em E. Então, temos que 0 ≤ n(A) ≥ n(E), o que
indica certeza e impossibilidade.
Quando P(A) = 0, o evento A é o evento impossível; não há possibilidade de que ocorra.
Agora, se P(A) = 1, o evento A é o evento certo, há certeza que ocorrerá.
Qual é a probabilidade de, no lançamento de um dado com a face voltada para cima, sair um
número menor que 4?
Figura 34 – Espaço amostral no lançamento de um dado.
E
A
A 3
1
2
4
5
6
144
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
A = {1, 2, 3} → n(A) = 3
S = {1, 2, 3, 4, 5, 6} → n(S) = 6
Logo:
P(A) = 3
6
= 1
2
Probabilidades finitas dos espaços amostrais finitos
Um espaço amostral é dito finito quando o número de elementos que compõem o conjunto é limitado,
ou seja, pode-se demonstrar por S = {a1, a2, ..., an}, sendo que a1, a2, até an é a quantidade desses elemen-
tos. Cada evento simples (que pode ser representado por A = {ai}) é denominado de Pi – probabilidade de
acontecer {ai} – e é composto no espaço amostral S, em que i varia de 1 até n, satisfazendo estas condi-
ções:
Pa) i ≥ 0, sendo i = 1, 2, ..., n
Pb) 1 + P2 + ... + Pn = 1
A probabilidade P(A) de cada evento composto (mais de um elemento) é então definida pela soma das
probabilidades dos pontos de A. Observemos o exemplo a seguir.
Os amigos Luiz, Pedro e Juca treinam sempre juntos no Jardim Botânico e resolveram apostar uma
corrida na pista da Universidade onde estudam. Luiz tem 2 vezes mais probabilidade de ganhar que Pedro,
e Pedro tem 2 vezes mais a probabilidade de ganhar que Juca, afinal de contas, Luiz e Pedro são atletas
profissionais. Quais são as probabilidades de vitória de cada um, isto é, P(Luiz), P(Pedro) e P(Juca)?
Fazendo P(Juca) = p; então, P(Pedro) = 2 . p e P(Luiz) = 4 . p.
Como a soma das probabilidades é igual a 1, temos:
p + 2 . p + 4 . p = 1
ou
7 . p = 1 ou p = 1
7
P(Luiz) = 4
7
P(Pedro) = 2
7
P(Juca) = 1
7
Espaços amostrais finitos equiprováveis
O espaço amostral é dito equiprovável ou uniforme quando associa a cada ponto amostral a mesma
probabilidade de ocorrência. Se S contém n pontos, então a probabilidade de cada ponto é 1
n
.
Já os pontos são independentes se a probabilidade P(A ∩ B) = P(A) ∩ P(B).
Para entendermos melhor o que é um espaço amostral equiprovável, observemos os exemplos seguintes.
Num baralho comum com 52 cartas, escolhemos aleatoriamente (aleatório indica que o espaço é 1.
equiprovável) uma carta.
Seja A = {carta de copas} e B = {a carta é uma figura}, calcule P(A) e P(B).
P(A) = carta de copas
total de cartas
= 13
52
= 1
4
Estatística Aplicada à Gestão – Capítulo 3
145
Estatística Aplicada à Gestão – Capítulo 3
P(A)= quantidade de figuras
total de cartas
= 12
52
=
13
3
As tabelas seguintes mostram as frequências de cada face de uma moeda que foi lançada várias 2.
vezes. As letras c e k indicam, respectivamente, cara e coroa. A frequência de cada face é o núme-
ro de vezes que ocorreu no total dos lançamentos.
Em vinte lançamentos:
fACE frEqUêNCiA
c 12
k 8
Em cinquenta lançamentos:
fACE frEqUêNCiA
c 23
k 27
Em cem lançamentos:
fACE frEqUêNCiA
c 49
k 51
À medida que aumentamos o número de lançamentos, ou seja, indefinidamente, as frequên-
cias das faces tenderão a um mesmo número. Por isso, dizemos que o espaço amostral E = {c, k}
é equiprovável.
Acontecimentos mutuamente excludentes
União de acontecimentos que são mutuamente exclusivos ou excludentes, isto é, ocorrendo um deles
não pode ocorrer o outro. Por exemplo, se lançarmos um dado não viciado e sair número 3, então não
poderia ter saído o número 6.
regra da adição para eventos mutuamente excludentes
Se, num espaço amostral, K eventos são mutuamente excludentes ou exclusivos, a probabilidade de
ocorrência de um deles é igual à soma individual de suas probabilidades:
P(A1 ∪ A2 ∪ ... ∪ Ak) = P(A1) + P(A2) + ... + P(Ak),
para qualquer evento mutuamente exclusivos ou excludentes de A1, A2, ..., Ak.
A união de dois eventos, A e B, frequentemente contém muitos pontos amostrais, uma vez que a união
ocorre se qualquer um acontecer ou se ambos os eventos acontecerem, conforme diagrama de Venn-
-Euler:
A ∪ B
A B
146
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
A probabilidade da união de dois eventos, A e B, mutuamente exclusivos, pode ser obtida somando
P(A) mais P(B) pela fórmula:
P(A ∪ B) = P(A) + P(B)
Lê-se: a probabilidade de poder acontecer o evento A ou o evento B é igual à probabilidade de aconte-
cer o evento A mais a probabilidade de acontecer o evento B.
Se temos P(A) = 1. 3
8
e P(B) = 5
8
, ao aplicarmos a fórmula, obtemos:
P(A ∪ B) = P(A) + P(B) = 3
8
+ 5
8
= 8
8
= 1
Ao somarmos dois ou mais quocientes, precisamos encontrar o mmc
para completar a resolução.
Se dois eventos, 2. Q e K, são mutuamente exclusivos ou excludentes do espaço amostral E, deter-
mine P(Q ∪ K), sabendo que P(Q) = 1
5
e P(K) = 2
7
.
P(A ∪ B) = P(A) + P(B) = 1
5
+ 2
7
= 17
35
Quando os eventos são mutuamente exclusivos ou excludentes,
P(A ∩ B) = 0.
Acontecimentos não mutuamente excludentes
Consideremos o caso de dois eventos que podem ocorrer simultaneamente. Suponhamos A = {extra-
ção de um às de um baralho} e B = {extração de uma carta de espadas}. Então, A e B não são mutuamente
exclusivos ou excludentes, visto que pode ser extraído o às de espadas.
Ao somarmos as probabilidades P(A) + P(B), estamos contando duas vezes os resultados da inter-
seção de P(A ∩ B); em função disso, precisamos subtrair para obtermos o valor correto do resultado
P(A ∩ B) dos eventos. Veja:
A ∪ B
A B A B
A ∩ B
P(A ∪ B) = P(A) + P(B) – P(A ∩ B)
Estatística Aplicada à Gestão – Capítulo 3
147
Estatística Aplicada à Gestão – Capítulo 3
Sejam 1. A e B dois eventos de um espaço amostral E, determine P(A), sabendo que P(B) = 1
5
,
P(A ∪ B) = 11
30
e P(A ∩ B) = 1
6
.
Aplicando a fórmula, temos:
(A ∪ B) = P(A) + P(B) – P(A ∩ B)
=1
30
P(A) + 1
5
– 1
6
⇒ 11
30
1
5
+ 1
6
– = P(A)
P(A) = 1
3
Na UFPR foi feita uma pesquisa na turma do 1.2. o período do curso de Educação Física sobre seus
esportes preferidos. Na entrevista, obtiveram-se os seguintes resultados: 56 alunos gostam de
futebol; 49, de basquete; 43, de vôlei; 19 gostam de futebol e basquete; 15, de futebol e vôlei; 13,
de vôlei e basquete; 9, de basquete, futebol e vôlei; e 15 não apreciam nenhum desses esportes.
EsPOrTEs NúMErO dE ALUNOs
Basquete 49
Futebol 56
Vôlei 43
Basquete e futebol 19
Futebol e vôlei 15
Basquete e vôlei 13
Basquete, futebol e vôlei 9
Nenhuma das modalidades 15
Vamos montar o diagrama de Venn-Euler com a distribuição das quantidades da tabela acima.
Observação: n(B ∪ F ∪ V) = n(B) + n(F) + n(V) – n(B ∩ F) – n(B ∩ V) – n(F ∩ V) + n(A ∩ B ∩ C)
+ nenhum.
Assim, temos: n(B ∪ F ∪ V) = 49 + 56 + 43 – 19 – 13 – 15 + 9 + 15 = 125 foi o número de alunos
entrevistados.
Basquete
Vôlei
Futebol
Nenhuma = 15
26
4
10
9
31
6
24
148
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
De acordo com o diagrama, determine o número de alunos que:I)
gostam somente de basquete: 26.a)
que gostam somente de futebol: 31.b)
gostam somente de vôlei: 24.c)
não gostam nem de basquete e nem de vôlei: 31.d)
que gostam de futebol ou vôlei ou ambos: 84.e)
II) Determine a quantidade de alunos entrevistados: 125.
regra da adição para eventos não mutuamente excludentes
Se os eventos A e B são não mutuamente exclusivos ou excludentes,
P(A ∪ B) = P(A) + P(B) – P(A ∩ B), em que P(A ∩ B) = P(A) . P(B).
Num jogo de baralho completo, com 52 cartas, ao se retirar um carta aleatoriamente, qual é a 1.
probabilidade de ser uma dama ou uma carta de ouros?
4
25
P(A) = , P(B) = 13
25
e P(A ∩ B) = 4
25
13
25
. = 1
25
P(A ∪ B) = 4
25
13
25
+ 1
25
– = 4
13
Portanto, a probabilidade de ser uma dama e de ser de ouros é 4
13
.
No caso do lançamento de dois dados não viciados, calcule as seguintes probabilidades:2.
O resultado da soma dos dois dados ser igual a 4.a)
A soma dos dois dados ser igual a 8.b)
O espaço amostral S é composto pela tabela a seguir, extraído dos seis lados do primeiro dado
e dos seis lados do segundo dado. Veja:
s 1, 1 1, 2 1, 3 1, 4 1, 5 1, 6
2, 1 2, 2 2, 3 2, 4 2, 5 2, 6
3, 1 3, 2 3, 3 3, 4 3, 5 3, 6
4, 1 4, 2 4, 3 4, 4 4, 5 4, 6
5, 1 5, 2 5, 3 5, 4 5, 5 5, 6
6, 1 6, 2 6, 3 6, 4 6, 5 6, 6
Os elementos em que ocorre a soma 4 são: A = {(1, 3), (2, 2), (3, 1)}a)
Pela definição da probabilidade, temos:
P(A) = 3
36
= 0,12 ou 12% de probabilidade de ocorrer a soma 4.
Os conjuntos de pares que formam a soma igual a 8 são:b)
B = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}.
Estatística Aplicada à Gestão – Capítulo 3
149
Estatística Aplicada à Gestão – Capítulo 3
Aplicando a fórmula da probabilidade, obtemos:
P(B) = 5
36
= 0,1388 ou 13,88% de probabilidade de ocorrer a soma 8.
Acontecimentos simultâneos e sucessivos
Existem acontecimentos independentes simultâneos, como um baralho não viciado de que se quer
tirar uma carta de um determinado naipe e que seja figura. A isso damos o nome de acontecimento com-
posto, como uma carta de copas e que seja uma dama.
Existem também acontecimentos independentes sucessivos, que exigem a ocorrência do primeiro
fato para que possa haver a hipótese do segundo acontecimento. Por exemplo, havendo duas jogadas
sucessivas de um dado não viciado, qual a probabilidade de sair o número 6 nas duas vezes? Esse tipo de
acontecimento é chamado de complexo, ou seja, é preciso acontecer o primeiro para depois acontecer o
segundo. Leia a seguir um exemplo na área jurídica:
Um motorista invade o sinal vermelho. Um outro carro estava em alta velocidade, desvia-se do
primeiro e acaba matando um transeunte. Neste caso, ambos agiram com culpa, embora de forma
independente. É uma situação de concorrência de culpas, que se resolve na forma de “crimes culposos
paralelos” (porque cada agente criou seu risco próprio, de forma independente, mas ambos concor-
reram para o resultado final). Temos, então, uma combinação de fatores (de riscos) que conduzem à
produção de um resultado. Não altera a solução penal, se ambos os veículos se chocaram e em razão
disso vem a morrer um transeunte que passava pelo local. Mais uma vez: crimes culposos paralelos(ou
seja: concorrência de culpas, na forma “crimes culposos paralelos”).
GOMES, Luiz Flávio. Participação de várias pessoas no crime culposo.
Disponível em: <http://www.parana-online.com.br/canal/direito-e-justica/news/>. Acesso em: 18 set. 2009.
Probabilidade condicional
Probabilidade condicional ocorre quando, dados dois eventos, A e B, de um espaço amostral S, denota-
-se por P(A | B) a probabilidade condicionada de o evento A ocorrer, quando o evento B já tiver ocorrido:
P(A | B) =
P(A ∩ B)
P(B)
, com P(B) /= 0, pois B já ocorreu.
Para avaliar a probabilidade de ocorrer o evento A, dado que o evento B já ocorreu, só precisamos
contar o número de casos favoráveis do evento (A ∩ B) e dividir esse número pela quantidade de casos
favoráveis do evento B.
U1. ma urna contém etiquetas numeradas de 1 a 100. Ao retirar-se uma etiqueta da urna aleato-
riamente, sabendo que o número da etiqueta é múltiplo de 5, qual a probabilidade de que esse
número seja 20?
Sabendo que o número da etiqueta retirada é múltiplo de 5, temos como espaço amostral o se-
guinte conjunto: S = {5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100},
e que n(S) = 20.
O evento que queremos é A = {20}, em que n(A) = 1.
P(A)
P(S)
Logo, P(A) = =
1
20
= 5%.
150
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
Nesse exemplo, o evento ocorreu com número múltiplo de 5, por isso o espaço amostral S ficou
reduzido a esses elementos do evento.
Num determinado lote com 10 pedais de bicicletas, foram retirados (aleatoriamente e sem reposi-2.
ção) dois. Sabendo que apenas 4 são bons, determine a probabilidade de que ambos os pedais
sejam defeituosos.
A = {a primeira peça é defeituosa}
B = {a segunda peça é defeituosa}
P(A ∩ B) = P(A) . P(B | A)
P(A ∩ B) = 6
10
5
9
30
90
1
3
. = =
Note que P(A | B) é a probabilidade da segunda peça ser defeituosa, sendo que a primeira já é
defeituosa.
Dentro de uma urna, temos os números de 1 a 15. Se um número sorteado entre eles, ao acaso, é 3.
um número ímpar, qual a probabilidade de que seja o número 7?
O nosso espaço amostral é S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15}.
O evento A = {7}, já o evento B = {número ímpar}.
P(A | B) = ?
Se não tivéssemos a informação de B ser ímpar, teríamos P(A) = 1
15
, porém, com a informação do
número ser ímpar, o espaço amostral é reduzido para Símpar = {1, 3, 5, 7, 9, 11, 13, 15} e é nesse
espaço que iremos avaliar a probabilidade do evento A ocorrer.
Então:
P(A ∩ B) = {7} → n(A) = 1
P(B) = {1, 3, 5, 7, 9, 11, 13, 15} → n(B) = 8
P(A | B) = número de evento favorável A ∩ B
número de evento favorável B
= 1
8
O evento A é independente do evento B, se a probabilidade de A não for
afetada pela ocorrência ou não ocorrência de B.
regra da multiplicação
P(A | B) =
P(A ∩ B)
P(B)
, com P(B) /= 0, pois B já ocorreu.
regra geral da multiplicação
P(A ∩ B) = P(B) . P(A / B)
De acordo com a fórmula, a probabilidade de ocorrência de dois eventos é igual ao produto da proba-
bilidade de ocorrência de um deles pela probabilidade condicional da ocorrência do segundo, dado que o
Estatística Aplicada à Gestão – Capítulo 3
151
Estatística Aplicada à Gestão – Capítulo 3
primeiro ocorreu. Se não designamos (ou não interessa saber) qual é o evento, A ou B, podemos também
ter a fórmula escrita a seguir:
P(A ∩ B) = P(A) . P(B / A)
No acontecimento composto e no acontecimento complexo, aplica-se a regra da multiplicação, que tem
a seguinte definição:
A probabilidade de um acontecimento complexo ou composto é igual ao
produto das probabilidades simples dos acontecimentos considerados
(quando os acontecimentos anteriores já se realizaram).
Eventos independentes: (A a) ∩ B) = P(A) . P(B).
Eventos dependentes: (B | A) = P(A b) ∩ B) = P(A) . P(B / A).
O princípio da multiplicação afirma que, se o primeiro de dois experimentos admite a resultados possí-
veis, o segundo comporta b resultados possíveis, podendo ocorrer qualquer combinação desses resultados,
então, o número total de resultados possíveis dos dois experimentos é: a . b.
Num lote com doze impressoras importadas, quatro estão com defeito de fábrica. Ao retirar duas im-1.
pressoras do lote, uma após a outra, qual será a probabilidade de ambas não estarem com defeito?
Espaço amostral total é igual a 12.
Impressoras com defeito são 4.
Impressoras sem problema é 12 – 4 = 8.
Portanto, temos que fazer os cálculos da probabilidade com as impressoras boas e, ainda, quando
se tira uma do lote, diminui a quantidade total:
8
12
7
11
56
132
0,42. = =
A probabilidade de que ambas sejam boas é de 42%.
Qual a probabilidade de se obter dois reis em seguida, quando se extraem duas cartas de um 2.
baralho comum de 52 cartas não viciado, se:
a primeira carta é extraída e lida, depois é reposta no baralho antes da segunda extração?a)
a primeira carta extraída não é reposta antes da segunda extração?b)
4
52
4
52
1
169
0,0059 ou 0,59%. = =
Se retirarmos uma carta, e ela não é reposta no baralho para segunda extração, ficamos com 51
cartas no baralho.
4
52
3
51
1
221
0,0045 ou 0,45%. = =
A distinção entre as duas resoluções é muito importante em estatísti-
ca. No item (a), temos uma amostragem com reposição; no item (b),
amostragem sem reposição.
152
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
Em um recipiente não transparente existem onze bolas coloridas, sendo seis azuis e cinco verme-3.
lhas. Retirando-se simultaneamente quatro bolas sem reposição, qual a probabilidade de saírem
três bolas azuis e uma vermelha?
Total da amostragem é 11.
As possíveis situações são:
6
1
5
10
600
7920
AAAV ⇒ P1 = . =
4
9
. 5
8
. = 5
6
6
1
5
10
AAVA ⇒ P2 = . =
5
9
. 4
8
. 5
6
6
1
5
10
AVAA ⇒ P3 = . =
5
9
. 4
8
. 5
6
6
1
5
10
VAAA ⇒ P4 = . =
5
9
. 4
8
. 5
6
Assim, a probabilidade total é P = P1 + P2 + P3 + P4 =
20
6
=
10
3
= 0,30 ou 30%.
A regra especial da multiplicação pode ser generalizada, de modo a
aplicarmos a ocorrência para mais eventos independentes, ou seja, mul-
tiplicarmos novamente todas as probabilidades individuais.
independência estatística
Um evento A é considerado independente de um outro evento B, se a probabilidade de A é igual à
probabilidade condicional de A, dado B, isto é, se:
P(A) = P(A | B).
É evidente que, se A é independente de B, B é independente de A. Logo: P(B) = P(B | A). Considerando
a regra da multiplicação, podemos afirmar que, se A e B são independentes, então:
P(A ∩ B) = P(A) . P(B)
Dados n eventos A1, A2, ..., An, dizemos que eles são independentes, se o forem 2 a 2, 3 a 3, ..., n a n.
Então:
P(A1 ∩ A2 ∩ ... ∩ An) = P(A1) . P(A2) . ... . P(An)
Numa conversa, dois amigos, Luiz e Mário, analisando a situação atual de saúde de cada um em 1.
função dos diagnósticos de um médico, resolveram fazer um cálculo de probabilidade de vida. A
probabilidade de Luiz estar vivo daqui a 20 anos é de 70%, e de Mário, no mesmo tempo, de 50%.
Com essas informações, calcule a probabilidade de que ambos estejam vivos daqui a 20 anos.
P(Luiz e Mário estejam vivos) = P(Luiz) = 70
100
e P(Mário) = 50
100
P(Luiz ∩ Mário) = 70
100
. 50
100
= 35
100
= 0,35
A probabilidade de os dois estarem vivos daqui a 20 anos é de 35%.
Estatística Aplicada à Gestão – Capítulo 3
153
Estatística Aplicada à Gestão – Capítulo 3
Na amostra 2. S dos números inteiros compreendidos de 1 a 30, se escolhermos ao acaso um dentre
eles, qual a probabilidade de o:
número ser divisível por 5;a)
número ser divisível por 3;b)
número ser divisível por 3 e por 5;c)
número ser divisívelpor 3 ou por 5?d)
S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30}
P(A) = {o número é divisível por 5} = 6
30
→ P(A) = 1
5
P(B) = {o número é divisível por 3} = 10
30
→ P(B) = 1
3
P(A e B) = {o número é divisível por 3 e por 5} → P(A e B) = P(A) + P(B) – P(A) . P(B)
P(A e B) = 1
5
+ 1
3
– 1
5
. 1
3
P(A e B) = 1
5
+ 1
3
– 1
15
→ P(A e B) = 7
75
P(A ou B) = {o número é divisível por 3 ou por 5} → P(A ou B) = P(A) . P(B)
P(A ou B) = 1
5
. 1
3
P(A ou B) = 1
15
A Matemática nunca deixa completamente de ser um jogo, embora possa ser muitas
outras coisas.
Miguel Guzmán
Um pouco de história
Há quem defenda que a teoria das probabilidades, ligada ao jogo,
é anterior a Cristo. Gregos e romanos, sendo viciados em dados,
preocupavam-se com a “forma” de ganhar. O imperador Claudius
(século I) escreveu um livro: Como ganhar aos dados. Mas o con-
ceito matemático é mais recente e nasce com a correspondência
trocada entre Blaise Pascal e Fermat acerca da possibilidade do
ganho nos jogos. Borel (1871–1956) e Henri Lebesque (1875–
1941) foram responsáveis pelo seu arranque sistemático.
Disponível em: <http://www.qfojo.net/criar+/mat/probabil/introdu.htm>. Acesso em: 7 set. 2009.
Podemos dizer, portanto, que a probabilidade nasceu no século XVII,
por interesse comum de Pascal e Fermat.
Inicialmente, o conceito de probabilidade era de caráter frequentista,
isto é, associando a probabilidade de um acontecimento à frequência
com que ele se repetia, quando observadas um grande número de ex-
periências.
154
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
Contudo, tal conceito pecava por falta de rigor. Basta pensar no quão
relativo é dizermos: “um grande número de experiências”.
Em 1933 o russo Kolmogorov construiu um axioma para o cálculo de
probabilidades convertendo-o numa teoria matemática e transformando
a estatística em ciência.
Blaise Pascal (1623–1662)
O
ld
b
oo
k
Pierre de Fermat (1601–1665)
Fr
a
n
ço
is
de
P
o
illy
APLiCANdO Os CiNCO PAssOs PArA ACHAr UMA PrObAbiLidAdE EM TrEiNAMENTO
EM diVErsidAdE
Problema: O treinamento de funcionários em diversidade é a ultima tendência no mundo empre-
sarial norte-americano. O jornal USA Today relatou as principais razões dadas pelas empresas para
promover o treinamento em diversidade como parte do seu processo de planejamento estratégico. As
razões estão resumidas na tabela.
Imagine uma empresa que é selecionada ao acaso entre todas as empresas dos Estados Unidos
que usam o treinamento em diversidade e que a razão fundamental é determinada.
Defina o experimento que gerou os dados da tabela e liste os pontos amostrais.a)
Atribua probabilidades aos pontos amostrais.b)
Qual é a probabilidade de que a razão fundamental para o treinamento em diversidade esteja c)
relacionada ao negócio, isto é, à competição ou produtividade?
Qual é a probabilidade de que a responsabilidade social não seja a razão fundamental para o d)
treinamento em diversidade?
rAZãO POrCENTAGEM
Está de acordo com as políticas de pessoal (EPP)
Aumenta a produtividade (AP)
Mantém a empresa competitiva (MC)
Responsabilidade social (RS)
Outras (O)
7
47
38
4
4
Total 100%
Tabela 1 – Principais razões para treinamento em diversidade.
Leitura complementar
Estatística Aplicada à Gestão – Capítulo 3
155
Estatística Aplicada à Gestão – Capítulo 3
Solução:
O experimento é o ato de determinar a razão fundamental para o treinamento em diversidade a)
dos empregados em uma empresa norte-americana. Os pontos amostrais, que são os resul-
tados elementares do experimento, são as cinco categorias de respostas listadas na tabela.
Esses pontos amostrais são mostrados no diagrama de Venn:
Figura 1– Diagrama de Venn para levantamento
sobre treinamento em diversidade.
B
AP•
MC•
S
EPP•
RS•
O•
Se tivéssemos que atribuir probabilidades iguais neste caso, cada uma das categorias de res-b)
postas teria probabilidade de um quinto (1/5) ou 0,2. Mas, examinando a tabela, você pode
verificar que probabilidades iguais não seriam razoáveis aqui, porque as porcentagens das
respostas não são nem aproximadamente as mesmas nas cinco classificações. Seria mais
razoável atribuir probabilidades iguais às porcentagens das respostas em cada classe, como
mostrado na tabela a seguir:
PONTOs AMOsTrAis PrObAbiLidAdE
EPP
AP
MC
RS
O
0,07
0,47
0,38
0,04
0,04
Tabela 2 – Probabilidade dos pontos amostrais para o
levantamento sobre treinamento em diversidade.
Considere que o símbolo c) B representa o evento de que a razão fundamental para o treinamento
em diversidade está relacionada ao negócio. B não é um ponto amostral, porque consiste em
mais de uma das categorias de respostas (os pontos amostrais). De fato, como mostrado na
figura anterior, B consiste em dois pontos amostrais, AP e MC. A probabilidade B é definida
como sendo a soma dos pontos amostrais de B.
P(B) = P(AP) + P(MC) = 0,47 + 0,38 = 0,85
Considere que o símbolo NRS representa o evento de que a responsabilidade social não é a d)
razão fundamental para o treinamento em diversidade. Então, NRS consiste em todos os pon-
tos amostrais exceto RS, e a probabilidade é a soma das probabilidades dos correspondentes
pontos amostrais:
P(NRS) = P(EPP) + P(AP) + P(MC) + P(O) = 0,07 + 0,47 + 0,38 + 0,04 = 0,96
Lembre-se: A chave para resolver esse problema é seguir os passos delineados anteriormente.
Definimos o experimento (Passo 1) e listamos os pontos amostrais (Passo 2) no item a. A atribuição das
156
probabilidades aos pontos amostrais (Ponto 3) foi feita no item b. Para cada probabilidade, nos itens c e
d, identificamos o conjunto de pontos no evento (Passo 4) e somamos suas probabilidades (Passo 5).
McCLAVE, James T.; BENSON, P. George; SINCICH, Terry.
Estatística para administração e economia. São Paulo: Pearson, 2008.
Você estudou:
Fenômenos determinísticos são situações ou eventos que nos levam sempre a um mesmo resultado
final. Isso só acontece quando as condições iniciais são sempre as mesmas ou quando há alguma va-
riação pequena e desprezível. Já os fenômenos aleatórios podem nos conduzir a resultados diferentes,
mesmo quando as condições iniciais são sempre as mesmas. Dessa forma, os resultados dos eventos
são imprevisíveis.
Os conceitos e as propriedades da teoria das probabilidades são utilizados como instrumento para a
avaliação de riscos e tomadas de decisões.
O espaço amostral representa o conjunto de todas as possibilidades de respostas de um experimento.
Já evento representa um subconjunto do espaço amostral.
Operações entre eventos trazem respostas das ocorrências e dos experimentos com resultados possí-
veis ou mesmo impossíveis, principalmente quando se trata de experimento aleatório.
síntese
BIANCHINI, Edwaldo; PACCOLA, Herval. Curso de matemática. 2. ed. São Paulo: Moderna, 1999.
CASTANHEIRA, Nelson Pereira. Estatística aplicada. 2. ed. Curitiba: Ibpex, 2005.
DANTE, Luiz Roberto. Matemática: contexto & aplicações. São Paulo: Ática, 2001.
DEVORE, Jay. Probabilidade e estatística para engenharia e ciências. Tradução de: SILVA, Joaquim Pinheiro Nunes
da. São Paulo: Pioneira/Thomson Learning, 2006.
FREUND, John; SIMON, Gary. Estatística aplicada. 9. ed. Porto Alegre: Bookman, 2000.
McCLAVE, James; BENSON, George; SINCICH, Terry. Estatística para administração e economia. São Paulo: Pearson,
2008.
PAIVA, Manoel Rodrigues. Matemática. São Paulo: Moderna, 1995.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidor. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
referências
Anotações
Variáveis aleatórias
Conteúdo programático
Conceitos básicos relacionadosàs variáveis aleatórias
Tipos de variáveis
Variável aleatória discreta
Variável aleatória contínua
Função da probabilidade
Função densidade de probabilidade
Esperança matemática, média ou valor esperado
Variância
Objetivos
Compreender que um dos interesses da estatística é fazer inferências
sobre populações em estudo e suas características.
Verificar que, em qualquer experimento estatístico, os resultados estão
sujeitos a incertezas.
Entender que é normal o emprego de modelos por meio das variáveis
aleatórias, as quais permitem passar dos resultados do experimento para
uma função numérica dos resultados.
158
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
concEitos básicos rElacionados às
variávEis alEatórias
Segundo Devore (2006), para um dado espaço amostral S de um experimento, uma variável aleatória é
qualquer regra que associe um valor a cada resultado de S. Em termos matemáticos, uma variável aleatória
é uma função cujo domínio é o espaço amostral S, e o contradomínio é o conjunto dos números reais R.
O espaço amostral S é o conjunto de todos os elementos que pertencem
a um experimento e dos possíveis resultados de um subconjunto e.
Segue outra definição menos formal: variável aleatória é uma função que associa números reais aos
eventos de um espaço amostral, como é possível verificar na figura:
Figura 35 – Variável aleatória.
•
e
S Rx
x(e)
e = evento qualquer de S
S = espaço amostral
x(e) = número real associado aos elementos e pertencem ao espaço amostral S
Rx = conjunto dos valores possíveis de x
Uma moeda é lançada duas vezes. Sendo a variável aleatória x = número de caras, quais são os pos-1.
síveis valores da variável aleatória x?
S = {(c, c)(c, k)(k, c)(k, k)}
c = cara
k = coroa
Rx = {0, 1, 2}
(c, c)
(c, k)
(k, c)
(k, k)
2
1
0
S R
x
Estatística Aplicada à Gestão – Capítulo 3
159
Estatística Aplicada à Gestão – Capítulo 3
Duas bolas são retiradas, sucessivamente, de uma urna que contém três bolas brancas e duas azuis, 2.
sem reposição. Quais são os resultados possíveis e os valores da variável aleatória, considerando:
X = número de bolas brancas
S = {(B, B)(B, A)(A, B)(A, A)}
EsPAçO AMOsTrAL (s) VALOrEs dE x (x = x)
BB 2
BA 1
AB 1
AA 0
Tipos de variáveis
Quanto à natureza da variável, ela pode ser classificada em qualitativa e quantitativa. Aqui, as variáveis
de interesse para estudo são as quantitativas, aquelas que podemos contar ou medir, que se subdividem
em discretas e contínuas.
Variável quantitativa e contínua é aquela que assume uma quantidade
de valores distintos. Para a construção de tabelas de frequências, é
preciso o agrupamento dos elementos ou dados em classes.
Variável aleatória discreta
Uma variável aleatória X é dita discreta se o número dos possíveis valores que X pode assumir for finito
ou infinito enumerável. Sintetizando: é possível contar. Observe os exemplos a seguir.
O número de peças defeituosas em cada sete inspecionadas.a)
Ao lançar duas moedas e observar o número de caras.b)
O número de filhos por funcionários de determinada empresa.c)
Variável aleatória contínua
Uma variável aleatória é contínua quando pode assumir valores em um intervalo contínuo de números.
É mensuração, podendo tomar todos os números reais maiores que zero.
Comprimento de certo componente fabricado.a)
Altura dos alunos de uma sala de aula.b)
Peso dos funcionários de determinada empresa.c)
Duração, em horas, de uma lâmpada.d)
função de probabilidade
Seja X uma variável aleatória discreta e o valor de sua probabilidade associado ao conjunto de pares
ordenados (x, f(x)), dá-se o nome de função de probabilidade ou distribuição de probabilidades da variável
160
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
discreta x, se cada resultado possível da variável aleatória x satisfizer as seguintes propriedades:
f(x) ≥ 0
x
∑f(x) = 1
P(X = x) = f(x)
Nesse caso, é preciso retomar conceitos de matemática estudados
no Ensino Médio, principalmente a parte de funções, derivadas e inte-
grais definidas. Na definição acima, aparece a função do par ordenado
(x, f(x)), em que f(x) = y e depende da variável x.
Lançadas duas moedas ao ar, em que o espaço amostral S = {(ca, ca), (ca, co), (co, ca), (co, co)}, e a 1.
variável aleatória x = número de caras:
PONTO AMOsTrAL VALOrEs dE x PrObAbiLidAdE dE x = x
ca, ca 2 0,25
ca, co 1 0,25
co, ca 1 0,25
co, co 0 0,25
∑ = 1
Um carregamento de oito microcomputadores similares para um ponto de venda contém três que 2.
apresentam defeitos. Se uma escola faz uma compra aleatória de dois desses microcomputadores,
determine a distribuição de probabilidade para o número de defeituosos.
x = a variável aleatória cujos valores x são os números possíveis de computadores comprados pela
escola.
S = {0, 1, 2, 3, 4, 5, 6, 7, 8}
A fórmula a ser aplicada é a seguinte:
n!
x! (n – x)!
Cn,x =
Figura 36 – Função de probabilidade.
0
0,25
0,5
0,75
0 1 2 3
X
P(
x)
-1
Estatística Aplicada à Gestão – Capítulo 3
161
Estatística Aplicada à Gestão – Capítulo 3
Esta fórmula exige que você recorde estes assuntos: fatorial e combi-
nação. Segue um exemplo.
Fatorial de um número: n! = 3! → 3! = 3 . 2 . 1 = 6
Portanto, a combinação de 5 elementos tomados 3 a 3 é resolvida as-
sim:
5!
3! (5 – 3)!
C5,3 = =
5 . 4 . 3 . 2 . 1
3 . 2 . 1(2)! =
120
6 . 2
=
120
12
= 10
8!
2! (8 – 2)!
P(defeito) =
8
2
= = 28 (Todas as possibilidades de a peça ser defeituosa.)
1 . 10
28
P(não ter defeito) = P(x = 0) = =
8
2
3
0
5
2
= 10
28
(Todas as possibilidades de a peça não
apresentar defeito.)
3 . 5
28
P(ter um defeito) = P(x = 1) = =
8
2
3
1
5
1
= 15
28
(A probabilidade de uma peça apresentar
defeito.)
3 .1
28
P(ter dois defeitos) = P(x = 2) = =
8
2
3
2
5
0
= 3
28
(A probabilidade de duas peças apresen-
tarem defeito.)
Verifique como fica a distribuição de probabilidade:
VALOrEs dE x PrObAbiLidAdE dE x = x
0 10
28
1 15
28
2 3
28
162
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
função densidade de probabilidade
Seja X uma variável aleatória contínua, a função densidade de probabilidade pode ser definida como
sendo a função f que satisfaz as seguintes propriedades:
f(x)a) ≥ 0 para todo x ∈ Rx
Rx
b) f(x)dx = 1
A segunda propriedade indica que a área total limitada pela curva que representa a função f(x) e o eixo
das abscissas é igual a 1.
Se o intervalo [a, b] ∈ ℜx , então a probabilidade de certo valor de x pertencer a esse intervalo será
dada por:
P(a c) ≤ x ≤ b) =
a
b
f(x)dx
Sendo as probabilidades das variáveis aleatórias contínuas interpreta-
das como áreas, fica claro que, para qualquer valor x0 ∈ ℜx , temos que
P(x = 0) é nula.
Seja 1. x uma variável aleatória contínua, cuja fdp é dada por f(x) = x
6
, para 2 ≤ x ≤ 6 e 0 para quais-
quer outros valores, calcule:
P(3 a) ≤ x ≤ 4)
P(x b) > 5)
Resolvendo:
a) P(3 ≤ x ≤ 4) =
3
4
x
16
dx = 1
16
3
4
xdx = 1
16
x
2
2
4
3
= 7
32
= 0,219
b) P(x > 5) =
5
6
x
16
dx = 1
16
5
6
xdx = 1
16
x
2
2
6
5
= 11
32
= 0,344
Seja 2. x uma variável aleatória contínua, cuja fdp é dada por f(x) = k, para 2 ≤ x ≤5, e e = 0 para
quaisquer outros valores, determine o valor de k.
Pela propriedade 1 da fdp, temos:
Rx
f(x)dx = 1, portanto:
2
5
kdx = 1
k
2
5
dx = 1
k[5 – 2] = 1 ∴ k = 1
3
Esperança matemática, média ou valor esperado
O cálculo da média aritmética ou esperança matemática é igualà média ponderada da probabilidade
de ganhar (cujo peso é um coeficiente de custo) menos a média ponderada da probabilidade de perder
Estatística Aplicada à Gestão – Capítulo 3
163
Estatística Aplicada à Gestão – Capítulo 3
(cujo peso é um coeficiente de custo), ou seja, verifica-se um ganho esperado utilizando variáveis aleatórias
xi, sendo que P(x) representa as probabilidades de cada variável.
Em outras palavras: a esperança matemática é o ganho esperado em um jogo não manipulado (com
uma ou mais variáveis aleatórias), multiplicado pela probabilidade dessas variáveis ocorrerem e por um
fator de capitalização financeira.
Quando a variável aleatória x for discreta, o valor esperado dessa variável será dado por:
E(x) = µx = µ = i = l∑
∞
xi . P(xi)
Quando a variável aleatória x for contínua, o valor esperado dessa variável será dado por:
E(x) = µx = µ =
–∞
+∞
fx(x)
São propriedades da esperança matemática:
E(k) = k1.
E(k . x) = k . E(x)2.
E(x ± y) = E(x) ± E(y)3.
E(x ± k) = E(x) ± k4.
E(x . y) = E(x) . E(y), desde que 5. x e y sejam independentes.
Seja 1. x uma variável aleatória discreta que representa o número de peças perfeitas em cada cinco
peças inspecionadas. Sabendo-se que a probabilidade de uma peça qualquer ser defeituosa é de
20%, obtivemos a seguinte distribuição de probabilidades:
xi 0 1 2 3 4 5
P(xi) 0,00032 0,00640 0,05120 0,20480 0,40960 0,32768
Qual o valor esperado de peças perfeitas?
Como a v.a. (variável aleatória) x é discreta, temos que: E(x) = µx = µ = i = l∑
∞
xi . P(xi)
= 0 . 0,00032 + 1 . 0,00640 + 2 . 0,05120 + 3 . 0,20480 + 4 . 0,40960 + 5 . 0,32768 = 4
Logo, de cada 5 peças inspecionadas, o número esperado de peças perfeitas é 4.
Seja uma v.a. contínua 2. x, representando o tempo de vida em horas de certo componente eletrôni-
co, sabendo-se que a fdp de x é dada por f(x) = 0,002e–0,002x, x ≥ 0 e e = 0, se x < 0, (lê-se x menor
que), calcule o valor esperado de x.
E(x) = µx = µ =
–∞
+∞
fx(x)
0
∞
0,002x . e–0,002x dx = –x . e–0,002x – 1
0,002
e–0,002x
∞
0
= 0 – – 1
0,002
= 500 horas
Variância
Relembrando: variância é à média aritmética da soma total dos quadrados dos desvios. Seja x uma v.a.,
a variância dessa variável é definida como:
V(x) = Var(x) = σ2x = σ
2 = E[x – E(x)]2
164
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
Texto i
MANTEGA E O VALOr EsPErAdO
Mais uma demonstração de brilhantismo do nosso ministro da economia: em entrevista ao Jornal
Nacional, Mantega declarou: “ao cobrar uma taxa de juros mais elevada, cria-se a inadimplência; você
dificulta ao cidadão pagar a conta. Eu acho que essa política dos bancos é totalmente equivocada, é
claro que leva a lucros elevados dos bancos, mas depois é um tiro no pé, porque se o cidadão depois
ficar inadimplente, ele não vai pagar”.
Alguém precisa explicar ao ministro que, ao contrário dele, pessoas em bancos sabem fazer conta
de valor esperado. Por isso a inadimplência é levada em consideração ao se calcular a taxa de juros
cobrada, que, aliás, é aquela que maximiza o lucro do banco.
Fico com pena do professor de estatística que ele teve na USP, deve estar se contorcendo.
CARUSO, Tiago. Mantega e o valor esperado.
Disponível em: <http://espectroeconomico.blogspot.com/2009/01/mantega-e-o-valor-esperado.html>.
Acesso em: 29 ago. 2009.
Leituras complementares
Desenvolvendo, temos:
V(x) = E{x2 – 2 . x . E(x) + [E(x)2] =
E(x2) – 2E(x)E(x) + [E(x)]2 =
E(x2) – [E(x)]2
Estas são as propriedades da variância:
V(k) = 01.
V(kx) = k2. 2 . V(x)
V(x ± k) = V(x)3.
V(x ± y) = V(x) + V(y) ± 2 . COV(x, y).4.
O desvio padrão (σ) é a raiz quadrada da variância (σ2):σσ = σ2 .
Seja a v.a. x, representando o número de vezes por dia que uma máquina em funcionamento apresenta certo
defeito. Supondo que a distribuição dessa variável seja a seguinte, calcule a variância de x.
xi 0 1 2 3
P(xi ) 0,60 0,20 0,15 0,05
V(x) = E(x2) – [E(x)]2 =
i = l
∑
4
x2 i . P(xi) –
i = l
∑
4
x2 i . P(xi)
2
=
= 0 . 0,60 + 1 . 0,20 + 4 . 0,15 – 9 . 0,05 – (0 . 0,60 + 1 . 0,20 + 4 . 0,15 + 9 . 0,05)2 = 0,8275
O cálculo da variância e o desvio padrão têm resultados positivos ou
nulos.
Estatística Aplicada à Gestão – Capítulo 3
165
Estatística Aplicada à Gestão – Capítulo 3
Texto ii
LEi dE MUrPHy – qUANdO TUdO dá ErrAdO
Quem nunca atribuiu as terríveis e desastrosas coincidências cotidianas à Lei de Murphy, que atire
o primeiro pão com manteiga. Pode não acertar o alvo, mas terá uma certeza: a fatia cairá com o lado
recheado para baixo. Coincidência? Nem tanto. A gravidade e a altura média das mesas usadas por
nós são responsáveis por esse resultado, assim como o culpado pelas meias constantemente desem-
parceiradas nas gavetas é o número de modelos diferentes que possuímos.
Princípios científicos simples, mas desconhecidos da maior parte das pessoas, fazem com que
essa bem-humorada constatação da fatalidade da vida pareça sabedoria sobrenatural ou lenda urbana.
Para o físico britânico Robert Matthews, da Universidade Aston, em Birmingham, a famosa afirmação
de que “se alguma coisa puder dar errado, dará” é matemática pura. Há quase uma década o pesqui-
sador dedica-se ao estudo dessas pequenas peças pregadas pelo dia a dia e é categórico ao afirmar
que sim, as coisas têm mais chance de acabar mal do que bem.
A quase infalibilidade desse princípio rendeu a seus criadores um troféu IgNobel, honraria entre-
gue anualmente aos autores de pesquisas improváveis. O criador do prêmio, Marc Abrahams, explica
a razão: “Ele faz as pessoas rirem primeiro e, depois, pensarem”. [...]
Você decide lavar o carro e, quando termina o serviço, percebe nuvens carregadas se aproximando.
Não, o Universo não está conspirando contra você. Calcule quantas vezes por ano chove em sua
cidade e descobrirá que, por menor que seja a chance de uma tempestade acontecer em um determi-
nado dia, ela existe, e deve ser considerada.
Isso não quer dizer que, necessariamente, vá acontecer algo ruim. No exemplo acima, a não ser
que você more em Londres, as chances de um dia seco são maiores do que as de um temporal. “A Lei
de Murphy não é a previsão de um destino inevitável, mas justamente uma lembrança de que, se existe
a possibilidade de que algo ocorra, o dado não pode ser ignorado, a fim de se evitar uma catástrofe”,
afirma o historiador norte-americano Nick Spark, especialista no assunto. As origens da frase, que
Spark investigou a fundo, contemplam esse conceito.
A história começa no fim da década de 1940, na base Edwards da força aérea americana, na
Califórnia.
Na época, uma equipe liderada pelo médico militar John Paul Stapp (1910–1999) conduzia experi-
mentos para medir o impacto da gravidade sobre o corpo humano. O objetivo do projeto era descobrir
quantos Gs – unidades da força gravitacional que age sobre um corpo ao nível do mar – um piloto era
capaz de suportar em caso de acidente.
O trabalho de Stapp era monitorar um desacelerador – um aparelho composto de um trilho em que
corria um trenó. Acoplados à engenhoca, apelidada de Gee Whiz (expressão para definir algo espeta-
cular), viajavam bonecos de teste a uma velocidade de até 320 km por hora.
Por muitos anos, acreditou-se que o número máximo de gravidade que uma pessoa era capaz de
suportar era 18 Gs. Todas as aeronaves militares eram construídas em respeito a esse valor, embora
alguns incidentes ocorridos durante a Segunda Guerra sugerissem a possibilidade de o número estar
superestimado. O jovem capitão propôs-se então a uma experiência inédita: queria testar em si mesmo
o efeito da máquina. Para que a medição das forças G fosse acurada, quatro sensores foram trazidos
por outro membro da força aérea – o engenheiro de desenvolvimento Edward Murphy Jr.(1918–1990),
que passou poucos dias no local.
166
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
DEVORE, Jay L. Probabilidade e estatística para engenharia e ciências. São Paulo: Thomson Learning (Pioneira),
2006.
FREUND, John; SIMON, Gary. Estatística aplicada. 9. ed. Porto Alegre: Bookman, 2000.
McCLAVE, James. Estatística para administração e economia. São Paulo: Pearson Prentice Hall, 2009.
MORETTIN, Luiz Gonzaga. Estatística básica: probabilidade. 7. ed. São Paulo: McGraw Hill, 1979.
STEVENSON, Willian J. Estatística aplicada à administração. São Paulo: Habra, 1981.
referências
O Gee Whiz foi posto para trabalhar, mas a prática foi em vão. Para azar do grupo, os contadores
foram afixados da forma errada, o que zerou os valores atingidos. Irritado com o erro, Murphy teria
culpado um subordinado, queixando-se de que “se existirem duas ou mais formas de fazer uma tarefa,
e uma delas puder provocar um desastre, alguém irá adotá-la”.
Teoria da sorte
Um dos primeiros estudos a considerar o conceito de probabilidade é de autoria do italiano Galileu
Galilei, que se dedicou ao assunto a pedido de um amigo apaixonado pelo jogo de dados. Hoje, a téc-
nica matemática nascida dessa intuição já permite estudarmos eventos físicos inteiramente baseados
na probabilidade, como a mecânica quântica, ou elaborarmos previsões do comportamento social com
a ciência da estatística.
A probabilidade lida com as chances de sucesso de um evento. Algumas contas são bastante sim-
ples, como a ocorrência de cara ou coroa ao jogar uma moeda para o alto; como são apenas dois os
resultados possíveis, a chance é de 1
2
, ou 50%. Problemas mais sofisticados podem requerer cálculos
um pouco mais complexos, envolvendo permutação ou combinação. É o caso de quem tenta descobrir
a probabilidade de que dez cartas quaisquer de um baralho formem uma sequência ou de que, ao
lançar dois dados, ambos mostrem a mesma face.
LEI de Murphy – quando tudo dá errado.
Disponível em: <exatas.net/lei_murphy.pdf>.
Acesso em: 6 set. 2009.
Você estudou:
Quando associamos um valor numérico real à variável aleatória com a probabilidade de ocorrência, é
caracterizada uma distribuição de probabilidade.
A variável aleatória é aquela cujo valor é o resultado numérico de um experimento aleatório definido so-
bre o espaço amostral. Cada resultado corresponde a apenas um valor numérico de variável aleatória,
mas um valor numérico pode corresponder a um ou mais resultados de um experimento. Dependendo
dos dados obtidos, a variável aleatória pode ser discreta ou contínua.
A variável aleatória é discreta quando os valores numéricos se referem, normalmente, a uma contagem,
razão pela qual seus valores são expressos em números inteiros não negativos.
A variável aleatória contínua é aquela em que os valores são expressos em números reais positivos.
síntese
Estatística Aplicada à Gestão – Capítulo 3
167
Estatística Aplicada à Gestão – Capítulo 3
Anotações
TOLLEDO, Geraldo; OVALLE, Ivo. Estatística básica. 2. ed. São Paulo: Atlas, 1999.
TRIOLA, Mario. Introdução à estatística. 7. ed. Rio de Janeiro: LTC, 1999.
168
distribuições de probalidade
Conteúdo programático
Principais distribuições de probabilidade
Distribuição discreta binomial X ~ b (n, p)
Parâmetros das variáveis aleatórias
Distribuição Poisson X ~ P ( λ)
Parâmetros das variáveis aleatórias
Aproximação da distribuição binomial pela distribuição Poisson
Distribuição normal X ~ N ( µ, σ2)
Objetivos
Conhecer alguns modelos teóricos de probabilidade mais utilizados na
prática.
Entender a distribuição de probabilidade de forma mais compacta, ou
seja, conhecer a lei para atribuir as probabilidades.
170
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
principais distribuiçõEs dE probabilidadE
As distribuições binomial e de Poisson são modelos matemáticos aplicados a uma distribuição real de
frequência.
distribuição discreta binomial x ~ b (n, p)
É a distribuição discreta de probabilidade associada a experimentos que apresentam as seguintes
propriedades:
Há a sequência de n provas ou tentativas.
As n tentativas são idênticas e independentes.
As provas só têm dois resultados possíveis: sucesso (p) e fracasso (q).
As chances de sucesso e de fracasso não mudam de uma tentativa para outra.
A função de probabilidade f(x) = P(X = x) é dada por:
P(X = x) =
n
x
. px . qn – x, em que n!
x! (n – x)!
n
x
= ,
n = número total de tentativas na realização do experimento
x = número de vezes que ocorreu o evento
p = probabilidade de sucesso
q = probabilidade de fracasso
Esta fórmula exige conhecimentos de fatorial e combinação.
Parâmetros das variáveis aleatórias
A média e o desvio padrão são os parâmetros fundamentais de uma curva normal.
E(x) = n . p e Var(x) = n . p . q
Em uma população suficientemente grande, 16% dos indivíduos são surdos. Em uma amostra 1.
aleatória de 10 indivíduos, encontre a probabilidade de que:
exatamente 2 sejam surdos.a)
P(X = 2) =
10
2
. 0,162 . 0,848 = 0,2855
2 ou mais sejam surdos.b)
P(X ≥ 2) = 1 – (P(X = 0) + P(X = 1)
P(X ≥ 2) = 1 –
10
0
. 0,160 . 0,8410 +
10
1
. 0,161 . 0,849
P(X ≥ 2) = 1 – 0,5080
P(X ≥ 2) = 0,4919
Estatística Aplicada à Gestão – Capítulo 3
171
Estatística Aplicada à Gestão – Capítulo 3
menos que 2 sejam surdos.c)
P(X < 2) =
10
0
. 0,160 . 0,8410 +
10
1
. 0,161 . 0,849 = 0,5080
A proporção de obesos em uma determinada excursão é de 8,5%. Um grupo de nove adultos foi 2.
selecionado. Calcule a probabilidade de:
apenas um ser obeso.a)
P(X = 1) =
9
1
. 0,0851 . 0,9158 = 9!
1! 8!
. 0,085 . 0,491324875 = 0,3758
pelo menos dois serem obesos. b)
P(X ≥ 2) = 1 – (P(X = 0) + P(X = 1))
P(X ≥ 2) = 1 –
9
0
. 0,0850 . 0,9159 + 0,3758 = 1 – (1 . 1 . 0,44956226) + 0,3758) =
1 – 0,82536 = 0,1746
A probabilidade de um funcionário de uma empresa hoteleira ser promovido a gerente após terminar 3.
o curso superior é de 7,5%. Em um grupo de seis novos funcionários, calcule a probabilidade de:
nenhum ser promovido.a)
P(X = 0) =
6
0
. 0,0750 . 0,9256 = 1 . 1 . 0,6264 = 0,6264
pelo menos um ser promovido.b)
P(X ≥ 1) = 1 – P(X = 0) = 1 – 0,6264 = 0,3736
todos serem promovidos. c)
P(X = 6) =
6
6
. 0,0756 . 0,9250 = 1 . 0,0000001779 . 1 = 0,0000001779
A probabilidade de encontrar embalagens fora do padrão de um determinado produto é igual a 30%. 4.
Em uma amostra composta por cinco produtos, calcule a probabilidade de:
apenas dois estarem fora do padrão.a)
P(X = 2) = . 0,32 . 0,73 = . 0,09 . 0,343 = 10 . 0,09 . 0343 = 0,30875!
2! 3!
5
2
pelo menos um estar fora do padrão.b)
P(X ≥ 1) = 1 – P(X = 0) = 1 – . 0,30 . 0,75
5
0
= 1 – 0,168 = 0,83193
todos estarem fora do padrão. c)
P(X = 5) =
5
5
. 0,35 . 0,70 = 1 . 0,00243 . 1 = 0,00243
172
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
distribuição Poisson x ~ P (λ)
Esta distribuição discreta de probabilidade assume seus valores em um intervalo contínuo e é utilizada
com frequência para modelagem probabilística de dados obtidos através de contagens, com as seguintes
propriedades:
f(X) = P(X = x) =
e–λ . λx
x!x = número de sucessos num intervalo
λ = número médio de sucessos num intervalo contínuo
e = constante 2,71828
Parâmetros das variáveis aleatórias
E(x) = λ e Var(x) = λ
No estudo das distribuições de Poisson e normal, a representação da
média será a letra λ (lambda) e não o x como estava sendo utilizado
até então.
Uma telefonista recebe em média 4,6 chamadas por minuto. Determine a probabilidade de que ela
receba 2 chamadas no intervalo de 1 minuto.f(X) = P(X = x) =
e–λ . λx
x!
P(X = 2) =
e–4 . 6 . 4,62
2!
= 0,106
Aproximação da distribuição binomial pela distribuição Poisson
A distribuição de Poisson é empregada também como aproximação pela binomial para facilitar o cálculo
de probabilidades quando o uso da binomial é muito complexo. Ou seja, é utilizada quando n é grande, p é
pequeno, sendo uma forma alternativa para o cálculo das probabilidades.
λ = n . p
Um entrevistador de censo deverá visitar, em determinada semana, 150 domicílios. Sabendo que 1.
a probabilidade de não ser atendido por qualquer domicílio visitado é de 10%, calcule a probabili-
dade de o entrevistador não ser atendido por:
13 domicíliosa)
Resolução pela distribuição binomial
P(x = 13) =
150
13
. 0,1013 . 0.90137 = 0,0986
Resolução pela distribuição de Poisson
λ = n . p = 150 . 0,10 = 15
P(x = 13) = e
–15 . 1513
13!
= 0,0956
Estatística Aplicada à Gestão – Capítulo 3
173
Estatística Aplicada à Gestão – Capítulo 3
18 domicíliosb)
Resolução pela distribuição binomial
P(X = 18) =
150
18
. 0,1018 . 0.90132 = 0,073
Resolução pela distribuição de Poisson
λ = n . p =150 . 0,10 = 15
P(X = 18) = e
–15 . 1518
18!
= 0,071
A probabilidade de uma pessoa adquirir o vírus H1N1 em certa localidade é de 0,001. Determine a 2.
probabilidade de que, nessa localidade de 1 000 pessoas, exatamente duas adquiram o vírus.
Neste exemplo, devido ao fato de n ser um valor alto e p pequeno, necessitamos utilizar a seguinte
expressão:
λ = n . p = 1000 . 0,001 = 1
Logo:
P(X = 2) = e
–1 . 12
2!
= 0,36788 . 1
2
= 0,18394 ou 18,394%
Uma financeira atende em média 5 clientes por hora. Calcule a probabilidade de que, em uma hora, 3.
selecionada por acaso, sejam atendidos 3 clientes.
P(X = 3) = e
–5 . 53
3!
= 0,00674 . 1
2
= 0,18394 ou 18,394%
P(X = 3) = e
–5 . 53
3!
= 0,00674 . 125
6
= 0,1404 ou 14,04%
distribuição normal x ~ N (µ, σ2)
É uma distribuição de probabilidade contínua que é simétrica, ou seja, as medidas de tendência central,
como a mediana e a moda, são iguais à média. A curva dessa distribuição é mesocúrtica e apresenta a
forma de um sino (também conhecida como a curva de Gauss). Veja:
Figura 37 – Distribuição normal.
x
f(X)
174
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
A equação da distribuição normal está representada a seguir:
f(x) =
(2πσ2)
1 exp
2σ2
(x – µ)2
x = variável aleatória normal
σ = o desvio padrão (raiz quadrada da σ2)
µ = média da população
exp = e
Não é necessário que utilizemos esta equação, pois a probabilidade é igual à área sob a curva delimi-
tada pelos limites inferior e superior, e existem valores padronizados apresentados em tabelas que repre-
sentam as probabilidades de ocorrência sob a curva.
Para a padronização dos cálculos das tabelas, é necessário o valor da variável aleatória x convertido
em valores normais padronizados por z pela fórmula:
z =
x – µ
σ
x = variável aleatória normal
σ = desvio padrão (raiz quadrada da σ2)
µ = média da população
Para a distribuição normal, a proporção de valores caindo dentro de um, dois ou três desvios padrão
da média são:
árEA PrOPOrçãO
µ ± 1σ
µ ± 2σ
µ ± 3σ
68,3%
95,5%
99,7%
Na prática, desejamos calcular probabilidades para diferentes valores de µ e σ2. Para isso, a variável x,
cuja distribuição é N(µ, σ2), é transformada numa forma padronizada z com distribuição N(0,1), denominada
de distribuição normal padrão a ser tabelada.
A quantidade z é dada por:
z =
x – µ
σ2
x = valor qualquer da variável aleatória
µ = média da distribuição
σ = desvio padrão da distribuição
Parâmetros das variáveis aleatórias: E(x) = µ e Var (x) = σ2.
A fábrica de ração para cães Tip Top está ajustando o peso no empacotamento de um determinado 1.
tipo de ração, sendo que, em média, λ = 15,00 kg em cada embalagem. Sabe-se que nem todas
as embalagens contêm exatamente os 15,00 kg, devido à variabilidade no processo, com desvio
padrão de S = 0,15 kg numa distribuição normal. Escolhendo uma embalagem ao acaso, qual a
probabilidade de que ela contenha entre 15,00 e 15,30 kg do tipo de ração em estudo?
Aplicando a fórmula do z, para x = 15,00, temos:
Estatística Aplicada à Gestão – Capítulo 3
175
Estatística Aplicada à Gestão – Capítulo 3
z =
x – λ
S
15,00 – 15,00
0,15
= = 0
Se o valor de x for igual 15,20 kg, temos:
z =
x – λ
S
15,30 – 15,00
0,15
= = 2,0=
0,30
0,15
O valor de z consta na tabela de distribuição normal. A busca desse valor é feita através do valor
calculado de z, na intersecção entre a linha 2,0 e a coluna 0,00. O valor, portanto, é 0,4772.
Então: P(0 ≤ z ≤ + 2,0) = 0,4772.
Portanto: P(15,00≤ z ≤ 15,30) = 0,4772 ou 47,72%.
Uma lâmpada fluorescente tem uma vida útil determinada pelo fabricante numa distribuição normal 2.
em média λ = 5.000 horas com desvio padrão S = 350 horas. Determine a probabilidade de que
uma lâmpada selecionada por acaso dure de 5 000 a 5 500 horas.
Perceba que se trata de uma área na curva normal com valores de x entre 5 000 a 5 500 horas.
A fronteira inferior do intervalo está na média da distribuição, portanto, está no valor z = 0. A fron-
teira superior do intervalo, em termos de valor de z, é:
z =
x – λ
S
5 500 – 5 000
350
= = 1,43=
500
350
Deve-se procurar o valor de z na tabela de distribuição normal. A busca será feita pelo valor calcu-
lado de z, na interseção entre a linha 1,4 e a coluna 0,03. O valor é 0,4236.
Então: P(0 ≤ z ≤ +1,43) = 0,4236 ou 42,36%.
Portanto: P(5 000 ≤ z ≤ 5 500) = 0,4236 ou 42,36%
A VEZ dOs EsTATÍsTiCOs
Para a paulista Marcella Macedo, 29 anos, da Vivo, trabalhar com estatística é uma grande paixão:
“Esprememos os números até que eles confessem os dados”
Você já imaginou quantas análises estatísticas são feitas antes do lançamento de um novo medica-
mento? É preciso testar exaustivamente a ação do remédio, reunir os resultados dos testes, organizar
as informações e só depois concluir se a droga pode ser comercializada. A análise de dados está pre-
sente até em uma simples ligação telefônica que a administradora de cartão de crédito faz para você. A
companhia cruza informações como sexo, renda mensal e hábitos de consumo para oferecer um pro-
duto na medida certa. E quem faz todo esse trabalho? O estatístico. Um profissional que as empresas
vêm descobrindo que pode transformar pilhas de números e gráficos em informações que servirão para
reduzir custos e aumentar os lucros. O problema é que falta gente qualificada no mercado.
Uma explicação para isso é o reduzido número de alunos nos cursos de estatística e a falta de
informações sobre o campo de atuação desse profissional. Para cada estatístico que se registra no
Conselho Federal de Estatística, há pelo menos mil engenheiros pedindo registro no Conselho Federal
de Engenharia, Arquitetura e Agronomia. Aliás, até aqui engenheiros vinham cumprindo as funções que
agora algumas organizações entregam na mão do pessoal de estatística.
Leitura complementar
176
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
É assim na Vivo, operadora de telefonia celular. Ali, a divisão de garantia de receita é gerenciada
pela estatística Marcella Macedo, de 29 anos, de São Paulo. “Escolhi estatística porque gostava de
contas e acabei conhecendo o curso por acaso”, diz. “O bom da profissão é que dá para trabalhar em
qualquer setor, basta ter raciocínio lógico, saber lidar com informações e ter curiosidade de entender
como e por que as coisas acontecem.” Marcella é responsável por analisar dados que possam ajudar a
reverter as perdas financeiras da Vivo. Ela tem conseguido bater suas metas e manter-se em ascensão
profissional, tanto que convenceua irmã e o primo a seguirem a mesma carreira.
Os ventos sopram a favor também para quem quer trocar de carreira para se especializar na área.
A procura por esses profissionais tem crescido junto com o avanço tecnológico, que permite que mais
dados sejam armazenados e avaliados rapidamente, agilizando as decisões da empresa. “Nenhuma
companhia decide nada de importante sem avaliar bastante os riscos e as oportunidades. Quem faz
isso com muita precisão são os estatísticos”, diz José Ferreira de Carvalho, consultor e professor da
Unicamp. Os empregos estão em todos os setores, principalmente nas instituições financeiras, e os
salários médios são de 4 000 reais. “Tivemos de esperar 12 meses para conseguir preencher uma
posição”, diz a estatística Érika Rollim, de 31 anos, diretora de marketing e serviços ao cliente do SAS
Brasil, empresa de software e consultoria estatística, de São Paulo.
Para suprir a ausência desses profissionais, Carlos Rodrigo Formigare, de 34 anos, estatístico
do Unibanco, que dirige a área de cartão de créditos da empresa, o Unicard, ajudou a montar um
curso de modelagem estatística – técnica usada pelo departamento para traçar o perfil dos clientes e
customizar serviços. O curso tem seis módulos, que duram nove meses, e já especializou mais de 300
profissionais, entre engenheiros, administradores e economistas, nos últimos oito anos. “O estatístico
sai da faculdade sem visão básica de gestão e outros conhecimentos para assumir cargos de lideran-
ça. Nesse ponto, os outros profissionais saem na frente”, diz Carlos. Ele aposta que, se essa lacuna
for diminuída, haverá estatísticos em cargos de gerência nos próximos cinco anos. Palavra de quem
entende de probabilidade.
de olho nos números
Não é só o IBGE e os institutos de pesquisa que empregam estatísticos. Esses profissionais têm
sido contratados por empresas para trabalhar em diferentes departamentos como:
Recursos humanos – A responsabilidade do estatístico é calcular e projetar, por exemplo, os
gastos futuros com planos de saúde e previdência privada.
Departamento financeiro – Sua expertise ajuda a analisar os números da companhia e os pro-
cessos de produção para tentar reverter prejuízos ou melhorar os resultados.
Departamentos de produção – O desafio é aperfeiçoar os processos produtivos, medindo,entre
outras variáveis,a produtividade de uma máquina por hora, além de avaliar a qualidade dos produtos,
checando informações sobre itens fabricados com defeitos.
AVEDIANI, Renata. A vez dos estatísticos.
Disponível em: <http://www.gestao-comercial.net/gestaocomercial/
ARTIGO-GESTAO-COMERCIAL-36-A+VEZ+DOS+ESTATISTICOS.htm>. Acesso em: 7 set. 2009.
Você estudou:
A distribuição de Poisson pode ser usada para determinar a probabilidade de sucesso de um dado
numérico quando os eventos ocorrem em um contínuo tempo e espaço. Esse processo também é cha-
síntese
Estatística Aplicada à Gestão – Capítulo 3
177
Estatística Aplicada à Gestão – Capítulo 3
mado processo Poisson e é similar ao processo de Bernoulli, exceto que os eventos ocorrem em um
continuum no lugar de ocorrerem em tentativas ou observações fixadas.
A distribuição normal é uma distribuição de probabilidade contínua simétrica e mesocúrtica. A curva
que representa a distribuição normal de probabilidade é frequentemente descrita como tendo uma for-
ma de sino e é também conhecida como curva de Gauss.
FREUND, John E. Estatística aplicada. 9. ed. Porto Alegre: Bookman, 2000.
McCLAVE, James Estatística para administração e economia. São Paulo: Pearson Prentice Hall, 2009.
MORETTIN, Luiz Gonzaga. Estatística básica: probabilidade. 6. ed. São Paulo: McGraw Hill, 1979.
TOLLEDO, Geraldo; OVALLE, Ivo. Estatística básica. 2. ed. São Paulo: Atlas, 1999.
TRIOLA, Mario. Introdução à estatística. 7. ed. Rio de Janeiro: LTC, 1999.
STEVENSON, William J. Estatística aplicada à administração. São Paulo: Habra, 1981.
referências
Atividades do capítulo
Num determinado lote de HD’s para computadores, existem alguns com defeitos. Se forem escolhidos 1.
ao acaso cinco HD’s, a probabilidade de um ser defeituoso é 1/16. Qual a probabilidade de serem
retirados cinco perfeitos?
Na indústria de brinquedos Verde Brasil, há um problema a ser resolvido em uma das máquinas injeto-2.
ras. A solução está nas mãos de dois funcionários que fazem a manutenção, Jonas e Felipe. A proba-
bilidade do Jonas resolver é 1/5 e de Felipe é 1/4. Se o problema for resolvido independentemente, ou
seja, por Jonas ou Felipe, qual a probabilidade de que o mesmo seja resolvido?
1
20
a)
1
7
b)
2
5
c)
2
7
d)
9
20
e)
Os registros de garantia de um fabricante de lavadora de louça automática indicam que, das 813 lava-3.
doras vendidas, 504 registraram solicitação de garantia para algum tipo de reparo dentro do prazo de
um ano. Qual é a probabilidade de que uma dessas lavadoras não tenha solicitação de reparos dentro
da garantia?
Numa pesquisa feita com 75 alunos da turma de Matemática da Faculdade Açores, tivemos as seguin-4.
tes respostas: 16 alunos gostam de música, esporte e leitura; 6, somente de música; 9, somente de
esportes; 24, de música e esportes; 5, somente de leitura; e 22, de esportes e leitura. Ao escolhermos
um aluno aleatoriamente dessa turma, qual a probabilidade de ele:
178
Estatística Aplicada à Gestão – Capítulo 3Estatística Aplicada à Gestão – Capítulo 3
gostar de música?a)
não gostar de nenhuma dessas atividades?b)
Dica: elabore o diagrama de Venn-Euler, considerando M = música, E = esportes e L = leitura.
Retira-se ao acaso uma carta de um baralho com 52 cartas. Determine a probabilidade de a carta ser: 5.
um ás; a)
o valete de copas; b)
três de paus ou seis de ouros; c)
uma carta de copas; d)
de qualquer naipe exceto copas; e)
um dez ou uma carta de espadas; f)
nem quatro nem carta de paus.g)
Em um lote de 12 peças de automóveis, 4 estão com defeito. São retiradas da embalagem duas peças, 6.
uma após a outra, aleatoriamente. Calcule a probabilidade de:
ambas serem defeituosas.a)
ambas serem boas.b)
ao menos uma ser defeituosa.c)
A roleta contém 5 setores iguais com as cores amarelo, preto, branco, vermelho e azul: E = {a, p, b, v, az}. 7.
Após girá-la, quais são as possibilidades de parar na zona azul?
Em uma determinada caixa existem 13 canetas escrita fina, sendo 7 de escrita azul e 6 de escrita ver-8.
melha. Ao retirar-se aleatoriamente uma caneta da caixa, registra-se a cor da caneta e ela não é repos-
ta na caixa. A seguir, retira-se outra caneta e registra-se novamente a cor. Calcule a probabilidade de:
sair uma caneta de cor azul e depois uma vermelha.a)
saírem duas canetas de cores diferentes.b)
Dada a população e a variável de interesse, classifique as variáveis em: quantitativa discreta ou con-9.
tínua.
População: estudantes da escola Aa)
Variável: número de alunos da turma C
População: automóveis produzidos por uma fábricab)
Variável: volume que comporta o bagageiro (em litros)
Estatística Aplicada à Gestão – Capítulo 3
179
Estatística Aplicada à Gestão – Capítulo 3
População: peças produzidas por uma máquinac)
Variável: número de peças produzidas em um dia
População: peças produzidas por uma máquinad)
Variável: diâmetro das peças
População: bolsa de valores de São Pauloe)
Variável: número de ações negociadas
População: alunos de pós-graduação da UniJorgef)
Variável: número de horas de estudo diário
Determine a E(x) e a var(x) para as seguintes distribuições de probabilidades:10.
a)
x 2 3 6
P(x)
1
3
1
2
1
6
b)
x –5 –4 1 2
P(x)
1
4
1
8
1
2
1
8
f(x) = kx, se 0 c) ≤ x ≤ 10, e 0 cc (caso contrário).
Uma fábrica de calçados masculinos tem três máquinas para produção e, verifica-se que, em média, 11.
5% dos sapatos produzidos poruma das máquinas não satisfazem a certas especificações de quali-
dade. Se forem escolhidos, aleatoriamente, 10 pares da produção diária dessa máquina, determine a
probabilidade de nenhum par ser defeituoso, através da fórmula de probabilidades binomiais.
A concentração de cádmio em cinzas de certo lixo radioativo tem distribuição N(1; 0,72). Quais são 12.
as chances de que uma amostra aleatória das cinzas tenha uma concentração de cádmio entre 0,5 e
1,75ppm?
Para a distribuição 13. µ = 100 e σ = 25, calcule:
P(100 < x < 106)a)
P(89 < x < 107)b)
P(112 < x < 116)c)
P(x < 108)d)
Os atletas da seleção brasileira de futebol têm, em média, 175 cm, numa distribuição normal com um 14.
desvio padrão de 5 cm. Calcule a probabilidade de um atleta da seleção, escolhido aleatoriamente, ter
altura superior a 178 cm.
19,15%a)
37,43%b)
30,85%c)
15,87%d)
180
Estatística Aplicada à Gestão – Capítulo 3
Os representantes da distribuidora de remédios Milagrosa têm, em média, os salários de R$ 1.900,00 15.
numa distribuição normal, e um desvio padrão de R$ 250,00. Calcule a probabilidade de um desses
representantes dessa empresa, escolhido ao acaso, perceber um sálario menor que R$ 2.200,00.
6,68% a)
93,32% b)
88,49% c)
56,68% d)
ANEXO I
Distribuição normal
Probabilidades da distribuição normal padrão com valores de Zt dados nas margens da tabela
0 1 2 3 4 5 6 7 8 9
0,0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.03586
0,1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535
0,2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
0,3 0.11791 0.12172 0.12552 0.12930 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173
0,4 0.15542 0.15910 0.16276 0.16640 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793
0,5 0.19146 0.19497 0.19847 0.20194 0.20540 0.20884 0.21226 0.21566 0.21904 0.22240
0,6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.25490
0,7 0.25804 0.26115 0.26424 0.26730 0.27035 0.27337 0.27637 0.27935 0.28230 0.28524
0,8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.31327
0,9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891
1,0 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214
1,1 0.36433 0.36650 0.36864 0.37076 0.37286 0.37493 0.37698 0.37900 0.38100 0.38298
1,2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.40147
1,3 0.40320 0.40490 0.40658 0.40824 0.40988 0.41149 0.41309 0.41466 0.41621 0.41774
1,4 0.41924 0.42073 0.42220 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189
1,5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408
1,6 0.44520 0.44630 0.44738 0.44845 0.44950 0.45053 0.45154 0.45254 0.45352 0.45449
1,7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46080 0.46164 0.46246 0.46327
1,8 0.46407 0.46485 0.46562 0.46638 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062
1,9 0.47128 0.47193 0.47257 0.47320 0.47381 0.47441 0.47500 0.47558 0.47615 0.47670
2,0 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.48030 0.48077 0.48124 0.48169
2,1 0.48214 0.48257 0.48300 0.48341 0.48382 0.48422 0.48461 0.48500 0.48537 0.48574
2,2 0.48610 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.48840 0.48870 0.48899
2,3 0.48928 0.48956 0.48983 0.49010 0.49036 0.49061 0.49086 0.49111 0.49134 0.49158
2,4 0.49180 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361
2,5 0.49379 0.49396 0.49413 0.49430 0.49446 0.49461 0.49477 0.49492 0.49506 0.49520
2,6 0.49534 0.49547 0.49560 0.49573 0.49585 0.49598 0.49609 0.49621 0.49632 0.49643
2,7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.49720 0.49728 0.49736
2,8 0.49744 0.49752 0.49760 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807
2,9 0.49813 0.49819 0.49825 0.49831 0.49836 0.49841 0.49846 0.49851 0.49856 0.49861
3,0 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49896 0.49900
3,1 0.49903 0.49906 0.49910 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929
3,2 0.49931 0.49934 0.49936 0.49938 0.49940 0.49942 0.49944 0.49946 0.49948 0.49950
3,3 0.49952 0.49953 0.49955 0.49957 0.49958 0.49960 0.49961 0.49962 0.49964 0.49965
3,4 0.49966 0.49968 0.49969 0.49970 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976
3,5 0.49977 0.49978 0.49978 0.49979 0.49980 0.49981 0.49981 0.49982 0.49983 0.49983
3,6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3,7 0.49989 0.49990 0.49990 0.49990 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992
3,8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3,9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997
Fonte: http://www.itl.nist.gov/div898/handbook/eda/section3/eda3671.htm.
Capítulo 4
Correlação e regressão linear
Correlação
Regressão linear e correlação
Análise de variância do modelo de regressão
linear
Intervalos de variação e predição
Correlação
Conteúdo programático
Correlação linear simples
Diagrama de dispersão
Cálculo prático do coeficiente de correlação linear
Objetivos
Perceber a relação entre duas variáveis.
Calcular o coeficiente de correlação.
Interpretar o resultado expresso pelo coeficiente de correlação.
Analisar o gráfico de dispersão correspondente, fazendo as devidas
associações.
184
corrElação linEar simplEs
O estudo da correlação tem por objetivo medir e avaliar o grau de relação entre duas variáveis alea-
tórias. Podemos medir, por exemplo, se a relação entre o tempo de experiência de um funcionário da área
de vendas e o volume de vendas realizado por ele é forte, fraca ou nula. É necessário entender, portanto,
que a correlação tem aplicação em diversas áreas do conhecimento, sempre que se deseja estabelecer
relações entre duas variáveis.
A correlação linear simples envolve apenas duas variáveis (x e y), sendo que a amostra é formada por
um conjunto de pares de valores (x, y) e sua disposição ocorre em torno de uma reta. O resultado da análise
de correlação linear é expresso na forma de um coeficiente de correlação (r).
O coeficiente de correlação situa-se entre –1 e +1, ou seja, –1 r £ £ +1.
Quando x e y variam no mesmo sentido, dizemos que a correlação é positiva, assim o coeficiente
tem sinal positivo.
Quando x e y variam em sentidos contrários, dizemos que a correlação é negativa, assim o coefi-
ciente de correlação tem sinal negativo.
Se r = +1, existe uma correlação perfeita positiva entre as variáveis.
Se r = –1, existe uma correlação perfeita negativa entre as variáveis.
Se r = 0, não há relação entre as variáveis.
O instrumento mais utilizado para medir a correlação linear é o coeficiente de correlação linear de
Pearson:
r
x y
xy
2
2
2
2
=
xy
x . y
n
x
n
y
n
–
– –
å( ) å( )
å
å( )
å
é
ë
ê
ê
ê
ù
û
ú
ú
ú
å( )
å
éé
ë
ê
ê
ê
ù
û
ú
ú
ú
n – número de observações
diagrama de dispersão
O comportamento de duas variáveis é visualizado pela representação gráfica. A construção do dia-
grama de dispersão possibilita, pela simples observação, uma ideia bastante completa sobre como as
variáveis se relacionam, ou seja, qual é a tendência de variação conjunta que apresentam. Observe os
gráficos a seguir:
0 < r < 1 r = 1
Figura 38 – Correlação positiva. Figura 39 – Correlação perfeita positiva.
185
Estatística Aplicada à Gestão – Capítulo 4
r = – 1
Figura 41 – Correlação perfeita
negativa.
– 1 < r < 0
Figura 40 – Correlação
negativa.
r = 0
Figura 42 – Correlação nula.
Cálculo prático do coeficiente de correlação linear
Para o cálculo do coeficiente de correlação, é conveniente a construção de uma tabela, em que, a partir
de x ey, são determinadas as somas necessárias.
y x x2 y2 xy
–
–
–
–
–
–
–
–
∑ y ∑ x ∑ x2 ∑ y2 ∑ xy
Seguem dois exemplos para melhor entendimento da correlação.
Vamos calcular o coeficiente de correlação linear entre as variáveis 1. x e y, usando os dados abaixo:
y 8 10 5 9 11
x 3 4 5 6 9
n = 5
y x x2 y2 xy
8
10
5
9
11
3
4
5
6
9
9
16
25
36
81
64
100
25
81
121
24
40
25
54
99
43 27 167 391 242
r =
xy
x . y
n
x
n
y
n
xy
2
2
2
2
–
– –
å( ) å( )
å
å( )
å
é
ë
ê
ê
ê
ù
û
ú
ú
ú
å( )
åx y
éé
ë
ê
ê
ê
ù
û
ú
ú
ú
é
ë
ê
ê
ù
û
ú
ú
é
ë
=
242 27 . 43
5
167 27
5
391 43
5
2 2
–
– –êêê
ù
û
úú
= 9,8
21,2 . 21,2
= 0,462
O resultado mostra que a correlação linear entre as variáveis x e y é positiva (quando x cresce line-
armente, y também cresce linearmente), porém, a correlação entre elas, nesse caso, é baixa, ou seja, as
variáveis praticamente não se relacionam.
Fonte: Os autores.
186
Podemos perceber a fraca correlação positiva entre elas pelo diagrama de dispersão abaixo:
Figura 43 – Gráfico de dispersão.
10
9
8
7
6
5
4
3
2
1
0 2 4 6 8 10 12
2. Os dados abaixo referem-se a uma pesquisa com 10 famílias de determinada cidade. Foram analisa-
dos, entre outros, os seguintes aspectos: renda familiar (em salários mínimos) e número de filhos.
fAMÍLiAs rENdA NúMErO dE fiLHOs
A
B
C
D
E
F
G
H
I
J
10
6
4
12
16
7
6
8
10
5
2
3
4
2
1
3
3
2
1
4
Vamos calcular o coeficiente de correlação linear para as variáveis apresentadas a seguir:
rENdA (y) N.O dE fiLHOs (x) x2 y2 xy
10
6
4
12
16
7
6
8
10
5
2
3
4
2
1
3
3
2
1
4
4
9
16
4
1
9
9
4
1
16
100
36
16
144
256
49
36
64
100
25
20
18
16
24
16
21
16
16
10
20
84 25 73 826 177
n = 10
Fonte: Os autores.
Fonte: Os autores.
187
Estatística Aplicada à Gestão – Capítulo 4
r =
xy
. y
n
n
n
xy
2
2
2
2
–
– –
x
x
x
y
y
å( ) å( )
å
å( )
å
é
ë
ê
ê
ê
ù
û
ú
ú
ú
å( )
å
é
ë
êê
ê
ê
ù
û
ú
ú
ú
é
ë
ê
ê
ù
û
ú
ú
é
ë
=
177 25 . 84
73 25 826
2 2
–
– –
10
10
84
10
êêê
ù
û
úú
=
10,5 . 120,4
= 93–33 – 0,
O resultado rxy = –0,93 aponta uma correlação forte e inversa (negativa), ou seja, as famílias com maio-
res rendas têm menor número de filhos, o que se pode perceber pelo gráfico:
A rENTAbiLidAdE NA ATiVidAdE rUrAL
Pesquisando alguns dados no Agrianual* 2006, mais especificamente na pesquisa de preços de
terras (em reais por hectare) realizada durante vários meses do ano, podem ser observadas algumas
informações interessantes.
Primeiramente, numa análise em longo prazo, com dados de 1989–2005 para o estado de São
Paulo, de 1998–2004 para os Estados Unidos, e mais especificamente para o Mato Grosso do Sul, de
2002–2005, podemos enxergar algumas relações e correlações interessantes. A correlação** entre
os preços de terra de lavoura em São Paulo e na região do Corn Belt americano é de 94,98%, o que
demonstra que o comportamento de preço de ambas as regiões sofre influências parecidas. Ou seja,
por se tratarem de commodities, a relação pode ser explicada pela variação do preço de venda das
commodities.
Mas o que o preço das commodities tem a ver com o preço da terra? Em 1960, William Sharpe
desenvolveu um modelo de precificação de ativos chamado CAPM***, que é um modelo de precifica-
ção de ativos (no caso deste texto, o preço da terra) que leva em consideração a geração de fluxo de
caixa (quantos reais aquele ativo gera anualmente) e o nível de risco da operação (risco este sendo a
variação do fluxo de caixa, numa análise ano a ano).
Leitura complementar
4,5
4
3,5
3
2,5
2
1,5
1
0,5
0
0 2 4 6 8 10 12 14 16 18
Renda familiar
N
úm
er
o
d
e
fil
ho
s
Figura 44 – Gráfico de dispersão: renda familiar e número de filhos.
188
Na análise da correlação dos preços de terra agrícola de alta produtividade no Mato Grosso do Sul
com o preço médio da soja, de 2002 a 2005, verifica-se um índice de 87,91%, que indica que a variação
do preço da terra tem alta relação com a geração de capital em uma propriedade rural. Este índice con-
firma a utilidade da aplicação do CAPM e a afirmação de que um ativo só tem valor se gerar renda.
[...]
* O Agrianual é o anuário agrícola da FNP. Mais informações em http://www.fnp.com.br.
** A correlação é uma medida estatística que indica a força e a relação entre duas variáveis. 100%
indica uma correlação perfeita e –100% indica uma correlação inversa.
*** CAPM: Capital Asset Pricing Model, ou Modelo de Precificação de Ativos. É um modelo de
finanças corporativas utilizado para valorar um ativo, de acordo com a capacidade deste de gerar fluxo
de caixa positivo, associando este retorno a um nível de risco.
CORRÊA, Kenneth. A rentabilidade na atividade rural. Disponível em: <http://www.administracaoegestao.com.br/
administracao-rural/a-rentabilidade-na-atividade-rural/>. Acesso em: 15 set. 2009.
Você estudou:
A correlação ocorre entre duas variáveis quando uma delas está, de alguma forma, relacionada com a
outra.
O coeficiente de correlação linear (r) é determinado para medir o grau de relacionamento linear entre os
valores emparelhados x e y em uma amostra.
O coeficiente de correlação se situa entre –1 e +1, ou seja, –1 r £ £ +1. Se r = +1, existe uma corre-
lação perfeita positiva entre as variáveis; se r = –1, existe uma correlação perfeita negativa entre as
variáveis; se r = 0, não há relação entre as variáveis.
síntese
CORRÊA, Kenneth. A rentabilidade na atividade rural. Disponível em: <http://www.administracaoegestao.com.br/
administracao-rural/a-rentabilidade-na-atividade-rural/>. Acesso em: 15 set. 2009.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
TRIOLA, Mario F. Introdução à estatística. 7. ed. Rio de Janeiro: LTC, 1999.
referências
Anotações
regressão linear e correlação
Conteúdo programático
Regressão linear e correlação
Regressão linear simples
Interpretação dos parâmetros do modelo
Coeficiente de determinação
Pontos extremos ( outliers) e pontos de influência
Variação marginal
Objetivos
Entender a regressão linear, no sentido de estimar um modelo
matemático para entender as relações entre duas variáveis.
Representar graficamente o modelo de regressão linear.
Calcular os coeficientes de regressão e o coeficiente de determinação.
190
rEgrEssão linEar E corrElação
A regressão, assim como a correlação, é uma técnica utilizada para entender as relações entre as
variáveis do estudo de uma população.
As técnicas como medidas de tendência central e de dispersão (média, desvio padrão, variância, etc.)
servem para estudar um único parâmetro populacional. Já o objetivo da análise de regressão é construir um
modelo matemático que avalie a relação entre duas ou mais variáveis, considerando observações dessa(s)
variável(is).
Quando temos “variáveis quantitativas” e desejamos avaliar o efeito que algumas exercem (ou parecem
exercer) sobre outras, podemos classificar as variáveis em dois tipos: variáveis independentes (ou predito-
ras) e variáveis dependentes (ou respostas).
No entanto, a distinção entre variáveis independentes e dependentes nem sempre é clara e algumas
vezes leva em consideração o que se espera da análise.
A variável (x), chamada variável independente ou variável explicativa, selecionada pelo experimentador,
induz a ocorrência de outra variável (y), chamada de variável dependente, resposta ou variávelexplicada.
O valor dessa última depende do valor escolhido da variável independente (x). Por exemplo, a demanda (y)
em função do preço (x); o número de filhos (y) em função da renda familiar (x); o consumo (y) em função da
potência (x); a produção (y) em função do uso de fertilizantes (x), etc.
O estudo da regressão considera apenas a variável y como aleatória e a variável x como supostamen-
te sem erro. Portanto, a relação entre x e y será expressa matematicamente como y = f(x) + e, em que a
variável e refere-se ao “erro estatístico” e indica a falha do modelo em se ajustar exatamente aos dados.
Quando há uma variável resposta (y) e uma variável explanatória (x), ocorre a regressão linear simples;
no entanto, quando se tem uma variável resposta e mais de uma variável explanatória, a regressão é dita
múltipla.
A regressão é utilizada normalmente com duas finalidades: de previsão (prever o valor de y a partir de
x) e estimar o quanto x influencia ou modifica y.
Em suma, dizemos que a correlação mede a força de relacionamento entre duas variáveis, enquanto a
regressão equaciona esse relacionamento.
rEgrEssão linEar simplEs
A regressão linear simples mostra o relacionamento entre duas variáveis por meio de uma equação
matemática linear, ou seja, uma linha reta.
Segundo Toledo (1995), dado um conjunto de valores observados de x e y, construir um modelo
de equação linear de y sobre x consiste em obter, desses valores, uma reta que melhor represente a
relação verdadeira entre essas variáveis. A determinação dos parâmetros dessa reta é denominada
ajustamento. O processo de ajustamento deve partir da escolha da função através da qual os valores de
x explicarão os de y. Para isso, utilizamos o diagrama de dispersão. Esse gráfico é construído anotando-
-se, em um sistema de coordenadas retangulares, os pontos correspondentes aos pares de observações
de x e y.
A função escolhida será aquela que for sugerida pelo conjunto de pontos dispostos no diagrama. No
gráfico seguinte, o conjunto de pontos sugere uma função linear (reta).
191
Estatística Aplicada à Gestão – Capítulo 4
Observe, passo a passo, a construção desse gráfico no Excel.
1.o) Digite os dados das variáveis x e y em colunas separadas.
2.o) Selecione as variáveis das colunas x e y.
3.o) Clique sobre o assistente de gráfico.
4.o) Selecione o gráfico do tipo “dispersão (xy)”.
5.o) Clique em “avançar”.
6.o) Na opção “título”, acrescente o título e os eixos dos valores x e y ; na opção “linhas de grade”,
retire-as ou acrescente-as. Você pode, ainda, usar o recurso da opção “legenda”.
7.o) Clique em “avançar”.
8.o) Clique em “concluir”.
9.o) Com o gráfico pronto, clique com o botão direito do mouse sobre um dos pontos e selecione a
opção “adicionar linha de tendência”, tipo “linear”; em “opções”, marque “exibir equação no gráfico”
e “exibir valor de R-quadrado no gráfico”.
Agora, voltemos ao gráfico já pronto. De acordo com Toledo (1995), a reta ajustada é representada por
yˆ = a + bx, em que a e b são os parâmetros do modelo: a é o ponto em que a reta ajustada corta o eixo da
variável y; b é a tangente do ângulo que a reta forma com uma paralela ao eixo da variável x.
A reta ajustada é a reta de mínimos quadrados, pois os valores de a e b são obtidos de tal forma que
é mínima a soma dos quadrados das diferenças entre os valores observados de y e os obtidos da reta
ajustada para os mesmos valores de x.
O método dos mínimos quadrados determina que a e b devem ser obtidos de modo que:
Os parâmetros são os coeficientes angular e linear da equação da reta,
em que a indica o ponto de interseção da reta com o eixo y e b indica o
ângulo de inclinação da reta com o eixo x.
a =
y
n
b x
n
a = y bxå å Þ– –b =
xy
n
n
2
2
–
–
x y
x
x
å( ) å( )
å
å( )
å
Figura 45 – Gráfico de dispersão (modelo ajustado).
a
y
x
Em que: x =
x
n
å e y = y
n
å
.
y = a + bx
192
Os dados, no entanto, não caem sobre a linha reta, ou seja, existe uma diferença entre o valor observa-
do e o valor da linha reta. A isso chamamos de “erro estatístico”, isto é, uma variável aleatória que quantifica
a falha do modelo em se ajustar exatamente aos dados. O erro será representado por e. Considerando isso,
um modelo matemático mais adequado é o chamado modelo de regressão linear:
y = a + bx + e
interpretação dos parâmetros do modelo
Os coeficientes a e b são interpretados do seguinte modo:
se a variação dos dados em x inclui x = 0, então a é a resposta esperada quando x = 0;
se a variação dos dados em x não inclui x = 0, então x não possui interpretação prática;
b é interpretado como a “mudança” na média da distribuição de y produzida por uma unidade de
mudança em x.
Os parâmetros a e b são normalmente chamados de “coeficientes de
regressão”.
O modelo proposto refere-se ao comportamento das médias da popu-
lação e não da amostra.
Em relação a uma amostra de 7 fazendas, considere a produção agrícola (em hectares) e o uso de
fertilizantes (em toneladas) como as variáveis que nos interessam investigar.
fErTiLiZANTE (x) PrOdUçãO (y)
100
200
300
400
500
600
700
40
45
50
65
70
70
80
x = 400 y = 60
x i
i=1
7
= 2 800å y i
i=1
7
= 420å
x i
2
i=1
7
= 1 400 000å y i2
i=1
7
= 26 500å
x . y = 187 000
i=1
7
å
r = 0,977
Fonte: MELLO, A.O.R.; SANTOS, T.T.C.
O texto seguinte traz um exemplo resolvido de um problema envolvendo a correlação:
193
Estatística Aplicada à Gestão – Capítulo 4
Há evidências de alta relação linear positiva entre o uso de fertilizantes e o resultado da produção
agrícola. Podemos, então, usar o modelo de regressão linear simples necessitando, agora, estimar os
parâmetros deste modelo, baseados na amostra observada.
b =
xy
n
n
=
187 000 2 800 . 420
7
1 2
2
–
–
–
x y
x
x
å( ) å( )
å
å( )
å 4400 000
2 800
7
= 19 000
280 000
= 0,06786
2
–
( )
a = b = 60 0,06786 . 400 = 32,856y x– –
Desse modo, é possível obter o seguinte modelo de regressão linear ajustado:
yˆ = a + bx = 32,856 + 0,06786x
Fertilizantes
Pr
o
du
çã
o
ag
ríc
ol
a
90
80
70
60
50
40
30
20
10
0
0 100 200 300 400 500 600 700 800
Fonte: MELLO, A.O.R.; SANTOS, T.T.C.
Fonte: MELLO, A.O.R.; SANTOS, T.T.C.
Fertilizantes
y = 0,0679x + 32,857
Pr
o
du
çã
o
ag
ríc
ol
a
90
80
70
60
50
40
30
20
10
0
0 100 200 300 400 500 600 700 800
194
Como a variação dos dados não inclui x = 0, não há interpretação prática do coeficiente a = 32,856.
Por outro lado, b = 0,06786 significa que a cada aumento de 1 tonelada de fertilizantes, a produção
agrícola média (esperada) aumenta 0,06786 por hectare.
Se x = 250 toneladas, por exemplo, yˆ = 49,821.
Se x = 251 toneladas, yˆ = 49,889.
Se x = 252 toneladas, yˆ = 49,957.
MELLO, Adélia. Apostila de Estatística II. Curitiba, 2009. p. 26.
Coeficiente de determinação
Um modo de medir a qualidade do ajuste linear simples é pelo coeficiente de determinação. Seu valor
fornece a proporção da variação total da variável y explicada pela variável x pela função ajustada. É repre-
sentado por R2.
R =
b
n
n
2
2 2
2
2
2
x
x
y
y
–
–
å( )
å
é
ë
ê
ê
ê
ù
û
ú
ú
ú
å( )
å
, sendo 0 12£ ³R .
Observe que quanto mais próximo o coeficiente de determinação estiver da unidade, melhor será o
ajuste.
Assim, temos:
R =
b
n
n
=
0,06786 . 1
2
2 2
2
2
2
2x
x
y
y
–
–
å( )
å
é
ë
ê
ê
ê
ù
û
ú
ú
ú
å( )
å
( ) 4400 000 2 800
7
26 500 420
7
= 1 289,3943
1 300
2
2
–
–
éë
êê
ù
û
úú = 0,99
Como o coeficiente está próximo da unidade, temos um bom ajuste, ou seja, o uso de fertilizantes
influencia a produção.
Acompanhe a resolução passo a passo do exercício seguinte.
Uma empresa está analisando a variação da demanda de certo produto em função de seu preço de
venda. Abaixo, constam as unidades vendidas e o preço da venda por mês.
MEsEs UNidAdEs VENdidAs (y) PrEçO dE VENdA (x) POr UNidAdE
J
F
M
A
M
J
J
A
S
O
147
140
134
126
110
103
97
89
81
73
132,00
137,00
142,00
148,00
150,00
156,00
160,00
164,00
170,00
178,00
Fonte: Os autores.
195
Estatística Aplicada à Gestão – Capítulo 4
Com base nesses dados, observe como a demanda do produto decresce linearmente com o acréscimo
de preço.
y x xy x2 y2
147
140
134
126
110
103
97
89
81
73
132,00
137,00
142,00
148,00
150,00
156,00
160,00
164,00
170,00
178,00
19 404
19 180
19 028
18 648
16 500
16 068
15 520
14 596
13 770
12 994
17 424
18 769
20 164
21 904
22 500
24 336
25 600
26 896
28 900
31 684
21 609
19 600
17 956
15 876
12 100
10 609
9 409
7 921
6 561
5 329
1100 1 537 165 708 238 177 126 970
y = 110 x = 153,7
1.o) Calculando a correlação entre as variáveis, percebemos a forte correlação entre elas:
r =
xy
.
n
n
y
n
2
2
2
2
xy
x y
x
x
y
–
– –
å( ) å( )
å
å( )
å
é
ë
ê
ê
ê
ù
û
ú
ú
ú
å( )
å
éé
ë
ê
ê
ê
ù
û
ú
ú
ú
é
=
165 708 1537 . 1100
10
238177 1537
10
2
–
–
ëë
ê
ê
ù
û
ú
ú
é
ë
êê
ù
û
úú
126 970 1100
10
= 3 362
1940,1 . 5 970
2
–
–
== 0,98–
2.o) Calculando os parâmetros:
b =
xy
n
n
=
165 708 1 537 . 1 100
1
2
2
–
–
–
x y
x
x
å( ) å( )
å
å( )
å
00
238 177
1 537
10
= 3 362
1 940,1
= 1,7329
2
–
– –
( )
Figura 46 – Gráfico unidades vendidas e preço por unidade.
Preço por unidade
Un
id
ad
es
v
en
di
da
s
200
150
100
50
0
0 20 40 60 80 100 120 140 160
Fonte: Os autores.
196
a = b = 110 ( 1,7329) . 153,7 = 376,35y y– – –
3.o) Montando a equação de regressão:
yˆ = a + bx = 376,35 1,7329x–
O resultado b = –1,7329 significa que para cada unidade de variação positiva de preço (x), a quantidade
procurada (y) decresce em 1,7329 unidade.
Pontos extremos (outliers) e pontos de influência
Em um diagrama de dispersão, um ponto extremo (outlier) é aquele que está muito afastado dos de-
mais. Isso acontece quando as variáveis não estão fortemente relacionadas.
Os dados amostrais emparelhados podem conter um ou mais pontos de influência, aqueles que afetam
fortemente o gráfico da reta de regressão (TRIOLA, 1999). Perceba, no exemplo anterior, que há vários
pontos de influência.
Variação marginal
Ao trabalharmos com duas variáveis relacionadas por uma equação de regressão, a variação mar-
ginal em uma delas é o quanto ela varia quando a outra variável sofre uma variação de exatamente uma
unidade.
Texto i
O MéTOdO dE COrrELAçãO E rEGrEssãO APLiCAdO NA árEA dE TrANsPOrTEs
A pesquisa de campo realizada sobre o desempenho da empresa de transportes Costeira
Transportes e Serviços Ltda. detectou constantes atrasos na entrega das mercadorias das re-
despachadoras, assim como no retorno dos conhecimentos de entrega. Tal fenômeno motivou a
criação de um modelo para análise de indicadores que possa ajudar a identificar a solução para
esse problema. O modelo está baseado na análise estatística de correlação e regressão linear.
Os resultados mostram, através de gráficos, uma relação funcional que representa esse fenôme-
no, efetuando assim um diagnóstico mais específico da situação. A pesquisa ilustra o papel que
conceitos e técnicas estatísticas têm na formação do administrador na área de logística e gestão
de operações, na sua prática profissional e, de modo especial, no avanço do conhecimento nessa
área específica. O objetivo será alcançado principalmente através da apresentação e discussão
dos resultados de estudos relevantes. Através destes exemplos, argumenta-se que conceitos es-
tatísticos têm papel importante a desempenhar, tanto no estudo da logística, como no processo
de administração em geral.
COSTA, Denis Carlos Lima; CRUZ, Edson Costa; LAUNÈE, Erycka; LIMA, Waldemiro.
O método de correlação e regressão aplicado na área de transportes.
Disponível em: <http://www.administradores.com.br/producao_academica/o_metodo_de_correlacao_e_regressao_aplicado_na_area_de_
transportes/1852/>. Acesso em: 15 set. 2009.
Leituras complementares
197
Estatística Aplicada à Gestão – Capítulo 4
Texto ii
UM EsTUdO dE COrrELAçãO ENTrE O CLiMA OrGANiZACiONAL E A
PrOdUTiVidAdE EM UMA EMPrEsA
introdução
O clima organizacional é o elo conceitual de ligação entre o nível individual e o nível organizacional,
no sentido de expressar a compatibilidade ou congruência das expectativas, valores e interesses indivi-
duais com as necessidades, valores e diretrizes formais da organização [1]. O objetivo geral do estudo
visa demonstrar a correlação entre o clima organizacional, qualificação da mão de obra dentro da organi-
zação e os índices de produtividade atingidos como resultado. Observaram-se os aspectos que denotam
o grau de relação existente entre a gestão de recursos humanos e a produção global da organização,
assim como os reflexos existentes nas tomadas de decisão em ambas as áreas. Três fatores importantes
afetam a produtividade da mão de obra: desempenho do empregado no trabalho; tecnologia, máquinas,
ferramentas e métodos do trabalho que sustentam e auxiliam o trabalho deles; e a qualidade de produto.
Aumentar a produtividade através de desenvolvimentos tecnológicos é, no mínimo, tão importante quan-
to o desempenho do empregado no trabalho para aumentar a produtividade [2]. Buscou-se: estabelecer
o grau de satisfação dos colaboradores e o quanto isso se reflete favorável ou desfavoravelmente no
clima organizacional; e identificar os métodos e/ou instrumentos que a empresa adota para promover o
desenvolvimento intelectual dos colaboradores, assim como as formas de enriquecimento das tarefas
propostas de forma variada e não repetitiva, as condições básicas das instalações e se estas estão
adequadas com o trabalho, proporcionando bem-estar e conforto.
Metodologia
Para a efetivação da pesquisa, buscou-se uma empresa do setor de indústria e comércio para fazer
a aplicação do estudo, sendo uma pesquisa de campo, descritiva e quantitativa.
Determinaram-se, como população, os 36 funcionários da Empresa Reflexo, sendo selecionada
uma amostra por quotas de 26 funcionários, representando 72% dos mesmos.
resultados
Com base na pesquisa, identificou-se que todos os colaboradores têm interesse de aperfeiçoar o
conhecimento, sendo que 77% dos entrevistados não estão estudando. 69% trabalham no setor de fer-
ro/alumínio/vidro; os benefícios citados como mais importantes pelos funcionários foram a assistência
médica/hospitalar/odontológica, com 37%, enquanto 24% elegeram o auxílio alimentação. Dentre os
entrevistados, 54% acreditam que o relacionamento é muito bom; 46% dizem ser bom, quanto ao grau
de motivação; 50% dos colaboradores estão muito motivados; e 46% se encontram motivados com as
atividades que realizam. Com relação ao desempenho das atividades, 58% responderam estar bom;
100% dos entrevistados afirmam que a empresa estimula a solução de problemas; 61% responderam
que há uma relação contínua entre a qualidade do trabalho executado com os resultados da empresa.
Os funcionários elencaram alguns aspectos positivos que afetam a produtividade, como os equipa-
mentos, limpeza, organização e benefícios oferecidos; e, como fatores negativos,citam os problemas
pessoais, ruídos e iluminação.
discussões e conclusões
O estudo mostrou que há uma correlação entre o clima organizacional e a produtividade no tra-
balho, pois aspectos como instalações e equipamentos interferem na qualidade e produtividade do
198
trabalho. [...] Percebeu-se também que a maioria dos pesquisados pretende continuar na empresa,
indicando que há um nível de aceitação bastante grande por parte destes às práticas da empresa.
Destaca-se uma pequena contradição quando os mesmos foram questionados com relação à vontade
de aperfeiçoar-se, sendo que a maioria dos entrevistados manifestou esse desejo, mas, no entanto,
grande parte dos mesmos não está estudando e possui como formação o primeiro grau incompleto.
[1] PAYNE, R.L.; MANSFIEL, S. Clima organizacional e a satisfação. São Paulo: Human Performance, 1983.
[2] GAITHER, N.; FRAZIER, G. Administração da produção e operações. São Paulo: Pioneira, 1999.
BISOGNIN, M.; RüDELL, J. A.; RADDATZ, M.; OLIVEIRA, C.; BIANCHI, R. C.
Um estudo de correlação entre o clima organizacional e produtividade em uma empresa.
Disponível em: <http://www.unifra.br/cursos/administracao/publicacoes/Marcelo%20Bisognin%20-%20317.pdf>.
Acesso em: 15 set. 2009.
Você estudou:
Quando temos algumas variáveis quantitativas e desejamos examinar o efeito que algumas exercem, ou
parecem exercer, sobre as outras, classificamos essas variáveis em dois tipos: variáveis independentes
(explicativas) e variáveis dependentes (explicadas). Denota-se x para a variável independente e y para
a variável dependente.
A regressão é uma técnica usada para avaliar as relações que possam existir entre tais variáveis, cole-
tadas no estudo de uma população, através da utilização de um modelo matemático.
síntese
BISOGNIN, M.; RüDELL, J. A.; RADDATZ, M.; OLIVEIRA, C.; BIANCHI, R. C. Um estudo de correlação entre o
clima organizacional e produtividade em uma empresa. Disponível em: <http://www.unifra.br/cursos/administracao/
publicacoes/Marcelo%20Bisognin%20-%20317.pdf>. Acesso em: 15 set. 2009.
COSTA, Denis Carlos Lima; CRUZ, Edson Costa; LAUNÈE, Erycka; LIMA, Waldemiro. O método de correlação
e regressão aplicado na área de transportes. Disponível em: <http://www.administradores.com.br/producao_
academica/o_metodo_de_correlacao_e_regressao_aplicado_na_area_de_transportes/1852/. Acesso em: 15 set.
2009.
MELLO, Adélia. Apostila de estatística II. Curitiba, 2009.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
TRIOLA, Mario F. Introdução à estatística. 7. ed. Rio de Janeiro: LTC, 1999.
referências
Anotações
Análise de variância do modelo
de regressão linear
Conteúdo programático
Predições
Resíduos
Modelos não lineares – transformações
Objetivos
Entender a importância da projeção na estatística e a sua relação com a
regressão linear.
Apreender o conceito de “resíduos”.
Compreender a propriedade dos mínimos quadrados considerando a
definição dos resíduos.
200
prEdiçõEs
Quando as equações de regressão se ajustam bem aos dados, podem ser feitas previsões para o valor
de uma variável, desde que se conheça a outra variável.
Essas previsões implicam estabelecer relações entre duas ou mais variáveis que tenham a possibilida-
de de prever uma ou mais delas em função das restantes.
Fazer previsões ou projeções é um recurso estatístico bastante utilizado, principalmente nas empresas,
pois é necessário prever vendas, estoques, custos, fluxo de caixa, entre outros.
As previsões dependem da obtenção de dados referentes a uma população. No caso da empresa, por
exemplo, são necessárias amostras da quantidade de produtos produzidos, do seu preço, do valor gasto
com publicidade, etc.
Ao predizer um valor de y com base em determinado valor de x, se não houver correlação linear, o
melhor valor predito de y é y ; se houver correlação linear significativa, obtemos o melhor valor predito de
y substituindo o valor de x na equação de regressão, sendo que devemos estar atentos aos limites dos
valores disponíveis.
Portanto, só utilizamos a equação da reta de regressão se r (coeficiente de correlação) indicar a
existência de uma correlação linear significativa. Quando não há uma correlação linear, não utilizamos a
equação de regressão para projetar ou predizer; em vez disso, a melhor estimativa da segunda variável é
simplesmente a sua média.
Então, se r está próximo de –1 ou +1, existe um bom ajuste e podemos, então, fazer predições; porém,
se r é vizinho de 0, o ajuste é fraco (e não deve ser usado para fazer predições).
Verifique, pelo exemplo seguinte, como utilizar a correlação.
Em uma empresa que analisa a variação da demanda em relação ao preço do produto, constatamos
uma correlação linear significativa entre as unidades vendidas (y) e o preço de venda (x) de determinado
produto.
A equação de regressão é:
yˆ = a + bx = 375,9 – 1,73x
Portanto, se o preço de venda for R$ 120,00, podemos projetar o número de unidades vendidas. As-
sim:
ˆ ˆ ˆy y y = 375,9 1,73x = 375,9 1,73 . 120 = 375,9 2– – –Þ Þ 007,6Þ yˆ ~= 168
Então, se o preço for R$ 120,00, projetamos que o número de unidades vendidas será 168.
rEsíduos
Após realizar a regressão, é importante verificar se o modelo encontrado é apropriado para os dados.
Isso é feito com a análise dos resíduos.
Os resíduos apresentam a diferença entre o valor observado de y e o que foi predito pelo modelo de
regressão:
e = y – y
201
Estatística Aplicada à Gestão – Capítulo 4
Para avaliar os resíduos, podemos construir um gráfico em que:
no eixo vertical (y) são colocados os resíduos ( y y– ˆˆy);
no eixo horizontal (x) são colocados os valores esperados de y ( yˆ ).
Então, pode ser observada a distância entre os pontos que representam os dados originais e a reta de
regressão. Tais distâncias são chamadas de resíduos.
Analisando os resíduos, percebemos: se a distribuição dos dados apresenta uma normalidade; se a
variância dos resíduos é constante (nesse caso, a dispersão em torno da reta de regressão é uniforme); se
os resíduos não estão correlacionados; e, ainda, se há uma variável não identificada que deva ser incluída
no modelo.
Neste exemplo, inicialmente, vamos analisar os seguintes dados:
x 1 2 4 5
y 4 24 8 32
y x x2 y2 xy
4
24
8
32
1
2
4
5
1
4
16
25
16
576
64
1024
4
48
32
160
68 12 21 1680 244
No gráfico, os resíduos são as distâncias dos pontos até a reta.
Como exemplo específico, observe o ponto de abscissa x = 5. Levando o valor x = 5 na equação de
regressão yˆ = 4x + 5, obtemos o valor predito yˆ = 25, mas o valor amostral efetivamente observado é
y = 32. A diferença y y = 7– ˆ é um resíduo.
A equação de regressão representa a reta que melhor se ajusta aos pontos de acordo com a proprie-
dade dos mínimos quadrados. É importante entender que uma reta verifica a propriedade dos mínimos
quadrados se a soma dos quadrados dos resíduos é a menor possível.
Calculando os outros resíduos do exemplo dado, obtemos:
Para x = 1 y = 4 . 1 + 5 = 9 y y = 4 9 = 5Þ \ˆ ˆ– – –
Para x = 2 y = 4 . 2 + 5 = 13 y y = 24 13 = 11Þ \ˆ ˆ– –
Fonte: Os autores.
y = 4x + 5
35
30
25
20
15
10
5
0
0 1 2 3 4 5 6
Figura 47 – Reta de regressão e resíduos – modelo ajustado.
Fonte: Os autores.
202
P ara x = 4 y = 4 . 4 + 5 = 21 y y = 8 21 = 13Þ \ˆ ˆ– – –
A soma dos quadrados dos resíduos é: – –5 + 11 + 13 + 7 = 364
2 2 2 2( ) ( ) .
Qualquer outra reta distinta de yˆ = 4x + 5 dará resíduos cuja soma dos quadrados é maior do que
364.
modElos não linEarEs –
transFormaçõEs
Em muitos casos, a relação entre duas variáveis não é linear. Observe o exemplo:
x 3 4 5 6 7
y 9 16 25 36 49
Perceba que cada valor de y é o quadradodo valor de x correspondente, de forma que as duas variá-
veis estão relacionadas pela equação y = x2 e não por uma equação linear, que teria a forma y = ax + b.
Podemos encontrar a melhor equação de ajuste com o auxílio de diagramas de dispersão e uma
calculadora ou de um computador cujas apresentações incluam os valores de r ou outras estatísticas que
permitam avaliar quão bem a equação se ajusta aos dados amostrais.
A função potência, apresentada no exemplo acima, embora não linear, pode se tornar linear através de
uma transformação com logaritmos naturais: aplicando logaritmos nos dois membros da função potência,
obtemos a expressão linear ln yˆ = ln a + bln x.
Para realizar essa transformação, os valores da amostra y devem ser transformados em ln y, formando
a nova amostra com valores ln y, e os valores da amostra x devem ser transformados em ln x, formando a
nova amostra com valores ln x.
O quadro a seguir mostra alguns modelos não lineares que se tornam lineares depois de uma transfor-
mação com logaritmos naturais (ln):
TiPO EqUAçãO TrANsfOrMAçãO VAriáVEL x VAriáVEL y
Linear yˆ = a + bx yˆ = a + bx x y
Exponencial yˆ = a. ebx ln y = ln a + ln xˆ x ln y
Logarítmica yˆ = a + b . ln x yˆ = a + b . ln x ln x y
Potência yˆ = a . xb ln y = ln a + b . ln x ln x ln y
Na primeira linha, consta a equação da regressão linear simples conhecida.
Nas outras três linhas, estão registradas três funções não lineares e as transformações das variáveis x
e y para torná-las funções lineares semelhantes à da primeira linha.
As transformações das variáveis relacionadas de forma não linear criam novas variáveis relacionadas
de forma linear que podem ser analisadas dentro do modelo de regressão linear.
Além disso, perceba que a transformação das funções exponencial, logarítmica e potência permite
utilizar o modelo de regressão linear simples, apesar de não ser linear a relação entre as variáveis ori-
ginais.
203
Estatística Aplicada à Gestão – Capítulo 4
Texto i
PrOJEçãO dAs qUANTidAdEs dE rEsÍdUOs sóLidOs UrbANOs
Para se avaliar corretamente a projeção da geração de lixo per capita é necessário conhecer o
tamanho da população residente, bem como o da flutuante, principalmente nas cidades turísticas,
quando esta última gera cerca de 70% a mais de lixo do que a população local.
População flutuante é um dado significativo a ser considerado na projeção da quantidade de lixo
gerado em cidades turísticas.
Na inexistência de dados demográficos detalhados podem-se utilizar as projeções populacionais
disponíveis para determinação da produção do lixo com o auxílio da tabela abaixo, na qual é estimada
uma geração per capita em função do tamanho da população.
O exemplo a seguir esclarece os procedimentos a serem adotados.
Suponha que se queira projetar um sistema de limpeza urbana para uma cidade sem vocação
turística, com uma população urbana atual de 50 mil habitantes, que cresce a uma taxa de 3% ao ano,
na qual foi medida uma geração per capita de 530g/hab./dia.
Adotando-se um horizonte de 20 anos para a projeção, os valores de população serão os forneci-
dos pela tabela.
Projeção populacional
ANO
POP. UrbANA
(HAb.)
ANO
POP. UrbANA
(HAb.)
2001 50.000 2012 69.211
2002 51.500 2013 71.287
2003 53.045 2014 73.426
2004 54.636 2015 75.629
2005 56.275 2016 77.898
2006 57.963 2017 80.235
2007 59.702 2018 82.642
2008 61.493 2019 85.121
2009 63.338 2020 87.675
2010 65.238 2021 90.305
2011 67.195
Quando a cidade atingir os 90 mil habitantes, a geração per capita deverá ser da ordem de
550g/hab./dia. Assim, pode-se estimar a evolução da produção per capita conforme os valores da
tabela seguinte.
EVOLUçãO PEr CAPiTA
Período Per capita (g/hab./dia)
2001 a 2007 530
2008 a 2014 540
2015 a 2021 550
Dessa forma, calcula-se a projeção da quantidade de resíduos sólidos produzida ano a ano, con-
forme a próxima tabela.
Leituras complementares
204
PrOJEçãO dA qUANTidAdE dE LixO GErAdA
ANO
PrOJEçãO POPULACiONAL
(HAb.)
PEr CAPiTA
(kg/HAb./diA)
qUANTidAdE dE LixO
(t)
2001 50.000 0,53 26,5
2002 51.500 0,53 27,3
2003 53.045 0,53 28,1
2004 54.636 0,53 29,0
2005 56.275 0,53 29,8
2006 57.963 0,53 30,7
2007 59.702 0,53 31,6
2008 61.493 0,54 33,2
2009 63.338 0,54 34,2
2010 65.238 0,54 35,2
2011 67.195 0,54 36,3
2012 69.211 0,54 37,4
2013 71.287 0,54 38,5
2014 73.426 0,54 39,7
2015 75.629 0,55 41,6
2016 77.898 0,55 42,8
2017 80.235 0,55 44,1
2018 82.642 0,55 45,5
2019 85.121 0,55 46,8
2020 87.675 0,55 48,2
2021 90.305 0,55 49,7
BIBLIOTECA VIRTUAL DE DESENVOLVIMENTO SUSTENTÁVEL E SAÚDE AMBIENTAL.
Projeção das quantidades de resíduos sólidos urbanos. Disponível em: <www.bvsde.paho.org/
bvsacd/cd29/manualrs/cap6-6.pdf>. Acesso em: 16 set. 2009.
Texto ii
EsTUdO sObrE rEsÍdUOs ELETrOELETrôNiCOs
Estimativas feitas a partir do “Diagnóstico da Geração de Resíduos Eletroeletrônicos no Estado de
Minas Gerais”, divulgado pela Fundação Estadual do Meio Ambiente (Feam), constataram que em Mi-
nas Gerais são descartadas, por ano, cerca de 40 mil toneladas de materiais metálicos integrantes dos
resíduos eletroeletrônicos (REEs) provenientes de telefones celulares e fixos, aparelhos de televisão,
computadores, rádios, máquinas de lavar roupa, geladeiras e freezers.
Compostos por ferro, alumínio, cobre, chumbo, cádmio, mercúrio, ouro, prata, paládio e índio, es-
ses resíduos têm cerca de 30% do seu total gerado na região metropolitana de Belo Horizonte (RMBH).
Em se tratando de plásticos, são geradas cerca de 17 mil toneladas. Já no caso de vidros, a geração é
de, aproximadamente, 6 mil toneladas.
Já o Brasil gera em torno de 680 mil toneladas desse mesmo tipo de resíduo. Além de conter
materiais que podem vir a ser reciclados e recuperados, estes equipamentos apresentam várias subs-
tâncias tóxicas e poluentes, como os metais pesados. O manuseio ou descarte incorreto dos REEs
tem potencial de causar problemas à saúde humana e ao meio ambiente, por meio da contaminação,
principalmente, do solo e das águas subterrâneas.
205
Estatística Aplicada à Gestão – Capítulo 4
Além das estimativas de geração de REEs, o diagnóstico faz uma análise do fluxo de geração
de resíduos eletroeletrônicos, incluindo discussões sobre os diversos atores envolvidos desde a ge-
ração até a destinação final. Embora aponte as curvas de geração deste tipo de resíduos em t/ano
e kg/hab. para Minas Gerais, o diagnóstico apresenta, sempre que possível, resultados relativos ao
Brasil e à região metropolitana de Belo Horizonte até o ano de 2030. O presidente da Feam, José
Cláudio Junqueira, afirma que o objetivo do levantamento é fazer uma gestão efetiva dos REEs. “Com
base nesses dados, precisamos estabelecer normas para atuar junto à cadeia de produção desses
equipamentos e fazer dos fabricantes, distribuidores e revendedores corresponsáveis pelos resíduos
gerados”, revelou.
De acordo com o diagnóstico, entre 2001 e 2030, cada brasileiro deve gerar em média, a cada ano,
em torno de 3,4 kg de REEs. “Este estudo foi realizado para estimar, preliminarmente, a geração atual
e futura dos resíduos eletroeletrônicos e auxiliar decisões na busca pela solução dos consequentes
problemas ambientais advindos do gerenciamento inadequado”, afirmou Junqueira que é, também,
membro do Conselho Nacional do Meio Ambiente (Conama).
Com a progressão de descartes de resíduos provenientes de telefones (celular e fixo), televisores,
computadores, rádios, máquinas de lavar roupa, geladeiras e freezers, o diagnóstico aponta que o
Brasil terá acumulado, aproximadamente, 22 milhões de toneladas de resíduos eletroeletrônicos para
disposição, no período de 2001 a 2030, sendo que Minas Gerais representa em torno de 10% desse
total. Segundo Gustavo Tetzl Rocha, consultor da Feam e do Swiss Federal Laboratories for Materials
Testingand Research (EMPA), centro de pesquisa sediado na Suíça que, ao longo dos últimos anos,
tem desenvolvido trabalhos de quantificação e gerenciamento de resíduos eletroeletrônicos em diver-
sos países do mundo, os números podem ser ainda maiores. “No diagnóstico consideramos que cada
domicílio tem apenas um equipamento eletroeletrônico de cada tipo”, explicou.
Para o cálculo da estimativa de geração, foi utilizada a metodologia de Consumo e Uso, estabe-
lecida pelo EMPA. O estudo recorreu a indicadores do IBGE e Programa das Nações Unidas para o
Desenvolvimento (PNUD), além de fazer projeções na geração destes resíduos a partir do crescimento
populacional, com base no último período intercensitário (1991–2000).
A partir da identificação dos potenciais problemas ambientais provocados pelos REEs, a Feam
pretende iniciar discussões que envolvam a elaboração de normativas para implementação de políticas
públicas relativas à gestão deste tipo de resíduos no estado de Minas Gerais, além de apresentar ao
Conama sugestões de âmbito nacional. Junqueira ressaltou, por exemplo, que a fabricação de produ-
tos que geram resíduos eletroeletrônicos pode estar condicionada ao recolhimento de equipamentos
pós-consumo, como ocorre com os fabricantes de pneus. Nacionalmente, podem-se ainda estabelecer
metas progressivas para que um produto seja constituído de material reciclável.
Para o estado, que passou a contar neste ano com uma legislação específica (Lei n. 18.031/09)
para a gestão de resíduos sólidos, o diagnóstico vai permitir avanços na busca de soluções para redu-
zir o impacto provocado por estes resíduos, que se avolumam em aterros sanitários, quando não são
descartados de forma inadequada, como geralmente ocorre. O presidente da Feam não descarta, por
exemplo, a criação de uma proposição para redução de ICMS ou a criação de outro tipo de incentivo
para fabricantes, importadores e comerciantes que recolham produtos que esgotaram o seu tempo de
vida útil, vendam produtos ecológicos ou desenvolvam tecnologias para segregação de componentes,
principalmente placas, que contêm metais pesados. “Temos que planejar uma gestão adequada para
evitar que as pessoas acabem se contaminando no momento em que separam as peças a fim de apro-
veitar o plástico e o metal nelas contidos”, destacou.
206
Alguns números do diagnóstico:
Geração de resíduos eletroeletrônicos:
Brasil: 680.000 toneladas/ano
MG: 69.000 toneladas/ano
RMBH: 21.000 toneladas/ano
Geração média per capita anual de resíduos eletroeletrônicos (2001 a 2030), considerando resí-
duos provenientes de telefones celulares e fixos, televisores, computadores, rádios, máquinas de lavar
roupa, geladeiras e freezers:
Brasil: 3,4 kg/habitante
MG: 3,3 kg/habitante
RMBH: 3,7 kg/habitante
Geração média per capita anual de resíduos eletroeletrônicos (2001 a 2030), considerando resí-
duos provenientes de telefones celulares e fixos, televisores e computadores:
Brasil: 1,0 kg/habitante
MG: 1,0 kg/habitante
RMBH: 1,1 kg/habitante
Projeção de acúmulo de resíduos eletroeletrônicos gerados entre 2001 e 2030, considerando resí-
duos provenientes de telefones celulares e fixos, televisores, computadores, rádios, máquinas de lavar
roupa, geladeiras e freezers:
Brasil: 22 milhões de toneladas
MG: 2,2 milhões de toneladas
RMBH: 625 mil toneladas
Projeção de acúmulo de resíduos eletroeletrônicos gerados entre 2001 e 2030, considerando resí-
duos provenientes de telefones celulares e fixos, televisores e computadores:
Brasil: 7 milhões de toneladas
MG: 680 mil toneladas
RMBH: 200 mil toneladas
FAROL COMUNITÁRIO. Estudo sobre resíduos eletroeletrônicos.
Disponível em: <http://www.setorreciclagem.com.br/modules.php?name=News&file=article&sid=823>. Acesso em: 16 set. 2009.
Sugerimos duas obras para você consultar e aprofundar seus estudos.
Ambas tratam do tópico “regressão”.
Estatística aplicada, dos autores Douglas Downing e Jeffrey Clark, é
uma importante obra de referência. Ela apresenta aplicações práticas
e estudos de casos reais. Há respostas explicativas dos exercícios pro-
postos, o que facilita o estudo.
Já a obra Estatística para administração e economia, de James McCla-
ve, também é referência para estudantes de graduação, em especial,
os da área de administração e contabilidade. Além dos conceitos pró-
prios da estatística básica, traz demonstrações de coleta de dados e de
análises que contribuem para a tomada de decisões.
207
Estatística Aplicada à Gestão – Capítulo 4
BIBLIOTECA VIRTUAL DE DESENVOLVIMENTO SUSTENTÁVEL E SAÚDE AMBIENTAL. Projeção das quantidades
de resíduos sólidos urbanos. Disponível em: <www.bvsde.paho.org/bvsacd/cd29/manualrs/cap6-6.pdf>. Acesso em:
16 set. 2009.
FAROL COMUNITÁRIO. Estudo sobre resíduos eletroeletrônicos. Disponível em: <http://www.setorreciclagem.com.br/
modules.php?name=News&file=article&sid=823>. Acesso em: 16 set. 2009.
TRIOLA, Mario F. Introdução à estatística. 7. ed. Rio de Janeiro. LTC, 1999.
referências
Anotações
Você estudou:
Existem condições necessárias para poder fazer previsões do valor de uma variável.
A análise de resíduos permite percebermos se o modelo encontrado é apropriado para os dados. Os
resíduos são estimados pela diferença entre o valor observado de y e o valor predito pelo modelo de
regressão.
A propriedade dos mínimos quadrados é verificada por uma reta quando a soma dos quadrados dos
resíduos é a menor possível.
É possível ajustarmos equações não lineares ao modelo de regressão linear por meio de transforma-
ções.
síntese
208
intervalos de variação e predição
Conteúdo programático
Análise do modelo ajustado
Intervalos de predição
Objetivos
Elaborar uma análise gráfica detalhada dos conceitos de desvio total,
desvio explicado e desvio não explicado, considerando a reta de
regressão.
Compreender o conceito de “resíduo” nesse contexto.
Estimar os intervalos de predição, compreendendo que são medidas
mais precisas do que estimativas pontuais.
210
análisE do modElo ajustado
O coeficiente de correlação pode oferecer informações adicionais sobre a variação dos pontos da
amostra em torno da reta de regressão.
O exemplo a seguir possui informações importantes. Observe.
Os resultados de uma grande coleção de dados são os seguintes:
Há uma correlação linear significativa.
A equação da reta de regressão é yˆ = 3 + 2x.
y = 9
Um dos pares de dados da amostra é x = 5 e y = 19.
O ponto (5, 13) é um dos pontos da reta de regressão, pois, fazendo x = 5 na equação de regressão,
obtemos: yˆ = 3 + 2x = 3 + 2 . 5 = 13 .
O ponto (5, 13) está sobre a reta de regressão, mas o ponto (5, 19) pertence ao conjunto original de
dados e não pertence à reta de regressão, porque não satisfaz a equação de regressão. Veja o gráfico:
Você já estudou como aplicar o coeficiente de correlação linear r para
avaliar se havia correlação linear significativa entre duas variáveis.
Desvio
não explicado
Desvio explicado
(5,19)
(5,13)
(5, 9)
y = 2x + 3
0 1 2 3 4 75 86 9
Figura 48 – Representação gráfica dos desvios.
Segundo Triola (1999), para uma coleção de dados emparelhados que contenha o ponto (x, y), sendo
yˆ o valor predito de y (dado através da equação de regressão), e y a média dos valores amostrais de y,
temos que:
O desvio total (em relação à média) do ponto (x, y) é a distância vertical y – y, que é a distância
entre o ponto (x, y) e a reta horizontal que passa pela média amostral y.
O desvio explicado é a distância vertical yˆ – y , que é a distância entre o valor predito yˆ e a reta
horizontal que passa pela média amostral.
20
18
16
14
12
10
8
6
4
2
0
211
Estatística Aplicada à Gestão – Capítulo 4
r2 =
variação explicada
variação total
O desvio não explicado é a distânciavertical y – yˆ, ou seja, a distância vertical entre o ponto
(x, y) e a reta de regressão. (A distância y – yˆ também é chamada de resíduo.)
Para os dados considerados, obtemos os seguintes resultados:
desvio t otal de (5, 19) = y – y = 19 – 9 = 10;
desvio explicado de (5, 19) = yˆ – y = 13 – 9 = 4;
desvio não e xplicado de (5, 19) = 19 – 13 = 6.
Para predizer um valor de y, dado um valor de x e uma coleção de dados (x, y), é necessária uma
correlação linear significativa, caso contrário, a melhor estimativa seria y .
Para predizer o valor de y, quando x = 5, aplicamos a equação de regressão, que resulta yˆ = 13, cal-
culado anteriormente. Para explicar a discrepância entre y = 9 e yˆ = 13, é preciso notar que existe uma
correlação linear significativa cuja melhor descrição é a reta de regressão. Consequentemente, quando
x = 5, y deveria ser 13 e não 9. Contudo, quando deveria ser 13, y é realmente 19. A discrepância entre 13
e 19 não pode ser explicada pela reta de regressão e é chamada de desvio não explicado ou resíduo:
(desvio total) = (desvio explicado) + (desvio não explicado)
ou
(y – y) = (yˆ – y) + (y – yˆ )
Essa expressão é aplicada em um ponto particular (x, y), mas pode ser generalizada e modificada de
modo a incluir todos os pares de dados da amostra, conforme a fórmula abaixo:
(variação total) = (variação explicada) + (variação não explicada)
ou
y = y + y y
2 2 2
– – –( ) ( ) ( )ååå ˆ ˆ
Nesse caso:
a variação total é expressa como a soma dos quadrados dos desvios totais;
a variação explicada é a soma dos quadrados dos desvios explicados;
a variação não explicada é a soma dos quadrados dos desvios não explicados.
O coeficiente de determinação também pode ser calculado em função das variáveis já citadas. Lem-
brando que se trata de um coeficiente que explica a variação de y pela reta de regressão e é dado por:
intErvalos dE prEdição
Uma empresa está analisando a variação da demanda de certo produto em função de seu preço de
venda e obteve a equação de regressão yˆ = 375,9 1,73x– , em que yˆ representa o número de unidades
vendidas. Com essa equação podemos estimar o valor de y para qualquer valor de x. Por exemplo, se x =
R$ 120,00, y seria aproximadamente 168 unidades.
y y
212
Como 168 é um valor único, é chamado de estimativa pontual. Sabemos, no entanto, que estimativas
pontuais têm a desvantagem de não dar qualquer ideia de sua precisão. No exemplo citado, temos que o
melhor valor predito é 168, mas não sabemos quão preciso ele é.
Um intervalo de predição é uma estimativa em torno de um intervalo para um valor predito de y.
Nesse caso, podemos utilizar, então, um intervalo de predição, que consiste numa estimativa intervalar
de confiança em relação a um valor predito de y.
O estabelecimento de um intervalo de predição exige uma medida de dispersão dos pontos amostrais
em torno da reta de regressão.
Devemos diferenciar desvio não explicado (resíduo) e erro padrão:
desvio não explicado: distância vertical entre um ponto amostral e a
reta de regressão;
erro padrão: medida coletiva da dispersão dos pontos amostrais em
torno da reta de regressão.
O erro padrão da estimativa (se) é a medida das diferenças entre os valores dos dados coletados y e os
valores estimados yˆ obtidos através da reta de regressão. O erro padrão é dado por:
s =
y y
n 2e
2
–
–
ˆ( )å
, em que yˆ é o valor predito de y.
O desenvolvimento do erro padrão da estimativa (se) acompanha o do desvio padrão ordinário. Assim
como o desvio padrão mede o quanto os dados se desviam de sua média, o erro padrão de estimativa é
uma medida de quanto os pontos amostrais se afastam da reta de regressão.
Quanto menores forem os valores de se, mais próximos da reta de regressão estarão os pontos; valores
maiores de se correspondem a valores mais afastados da reta.
Devido à praticidade, uma fórmula bastante utilizada para o cálculo do erro padrão da estimativa é a
seguinte:
s =
y a y b xy
n 2e
2 – –
–
ååå
Neste caso, a e b são os coeficientes de regressão.
Aplique a fórmula anterior para calcular o erro padrão da estimativa dos exemplos seguintes.
Vamos retomar um exemplo e ampliar a sua resolução. Uma empresa está analisando a variação da 1.
demanda de certo produto em função de seu preço de venda. Na tabela seguinte constam as informa-
ções quanto aos meses, as unidades vendidas e o preço da venda.
MEsEs UNidAdEs VENdidAs (y) PrEçO dE VENdA (x) POr UNidAdE
Janeiro 147 132,00
Fevereiro 140 137,00
Março 134 142,00
Abril 126 148,00
Maio 110 150,00
213
Estatística Aplicada à Gestão – Capítulo 4
Junho 103 156,00
Julho 97 160,00
Agosto 89 164,00
Setembro 81 170,00
Outubro 73 178,00
∑ 1 100 1 537,00
n = 10 ∑ y2 = 12 6970 ∑ x2 = 238 177 ∑ xy = 165 708
y = 110 x = 153,7
Fonte: Os autores.
1.o) Cálculo dos parâmetros:
b =
xy
n
n
=
165 708 1 537 . 1 100
10
2
2
–
–
–
x y
x
x
å( ) å( )
å
å( )
å 2238 177
1537
10
= 3 362
1 940,1
= 1,7329
2
–
– –
( )
a = b = 110 ( 1,7329) . 153,7 = 376,35y x– – –
2.o) Equação de regressão:
yˆ = a + bx = 376,35 1,7329x–
O resultado b = –1,7329 significa que, para cada unidade de variação positiva de preço (x), a quantida-
de procurada (y) decresce 1,7329 unidades.
Podemos, então, achar o erro padrão da estimativa se:
s =
y a y b xy
n 2
=
126 970 376,3468 . 1 100
e
2 – –
–
– –ååå (( 1,7329) . 165 708
10 2
= 143,91
8
= 4,24
s = 4,24e
–
–
Avaliamos, então, a dispersão dos pontos amostrais em torno da reta de regressão com o erro padrão
de estimativa s = 4,24e .
Figura 49 – Unidades vendidas e preço por unidade.
200
150
100
50
0
0 20
Un
id
ad
es
v
en
di
da
s
Preço por unidade
40 60 80 100 120 160140
214
Com a ajuda do erro padrão de estimativa se, podemos construir estimativas intervalares para avaliar
quão confiáveis são as estimativas pontuais obtidas. Suponha que, para cada valor fixo de x, os valores
amostrais correspondentes de y se distribuam normalmente em torno da reta de regressão, e que essas
distribuições normais tenham a mesma variância. A estimativa intervalar seguinte se aplica a um y indivi-
dual.
Dado um valor fixo x0, o intervalo de predição para um determinado y é:
yˆ – ε < y < yˆ – ε
A margem de erro ε é dada por:
ε = t s 1 + 1
n
+
n x x
n x x2
e
0
2
2 2a
–
–
( )
å( ) å( )
em que:
x0 representa o valor dado de x;
ta
2
tem n – 2 graus de liberdade;
se é o erro padrão da estimativa.
A distribuição t de Student, conhecida como distribuição t, é utilizada na
determinação de valores críticos denotados por ta
2
.
A tabela a seguir apresenta dados referentes a aluguel (em reais) de 10 casas e os anos de construção
do imóvel:
ALUGUEL (y) ANOs dE CONsTrUçãO (x)
450
200
180
500
320
265
320
580
150
290
2
6
10
4
6
8
5
3
12
9
A partir dos dados iremos construir um intervalo de predição de 95% para o valor do aluguel de um
imóvel com 7 anos de construção.
É necessário revisar os procedimentos para a obtenção da reta de regressão e das demais informa-
ções pertinentes.
Fonte: Os autores.
215
Estatística Aplicada à Gestão – Capítulo 4
1.o) Construímos a tabela auxiliar:
y x xy x2 y2
450
200
180
500
320
265
320
580
150
290
2
6
10
4
6
8
5
3
12
9
900
1 200
1 800
2 000
1 920
2 120
1 600
1 740
1 800
2 610
4
36
100
16
36
64
25
9
144
81
202 500
40 000
32 400
250 000
102 400
133 225
102 400
336 400
22 500
84 100
3 255 65 17 690 515 1 305 925
2.o) Determinamos o coeficiente de correlação:
rxy
2
2
2
2
=
xy
x . y
n
xx
n
y
y
n
–
– –
å( ) å( )
å
å( )
å
é
ë
ê
ê
ê
ù
û
ú
ú
ú
å( )
å
éé
ë
ê
ê
ê
ù
û
ú
ú
ú
= 0,842
3.o) Obtemos os parâmetros de regressão:
b =
xy
n
n
=
17 690 65 . 3 255
10
5152
2
–
–
–
x y
x
x
å( ) å( )
å
å( )
å
65
10
= 3 467,5
92,5
= 37,486
2
–
– –
( )
a = b = 325,5 ( 37,486) . 6,5 = 569,16y x– – –
4.o) Chegamos à reta de regressão (modelo ajustado):
yˆ = 569,16 37,486x–
O valor predito para x = 7 é ˆ ˆy = 569,16 37,486x y = 569,16 37,486 . 7 = 306,76– –Þ
5.o) Calculamos a média x dos dados:
x = x
n
= 65
10
= 6,5å
6.o) Calculamos a média y dos dados:
y =
y
n
= 3 255
10
= 325,5å
(Percebemos que
as variáveis têm
correlação.)
.
216
7.o) Calculamos o erro padrão da estimativa:
s =
y a y b xy
n 2
=
1 305 925 569,16 . 3 255 (
e
2 – –
–
– – –ååå 337,486) . 17 690
10 2
= 12 937,39
8
= 40,214
–
8.o) Calculamos a margem de erro:
Um grau de confiança de 95% que corresponda a a = 0,05 é a escolha mais comum porque propor-
ciona bom equilíbrio entre a precisão e a confiabilidade. Pela tabela, temos que ta
2
= 2,262 (interseção
da coluna 0,05 bilateral com a linha correspondente a n – 1 = 10 – 1 = 9 graus de liberdade) (ver tabela de
distribuição t na página 219).
Fazemos, então, x0 = 13 (porque queremos o intervalo de predição de y para x = 13).
ε = t s 1 + 1
n
+
n x x
n x x
= 2,262 . 40,214 a
2
e
0
2
2 2
–
–
( )
å( ) å( )
11 + 1
10
+
10 . 7 6,5
10 . 515 65
2
2
–
–
( )
( )
ε = 2,262 . 40,214 . 1,05 = 95,52
Com ˆ ,y = 306 76 e ε = 95,52, obtemos o seguinte intervalo de predição:
yˆ – ε < y < yˆ + ε
306,76 95,52 < y < 306,76 + 95,52
211,24 < y < 402,28
–
Então, para um imóvel de 7 anos de construção, temos 95% de confiança de que o verdadeiro valor
do aluguel esteja entre R$ 211,24 e R$ 402,28. O intervalo é grande porque o tamanho da amostra é pe-
queno.
Leia o artigo “Desvio padrão ou erro padrão: qual utilizar?”, publicado
no site http://apps.einstein.br/revista/arquivos/PDF/971-EC%20v6n3%20
p107-8.pdf. A autora do texto, Ângela Tavares Paes, buscou esclarecer
conceitos da estatística que aparecem comumente em artigos científi-
cos. Pela leitura do texto, é possível verificar a diferença entre os ter-
mos “desvio padrão” e “erro padrão” e sua importância no momento da
análise de dados.
Texto i
APLiCAbiLidAdE dOs MOdELOs dE rEGrEssãO
fazendo música com regressão múltipla
A Sony fabrica milhões de discos compactados em Terre Haute, Indiana. Em um estágio do pro-
cesso de fabricação, um laser expõe uma chapa fotográfica de modo que um sinal musical seja trans-
Leituras complementares
217
Estatística Aplicada à Gestão – Capítulo 4
ferido para um sinal digital codificado com 0 e 1s. Este processo foi analisado estatisticamente, para
identificar os efeitos de diferentes variáveis, como o tempo de exposição e a consistência da emulsão
fotográfica. Os métodos de regressão múltipla mostraram que, entre todas as variáveis consideradas,
quatro eram altamente significativas. O processo fotográfico foi ajustado para otimizar resultados com
base nas quatro variáveis críticas. Como resultado, a percentagem de discos defeituosos diminuiu,
mantendo-se a qualidade do som. O emprego de métodos de regressão múltipla levou a custos mais
baixos de produção e melhor controle do processo de fabricação.
A estatística no tribunal
Os proprietários de um complexo de cinco edifícios de apartamentos na cidade de Nova York
moveram uma ação em virtude de danos causados aos tijolos. O dano ocorreu quando a água foi
absorvida pela parede de tijolos, seguindo-se ciclos de congelamento e descongelamento, o que
fez com que a parede rachasse. Com cerca de 750.000 tijolos, não seria possível inspecionar um a
um, o que levou à adoção de métodos de amostragem. Estatísticos aplicaram métodos de regressão
para predizer o número total de tijolos danificados. As variáveis independentes incluíram qual dos
cinco edifícios foi utilizado, a orientação da parede, a altura, e se a parede se voltava para o pátio
interno ou era uma parede externa. A estimativa do dano total parece ter influenciado fortemente os
acordos [judiciais] finais.
TRIOLA, Mario F. Introdução à estatística. 7. ed. Rio de Janeiro: LTC, 1999.
Texto ii
UMA METOdOLOGiA dE PrEdiçãO EsTATÍsTiCA dE PrOJETOs bAsEAdA EM siMULAçãO
Segundo Pressman [2002], a imprecisão de estimativas é um dos problemas cruciais enfrentados
pela indústria de software. A baixa qualidade e produtividade, o atraso significativo na entrega de pro-
dutos (mais de 200%) e a extrapolação de custos previamente definidos (mais de 90%) representam a
realidade atual do desenvolvimento de software [Standish, 1995].
Paula [2003] afirma que muitos gerentes não sabem de fato estimar e realizam “previsões” com
base em sua experiência, muitas vezes insuficiente, com relação à equipe de desenvolvimento. Isso
pode ocasionar prejuízos financeiros à organização, além da insatisfação dos seus clientes.
Uma das maneiras de resolver este problema é dar condições para que a organização possa predi-
zer, de maneira confiável, as chances de um projeto futuro atingir seus objetivos dentro do prazo, custo
e qualidade definidos. A partir da percepção da execução do projeto, a negociação de prazo pode ser
feita com maior segurança, diminuindo o risco de atrasos.
Visando uma maior aproximação à realidade da organização, uma predição pode combinar a es-
timativa definida pelo gerente, com a natureza e disponibilidade atual de recursos da organização.
Isso pode ser feito através de simulação, que prediz a execução de um dado projeto de maneira mais
realista, através da utilização dos recursos humanos e financeiros disponíveis para o projeto, durante a
execução do cronograma previsto pelo gerente.
Além disso, devido à natureza dinâmica e estocástica de um ambiente de desenvolvimento de
software, a predição de um projeto deve considerar ainda o possível aumento no custo e tempo de
execução de tarefas, causado pela ocorrência de eventos, associados aos riscos de projeto.
218
Caso não seja considerado na simulação, esse aumento de tempo pode ser tratado estatisticamen-
te, pela utilização do histórico de projetos da organização. Neste caso, a predição é realizada com base
na capacidade e maturidade da organização com relação ao atraso, identificados durante a análise de
seu histórico de projetos. A partir daí, as organizações são incentivadas a aumentar a capacidade e
maturidade do processo de estimativas, já identificadas, fornecendo maior confiabilidade na predição
de seus projetos.
Segundo Oliveira [2006], a aplicação de práticas, definidas em modelos de qualidade como o
CMMI [Paulk et al., 1993], que visam aumentar continuamente a qualidade dos processos de uma
organização, acarreta as seguintes melhorias [...]:
Previsibilidade: o amadurecimento da organização ocasiona uma maior previsibilidade, ou seja,
menor será a diferença entre resultados esperados e realizados dos projetos, aumentando a
validade e eficácia de predições. Tal característica é comum em organizações no nível de ma-
turidade 2 do modelo CMMI.
Controle: organizações maduras conseguem um maior controle sobre seus projetos, resultando
em uma menor variabilidade dos resultados observados ao redor dos resultados estimados,
aumentando a confiabilidade das estimativas e a eficiência do processo. Tal característica co-
meça a se tornar comum em organizações no nível de maturidade 3 e prossegue no nível 4 do
CMMI.
Efetividade: o amadurecimento da organização aumenta ainda sua efetividade, ou seja, o au-
mento na qualidade dos resultadosestimados dos projetos, o que está ligado ao aumento da
capacidade do processo.
SOUZA, Mariane Moreira de. Uma metodologia de predição estatística de projetos baseada em
simulação. Dissertação, Universidade Federal de Pernambuco, Recife, 2007.
Disponível em: <http://www.cin.ufpe.br/~imppros/Publicacoes.html>. Acesso em: 17 set. 2009.
Você estudou:
Desvio total é a distância entre o ponto (x, y) e a reta horizontal que passa pela média amostral.
Desvio explicado é a distância entre o valor previsto de y e a reta horizontal que passa pela média
amostral. Desvio não explicado (ou resíduo) é a distância entre o ponto (x, y) e a reta de regres-
são.
O coeficiente de determinação é o valor da variação de y que é explicado pela reta de regressão.
O erro padrão da estimativa (s e) é uma medida das diferenças entre os valores amostrais observados e
os valores estimados através da reta de regressão.
síntese
SOUZA, Mariane Moreira de. Uma metodologia de predição estatística de projetos baseada em simulação. Dissertação,
Universidade Federal de Pernambuco, Recife, 2007. Disponível em: <http://www.cin.ufpe.br/~imppros/Publicacoes.
html>. Acesso em: 17 set. 2009.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
TRIOLA, Mario F. Introdução à estatística. 7. ed. Rio de Janeiro: LTC, 1999.
referências
219
Estatística Aplicada à Gestão – Capítulo 4
TAbELA dE disTribUiçãO T dE sTUdENT
Critical values of Student's t-distribution
Fonte: http://www.umanitoba.ca/statistics/faculty/johnson/tables/t-Dist.pdf.
v 0,9 0,5 0,4 0,2 0,1 0,05 0,02 0,01 0,001 v
1 .158 1.000 1.376 3.078 6.314 12.706 31.821 63.657 636.619 1
2 .142 .816 1.061 1.886 2.920 4.303 6.965 9.925 31.598 2
3 .137 .765 .978 1.638 2.353 3.182 4.541 5.841 12.924 3
4 .134 .741 .941 1.533 2.132 2.776 3.747 4.604 8.610 4
5 .132 .727 .920 1.476 2.015 2.571 3.365 4.032 6.869 5
6 .131 .718 .906 1.440 1.943 2.447 3.143 3.707 5.959 6
7 .130 .711 .896 1.415 1.895 2.365 2.998 3.499 5.408 7
8 .130 .706 .889 1.397 1.860 2.306 2.896 3.355 5.041 8
9 .129 .703 .883 1.383 1.833 2.262 2.821 3.250 4.781 9
10 .129 .700 .879 1.372 1.812 2.228 2.764 3.169 4.587 10
11 .129 .697 .876 1.363 1.796 2.201 2.718 3.106 4.437 11
12 .128 .695 .873 1.356 1.782 2.179 2.681 3.005 4.318 12
13 .128 .694 .870 1.350 1.771 2.160 2.650 3.012 4.221 13
14 .128 .692 .868 1.345 1.761 2.145 2.624 2.977 4.140 14
15 .128 .691 .866 1.341 1.753 2.131 2.602 2.947 4.073 15
16 .128 .690 .865 1.337 1.746 2.120 2.583 2.921 4.015 16
17 .128 .689 .863 1.333 1.740 2.110 2.567 2.898 3.965 17
18 .127 .688 .862 1.330 1.734 2.101 2.552 2.878 3.922 18
19 .127 .688 .861 1.328 1.729 2.093 2.539 2.861 3.883 19
20 .127 .688 .860 1.325 1.725 2.086 2.528 2.845 3.850 20
21 .127 .686 .859 1.323 1.721 2.080 2.518 2.831 3.819 21
22 .127 .686 .858 1.321 1.717 2.074 2.508 2.819 3.792 22
23 .127 .685 .858 1.319 1.714 2.069 2.500 2.807 3.767 23
24 .127 .685 .857 1.318 1.711 2.064 2.492 2.797 3.745 24
25 .127 .684 .856 1.316 1.708 2.060 2.485 2.787 3.725 25
26 .127 .684 .856 1.315 1.706 2.056 2.479 2.779 3.707 26
27 .127 .684 .855 1.314 1.703 2.052 2.473 2.771 3.690 27
28 .127 .683 .855 1.313 1.701 2.048 2.467 2.763 3.674 28
29 .127 .683 .854 1.311 1.699 2.045 2.462 2.756 3.659 29
30 .127 .683 .854 1.310 1.697 2.042 2.457 2.750 3.646 30
40 .126 .681 .851 1.303 1.684 2.021 2.423 2.704 3.551 40
60 .126 .679 .848 1.296 1.671 2.000 2.390 2.660 3.460 60
120 .126 .677 .845 1.289 1.658 1.980 2.358 2.617 3.373 120
∞ .126 .674 .842 1.282 1.645 1.960 2.326 2.576 3.291 ∞
α α
–4
–3
–2
–1
0
–5 –4 –3 –2 –1 0 1 2 3 4 5
ƒ
ƒ
a
2
a
21
2 2
– a 1
2 2
– a
220
Atividades do capítulo
As notas de Português e Matemática de 12 estudantes selecionados aleatoriamente entre os alunos do 1.
3.o ano de um colégio estão na tabela abaixo.
Calcule o coeficiente de correlação entre a) x e y.
Faça o diagrama de dispersão.b)
ALUNO POrTUGUês MATEMáTiCA
A
B
C
D
E
F
G
H
I
J
K
65
80
65
43
55
40
71
65
60
68
49
92
65
82
78
90
75
78
85
83
91
80
Colete dados sobre a altura (cm) e o peso (kg) de alguns indivíduos. Determine o coeficiente de corre-2.
lação entre as variáveis pesquisadas.
Os dados da tabela abaixo mostram as vendas de determinado produto (em unidades) e os gastos com 3.
propaganda na TV (em R$).
MEsEs VENdAs (y) GAsTOs COM PrOPAGANdA
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
550
230
378
427
173
397
538
298
469
285
493
512
1273
785
869
1005
584
905
1173
740
998
698
973
1305
Elabore um diagrama de dispersão.a)
Obtenha o coeficiente de correlação e interprete o resultado.b)
Uma empresa analisou os gastos com publicidade nos últimos anos e sua relação com o volume de 4.
vendas. Os resultados estão apontados na tabela a seguir, ambos expressos em mil reais.
Fonte: Os autores.
Fonte: Os autores.
221
Estatística Aplicada à Gestão – Capítulo 4
ANOs GAsTOs COM PUbLiCidAdE (x) VENdAs (y)
2008
2007
2006
2005
2004
2003
2002
2001
2
3
4
7
10
12
17
23
5
8
10
15
23
28
37
49
Organize uma tabela que facilite as somas.a)
Estime os parâmetros b) a e b.
Dê a equação de ajuste (equação de regressão).c)
Monte o diagrama de dispersão.d)
Determine o coeficiente de determinação, comentando sobre o resultado observado.e)
Uma empresa analisou a relação entre o número de horas (em milhões) de trabalho (x) e o número de 5.
acidentes ocorridos (y).
NúMErO dE HOrAs (x) NúMErO dE ACidENTEs (y) x2 y2 xy
4
6
10
13
17
20
11
13
17
18
22
24
Complete o quadro.a)
Determine os parâmetros b) a e b e monte a reta de regressão.
Determine e interprete o coeficiente de determinação.c)
De acordo com a propriedade dos mínimos quadrados, a reta de regressão minimiza a soma dos 6.
quadrados dos resíduos. Vimos que, com os dados emparelhados a seguir, a equação de regressão é
yˆ = 5 + 4x , e que a soma dos quadrados dos resíduos é 364.
Mostre que a equação yˆ = 8 + 3x resulta em uma soma de quadrados maior do que 364.
x 1 2 4 5
y 4 24 8 32
Os dados expressos na tabela referem-se às vendas (em milhares de unidades) e ao preço médio por 7.
unidade (em mil reais) de veículos 1.0 das concessionárias Fiat, Ford, GM, Volkswagen e Renault no
mês de setembro de 2008.
MArCA PrEçO (x) VENdAs (y)
Fiat 27,21 31,16
Ford 29,63 14,50
GM 27,33 29,70
Volkswagen 28,29 24,52
Renault 30,01 4,68
Fonte: Os autores.
Fonte: www.fundap.sp.gov.br/...workshop/Apresentação%20de%20Aurélio%20Santana.pdf.
222
Considerando esses dados, construa um intervalo de predição de 95% para um veículo cujo valor seja
R$ 29.0000,00. Complete a tabela para facilitar seus cálculos e siga os procedimentos descritos neste
capítulo.
x y xy x2 y2
27,21 31,16
29,63 14,50
27,33 29,70
28,29 24,52
30,01 4,68
Figura 50 – Venda de veículos 1.0 em função do preço.
Anotações
Preço
35
30
25
20
15
10
5
0
Ve
n
da
s
27 27,5 28 28,5 29 29,5 30 30,5
223
Estatística Aplicada à Gestão – Capítulo 4
224