Buscar

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 153 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 153 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 153 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

Disciplina: Análise Estatística
Aula 1: Conceitos Introdutórios em Estatística
Apresentação
Atualmente, qualquer pessoa pode ter acesso a uma enorme quantidade de informações
estatísticas. Os profissionais nas funções gerenciais e tomadores de decisões necessitam cada
vez mais de ter conhecimentos estatísticos, a fim de entender a informação e usá-la de forma
eficaz.
As análises estatísticas dependem de vários fatores como tamanho da amostra, tipo de dados a
serem coletados e do processo de obtenção das informações. Desde a definição dos objetivos a
serem alcançados até a análise dos resultados obtidos o processo estatístico deve ser bem
criterioso e cuidadoso, a fim de que não haja erros grosseiros que levem a resultados distorcidos.
De uma forma decisiva os métodos estatísticos estão inseridos nas mais diversas áreas de
conhecimentos e nos seus diversos setores, auxiliando nas mais importantes tomadas de
decisões e direcionando muitas melhorias de processos.
Objetivos
Compreender a aplicação da estatística da área de gestão;
Identificar os métodos científico, experimental e estatístico;
Conhecer as fases do método estatístico (coleta, crítica, apuração e apresentação e análise
dos dados).
Introdução à Análise Estatística
Atualmente, é fundamental o emprego da Estatística em quase todas as áreas do
conhecimento, todas as vezes que estiverem envolvidas informações na forma de dados
coletados em pesquisas ou de forma experimental.
Com o objetivo de alcançar uma melhoria dos processos tanto nas áreas industriais
como tecnológicas, as ferramentas estatísticas tem alcançado um papel
importantíssimo nesse cenário.
O que modernamente se conhece como Estatística:

Um conjunto de técnicas e métodos de pesquisa que, entre outros
tópicos, envolve o planejamento do experimento a ser realizado, a
coleta qualificada dos dados, a inferência, o processamento, a análise
e a disseminação das informações.
IBGE
 Gráficos. ( Fonte: Shutterstock / Por Scanrail1)
Estatística da Área de Gestão
Todo profissional hoje em dia deve estar ciente da importância da Estatística e ter
conhecimento de como utilizá-la, a fim de ter um lugar no mercado de trabalho com a
capacidade de lidar com as realidades atuais extremamente competitivas. Dentre várias
habilidades profissionais, vem crescendo em importância o desenvolvimento do
pensamento estatístico, tendo em vista as necessidades de todas as áreas de
conhecimentos de uma análise mais apurada durante os processos decisórios.
 Pódio de bonecos. ( Fonte: Shutterstock /
Por Percom)
A metodologia estatística está sendo empregada em várias
áreas de conhecimento, tais como nos setores
farmacêuticos, médicos e setores industriais diversos,
principalmente para melhoria da área de produção.
Controle de qualidade
Observa-se que o controle de qualidade foi criado como uma necessidade de resolver
problemas na redução de custos, no controle de perdas desnecessárias, na
uniformização e normalização da produção, auxiliando as empresas a controlarem,
melhor distribuírem e maximizarem os seus recursos, tornando-as assim mais
competitivas.
 Prancheta. ( Fonte: Shutterstock / Por nut3d)
Aplicação
Um interessante estudo experimental aplicado à pesquisa médica é o relato do primeiro
ensaio clínico planejado para comprovar a eficácia do AZT (zidovudina) no
prolongamento da vida de aidéticos. Os dados foram publicado por Fischl et al. (1987) e
posteriormente discutidos por Soares & Siqueira (1999, p.176-183).
O experimento considerou essencialmente o acompanhamento de 282 pacientes
aidéticos durante 24 semanas de tratamento, os quais foram aleatoriamente divididos
em dois grupos: o grupo de pacientes tratados com AZT (composto por 145 aidéticos) e
o grupo controle, composto por 137 aidéticos que receberam o placebo. A variável
resposta (desfecho) é a situação do paciente (sobrevivente ou não sobrevivente) após as
24 semanas de tratamento.
 Ensaio clínico. ( Fonte: Shutterstock / Por Gorodenkoff )
Número de sobreviventes e não sobreviventes após 24 semanas de tratamento com AZT
ou Placebo.
Grupo / Situação Vivo Morto Total
AZT 144 1 145
Placebo 121 16 137

Atenção
A avaliação da eficácia do AZT para o prolongamento da vida de aidéticos consiste
basicamente em comparar as proporções de sobreviventes dos dois grupos. Entre
os indivíduos tratados com AZT, a proporção de sobreviventes e 𝑃 = 0,993,
enquanto que no grupo de pacientes que receberam o placebo é 𝑃 = 0,883.
Aparentemente a proporção de sobreviventes é maior no grupo de pacientes tratados
com AZT, mas para estender este resultado para a população, é vital avaliar se as
diferenças observadas não são devidas ao acaso, mediante um teste de hipóteses. Neste
problema, a estratégia de análise adotada foi o teste de homogeneidade de populações,
baseado na estatística (lê-se “qui-quadrado”) de Pearson.
O valor calculado da estatística de teste foi igual a 15,087, cuja probabilidade de
significância associada (𝑃 , em inglês) é inferior a 0,0001. Este resultado evidencia
que a verdadeira proporção de pacientes aidéticos que sobrevivem após 24 semanas é
maior quando são tratados com AZT em relação aos não tratados (isto é, que recebem o
placebo).
Métodos
Método Científico
Há muito tempo que o homem faz descobertas importantes, que originaram muitos
dos conhecimentos atuais. Entretanto muitas dessas descobertas foram ao acaso,
ou em função de uma necessidade da época e muitas dessas descobertas não
seguiram um caminho, roteiro ou um método específico. Contudo hoje em dia os
métodos de observação, estudo e análise fazem parte da maioria dos aumentos de
conhecimentos atuais. Até mesmo os conhecimentos obtidos por descobertas ao
acaso são desenvolvidos com base em métodos específicos, que chamamos de
métodos científicos. Os métodos são as trilhas que nos permite chegar a um
objetivo, ou a um determinado resultado, sendo um conjunto de passos e
procedimentos que repetidos fornecem um resultado específico. Dentre os
métodos científicos destacamos o método estatístico e experimental.
𝐴𝑍𝑇
𝑃𝐿𝐴𝐶𝐸𝐵𝑂
𝑣𝑎𝑙𝑢𝑒
Método Experimental
Quando se realiza um experimento e se deseja analisar como se comportam seus
resultados ao se alterar algum dos elementos componentes do experimento, é
necessário manter constante os demais fatores (causas).Quando se usa este tipo
de pesquisa, faz-se uma análise do problema, montam-se as hipóteses
necessárias. A seguir procede-se a uma manipulação das variáveis referentes ao
fenômeno observado, alterando-as da melhor maneira possível. As alterações nas
variáveis tanto em quantidade, quanto em qualidade, permite o estudo das relações
de causas e efeitos do referido fenômeno em análise. Todo esse procedimento
experimental permite que se possa avaliar e controlar os resultados obtidos.
Pontos importantes do método experimental:
Indicar o objeto de estudo;
Determinar as variáveis independentes capazes de influenciar o fenômeno em
estudo;
Identificar as ferramentas de análise, controle e observação dos efeitos,
resultantes da manipulação das variáveis, sobre o objeto.
Método Estatístico
No nosso dia a dia, quando fazemos repetidas observações com relação a um
determinado sistema ou fenômeno específico, verificamos que os resultados
obtidos não são exatamente os mesmos. A esta fato podemos chamar de
variabilidade.
Como fazer para que essa variabilidade possa fazer parte da nossa tomada de
decisão?
Através da análise estatística, é possível descrever a variabilidade e entender quais
a fontes mais importantes, ou quais as de maior potencial de influência na
variabilidade do fenômeno.
No método estatístico, observando suas várias etapas, podemos considerar que a
mais importante muitas vezes não é a análise de dados. Podemos dizer que a
etapa que necessita de maior atenção e cuidado é o planejamento de como o
conjunto de dados será coletado. Um mau planejamento, ou mesmo uma coleta
feita de forma inapropriada pode acarretar em dados inúteis, de onde não se
consegue tirarnenhuma informação ou qualquer conclusão coerente.
No método estatístico, observando suas várias etapas, podemos considerar que a
mais importante muitas vezes não é a análise de dados. Podemos dizer que a
etapa que necessita de maior atenção e cuidado é o planejamento de como o
conjunto de dados será coletado. Um mau planejamento, ou mesmo uma coleta
feita de forma inapropriada pode acarretar em dados inúteis, de onde não se
consegue tirar nenhuma informação ou qualquer conclusão coerente.

Leitura
Antes de continuar os estudos, leia o texto Fases do Método Estatístico.
<galeria/aula1/anexo/fases_do_metodo_estatistico.pdf>
http://www.wydendigital.com.br/cursos_graduacao/gra256/galeria/aula1/anexo/fases_do_metodo_estatistico.pdf
Abusos da Estatística
Não é de hoje que ocorrem abusos com a Estatística. Assim é que, há cerca de um
século, o estadista Benjamin Disraeli disse:

Há três tipos de mentiras: as mentiras, as mentiras sérias e as
estatísticas.
Já se disse também que:

Os números não mentem; mas os mentirosos forjam os números.
E que:

Se torturarmos os dados por bastante tempo, eles acabam por
admitir qualquer coisa.
O historiador Andrew Lang disse que algumas pessoas usam a Estatística:

Como um bêbado utiliza um poste de iluminação – para servir de
apoio, e não para iluminar.
Todas essas afirmações se referem aos abusos da Estatística quando os dados são
apresentados de forma enganosa. Eis alguns exemplos das diversas maneiras como os
dados podem ser distorcidos:
Pequenas Amostras
Números Imprecisos
Estimativas por Suposição
Porcentagens Distorcidas
Cifras Parciais
Distorções Liberadas
Perguntas Tendenciosas
Gráficos Enganosos
Pressão do Pesquisador
Más Amostras
Texto retirado da apostila de Estatística, Shiguti, Wanderley Akira e Shiguti, Valéria A. C., Brasília 2006, página
4.
Os motoristas mais idosos são mais prudentes que os mais jovens?
A American Association of Retired People — AARP (Associação Americana de
Aposentados) alega que os motoristas mais idosos se envolvem em menor número
de acidentes do que os mais jovens. Nos últimos anos, os motoristas com 16-19
anos de idade causaram cerca de 1,5 milhões de acidentes em comparação com
apenas 540.000 causados por motoristas com mais de 70 anos, de forma que a
alegação da AARP parece válida. Acontece, entretanto, que os motoristas mais
idosos não dirigem tanto quanto os mais jovens.
Em lugar de considerar apenas o número de acidentes, devemos examinar também
as taxas de acidentes. Eis as taxas de acidentes por 100 milhões de milhas
percorridas: 8,6 para motoristas com idade de 16 a 19 anos; 4,6 para os com idade
de 75 a 79 anos; 8,9 para os com idade de 80 a 84 e 20,3 para os motoristas com
85 anos de idade ou mais. Embora os motoristas mais jovens tenham de fato o
maior número de acidentes. os mais velhos apresentam as mais altas taxas de
acidentes.
Texto extraído do livro: TIOLA, Mario E, Introdução à Estatística. 7 ed. Rio de Janeiro: LTC. 1999.
Referências
BRUNI, Adriano Leal; PAIXÃO, Roberto Brazileiro. Excel aplicado à gestão empresarial.
1.ed. São Paulo: Atlas, 2008.
CRESPO, Antônio Arnot. Estatística fácil. 19.ed. São Paulo: Saraiva, 2009.
KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. 4.ed. Porto
Alegre: Artmed, 2007.
Próximos Passos
Média aritmética e ponderada;
Mediana;
Moda;
Relação entre média, moda e mediana;
Quartis, decis e percentis;
Cálculo das medidas estatísticas em Excel.
Explore mais
Pesquise na internet sites, vídeos e artigos relacionados ao conteúdo visto.
Em caso de dúvidas, converse com seu professor online por meio dos recursos
disponíveis no ambiente de aprendizagem.
Disciplina: Análise Estatística
Aula 2: Revisão das Medidas de Tendência Central e de Posição
Apresentação
Na aula 1 foram compreendidas as fases do método estatístico como a coleta, crítica,
apuração, apresentação e análise dos dados.
Nesta aula, você aprenderá como as medidas de posição central (média aritmética e
ponderada, mediana e moda) são determinadas e como permitem uma melhor
compreensão dos dados de uma análise estatística. Aprenderá ainda as relações
entre média, moda e mediana. Abordaremos as medidas de ordenamento quartis,
decis e percentis. Veremos, por fim, como calcular as medidas estatísticas em
Microsoft Excel.
As medidas de posição central nos apontam a tendência de comportamento dos
dados, enquanto as separatrizes nos auxiliam na decisão de qual a cobertura dos
dados poderemos atingir ou selecionar.
Objetivos
Apresentar o cálculo das medidas de posição central e suas relações;
Conhecer as medidas de ordenamento quartis, decis e percentis;
Apresentar o cálculo das medidas estatísticas em Microsoft Excel.
Medidas de Posição Central
Em uma dada distribuição amostral, é possível fazer várias observações, no
intuito de entender o comportamento dos seus valores. Podemos, por
exemplo, tentar localizar a maior concentração de valores de uma
determinada distribuição. Entretanto, para que tenhamos parâmetros de
comparação entre as tendências características de cada distribuição, é
necessário introduzir conceitos que se expressem através de números.
Veremos então as medidas de posição . As serem estudadas são as
medidas de tendência central e as separatrizes.
Média aritmética
Moda
Mediana
Iremos estudar as separatrizes:
Quartis
Decis
Percentis
Medidas de Tendência Central
As medidas de tendência central são valores que, de maneira condensada,
trazem informações contidas nos dados estatísticos. É um valor que tende a
melhor representar um conjunto de números. Funcionam como um resumo,
1
file:///W:/2018.2/analise_estatistica_conv004/aula2.html
passando a ideia do comportamento geral dos dados. Representam um valor
central em torno do qual os dados se concentram e se distribuem, mostrando
se essa concentração ocorre no inicio, no meio ou no final da distribuição, ou
até mesmo se estão distribuídos de forma igual ao longo da amplitude
considerada.
Quando esses valores estão associados a uma população, chamamos de
parâmetros; quando estão ligados a uma amostra, são chamados de
estatísticas. Como o cálculo dos parâmetros é feito em cima de todos os
números, os parâmetros são valores constantes, fixos. Já os valores
estatísticos são obtidos dos dados selecionados da população, e como para
cada amostra temos dados diferentes, que irão influenciar no cálculo dos
valores estatísticos, esses valores não são fixos.
Média
Para uma distribuição de dados estatísticos a ser analisada, composta por
n valores 𝑥 , i = 1, 2 ..., n. É interessante, sempre que possível, ordenar
os dados de modo que 𝑥 seja o menor valor e 𝑥 seja o maior valor da
relação de valores da distribuição.
Muitas vezes existe uma concentração maior dos dados em torno de um
valor; outras vezes os dados estão equilibradamente distribuídos entre a
faixa de valores compreendido pela amplitude dos dados (Amplitude =𝑥 
- 𝑥 ). Esta informação quanto à distribuição muitas vezes é importante,
sendo calculada através da média aritmética, ou apenas média.
Outro tipo de média, também bastante utilizada, é a média aritmética
ponderada. A média ponderada é muito usada em situações em que os
dados são agrupados por frequência, ou em situações em que os dados
possuem importâncias diferentes, sendo representados na forma de
pesos.
Média Aritmética e Ponderada
𝑖
𝑖 𝑛
𝑛
1
A média aritmética é usada para distribuições simétricas, ou quase
simétricas, ou para distribuições que têm um único pico dominante. É
determinada somando-se todas as observações e dividindo-se pelo
número total de observações.
O cálculo da média se dá pela fórmula:
͞𝑥 = Média aritmética da amostra (𝜇 é usado para a população);
𝑥 = Valor representativo de cada variável de dados (𝑥 , 𝑥 , 𝑥 ,..., 𝑥 
);
n = Número total de itens da amostra (N é usado para a população).
Exemplo: Sabendo-se que a quantidade de garrafas de refrigerante
vendidas no mercado, durante uma semana, foi de 10, 14, 13,15, 16, 18
e 12 garrafas, temos para a venda média da semana:
Logo...
͞𝑥 = 14 litros
... É a média diária nesta semana.
A média ponderada ( ͞𝑥 para amostra e 𝜇 para população ) é usada em
várias ocasiões como por exemplo, em situações em que os dados
possuem níveis de importância diferentes dentro do grupo para os
diversos dados da distribuição, explicitando essa importância na forma de
peso 𝑤 .
μ  = =
∑ xi
i=1
N
N
+ +...+x1 x2 xn
N
μ  = =
∑ xi
i=1
n
n
+ +...+x1 x2 xn
n
𝑖 1 2 3 𝑛
= = = 14x 10+14+13+15+16+18+12
7
98
7
𝑤 𝑤
𝑖
= =xw
∑
i=1
n
xiwi
∑
i=1
n
wi
. + . +...+x1 w1 x2 w2 xn.wn
+ +...+w1 w2 wn
Exemplo: Um concurso de três etapas possui peso 2 na primeira etapa,
peso 1 na segunda etapa e peso 3 na terceira etapa. Qual a nota final do
candidato que tire 5,9 na primeira, 8,4 na segunda e 6,7 na terceira
etapa do concurso?
Moda
Denominamos moda o valor que ocorre com a maior frequência em uma
relação de dados. Muitas vezes é utilizada por ser a medida de posição
de mais rápida visualização.
A moda (Mo) é usada quando temos distribuições extremamente
assimétricas, ou nas situações irregulares em que dois ou mais pontos de
concentração de dados são verificados na série de dados. Ou até mesmo
nas situações em que se deseja eliminar os efeitos de valores extremos
que destoam da normalidade da série de valores.
A moda também pode ser designada como valor típico, valor dominante
ou norma.
Quanto à classificação modal, um conjunto pode ser considerado
unimodal, quando apresenta apenas uma moda.
Exemplo:
X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) → Mo = 6
(o valor de maior frequência)
Pode ser considerado bimodal quando possui duas modas.
= = = = 6, 7xw
∑
i=1
n
xiwi
∑
i=1
n
wi
11,8.+8,4.+20,1
2+1+3
40,3
6
Exemplo:
X = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) → Mo = 2 e Mo = 4
(os valores de maior frequência)
É considerada plurimodal ou multimodal quando apresenta mais de
duas modas.
Exemplo:
X = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) → Mo = 2, Mo = 3 e Mo = 4
(os valores de maior frequência)
Quando todos os valores apresentam a mesma frequência, o conjunto
é considerado amodal.
Exemplo:
X = (1, 2, 3, 4, 5, 6)
(não apresenta valor predominante)
Mediana
A mediana é o valor central da distribuição quando os dados estão
ordenados de forma crescente ou decrescente. Normalmente é usada
quando se deseja obter o ponto que divide a distribuição em duas partes
iguais, ou quando existem valores extremos que afetam a média de
forma acentuada. Também existe uma tendência a utilizar a mediana
quando o valor a ser analisado ou estudado é salário, ou para
informações que possam ser ordenadas de alguma forma, mas que não
possuem valores mensuráveis (cor, nomes etc.).
Exemplo:
1) Considere o conjunto de dados: X = (6, 2, 7, 10, 3, 4, 1, 12).
Determine a mediana.
2) Colocar os valores em ordem crescente ou decrescente: X = (1, 2, 3,
4, 6, 7, 10, 12);
3) Determinar a ordem ou a posição do elemento (E) da mediana:
4) Localizar a mediana e calcular o seu valor (para o ocaso de n par):
5) Determinar x4,5, sabendo que:
Comparação entre a Média, a
Mediana e a Moda
MEDIDA
DEPOSIÇÃO VANTAGENS DESVANTAGENS
USAR
QUANDO
MÉDIA
Reflete cada
valor observado
na distribuição
É influenciada por
valores extremos
• Deseja-se a
medida de posição
com a maior
estabilidade;
• Necessita de um
posterior
tratamento
algébrico.
MEDIANA
Menos sensível a
valores
extremos do que
a Média
Difícil de determinar
para grande
quantidade de dados
• Deseja-se o ponto
que divide o
conjunto em partes
iguais;
• Há valores
extremos que
afetam de maneira
acentuada e média;
• A variável em
estudo é o salário.
E = = 4, 5n+1
2
8+1
2
=  4 e    =  6  →  Med  =   = = 5x4 x5
+x4 x5
2
4+6
2
MODA
Maior
quantidade de
valores
concentrados
neste ponto
Não se presta à
análise Matemática.
Nem sempre a
distribuição possui
moda
• Deseja-se uma
medida rápida e
aproximada da
posição;
• A medida de
posição deve ser o
valor mais típico da
distribuição.
Relação entre a Média, a Mediana e
a Moda
Com essas três medidas de posição é possível determinar a assimetria da
curva de distribuição de frequência. A tabela de distribuição de frequências é
composta de uma coluna contendo os valores que compõem a relação de
dados e uma coluna com as correspondentes quantidades que cada valor
aparece na relação de dados. As medidas de assimetria complementam as
informações dadas pelas medidas de posição, a fim de permitir uma melhor
compreensão das distribuições de frequências. A mediana se localiza na
posição central da distribuição, devendo estar entre os valores da média e
moda e podendo até mesmo ser igual a ambas.
Nesta situação temos três casos possíveis:
1º Caso  Média = Mediana =Moda 
A curva da distribuição é
simétrica
2º Caso  Média < Mediana <Moda 
A curva da distribuição tem
assimetria negativa
3º Caso  Média > Mediana >Moda 
A curva da distribuição tem
assimetria positiva
O coeficiente de assimetria pode ser calculado pela fórmula do primeiro
coeficiente de Pearson, tornando mais fácil determinar se a assimetria da
distribuição é positiva ou negativa:

Atenção
No denominador da fórmula temos um símbolo que representa o desvio
padrão da distribuição. Quando for apresentado o estudo sobre as
medidas de dispersão, veremos mais detalhes sobre o cálculo do desvio
padrão e seu significado. No momento podemos adiantar que terá
sempre um valor positivo (ou seja, não é possível ocorrer desvio padrão
negativo). Assim sendo o que vai determinar o sinal da fração é o sinal
do numerador.
1º Caso
Média = Moda → ͞𝑥 - Mo = 0 → Assimétrica nula = Simétrica
2º Caso
Média < Moda → ͞𝑥 - Mo < 0 → Assimetria negativa
3º Caso
Média > Moda → ͞𝑥 - Mo > 0 → Assimetria positiva
Curva da distribuição é simétrica
Curva da distribuição é assimétrica positiva e negativa
Quando a distribuição de frequência é assimétrica à direita da curva,
dizemos que a distribuição tem assimetria positiva;
Quando a distribuição de frequência é assimétrica à esquerda da curva,
dizemos que a distribuição tem assimetria negativa.
Outro coeficiente de assimetria de Pearson indica se esta é forte ou fraca:
AS =
3(  − Md)x
S
0 < || AS || ≤ 0,15 → Assimetria Fraca
0,15 < || AS || ≤ 1 → Assimetria Moderada
|| AS || > 1 → Assimetria Forte
Quartis
Dividem a distribuição de frequência depois de ordenados em quatro
partes iguais, contendo a mesma quantidade de elementos. Nesta
divisão, o 1° quartil deixa 25% dos dados abaixo dele; o 2° quartil
coincide com a mediana e deixa 50% dos dados abaixo dele; o 3° quartil
deixa 75% dos dados abaixo dele.
A forma de determinação dos quartis é:
𝑄 = determina o elemento que separa o quartil i e o quartil seguinte +
1);
n = número de dados.
Se o índice
não é um valor inteiro, então se calcula a média entre os dados anterior
e posterior ao determinado.
1º quadril:
2º quadril:
3º quadril:
=  Qi X( + )in
4
1
2
𝑖
( + )in
4
1
2
=Q1 X( + )n
4
1
2
= =Q2 X( + )2n
4
1
2
X( + )n
2
1
2
Decis
Dividem a distribuição de frequência depois de ordenados em dez partes
iguais, contendo a mesma quantidade de elementos.
Mantendo o raciocínio usado para a determinação dos quartis, a forma de
determinação dos decis é:
Se o índice não é um valor inteiro, então se calcula a média entre os
dados anterior e posterior ao determinado.
Percentis
Dividem a distribuição de frequência depois de ordenados em 100 partes
iguais, contendo a mesma quantidade de elementos. Mantendo o
raciocínio usado para a determinação dos quartis, a forma de
determinação dos percentis é:
Se o índice não é um valor inteiro, então se calcula a média entre os
dados anterior e posterior ao determinado.
Exemplo usando Excel
Determine a média, a moda e a mediana da amostra abaixo, usando a
planilha do Excel:
=Q3 X( + )3n
4
1
2
=D1 X( + )in
10
1
2
=P1 X( + )in
100
1
2
44 48 53 54 56 56
56 57 60 60 62 63
63 63 63 65 66 67
68 68 69 69 70 71
72 74 77 78 80 81
82 85 90 93 95 95
97 100 106 107
Cálculoda Média:
Utilizando a função média (num1; num2; ...) e marcando a relação de
dados para calcularmos a média, teremos o resultado desejado.
Cálculo da Mediana:
Utilizando a função MED (num1; num2; ...) e marcando a relação de
dados para calcularmos a mediana, teremos o resultado desejado.
Cálculo da Moda:
Utilizando a função MODO (num1; num2; ...) e marcando a relação de
dados para calcularmos a moda, teremos o resultado desejado.
Resposta...
Notas
Medidas de posição 
São valores que vão orientar quanto à posição da distribuição dos dados numa
sequência ordenada.
Referências
BRUNI, Adriano Leal; PAIXÃO, Roberto Brazileiro. Excel aplicado à gestão
empresarial. 1.ed. São Paulo: Atlas, 2008.
CRESPO, Antônio Arnot. Estatística fácil. 19.ed. São Paulo: Saraiva, 2009.
KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. 4.ed. Porto
Alegre: Artmed, 2007.
1
Próximos Passos
Medidas de dispersão;
Amplitude total e interquartil;
Desvio médio, variância, desvio padrão e coeficiente de variação;
Cálculo das medidas de dispersão em Microsoft Excel.
Explore mais
Disciplina: Análise Estatística
Aula 3: Revisão das Medidas de Dispersão
Apresentação
Na aula 2, você compreendeu as formas de calcular as medidas de posição central e suas relações, bem como as
medidas de ordenamento.
Nesta aula, você verá como encontrar as medidas de dispersão, complementando a informação contida nas
medidas de tendência central. Com a ideia de amplitude total e interquartil, desvio médio, variância e desvio
padrão, bem como o coeficiente de variação, sendo possível ver o quanto os dados estão afastados da média.
Essa visão da dispersão permite ter um melhor entendimento do comportamento dos dados obtidos. Será visto
nesta aula como calcular as medidas de dispersão em Excel.
Na interpretação e análise dos dados estatísticos, é necessário conhecer como os dados se comportam e se
distribuem ao longo da relação em estudo.
Objetivos
Aprender a calcular as medidas de dispersão com a ideia de amplitude total e interquartil, desvio médio,
variância e desvio padrão, bem como o coeficiente de variação;
Aprender a calcular as medidas estatísticas em Excel.
Medidas de Posição Central
Em uma dada distribuição amostral é possível fazer várias observações no intuito de entender o
comportamento dos seus valores. Normalmente as medidas de posição não são suficientes para dar o
comportamento de uma distribuição de dados, sendo necessárias informações adicionais que permitam
uma melhor análise do fenômeno a ser estudado. É importante levar um ponto em consideração durante
a análise dos dados, a dispersão ou variabilidade. A dispersão ou variabilidade indica a maior ou
menor diferença entre os valores de uma variável, dado da distribuição, e sua medida de posição,
normalmente a média.
Estudaremos as seguintes medidas de dispersão:
1
Amplitude
2
Desvio médio
3
Variância e desvio padrão
4
Coeficente de variação
Amplitude
Amplitude Interquadril
Com o objetivo de determinar onde se situam os 50% valores centrais, pode calcular a Amplitude
Interquartil (IQR):
IQR = Q3 – Q1
Amplitude Total
Numa amostra de n valores ordenados, onde n é a quantidade total de dados, definimos como
amplitude total (R) a diferença entre os valores máximo (H) e mínimo (L) da relação.
R = x – x = H – L

Exemplo
Amplitude total: sabendo-se que a quantidade de garrafas de refrigerantes vendidas no mercado,
durante uma semana, foi de 10, 12, 13, 14, 15, 16 e 18 garrafas, temos para a amplitude total:
n = 7;
H = x = x = 18;
L = x = x = 10
Amplitude total: R = 18 – 10 = 8
Desvio Médio Absoluto
O desvio (d ) mede a diferença entre cada valor e a média aritmética. O desvio médio absoluto (MAD)
é obtido dividindo o somatório dos módulos de cada desvio pela quantidade de dados (n para amostra e
N para população).
 (Amostra)
 (População)
A soma de todos os desvios é igual à zero:
A amplitude total, pela influência dos valores extremos, que muitas vezes podem não representar o
comportamento da distribuição dos dados, são considerados instáveis.
Variância
A variância é uma medida estatística que não recebe essa influência, pois leva em consideração
todos os valores no seu cálculo. Ela é a média aritmética dos quadrados dos desvios:
máx mín
máx 7
mín 1
i
MAD =   =  
∑| |di
n
∑| |xi − x̄
n
MAD =   =  
∑| |di
N
∑| |xi −μ
N
∑   =  ∑   −   =  0di xi x̄
 (População)
Quando o cálculo é feito em cima da amostra, troca-se o denominador n por (n – 1):
 (Amostra)
Simplificação
A fim de simplificar os cálculos e evitar os arredondamentos causados pelo fato da média ser
normalmente fracionário, pode-se usar a igualdade:
Com a simplificação a variância fica na forma:
 (População)
 (Amostra)
Os dados podem ser agrupados numa tabela de distribuição de frequência ou numa tabela de distribuição
por classes:
Dados agrupados sem intervalos de classe
Para os dados agrupados numa tabela de distribuição de frequência a variância é calculada da
seguinte forma:
 
ou
 
= ∑     =  σ2 ( )di
2
n
∑ (  −  )xi x̄
2
n
=   =  S2
∑ ( )di
2
n−1
∑ (  −  )xi x̄
2
n−1
∑  (   −   = ∑   −xi x̄)
2
x2i
(∑ )xi
2
n
=    (∑   − )σ2 1
n
x2i
(∑ )xi
2
n
=    (∑   − )s2 1
n−1 x
2
i
(∑ )xi
2
n
=     =  σ2
∑  . ( )di
2 Fi
2
∑  . (  −  )xi x̄
2 Fi
n
Dados agrupados com intervalos de classe
Para os dados agrupados numa tabela de distribuição por classes as fórmulas são as mesmas:
Entretanto:
x = ponto médio das classes;
L = Limite superior da classe;
L = Limite inferior da classe.
 
O fato de a variância ser calculada a partir dos quadrados dos desvios gera um número com a
unidade quadrada em relação a variável em estudo, que é um inconveniente. Esse inconveniente
criou a necessidade de uma nova variável denominada desvio padrão definida como a raiz
quadrada da variância e representada por s (amostra) e σ (população), com mais utilidade e
interpretação prática.

Leitura
Clique aqui <galeria/aula3/anexo/a03_06_01.pdf> para ler mais sobre Dados não
Agrupados e Agrupados Sem Intervalos de Classe.
= [∑(  .   )− ] = [n .  ∑(  .   )− ] σ2 1
n
x2i Fi
(∑  .  )xi Fi
2
n
 1 
n2
x2i Fi (∑  .    )xi Fi
2
= [∑(  .   )− ] = [n .  ∑(  .   )− ] s2 1
n−1 x
2
i Fi
(∑  .  )xi Fi
2
n
 1 
n . (n−1)
x2i Fi (∑  .    )xi Fi
2
= [n .  ∑(  .   )− ] σ2 1
n2
x2i Fi (∑  .    )xi Fi
2
= [n .  ∑(  .   )− ] s2 1
n . (n−1)
x2i Fi (∑  .    )xi Fi
2
=xi
 − Ls Li
2
i
s
i
σ =      e     s =σ2
−−
√ s2
−−√
file:///W:/2018.2/analise_estatistica_conv004/galeria/aula3/anexo/a03_06_01.pdf
Coeficiente de Variação
O coeficiente de variação mede a homogeneidade dos dados, ou seja, mostra a magnitude do desvio
padrão em relação à média dos dados como porcentagem. Permitindo caracterizar a dispersão dos dados
em função do valor médio. Quanto maior o valor do coeficiente de variação, menos homogêneo será o
conjunto.
 (População)
 (Amostra)
Quando é necessário comparar duas amostras com média e desvio padrão diferentes, podemos comparar
os coeficientes de variação. Quanto maior o valor, menor será a homogeneidade da distribuição, ou seja,
apresenta o maior grau de dispersão.
Tomemos os resultados das medidas de altura e pesos de um mesmo grupo de pessoas tiradas de uma
sala de aula.
s
ALTURA 176 cm 5,0 cm
PESO 69kg 2,0kg
A fim de comparar a dispersão das duas relações de medidas, utilizaremos o coeficiente de dispersão.
Podemos observar que neste grupo de pessoas, a relação de distribuição das alturas apresenta
um menor grau de dispersão do que os pesos.
CV = × 100 σ 
μ
CV = × 100 s 
x̄
C = = 0, 0284VALT
 5 
176
C = = 0, 0290VPESO
 2 
69
Usando o Excel
Seja uma distribuição amostral composta de sete números (n), representando o tempo (em minutos) de
execução de uma prova.
X = (85, 86, 88, 88, 91, 94, 104)
Usando as fórmulas prontas do Microsft Excel para determinar a variância e o desvio padrão da amostra e
da população, teremos:
O comando VARP(NUM1;NUM2...) calcula a variânciada população, bastando marcar as células que
contêm os dados.
Com o comando VARA(NUM1;NUM2;...) calcula a variância da amostra, bastando marcar as células
que contêm os dados com o mouse, ou indicar o intervalo na função como mostrado no exemplo.
População: DESVPADP(NUM1;NUM2;...)
Amostra: DESVPAD(NUM1;NUM2;...)
Referências
BRUNI, Adriano Leal; PAIXÃO, Roberto Brazileiro. Excel aplicado à gestão empresarial. 1.ed. São Paulo:
Atlas, 2008.
CRESPO, Antônio Arnot. Estatística fácil. 19.ed. São Paulo: Saraiva, 2009.
KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. 4.ed. Porto Alegre: Artmed, 2007.
Próximos Passos
Análise dos dados através de gráficos;
Uso do Excel 2007 para a montagem dos gráficos (de colunas, de barras, de linhas, de dispersão e de
Pareto) a partir de uma relação de dados.
Disciplina: Análise Estatística
Aula 4: Gráficos Estatísticos no Microsoft Excel
Apresentação
Nas aulas 2 e 3, você viu como se calculam as medidas de posição, de tendência
central e de dispersão.
Nesta aula, faremos as análises dos dados através dos diversos tipos de gráficos,
capazes de transmitir o comportamento dos dados de uma análise estatística, usando
o Excel 2007, a partir de uma relação de dados contidos em uma tabela. Em relação
às versões anteriores, o Excel tornou os gráficos mais suaves e melhores, porém sem
acrescentar tipos novos.
Na interpretação e análise dos dados estatísticos, é necessário, como já vimos,
conhecer como os dados se comportam e se distribuem ao longo da relação em
estudo. Veremos isso através da montagem de gráficos padrões e formatando de
acordo com a necessidade desejada.
Objetivos
Conhecer o Excel 2007;
Entender a montagem dos gráficos (de colunas, de barras, de linhas, de
dispersão e de Pareto).
Inserindo Gráficos no Excel
Para que um gráfico seja inserido no Excel, é necessário que os dados que se
deseja analisar também estejam contidos na planilha.
Vejamos como seria ilustrar graficamente a venda de camisas por cor:
Primeiramente, insira os dados na planilha do Excel, digitando conforme
imagem acima.
Após os dados devidamente digitados, selecione o conjunto de dados e
utilize o recurso Gráficos do menu Inserir (mostraremos a seguir).
Clique em Inserir, como mostrado
Para ilustrar, marque a opção gráfico de colunas.
Em seguida, marque a opção gráfico de colunas 2D agrupadas (a
primeira opção da esquerda).
O gráfico deverá ficar desta forma.
Formatando o Gráfico
É preciso formatar o gráfico criado, pois ele não possui informação de
cabeçalho, rótulos nos dados, nome dos eixos etc.
Clicando no gráfico e mantendo-o marcado, veremos na opção
Ferramentas de gráfico os três novos menus. Com a opção Design
marcada...
... Clicando em Alterar tipo de gráfico (primeiro ícone da esquerda), é
possível alterar o modelo do gráfico, escolhendo alguma das opções do
lado direito da janela.
Em situações que se deseja alternar os dados do eixo vertical e o eixo
horizontal, pode-se utilizar a opção Alternar linha/coluna (terceiro ícone).
Ou em situações em que é necessário diminuir, ou alterar de alguma
forma a entrada de dados do gráfico, utiliza-se selecionar dados (quarto
ícone) e marcam-se com o mouse os dados que deseja apresentar no
gráfico.
Automaticamente esses dados serão colocados na caixa de texto
Intervalo de dados do gráfico, conforme a imagem acima.
Caso queira alterar a forma como o gráfico se apresenta, mudando o
layout das colunas, basta escolher a opção layout de gráfico. Nesta
opção, o Excel lhe apresentará 11 tipos de colunas.
Caso queira alterar as cores de fundo, das colunas e o gradiente das
cores, basta escolher a opção Estilos de gráfico, conforme é mostrado na
figura. Esta opção torna o gráfico mais apresentável e com um estilo
mais profissional.
Movendo o Gráfico
O gráfico pode ser colocado na mesma planilha onde estão inseridos os dados,
ou em uma planilha diferente, caso não haja espaço para colocá-lo. Para fazer
essa escolha, basta clicar na opção local, ainda na opção design.
Escolhendo a opção Nova planilha, o Excel vai inserir uma planilha com o
nome especificado na caixa de texto e moverá o gráfico para esta planilha
criada. Escolhendo a opção Objeto em, o Excel vai inserir o gráfico em uma
das planilhas existentes no arquivo e que estarão listadas na caixa de opções
ao lado da opção escolhida, conforme mostrado na figura. Esta mudança pode
ser desfeita refazendo o processo novamente desde o início.
Menu Layout
O menu Layout possui as seguintes opções:
Seleção Atual
A primeira opção, Seleção atual, permite formatar uma parte do gráfico
dentre as opções relacionadas na caixa, utilizando a janela drop-down.
Como exemplo, vamos alterar o eixo vertical.
Escolha a opção Formatar seleção.
Abrirá a caixa e marcaremos o mínimo como fixo e 0,0 na caixa de texto,
o máximo como fixo e 35 na caixa de texto, conforme a figura.
Gráfico deverá ficar assim. O mínimo deve estar em fixo e 0,0, senão o
modo automático colocará fora do zero. É o que acontece caso
coloquemos o máximo em 28. O modo automático passará o mínimo
para -2,0. Após fazer o teste, aperte as teclas <ctrl> + <z> ao mesmo
tempo e o gráfico retornará à situação anterior. Ou refaça o processo e
coloque na situação anterior.
Com a opção Inserir, é possível colocar imagens (figuras e fotos), formas
(setas, linhas, figuras geométricas etc.) ou caixas de texto.
Com a opção Rótulo, é possível inserir e formatar os vários rótulos do gráfico,
como rótulo dos dados, título do gráfico e dos eixos, a legenda e a tabela de
dados.
Vamos inserir no gráfico um título com o nome de Vendas por cores.
Na opção Título de gráfico e escolhendo a opção Acima do gráfico,
aparecerá a caixa de texto onde se pode escrever o título desejado. Ao
lado, o resultado.
Caso deseje um título melhor elaborado, escolha o item Mais opções de
títulos, onde é possível mesclar várias possibilidades e chegar a um título
da forma.
Escolha a opção para inserir título abaixo do eixo horizontal e inclua o
texto CORES.
Escolha opção para inserir título do eixo vertical no modo vertical e inclua
o texto VENDAS. Ao lado, o resultado.
A próxima ação será retirar a legenda, pois no caso, ela não vai ajudar.
Escolha a opção Legenda e marque a opção Nenhuma (desativar
legenda). O resultado é mostrado ao lado.
Rótulos
As duas seleções seguintes são referentes aos dados que podem ser colocados
no gráfico, opção Rótulo de dados, ou na forma de tabela, opção Tabela de
dados.
Tabela de dados
Rótulo de dados
Eixos
Continuando nosso exemplo e dando uma breve passada nas opções que
ainda faltam:

Selecionando Eixos, é possível alterar os eixos horizontal e vertical. Para o
nosso exemplo, mantenha selecionada a opção do eixo horizontal da esquerda
para a direita. No eixo vertical, escolha a opção Eixo padrão. No caso de
necessidade de outras alterações nos eixos, é possível usar o comando Mais
opções de eixo vertical principal, que também vale para o eixo horizontal.
As linhas de grades em um gráfico têm a finalidade de orientar a posição de
um valor em comparação aos outros valores do gráfico, principalmente neste
exemplo, se as alturas das colunas fossem próximas. Quando se utilizam
rótulos, as linhas de grades podem ser alteradas.

Comentário
Em nosso exemplo, utilizaremos para o eixo horizontal as linhas de
grades principais, que são as mais utilizadas. Para o eixo vertical será
mantida a opção Nenhuma.
Plano de Fundo, Análise e
Propriedades
Plano de Fundo
A opção Plano de fundo não será usada no nosso exemplo, ou seja, não será
alterado o plano de fundo do gráfico.
Análise
A opção Análise é bastante útil quando se deseja identificar a tendência dos
resultados do gráfico para entender o que acontece com os dados, ou para
regressões lineares que são muito usados em estudos estatísticos.
Propriedades
A opção Propriedades permite alterar o nome do gráfico. É útil quando
temos mais de um gráfico em uma mesma planilha e podemos identificar maisfacilmente o gráfico pelo nome.
Menu Formatar
As duas seleções seguintes são referentes aos dados que podem ser colocados
no gráfico, opção Rótulo de dados, ou na forma de tabela, opção Tabela de
dados.
Seleção Atual
A opção Seleção atual já foi vista.
Estilo de Forma
A opção Estilo de forma permite a formatação da moldura e do fundo do
gráfico.
Estilo de WordArt
A opção Estilo de WordArt permite a formatação total da fonte.
Organizar
A opção Organizar é utilizada quando existem outras figuras ou objetos
na planilha e é preciso alternar a visibilidade do objeto, trazendo-o para
trás ou para a frente.
Tamanho
A opção Tamanho permite a formatação da largura e altura.

Comentário
Vamos colocar: Altura, 8 cm e Largura, 13cm.
Resultado...
Usamos um exemplo para apresentar os dados de uma tabela. O Excel possui
diversas alternativas que podem ser utilizadas de acordo com o tipo de dados
e análise a ser realizada. Dentre os principais, temos no menu Inserir:
Gráfico de Colunas
São muito usados em comparações feitas em períodos diferentes de um
mesmo item, ou diferentes itens em um único período de tempo.
No exemplo anterior, utilizamos o tipo Coluna 2D. Os outros tipos de
gráficos têm a vantagem de que os rótulos dos eixos podem ficar mais
visíveis. A opção Colunas 3D 100% empilhadas apresentará o gráfico
na forma de porcentagem.
Gráfico de Linhas
Este tipo de gráfico é utilizado para apresentar evoluções temporais de
um ou mais itens, tomando o cuidado de que os intervalos de tempos
devem ser iguais. No mesmo gráfico podem ser colocadas várias séries
de dados, que são distinguidas pelas cores das linhas.
Gráfico de Dispersão
Este tipo de gráfico é muito utilizado para analisar a relação entre duas
variáveis eu um eixo xy. Possui os subtipos de apenas marcadores, linhas
suaves com marcadores ou apenas linhas suaves.
Gráfico de Pareto
O Gráfico de Pareto, também chamado de Diagrama de Pareto, é do tipo
colunas, ordenadas na forma decrescente e complementadas com uma
linha, indicando a frequência acumulada. Na verdade, trata-se de um
gráfico de colunas e linha em dois eixos. Este gráfico pode ser usado
para dados quantitativos agrupados em classe, ou na forma de ralação
(não agrupados), bem como em dados nominais ou categóricos.
Clique aqui <galeria/aula4/anexo/grafico_pareto.pdf> e veja
como adaptar o exemplo anterior para utilizarmos o Gráfico de Pareto.
Referências
BRUNI, Adriano Leal; PAIXÃO, Roberto Brazileiro. Excel aplicado à gestão
empresarial. 1.ed. São Paulo: Atlas, 2008.
CRESPO, Antônio Arnot. Estatística fácil. 19.ed. São Paulo: Saraiva, 2009.
KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. 4.ed.
Porto Alegre: Artmed, 2007.
Próximos Passos
Significado de curtose e das medidas de assimetria;
Cálculo dos seus coeficientes e interpretação dos resultados.
Explore mais
file:///W:/2018.2/analise_estatistica_conv004/galeria/aula4/anexo/grafico_pareto.pdf
Discplina: Análise Estatística
Aula 5: Medidas de Assimetria e de Curtose
Introdução
Na aula 4, fizemos as análises dos dados por meio de gráficos capazes de transmitir o
comportamento dos dados de uma análise estatística, utilizando o Excel 2007.
Nesta aula, veremos como encontrar as medidas de assimetria e de curtose,
complementando a informação contida nas medidas de posição. Com a ideia de
média, moda e mediana, bem como o de quartis e percentis, você verá o quanto na
curva de distribuição dos dados a média está deslocada em relação à mediana.
Também verá o grau de achatamento de uma distribuição em relação à curva normal.
A curva normal corresponde a uma distribuição teórica de probabilidade.
Veremos o significado e a forma de determinar os coeficientes de assimetria de
curtose, bem como a interpretação dos seus resultados.
Objetivos
Apresentar o significado das medidas de assimetria e de curtose, bem como
determinar seus coeficientes;
Compreender como interpretar os resultados de assimetria e de curtose.
Medidas de Assimetria
Nas aulas anteriores, vimos a natureza da assimetria, isto é, quando a curva
de frequência se afasta da posição de simetria, sendo simétrica quando a
média e a moda coincidem, ou seja, possuem o mesmo valor.
A curva de uma distribuição simétrica tem por
característica que o valor máximo encontra-se no ponto
central da distribuição. Desta forma, os pontos
equidistantes do centro possuem a mesma frequência.
Quando se faz um levantamento estatístico, dificilmente encontramos, na
prática, uma distribuição simétrica. O que ocorre, em levantamentos de dados
reais, são medidas mais ou menos assimétricas em relação à frequência
máxima.
A distribuição assimétrica à esquerda ou negativa ocorre quando o valor da
moda é maior do que a média. Logo, a distribuição assimétrica à direita
ou positiva ocorre quando a moda é menor do que a média.
Desta forma, a diferença entre a moda e a média poderá definir o tipo de
assimetria.
Calculando o valor da diferença
x = Mo
x - Mo = 0 → Assimetria nula ou distribuição simétrica.
x = Mo < 0 → Assimetria negativa ou à esquerda.
x - Mo > 0 → Assimetria positiva ou à direita.
Exemplos
Logo, usando a fórmula (x - Mo), tem-se:
Distribuição A
5 – 5 = 0 → Assimetria nula ou distribuição simétrica.
x = 5; 
Md = 5; 
Mo = 10; 
S = 5,0912;
Distribuição B
5,375 – 6,6 = – 1,225 → Assimetria negativa ou à esquerda.
x = 5,375; 
Md = 5,75; 
Mo = 6,6; 
S = 5,5088;
Distribuição C
4,75 – 4,5 = 0,25 → Assimetria positiva ou à direita.
x = 4,75; 
Md = 4,5; 
Mo = 3,5; 
S = 4,8389;
Coeficiente de Assimetria
A fórmula x = Mo não permite fazer comparações entre duas distribuições
com relação ao seu grau de assimetria. Desta forma, o coeficiente de
assimetria de Pearson é muito utilizado para verificar o grau de assimetria das
curvas de distribuição, definido como:
Se o resultado for:
0,15 <| As |< 1 → Assimetria moderada.
| As |> 1 → Assimetria forte.
Considerando o exemplo anterior, os coeficientes de Pearson para as
distribuições A, B e C são:
Distribuição A
Simetria.
Distribuição B
Assimetria negativa ou à esquerda (assimetria moderada).
Distribuição C
As =
3( −Md)x̄
s
A =SA
3(5−5)
5,0912
A = = = 0, 204SB
3(5,375−5,75)
5,5088
−0,375
5,5088
Assimetria positiva ou à direita (assimetria moderada).
Medida de Curtose
Quando a distribuição apresenta uma curva de frequência com dados mais
concentrados em torno da média do que a curva normal, ela chama-se
leptocúrtica.
A curva normal, tomada por base para classificação do achatamento das
distribuições de frequências, recebe o nome de mesocúrtica.
A = = = 0, 155SC
3(4,75−4,5)
4,8389
0,25
4,8389
Quando a distribuição apresenta uma curva de frequência com dados mais
dispersos em relação à média do que na curva normal, essa distribuição
chama-se platicúrtica.
Coeficiente de Curtose
A fórmula que determina a medida da curtose, isto é, o grau de achatamento
da curva, é:
Essa fórmula é denominada como coeficiente percentílico de curtose.
O coeficiente de curtose define o grau de achatamento da curva, da seguinte
forma:
C = 0,263 
Curva mesocúrtica.
C < 0,263 
Curva leptocúrtica.
C > 0,263 
Curva platicúrtica.
C = Q3−Q1
2( − )P90 P10
A análise conjunta da assimetria e curtose da distribuição de frequências pode
fornecer informações importantes sobre os dados obtidos, que muitas vezes
não aparecem na simples observância dos valores obtidos.
A assimetria nos mostra o quanto a média se desloca para a direita ou para a
esquerda, mostrando, também, como algumas condições impostas sobre a
população podem influenciar o resultado e deslocamento da média.

Atenção
O grau de curtose indica se a distribuição está mais ou menos
concentrada, fazendo com que a curva esteja mais ou menos achatada
em relação à curva normal (curva mesocúrtica), padrão de referência
para a classificação do grau de curtose.
Atividade
Sejam as seguintes medidas, relativas às distribuições de frequências A,
B e C:
DISTRIBUIÇÕES
A 930 809 1020 780
B 82,4 65,8 88,6 57,0C 46,5 29,7 51,2 20,9
Utilizando a fórmula denominada coeficiente percentílico de curtose,
determine os graus de curtose para determinar o tipo de curva em cada
uma das distribuições:
Distribuição A
 Curva Mesocúrtica
 Curva Platicúrtica
 Curva Leptocúrtica
Distribuição B
 Curva Mesocúrtica
 Curva Platicúrtica
 Curva Leptocúrtica
Distribuição C
 Curva Mesocúrtica
 Curva Platicúrtica
 Curva Leptocúrtica
Referências
BRUNI, Adriano Leal; PAIXÃO, Roberto Brazileiro. Excel aplicado à gestão
empresarial. 1.ed. São Paulo: Atlas, 2008. 
CRESPO, Antônio Arnot. Estatística fácil. 19.ed. São Paulo: Saraiva, 2009. 
KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. 4.ed.
Porto Alegre: Artmed, 2007
Próximos Passos
Probabilidade e seus principais teoremas;
Significado e aplicação dos eventos complementares, eventos independentes e
eventos mutuamente exclusivos.
Disciplina: Análise Estatística
Aula 6: Probabilidade
Apresentação
Nesta aula, abordaremos a definição de probabilidade, faremos a exposição de seus
principais teoremas e mostraremos o significado e aplicação dos eventos
complementares (p + q = 1 → q = 1 – p) dos eventos independentes, também
conhecido como regra do “e” (p = PA x PB); bem como os eventos mutuamente
exclusivos, também conhecidos como regra do “ou” (p = PA + PB). Definiremos,
ainda nesta aula, o conceito de experimento aleatório e do espaço amostral, sua
finalidade, utilização e aplicação no campo da teoria da probabilidade em Estatística.
Quando falamos de probabilidade, a ideia é identificar a possibilidade de ocorrência
de um determinado fato de interesse, em situações onde existem inúmeros casos
possíveis e quando não é possível determinar com precisão o real valor do evento.
Assim, trabalhamos com chances ou probabilidades.
Objetivos
Conhecer a definição de probabilidade e seus principais teoremas;
Aprender o significado e aplicação dos eventos complementares, dos eventos
independentes, bem como dos eventos mutuamente exclusivos;
Entender a definição dos conceitos de experimento aleatório e de espaço
amostral, assim como suas finalidades, utilizações e aplicações no campo da
teoria da probabilidade em Estatística.
Estatística
A maioria dos assuntos de que trata a Estatística tem uma natureza aleatória
ou probabilística. É esta a importância do estudo dos conhecimentos
fundamentais do cálculo da probabilidade, além de ser fundamental no estudo
da Estatística Inferencial ou Indutiva.
Experimento Aleatório
É qualquer processo aleatório capaz de produzir observações e que possa se
repetir indefinidamente no futuro sob as mesmas condições. Um experimento
aleatório apresenta variações nos resultados, o que faz com que seus
resultados a priori não sejam determinados antes que tenham sido realizados.
É possível, entretanto, indicar todos os seus resultados possíveis, ou seja, as
suas probabilidades. É na verdade qualquer processo capaz de gerar um
resultado incerto ou casual.
O experimento aleatório apresenta três características, que possibilitam
calcularmos uma probabilidade, são elas:
Característica 1
Cada experimento pode ser repetido indefinidamente sob as mesmas
condições, n vezes (n ∞).
Característica 2
Embora não se possa prever a priori que resultados ocorrerão, pode-se
descrever o conjunto de resultados possíveis.
Característica 3
À medida que se aumenta o número de repetições, surgirá certa
regularidade dos resultados, isto é, haverá uma estabilidade na
ocorrência da frequência relativa de um particular resultado.

Comentário
Assim, observamos que todo experimento que apresentar resultados
diferentes quando repetido nas mesmas condições iniciais é considerado
um experimento aleatório, e a variabilidade dos seus resultados deve-
se ao acaso. A tudo isto liga-se a incerteza, que é a chance de ocorrência
do resultado de interesse.
Temos como exemplo os operários que trabalham no setor de produção
de determinada empresa. Sabe-se que neste setor trabalham oito
operários. Um experimento ao acaso seria escolher de forma aleatória
um dos operários. Pode-se considerar como evento de interesse o sexo
do operário escolhido.
Espaço Amostral
Cada experimento aleatório corresponde, normalmente, a inúmeros resultados
possíveis. Chamamos de espaço amostral ou conjunto universo o seu
conjunto de possibilidades, isto é, o conjunto formado por todos os possíveis
resultados do experimento, geralmente denominado S ou Ω (letra grega que
se lê: “ômega”). Definimos por n(S) como sendo o número de elementos do
conjunto S, ou seja, o número de resultados possíveis do experimento.
1
Finito
Número limitado de elementos. 
Ex.: S = {1, 2, 3, 4, 5, 6}
2
Infinito
Número ilimitado de elementos, e pode ser subdividido em: Finito e Infinito.
3
Enumerável
Quando os possíveis resultados puderem ser postos em concordância
biunívoca com o conjunto dos números naturais (N) (caso das variáveis
aleatórias discretas).
4
Não Enumerável
Quando os possíveis resultados não puderem ser postos em concordância
biunívoca com o conjunto dos números naturais (caso das variáveis aleatórias
contínuas).

Exemplo
Veja alguns exemplos <galeria/aula6/anexo/pdf1.pdf> .
Eventos
Seja um espaço amostral S de um experimento aleatório qualquer,
consideramos evento qualquer subconjunto desse espaço amostral S.
Logo, qualquer que seja E um conjunto de possíveis resultados do
experimento, se E ⊂ S, então E é um evento de S.
Se E = S, chamamos E de evento certo; se E é um conjunto unitário e E ⊂
S, chamamos E de evento elementar; quando E = ∅, chamamos de evento
impossível.

Exemplo
Veja alguns exemplos <galeria/aula6/anexo/pdf2.pdf> .
Probabilidade
Seja S o espaço amostral de um experimento aleatório, se todos os elementos
de S possuem a mesma chance de acontecer, então S é um conjunto
equiprovável.
Definimos como sendo a probabilidade de um evento A (A ⊂ S) o valor
real P(A), tal que:
file:///W:/2018.2/analise_estatistica_conv004/galeria/aula6/anexo/pdf1.pdf
file:///W:/2018.2/analise_estatistica_conv004/galeria/aula6/anexo/pdf2.pdf
Onde:
n(A) = número de elementos de A;
n(S) = número de elementos de S.
A probabilidade de um evento certo é igual a 1: P(S) = 1;
A probabilidade de um evento impossível é igual a 0: P(∅) = 0;
A probabilidade de um evento A qualquer (A ⊂ S) é o valor real P(A), tal
que: 0 ≤ P(A) ≤ 1;
Seja n(S) = n e A um evento elementar qualquer, onde n(A) = 1, logo a
probabilidade de A será:
O valor de uma probabilidade está dentro do intervalo fechado de números
reais que vai de 0 a 1, incluindo as extremidades desse intervalo. A
probabilidade pode ser da forma decimal do tipo 0,70, ou representada na
forma de percentagem onde o mesmo número é multiplicado por 100. Ficando
na forma 70%.

Saiba mais
Quanto mais a probabilidade se aproxima de 1, maior é sua possibilidade
de ocorrer. Quanto mais se aproxima de 0, o evento se torna mais
improvável de ocorrer.
Há três maneiras de estimar ou calcular probabilidades, são elas:
P(A) = n(A)
n(S)
P(A) = 1
n
Método Subjetivo
O método subjetivo, que se baseia em estimativas pessoais de
probabilidade ou algum tipo de crença.
Método Empírico
O método empírico, que leva em consideração a frequência relativa de
um determinado evento em cima de um grande número de fatos
repetidos.
Método Clássico
No método clássico, o espaço amostral tem resultados igualmente
prováveis. Em geral, utiliza-se este último método para o cálculo de
probabilidades.
O que não pode acontecer é confundir “chance” com “probabilidade”, pois
existe certa diferença entre eles. A chance compara a quantidade de
resultados possíveis de A com os resultados possíveis de outro evento (B ou
C), enquanto que a probabilidade faz relação entre os resultados possíveis de
A com a quantidade total dos resultados possíveis do experimento aleatório.
Em uma caixa com 7 bolas brancas, 3 azuis e 4 pretas, a probabilidade de
retirar uma bola branca é:
P (branca) = 𝟕/𝟏𝟒 = 0,5 ou 50%
Enquanto que a chance de retirar uma bola brancaé 7:7, ou seja, a chance de
retirar uma bola branca é a mesma de retirar uma bola de outra cor.

Exemplo
Veja alguns exemplos <galeria/aula6/anexo/pdf3.pdf> .
Eventos Complementares
Todo evento pode ocorrer ou não. Se um evento possui uma probabilidade p
de sucesso e uma probabilidade de insucesso q, então para esse mesmo
evento existe a relação:
Se P(A) é a probabilidade do evento A, então 𝑃(𝐴 )̅ é a probabilidade do
evento não A (complemento de A), tal que:

Exemplo
p + q = 1  →  q = 1 − P
P(A) + P( ) = 1  →  P( ) = 1 − P(A)Ā̄̄ Ā̄̄
file:///W:/2018.2/analise_estatistica_conv004/galeria/aula6/anexo/pdf3.pdf
Veja alguns exemplos <galeria/aula6/anexo/pdf4.pdf> .
Eventos Independentes
Dois eventos são independentes quando o sucesso ou o insucesso de um
dos eventos não afeta a probabilidade de sucesso do outro evento e vice-
versa. O resultado obtido por um evento independe do resultado obtido no
outro evento. Neste caso de eventos independentes, a probabilidade de que
os dois eventos se realizem simultaneamente é igual ao produto das
probabilidades de sucesso de cada evento.
Sejam dois eventos A e B, onde P(A) = p e P(B) = p , logo um terceiro
evento C, definido pela ocorrência simultânea dos eventos A e B, terá
probabilidade P(C) = p. E a probabilidade do evento C será função das
probabilidades individuais de A e B, dada por:
Outra forma de representar a ocorrência simultânea de dois eventos A e B é
P(A ∩ B).

Exemplo
Veja alguns exemplos <galeria/aula6/anexo/pdf5.pdf> .
Eventos Mutuamente Exclusivos
1 2
p = ×p1 p2
P(A ∩ B) = P(A) × P(B)
file:///W:/2018.2/analise_estatistica_conv004/galeria/aula6/anexo/pdf4.pdf
file:///W:/2018.2/analise_estatistica_conv004/galeria/aula6/anexo/pdf5.pdf
Dois ou mais eventos são mutuamente
exclusivos quando o sucesso de um evento
exclui a realização do(s) outro(s).
Desta forma, no experimento aleatório de lançamento de um dado, o evento
tirar o número 3 e o evento tirar o número 6 são mutuamente exclusivos,
uma vez que, ao se realizar um deles, o outro não se realiza.
Quando se deseja calcular a probabilidade de que um evento ou outro se
realize, sendo estes eventos mutuamente exclusivos, determinamos a
soma das probabilidades de sucesso de cada evento separadamente.
Ou seja:
No caso do dado a probabilidade do evento de tirar 3 ou 6 é:
Referências
BRUNI, Adriano Leal; PAIXÃO, Roberto Brazileiro. Excel aplicado à gestão
empresarial. 1.ed. São Paulo: Atlas, 2008. 
CRESPO, Antônio Arnot. Estatística fácil. 19.ed. São Paulo: Saraiva, 2009. 
KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. 4.ed.
Porto Alegre: Artmed, 2007
Próximos Passos
Formas de Distribuição Binomial, bem como as condições a serem satisfeitas
para que ela seja aplicada;
Conceito de variável e suas espécies (qualitativas e quantitativas);
Conceito de variável aleatória e as espécies de distribuição de probabilidade.
p = +p1 p2
p = + = + = =p1 p2
1
6
1
6
2
6
1
3
Disciplina: Análise Estatística
Aula 7: Distribuição Binomial
Apresentação
Até aqui, vimos as diversas características de uma amostra e seus valores
característicos.
Nesta aula, veremos os tipos de variáveis, o que caracteriza uma distribuição
binomial, um experimento, um evento e como se determina a probabilidade de
ocorrência desse evento. Entenderemos a função de distribuição de probabilidade e o
que representa uma distribuição binomial.
Objetivos
Aprender as formas de Distribuição Binomial, bem como as condições a serem
satisfeitas para que ela seja aplicada;
Aprender o conceito de variável e suas espécies (qualitativas e quantitativas).
Tipos de Variáveis
Existem muitos tipos de variáveis que serão utilizadas em um estudo
estatístico. É importante compreender o conceito matemático de variável.
Variável é algo que se refere a um determinado aspecto do fenômeno que
está sendo estudado. Podemos afirmar que a quantidade colhida da safra
anual de soja é uma variável. Representemos essa variável pela letra X.
Essa variável pode assumir diversos valores específicos, em função
dos anos de safra, por exemplo, X1986, X1990 e X1992.
Variáveis Quantitativas
Referem-se a quantidades e podem ser medidas em uma escala numérica.
Exemplos: idade de pessoas, preço de produtos, o peso de recém-nascidos.
As variáveis quantitativas subdividem-se em dois grupos:
Variáveis Quantitativas Discretas
São aquelas que assumem apenas determinados valores tais como 1, 2,
3, 4, 5, 6, dando saltos de descontinuidade entre seus valores.
Normalmente referem-se a contagens. 
Por exemplo: número de vendas mensais em uma loja, número de
pessoas por família, quantidade de internações por hospital.
Variáveis Quantitativas Contínuas
São aquelas cujos valores assumem uma faixa contínua e não
apresentam saltos de descontinuidade. 
Exemplos dessas variáveis são: 
• O peso de pessoas; 
• O consumo mensal de energia elétrica; 
• O preço de um produto agrícola. 
 
Referem-se ao conjunto dos números reais ou a um de seus
subconjuntos contínuos.
Variáveis Qualitativas
Referem-se a dados não numéricos. Exemplos dessas variáveis são: o sexo
das pessoas, a cor, o grau de instrução.
As variáveis qualitativas subdividem-se também em dois grupos:
Variáveis Qualitativas Ordinais
São aquelas que definem um ordenamento ou uma hierarquia. Como
exemplo, temos o grau de instrução, a classificação de um estudante no
curso de estatística, as posições das 100 empresas mais lucrativas etc.
Variáveis Qualitativas Nominais
Não definem qualquer ordenamento ou hierarquia. Como exemplos,
temos a cor, o sexo, o local de nascimento etc. Dependendo da situação,
uma variável qualitativa pode ser representada (codificada) através do
emprego de números (por exemplo: em sexo, representamos homens
como sendo “0” e mulheres como sendo “1”). Mas no tratamento
estatístico dessa variável codificada, não podemos considerá-la como
sendo quantitativa. Ela continua sendo uma variável qualitativa (pois o é
em sua essência e natureza), apesar de sua codificação numérica, que
tem como finalidade uma maior finalidade de tabulação de resultados.
Variável Aleatória
função variável aleatória. Costuma-se definir a função variável aleatória por
uma letra maiúscula e seus valores por letras minúsculas.
Seja S o espaço amostral relativo ao “lançamento simultâneo de duas
moedas”, logo S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}. Se X representa
“o número de caras” que aparecem, temos que a cada ponto amostral
podemos associar um número para X, de acordo com a tabela.
 
NÚMERO DE ACIDENTES FREQUÊNCIAS 
(Ca, Ca) 2
(Ca, Co) 1
(Co, Ca) 1
(Co, Co) 0
 
No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q
(q = 1 – p) do insucesso manter-se-ão constantes.
Com a distribuição binomial, podemos
determinar a probabilidade de se obter k
sucessos em n tentativas.
A função para tal é:
Distribuição de Probabilidade
Suponha uma distribuição de frequências relativas ao número de acidentes
diários em um estacionamento
NÚMERO DE ACIDENTES FREQUÊNCIAS 
0 22
1 5
2 2
3 1
 = 30
Em um dia, a probabilidade de:
• Não ocorrer acidente é: 
• Ocorrer um acidente é: 
• Ocorrerem dois acidentes é: 
• Ocorrerem três acidentes é: 
É possível, então, escrever a tabela de probabilidade:
f (x) = P (x = k) = ( )n
k
pk. qn−k
∑
p =   =  0, 7322
30
p =   =  0, 175
30
p =   =  0, 072
30
p =   =  0, 031
30
NÚMERO DE ACIDENTES FREQUÊNCIAS 
0 0,73
1 0,17
2 0,07
3 0,03
 = 1
 
Seja X uma variável aleatória que pode assumir os valores x , x , x ,..., x . A
cada valor de xi correspondem pontos do espaço amostral. Para cada valor de
xi fica associada uma probabilidade pi de ocorrência (sucesso) de tais pontos
no espaço amostral. Desta forma, temos que:
P = 1
Os valores x , x , x ,..., x e seus
correspondentes p , p , p ,..., p definem uma
distribuição de probabilidade.
Vejamos novamente a tabela do espaço amostral relativo ao “lançamento
simultâneo de duas moedas”, incluindo uma coluna de probabilidade de X (o
númerode caras).
Temos então:
NÚMERO DE ACIDENTES FREQUÊNCIAS P(X) 
(Ca, Ca) 2 1/2 x 1/2 = 1/4 
(Ca, Co) 1
(Co, Ca) 1
∑
1 2 3 n
∑ i
1 2 3 n
1 2 3 n
→ + =
1∕2  x 1∕2=1∕4
1∕2  x 1∕2=1∕4
1
4
1
4
2
4
(Co, Co) 0 1/2 x 1/2 = 1/4 
Ao definir a distribuição de probabilidade, estabelecemos uma relação unívoca
entre os valores da variável aleatória X e os valores da variável P
(probabilidade). Nessa correspondência temos os valores xi (i = 1, 2, 3, .., n)
formando o domínio da função e os valores pi (i = 1, 2, 3, .., n) formando o
seu conjunto imagem.
Desta forma definimos a função probabilidade, representada por:
 
A função determina a distribuição de
probabilidade da variável aleatória X.
Tomando como exemplo o lançamento de um dado, onde a variável X é
definida por “pontos de um dado” e podendo tomar os valores 1, 2, 3, 4, 5 e
6.
f(x) = P(x  =   )xi
P(x  =   )xi
Sabendo que a cada um destes valores está associada apenas uma
probabilidade de realização e que P(x ) = 1, fica definida uma função, da qual
resulta a tabela de distribuição de probabilidade.
 
(X) P(X)
6 1/6
5 1/6
4 1/6
3 1/6
2 1/6
1 1/6
∑ = 1
Distribuição Binomial
A distribuição binomial é um prolongamento da distribuição de Bernoulli,
devendo ser aplicada em problemas nos quais um experimento é realizado um
número de vezes preestabelecido. Cada uma destas repetições é denominada
prova ou experimento.
Vamos considerar um experimento aleatório que tenha as seguintes
características:
 O experimento deve ser repetido nas mesmas condições, um número finito
de vezes, ou seja, considerar n tentativas;
 As provas repetidas devem ser independentes, isto é, o resultado de uma
não deve afetar os resultados das demais;
 Cada tentativa admite apenas dois resultados: sucesso e insucesso, com as
mesmas probabilidades de ocorrer;
 No decorrer do experimento, a probabilidade p do sucesso e a
probabilidade q (q = 1 – p) do insucesso manter-se-ão constantes.
i
Em geral resolveremos problemas do tipo:
determinar em n tentativas a possibilidade de se
obterem k sucessos. O experimento “obtenção
de caras em cinco lançamentos sucessivos e
independentes de uma moeda” satisfaz essas
condições.

Atenção
É importante entender que, na realização de um experimento qualquer
em uma única tentativa, se a probabilidade de realização de um evento
(sucesso) é p, a probabilidade de não realização desse mesmo evento
(insucesso) é 1 – p = q.
Suponhamos que realizemos o mesmo experimento n vezes, em tentativas
sucessivas e independentes. A probabilidade de que um evento se realize k
vezes nos experimentos realizados é dada pela função:
Em um dia, a probabilidade de:
(X = k) é a probabilidade de que o evento se realize k vezes em n provas;
p é a probabilidade de que o evento se realize em uma só prova – sucesso;
q é a probabilidade de que o evento não se realize no decurso dessa prova –
insucesso;
 é o coeficiente binomial de n sobre k, igual a 
f(x) = P(x  = k) = ( ) .n
k
pk qn−k
( )n
k
n!
k!(n−k)!
É importante lembrar que o sinal “!” representa
a função fatorial, logo 5! representa o produto
da sequência de 1 a 5. 5! = 5.4.3.2.1 = 120.
Essa função, denominada lei binomial, define a distribuição binomial. O
nome binomial vem do fato de ser o termo geral do
desenvolvimento do binômio de Newton.
A distribuição binomial é uma distribuição de probabilidade utilizada em
experimentos onde é possível ter dois tipos de resultados: sucesso ou
fracasso.

Exemplo
Veja alguns exemplos <galeria/aula7/anexo/pdf_aula_7.pdf> .
Referências
CRESPO, Antônio Arnot. Estatística fácil. 19.ed. São Paulo: Saraiva, 2009. 
Próximos Passos
Como reconhecer a distribuição normal (curva de Gauss) e usar suas
propriedades nas aplicações da vida real;
Como estimar áreas sob uma curva normal e usá-las para calcular
probabilidades de variáveis aleatórias como distribuições normais;
Entender o diagrama de dispersão.
( ) .n
k
pk qn−k
file:///W:/2018.2/analise_estatistica_conv004/galeria/aula7/anexo/pdf_aula_7.pdf
11/10/2018 Estácio
file:///W:/2018.2/analise_estatistica_conv004/aula8.html 1/8
Disciplina: Análise Estatística
Aula 8: Distribuição normal e Gráficos de dispersão
Apresentação
Nesta aula, veremos como determinar a probabilidade de ocorrência do fenômeno
estudado para determinados valores, ou faixas de valores dentro da sua amplitude
viável de ocorrência. Entenderemos como calcular essas probabilidades utilizando a
curva normal padrão. Aprenderemos a relação entre a probabilidade de ocorrência e a
área sob a curva que representa a função probabilidade. Veremos também como a
distribuição normal pode ser utilizada nas observações feitas em muitas atividades do
dia a dia.
Objetivos
Reconhecer a distribuição normal (curva de Gauss) e como usar suas
propriedades nas aplicações do dia a dia;
Aprender como estimar áreas sob uma curva normal e usá-las para calcular
probabilidades de variáveis aleatórias como distribuições normais;
Entender o diagrama de dispersão e suas formas de utilização.
11/10/2018 Estácio
file:///W:/2018.2/analise_estatistica_conv004/aula8.html 2/8
Determinando a variável
Diversos tipos de variáveis são utilizadas em um estudo estatístico. É
importante entender o conceito matemático de uma variável.
Chamamos variável aquilo que se refere a um
determinado aspecto do fenômeno que está
sendo estudado.
 Fonte: Bohbeh / shutterstock

Exemplo
Podemos afirmar que a quantidade colhida da safra anual de soja é uma
variável. Representemos essa variável pela letra X. Essa variável
pode assumir diversos valores específicos, em função dos anos de safra,
como por exemplo, X1986, X1990 e X1992. Esses valores que a variável
11/10/2018 Estácio
file:///W:/2018.2/analise_estatistica_conv004/aula8.html 3/8
assume em determinados anos não são a própria variável, mas valores
assumidos por ela para determinados objetos, ou pessoas da amostra ou
da população. Se uma amostra tiver 50 indivíduos, podemos referir-nos a
X como sendo a variável nota de estatística e a X30 como a nota de um
indivíduo particular, no caso o trigésimo.
Distribuição normal
Entre as distribuições teóricas de variável aleatória contínua, podemos
considerar a distribuição normal como uma das mais empregadas.
A observação cuidadosa mostrou que a ideia de que distribuição normal não
correspondia à realidade de todos os fenômenos da vida real. De fato, não são
poucos os casos representados por distribuições assimétricas (não normais).
Mas a distribuição normal tem papel
predominante na Estatística, e os processos de
inferência nela baseados possuem vasta
aplicação.

Saiba mais
É comum na literatura encontrarmos letras maiúsculas para a notação de
variáveis e as correspondentes letras minúsculas para referência aos
valores particulares assumidos por essa variável. Porém, neste resumo
procuraremos evitar essa forma de notação.
11/10/2018 Estácio
file:///W:/2018.2/analise_estatistica_conv004/aula8.html 4/8
Gráfico da distribuição normal de
frequências
1
A variável aleatória X pode assumir todo e qualquer valor real
2
A representação gráfica da distribuição normal é uma curva em forma de sino,
simétrica em torno da média ( ), ponto central e de maior frequência
(coincidem média, moda e mediana), que recebe o nome de curva normal ou
de Gauss
3
A probabilidade de a variável aleatória X assumir qualquer valor real
corresponde à área total sob a curva, ou seja, a área total entre a curva e o
eixo das abscissas, que é igual a 1
x̄
11/10/2018 Estácio
file:///W:/2018.2/analise_estatistica_conv004/aula8.html 5/8
5
A densidade de probabilidade é mais alta no meio e diminui gradualmente em
direção às caudas. Logo, as extremidades da curva normal aproximam-se
indefinidamente do eixo das abscissas sem tocá-lo, isto é, a curva normal é
assintótica em relação ao eixo das abscissas
6
Por ser padrão, todos os momentos e coeficientes de assimetria são iguais a
zero, e o coeficiente de curtose é igual a 0,263
7
Como a curva normal é simétricaem torno da média ( ), a probabilidade de
ocorrer um valor maior que a média é igual à probabilidade de ocorrer um
valor menor do que a média, que são iguais à metade da área, ou seja, 0,5.
Dizemos que: P(X > )= P(X < )= 0,5
Distribuição normal e variável
aleatória
Uma variável aleatória normalmente pode assumir um valor em um
determinado intervalo, e o principal interesse é determinar a probabilidade
dessa variável.
Cada distribuição normal possui uma função geradora da curva. O cálculo
dessa área necessita de conhecimentos matemáticos mais específicos.
Esta curva pode ser expressa matematicamente como segue:
x̄
x̄ x̄
11/10/2018 Estácio
file:///W:/2018.2/analise_estatistica_conv004/aula8.html 6/8
Onde:
e ≈ 2,718
π ≈ 3,1416
µ = média da população
σ = desvio-padrão da população
Representada graficamente:
Probabilidades
As probabilidades referentes à distribuição normal reduzida estão
determinadas em uma tabela específica, apresentada a seguir, não sendo
mais necessário serem calculadas.
y  =     ⋅  1
σ  2 π√
e
(x−μ)2
2σ2
11/10/2018 Estácio
file:///W:/2018.2/analise_estatistica_conv004/aula8.html 7/8
Esta tabela fornece a probabilidade de Z tomar qualquer valor entre 0 e
determinado valor de z, tal que:
Esta conversão será:
Temos então que, para qualquer valor de X, podemos escrever:

Exemplo
P  (0  <  Z  ≤  z)
z  =           ou        z  =  x − x̄s
x − μ
σ
P (    <  X  <  x)  =  P ( 0  <  Z  <  z)x̄
11/10/2018 Estácio
file:///W:/2018.2/analise_estatistica_conv004/aula8.html 8/8
Veja exemplos <galeria/aula8/anexo/exemplos_tabela.pdf>
sobre a utilização da tabela!
Referências
CRESPO, Antônio Arnot. Estatística fácil. 19.ed. São Paulo: Saraiva, 2009.
KAZMIER, Leonard J. Estatística aplicada à Economia e Administração. 4.ed.
Porto Alegre: Artmed, 2007
Próximos Passos
Como definir o que é correlação, bem como suas espécies (positiva, negativa e
curvilínea);
Como abordar sobre a correlação linear e coeficiente de correlação linear;
Estimar os parâmetros e apresentaremos as propriedades da equação de
regressão;
Fazer o ajustamento da reta, ressaltando a interpolação e extrapolação e como
calcular o coeficiente de correlação linear e do diagrama de dispersão em
Microsoft Excel.
Explore mais
Pesquise na internet, sites, vídeos e artigos relacionados ao conteúdo visto.
Em caso de dúvidas, converse com seu professor online por meio dos recursos
disponíveis no ambiente de aprendizagem.
file:///W:/2018.2/analise_estatistica_conv004/galeria/aula8/anexo/exemplos_tabela.pdf
Disciplina: Análise Estatística
Aula 9: Correlação e Regressão Linear
Apresentação
Nesta aula, veremos como correlacionar amostras de dados obtidas em pesquisas, que, apesar
de terem sido retiradas da uma mesma população, possuem parâmetros diferentes.
Aprenderemos como estimar pontos não existentes em uma série de dados, mas necessários
para análise ou interpretação dos resultados, utilizando a equação de regressão linear.
Objetivos
Aprender a definição de Correlação, bem como das suas espécies (correlação positiva,
negativa e curvilínea) e como calcular o coeficiente de correlação linear;
Compreender correlação linear e o coeficiente de correlação linear;
Aprender o modelo de regressão linear simples, as propriedades da equação de regressão e
como estimar seus parâmetros;
Compreender o ajustamento de reta, ressaltando o conceito de interpolação e extrapolação.
Correlação e Regressão
Nas aulas anteriores procuramos descrever a distribuição de valores de uma única
variável. A partir desse ponto podemos aprender a calcular as medidas de tendência
central, variabilidade e demais parâmetros. Quando, porém, consideramos observações
de duas ou mais variáveis surge um novo problema, do tipo, como verificar as relações
que podem existir entre as variáveis estudadas. Para esse tipo de análise, as medidas
estudadas não são eficientes.
Assim, quando consideramos variáveis como peso e
estatura de um grupo de pessoas, uso do cigarro e
incidência de problemas pulmonares, procura-se verificar
se existe alguma relação entre as variáveis de cada um
dos pares e qual é essa relação.
Uma vez caracterizada a relação quantitativa, procuramos descrevê-la através de uma
função matemática. A regressão é o instrumento adequado para determinação dos
parâmetros dessa função e medir essa relação. Se todos os valores das variáveis
satisfazem exatamente uma equação, diz-se que elas estão perfeitamente
correlacionadas ou que há correlação perfeita entre elas.

Dica
Quando estão em jogo somente duas variáveis, fala-se em correlação e regressão
simples. Quando se trata de mais de duas variáveis, fala-se em correlação e
regressão múltipla.
Correlação
É de conhecimento matemático que a área e o comprimento do lado do quadrado estão
relacionados. Essa é uma relação perfeitamente definida e pode ser expressa por meio
de uma sentença matemática, algumas vezes chamada de relação funcional:
2
A = ℓ
Onde A é a área e ℓ é o lado do quadrado.
Vejamos, agora, a relação que existe entre peso e altura das pessoas de um grupo. Fica
claro de essa relação não é a do mesmo tipo e nem tão precisa quanto a anterior.
Uma vez que pessoas de alturas diferentes tenham pesos iguais e, da mesma forma,
pessoas com alturas iguais possuam pesos diferentes. Entretanto, quanto maior a altura,
maior o peso. Neste caso dizemos que peso-altura possui uma relação estatística.
Diagrama de Dispersão
Um exemplo interessante é separar as notas das provas de alunos de uma mesma turma
da faculdade A. vejamos duas disciplinas da área de exatas, por exemplo, matemática e
estatística. Separando uma amostra de notas de 10 alunos escolhidos aleatoriamente,
teremos:
ALUNOS
NOTAS
MATEMÁTICA ESTATÍSTICA
(x ) (y )
01 5,0 6,0
02 8,0 9,0
03 7,0 8,0
04 10,0 10,0
05 6,0 5,0
06 7,0 7,0
07 9,0 8,0
08 3,0 4,0
09 8,0 6,0
10 2,0 2,0
Para esboçar um diagrama de dispersão, primeiro traça-se o sistema de eixos cartesianos
ortogonais. Depois se representa uma das variáveis no eixo “x” (horizontal) e a outra no
eixo “y”(vertical). Colocam-se, então os valores das variáveis sobre os respectivos eixos
e marca-se um ponto para cada par de valores.
2
i i
Esse diagrama nos fornece uma ideia grosseira, porém
útil da correlação existente entre as variáveis.
Correção Linear
De um modo geral, os pontos de uma análise estatística colocados no gráfico cartesiano,
possuem a forma aproximada de uma elipse em diagonal. Logo, quanto mais fina for
essa elipse, mais ela se aproximará de uma reta. Essa reta pode ser chamada de
“imagem” da correlação.
A correlação linear é a aproximação dessa elipse em uma reta que mais se aproxime da
maioria dos pontos dados.
Neste exemplo a “imagem” é uma reta crescente, então é denominada correlação linear
positiva.
Correlação Linear Positiva
Os pontos do gráfico têm como “imagem” uma reta crescente.
Correlação Linear Negativa
Os pontos do gráfico têm como “imagem” uma reta decrescente.
Correção Não – Linear
Os pontos do gráfico têm como “imagem” uma curva.
Não há Correlação
Quando os pontos, por sua elevada dispersão, não segue nenhum dos casos anteriores,
dizemos que não há correlação.
Coeficiente de Correlação Linear
Dizemos que duas ou mais variáveis expressam a relação de causa e efeito ou se elas
variam concomitantemente, se elas são variáveis consideradas correlacionadas. Nesta
situação é dita que essas variáveis possuem correlação linear, no caso de sua “imagem”
ser uma reta. E o instrumento de medida desta correlação linear é o coeficiente de
correlação. Através do valor deste coeficiente sabemos o grau de intensidade da
correlação entre as duas variáveis, bem como, o sentido dessa correlação (negativo ou
positivo).
Utilizaremos o coeficiente de correlação de Pearson, que é dado por:
Onde n é o número de observações, ou seja, o tamanho da amostra. O resultado obtido
para r deve estar no intervalo fechado [– 1, 1].
Podemos concluir que:
Se a correlação entre duas variáveis é perfeita e positiva, então: