Buscar

ANÁLISE ESTATÍSTICA AULAS

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 46 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 46 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 46 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

ANÁLISE ESTATÍSTICA (aulas 1 – 10) 
Aula 1: Conceitos Introdutórios em Estatística 
Atualmente, é fundamental o emprego da Estatística em quase todas as áreas do conhecimento, todas as vezes que 
estiverem envolvidas informações na forma de dados coletados em pesquisas ou de forma experimental. Com o objetivo 
de alcançar uma melhoria dos processos tanto nas áreas industriais como tecnológicas, as ferramentas estatísticas tem 
alcançado um papel importantíssimo nesse cenário. O que modernamente se conhece como Estatística é “um conjunto 
de técnicas e métodos de pesquisa que, entre outros tópicos, envolve o planejamento do experimento a ser realizado, a 
coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações”. Fonte: IBGE 
Estatística da Área de Gestão 
Todo profissional hoje em dia deve estar ciente da importância da Estatística e ter conhecimento de como utilizá-la, a fim 
de ter um lugar no mercado de trabalho com a capacidade de lidar com as realidades atuais extremamente competitivas. 
Dentre várias habilidades profissionais, vem crescendo em importância o desenvolvimento do pensamento estatístico, 
tendo em vista as necessidades de todas as áreas de conhecimentos de uma análise mais apurada durante os processos 
decisórios. 
A metodologia estatística está sendo empregada em várias áreas de conhecimento, tais como nos setores farmacêuticos, 
médicos e setores industriais diversos, principalmente para melhoria da área de produção. 
Observa-se que o controle de qualidade foi criado como uma necessidade de resolver problemas na redução de custos, 
no controle de perdas desnecessárias, na uniformização e normalização da produção, auxiliando as empresas a 
controlarem, melhor distribuírem e maximizarem os seus recursos, tornando-as assim mais competitivas. 
Aplicação 
Um interessante estudo experimental aplicado à pesquisa médica é o relato do primeiro ensaio clínico planejado para 
comprovar a eficácia do AZT (zidovudina) no prolongamento da vida de aidéticos. Os dados foram publicado por Fischl et 
al. (1987) e posteriormente discutidos por Soares & Siqueira (1999, p.176-183). O experimento considerou 
essencialmente o acompanhamento de 282 pacientes aidéticos durante 24 semanas de tratamento, os quais foram 
aleatoriamente divididos em dois grupos: o grupo de pacientes tratados com AZT (composto por 145 aidéticos) e o grupo 
controle, composto por 137 aidéticos que receberam o placebo. A variável resposta (desfecho) é a situação do paciente 
(sobrevivente ou não sobrevivente) após as 24 semanas de tratamento. 
Número de sobreviventes e não sobreviventes após 24 semanas de tratamento com AZT ou Placebo. 
 
 
Aparentemente a proporção de sobreviventes é maior no grupo de pacientes tratados com AZT, mas para estender este 
resultado para a população, é vital avaliar se as diferenças observadas não são devidas ao acaso, mediante um teste de 
hipóteses. Neste problema, a estratégia de análise adotada foi o teste de homogeneidade de populações, baseado na 
estatística (lê-se “qui-quadrado”) de Pearson. O valor calculado da estatística de teste foi igual a 15,087, cuja 
probabilidade de significância associada (p_value, em inglês) é inferior a 0,0001. Este resultado evidencia que a 
verdadeira proporção de pacientes aidéticos que sobrevivem após 24 semanas é maior quando são tratados com AZT em 
relação aos não tratados (isto é, que recebem o placebo). 
Método científico 
Há muito tempo que o homem faz descobertas importantes, que originaram muitos dos conhecimentos atuais. 
Entretanto muitas dessas descobertas foram ao acaso, ou em função de uma necessidade da época e muitas dessas 
descobertas não seguiram um caminho, roteiro ou um método específico. Contudo hoje em dia os métodos de 
observação, estudo e análise fazem parte da maioria dos aumentos de conhecimentos atuais. Até mesmo os 
conhecimentos obtidos por descobertas ao acaso são desenvolvidos com base em métodos específicos, que chamamos 
de métodos científicos. Os métodos são as trilhas que nos permite chegar a um objetivo, ou a um determinado resultado, 
sendo um conjunto de passos e procedimentos que repetidos fornecem um resultado específico. Dentre os métodos 
científicos destacamos o método estatístico e experimental. 
Método Experimental 
Quando se realiza um experimento e se deseja analisar como se comportam seus resultados ao se alterar algum dos 
elementos componentes do experimento, é necessário manter constante os demais fatores (causas). 
Quando se usa este tipo de pesquisa, faz-se uma análise do problema, montam-se as hipóteses necessárias. A seguir 
procede-se a uma manipulação das variáveis referentes ao fenômeno observado, alterando-as da melhor maneira 
possível. As alterações nas variáveis tanto em quantidade, quanto em qualidade, permite o estudo das relações de causas 
e efeitos do referido fenômeno em análise. Todo esse procedimento experimental permite que se possa avaliar e 
controlar os resultados obtidos. Pontos importantes do método experimental: 
 Indicar o objeto de estudo; 
 Determinar as variáveis independentes capazes de influenciar o fenômeno em estudo; 
 Identificar as ferramentas de análise, controle e observação dos efeitos, resultantes da manipulação das variáveis, 
sobre o objeto. 
Método Estatístico 
No nosso dia a dia, quando fazemos repetidas observações com relação a um determinado sistema ou fenômeno 
específico, verificamos que os resultados obtidos não são exatamente os mesmos. A esta fato podemos chamar de 
variabilidade. 
 
No método estatístico, observando suas várias etapas, podemos considerar que a mais importante muitas vezes não é a 
análise de dados. Podemos dizer que a etapa que necessita de maior atenção e cuidado é o planejamento de como o 
conjunto de dados será coletado. Um mau planejamento, ou mesmo uma coleta feita de forma inapropriada pode 
acarretar em dados inúteis, de onde não se consegue tirar nenhuma informação ou qualquer conclusão coerente. 
O uso dos métodos estatísticos está praticamente em todos os setores e campos de estudo. É possível utilizar o método 
na avaliação da produção, a fim de melhorar o controle de qualidade e permitir um produto melhor a custos menores; 
utilizar no controle estatístico de doenças e epidemias, permitindo uma ação antecipada no controle de doenças; ou até 
mesmo na criação de regulamentações e leis, com a finalidade de proteger espécies em extinção, verificadas através de 
levantamentos estatísticos da população. 
Abusos da Estatística 
Não é de hoje que ocorrem abusos com a Estatística. Assim é que, há cerca de um século, o estadista Benjamin Disraeli 
disse: “Há três tipos de mentiras: as mentiras, as mentiras sérias e as estatísticas”. Já se disse também que “os números 
não mentem; mas os mentirosos forjam os números” (Figures don’t lie; liars figure) e que “se torturarmos os dados por 
bastante tempo, eles acabam por admitir qualquer coisa”. O historiador Andrew Lang disse que algumas pessoas usam a 
Estatística “como um bêbado utiliza um poste de iluminação – para servir de apoio, e não para iluminar”. Todas essas 
afirmações se referem aos abusos da Estatística quando os dados são apresentados de forma enganosa. Eis alguns 
exemplos das diversas maneiras como os dados podem ser distorcidos: 
 Pequenas Amostras 
 Números Imprecisos 
 Estimativas por Suposição 
 Porcentagens Distorcidas 
 Cifras Parciais 
 Distorções Liberadas 
 Perguntas Tendenciosas 
 Gráficos Enganosos 
 Pressão do Pesquisador 
 Más Amostras 
Conclusão: 
 
Aula 2: Revisão das Medidas de Tendência Central e de Posição 
Medidas de Posição Central 
Em uma dada distribuição amostral, é possível fazer várias observações,no intuito de entender o comportamento dos 
seus valores. Podemos, por exemplo, tentar localizar a maior concentração de valores de uma determinada distribuição. 
Entretanto, para que tenhamos parâmetros de comparação entre as tendências características de cada distribuição, é 
necessário introduzir conceitos que se expressem através de números. Veremos então as medidas de posição. As serem 
estudadas são as medidas de tendência central e as separatrizes. 
 
Medidas de tendência Central: 
 
 
Média: 
 
 
Média Aritmética: 
 
 
 
 
 
Multiplicação por Escalar: 
 
 
 
 
 
 
 
Mediana: 
 
Comparação entre a Média, a Mediana e a Moda: 
 
Relação entre a Média, a Mediana e a Moda: 
Com essas três medidas de posição é possível determinar a assimetria da curva de distribuição de frequência. A tabela de 
distribuição de frequências é composta de uma coluna contendo os valores que compõem a relação de dados e uma 
coluna com as correspondentes quantidades que cada valor aparece na relação de dados. As medidas de assimetria 
complementam as informações dadas pelas medidas de posição, a fim de permitir uma melhor compreensão das 
distribuições de frequências. A mediana se localiza na posição central da distribuição, devendo estar entre os valores da 
média e moda e podendo até mesmo ser igual a ambas. Nesta situação temos três casos possíveis: 
 
O coeficiente de assimetria pode ser calculado pela fórmula do primeiro coeficiente de Pearson, tornando mais fácil 
determinar se a assimetria da distribuição é positiva ou negativa: 
 
No denominador da fórmula temos um símbolo que representa o desvio padrão da distribuição. Quando for apresentado 
o estudo sobre as medidas de dispersão, veremos mais detalhes sobre o cálculo do desvio padrão e seu significado. No 
momento podemos adiantar que terá sempre um valor positivo (ou seja, não é possível ocorrer desvio padrão negativo). 
Assim sendo o que vai determinar o sinal da fração é o sinal do numerador. 
 
 
 
 
Quando a distribuição de frequência é assimétrica à direita da curva, dizemos que a distribuição tem assimetria positiva; 
Quando a distribuição de frequência é assimétrica à esquerda da curva, dizemos que a distribuição tem assimetria 
negativa; 
Outro coeficiente de assimetria de Pearson indica se esta é forte ou fraca: 
 
SEPARATRIZES: 
 
 
 
Exemplo usando Excel - 
EXEMPLO: Determine a média, a moda e a mediana da amostra abaixo, usando a planilha do Excel: 
 
 
 
Aula 3: Revisão das Medidas de Dispersão 
Medidas de Dispersão 
Em uma dada distribuição amostral é possível fazer várias observações no intuito de entender o comportamento dos seus 
valores. Normalmente as medidas de posição não são suficientes para dar o comportamento de uma distribuição de 
dados, sendo necessárias informações adicionais que permitam uma melhor análise do fenômeno a ser estudado. É 
importante levar um ponto em consideração durante a análise dos dados, a dispersão ou variabilidade. A dispersão ou 
variabilidade indica a maior ou menor diferença entre os valores de uma variável, dado da distribuição, e sua medida de 
posição, normalmente a média. Estudaremos as seguintes medidas de dispersão: 
 
 
Amplitude: 
 
 
 
 
 
 
 
 
 
 
Desvio Médio Absoluto 
 
 
 
Variância e Desvio padrão: 
 
Dados Agrupados Sem Intervalos de Classe: 
Para os dados agrupados numa tabela de distribuição de frequência a variância é calculada da seguinte forma: 
 
 
Coeficiente de Variação 
 
Quando é necessário comparar duas amostras com média e desvio padrão diferentes, podemos comparar os coeficientes 
de variação. Quanto maior o valor, menor será a homogeneidade da distribuição, ou seja, apresenta o maior grau de 
dispersão. 
 
Usando o Excel 
Seja uma distribuição amostral composta de sete números (n), representando o tempo (em minutos) de execução de uma 
prova. X = (85, 86, 88, 88, 91, 94, 104). 
Usando as fórmulas prontas do Microsft Excel para determinar a variância e o desvio padrão da amostra e da população, 
teremos: 
 
 
 
Aula 4: Gráficos Estatísticos no Microsoft Excel 
Inserindo gráficos no Excel 
Para que um gráfico seja inserido no Excel, é necessário que os dados que se deseja analisar também estejam contidos na 
planilha. Vejamos como seria ilustrar graficamente a venda de camisas por cor: 
 
Passo a passo: 
Primeiramente, insira os dados na planilha do Excel, digitando conforme mostrado a seguir: 
 
 
 
Formatando o Gráfico 
É preciso formatar o gráfico criado, pois ele não possui informação de cabeçalho, rótulos nos dados, nome dos eixos etc. 
Clicando no gráfico e mantendo-o marcado, veremos na opção Ferramentas de gráfico os três novos menus: 
 
Com a opção Design marcada, clicando em Alterar tipo de gráfico (primeiro ícone da esquerda), é possível alterar o 
modelo do gráfico, escolhendo alguma das opções do lado direito da janela. 
 
 
 
Automaticamente esses dados serão colocados na caixa de texto Intervalo de dados do gráfico, conforme a figura: 
 
 
 
 
 
 
Menu Layout 
O menu Layout possui as seguintes opções: 
 
 
 
 
 
 
 
Rótulos 
As duas seleções seguintes são referentes aos dados que podem ser colocados no gráfico, opção Rótulo de dados, ou na 
forma de tabela, opção Tabela de dados. 
 
 
Eixos 
Continuando nosso exemplo e dando uma breve passada nas opções que ainda faltam: 
Selecionando Eixos, é possível alterar os eixos horizontal e vertical. Para o nosso exemplo, 
mantenha selecionada a opção do eixo horizontal da esquerda para a direita. No eixo 
vertical, escolha a opção Eixo padrão. No caso de necessidade de outras alterações nos eixos, 
é possível usar o comando Mais opções de eixo vertical principal, que também vale para o 
eixo horizontal. 
As linhas de grades em um gráfico têm a finalidade de orientar a posição de um valor em comparação aos outros valores 
do gráfico, principalmente neste exemplo, se as alturas das colunas fossem próximas. Quando se utilizam rótulos, as 
linhas de grades podem ser alteradas. 
Em nosso exemplo, utilizaremos para o eixo horizontal as linhas de grades principais, que são as mais utilizadas. Para o 
eixo vertical será mantida a opção Nenhuma. 
Plano de Fundo, Análise e Propriedades 
 
Escolhendo entre Diferentes Alternativas 
Usamos um exemplo para apresentar os dados de uma tabela. O Excel possui diversas alternativas que podem ser 
utilizadas de acordo com o tipo de dados e análise a ser realizada. 
Dentre os principais, temos no menu Inserir: 
 
Gráfico de Colunas: 
 
 
 
Gráfico de linhas: 
 
Gráfico de dispersão: 
 
Gráfico de Pareto: 
O Gráfico de Pareto, também chamado de Diagrama de Pareto, é do tipo colunas, ordenadas na forma decrescente e 
complementadas com uma linha, indicando a frequência acumulada. Na verdade, trata-se de um gráfico de colunas e 
linha em dois eixos. Este gráfico pode ser usado para dados quantitativos agrupados em classe, ou na forma de ralação 
(não agrupados), bem como em dados nominais ou categóricos. Clique aqui e veja como adaptar o exemplo anterior para 
utilizarmos o Gráfico de Pareto. 
Aula 5: Medidas de Assimetria e de Curtose 
Medidas de Assimetria 
 
Quando se faz um levantamento estatístico, dificilmente encontramos, na prática, uma distribuição simétrica. O que 
ocorre, em levantamentos de dados reais, são medidas mais ou menos assimétricas em relação à frequência máxima. A 
distribuição assimétrica à esquerda ou negativa ocorre quando o valor da moda é maior do que a média.Logo, a 
distribuição assimétrica à direita ou positiva ocorre quando a moda é menor do que a média. 
 
Desta forma, a diferença entre a moda e a média poderá definir o tipo de assimetria. Calculando o valor da diferença: 
 
Exemplos: 
 
 
 
 
Coeficiente de Assimetria: 
 
Medida de Curtose: 
Curtose é o grau de achatamento de uma distribuição em relação à curva normal, uma distribuição padrão. A curva 
normal corresponde a uma distribuição teórica de probabilidade. 
 
Quando a distribuição apresenta uma curva de frequência com dados mais concentrados em torno da média do que a 
curva normal, ela chama-se leptocúrtica. 
 A curva normal, tomada por base para classificação do achatamento das distribuições de frequências, recebe o nome 
de mesocúrtica. 
Quando a distribuição apresenta uma curva de frequência com dados mais dispersos em relação à média do que na 
curva normal, essa distribuição chama-se platicúrtica. 
Coeficiente de Curtose: 
 
 
Atividade: 
 
 
A análise conjunta da assimetria e curtose da distribuição de frequências pode fornecer informações importantes sobre 
os dados obtidos, que muitas vezes não aparecem na simples observância dos valores obtidos. 
A assimetria nos mostra o quanto a média se desloca para a direita ou para a esquerda, mostrando, também, como 
algumas condições impostas sobre a população podem influenciar o resultado e deslocamento da média. 
O grau de curtose indica se a distribuição está mais ou menos concentrada, fazendo com que a curva esteja mais ou 
menos achatada em relação à curva normal (curva mesocúrtica), padrão de referência para a classificação do grau de 
curtose. 
Aula 6: Probabilidade 
A maioria dos assuntos de que trata a Estatística tem uma natureza aleatória ou probabilística. É esta a importância do 
estudo dos conhecimentos fundamentais do cálculo da probabilidade, além de ser fundamental no estudo da Estatística 
Inferencial ou Indutiva. 
Experimento Aleatório: É qualquer processo aleatório capaz de produzir observações e que possa se repetir 
indefinidamente no futuro sob as mesmas condições. Um experimento aleatório apresenta variações nos resultados, o 
que faz com que seus resultados a priori não sejam determinados antes que tenham sido realizados. É possível, 
entretanto, indicar todos os seus resultados possíveis, ou seja, as suas probabilidades. É na verdade qualquer processo 
capaz de gerar um resultado incerto ou casual. 
 
Assim, observamos que todo experimento que apresentar resultados diferentes quando repetido nas mesmas condições 
iniciais é considerado um experimento aleatório, e a variabilidade dos seus resultados deve-se ao acaso. A tudo isto liga-
se a incerteza, que é a chance de ocorrência do resultado de interesse. Temos como exemplo os operários que trabalham 
no setor de produção de determinada empresa. Sabe-se que neste setor trabalham oito operários. Um experimento ao 
acaso seria escolher de forma aleatória um dos operários. Pode-se considerar como evento de interesse o sexo do 
operário escolhido. 
Espaço Amostral: 
Cada experimento aleatório corresponde, normalmente, a inúmeros resultados possíveis. Chamamos de espaço amostral 
ou conjunto universo o seu conjunto de possibilidades, isto é, o conjunto formado por todos os possíveis resultados do 
experimento, geralmente denominado S ou Ω (letra grega que se lê: “ômega”). Definimos por n(S) como sendo o número 
de elementos do conjunto S, ou seja, o número de resultados possíveis do experimento. Quanto ao número de 
elementos, pode ser: 
 
Eventos: 
 
 
 
 
O que não pode acontecer é confundir “chance” com “probabilidade”, pois existe certa diferença entre eles. A chance 
compara a quantidade de resultados possíveis de A com os resultados possíveis de outro evento (B ou C), enquanto que a 
probabilidade faz relação entre os resultados possíveis de A com a quantidade total dos resultados possíveis do 
experimento aleatório. 
Em uma caixa com 7 bolas brancas, 3 azuis e 4 pretas, a probabilidade de retirar uma bola branca é: 
 
Enquanto que a chance de retirar uma bola branca é 7:7, ou seja, a chance de retirar uma bola branca é a mesma de 
retirar uma bola de outra cor. 
Eventos Complementares: 
 
Eventos Independentes: 
 
Eventos Mutuamente Exclusivos 
Dois ou mais eventos são mutuamente exclusivos quando o sucesso de um evento exclui a realização do(s) outro(s). 
 Desta forma, no experimento aleatório de lançamento de um dado, o evento tirar o número 3 e o evento tirar o número 
6 são mutuamente exclusivos, uma vez que, ao se realizar um deles, o outro não se realiza. 
Quando se deseja calcular a probabilidade de que um evento ou outro se realize, sendo estes eventos mutuamente 
exclusivos, determinamos a soma das probabilidades de sucesso de cada evento separadamente. 
 
Aula 7: Distribuição Binomial 
Tipos de variáveis: 
 
Variáveis Quantitativas: 
 
Variáveis Quantitativas Discretas: 
São aquelas que assumem apenas determinados valores tais como 1, 2, 3, 4, 5, 6, dando saltos de descontinuidade entre 
seus valores. Normalmente referem-se a contagens. 
Por exemplo: número de vendas mensais em uma loja, número de pessoas por família, quantidade de internações por 
hospital. 
Variáveis Quantitativas Contínuas: 
São aquelas cujos valores assumem uma faixa contínua e não apresentam saltos de descontinuidade. 
Exemplos dessas variáveis são: 
• O peso de pessoas; 
• A renda familiar; 
• O consumo mensal de energia elétrica; 
• O preço de um produto agrícola. 
Referem-se ao conjunto dos números reais ou a um de seus subconjuntos contínuos. 
Coeficiente de Assimetria 
 
Variável Aleatória: 
 
Seja um espaço amostral S, e supondo que para cada ponto amostral seja atribuído um número. 
Desta forma, passamos a definir uma função variável aleatória. Costuma-se definir a função 
variável aleatória por uma letra maiúscula e seus valores por letras minúsculas. 
 
 
Seja S o espaço amostral relativo ao “lançamento simultâneo de duas moedas”, 
logo S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}. Se X representa “o número de caras” 
que aparecem, temos que a cada ponto amostral podemos associar um número 
para X, de acordo com a tabela. 
 
 
No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (q 
= 1 – p) do insucesso manter-se-ão constantes. 
 
Com a distribuição binomial, podemos determinar a probabilidade de se obter k sucessos em n tentativas. 
 
 
 
 
 
 
Distribuição Binomial: 
A distribuição binomial é um prolongamento da distribuição de Bernoulli, devendo ser aplicada em problemas nos quais 
um experimento é realizado um número de vezes preestabelecido. Cada uma destas repetições é denominada prova ou 
experimento. 
 
 
 
 
 
Aula 8: Distribuição Normal e Gráficos de Dispersão 
Curva Normal: 
Diversos tipos de variáveis são utilizadas em um estudo estatístico. É importante entender o conceito matemático de uma 
variável. Chamamos variável aquilo que se refere a um determinado aspecto do fenômeno que está sendo estudado. 
 
Se uma amostra tiver 50 indivíduos, podemos referir-nos a X como sendo a variável nota de estatística e a X30 como a 
nota de um indivíduo particular, no caso o trigésimo. É comum na literatura encontrarmos letras maiúsculas para a 
notação de variáveis e as correspondentes letras minúsculas para referência aos valores particulares assumidos por essa 
variável. Porém, neste resumo procuraremos evitar essa forma de notação. 
Entre as distribuições teóricas de variável aleatório contínua, podemos considerar a 
distribuição normal como uma das mais empregadas. 
A observaçãocuidadosa mostrou que a ideia de que distribuição normal não correspondia 
à realidade de todos os fenômenos da vida real. De fato, não são poucos os casos 
representados por distribuições assimétricas (não normais). 
 Mas a distribuição normal tem papel predominante na Estatística, e os processos de 
inferência nela baseados possuem vasta aplicação. 
Características do gráfico da distribuição normal de frequências: 
 
 
Estatística da Área de Gestão 
Uma variável aleatória normalmente pode assumir um valor em um determinado intervalo, e o principal interesse é 
determinar a probabilidade dessa variável. 
Cada distribuição normal possui uma função geradora da curva. O cálculo dessa área necessita de conhecimentos 
matemáticos mais específicos. 
 
Curva: 
 
 
Aula 9: Correlação e Regressão Linear 
 
Correlação e Regressão 
 
 
Correlação: 
 
 
 
Diagrama de dispersão: 
 
Um exemplo interessante é separar as notas das provas 
dos alunos de uma mesma turma da faculdade A. 
vejamos duas disciplinas da área de Exatas, como por 
exemplo, Matemática e Estatística. Separando uma 
amostra de notas de 10 alunos escolhidos 
aleatoriamente, teremos: 
 
 
 
 
 
Para esboçar um diagrama de dispersão, primeiro traça-
se o sistema de eixos cartesianos ortogonais. Depois, 
representa-se uma das variáveis no eixo “x” (horizontal) 
e outra no eixo “y”(vertical). Colocam-se, então os 
valores das variáveis sobre os respectivos eixos e marca-
se um ponto para cada par de valores. Representemos, 
em um sistema cartesiano coordenado ortogonal, os 
pares ordenados (x,y). Como resultado, obtemos uma 
nuvem de pontos que denominamos diagrama de 
dispersão. Esse diagrama nos fornece uma ideia 
grosseira, porém útil da correlação existente entre as 
variáveis. 
 
Correlação linear 
 
De um modo geral, os pontos de uma análise estatística colocados no gráfico cartesiano possuem a forma aproximada de 
uma elipse em diagonal. Logo, quanto mais fina for essa elipse, 
mais ela se aproximará de uma reta. Essa reta pode ser chamada 
de “imagem” da correlação. 
A correlação linear é a aproximação dessa elipse em uma reta que 
mais se aproxime da maioria dos pontos dados. 
No exemplo ao lado, a “imagem” é uma reta crescente, então é 
denominada correlação linear positiva. 
 
 
 
 
 Os pontos do gráfico têm como “imagem” uma reta crescente. 
 Os pontos do gráfico têm como imagem uma curva. 
 Os pontos do gráfico têm como “imagem” uma reta decrescente. 
 Quando os pontos, por sua elevada dispersão, não seguem nenhum dos casos anteriores, dizemos que não há 
correlação. 
 
Coeficiente de correlação linear 
Dizemos que duas ou mais variáveis expressam a relação de causa e efeito ou se elas variam concomitantemente, se elas 
forem variáveis consideradas correlacionadas. Nesta situação, dizemos que essas variáveis possuem correlação linear, no 
caso de sua imagem ser uma reta. E o instrumento de medida desta correlação linear é o coeficiente de correlação. 
Através do valor deste coeficiente, sabemos o grau de intensidade da correlação entre as duas variáveis, bem como o 
sentido dessa correlação (negativo ou positivo). 
 
Podemos concluir que: 
 
Observações: 
Para que possamos descrever a relação por meio do coeficiente de correlação de Pearson, é fundamental que ela se 
aproxime da função linear. A maneira prática de verificar essa linearidade é a inspeção do diagrama de dispersão. 
Se a elipse apresenta reentrâncias ou saliências mais acentuadas, provavelmente trata-se da correlação curvilínea. r mede 
a intensidade, ou grau, de um relacionamento linear. Não serve para medir a intensidade de um relacionamento não 
linear. 
Coeficiente de correlação linear: 
 
 
 
Regressão 
Todas as vezes que temos duas variáveis com certa correlação e desejamos estudar uma variável em função da outra, 
fazemos uma análise de regressão. O objetivo principal da análise de regressão é realizar a relação entre as duas 
variáveis, a partir de um modelo matemático linear, partindo de n observações delas. A variável sobre a qual desejamos 
fazer a estimativa é denominada variável dependente e a outra recebe o nome de variável independente. 
Considerando X a variável independente e Y a variável dependente, vamos determinar o ajustamento da reta, obtendo a 
função definida por: 
Y = aX + b 
onde a e b são parâmetros. 
 
 
 
 
Voltemos então para o exercício das notas de Matemática e Estatística. 
 
 
 
 
 
 
Aula 10: Números Índices 
Introdução 
Um exemplo simples de números absolutos e relativos pode esclarecer melhor essa ideia. Imagine uma determinada 
faculdade que possua os cursos A, B, C, D e E. Uma pesquisa identifica a quantidade de alunos que trancaram a matrícula 
no ano anterior. 
 
 
Números-índice: 
 
 
 
Relativos de preços 
Sempre que é necessário analisar a variação no preço, na quantidade ou no valor de um determinado bem, é possível 
fazer uso do que chamamos de relativos de preço, de quantidade ou de valor. Fazemos isso através da variação 
percentual do item a ser analisado. 
Vamos considerar o índice o para representar a data-base e o índice t para representar a época atual (ou a ser analisada). 
Determinando o relativo de preços, temos: 
po: preço na época-base; 
pt: preço na época atual. 
 
A fórmula é determinada a partir de uma regra de três simples, na qual fazemos o preço 
na data-base ser equivalente a 100, como segue: 
 
po,t (relativo de preço): é um indicador que reflete a variação de preços de um 
conjunto de bens e serviços entre momentos no tempo. 
 
Do mesmo modo, determinamos: 
 
qo,t (relativo de quantidade): representa as variações das quantidades de conjunto de 
bens ou serviços produzidos, vendidos ou consumidos entre momentos no tempo. 
 
vo,t (relativo de valor): é um indicador que representa as variações dos preços em 
relação às quantidades em momentos diferentes do tempo. 
 
 
Política de segurança operacional: 
Consideramos que os relativos de base móvel formam elos quando cada um deles é calculado tomando como base a data 
imediatamente anterior. 
Suponha que certo produto tenha apresentado os seguintes preços no período de 2008 a 2011: R$ 88,00, R$ 110,00, R$ 
132,00, R$ 198,00. 
 
 
 
 
 
 
 
 
 
 
 
 
Índice de custo de vida 
Até agora, vimos índices utilizados apenas para caracterizar a evolução do preço de um só bem. No entanto, exige-se um 
índice que sintetize a variação dos preços de um conjunto de bens (agregado). Para cumprir essa finalidade, utilizamos o 
índice agregativo. 
Muitas são as formas de determinar os índices agregativos, apesar de os fundamentos básicos serem constantes. Na 
verdade, o que varia são os aspectos relacionados com o campo de aplicação do índice. Um exemplo clássico é o índice de 
inflação, que considera diversas variáveis, com pesos distintos. 
Índice agregativo simples 
 
 
Índice agregativo ponderado 
Este índice é calculado levando em conta a importância relativa dos bens, enquanto que o índice simples considera todos 
os índices do agregado em um mesmo nível. Na prática, sempre temos bens de maior importância do que outros, razão 
pela qual devemos considerar os coeficientes de ponderação, atribuindo a cada item a importância que lhe cabe. 
Para o cálculo do índice agregativo ponderado, existem várias fórmulas, como por exemplo, de Laspeyres, de Paasche, de 
Fisher etc. 
Vamos aplicar o método de ponderação considerado um dos mais usuais na investigação econômica: a fórmula de 
Laspeyres. 
Afórmula de Laspeyres ou método da época-base é obtida ponderando os relativos do preço pelos valores (po . qo) do 
ano base. 
 
Índice de Preços 
 
 
 
 
 
 
Índice de custo de vida 
O índice de custo de vida, também chamado de índice de preço ao consumidor, mede a variação de preços de um 
conjunto de bens e serviços necessários à vida do consumidor final padrão. 
Os principais itens devem ser considerados, tais como: alimentação, vestuário, mobiliário, habitação, lazer, saúde, 
higiene, além dos gastos com água, luz, transporte, educação e outros. 
As famílias, por meio de pesquisas, determinam a lista de bens e serviços consumidos por elas e a percentagem de gastos 
com os respectivos itens. A partir desses dados, é fixado um índice de preço (Laspeyres) para cada grupo. 
Após todos os dados coletados, calcula-se a média aritmética ponderada dos índices de preços dos grupos, onde os pesos 
são os valores percentuais dos gastos com cada grupo na despesa total da família padrão. 
Índice de preços ao consumidor (IPC) 
É um índice que reflete os gastos das famílias com renda de até 8 salários mínimos, onde o chefe da família é assalariado 
em sua ocupação principal. Os gastos são agrupados em categorias de consumo de mesma natureza, como alimentação, 
habitação, vestuário, higiene, transporte, luz, combustível, educação, recreação e diversos. 
A coleta de preços é feita pelo IBGE, em dez regiões metropolitanas. O período pesquisado é do dia 16 do mês ao dia 15 
do mês seguinte. 
Índice de cesta básica (ICB) 
É um índice bimestral usado para a correção do salário mínimo. Tem uma metodologia semelhante ao do IPC, porém 
representa os gastos de famílias com renda de até dois salários mínimos. 
 
Índice geral de preços (IGP) 
 
Política de segurança operacional 
FIPE é a Fundação Instituto de Pesquisas Econômicas da USP, que pesquisa o custo de vida em São Paulo para famílias que 
possuem renda de dois a seis salários mínimos. A FIPE compara os preços médios de quatro semanas com as quatro 
semanas imediatamente anteriores. 
É o índice mais antigo do Brasil e, na opinião de alguns especialistas, é o que melhor mede a inflação, refletindo a variação 
dos preços de alimentos, aluguel, vestuário, transporte etc. 
Deflacionamento de dados 
O aumento dos preços tem como consequência uma baixa no poder de compra ou no valor da moeda, gerando a 
necessidade de realizar uma manutenção no poder de compra dos salários. 
Assim, embora os salários nominais estejam sempre aumentando, os salários reais podem diminuir, devido ao aumento 
do custo de vida (inflação), e, consequentemente, tendo o seu poder aquisitivo reduzido. 
Supondo a situação em que um trabalhador, em 1º de maio de 2011, ganhava X reais por mês, qual deveria ser seu salário 
mensal, em 1º de janeiro de 2012, para que ele se encontrasse em situação equivalente à anterior? 
Este é um problema típico de conversão de salário nominal em salário real, de grande importância quando há inflação. 
Desta forma, sabendo-se que um assalariado, em dezembro de 2010, tinha salário de R$1.071,00 e o índice de preços de 
dezembro de 2010, com base em novembro, era de 101,24%, calcular qual o valor real do salário em dezembro com base 
em novembro. 
 
Ou seja, seu valor aquisitivo é de R$ 1.058,00. 
Esse procedimento é denominado deflacionamento de salários, e o índice de preços usado na determinação do salário 
real é chamado deflator.

Outros materiais