Buscar

ESTATÍSTICA AULA 01

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ESTATÍSTICA DIFERENCIAL – AULA 01
JOÃO MESQUITA
Estatística descritiva e inferencial
A estatística é usualmente dividida em duas partes: a descritiva e a inferencial.
A estatística descritiva, como o próprio nome indica, busca descrever um conjunto de dados por meio de algumas medidas. Acho que a melhor maneira de entender é por meio de um exemplo. Considere uma pesquisa sobre o salário das pessoas de um bairro. Entrevistamos diversos moradores e anotamos seus salários. Um trecho de nossas anotações poderia ser representado assim:
Salários dos moradores no bairro de Boa Viagem:
R$ 5.000,00; R$ 2.000,00; R$ 2.000,00; R$ 7.000,00; R$ 1.000,00; R$ 4.000,00, R$ 2.000,00, R$ 4.000,00, R$ 3.000,00, R$ 6.000,00...
E a lista prosseguiria, com dezenas e dezenas de salários. Só que simplesmente pegar esta listagem e apresentar para alguém não permite, de imediato, tirar conclusões sobre as pessoas deste bairro. São predominantemente de classe média, baixa, alta? O bairro é mais ou menos homogêneo ou abriga pessoas ricas e pobres?
Se em vez de apresentarmos toda a nossa listagem dissermos que o salário médio das pessoas pesquisadas no bairro de Boa Viagem é de R$ 3.600,00, aí sim já podemos começar a tirar algumas conclusões. Esta média descreve, de maneira sucinta, todo o nosso conjunto de dados. É uma medida típica na estatística descritiva.
Já a estatística inferencial tem outro propósito. Se quisermos, a partir da média obtida nesta nossa pesquisa, calcular qual a provável média salarial de todos os moradores do bairro, usaremos ferramentas de estatística inferencial. Seu intuito é fazer generalizações, a partir de alguns valores conhecidos.
População e amostra
Voltemos ao exemplo anterior, em que queríamos pesquisar o salário das pessoas do bairro de Boa Viagem. O conjunto formado pelos salários de todas as pessoas do bairro é a nossa população.
População: conjunto de todos os elementos que possuem uma determinada característica em comum. 
No nosso caso, estamos interessados nos dados que representam salários de pessoas que moram no de Boa Viagem. Esta é a característica de interesse.
Se entrevistarmos todas as pessoas do bairro, estamos realizando um censo. Agora, dependendo da população, fica inviável entrevistar todo mundo. Imagine se for um bairro muito grande. De repente não se tem tempo suficiente para esperar que todo mundo seja entrevistado. Ou não se tem dinheiro para pagar toda a quantidade de pessoal que seria necessária para coletar tais dados. Nestes casos, em vez de entrevistarmos todo mundo, escolhemos uma amostra.
Amostra: qualquer subconjunto não vazio da população.
Apesar de eu ter dito “qualquer subconjunto”, este “qualquer” tem exceção. O conjunto de todos os salários dos moradores (= população) é um subconjunto de si mesmo. Então uma definição mais correta de amostra seria: qualquer subconjunto não vazio da população, exceto a própria população.
O termo apropriado seria: subconjunto próprio.
Um subconjunto próprio é aquele que difere do conjunto original. Com isso, nossa definição de amostra passa a ser:
Amostra: qualquer subconjunto próprio e não vazio da população
Há diversos fatores que nos levam a fazer uma amostragem. No exemplo da pesquisa salarial com os moradores do bairro de Boa Viagem, já demos algumas razões (tempo, custo). Há outras. Considere que se deseje testar a resistência de uma dada mercadoria, produzida em série por uma empresa. O teste consiste em submeter esta mercadoria a pressões cada vez maiores, até que ele arrebente. Não podemos testar todas as mercadorias produzidas. Se não, não sobra nenhum produto e o teste fica sem o menor sentido. Seria o caso daquela piada comum do português (com todo respeito aos portugueses) que risca todos os fósforos da caixa para ver se estão funcionando. Neste caso, testando toda a população, temos uma situação absurda.
Atividade de Classe:
O processo estatístico que consiste em uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população, denomina-se:
a) amostragem
b) estimação
c) censo
d) parametrização
e) correlação
Formas de Apresentação de Dados:
Antes de estudarmos as medidas que descrevem de forma sucinta um conjunto de dados, precisamos saber de quais formas os dados podem ser apresentados. Basicamente, eles podem ser organizados das seguintes formas:
♦ em ROL
♦ em uma tabela, agrupados por valor
♦ em uma tabela, agrupados em classes.
Há ainda as chamadas formas gráficas, que acabam guardando correspondência a pelo menos uma das formas básicas acima indicadas.
Formas não agrupadas de Apresentação de Dados
Dados brutos
Voltemos ao bairro de Boa Viagem. Vamos supor que efetuamos a tal pesquisa no bairro. Entrevistamos apenas dez pessoas. Os resultados obtidos foram:
Salário dos moradores de Boa Viagem – amostra com dez salários: R$ 5.000,00; R$ 2.000,00; R$ 2.000,00; R$ 7.000,00; R$ 1.000,00; R$ 4.000,00, R$ 2.000,00, R$ 4.000,00, R$ 3.000,00, R$ 6.000,00.
O que significa a listagem acima? Significa que chegamos para um primeiro morador e perguntamos: qual o seu salário? Ele responde: R$ 5.000,00. A gente pega e anota este valor. Fazemos a mesma pergunta para uma segunda pessoa. Ela responde: R$ 2.000,00. A gente pega e anota este valor. E assim por diante.
A estes dados desorganizados, chamamos de dados brutos. Eles estão simplesmente na ordem em que foram coletados. Não receberam qualquer tratamento.
Rol
Se colocarmos nossos dados em ordem crescente (ou decrescente) temos um ROL. Geralmente aparece em ordem crescente. O rol da nossa pesquisa ficaria assim:
Rol: R$ 1.000,00; R$ 2.000,00; R$ 2.000,00; R$ 2.000,00; R$ 3.000,00; R$ 4.000,00; R$ 4.000,00; R$ 5.000,00; R$ 6.000,00; R$ 7.000,00.
O rol já é uma primeira forma de organizar nossos dados. É também uma maneira de apresentarmos nossos dados. Como ainda vamos utilizar este exemplo durante algum tempo ao longo do curso, vamos simplificar a escrita. Vamos tirar o símbolo ‘R$’ e indicar apenas as unidades de milhar.
Rol (dados em R$ 1.000,00): 1, 2, 2, 2, 3, 4, 4, 5, 6, 7.
Então rol é apenas isto. Nada mais é que um conjunto de números (resultados de uma pesquisa, de um experimento etc.), colocados em ordem crescente (ou decrescente).
É muito comum que se queira referir a um elemento em particular da nossa série de dados. Uma notação muito usual é: (lê-se “xis, índice i”). É utilizada para nós referimos ao “i-ésimo” elemento. 
Vamos dar um exemplo.
Quem é o terceiro elemento? A pergunta pode ser reescrita como:
Qual o valor de ?
Resposta: o terceiro elemento é 2 (
Para chegar à resposta, simplesmente nos dirigimos ao Rol e contamos. O primeiro elemento é o 1, o segundo elemento é o 2 e o terceiro elemento também é 2.
Abaixo seguem mais valores de :
X1 = 1; X2 = 2; X3 = 2; X4 = 2; X5 = 3; X6 = 4; X7 = 4; X8 = 5; X9 = 6; X10 = 7.
Somatório
Conhecendo esta notação, podemos apresentar uma ferramenta muito importante em estatística: o SOMATÓRIO.
O símbolo de somatório é: 
A utilidade do somatório é possibilitar uma escrita mais compacta. 
Desejamos saber qual o salário total das pessoas pesquisadas. Ou seja, queremos somar todos os valores de salários das dez pessoas entrevistadas. 
Precisamos fazer o seguinte:
X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9 + X10 = 36.
O salário total das dez pessoas entrevistadas é de R$ 36.000,00.
Em vez de escrever desta forma, poderíamos escrever:
=36
O que significa esta simbologia? Significa que queremos somar valores (pois há um símbolo de somatório). Que valores queremos somar? Queremos somar valores de Xi. Quais valores de Xi? Aqueles para os quais ‘i’ vai de 1 até 10.
A expressão =36 nada mais é que uma forma compacta de escrever X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9 + X10 = 36.
Passemos para um outro exemplo. Para a nossa mesma série de dados, vamos calcular .
Sabemos que queremos somar valores(pois há um símbolo de somatório). Queremos somar valores de Xi para os quais ‘i’ vai de 2 até 5. Assim, queremos calcular a seguinte soma:
X2 + X3 + X4 + X5
Substituindo os valores, ficamos com:
 = X2 + X3 + X4 + X5 = 2 + 2 + 2 + 3 = 9.
Atividade de Classe:
01. Considere a seguinte sequência de dados:
2, 6, 1, 4, 6.
02. Obtenha o rol correspondente
03. Considere a seguinte sequência de dados:
3, 1, 4, 2, 7, 3
04. Obtenha o valor de 
05. Para a mesma sequência de dados do exercício anterior, obtenha .
Elementos de uma distribuição de frequências
a) Classes: São os intervalos de variação em uma variável. São representadas por i = 1, 2, 3, …k; onde k é um número total de classe da distribuição.
b) Frequência de uma classe: Indica o número de elementos de uma classe, isto é, o total de vezes que cada valor entra na constituição de uma classe.
c) Intervalo de classe: É o conjunto de números que constitui o intervalo. É a forma mais comum de agrupar os dados.
Os intervalos de classes podem ser representados das seguintes formas:
I – 
II – 
III – 
IV – 
d) Limites de classe: São os extremos de uma classe.
e) Ponto médio de uma classe: É aquele que divide o intervalo de classe em partes iguais.
f) Amplitude total da distribuição: É a diferença entre o limite superior da última classe e o limite inferior da primeira classe – (AT).
Tipos de frequências:
Frequências Simples ou absoluta - fi
São os valores que realmente representam o número de dados de cada classe. A soma das frequências simples é igual ao número total dos dados.
 O símbolo significa somatório. 
Frequência Absoluta Acumulada Crescente – fac
É a soma da frequência absoluta de uma classe com as frequências absolutas de todas as classes anteriores.
Frequência Absoluta Acumulada Decrescente - fad
É a soma da frequência absoluta de uma classe com as frequências absolutas de todas as classes posteriores.
Frequências Relativas - Fi
Indica, em porcentagem, o número de elementos de cada classe.
É determinada quando dividirmos a frequência absoluta de cada classe pela frequência total, isto é, pelo tamanho da amostra. Ou seja:
Evidentemente o somatório das frequências relativas é igual a 1 (100%) ou bastante próximo a 1 (100%). O propósito das frequências relativas é o de permitir a análise ou facilitar as comparações de cada classe com o total de observações.
Frequência Relativa Acumulada Crescente - Fac
É a soma da frequência relativa de uma classe com as frequências relativas de todas as classes anteriores.
Frequência Relativa Acumulada Decrescente - Fad
É a soma da frequência relativa de uma classe com as frequências relativas de todas as classes posteriores.
Atividade de Classe:
01. Considere a seguinte sequência de dados: 2, 3, 1, 2, 4, 3, 9, 2, 10, 5, 12, 4, 4, 7, 2, 4, 1, 10, 3, 3.
a) obtenha o ROL
b) construa a tabela de frequências absolutas simples
c) construa a tabela de frequências absolutas acumuladas
d) construa a tabela de frequências relativas simples
02. Se os pontos médios de uma distribuição de frequências dos pesos dos estudantes de uma classe são; 64, 70, 76, 82, 88, e 94, determine os limites da quarta classe (considere que as classes possuem a mesma amplitude:
a) 78┝ 84.
b) 79┝ 84.
c) 78┝ 82.
d) 79┝ 85.
03. Frequência absoluta simples é:
a) O número de repetições de uma variável;
b) A soma das frequências simples;
c) O número de valores que se repetem divido pelo total de valores;
d) Nada se pode afirmar.
04. Se dividirmos cada frequência absoluta pelo total de frequências absolutas, vamos obter:
a) Frequência acumulada Crescente;
b) Frequência Acumulada decrescente;
c) Frequência Relativa;
d) Frequência Acumulada Relativa.
05. Considere o seguinte ROL:
23, 24, 25, 26, 28, 28, 32, 38, 43, 44, 48, 51, 55, 59, 60, 65, 76, 79, 82.
Elabore o diagrama de ramos e folhas correspondente, adotando as seguintes regras:
- Separe as unidades (folhas) das dezenas (ramos)
- Para cada dezena, utilize duas linhas: uma para algarismos das unidades indo de 0 a 4; outra indo de 5 a 9.
06. Em 20 dias de aula, um professor de estatística anotou o número de alunos ausentes. Depois, fez a seguinte tabela de frequências:
	Alunos ausentes
	Frequência
	Percentual
	0|----|3
	5
	A
	4|----|7
	B
	25
	8|----|12
	C
	D
	12|----|16
	2
	E
A letra B representa o número:
a) 5		b) 6		c) 7		d) 8 		e) 9
MEDIDAS DE POSIÇÃO
Medidas de posição nos fornecem informações acerca de posições que os dados ocupam. Podem ser de dois tipos:
a) Medidas de tendência central (média, mediana e moda).
b) Medidas separatrizes
As medidas de tendência central indicam valores em torno dos quais os dados “giram”. Um exemplo é a média. Se dissermos que a nota média dos alunos em uma prova foi 6, é razoável esperar que as notas “giraram” em torno de 6. Um ou outro aluno deve ter tirado 9 ou 10. Um ou outro deve ter tirado 0 ou 1. Mas a maioria deve ter ficado com uma nota intermediária, uns 4, 5, 6 ou 7.
Se dissermos que a nota média desses mesmos alunos em uma outra prova foi 8, é razoável esperar que as notas giraram em torno de 8. Um ou outro aluno tirou 0 ou 1. Mas o restante deve ter ido muito bem, tirando 6, 7, 8, 9 e 10.
As medidas separatrizes nos ajudam a separar os dados. Um exemplo de medida separatriz é o quartil. Uma série de dados possui três quartis que separam a série de dados em quatro partes.
MÉDIA
A média aritmética dos dados é dada pela soma dos valores observados, dividida pelo total de observações. 
Vamos agora aprender a calculá-la, conforme os dados estejam em rol, agrupados por valor ou em classes.
a) Média aritmética para dados em rol
Vamos a um exemplo para melhor esclarecer:
Salários dos moradores bairro de Boa Viagem:
R$ 5.000,00; R$ 2.000,00; R$ 2.000,00; R$ 7.000,00; R$ 1.000,00; R$ 4.000,00, R$ 2.000,00, R$ 4.000,00, R$ 3.000,00, R$ 6.000,00...
Rol (dados em R$ 1.000,00): 1, 2, 2, 2, 3, 4, 4, 5, 6, 7.
Calculando a soma dos dados, temos:
Só relembrando. A simbologia acima significa que queremos somar valores (pois há um símbolo de somatório). Quais valores? Valores de X para os quais ‘i’ vai de 1 até 10. Ou seja, queremos somar todos os 10 valores observados.
A média fica:
Ou seja, o conjunto de pessoas pesquisadas apresenta um salário médio de R$ 3.600,00.
Média é apenas isto. Basta somar todos os valores e dividir pelo número de dados.
Este símbolo adotado para média () é muito comum. Muitos autores o utilizam. É importante saber isto porque às vezes as provas de concursos simplesmente indicam e não explicam que se trata da média.
Para um conjunto de ‘n’ dados, a média pode ser representada por:
A fórmula acima indica que, para obter a média aritmética, somamos todos os dados e dividimos por n.
Uma coisa que muita gente confunde é o seguinte. Muitas pessoas acham que a média precisa pertencer ao conjunto de dados. Isto é falso. No exemplo acima, a média foi 3,6. E na nossa amostra não há nenhuma pessoa que ganhe um salário de R$ 3.600,00.
Este valor 3,6 só é um indicativo de que os salários das pessoas entrevistadas devem girar em torno de R$ 3.600,00.
Atividade de Classe:
01. Uma empresa possui dois técnicos em informática recebendo salários, mensalmente, de R$ 3.400,00 cada um, quatro economistas recebendo R$ 4.500,00 cada um por mês, um diretor de recursos humanos com salário mensal de R$ 7.000,00 e três outros profissionais recebendo R$ 5.500,00 cada um por mês. A média, mensal, destes salários é:
a) 5.830,00
b) 6.830,00
c) 2.830,00
d) 3.830,00
e) 4.830,00
02. Em determinado mês, a média aritmética dos pagamentos de certo tributo, efetuados por 53 empresas, foi de R$ 2.340,00. Acrescentando-se o pagamento feito por uma nova empresa, a média passou a ser R$ 2.480,00. O valor do tributo pago por esta empresa foi de:
a) 140,00b) 990,00
c) 5.820,00
d) 7.420,00
e) 9.900,00
Propriedades da média aritmética
1) somando ou subtraindo uma constante c de cada elemento do conjunto de dados, a média do novo conjunto fica aumentada ou diminuída de c.
2) multiplicando ou dividindo cada elemento do conjunto de dados por uma constante c, a média do novo conjunto fica multiplicada ou dividida por c.
Outras duas propriedades da média são:
3) a média aritmética é o valor em relação ao qual é mínima a soma dos quadrados dos desvios.
4) a soma de todos os desvios em relação à média aritmética é igual a zero.
Sobre essas duas últimas propriedades, por enquanto vai ficar só o registro de que elas existem. Explicaremos com mais detalhes na aula de medidas de dispersão.
Atividade de Classe:
01. Calcule a média aritmética da seguinte sequência: {1, 3, 5}
02. Calcule a média aritmética da seguinte sequência: {3, 5, 7} (observe que esta foi obtida a partir da sequência anterior, somando 2 a todos os elementos).
03. Calcule a média aritmética da seguinte sequência: {6, 10, 14} (observe que esta sequência foi obtida a partir da anterior, multiplicando todos os elementos por 2).
04. Uma administradora de locação de imóveis, com o objetivo de analisar o mercado em sua região, procedeu às seguintes operações:
I. Multiplicou por dois os valores de todos os alugueis de sua carteira
II. Subtraiu R$ 1.200,00 de cada valor encontrado no item I.
III. Dividiu por R$ 1.000,00 cada valor encontrado no item II
IV. Calculou a média aritmética de todos os valores apurados no item III.
Se o valor encontrado no item IV foi de 3/10, então a média aritmética dos valores dos alugueis em reais é:
a) 2300
b) 1700
c) 1500
d) 1300
e) 750
Média para dados agrupados – Sem intervalo de classe
Fórmula Resolutiva

Continue navegando