Estatistica

•

UCAM

0

Rafa Berga

25.10.2017

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Matemática

626.891 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Conceitos Básicos
A Estatística é a ciência voltada para a construção de técnicas e métodos que permitem tomar decisões nos
mais deferentes setores do conhecimento. O que hoje se conhece por Estatística, é justamente esse conjunto
de ferramentas de pesquisa que envolve, entre outros, o planejamento do experimento a ser realizado, a
coleta qualificada dos dados, os processos de inferência estatística, bem como a análise e o processamento
das informações coletadas.
1.1. Definições importantes
Na estatística temos algumas definições importantes:
 População: Qualquer conjunto de informação que tenha entre si uma característica comum
que delimite os elementos pertencentes a ela.
 Amostra: É um subconjunto de elementos pertencentes a uma população.
 Variável: Dados referentes a uma característica de interesse, coletados a partir de uma
amostra.
 Censo: Exame de todos os elementos da população.

VARIÁVEL QUALITATIVA: Quando seus valores são expressos por atributos: sexo, cor da pele,
etc.
VARIÁVEL QUANTITATIVA: Quando os dados são de caráter nitidamente quantitativo, e o
conjunto dos resultados possui uma estrutura numérica, trata-se, portanto, da estatística de
variável e se dividem em:
VARIÁVEL DISCRETA OU DESCONTÍNUA: Seus valores são expressos geralmente através
de números inteiros não negativos. Resulta normalmente de contagens. Ex: Nº de alunos
presentes às aulas de introdução à estatística econômica no 1º semestre de 2017: mar = 18 , abr
= 30 , mai = 35 , jun = 36.
VARIÁVEL CONTÍNUA: Resulta normalmente de uma mensuração, e a escala numérica de seus
possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem assumir,
teoricamente, qualquer valor entre dois limites. Ex.: Quando você vai medir a temperatura de
seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio, ao
dilatar-se, passará por todas as temperaturas intermediárias até chegar na temperatura atual
do seu corpo.
Exemplos -
. Cor dos olhos das alunas: qualitativa
. Índice de liquidez nas indústrias capixabas: quantitativa contínua
. Produção de café no Brasil: quantitativa contínua
. Número de defeitos em aparelhos de TV: quantitativa discreta
. Comprimento dos pregos produzidos por uma empresa: quantitativa contínua
. O ponto obtido em cada jogada de um dado: quantitativa discreta

1.2 Tabelas Estatísticas
Na estatística é fundamental aprendermos a representar os dados que serão analisados por
meio de tabelas.
A tabela é um quadro que resume um conjunto de dados dispostos segundo linhas e
colunas de maneira sistemática.

1.2.1 Série Cronológica ou Temporal
Um exemplo muito comum e muito útil de tabela é dado pelas séries temporais. Uma
série temporal consiste em uma sequência numérica cujos valores variam com o tempo.
Abaixo vemos como inserir os dados de uma série temporal em uma tabela:

1.2.2 Série Geográfica
Muitas vezes o dado de interesse pode depender a posição geográfica de onde foram
coletados. Assim, uma série geográfica consiste em uma sequência numérica obtidas em
diferentes regiões em um determinado instante do tempo.

1.2.3 Série Específica
Uma série importante é formada por dados agrupados por alguma espécie ou
característica comum. Assim, uma série específica é uma série numérica agrupada por
tipo. Temos o exemplo abaixo:

1.3 Distribuição de Frequência
Uma distribuição de frequência é uma tabela que contém um resumo dos dados obtido
em uma amostra.
A distribuição é organizada em formato de tabela, e cada entrada da tabela contém a
frequência dos dados em um determinado intervalo, ou em um grupo. Abaixo vemos um
exemplo simplificado de tabela de distribuição de frequência:

1.3.1 Construção de uma distribuição de frequência
Para ilustrar como se constrói uma distribuição de frequência, nós vamos considerar um
exemplo específico.
Assim, suponha que uma pesquisa foi feita, e o seguinte conjunto de dados foi obtido:
• Dados Brutos:
24-23-22-28-35-21-23-33-34-24-21-25-36-26-22-30-32-25-26-33-34-21-
31-25-31-26-25-35-33-31.
A primeira coisa que fazemos é ordenar os dados do menor para o maior, formando o rol
de dados:

• Rol de dados:

21-21-21-22-22-23-23-24-25-25-25-25-26-26-26-28-30-31-31-31-32-33-
33-33-34-34-34-35-35-36.

Em seguida, calculamos a amplitude total, ou seja, o maior valor obtido na amostra
subtraído do menor valor obtido na amostra:

• Amplitude Total R:

R = 36 - 21 = 15:

Vamos agora definir as variáveis de interesse, ou seja, para cada valor distinto obtido na
amostra, atribuiremos uma variável diferente:

• Variável Xi:
X1 = 21; X2 = 22; X3 = 23; X4 = 24; etc:

O próximo passo é calcular a frequência absoluta das variáveis, ou seja, vamos calcular
quantas vezes cada valor aparece na sequência. Por exemplo, o valor 21 aparece 3 vezes,
o valor 22 aparece 2 vezes, etc.. Assim, obtemos:

• Frequência simples ou Absoluta Fi
F1 = 3; F2 = 2; F3 = 2; F4 = 1; etc:

Vamos calcular, agora, o tamanho amostral, ou seja, o número de observações obtidas na
amostra. Desta forma, temos:

• Tamanho Amostral n:
n = 30:

Queremos, agora, dividir a amostra em uma quantidade de grupos que formarão os
intervalos. Cada grupo é chamado de classe, assim, queremos definir o número de classes
a ser considerado na tabela de distribuição de frequência:

 Número de Classes K:

k = onde, n= totais valores a serem organizados
Obs. Caso a raiz não seja número inteiro, não se usará a regra de arredondamento, mas sim,
arredonda-se para o próximo número inteiro. Ex. 5,1 = 6,0
Ou

O próximo passo é saber o comprimento de cada intervalo a ser considerado, ou seja,
calcular a amplitude de cada classe. Queremos que todas as classes tenham a mesma
amplitude e portanto, temos:

• Amplitude das Classes h:

Vamos agora definir os limites das classes. Ou seja, definir os intervalos propriamente
ditos. Para tanto, começamos com o menor valor obtido da amostra, ou equivalentemente,
o primeiro valor do rol de dados, e vamos somando a amplitude para definir cada limite
de intervalo:

 Limites das Classes:

Denominamos limites de classe os extremos de cada classe.
• O menor número é o limite inferior da classe (li) e o maior número, o limite superior da
classe (Li).
Amplitude de um intervalo de classe (hi)
Amplitude de um intervalo de classe é a medida (tamanho) do intervalo que define a classe.
Ela é obtida pela diferença entre os limites superiores e inferiores dessa classe e indicada por
hi. Assim:
hi = Li – li
Amplitude amostral (AA)
Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da amostra:
AA = x(máx) – x(mín)

Notação: Nas distribuições de Frequência, usa-se as seguintes convenções, usuais em
Matemática e na Estatística:
• 0 ┤10 – corresponde a valores de variável maiores do que zero e menores ou iguais a
dez.
• 0├ 10 – corresponde a valores da variável, maiores ou iguais a zero e menores do que
dez.
• 0 – 10 – corresponde aos valores da variável maiores do que zero e menores do que dez.
• 0 ├┤10 – corresponde os valoresda variável, maiores ou iguais a zero e menores ou
iguais a dez.

Em seguida, calculamos os pontos médios das classes, que nada mais é que a média
aritmética entre os limites das classes:

• Pontos Médios das Classes pmi:

Agora, calculamos as frequências dos dados em cada intervalo e, chamada de frequência
absoluta, e também a frequência acumulada, chamada de frequência absoluta acumulada,
que considera a soma das frequências dos intervalos anteriores até o intervalo
considerado:

Em seguida, inclui-se as frequências relativas dos dados, ou seja, para cada intervalo
calcula-se fi = Fi/n. A frequência relativa, nos informa a proporção dos dados que
pertencem a um determinado intervalo.
Frequência Relativa fi:

Para finalizar, calculamos a frequência acumulada relativa, ou seja, calculamos para cada
intervalo fac = Fac/n:

Frequência Relativa Acumulada fac:

Medidas de Posição
As medidas de posição são valores que representam a tendência de concentração dos
dados observados. As mais importantes são as medidas de tendência central. As três
medidas de tendência central mais utilizadas são: média aritmética, moda e mediana.

Média Aritmética ( )
É o quociente da divisão da soma dos valores da variável pelo número deles: ( dados não
agrupados)
Notação: representamos a média de um conjunto de dados por (lê-se x barra).
– a média aritmética;
xi – os valores da variável;
n – o número de valores.
Desvio em relação à média
Denominamos desvio em relação à média a diferença entre cada elemento de um
conjunto de valores e a média aritmética. Fórmula:
di = xi –

Mediana
Definimos a mediana de um conjunto de dados como o valor que divide um conjunto de
dados (ordenados) em duas partes com a mesma quantidade de dados.
Notação: representamos a mediana de um conjunto de dados por Md.
O elemento mediano (EMd) aponta o local (nos dados) onde a mediana está localizada.
A mediana será o valor assumido na posição EMd.

– No caso de dados brutos, se o tamanho amostral (n) é ímpar, temos que EMd = (n+1)/2.

1, 2, 4, 5 e 8. Como n é ímpar, temos EMd = 3°, e Md = 4.

– Note que no caso tamanho amostral é par, teremos dois valores possíveis para o
elemento mediano, neste caso a mediana será a média dos valores assumidos nestas
posições.

2, 2, 3, 7, 8 e 10. Aqui n é par, assim:

Md= (3+7) /2=5.

Moda
Definimos a moda de um conjunto de dados como o valor mais frequente deste conjunto.
Notação: representamos a moda de um conjunto de dados por Mo.

Exemplo de modas
• 1, 2, 4, 5 e 8 - não existe valor mais frequente - não existe moda (Amodal).
• 2, 2, 3, 7 e 8 - Mo = 2 (Unimodal).
• 1, 1, 10, 5, 5, 8, 7, 2 - Mo = 1 e 5 (Bimodal).

Gráficos Estatísticos
Histograma
Um histograma nada mais é que uma representação gráfica de uma distribuição de frequência.
Um histograma é formado por retângulos justapostos, sendo que a base do retângulo é formada
pelos intervalos de classe e a altura será determinada pela frequência – absoluta ou relativa –
de cada classe. Um histograma fornece uma representação visual da distribuição dos dados.

Gráfico de Linhas
Suponha que temos duas variáveis, por exemplo, podemos ter os dados de uma série
temporal, donde uma variável seria o valor obtido, e a outra variável seria a data em que
o valor foi obtido. Outra possibilidade seria colocar dados de uma série geográfica, onde
uma variável seria formada pelos dados e a outra seria a localização geográfica.
O gráfico de linhas então é formado construindo pontos no plano (a partir das duas
variáveis) e, em seguida, estes pontos são ligados por segmentos de retas.

Gráfico de Colunas
Um gráfico de colunas é formado por uma coleção de colunas, com bases de
mesmo comprimento, e igualmente espaçados. O eixo horizontal do gráfico
consiste das diferentes categorias consideradas, e o eixo vertical é proporcional
ao valor do dado.

Gráfico em Barras
O gráfico em barras pode ser entendido como uma variação do gráfico de
colunas. De fato, o gráfico em barras é formado por uma coleção de barras, de
mesma altura e igualmente espaçadas. Entretanto, neste caso o eixo vertical
representa as diferentes categorias consideradas e o eixo horizontal é
proporcional ao valor dado.

Gráfico de Setores
O gráfico de setores, que também é popularmente conhecido como gráfico pizza, é um
gráfico em que um círculo é dividido em setores (que podem ser pensados como as fatias
da pizza), onde cada setor representa uma categoria considerada pelo conjunto de dados,
e os ângulos dos setores são proporcionais aos valores dos dados em cada categoria.
Assim, quanto maior o valor obtido, maior será o ângulo do setor (e assim, maior será a
fatia da pizza).