Buscar

Estastistica Básica

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Profa. Daniela Gomes - 2007
*
*
Centro Federal de Educação Tecnológica de Química de Nilópolis/RJ 
ESTATÍSTICA BÁSICA
 MÉTODOS QUANTITATIVOS
TRATAMENTO DE DADOS
Profa. Daniela Gomes
Email: danielasgs@oi.com.br
Profa. Daniela Gomes - 2007
*
*
 No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas.
 A Estatística fornece métodos que auxiliam o processo de tomada de decisão.
O QUE É ESTATÍSTICA?
Profa. Daniela Gomes - 2007
*
*
O QUE É ESTATÍSTICA?
Inicialmente a Estatística tratava da compilação de dados (nº de habitantes, nº de nascimentos, estimativas das riquezas etc).
Quando começa a ter aspecto mais científico esse conjunto de técnicas recebe o nome de estatística por Godofredo Achenwall no século XVIII.
Passa da simples catalogação de dados numéricos para ser um estudo mais completo desses dados.
O método estatístico trata-se de um conjunto de técnicas para coletar, organizar, descrever, analisar e interpretar dados.
Com base nos resultados obtidos, busca-se subsídios para planejar e tomar decisões.
Profa. Daniela Gomes - 2007
*
*
A ESTATÍSTICA E A PROBABILIDADE
A probabilidade tem origem no século XVII, surgindo bem depois da Estatística, e tem como objetivo resolver questões de jogo de azar.
Somente no século XX a probabilidade obteve teoria matemática mais rigorosa fundamentada em axiomas, definições e teoremas.
A junção da probabilidade à Estatística permitiu, com base na análise de dados, extrair conclusões mais válidas sobre o fenômeno observado, auxiliando com maior precisão a tomada de decisão.
Profa. Daniela Gomes - 2007
*
*
 Estatística Descritiva => parte da Estatística que aborda a coleta, a organização e a descrição dos dados.
 Inferência Estatística => trata da análise e interpretação dos dados, baseando-se na evidência amostral para chegar a conclusões sobre uma população.
RAMOS DA ESTATÍSTICA
Profa. Daniela Gomes - 2007
*
*
Como selecionar uma amostra, de tal modo que as informações possam ser expandidas (generalizadas) para a população?
POPULAÇÃO E AMOSTRA
 População ou universo – trata-se do conjunto de todos os elementos (objetos, indivíduos, valores, medidas etc) que apresentam pelo menos uma característica em comum, esse conjunto pode ser finito ou infinito.
 Amostra – é um subconjunto finito extraído da população, onde, com base nos resultados observados nessa amostra é possível chegar a conclusões sobre a população.
A partir de observações de partes do todo, deseja-se obter informações sobre esse todo. Em outras palavras, é possível chegar a diagnósticos e conclusões sobre a população.
Profa. Daniela Gomes - 2007
*
*
AMOSTRAGEM
Amostragem é o processo de seleção para se obter amostras, pode ser probabilística (aleatória) ou não probabilística.
 Amostragem Probabilística – cada elemento da população tem a mesma chance (probabilidade) de participar da amostra. Esse tipo de amostragem é planejada a fim de evitar qualquer tipo de tendenciosidade.
 Amostragem Não Probabilística – ocorre quando os elementos da população não têm a mesma chance de serem representados na amostra.
Profa. Daniela Gomes - 2007
*
*
AMOSTRAGEM
 Principais tipos de Amostragem Probabilística:
 
Aleatória Simples (ou Casual): processo mais elementar e freqüentemente utilizado, equivale a um sorteio lotérico. Numera-se a população de 1 a n e, em seguida, realiza-se um sorteio aleatório de x elementos dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra.
 Estratificada (ou proporcional): classifica a população em pelo menos dois estratos (ou subpopulações) que possuem as mesmas características, para, assim, extrair uma amostra de cada estrato. Ex. sexo (masculino e feminino).
 Sistemática: escolhe-se um ponto de partida e seleciona-se o késimo elemento da população, ou seja, escolhe-se cada elemento de ordem k. Ex. pesquisa em uma rua residencial com k=10, onde a primeira casa sorteada aleatoriamente foi a casa 8, sendo assim, a próxima será a casa 18 etc.
 Por conglomerado: divide-se a área da população em conglomerados (ou seções), depois, seleciona-se aleatoriamente algumas dessas seções e, finalmente, considera-se todos os elementos dos conglomerados selecionados. Ex. pesquisa pré-eleitoral: seleciona-se aleatoriamente 30 zonas eleitorais e, realiza-se a pesquisa com todos os elementos das zona selecionadas.
Profa. Daniela Gomes - 2007
*
*
AMOSTRAGEM
 Principais tipos de Amostragem Não Probabilística:
 Amostragem de conveniência: utiliza-se os resultados de fácil acesso, isto é, o que se tem disponível. Ex. pesquisas de opinião em praças públicas.
 Amostragem por cotas: Ex. pesquisa sobre o "trabalho das mulheres na atualidade", provavelmente se terá interesse em considerar: a divisão cidade e campo, a habitação, o número de filhos, a idade dos filhos, a renda média, as faixas etárias etc.
 Amostragem intencional: escolhe-se intencionalmente um grupo de elementos que irão compor a amostra, cujo os quais se deseja saber a opinião. Ex. pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza para entrevistar clientes e funcionários do salão. 
Profa. Daniela Gomes - 2007
*
*
DADOS BRUTOS: dados originais na forma com que foram coletados, refere-se aqueles dados que não foram numericamente organizados ou ordenados.
ROL ESTATÍSTICO: dados numéricos arranjados em ordem de grandeza crescente ou decrescente.
AMPLITUDE TOTAL: com os dados elaborados pode-se estimar a amplitude total do conjunto de dados (A), a partir da diferença entre o maior e menor valor observados no conjunto.
A = Xn – X1 = MAIOR VALOR – MENOR VALOR
VARIÁVEL: característica dos elementos observados.
CENSO: estudo realizado com todos os elementos de uma população.
PESQUISA: estudo realizado a partir de uma amostra.
CONCEITOS BÁSICOS
Profa. Daniela Gomes - 2007
*
*
Profa. Daniela Gomes - 2007
*
*
DADOS BRUTOS: dados originais na forma com que foram coletados, refere-se aqueles dados que não foram numericamente organizados ou ordenados.
ROL ESTATÍSTICO: dados numéricos arranjados em ordem de grandeza crescente ou decrescente.
AMPLITUDE TOTAL: com os dados elaborados pode-se estimar a amplitude total do conjunto de dados (A), a partir da diferença entre o maior e menor valor observados no conjunto.
A = Xn – X1 = MAIOR VALOR – MENOR VALOR
VARIÁVEL: característica dos elementos observados.
CENSO: estudo realizado com todos os elementos de uma população.
PESQUISA: estudo realizado a partir de uma amostra.
CONCEITOS BÁSICOS
Profa. Daniela Gomes - 2007
*
*
Variáveis Qualitativas:
Expressam atributos, qualidades dos elementos pesquisados.
Exemplos: estado civil, profissão, escolaridade (fundamental, médio, superior), sexo.
VARIÁVEIS
Variáveis Quantitativas:
Implicam em relações de mensuração, medida, contagem.
Exemplos: salário, idade, preço, produção, escolaridade (nº de anos na escola), nº de filhos.
Profa. Daniela Gomes - 2007
*
*
TIPOS DE VARIÁVEIS
Nominal: não é possível fazer nenhuma classificação depois das realizações.
Ordinal: é possível atribuir alguma ordem aos indivíduos depois de atribuída a característica.
Discreta: valores assumem um conjunto finito de valores possíveis.
Contínua: valores pertencem a um intervalo dos número Reais.
Profa. Daniela Gomes - 2007
*
*
TIPOS DE MENSURAÇÃO
Os dados também podem ser classificados quanto ao tipo de mensuração: nominal, ordinal, intervalar e razão.
Nominal – trata-se de dados que consistem em nomes, rótulos e categorias. Não é possível realizar nenhum tipo de ordenação e nenhum cálculo com dados do tipo nominal. Ex. respostas do tipo “sim, não, não sei informar”; “partido político do deputados”.
Ordinal – refere-se aos dados que podem ser ordenados de algum modo, ainda assim, não faz sentido realizar cálculos. Ex. respostas do tipo “ótimo,
bom, ruim, péssimo”.
Intervalar – é análogo ao nível ordinal, porém é possível realizar cálculos. Neste caso, não existe um ponto de partida zero, por exemplo, as temperaturas 35,8ºC e 35,3ºC são dados de nível intervalar, porém quando se registra temperatura igual a 0ºC isso não significa ausência de calor (não existe zero absoluto)
Razão – é o nível de intervalo incluindo o ponto de partida zero, pois o zero significa nenhuma quantidade presente. Ex. distância em Km percorrida por dois carros em uma prova.
Profa. Daniela Gomes - 2007
*
*
DISTRIBUIÇÃO DE FREQÜÊNCIA
Trata-se de um modo de organizar um conjunto de realizações observadas a fim de obter uma idéia de seu comportamento, ou seja, de sua distribuição.
 Para variáveis discretas: proporção em relação à característica.
 Para variáveis contínuas: proporção em relação a intervalos.
Relaciona categorias ou classes de valores, juntamente com contagens ou freqüências do número de valores que se enquadram em cada categoria
Profa. Daniela Gomes - 2007
*
*
DISTRIBUIÇÃO DE FREQÜÊNCIA
Sem intervalos de classe
Distribuição das famílias segundo o número de filhos
Fonte: Hipotética.
Profa. Daniela Gomes - 2007
*
*
DISTRIBUIÇÃO DE FREQÜÊNCIA
Com intervalos de classe
Distribuição da estatura (cm) dos alunos do curso de Estatística
Fonte: Hipotética.
Profa. Daniela Gomes - 2007
*
*
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA
a) Limites inferiores de classe ( ): os menores valores do intervalo de classes; 
b) Limites inferiores de classe ( ): os maiores valores do intervalo de classes;
c) Amplitude de classe: é a diferença entre dois limites inferiores de classe consecutivos;
d) Pontos médios de classe ( ):
e) Freqüência absoluta ou simples ( ): número de observações correspondente a determinada classe ou categoria ou valor.
Desse modo, .
f) Freqüência relativa ( ): é a razão entre a freqüência simples e a freqüência total da classe, multiplicada por cem (%): 
g) Freqüência acumulada ( ): é a soma das freqüências de uma classe e de todas as classes que a antecedem, partindo da freqüência da primeira classe.
h) Freqüência acumulada relativa ( ): é a freqüência acumulada de uma classe dividida pela freqüência total da distribuição, multiplicada por cem (%): 
Profa. Daniela Gomes - 2007
*
*
PASSOS PARA CONSTRUIR UMA DISTRIBUIÇÃO DE FREQÜÊNCIA
a) Determinar o número de classes: geralmente o número de classes é escolhido por muitos autores em um valor entre 5 e 20, de uma forma empírica. A familiaridade do pesquisador com os dados é que deve indicar quantas classes devem ser construídas.
b) Amplitude de classe: na construção da distribuição de freqüência define-se a amplitude de classe como sendo a diferença entre o maior e o menor valor do rol dividida pelo número de classes.
c) Limite inferior da primeira classe ( ): deve-se iniciar o processo de construção das classes determinando o limite inferior da primeira classe a ser formada. A escolha deste valor é feita por muitos autores, como menor valor amostral, ou seja, o menor valor observado no rol estatístico (ponto de partida).
d) Determinação dos limites inferiores das demais classes: somar ao valor do limite inferior da primeira classe a amplitude de classe para obter o limite inferior da segunda classe, e, assim, sucessivamente.
e) Limite superior ( ): o limite superior da primeira classe será o limite inferior da segunda classe e, assim, sucessivamente, até que o maior valor observado esteja contido na última classe.
f) Determinar a freqüência total de cada classe.
Profa. Daniela Gomes - 2007
*
*
Exemplo de distribuição de freqüência com intervalos de classes:
DISTRIBUIÇÃO DE FREQÜÊNCIA
1. Quantos alunos têm estatura entre 154 e 157 cm?
2. Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm?
3. Quantos alunos têm estatura inferior a 162 cm?
4. Quantos alunos têm estatura superior a 158 cm?
Profa. Daniela Gomes - 2007
*
*
MEDIDAS DE TENDÊNCIA CENTRAL
Corresponde a um valor no centro ou no meio do conjunto de dados, o qual permite traduzir algumas características desse conjunto de dados. Em outra palavras, uma medida de tendência central procura sintetizar as informações da amostra em um único e informativo valor.
As principais medidas de tendência central são: a média aritmética; a mediana e a moda.
Profa. Daniela Gomes - 2007
*
*
A MÉDIA ARITMÉTICA
A média aritmética é a principal medida de tendência central, sendo utilizada principalmente quando os dados apresentam distribuição simétrica ou aproximadamente simétrica. É o centro do conjunto de dados, ou seja, um ponto de equilíbrio dos mesmos, tratando-se da soma de todas as observações dividida pelo total do número de observações.
Observações:
1) A média é um bom estimador quando na série de dados não existem valores atípicos (ou extremos). Quando há valores atípicos no conjunto de dados, a média pode ser bastante afetada tanto por valores extremos mínimos quanto por valores extremos máximos.
2) O que é uma distribuição simétrica ou aproximadamente simétrica?
Diz-se que uma distribuição é simétrica quando a metade esquerda de seu histograma é a imagem-espelho da metade direita.
Profa. Daniela Gomes - 2007
*
*
A MÉDIA ARITMÉTICA
Observação para média de dados agrupados com intervalos de classe:
 A hipótese tabular básica, considera que todos os elementos de uma classe são representados pelo seu ponto médio, fato este, que pode não ser verdadeiro em muitas as situações. Porém, este resultado é apenas uma aproximação e, neste caso, o erro cometido é mínimo, portanto, pode ser desprezado.
Profa. Daniela Gomes - 2007
*
*
PROPRIEDADES DA MÉDIA ARITMÉTICA
1ª) A soma algébrica dos desvios tomados em relação a média é nula. O desvio em relação a média é a diferença entre cada elemento de um conjunto de valores e a média aritmética desse conjunto: . 
Então,
2ª) Somando-se ou subtraindo-se uma constante c a todos os valores de um conjunto de dados, a média do conjunto fica aumentada ou diminuída dessa constante.
Ou seja, , onde, é a média do novo conjunto de dados.
3ª) Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante c, a média do conjunto fica multiplicada ou dividida por essa constante. 
Desse modo, , é a média do novo conjunto de dados. 
Profa. Daniela Gomes - 2007
*
*
A MEDIANA (Md)
A mediana corresponde ao valor que se encontra no meio (centro) de uma série de dados, quando os dados estão dispostos em uma ordem de grandeza crescente ou decrescente. Isto é, divide o conjunto de dados (a partir das observações ordenadas) em duas partes iguais.
Determinando o valor da mediana para dados não-agrupados a partir do conhecimento da posição central:
 para n for ímpar o valor mediano ocupará a posição . Neste caso, o valor da mediana será exatamente o número correspondente a tal posição na série de dados.
 se n for par, a mediana será a média entre os dois termos que ocupam as posições e . 
Profa. Daniela Gomes - 2007
*
*
Mediana para dados agrupados sem intervalos de classe:
É necessário determinar as freqüências acumuladas para verificar a posição em que a mediana se encontra. Pois, a mediana será o valor da variável correspondente a freqüência acumulada imediatamente superior à metade da soma das freqüências.
Ou seja,
Observação:
Se , a mediana será , correspondente ao encontrado.
A MEDIANA (Md)
Profa. Daniela Gomes - 2007
*
*
Mediana para dados agrupados com intervalos de classe:
Ao determinar a classe mediana correspondente a freqüência acumulada imediatamente
superior a , utiliza-se a seguinte fórmula:
 - limite inferior da classe mediana
 - posição (ordem) do valor da mediana
 - freqüência acumulada da classe anterior à classe mediana
 - freqüência simples da classe mediana
 - amplitude do intervalo da classe mediana
Observação: caso exista uma freqüência acumulada exatamente igual a , a mediana será o limite superior da classe correspondente.
A MEDIANA (Md)
Profa. Daniela Gomes - 2007
*
*
PROPRIEDADES DA MEDIANA
1ª) Somando-se ou subtraindo-se uma constante c a todos os valores de um conjunto de dados, a mediana do conjunto também ficará aumentada ou diminuída dessa constante.
2ª) Assim como a média a mediana é influenciada quando o conjunto de dados é multiplicado ou dividido por determinada constante c. Nesse caso, a mediana do conjunto fica multiplicada ou dividida por essa constante. 
Profa. Daniela Gomes - 2007
*
*
A MODA (Mo)
 A moda de uma série de dados corresponde a observação que ocorre com maior freqüência.
 Um conjunto de dados pode ser classificado como: modal (apenas uma observação ocorre com freqüência máxima); bimodal (duas observações ocorrem com a mesma freqüência máxima); multimodal (mais de duas observações ocorrem com a mesma freqüência máxima); amodal (nenhum valor é repetido, o conjunto não tem moda).
 A moda é a única medida de tendência central que pode ser utilizada para variáveis qualitativas.
 A moda para dados agrupados sem intervalos de classe será o valor da variável de maior freqüência.
 Já para dados agrupados com intervalos de classe, determina-se primeiro a classe modal, a partir da classe que apresenta maior freqüência e, aplica-se a fórmula de Czuber.
 - limite inferior da classe modal
 - diferença entre a freqüência simples da classe modal e a freqüência simples da classe anterior à classe modal
 - diferença entre a freqüência simples da classe modal e a freqüência simples da classe posterior à classe modal
 - amplitude da classe modal
Profa. Daniela Gomes - 2007
*
*
PROPRIEDADES DA MODA
1ª) Também nesse caso, somando-se ou subtraindo-se uma constante c a todos os valores de um conjunto de dados, a moda do conjunto também ficará aumentada ou diminuída dessa constante.
2ª) A moda é influenciada quando o conjunto de dados é multiplicado ou dividido por determinada constante c. Nesse caso, a nova moda do conjunto fica multiplicada ou dividida por essa constante. 
Profa. Daniela Gomes - 2007
*
*
BIBLIOGRAFIA
BUSSAB, W. O. e MORETTIN, P. A. Estatística básica. 5ª edição (8ª tiragem). Ed. Saraiva: São Paulo, SP, 2007.
CRESPO, Antônio Arnot. Estatística Básica. 1ª Edição. São Paulo, SP: Saraiva, 1984. 
MEYER, P.L. Probabilidade, aplicações a estatística. Tradução de Ruy C. B. Lourenço Filho. Rio de Janeiro, RJ, 1984.
SPIEGEL, Murray R, et al. Teoria de Problemas de Probabilidade e Estatística. Trad. Sara Ianda Correa Carmona. 2ª Edição. Porto Alegre, RS: Bookman, 2004. (Coleção Shaum) 
TIOLA, Mário F. Introdução a Estatística. Trad. Alfredo Alves de Farias. 7ª Edição. Rio de Janeiro, RJ: LTC, 1998.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando