Buscar

Apostila-parteI

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

CONCEITOS INICIAIS EM ESTATI´STICA
1 O que e´ Estat´ıstica?
A estat´ıstica e´ o ramo da matema´tica interessado nos me´todos cient´ıficos para coleta,organizac¸a˜o,
resumo, apresentac¸a˜o e ana´lise de dados, bem como na obtenc¸a˜o de concluso˜es va´lidas e na
tomada de deciso˜es razoa´veis baseadas em tais ana´lises.
Estat´ıstica e´ um conjunto de me´todos e te´cnicas que auxiliam a tomada de decisa˜o sobre a
presenc¸a de incerteza.
1.1 Subdiviso˜es da Estat´ıstica
A estat´ıstica pode ser dividida em treˆs grandes a´reas:
• Estat´ıstica Descritiva ou Ana´lise Explorato´ria dos Dados
• Probabilidade
• Estat´ıstica Indutiva ou Infereˆncia Estat´ıstica
Estat´ıstica Descritiva: E´, em geral, utilizada na etapa inicial da ana´lise, quando tomamos
contato com os dados pela primeira vez. Pode ser definida como um conjunto de te´cnicas des-
tinadas a descrever e resumir os dados, a fim de que possamos tirar informac¸o˜es e concluso˜es a
respeito de caracter´ısticas de interesse.
A Estat´ıstica Descritiva pode ser resumida da seguinte forma:
Tabelas
Coleta de ⇒ Cr´ıtica ⇒ Apresentac¸a˜o ⇒ Ana´lise
dados de dados dos Dados
Gra´ficos
Probabilidade: E´ a base matema´tica sob a qual a Estat´ıstica e´ constru´ıda. Fornece
me´todos para quantificar a incerteza existente em determinada situac¸a˜o, usando ora um nu´mero
ora uma func¸a˜o matema´tica.
A Infereˆncia Estat´ıstica: Consiste em obter e generalizar concluso˜es; ou seja, inferir
propriedades para o todo com base na parte, no particular. E´ tratada atrave´s de te´cnicas e
me´todos que se fundamentam na Teoria das Probabilidades. A infereˆncia estat´ıstica envolve
questo˜es de dois tipos: a estimac¸a˜o de paraˆmetros populacionais e os testes de hipo´teses.
Em estat´ıstica utilizaremos extensivamente os termos populac¸a˜o e amostra. Assim, definire-
mos esses termos no contexto da estat´ıstica:
• Populac¸a˜o: conjunto da totalidade dos elementos (valores, pessoas, medidas) a serem
estudados. Congrega todas as observac¸o˜es que sejam relevantes para o estudo de uma ou
mais caracter´ısticas dos indiv´ıduos. Podem ser tanto seres animados ou inanimados.
• Amostra: um subconjunto de elementos extra´ıdos de uma populac¸a˜o.
• Censo: e´ uma colec¸a˜o de dados relativos a todos os elementos de uma populac¸a˜o.
1
2 ESTATI´STICA DESCRITIVA
2.1 Fases do Trabalho Estat´ıstico
A estat´ıstica esta´ envolvida em todas as etapas de um projeto de pesquisa. A seguir as fases de
um trabalho cientif´ıco sa˜o citadas do ponto de vista do trabalho estat´ıstico. As fases do trabalho
estat´ıstico sa˜o do aˆmbito da Estat´ıstica Descritiva, e sa˜o as principais fases as seguintes:
1. Definic¸a˜o do Problema: Consiste na:
• formulac¸a˜o correta do problema;
• examinar outros levantamentos realizados no mesmo campo (revisa˜o da literatura);
• saber exatamente o que se pretende pesquisar definindo o problema corretamente
(varia´veis, populac¸a˜o, hipo´teses, etc.)
2. Planejamento: - Determinar o procedimento necessa´rio para resolver o problema:
• Como levantar informac¸o˜es;
• Tipos de levantamentos: por censo (completo) ou por amostragem (parcial).
• Cronograma, custos, etc.
3. Coleta de dados (quesitos espec´ıficos para obter informac¸o˜es desejadas): refere-
se a` obtenc¸a˜o, reunia˜o e registro sistema´tico de dados, com um objetivo determinado.
4. Cr´ıtica dos questiona´rios: leitura dos questiona´rios, observac¸a˜o de respostas incom-
pletas, erradas. Supressa˜o de valores estranhos ao levantamento.
5. Apurac¸a˜o dos dados: consiste em resumir os dados, atrave´s de sua contagem e agrupa-
mento. E´ um trabalho de condensac¸a˜o e de tabulac¸a˜o dos dados, que chegam ao analista
de forma desorganizada, tornando imposs´ıvel a tarefa de apreender todo o seu significado
pela simples leitura. Nos dias atuais esta apurac¸a˜o tornou-se sinoˆnimo de organizac¸a˜o de
base de dados, que e´ realizada em computadores.
6. Apresentac¸a˜o dos Dados: ha´ duas formas de apresentac¸a˜o:
a) Apresentac¸a˜o Tabular: apresentac¸a˜o nume´rica dos dados. As tabelas teˆm a vantagem
de conseguir expor, sinteticamente, e em um so´ local, os resultados sobre determinado
assunto, de modo a se obter uma visa˜o global mais ra´pida daquilo que se pretende
analisar.
b) Apresentac¸a˜o Gra´fica: constitui uma apresentac¸a˜o geome´trica. E´ de extrema im-
portaˆncia, no sentido de permitir uma visa˜o ra´pida, fa´cil e clara do fenoˆmeno e sua
variac¸a˜o.
7. Ana´lise e Interpretac¸a˜o dos Dados: O interesse maior consiste em tirar concluso˜es
que auxiliem o pesquisador a resolver seu problema. A analise dos dados estat´ısticos
esta´ ligada essencialmente ao ca´lculo de medidas, cuja finalidade principal e´ descrever o
fenoˆmeno. Assim, o conjunto de dados a ser analisado pode ser expresso por nu´meros-
resumos, as estat´ısticas, que evidenciam caracter´ısticas particulares desse conjunto. O
significado exato de cada um desses valores sera´ explicado posteriormente.
2
2.2 Classificac¸a˜o de Varia´veis
Definiremos varia´vel como qualquer atributo/caracter´ıstica que exerc¸a influeˆncia no fenoˆmeno
estudado. Por exemplo, desejamos registrar a idade das pessoas ao morrer, a estatura ou peso
dos indiv´ıduos, o rendimento das famı´lias em uma grande cidade, o nu´mero de empregados
dispensados, por meˆs, em uma grande empresa,a distribuic¸a˜o dos alunos por sexo, etc.
Antes da escolha da ana´lise descritiva apropriada e´ necessa´ria a classificac¸a˜o da varia´vel
de interesse, pois a adequac¸a˜o da te´cnica esta´ diretamente relacionada ao tipo de varia´vel em
questa˜o.
De acordo com a estrutura nume´rica as varia´veis podem ser classificadas em:
• Qualitativas (ou atributos ou catego´ricos): Sa˜o caracter´ısticas que na˜o podem ser medidas,
ou seja, sa˜o na˜o-nume´ricas.Elas podem ser:
– Nominal : varia´veis em que na˜o e´ poss´ıvel estabelecer uma ordem natural entre seus
valores. Ex.: cor da flor, que pode ser rosa, branca ou vermelha; Sexo (feminino ou
masculino).
– Ordinal ou por postos: varia´veis que teˆm uma ordenac¸a˜o natural, indicando inten-
sidades crescentes de realizac¸a˜o. Ex.: Tamanho (pequeno, me´dio ou grande), Classe
Social (baixa, me´dia ou alta).
• Quantitativas: Sa˜o caracter´ısticas que podem ser contadas ou medidas, sendo classificadas
em discretas e cont´ınuas.
– Discretas: sa˜o aquelas varia´veis que podem assumir somente valores inteiros num
conjunto de valores. E´ gerada pelo processo de contagem. Ex.: nu´mero de folhas
por planta; nu´mero de carrapatos por animal; etc.
– Cont´ınuas: sa˜o aquelas varia´veis que podem assumir um valor dentro de um intervalo
de valores. E´ gerada pelo processo de medic¸a˜o ou mensurac¸a˜o. Ex.: volume de a´gua
em um reservato´rio; peso de raiz; diaˆmetro do caule, etc.
2.3 PARAˆMETRO X ESTIMADOR X ESTIMATIVA
a) Paraˆmetro: e´ uma medida nume´rica que descreve alguma caracter´ıstica da populac¸a˜o. E´
o resumo da varia´vel observada na populac¸a˜o. Por exemplo, me´dia, variaˆncia e desvio
padra˜o.
Cada paraˆmetro e´ representado por um s´ımbolo ou letra. No exemplo tem-se que para a
me´dia, a variaˆncia e o desvio padra˜o as letras gregas µ, σ2 e σ.
Na˜o e´ poss´ıvel fazer infereˆncias baseada em paraˆmetro, uma vez que toda a populac¸a˜o foi
investigada.
b) Estimador (tambe´m chamado de Estat´ıstica): e´ uma medida nume´rica que descreve al-
guma caracter´ıstica de umaamostra, ou seja, o estimador e´ obtido a partir do resumo da
varia´vel observada na amostra. Neste caso, e´ poss´ıvel utilizarmos as teorias infereˆncias
3
para que, com base na amostra, possamos obter concluso˜es sobre a populac¸a˜o.
Cada estimador tambe´m e´ representado por um s´ımbolo ou letra. Para a me´dia, a
variaˆncia e o desvio padra˜o as letras gregas µ̂ ou X , σ̂2 ou S2 e σ̂ ou S.
2.4 Apresentac¸a˜o de Dados
2.4.1 Se´ries Estat´ısticas
As se´ries estat´ısticasresumem um conjunto ordenado de observac¸o˜es atrave´s de treˆs fatores
fundamentais:
• tempo: refere-se a data ou a e´poca em que o fenoˆmeno foi investigado;
• espac¸o: refere-se ao local ou regia˜o onde o fato ocorreu;
• espe´cie: refere-se ao fato ou fenoˆmeno que esta´ sendo investigado e cujos valores nume´ricos
esta˜o sendo apresentados.
As se´ries estat´ısticas sa˜o classificadas de acordo com o fator que estiver variando, podendo
ser simples ou mistas.
1. Se´ries simples
• Se´rie Cronolo´gica (temporal, histo´rica ou evolutiva): onde varia o tempo per-
manecendo fixos o espac¸o e a espe´cie do fenoˆmeno estudado.
Tabela 01: Casos de sarampo notificado no Brasil de 1987 a 1992
• Se´rie Geogra´fica (Espacial, ou Territorial, ou de Localizac¸a˜o): onde varia o espac¸o
permanecendo fixos o tempo e a espe´cie do fenoˆmeno estudado.
Tabela 02: Necessidades me´dias de energia em alguns pa´ıses, em 1973.
4
• Se´rie especificativa (qualitativa ou catego´rica: onde varia a espe´cie permanecendo
fixos o tempo e o espac¸o do fenoˆmeno estudado.
Tabela 03: Abate de animais, por espe´cie, no Brasil, em 1993.
2. Se´ries mistas: sa˜o aquelas em que mais de um fator varia ou um fator varia mais de uma
vez.
• Se´rie histo´rica geogra´fica (ou geogra´fica histo´rica)
Tabela 04: Taxa de atividade feminina urbana, em percentual,
em treˆs regio˜es do Brasil, 1981,90
• Se´rie especificativa geogra´fica (ou geogra´fica especificativa)
Tabela 05: Consumo per capita anual de alguns tipos de alimentos,
em algumas regio˜es metropolitanas do Brasil, no ano de 1988
5
• Se´rie especificativa histo´rica (ou histo´rica especificativa)
Tabela 06: Taxa de mortalidade (em percentual) de menores de um ano no Brasil,
segundo as treˆs principais causas, no per´ıodo de 1984 a 1987
• Se´rie especificativa histo´rica geogra´fica
Tabela 07: Nu´mero de v´ıtimas em acidentes, segundo as grandes regio˜es do Brasil, nos anos
de 1991 e 1992
2.4.2 Tabelas
Tem como finalidade apresentar os dados de modo ordenado, simples e de fa´cil inter-
pretac¸a˜o, fornecendo o ma´ximo de informac¸a˜o num mı´nimo de espac¸o.
A construc¸a˜o de uma tabela, entretanto, deve obedecer a uma se´rie de normas te´cnicas.
Estas normas podem ser encontradas na publicac¸a˜o do IBGE intitulada “Normas de
Apresentac¸a˜o Tabular”.
2.4.3 Elementos da Tabela
• T´ıtulo: e´ a indicac¸a˜o que precede a tabela contendo a designac¸a˜o do fato observado,
o local e a e´poca em que foi estudado.
• Corpo: e´ o conjunto de lihas e colunas onde esta˜o inseridos os dados.
• Cabec¸alho: e´ a parte superior da tabela que indica o conteu´do das colunas.
• Coluna indicadora: e´ a parte da tabela que indica o conteu´do das linhas.
Os elementos complementares sa˜o:
6
• Fonte: entidade que fornece os dados ou elabora a tabela.
• Notas: informac¸o˜es de natureza geral, destinadas a esclarecer o conteu´do das tabelas.
• chamadas: informac¸o˜es espec´ıficas destinadas a esclarecer ou conceituar dados numa
parte da tabela.
Os elementos complementares devem situar-se no rodape´ da tabela, na mesma ordem em
que foram descritos.
2.5 Distribuic¸a˜o de Frequeˆncia e Representac¸a˜o Gra´fica
Uma das formas de organizar e resumir a informac¸a˜o contida em dados observados e´ por
meio de tabela de frequ¨eˆncias e gra´ficos.
A definic¸a˜o de alguns conceitos sera´ importante para o uso da linguagem apropriada ao
elaborarmos e analisarmos as distribuic¸o˜es de frequeˆncias. No total, sa˜o 9 conceitos a
serem apresentados. A seguir de?niremos 5 primeiros, va´lidos para quaiquer distribuic¸a˜o
de frequ¨eˆncias, e mais adiante apresentaremos os 4 u´ltimos, espec´ı?cos para dados agru-
pados em classes.:
(a) Dados Brutos - E´ o conjunto dos dados nume´ricos obtidos apo´s a coleta dos dados.
Ex: Idade dos alunos do curso de medicina veterina´ria da UFBA, no ano de 1993.
24−23−22−28−35−21−23−33−34−24−21−25−36−26−22−30−32−25−
26− 33− 34− 21− 31− 25− 31− 26− 25− 35− 33− 31
Como pode ser observado, os valores esta˜o dispostos de forma desordenada. Em
raza˜o disso, pouca informac¸a˜o se consegue obter inspecionando-se os dados anotados.
Mesmo uma informac¸a˜o ta˜o simples como a de saber os valores mı´nimos e ma´ximo
requer um certo exame dos dados coletados.
(b) Rol - E´ o arranjo dos dados brutos em uma determinada ordem crescente ou decres-
cente. Ex: Utilizando os mesmos dados anteriores:
21− 21− 21− 22− 22− 23− 23− 24− 25− 25− 25− 25− 26− 26− 26−
7
28− 30− 31− 31− 31− 32− 33− 33− 33− 34− 34− 34− 35− 35− 36
Apresenta vantagens concretas em relac¸a˜o aos dados brutos. Ela torna poss´ıvel
visualizar, de forma bem ampla, as variac¸o˜es dos dados, uma vez que os valores
extremos sa˜o percebidos de imediato. Mas, a ana´lise com este tipo de disposic¸a˜o
comec¸a a se complicar quando o nu´mero de observac¸o˜es tende a crescer.
(c) Amplitude total ou ”range” (A) - E´ a diferenc¸a entre o maior e o menor valor ob-
servado da varia´vel em estudo. Ex: Utilizando os mesmos dados anteriores:
A = 36− 21 = 15.
(d) Frequeˆncia absoluta simples (Fi) - E´ o nu´mero de vezes que o elemento aparece na
amostra ou o nu´mero de elementos pertencentes a uma classe.
Para condensarmos melhor os dados, e´ aconselha´vel a elaborac¸a˜o de distribuic¸o˜es de
frequeˆncia. Uma tabela com distribuic¸a˜o de frequeˆncia e´ uma tabela onde se procura
fazer um arranjo dos valores e suas respectivas frequeˆncias, onde a frequeˆncia de determi-
nado valor sera´ dado pelo nu´mero de observac¸o˜es ou repetic¸o˜es de um valor ou de uma
modalidade. As tabelas de frequeˆncias podem representar tanto valores individuais como
valores agrupados em classes.
Essas tabelas podem ser classificadas em:
• Distribuic¸a˜o de Frequeˆncias de Dados Tabulados Na˜o-Agrupados em Classes - e´
uma tabela onde os valores da varia´vel aparecem individualmente. Esse tipo de dis-
tribuic¸a˜o e´ utilizado geralmente para representar uma varia´vel discreta, com pouca
variedade de valores. Exemplo : Utilizando os mesmos dados anteriores, a tabela a
seguir representa a distribuic¸a˜o de frequeˆncias de dados na˜o agrupados.
8

Outros materiais