Baixe o app para aproveitar ainda mais
Prévia do material em texto
CONCEITOS INICIAIS EM ESTATI´STICA 1 O que e´ Estat´ıstica? A estat´ıstica e´ o ramo da matema´tica interessado nos me´todos cient´ıficos para coleta,organizac¸a˜o, resumo, apresentac¸a˜o e ana´lise de dados, bem como na obtenc¸a˜o de concluso˜es va´lidas e na tomada de deciso˜es razoa´veis baseadas em tais ana´lises. Estat´ıstica e´ um conjunto de me´todos e te´cnicas que auxiliam a tomada de decisa˜o sobre a presenc¸a de incerteza. 1.1 Subdiviso˜es da Estat´ıstica A estat´ıstica pode ser dividida em treˆs grandes a´reas: • Estat´ıstica Descritiva ou Ana´lise Explorato´ria dos Dados • Probabilidade • Estat´ıstica Indutiva ou Infereˆncia Estat´ıstica Estat´ıstica Descritiva: E´, em geral, utilizada na etapa inicial da ana´lise, quando tomamos contato com os dados pela primeira vez. Pode ser definida como um conjunto de te´cnicas des- tinadas a descrever e resumir os dados, a fim de que possamos tirar informac¸o˜es e concluso˜es a respeito de caracter´ısticas de interesse. A Estat´ıstica Descritiva pode ser resumida da seguinte forma: Tabelas Coleta de ⇒ Cr´ıtica ⇒ Apresentac¸a˜o ⇒ Ana´lise dados de dados dos Dados Gra´ficos Probabilidade: E´ a base matema´tica sob a qual a Estat´ıstica e´ constru´ıda. Fornece me´todos para quantificar a incerteza existente em determinada situac¸a˜o, usando ora um nu´mero ora uma func¸a˜o matema´tica. A Infereˆncia Estat´ıstica: Consiste em obter e generalizar concluso˜es; ou seja, inferir propriedades para o todo com base na parte, no particular. E´ tratada atrave´s de te´cnicas e me´todos que se fundamentam na Teoria das Probabilidades. A infereˆncia estat´ıstica envolve questo˜es de dois tipos: a estimac¸a˜o de paraˆmetros populacionais e os testes de hipo´teses. Em estat´ıstica utilizaremos extensivamente os termos populac¸a˜o e amostra. Assim, definire- mos esses termos no contexto da estat´ıstica: • Populac¸a˜o: conjunto da totalidade dos elementos (valores, pessoas, medidas) a serem estudados. Congrega todas as observac¸o˜es que sejam relevantes para o estudo de uma ou mais caracter´ısticas dos indiv´ıduos. Podem ser tanto seres animados ou inanimados. • Amostra: um subconjunto de elementos extra´ıdos de uma populac¸a˜o. • Censo: e´ uma colec¸a˜o de dados relativos a todos os elementos de uma populac¸a˜o. 1 2 ESTATI´STICA DESCRITIVA 2.1 Fases do Trabalho Estat´ıstico A estat´ıstica esta´ envolvida em todas as etapas de um projeto de pesquisa. A seguir as fases de um trabalho cientif´ıco sa˜o citadas do ponto de vista do trabalho estat´ıstico. As fases do trabalho estat´ıstico sa˜o do aˆmbito da Estat´ıstica Descritiva, e sa˜o as principais fases as seguintes: 1. Definic¸a˜o do Problema: Consiste na: • formulac¸a˜o correta do problema; • examinar outros levantamentos realizados no mesmo campo (revisa˜o da literatura); • saber exatamente o que se pretende pesquisar definindo o problema corretamente (varia´veis, populac¸a˜o, hipo´teses, etc.) 2. Planejamento: - Determinar o procedimento necessa´rio para resolver o problema: • Como levantar informac¸o˜es; • Tipos de levantamentos: por censo (completo) ou por amostragem (parcial). • Cronograma, custos, etc. 3. Coleta de dados (quesitos espec´ıficos para obter informac¸o˜es desejadas): refere- se a` obtenc¸a˜o, reunia˜o e registro sistema´tico de dados, com um objetivo determinado. 4. Cr´ıtica dos questiona´rios: leitura dos questiona´rios, observac¸a˜o de respostas incom- pletas, erradas. Supressa˜o de valores estranhos ao levantamento. 5. Apurac¸a˜o dos dados: consiste em resumir os dados, atrave´s de sua contagem e agrupa- mento. E´ um trabalho de condensac¸a˜o e de tabulac¸a˜o dos dados, que chegam ao analista de forma desorganizada, tornando imposs´ıvel a tarefa de apreender todo o seu significado pela simples leitura. Nos dias atuais esta apurac¸a˜o tornou-se sinoˆnimo de organizac¸a˜o de base de dados, que e´ realizada em computadores. 6. Apresentac¸a˜o dos Dados: ha´ duas formas de apresentac¸a˜o: a) Apresentac¸a˜o Tabular: apresentac¸a˜o nume´rica dos dados. As tabelas teˆm a vantagem de conseguir expor, sinteticamente, e em um so´ local, os resultados sobre determinado assunto, de modo a se obter uma visa˜o global mais ra´pida daquilo que se pretende analisar. b) Apresentac¸a˜o Gra´fica: constitui uma apresentac¸a˜o geome´trica. E´ de extrema im- portaˆncia, no sentido de permitir uma visa˜o ra´pida, fa´cil e clara do fenoˆmeno e sua variac¸a˜o. 7. Ana´lise e Interpretac¸a˜o dos Dados: O interesse maior consiste em tirar concluso˜es que auxiliem o pesquisador a resolver seu problema. A analise dos dados estat´ısticos esta´ ligada essencialmente ao ca´lculo de medidas, cuja finalidade principal e´ descrever o fenoˆmeno. Assim, o conjunto de dados a ser analisado pode ser expresso por nu´meros- resumos, as estat´ısticas, que evidenciam caracter´ısticas particulares desse conjunto. O significado exato de cada um desses valores sera´ explicado posteriormente. 2 2.2 Classificac¸a˜o de Varia´veis Definiremos varia´vel como qualquer atributo/caracter´ıstica que exerc¸a influeˆncia no fenoˆmeno estudado. Por exemplo, desejamos registrar a idade das pessoas ao morrer, a estatura ou peso dos indiv´ıduos, o rendimento das famı´lias em uma grande cidade, o nu´mero de empregados dispensados, por meˆs, em uma grande empresa,a distribuic¸a˜o dos alunos por sexo, etc. Antes da escolha da ana´lise descritiva apropriada e´ necessa´ria a classificac¸a˜o da varia´vel de interesse, pois a adequac¸a˜o da te´cnica esta´ diretamente relacionada ao tipo de varia´vel em questa˜o. De acordo com a estrutura nume´rica as varia´veis podem ser classificadas em: • Qualitativas (ou atributos ou catego´ricos): Sa˜o caracter´ısticas que na˜o podem ser medidas, ou seja, sa˜o na˜o-nume´ricas.Elas podem ser: – Nominal : varia´veis em que na˜o e´ poss´ıvel estabelecer uma ordem natural entre seus valores. Ex.: cor da flor, que pode ser rosa, branca ou vermelha; Sexo (feminino ou masculino). – Ordinal ou por postos: varia´veis que teˆm uma ordenac¸a˜o natural, indicando inten- sidades crescentes de realizac¸a˜o. Ex.: Tamanho (pequeno, me´dio ou grande), Classe Social (baixa, me´dia ou alta). • Quantitativas: Sa˜o caracter´ısticas que podem ser contadas ou medidas, sendo classificadas em discretas e cont´ınuas. – Discretas: sa˜o aquelas varia´veis que podem assumir somente valores inteiros num conjunto de valores. E´ gerada pelo processo de contagem. Ex.: nu´mero de folhas por planta; nu´mero de carrapatos por animal; etc. – Cont´ınuas: sa˜o aquelas varia´veis que podem assumir um valor dentro de um intervalo de valores. E´ gerada pelo processo de medic¸a˜o ou mensurac¸a˜o. Ex.: volume de a´gua em um reservato´rio; peso de raiz; diaˆmetro do caule, etc. 2.3 PARAˆMETRO X ESTIMADOR X ESTIMATIVA a) Paraˆmetro: e´ uma medida nume´rica que descreve alguma caracter´ıstica da populac¸a˜o. E´ o resumo da varia´vel observada na populac¸a˜o. Por exemplo, me´dia, variaˆncia e desvio padra˜o. Cada paraˆmetro e´ representado por um s´ımbolo ou letra. No exemplo tem-se que para a me´dia, a variaˆncia e o desvio padra˜o as letras gregas µ, σ2 e σ. Na˜o e´ poss´ıvel fazer infereˆncias baseada em paraˆmetro, uma vez que toda a populac¸a˜o foi investigada. b) Estimador (tambe´m chamado de Estat´ıstica): e´ uma medida nume´rica que descreve al- guma caracter´ıstica de umaamostra, ou seja, o estimador e´ obtido a partir do resumo da varia´vel observada na amostra. Neste caso, e´ poss´ıvel utilizarmos as teorias infereˆncias 3 para que, com base na amostra, possamos obter concluso˜es sobre a populac¸a˜o. Cada estimador tambe´m e´ representado por um s´ımbolo ou letra. Para a me´dia, a variaˆncia e o desvio padra˜o as letras gregas µ̂ ou X , σ̂2 ou S2 e σ̂ ou S. 2.4 Apresentac¸a˜o de Dados 2.4.1 Se´ries Estat´ısticas As se´ries estat´ısticasresumem um conjunto ordenado de observac¸o˜es atrave´s de treˆs fatores fundamentais: • tempo: refere-se a data ou a e´poca em que o fenoˆmeno foi investigado; • espac¸o: refere-se ao local ou regia˜o onde o fato ocorreu; • espe´cie: refere-se ao fato ou fenoˆmeno que esta´ sendo investigado e cujos valores nume´ricos esta˜o sendo apresentados. As se´ries estat´ısticas sa˜o classificadas de acordo com o fator que estiver variando, podendo ser simples ou mistas. 1. Se´ries simples • Se´rie Cronolo´gica (temporal, histo´rica ou evolutiva): onde varia o tempo per- manecendo fixos o espac¸o e a espe´cie do fenoˆmeno estudado. Tabela 01: Casos de sarampo notificado no Brasil de 1987 a 1992 • Se´rie Geogra´fica (Espacial, ou Territorial, ou de Localizac¸a˜o): onde varia o espac¸o permanecendo fixos o tempo e a espe´cie do fenoˆmeno estudado. Tabela 02: Necessidades me´dias de energia em alguns pa´ıses, em 1973. 4 • Se´rie especificativa (qualitativa ou catego´rica: onde varia a espe´cie permanecendo fixos o tempo e o espac¸o do fenoˆmeno estudado. Tabela 03: Abate de animais, por espe´cie, no Brasil, em 1993. 2. Se´ries mistas: sa˜o aquelas em que mais de um fator varia ou um fator varia mais de uma vez. • Se´rie histo´rica geogra´fica (ou geogra´fica histo´rica) Tabela 04: Taxa de atividade feminina urbana, em percentual, em treˆs regio˜es do Brasil, 1981,90 • Se´rie especificativa geogra´fica (ou geogra´fica especificativa) Tabela 05: Consumo per capita anual de alguns tipos de alimentos, em algumas regio˜es metropolitanas do Brasil, no ano de 1988 5 • Se´rie especificativa histo´rica (ou histo´rica especificativa) Tabela 06: Taxa de mortalidade (em percentual) de menores de um ano no Brasil, segundo as treˆs principais causas, no per´ıodo de 1984 a 1987 • Se´rie especificativa histo´rica geogra´fica Tabela 07: Nu´mero de v´ıtimas em acidentes, segundo as grandes regio˜es do Brasil, nos anos de 1991 e 1992 2.4.2 Tabelas Tem como finalidade apresentar os dados de modo ordenado, simples e de fa´cil inter- pretac¸a˜o, fornecendo o ma´ximo de informac¸a˜o num mı´nimo de espac¸o. A construc¸a˜o de uma tabela, entretanto, deve obedecer a uma se´rie de normas te´cnicas. Estas normas podem ser encontradas na publicac¸a˜o do IBGE intitulada “Normas de Apresentac¸a˜o Tabular”. 2.4.3 Elementos da Tabela • T´ıtulo: e´ a indicac¸a˜o que precede a tabela contendo a designac¸a˜o do fato observado, o local e a e´poca em que foi estudado. • Corpo: e´ o conjunto de lihas e colunas onde esta˜o inseridos os dados. • Cabec¸alho: e´ a parte superior da tabela que indica o conteu´do das colunas. • Coluna indicadora: e´ a parte da tabela que indica o conteu´do das linhas. Os elementos complementares sa˜o: 6 • Fonte: entidade que fornece os dados ou elabora a tabela. • Notas: informac¸o˜es de natureza geral, destinadas a esclarecer o conteu´do das tabelas. • chamadas: informac¸o˜es espec´ıficas destinadas a esclarecer ou conceituar dados numa parte da tabela. Os elementos complementares devem situar-se no rodape´ da tabela, na mesma ordem em que foram descritos. 2.5 Distribuic¸a˜o de Frequeˆncia e Representac¸a˜o Gra´fica Uma das formas de organizar e resumir a informac¸a˜o contida em dados observados e´ por meio de tabela de frequ¨eˆncias e gra´ficos. A definic¸a˜o de alguns conceitos sera´ importante para o uso da linguagem apropriada ao elaborarmos e analisarmos as distribuic¸o˜es de frequeˆncias. No total, sa˜o 9 conceitos a serem apresentados. A seguir de?niremos 5 primeiros, va´lidos para quaiquer distribuic¸a˜o de frequ¨eˆncias, e mais adiante apresentaremos os 4 u´ltimos, espec´ı?cos para dados agru- pados em classes.: (a) Dados Brutos - E´ o conjunto dos dados nume´ricos obtidos apo´s a coleta dos dados. Ex: Idade dos alunos do curso de medicina veterina´ria da UFBA, no ano de 1993. 24−23−22−28−35−21−23−33−34−24−21−25−36−26−22−30−32−25− 26− 33− 34− 21− 31− 25− 31− 26− 25− 35− 33− 31 Como pode ser observado, os valores esta˜o dispostos de forma desordenada. Em raza˜o disso, pouca informac¸a˜o se consegue obter inspecionando-se os dados anotados. Mesmo uma informac¸a˜o ta˜o simples como a de saber os valores mı´nimos e ma´ximo requer um certo exame dos dados coletados. (b) Rol - E´ o arranjo dos dados brutos em uma determinada ordem crescente ou decres- cente. Ex: Utilizando os mesmos dados anteriores: 21− 21− 21− 22− 22− 23− 23− 24− 25− 25− 25− 25− 26− 26− 26− 7 28− 30− 31− 31− 31− 32− 33− 33− 33− 34− 34− 34− 35− 35− 36 Apresenta vantagens concretas em relac¸a˜o aos dados brutos. Ela torna poss´ıvel visualizar, de forma bem ampla, as variac¸o˜es dos dados, uma vez que os valores extremos sa˜o percebidos de imediato. Mas, a ana´lise com este tipo de disposic¸a˜o comec¸a a se complicar quando o nu´mero de observac¸o˜es tende a crescer. (c) Amplitude total ou ”range” (A) - E´ a diferenc¸a entre o maior e o menor valor ob- servado da varia´vel em estudo. Ex: Utilizando os mesmos dados anteriores: A = 36− 21 = 15. (d) Frequeˆncia absoluta simples (Fi) - E´ o nu´mero de vezes que o elemento aparece na amostra ou o nu´mero de elementos pertencentes a uma classe. Para condensarmos melhor os dados, e´ aconselha´vel a elaborac¸a˜o de distribuic¸o˜es de frequeˆncia. Uma tabela com distribuic¸a˜o de frequeˆncia e´ uma tabela onde se procura fazer um arranjo dos valores e suas respectivas frequeˆncias, onde a frequeˆncia de determi- nado valor sera´ dado pelo nu´mero de observac¸o˜es ou repetic¸o˜es de um valor ou de uma modalidade. As tabelas de frequeˆncias podem representar tanto valores individuais como valores agrupados em classes. Essas tabelas podem ser classificadas em: • Distribuic¸a˜o de Frequeˆncias de Dados Tabulados Na˜o-Agrupados em Classes - e´ uma tabela onde os valores da varia´vel aparecem individualmente. Esse tipo de dis- tribuic¸a˜o e´ utilizado geralmente para representar uma varia´vel discreta, com pouca variedade de valores. Exemplo : Utilizando os mesmos dados anteriores, a tabela a seguir representa a distribuic¸a˜o de frequeˆncias de dados na˜o agrupados. 8
Compartilhar