Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 A Ciência Estatística e suas técnicas1 prof. Wanderley Pires M1 O termo Estatística provém da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decisões. Nesse sentido foi utilizado em épocas remotas para determinar o valor dos impostos cobrados dos cidadãos, para determinar a estratégia de uma nova batalha em guerras que se caracterizavam por uma sucessão de batalhas. (Era fundamental aos comandantes saber de quantos homens, armas, cavalos, etc. dispunham após a última batalha.) Atualmente, a estatística é definida como um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. A estatística teve acelerado desenvolvimento a partir do século XVII, com os estudos de Bernoulli, Fermat, Pascal, Laplace, Gauss, Galton, Pearson, Fisher, Poisson e outros que estabeleceram suas características atuais. Ela não alcançou ainda um estado definitivo. Continua a progredir na razão direta do desejo de investigação dos fenômenos coletivos. A estatística é considerada por alguns autores como Ciência no sentido do estudo de uma população. É considerada como método quando utilizada como instrumento por outra Ciência. A estatística mantém com a Matemática uma relação de dependência, solicitando-lhe auxílio, sem o qual não poderia desenvolver-se. Com as outras Ciências mantém a relação de complemento, quando utilizada como instrumento de pesquisa. Em especial esta última é a relação que a Estatística mantém com a Administração, Economia, Ciências Contábeis, Medicina, etc servindo como instrumento auxiliar na tomada de decisões. A visão global do processo estatístico2 Quando solicitados a estudar um fenômeno coletivo podemos optar entre os seguintes processos estatísticos: a) Estimação b) Censo Censo: É uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população. Estimação: É uma avaliação indireta de um parâmetro, com base em um estimador através do cálculo de probabilidades. Propriedades principais do Censo: Admite erro processual zero e tem confiabilidade 100%. É caro. É lento. É quase sempre desatualizado. 1 E. Medeiros, V. Gonçalves, A. C. Murolo em Estatística para os cursos de Economia, Administração e Ciências Contábeis, 2ª. ed., v. 1, p. 11 e 12. 2 E. Medeiros, V. Gonçalves, A. C. Murolo em Estatística para os cursos de Economia, Administração e Ciências Contábeis, 2ª. ed., v. 1, p. 12-14. 2 Nem sempre é viável. Propriedades principais da Estimação: Admite erro processual positivo e tem confiabilidade menor que 100%. É barata. É rápida. É atualizada. É sempre viável. Estatisticamente, a precisão de um valor numérico é avaliada através do binômio: confiança e erro processual. Se admitirmos que pudessem retirar do Censo todo tipo de erro de natureza humana (erro de cálculo de avaliação, de anotação, etc.), restará apenas outro tipo de erro devido ao procedimento empregado. Esse erro é chamado erro processual. No caso de um Censo, o erro processual é zero, pois avaliamos um por um, todos os elementos componentes da População. Como o erro processual na avaliação é zero, a confiabilidade no parâmetro obtido é 100%. A precisão no Censo é total. Na estimação, como avaliamos apenas parte e não todos os elementos que compõem a população admitimos um erro processual positivo na avaliação do valor e por conseqüência uma confiabilidade menor que 100%, sendo, portanto, menos precisa que o Censo. Como o número de elementos que compõem uma amostra é consideravelmente menor que o número de elementos que compõem uma População, a Estimação é sempre bem mais barata que o Censo, é concluído mais rapidamente que o Censo e, portanto, mais atualizada. Normalmente, no trabalho estatístico o pesquisador se vê obrigado a lidar com grande quantidade de valores numéricos resultantes de um Censo ou de uma estimação. Estes valores numéricos são chamados dados estatísticos. No sentido de disciplina, a Estatística ensina métodos racionais para a obtenção de informações a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e também permitir a tomada de decisões, através de dados estatísticos observados. Desta forma, a estatística pode ser dividida em duas áreas: a) Estatística Descritiva é a parte da Estatística que tem por objetivo descrever os dados observados. b) Estatística Indutiva é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. O cálculo de probabilidade é que viabiliza a inferência estatística. . Populações e Amostras3 A Estatística tem como objetivo o estudo dos fenômenos coletivos. Conceituaremos População como sendo o conjunto de todos os itens (pessoas, coisas, objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma característica. 3 E. Medeiros, V. Gonçalves, A. C. Murolo em Estatística para os cursos de Economia, Administração e Ciências Contábeis, 2ª. ed., v. 1, p. 12. 3 Entenderemos por Amostra, qualquer subconjunto não vazio de uma população. Uma característica estabelecida para toda uma população é denominada parâmetro. Uma característica numérica estabelecida para uma amostra é denominada estimador. Por exemplo: no fenômeno coletivo eleição para governador no Estado de São Paulo, a população é o conjunto de todos os eleitores habilitados no Estado de São Paulo. Um parâmetro é a proporção de votos do candidato A. Uma amostra é um grupo de 1000 eleitores selecionados em todo o Estado. Um estimador é a proporção de votos do candidato A obtida na amostra. Em aplicações efetivas, o número de elementos componentes de uma amostra é bastante reduzido em relação ao número de elementos componentes da população. Em outras palavras, amostra é o número de elementos extraídos da população e utilizados para estimar propriedades da mesma. População é o conjunto de todos os elementos de interesse.4 . Variáveis qualitativas e quantitativas; contínuas e discretas5 Por exemplo: um pesquisador está interessado em fazer um levantamento sobre alguns aspectos sócio-econômicos dos empregados da seção de orçamentos da Companhia Milsa. Usando informações obtidas no departamento pessoal ele obtém a seguinte tabela: Nº. Estado Civil Grau de Instrução Nº. filhos Idade Região de Procedência 1 solteiro 1º. grau -- 26 Interior 2 casado 1º. grau 1 32 Capital 3 casado 1º. grau 2 36 Capital 4 solteiro 2º. grau -- 20 Interior ... ... ... ... ... ... De um modo geral, para cada elemento investigado, tem-se associado um resultado (ou mais de um resultado) correspondendo à realização de certa variável (ou variáveis). No exemplo em questão, consideram-se a variável estado civil, para cada empregado temos associada a realização solteiro ou casado. Observamos que o pesquisador colheu informações sobre cinco variáveis: estado civil, educação, número de filhos, idade e região de procedência. Algumas variáveis como sexo, educação, estado civil, etc. apresentam como possíveis realizações uma qualidade (ou atributo) do indivíduo pesquisado, ao passo que outras como número de filhos, salário, estatura, etc. apresentam como possíveis realizações números resultantes de uma contagem ou mensuração. As4 D. Downing e J. Clark em Estatística Aplicada, p. 1. 5 W. O. Bussab e P. A. Morettin em Estatística Básica, Coleção Métodos Quantitativos, 3ª. ed., p. 3-5. 4 variáveis do primeiro tipo são chamadas qualitativas e as do segundo tipo são chamadas quantitativas. Dentre as variáveis qualitativas, ainda podemos fazer uma distinção entre dois tipos: variável qualitativa nominal, para a qual não existe nenhuma ordenação nas possíveis realizações, e variável qualitativa ordinal, para a qual existe certa ordem nos possíveis resultados. No nosso exemplo, a região de procedência é um caso de variável nominal, ao passo que educação é um exemplo de variável ordinal, pois 1º. grau, 2º. grau e grau superior correspondem a uma ordenação baseada no número de anos de escolaridade. A variável qualitativa classe social, com as possíveis realizações (por exemplo, alta, média e baixa), é outro exemplo de variável qualitativa ordinal. De modo análogo, as variáveis quantitativas podem sofrer uma classificação: (a) variáveis quantitativas discretas, cujos possíveis valores formam um conjunto finito ou enumerável de números e que resultam, freqüentemente, de uma contagem, como por exemplo, número de filhos (0, 1, 2,...); (b) variáveis quantitativas contínuas, cujos possíveis valores formam um intervalo de número reais e que resultam, normalmente, de uma mensuração, como por exemplo, estatura ou peso de um indivíduo. . ESTATÍSTICA DESCRITIVA6 É a parte da Estatística que tem por objetivo descrever os dados observados. Na sua função de descrição dos dados, tem as seguintes atribuições: a) A obtenção dos dados estatísticos; b) A organização dos dados; c) A redução dos dados; d) A representação dos dados; e) A obtenção de algumas informações que auxiliam a descrição do fenômeno observado. A obtenção ou coleta de dados é normalmente feita através de um questionário ou de observação direta de uma população ou amostra. A organização dos dados consiste na ordenação e crítica quanto à correção dos valores observados, falhas humanas, omissões, abandono de dados duvidosos etc. Redução dos dados o entendimento e compreensão de grande quantidade de dados através da simples leitura de seus valores individuais é uma tarefa 6 E. Medeiros, V. Gonçalves, A. C. Murolo em Estatística para os cursos de Economia, Administração e Ciências Contábeis, 2ª. ed., v. 1, p. 14-15. 5 extremamente árdua e difícil para o mais experimentado pesquisador. A Estatística descritiva apresenta duas formas básicas para a redução do número de dados com os quais devemos trabalhar, chamadas variável discreta e variável contínua. A representação dos dados os dados estatísticos podem ser mais facilmente compreendidos quando apresentados através de uma representação gráfica, o que permite uma visualização instantânea de todos os dados. Os gráficos quando bem representativos, tornam-se importantes instrumentos de trabalho. É ainda atributo da Estatística Descritiva a obtenção de algumas informações como médias, proporções, dispersões, tendências, índices, taxas, coeficientes, que facilitam a descrição dos fenômenos observados. Isto encerra as atribuições da Estatística Descritiva. Completando o processamento estatístico, no caso de uma Estimação, a Estatística Indutiva estabelece parâmetros a partir de estimadores usando o cálculo de probabilidade. . Dados Estatísticos7 São os valores numéricos resultantes de um Censo ou Estimação. Quando fazemos n observações diretas em um fenômeno coletivo ou observamos as respostas a uma pergunta em uma coleção de n questionários, obtemos uma seqüência de n valores numéricos. Tal seqüência é denominada dados brutos. Representado por X a característica observada no fenômeno coletivo ou na pergunta dos questionários, então x1 representa o valor da característica obtida na primeira observação do fenômeno coletivo ou o valor da característica observado no primeiro questionário; x2 representa o valor da característica X na segunda observação do fenômeno coletivo ou o valor da característica X observada no segundo questionário e assim sucessivamente. Desta forma, os dados brutos podem ser representados por X: x1, x2, x3,..., xn Esta seqüência de valores assim obtida apresenta-se completamente desordenada. De modo geral, podemos afirmar que dados brutos é uma seqüência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo. Quando ordenamos na forma crescente ou decrescente, os Dados Brutos passam a se chamar Rol. Portanto, Rol é uma seqüência ordenada de Dados Brutos. Exemplo: No final do ano letivo, um aluno obteve as seguintes notas bimestrais em Matemática: 4; 8; 7,5; 6,5. Neste exemplo, X representa nota bimestral e pode ser representada na forma: X: 4; 8; 7,5; 6,5 (Dados Brutos) ou X: 4; 6,5; 7,5; 8 (Rol) 7 E. Medeiros, V. Gonçalves, A. C. Murolo em Estatística para os cursos de Economia, Administração e Ciências Contábeis, 2ª. ed., v. 1, p. 15-16. 6 Exercícios: Construa o Rol para seqüência de dados brutos: a) X: 2, 4, 12, 7, 8, 15, 21, 20. b) Y: 3, 5, 8, 5, 12, 14, 13, 12, 18. c) Z: 12,2; 13,9; 14,7; 21,8; 12,2; 14,7. d) W: 8, 7, 8, 7, 8, 7, 9. . Coleta de dados8 A obtenção ou coleta de dados é normalmente feita através de um questionário ou de observação direta de uma população ou amostra. Quando lidamos com poucos valores numéricos, o trabalho estatístico fica sensivelmente reduzido. No entanto, normalmente teremos que trabalhar com grande quantidade de dados. Um dos objetivos da Estatística Descritiva neste caso é obter uma significativa redução na quantidade de dados com os quais devemos operar diretamente. Isto pode ser conseguido modificando-se a forma de apresentação destes dados. . Tabelas de freqüências e agrupamento de dados9 Suponha que observamos as notas de 30 alunos em uma prova e obtivemos os seguintes valores: X: 3,5; 5; 4,5; 4; 4,5; 5; 3,5; 4; 4; 5; 2; 3; 4,5; 3,5; 4; 4,5; 3; 4; 3; 4; 3,5; 3,5; 3,5; 4; 4; 3; 4; 4; 5; 3 Se entendermos como freqüência simples de um elemento o número de vezes que este elemento figura no conjunto de dados, podemos reduzir significativamente o número de elementos com os quais devemos trabalhar. Para isso organiza-se o conjunto de dados na forma de uma série estatística chamada variável discreta. Distribuição de Freqüência Variável Discreta É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna em ordem crescente apenas os valores distintos da série e na segunda coluna em ordem crescente apenas os valores das freqüências simples correspondentes. Se usarmos f para representar freqüência simples, a seqüência do exemplo acima pode ser representada pela tabela: xi fi 2 1 3 5 3,5 6 4 10 8 E. Medeiros, V. Gonçalves, A. C. Murolo em Estatística para os cursos de Economia, Administração e Ciências Contábeis, 2ª. ed., v. 1, p. 18. 9 E. Medeiros, V. Gonçalves, A. C. Murolo em Estatística para os cursos de Economia, Administração e Ciências Contábeis, 2ª. ed., v. 1, p. 18-24. 7 4,5 4 5 4 30 Observações: 1) Note-se que a colocação de um índice i para x e para f tem a finalidade de referência. Deste modo, x1 representa o primeiro valor distinto da série, x2 representa o segundo valor distinto da série, f1 representa a freqüência simples do primeiro valor distinto da série, f2 representa a freqüência simples do segundovalor distinto da série e assim sucessivamente. 2) Note que conseguimos reduzir de 30 elementos que constituíam a série original para apenas 12 elementos. 3) Note também que a variável discreta só é uma forma eficiente de redução de dados, quando o número de elementos distintos da série for pequeno. Portanto, devemos optar por uma variável discreta na representação de uma série de valores quando o número de elementos distintos da série for pequeno. Construção da Variável Discreta A construção de uma variável discreta é bastante simples. Basta observar quais são os elementos distintos da seqüência, ordená-los, e colocá-los na primeira coluna da tabela. Em seguida computar a freqüência simples de cada elemento distinto e colocá-la na segunda coluna da tabela. Exemplo de construção de uma variável discreta: A seqüência abaixo representa a observação do número de acidentes por dia, em uma rodovia, durante 20 dias. X: 0, 2, 0, 1, 1, 0, 0, 0, 3, 2, 1, 0, 1, 2, 0, 1, 3, 2, 2, 0 Os valores distintos da seqüência são: 0, 1, 2, 3 As freqüências simples respectivas são: 8, 5, 5, 2. Portanto, a variável discreta representativa desta seqüência é: xi fi 0 8 1 5 2 5 3 2 20 8 Em alguma fase do seu trabalho, o pesquisador se vê às voltas com o problema de analisar e entender uma massa de dados, relevante ao seu particular objeto de estudos. A seguir, estão alguns procedimentos comuns para a representação das distribuições de freqüências, que é uma das maneiras de sumarizar os valores de uma variável discreta. Seja o conjunto de dados brutos: 3; 4; 4; 5; 7; 6; 6; 7; 7; 4; 5; 5; 6; 6; 7; 5; 8; 5; 6; 6 Pede-se: a) Construir o rol b) Amplitude total c) Distribuição de freqüências simples (absolutas) fi d) Freqüências relativas fri e) Freqüência Acumulada Fi f) Freqüência Acumulada Relativa Fri g) Gráfico das freqüências absolutas h) Histograma das freqüências absolutas i) Qual a porcentagem de elementos maiores que 5? j) Qual a porcentagem de elementos menores ou iguais a 6? Freqüência Relativa de um Elemento da Série: fr É a divisão da freqüência simples deste elemento pelo número total de elementos da série. fri = fi n Freqüência Acumulada de um Elemento da Série: Fi É a soma da freqüência simples deste elemento com as freqüências simples dos elementos que o antecedem. Fi = f1 + f2 + f3 + .... + fn Freqüência Acumulada Relativa de um Elemento da Série: Fri É a divisão da freqüência acumulada deste elemento, pelo número total de elementos da série. Fri = Fi n xi fi fri % Fi Fri % O quadro final tanto da variável discreta como da variável contínua recebe o nome de distribuição de freqüência. 9 Exercícios 1)A seqüência abaixo representa a observação do número de acidentes por dia, em uma rodovia, durante 20 dias. X: 0, 2, 0, 1, 1, 0, 0, 0, 3, 2, 1, 0, 1, 2, 0, 1, 3, 2, 2, 0 (V.D.) Pede-se: a) Construir o rol b) Amplitude total c) Distribuição de freqüências simples (absolutas) fi d) Freqüências relativas fri% e) Freqüência Acumulada Fi f) Freqüência Acumulada Relativa Fri% g) Gráfico das freqüências absolutas h) Histograma das freqüências absolutas i) Qual a porcentagem de elementos maiores que 2? j) Qual a porcentagem de elementos menores ou iguais a 1? k) Calcule a média 2) Anotadas as notas de 30 alunos em uma prova e obtivemos os seguintes valores: X: 3,5; 5; 4,5; 4; 4,5; 5; 3,5; 4; 4; 5; 2; 3; 4,5; 3,5; 4; 4,5; 3; 4; 3; 4; 3,5; 3,5; 3,5; 4; 4; 3; 4; 4; 5; 3 (V.D.) Pede-se: a) Construir o rol b) Amplitude total c) Distribuição de freqüências simples (absolutas) fi d) Freqüências simples relativas fri % e) Freqüência Acumulada Fi f) Freqüência Acumulada Relativa Fri % g) Gráfico das freqüências acumuladas h) Qual a porcentagem de elementos maiores que 2? i) Qual a porcentagem de elementos menores ou iguais a 4? j) Calcule a média 3) Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição: Notas 2 3 4 5 6 7 8 9 10 nº de alunos 1 3 6 10 13 8 5 3 1 Pede-se: a) Freqüências relativas fri% b) Freqüência Acumulada Fi c) Qual a porcentagem de elementos menores que 7? d) Histograma das freqüências absolutas. e) Gráfico da freqüência acumulada. f) Calcule a média
Compartilhar