Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE ESTÁCIO DE SÁ – campus Cabo Frio Curso: Sistema de Informação - Disciplina: Estatística e Probabilidade - Profª Gilselene Guimarães AULA 1: INTRODUÇÃO Á ESTATÍSTICA 1. INTRODUÇÃO Associar a palavra Estatística a ideia de censo é perfeitamente correto do ponto de vista histórico, sendo interessante salientar que as palavras estatística e estado têm a mesma origem latina: status. A estatística é também comumente associada às pesquisas de opinião pública, aos vários índices governamentais, aos gráficos e às médias publicados diariamente na imprensa. Na realidade, a estatística engloba muitos outros aspectos sendo fundamental na análise de dados provenientes de quaisquer processos onde exista variabilidade. É possível distinguir duas concepções para a palavra ESTATÍSTICA: no plural (Estatísticas), indica qualquer coleção de dados numéricos, reunidos com a finalidade de fornecer informações acerca de uma atividade qualquer. Assim, por exemplo, as estatísticas demográficas referem-se aos dados numéricos sobre nascimentos, falecimentos, matrimônios, desquites, etc. As estatísticas econômicas consistem em dados numéricos relacionados com emprego, produção, vendas e com outras atividades ligadas aos vários setores da vida econômica; no singular (Estatística), indica a atividade humana especializada ou um corpo de técnicas, ou ainda uma metodologia desenvolvida para a coleta, a classificação, a apresentação, a análise e a interpretação de dados quantitativos e a utilização desses dados para a tomada de decisões. 2. IMPORTÂNCIA DA ESTATÍSTICA A Estatística trabalha com informações que associam os dados ao problema, descobrem como e o que coletar, capacitando o pesquisador (ou profissional ou cientista) a obter conclusões a partir dessas informações, de tal forma que possam ser entendidas por outras pessoas. Portanto, os métodos estatísticos auxiliam o cientista social, o economista, o engenheiro, o agrônomo e muitos outros profissionais a realizarem o seu trabalho com mais eficiência. A Estatística é uma parte da Matemática que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados, viabilizando a utilização dos mesmos na tomada de decisões. 3. DEFINIÇÃO “Estatística é a arte de torturar os dados até que eles confessem.”(autor desconhecido) 2 4. GRANDES ÁREAS DA ESTATÍSTICA Para fins de apresentação, é usual se dividir a estatística em três grandes áreas, embora não se trate de ramos isolados: • Estatística Descritiva e Amostragem Conjunto de técnicas que objetivam coletar, organizar, apresentar, analisar e sintetizar os dados numéricos de uma população, ou amostra utilizando métodos numéricos e gráficos que resumem e apresentam a informação contida neles. • Estatística Inferencial Processo de se obter informações sobre uma população a partir de resultados observados na amostra, com a intenção de estender as conclusões obtidas a um conjunto de dados mais amplos. A tomada de decisões sobre a população, com base em estudos feitos sobre os dados da amostra, constitui o problema central da inferência estatística. • Probabilidade Modelos matemáticos que explicam os fenômenos estudados pela Estatística em condições de experimentação, caracterizado pelo processo de generalização, que está associado a uma margem de incerteza. A medida da incerteza é tratada mediante técnicas e métodos que se fundamentam na Teoria da Probabilidade. Essa teoria procura quantificar a incerteza existente em determinada situação. 5. FASES DO MÉTODO ESTATÍSTICO Quando se pretende empreender um estudo estatístico completo, existe fases do trabalho que devem ser desenvolvidas obedecendo a ordem de execução para se chegar aos resultados finais capazes de produzir resultados válidos. As principais fases são as seguintes: *Definição do problema * Planejamento * Coleta de dados * Apuração dos dados * Apresentação dos dados * Análise e Interpretação dos dados 1º) Definição do problema A primeira fase do trabalho consiste em uma definição ou formulação correta do problema a ser estudado. 2º) Planejamento consiste em se determinar o procedimento necessário para se resolver o problema e como levantar informações sobre o assunto ou objeto do estudo. Para estudarmos adequadamente uma população através de uma amostra, devemos planejar a coleta de dados. Com este objetivo, algumas perguntas se fazem importantes: • Com que frequência ocorrem os problemas? • Quais são as causas potenciais do problema? Além disso, para um bom planejamento para coleta de dados vale considerar as seguintes questões: • Qual a pergunta a ser respondida? • Como comunicar a resposta obtida? • Qual ferramenta de análise pretendemos usar e como utilizar os resultados? • Qual tipo de dado é necessário para utilizar as ferramentas desejadas e responder a pergunta? • Como coletar esses dados com o mínimo de esforço e erro? • Onde acessar estes dados? • Quem pode nos fornecer os dados? • Qual o período em que os dados serão coletados? Tendo as respostas para estas perguntas, devemos: • Construir uma metodologia para nos certificar de que todas as informações estão definidas; • Coletar os dados de forma consistente e honesta; • Certificar-se de que existe tempo suficiente para a coleta de dados; 3 • Definir quais informações adicionais serão necessárias para estudos futuros, referências ou reconhecimento. Outros elementos importantes que devem ser tratados nesta mesma fase são: • Cronograma das atividades, através do qual são fixados os prazos para as várias fases; • Custos envolvidos; • Exame das informações disponíveis; • Delineamento da amostra, etc. 3º) Coleta dos dados O terceiro passo é essencialmente operacional, compreendendo a coleta das informações propriamente ditas. Nesta fase do método estatístico, é conveniente estabelecer uma distinção entre duas espécies de dados: • Dados primários – quando são publicados ou coletados pelo próprio pesquisador ou organização que os escolheu. Ex.: tabelas do Censo Demográfico. • Dados secundários – quando são publicados ou coletados por outra organização. Ex.: quando um jornal publica estatísticas extraídas de várias fontes e relaciona com outros setores. Um conjunto de dados é, pois, primário ou secundário em relação a alguém, para quem desejar utilizar-se deles em alguma pesquisa que esteja desenvolvendo. A coleta de dados pode ser realizada de duas maneiras: • Coleta Direta – quando é obtida diretamente da fonte, como no caso da empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. • Coleta Indireta – quando é inferida a partir dos elementos conseguidos pela coleta direta, ou através do conhecimento de outros fenômenos que, de algum modo, estejam relacionados com o fenômeno em questão. 4º) Apuração dos dados consiste em resumir os dados através de sua contagem e agrupamento. Pode ser manual, eletromecânica ou eletrônica. 5º) Apresentação dos dados os dados devem ser apresentados sob forma adequada, tornando mais fácil o exame do fenômeno que está sendo objeto de tratamento estatístico. Há duas formas de apresentação ou exposição dos dados observados, que não se excluem mutuamente: • Apresentação tabular – É uma apresentação numérica dos dados. As tabelas têm a vantagem de conseguir expor, sinteticamente e em só local, os resultados sobre determinado assunto. • Apresentação gráfica – É uma apresentação geométrica dos dados numéricos e permite ao analista obter uma visão rápida, fácil e clara do fenômeno e sua variação. 6º) Análise e interpretação dos dados Nesta última etapa, o interesse maior reside em tirar conclusões que auxiliem o pesquisador a resolver seu problema. A análise dos estatísticos está ligada ao cálculo de medidas estatísticas, cuja finalidade principal é descrever os fenômenose interpretá-los. 6. DADOS ESTATÍSTICOS 6.1 População e amostra ● População ou Universo Estatístico Conjunto de todos os elementos que congregam todas as observações que sejam relevantes para o estudo de uma ou mais características dos elementos que podem ser tanto como seres animados ou inanimados. Estes elementos devem ter pelo menos uma característica em comum. A população estatística é estudada em termos de observações de características comuns dos elementos e não em termos de pessoas ou objetos em si. Por exemplo, as alturas dos cidadãos do Brasil constituem uma população. Poderia haver também uma população correspondente aos pesos desses mesmos cidadãos. 4 ● Amostra A amostra é um subconjunto finito de uma população. A amostra deve ter características, senão idênticas, bastante assemelhadas ao universo ou população e seu valor pode variar de amostra para amostra. Ao coletar os dados referentes às características de um grupo de objetos ou indivíduos, é muitas vezes impossível observar toda a população ou universo pelas seguintes razões: custos elevados, tempo necessário e a própria característica do objeto que não permite a sua análise no seu conteúdo completo, como, por exemplo, o exame de sangue. Nesse caso coleta-se uma parte de dados que é chamada de amostra. Outros exemplos, como medir a inteligência de toda a população brasileira, testar a qualidade de cada saco de café exportado pelo Brasil, aplicar um questionário de status socioeconômico a cada escola do Estado do Rio Grande do Sul, não é possível e racional de ser feito. Assim, recorre-se ao exame de uma amostra (uma fração da população) e coleta-se uma parte de dados. O tamanho de uma amostra depende do grau de certeza que se quer ter na inferência, da disponibilidade de informantes e de dados, dos custos aprovados e do grau de dispersão dos dados estatísticos. Quanto menor é a homogeneidade da população maior deverá ser a amostra. 6.2 Outras definições importantes • Censo: é uma coleção de dados relativos a todos os elementos de uma população. • Parâmetros: é uma medida numérica que descreve uma característica de uma população. • Estatística: é uma medida numérica que descreve uma característica de uma amostra. • Dados contínuos: resultam de um número infinito de valores possíveis que podem ser associados a pontos em uma escala contínua de tal maneira que não haja lacunas. •Dados discretos: resultam de um conjunto finito de valores possíveis, ou de um conjunto enumerável de valores. • Dados quantitativos: consistem em números que representam contagens ou medidas. •Dados qualitativos: podem ser separados em diferentes categorias que se distinguem por alguma característica não-numérica. 6.3 Variáveis são características específicas da população que podem assumir propriedades de medidas (valores e/ou aspectos) distintos. Cada variável corresponde a um conjunto de categorias que, associados às características, descrevem a natureza e o tipo de variação. Algumas variáveis podem ter inúmeras categorias de resposta, dependendo do objetivo e foco do problema de investigação. Estas categorias são indicadas como níveis ou escalas de medição. São exemplos de variáveis: idade, sexo, preferência partidária, taxa selic, comprimento de uma peça, quantidade de estoque, preço da matéria prima, renda, localização de clientes, entre outros. As escalas podem ser classificadas como: quantitativas ou qualitativas. ◘ Variáveis quantitativas são divididas em discretas e contínuas. ◘ Variáveis qualitativas são divididas em nominais e ordinais. ◘ Variáveis Quantitativas são aquelas com características que podem ser medidas e contadas em valores numéricos que fazem sentido. Podem ser contínuas ou discretas. Variáveis discretas: tem características mensuráveis que podem assumir apenas um número contável de valores e, assim, somente fazem sentido valores inteiros que representam o resultado de uma contagem. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia, o número de computadores danificados, número de redes utilizadas, etc. 5 Variáveis contínuas: tem características mensuráveis que assumem valores em uma escala contínua (na reta real) e para estes os valores fracionados fazem sentido. Usualmente são medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade. Os dados quantitativos usam a escala de medição de intervalo ou proporção. *A escala é intervalar quando os dados apresentam as propriedades inerentes aos dados ordinais e o intervalo entre os valores é expresso em termos de uma unidade de medida fixa. Os dados de intervalo são sempre numéricos. Exemplo: pontuação aplicada a um determinado tipo de exame de conhecimento. *A escala é de proporção quando os dados apresentam todas as propriedades inerentes aos dados de intervalo e a proporção dos dois valores for significativa. Também os dados de proporção são sempre numéricos. Exemplos: distância, altura, peso, tempo, etc. OBSERVAÇÕES *Operações numéricas comuns são significativas somente se os dados forem quantitativos. *Os cálculos estatísticos utilizados para dados quantitativos nem sempre são apropriados para dados qualitativos. No entanto, as distinções são menos rígidas do que a descrição acima insinua. *Uma variável originalmente quantitativa pode ser coletada de forma qualitativa. Por exemplo: a variável idade, medida em anos completos, é quantitativa (contínua); mas, se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc...), é qualitativa (ordinal). Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua) se trabalharmos com o valor obtido na balança, mas qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.). Outro ponto importante é que nem sempre uma variável representada por números é quantitativa (o número do telefone de uma pessoa, o número da casa, o número de sua identidade). Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se macho e 2 se fêmea, por exemplo. Isto não significa que a variável sexo passou a ser quantitativa! ◘Variáveis Qualitativas (ou categóricas) são aquelas com características que não possuem valores numéricos que podem ser contados mas, ao contrário, são definidas por categorias que classificam e descrevem a população. Podem ser nominais ou ordinais. Variáveis nominais: não existe uma determinação ordinária, ou seja, uma ordem para a apresentação das categorias que interfere na conclusão dos resultados. Nestes casos, os dados são melhor identificados por observações. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. Variáveis ordinais: existe uma determinação ordinária importante para a apresentação das categorias que interfere na conclusão dos resultados. Exemplos: escolaridade (1º, 2º, 3º graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). EXERCÍCIOS 1) As fases básicas do método Estatístico são: a) Coleta, Crítica, Interpretação, Representação e Análise dos dados. b) Censo, Planejamento, Representação dos dados. c) Coleta, Crítica, Apuração, Apresentação dos dados e Análise dos resultados. d) Apuração Crítica, Planejamento, Divulgação e Análise dos dados. e) Definição do problema, Planejamento, Coleta, Apuração Crítica, Apresentação e Análise dos resultados. 2) Defina estatística e dê dois exemplos em que a estatística pode ser e é útil. 6 3) Em quais duas grandes áreas a ciência Estatística poderá ser dividida? Descreva suscintamente do que trata cada uma destas áreas. 4) Comente as fases do Método Estatístico. 5) Como podemos classificar os dados segundo sua origem? 6) A parte da estatística que se preocupa somentecom a descrição de determinadas características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se: a) Estatística de População; b) Estatística de Amostra; c) Estatística Inferencial d) Estatística Descritiva; e) Estatística Grupal. 7) Classifique as variáveis abaixo: (a) Tempo para fazer um teste. (b) Número de alunos aprovados por turma. (c) Nível sócio-econômico (d) QI (Quociente de inteligência). (e) Sexo (f) Gastos com alimentação. (g) Opinião com relação à pena de morte (h) Religião (i) Valor de um imóvel (j) Conceitos em certa disciplina (k) Classificação em um concurso. 8) Das variáveis abaixo, indique a discreta: a) O número de "caras" que se pode obter jogando ao ar dez moedas. b) O tempo de duração de um disco, tomando como unidade o minuto. c) A temperatura de uma sala, medida em graus Celsius. d) As alturas dos alunos de uma turma, expressas em cm. e) As notas dos alunos, em um teste de Matemática. 9) As variáveis discretas são de natureza: a) quantitativa b) qualitativa c) fracionária d) contínua e) racional 10) População ou Universo é: a) Conjunto de pessoas b) Conjunto de indivíduos que apresentam características especiais. c) Conjunto de elementos que apresentam uma característica comum. d) Subconjunto confiável para um estudo qualquer. e) Nada disso. 11) Uma parte da população retirada para analisá-la denomina-se: a) Universo; b) Parte; c) Pedaço; d) Dados Brutos; e) Amostra. 7 12) Numere a segunda coluna, de acordo com a primeira, e registre a opção correta: a) Estudo de números associados a fenômenos. b) Parte da população observada. c) Denominação dada a atributos ou a quantidades, que variam quanto à grandeza. d) Grupo de indivíduos ou coisas cujas características são estudadas em forma de um todo, não interessando um elemento em particular. e) Cada valor observado de uma variável. ( ) Amostra ( ) Estatística ( ) População ( ) Variável ( ) Dado 13) A Columbia House entrega CDs aos membros dos “Eu Clube” através de encomenda postal. A columbia House Music Survey solicitou que os novos membros do clube preenchessem um formulário de pesquisa com 11 questões. Foram estas algumas das perguntas: a) Quantos CDs você comprou nos últimos 12 meses? b) Atualmente você é membro de algum clube do livro nacional que faz entrega por encomenda postal? Sim ou não? c)Qual é a sua idade? d)Quantas pessoas há em sua família (adultos e crianças), incluindo você? e) Qual estilo de música você está interessado em comprar? Comente se cada uma das perguntas fornece dados qualitativos ou quantitativos?
Compartilhar