Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 1 ANatureza e os Conceitos Fundamentais da Estatística Objetivo: Compreender a natureza da Estatística, as fases de um trabalho es- tatístico, e seus conceitos fundamentais a uma interpretação conscienciosa dos re- sultados de um trabalho estatístico. 1 A Natureza da Estatística Vivemos num mundo imerso em incertezas. A todo tempo somos bombardeados por informações sobre pesquisas cientí cas comprovando (estatisticamente) que tal substância induz uma certa patologia, ou sobre pesquisas eleitorais, índices de rou- bos, e outros conteúdos de forte caracterização probabilística. Num mundo assim, é de fundamental importância possuir um espírito crítico para informações sujeitas à incerteza a m de poder dar inteligibilidade a elas e até mesmo poder distinguir informações falsas de verdadeiras. Nessa medida, a Estatística é uma disciplina crucial para todos os estudantes, e talvez aquela que mais atua na formação crítica do cidadão, pois ela abarca diferentes áreas de atuação como: Medicina, Econo- mia, Política, Psicologia, Tecnologia, Indústria (Controle de Qualidade), Demogra a (Censo), dentre outras. A raiz etimológica da palavra Estatística vem da palavra latina status que signi ca estado e signi cava a contagem e gestão de dados do estado. Ao longo da história da Estatística, essa vinculação ao estado foi se enfraquecendo e hoje a estatística tem um caráter abrangente o bastante para lidar com sistemas do conhecimento bem dissociados da noção de Estado. No entanto, cabe ressaltar que hoje temos dois signi cados para Estatística, a saber: "Estatística" como Ciência e "estatística" como uma operação de dados coletados em pesquisas. Por exemplo, uma média aritmética (que iremos mais tarde estudar) é uma estatística também. O contexto nos auxiliará a distinguir o signi - cado veiculado pelo termo estatística. Mas como ciência, o que é a Estatística, a nal? Estatística é a arte e a ciência de coletar, analisar, apresentar, e interpretar dados, para que se tomem decisões sob incerteza. 1 Você deve estar surpreso com o uso da palavra "arte" na de nição acima, não? Mas a verdade é que sem julgamento, experiência e até mesmo uma forte intuição é impossível analisar estatisticamente fenômenos incertos. E o que entendemos por "fenômenos incertos"? Fenômenos aleatórios (ou incertos) são aqueles cujos resultados de interesse não podem ser aferidos com 100% de certeza. Assim, onde há incerteza (e por conseguinte, variabilidade de resultados mesmo sob mesmas condições iniciais) aí deverá estar a Estatística para nos auxiliar a dar ordem simbólica ao fenômeno. Vamos agora entender como se dão as quatro fases descritas acima da Es- tatística. Para isso, vejamos um caso concreto na pesquisa cientí ca: Um pesquisador deseja estudar o efeito de histórias infantis na prontidão para a alfabetização de crianças, através de um teste de prontidão de leitura chamado ABC. Para isso, ele seleciona sete crianças aleatoriamente para responderem ao teste ABC sem o treinamento (pré-teste). Em seguida elas são estimuladas usando-se a leitura e o comentário de histórias. Após o treinamento, as crianças respondem novamente ao teste ABC (pós-teste). Ele deseja saber se o treinamento de fato induz a prontidão na alfabetização. Observe que esse estudo demanda a ferramenta Estatística, já que cada amostra de sete alunos retirada trará resultados variáveis e desejamos concluir algo sob incerteza. Com esse objetivo, como conduzir as fases da Estatística? Fase 1 (Coletar Dados): o pesquisador selecionará as sete crianças, que par- ticiparão do estudo e mensurará os testes antes e depois do treinamento. Fase 2 (Explorar os Dados): o pesquisador fará uma análise exploratória dos dados coletados para comparar os valores obtidos antes e depois do teste a m de ter poder concluir, com um certo nível de con abilidade, se houve uma melhora na alfabetização. Para isso selecionará os métodos estatísticos adequados para testar a hipótese de que o treinamento de fato induziu ou não à prontidão na leitura. Ele deverá portanto analisar dados, conforme tabela e grá cos abaixo, criados após a coleta dos dados. Escores no Teste ABC do Grupo Experimental Indivíduos Pré-Teste Pós-Teste 1 6 20 2 9 11 3 13 12 4 10 14 5 8 10 6 4 7 7 6 6 2 PRE_TEST POS_TEST Bar/Column Plot (testeABC.STA 10v*7c) 0 4 8 12 16 20 24 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 Case 7 Pré-Teste x Pós-Teste Fase 3 (Apresentar os Dados): o pesquisador apresentará seus resultados de maneira adequada para que possas ser veiculados em conferências, mídias ou periódicos cientí cos. Fase 4 (Interpretar os Dados): o pesquisador fará interpretações claras e compreensíveis até para não-estatísticos, quanti cando o nível de incerteza de suas a rmações e propondo medidas gerenciais, quando necessárias, à luz de suas con- clusões obtidas no estudo. Claro que o exemplo acima é posto apenas para que possamos entender panorami- camente como iremos construir um raciocínio estatístico para o tratamento de dados coletados, daqui para frente. 2 Conceitos Fundamentais da Estatística Em todas as áreas da ciência, conceitos são fundamentais para a contrução de uma teoria. É o que se costuma chamar na loso a da linguagem uma taxonomia. Na Estatística, isso não é diferente. Como a Estatística é um ramo da Matemática, ela traz as marcas da concisão matemática e estabelece de forma unívoca os seus objetos e seus conceitos. Neste capítulo, discutiremos os conceitos-chave do nosso curso, para que possamos caminhar de forma concisa na construção teórica da Estatística. Antes, porém, gostaria de discutir com vocês a ideia mais emblemática da funcionalidade da Estatística nas ciências em geral: A concepção mais emblemática da Estatística seria aquela em que temos uma população de interesse em estudo e, por motivos quaisquer, não podemos acessá- la integralmente para medir uma certa propriedade da mesma. O que fazer então? A ideia central da Estatística é obter de maneira conscienciosa uma amostra que traga potencialmente a informação da população e, através da amostra, inferir os resultados para a população. Como a amostra não é a população, há portanto 3 variabilidade nos resultados amostrais (cada amostra gerará resultados diversos), e, portanto, tais resultados são aleatórios e devem ser modelados probabilisticamente. Na presença portanto de variabilidade de resultados, temos então legitimado aí o uso da Estatística, pois devemos tomar nossas decisões e a rmar determinadas coisas sob incerteza agora. Observe que se pudéssemos rastrear toda a população, então a mensuração da propriedade em estudo deixaria de ser variável e incerta, pois acederíamos ao valor exato, e assim não haveria necessidade do uso da Estatística... É claro que este exemplo supõe uma população nita. Se a população fosse in nita, então por mais razão a Estatística seria a ferramenta teórica por excelência para o tratamento do problema! Mas estamos nos adiantando e precisamos de nir ainda o que se entende por população, amostra, parâmetro e estatística (ou estimador) dentro das chamadas Estatística Descritiva e Estatística Inferencial. Vamos lá então! Estatística Descritiva é parte da Estatística que se ocupa em resumir (sintetizar) e organizar a informação de um conjunto de dados. Estatística Inferencial é parte da Estatística que se ocupa em estimar e tirar conclusões sobre características de uma população à luz da amostra. População é a coleção de todos os elementos (pessoas, objetos, ou dados) de interesse num particular estudo. Amostra é um suconjunto da população da qual a informação é coletada. Parâmetro é a descrição numérica de uma característica da população. Estatística (ou Estimador) é a descrição numérica de uma característica da amostra. Assim, suponha que estejamos interessados emestudar a renda bruta média mensal de todos os brasileiros assalariados no ano de 2010. Qual é a nossa população nesse estudo? Acertou se tiver dito que são todos os brasileiros com carteira assinada em 2010. Qual seria uma possível amostra? Por exemplo, os brasileiros assalariados de 2010 do estado do Rio de Janeiro. Qual é o nosso parâmetro de interesse? A média de todos os salários brutos mensais de todos os brasileiros assalariados de 2010. Qual é a nossa estatística? A média de todos os salários brutos mensais de todos os brasileiros assalariados do estado do Rio de Janeiro de 2010. A essa altura você já deve ter intuído que nossa ideia é usar a estatística (ou estimador) para a rmar com um certo nível de con abilidade qual o valor do parâmetro em jogo, certo? Pois é isto mesmo e é assim que iremos coroar o nosso curso ao nal deste. Como dissemos anteriormente, para que a informação fornecida pela amostra seja valiosa para a estimação de parâmetros, é necessário que amostra tenha sido 4 coletada de maneira conscienciosa da população. Embora haja toda uma teoria para uma tecnologia de obtenção da amostra, gostaríamos de caracterizar alguns tipos aqui, embora o tratamento dessa teoria esteja fora dos objetivos desse curso: � Amostra aleatória: Cada membro da população tem a mesma chance de ser selecionado. � Amostra aleatória simples: Todas as amostras de mesmo tamanho são igualmente prováveis. � Amostra aleatória estrati cada: A população é dividida em grupos (es- tratos) e uma amostra aleatória é selecionada de cada grupo. Os estratos podem ser faixas etárias, gêneros ou graus de escolaridade, por exemplo. � Amostra aleatória por conglomerados: A população é dividida em grupos distintos (como se fossem subpopulações), chamados conglomerados. Usamos a amostra aleatória simples para escolher uma amostra de conglomerados e em seguida todos os indivíduos dos conglomerados escolhidos são analisados. � Amostra sistemática: A partir de uma população caracterizada numa listagem, selecionamos aleatoriamente um elemento inicial, e em seguida, escolhemos os membros da amostra a intervalos regulares. Por exemplo, se desejamos selecionar um membro da população a cada 20 elementos da lista, então se- lecionamos aleatoriamente um número de 1 a 20, digamos 7, e tomamos os membros 27, 47, 67, e assim sucessivamente da lista. Mas nossa taxonomia ainda não chegou ao m... Temos ainda alguns con- ceitos a discutir. Então vamos lá. Um elemento é cada uma das unidades observadas no estudo. Uma variável é uma característica de um elemento que se possa medir. Uma observação é um conjunto de valores de variáveis de um dado elemento. Por exemplo, se desejamos testar a inuência de um determinado medica- mento na pressão arterial de idosos acima de 65 anos, a partir da mensuração da pressão arterial antes e depois da medicação, então, temos que cada idoso no estudo é um elemento (ou unidade experimental); a pressão arterial é a nossa variável de mensuração; e as medidas da pressão arterial antes e depois da medicação de cada idoso compõem a observação do estudo. Finalmente, para fechar agora os nossos conceitos fundamentais da Estatís- tica, precisamos classi car os tipos de variáveis presentes num determinado estudo. Por que isso é tão importante? Porque é pela natureza dos nossos dados, ou, como dizemos em Estatística, pelo nosso nível de mensuração dos dados, que saberemos que métodos estatísticos serão apropriados em cada caso. Assim, a natureza de nossos dados já nos direciona para o tipo de tratamento estatístico de que faremos uso. 5 Uma variável qualitativa é uma variável que não assume valor numérico, mas é classi cada em categorias (qualidades). Uma variável quantitativa é uma variável que assume valores numéricos. Variáveis qualitativas são também chamadas de variáveis categóricas, pois podem ser agrupadas em categorias. Alguns exemplos são: sexo, etnia, estado civil, etc. Já exemplos de variáveis quantitativas temos: altura, peso, idade, número de lhos, etc. As variáveis qualitativas podem ser classi cadas como nominais ou ordi- nais. Uma variável é dita nominal se assume categorias não-ordenadas, sem característico numérico intrínseco. Por exemplo, sexo e etnia. Uma variável é dita ordinal se assume categorias ordenadas, sem característico numérico intrínseco. Por exemplo, classe social e grau de instrução. Além disso, as variáveis quantitativas podem ser classi cadas como discre- tas ou contínuas. Uma variável discreta pode assumir um número nito ou contável de valores. Cada valor pode ser grafado como um ponto na reta, com espaço entre os pontos. Uma variável contínua assume um número in nito de valores, formando um intervalo da reta real, sem espaço entre os pontos. Exemplos de variáveis quantitativas discretas são: número de habitantes por domicílio, número de anos cursados com aprovação em séries escolares, etc. Já para as quantitativas contínuas podemos citar: altura, peso, tempo de vida útil de um componente eletrônico. Assim temos o seguinte esquema resumido: Variável 8>>>><>>>>: Qualitativa � Nominal Ordinal Quantitativa � Discreta Contínua Associados aos tipos de variáveis, temos também, não menos importante, os níveis de mensuração. 6 Níveis de Mensuração: Um conjunto de dados pode ser classi cado de acordo com o nível de medida mais alto que ele aplica. Os quatro níveis de medida, do mais baixo para o mais alto, são: 1. Escala Nominal: formada por categorias que descrevem atributos ou qual- idades dos dados (variáveis qualitativas). Não há nenhuma ordem natural nessas categorias e tampouco característicos numéricos intrínsecos. Exemplos: sexo, estado civil, cor dos olhos, etnia, etc. 2. Escala Ordinal: formada por categorias que descrevem atributos ou quali- dades dos dados (variáveis qualitativas), mas que podem ser ordenadas, embora não tenham característicos numéricos intrínsecos. Exemplos: grau de hipertensão (leve, moderada e grave), escolaridade (sem instrução, ensino fundamental, ensino médio, ensino superior, pós-graduação), etc. 3. Escala Intervalar: é similar à escala ordinal, exceto pelo fato de as men- surações serem numéricas e distâncias entre dois dados podem ser medidas. Entre- tanto, o zero (0) não é natural, isto é, não indica a ausência do atributo mensurado. Exemplo: temperatura em graus Celsius (0�C não indica a ausência de temper- atura). 4. Escala Racional (ou das Razões): é a escala mais rica de mensuração, com característicos numéricos intrínsecos e zero natural (indicando a ausência do atributo medido). Exemplo: todas as mensurações físicas (peso, altura, massa corporal). De posse desses conceitos fundamentais, podemos no próximo capítulo começar nalmente a operar matematicamente nossos dados. Antes, porém, gostaríamos de propor as seguintes atividades de sedimentação do conteúdo tratado em nossa primeira aula. Exercício 1 Qual o objetivo da Estatística? Exercício 2 Como se estrutura a Estatística? Exercício 3 Dê um exemplo de fenômeno aleatório e um exemplo de fenômeno não-aleatório (determinístico). Exercício 4 Suponha que você tivesse que validar a informação de que a geladeira da fábrica A consome menos energia ao mês que a geladeira da fábrica B. Como você intuitivamente estruturaria as fases do método estatístico para validar (ou não) essa a rmação? Exercício 5 Retire de mídias (jornal, revista, internet, etc) uma matéria que você utilizaria em sala de aula para ilustrar a presença da Estatística no dia a dia aos seus alunos. 7 Exercício 6 Estabeleça se as seguintes situações ilustram o uso da Estatística De- scritiva ou Estatística Inferencial, justi cando as respostas. (a) Em São Paulo, a média de gasto semanal de consumo de gasolina numa amostra de 700 proprietários de carros foi de R$ 150; 00. O governo inferea média semanal de gasto em gasolina no estado de São Paulo é R$ 150; 00. (b) Uma amostra de 150 residentes de Copacabana mostra que 27 destes são funcionários públicos. Assim 18% desses 150 residentes trabalham para o governo. (c) A média de idade de uma amostra de 250 habitantes de Santa Cruz foi de 34 anos. (d) Numa pesquisa feita com 1000 habitantes de Campos (Rio de Janeiro), 456 disseram que já fazem suas compras com sacola ecológica pessoal. A prefeitura con- clui que 45; 6% dos habitantes de Campo já aderiram à bolsa ecológica. Exercício 7 Deseja-se conhecer o comportamento de idosos do bairro do Flamengo, com idade acima de 65 anos. Para isso, você como pesquisador decide selecionar 200 idosos moradores do Flamengo e, através de mensurações, obter as seguintes informações por idoso: (1) Ativo (A) ou Sedentário (S). (2) Idade (em anos). (3) Peso (em kg). (4) Altura (em cm). (5) Índice de Massa Corporal (IMC), que é a razão entre peso e altura em metros elevada ao quadrado. (6) Classe segundo o IMC (Normal (N) ou Sobrepeso (P)) (7) Circunferência da cintura (em cm). (8) Circunferência do quadril (em cm). (9) Relação Cintura/Quadril (RCQ) (adimensional). (10) Classe segundo a RCQ, sendo PR (pequeno risco), MR (médio risco) e GR (grande risco). Com base no estudo acima, pede-se: (a) Identi car a população em estudo. (b) Identi car a amostra em estudo. (c) Identi car os parâmetros do estudo. (d) Identi car as estatísticas do estudo. (e) Identi car os elementos do estudo. (f) Identi car as variáveis do estudo. (g) Identi car as observações do estudo. (h) Classi car as variáveis do estudo como qualitativas ou quantitativas. (i) Classi car as variáveis qualitativas do estudo como nominais ou ordinais. (j) Classi car as variáveis quantitativas do estudo como discretas ou contínuas. (k) Avaliar o nível de mensuração de cada variável do estudo. 8
Compartilhar