Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística 1ª edição 2017 Estatística 3 Palavras do professor Caro(a) aluno(a), você já notou o quanto as coisas são imprevisíveis na nossa vida? Por mais detalhistas e planejadores que tentemos ser, certas situações acabam fugindo do nosso controle. Não são raros os relatos de pessoas que planejam ir para a praia em determinados períodos e locais onde a chance de chuva é pequena, mas voltam frustradas de sua viagem porque quase não viram a cor do sol durante sua estada a beira-mar. Situações como a relatada são típicas do mundo imprevisível e caótico em que vivemos. Há situações que podemos afirmar de maneira precisa que ocorrerão, mas há tantas outras cuja ocorrência pode no máximo ser pre- vista. Por exemplo, ao ver um fruto pendurado em uma árvore, é possível afirmar que um dia ele sairá de lá (ou cairá ou alguém o irá arrancar). No entanto, saber qual será esse dia já é uma pergunta que não sabemos res- ponder, apesar de às vezes conseguirmos prever (a menos que queiramos interferir e ir arrancar o fruto da árvore hoje!). É para ajudar a entender como funcionam essas situações aleatórias que existe a Estatística. Fazer previsões parece coisa de vidente. No entanto, todos nós podemos ser um pouco “videntes” se soubermos usar a Estatís- tica e tivermos dados suficientes para analisar. O objetivo desta disciplina é compreender o uso prático da Estatística na análise de fenômenos reais que nos envolvem, saber calcular alguns parâ- metros e medidas que ajudam a entender os resultados de uma pesquisa realizada com base em um conjunto de elementos (amostra) - tais como as medidas de posição, de dispersão e de assimetria, elaborar e analisar tabelas e gráficos e entender os conceitos de probabilidades e alguns de seus principais modelos. Nosso estudo será dividido em duas partes, cada uma com quatro unida- des. Na primeira parte estudaremos como fazer a análise exploratória de um conjunto de dados: amostragem, distribuição de frequências, gráfi- cos, medidas de posição, medidas de dispersão e medidas de assimetria. Na segunda parte entenderemos os conceitos principais de probabilida- des e conheceremos dois tipos de distribuições aleatórias. Nessa última parte estudaremos as probabilidades e suas propriedades, as variáveis aleatórias discretas e contínuas, o modelo binomial e o modelo normal. 4 Palavras do professor A disciplina também oferta um grande desafio a você, apresentado em forma de tarefas a serem cumpridas articulando teoria com a prática con- textualizada. O primeiro desafio será organizar-se em pequenos grupos de 3 a 4 alunos e dividir proporcionalmente as tarefas apresentadas em cada unidade. No fórum você terá os detalhes do desafio. Acesse! Esperamos que você percorra esse caminho do aprendizado da Estatística com foco nos objetivos e alegria nos olhos. Bons estudos! 1 5 Unidade 1 Introdução à Estatística Para iniciar seus estudos A estatística é uma ciência largamente aplicada em diversos e distintos contextos. Seja na avaliação sobre a eficácia de um remédio, no cálculo do crescimento populacional ou na previsão de estocagem de produtos em supermercados, a Estatística tem sido indispensável nas análises de dados e tomadas de decisões. Sabe-se que nem tudo no mundo é certo. A bem da verdade, a maior parte dos fenômenos que ocorrem são aleatórios. Em meio a esse caos, a Estatística oferece um tratamento matemático requintado que ajuda a entender com eficiência inúmeros fenômenos aleatórios, fazer previsões e consequentemente tomar decisões. Nesta unidade de estudo conheceremos os aspectos básicos da Estatística e veremos exemplos do quão útil ela pode ser na prática. Objetivos de Aprendizagem • Entender o que é a estatística e o método estatístico. • Compreender a utilidade da estatística e também os abusos cometidos com ela. • Diferenciar a estatística dedutiva da estatística indutiva. • Definir população e amostra. • Entender como coletar dados corretamente. • Diferenciar variáveis qualitativas de variáveis quantitativas. • Informar sobre ferramentas digitais que facilitam os cálculos estatísticos. 6 Estatística | Unidade 1 - Introdução à Estatística 1.1 A estatística e o método estatístico A Estatística é uma ciência que buscar observar a ocorrência de fenômenos dos mais diversos tipos e, a partir dessas observações, tirar conclusões que permitam modelar teoricamente a realidade. No Ensino Médio, todo aluno costuma ter contato com a Física. Numa das aulas dessa disciplina, os estudantes ouvem falar que Newton estabeleceu numa de suas leis que a força aplicada a um objeto é igual ao produto de sua massa pela aceleração realizada. Isso é um fato certo! No entanto, Newton não conseguiria afirmar com certeza qual é o peso de uma maçã qualquer sem o uso de uma balança. O máximo que ele pode fazer é uma previsão desse peso. De fato, existem muitas maçãs espalhadas pelo mundo e cada uma delas tem um peso dife- rente. O peso das maçãs é, portanto, algo aleatório, que varia de uma maçã para outra sem uma regra fixa. Isso é um fato incerto! Generalizando os exemplos citados no parágrafo anterior, podemos dizer que existem dois tipos de fenômenos na natureza: os determinísticos e os aleatórios. Antes de defini-los, saiba que fenômeno é qualquer ocorrên- cia que pode ser verificada. Para observar um fenômeno utilizam-se experimentos (ou ensaios). Os fenômenos determinísticos são aqueles que apresentam a mesma resposta, independentemente do experimento realizado. Por sua vez, os fenômenos aleatórios são aqueles que ora apresentam uma resposta, ora apresentam outra, estando sujeitos ao acaso. De modo mais simples, podemos dizer que os fenômenos determinísticos são fatos certos enquanto os fenômenos aleatórios são fatos incertos. Fenômeno é qualquer ocorrência que pode ser verificada. Os fenômenos determinísticos são aqueles que apresentam a mesma resposta, independentemente do experimento reali- zado. Fenômenos aleatórios são aqueles que ora apresentam uma resposta, ora apresentam outra, estando sujeitos ao acaso. Por exemplo, pode-se analisar o fenômeno do nascimento de uma pessoa. Escolhendo-se pessoas ao acaso, queremos saber quais delas nasceram da fecundação entre um óvulo e um espermatozoide. A resposta é clara e certa: todas! Portanto, esse é um fenômeno determinístico. Independente das pessoas que sejam escolhidas num experimento, todas elas terão nascido da fecundação entre um óvulo e um espermatozoide. Por sua vez, escolhendo pessoas ao acaso, queremos saber qual era o peso de cada uma delas no instante do seu nascimento. Note que cada pessoa, mesmo que não saiba a resposta, terá um peso que possivelmente é diferente do seu peso quando você nasceu ou do peso do Barack Obama, ex-presidente dos Estados Unidos. Assim sendo, notamos que o fenômeno que analisa o peso de recém-nascidos é um fenômeno aleatório. Um curso de Estatística não está interessado em analisar fenômenos determinísticos. Eles podem ser deixados para outras ciências o fazerem. No entanto, a Estatística preocupa-se com o estudo de fenômenos aleatórios. Essa ciência tenta buscar no caos desses fenômenos algum padrão que permita entendê-los ao menos na maio- ria das vezes. Para analisar fenômenos aleatórios lançamos mão da probabilidade. O fenômeno de jogar uma moeda e obser- var a face voltada para cima é aleatório, visto que ora essa face é cara, ora ela é coroa. Por mais caótico que isso possa parecer, é possível calcular qual é a probabilidade de ocorrer cara ou coroa nesse lançamento (normal- mente 50% para cara e 50% para coroa). 7 Estatística | Unidade 1 - Introdução à Estatística Figura 1.1 - Lançamento de uma moeda cerimonial no início do Pro Bowl 2013 Fonte: Wikimedia Commons No início de um jogo de futebol, um árbitro costuma lançaruma moeda para decidir qual time dará o pontapé inicial. Esse é um típico exemplo de fenômeno aleatório em que cada time tem a mesma chance de sair vitorioso no lançamento da moeda. Ao analisar um fenômeno aleatório, um pesquisador usualmente deseja transformar dados de um experimento em informações concretas que permitam uma consciente tomada de decisão. Para isso, ele pode utilizar a Esta- tística em três momentos distintos. No primeiro, ele faz a coleta de dados, organiza-os e os sumariza - é a cha- mada Estatística Descritiva ou Estatística Dedutiva. No segundo momento, ele utiliza da Probabilidade para obter modelos que se adaptam às conclusões obtidas no primeiro momento. Por fim, no terceiro momento, ele faz a análise e interpretação dos dados a fim de fazer afirmações sobre o todo a partir de uma amostra - é a Inferência Estatística ou Estatística Indutiva. Neste curso, focaremos apenas os dois primeiros momentos: a Estatística Des- critiva e a Probabilidade. O método estatístico consiste numa série de passos que um pesquisador faz para obter as informações que deseja de um determinado fenômeno aleatório: 1. Formulação clara do problema a ser tratado e definição do processo que será usado para resolvê-lo (forma, cronograma etc.). 2. Coleta dos dados por algum meio: questionários, observações sobre registros ou documentos, experi- mentos, material bibliográfico, entre outros. 3. Apuração dos dados, a fim de contá-los, resumi-los e separá-los em grupos. 4. Organização dos dados por meio de tabelas e/ou gráficos. 5. Análise e interpretação dos dados, por meio das quais podem ser percebidas algumas características que ajudem a propor uma solução para o problema proposto inicialmente. Geralmente é aqui que entra a Inferência Estatística. Por um lado, a Estatística tem se tornado cada vez mais útil ao mundo moderno, já que a busca por informações a partir de dados e observações têm sido cada vez mais motivada pela alta competitividade entre empresas e pelas novas tecnologias. Não é à toa que Estatística está envolvida em diversos contextos: na economia (variações nas bolsas de valores, cálculo de inflação etc.), nas engenharias (transmissão de mensagens por meio de canais rui- dosos, dimensões e pesos de equipamentos, instrumentos e imóveis etc.), na medicina (verificação da eficácia de remédios no tratamento de determinadas doenças), na biologia (genética, controle de epidemias etc.), nas 8 Estatística | Unidade 1 - Introdução à Estatística ciências sociais (análise de comportamentos, demografia etc.), nas indústrias (controle de qualidade, tempo de produção etc.), entre outros. Por outro lado, muitos se utilizam de falsos argumentos estatísticos para fazer conclusões incorretas ou tendencio- sas acerca de determinados assuntos. Por vezes em nossas vidas já devemos ter tirado conclusões que se pautavam exclusivamente na nossa experiência pessoal, sem levar em consideração a experiência de outras pessoas. Esse é um erro estatístico causado pelo baixo tamanho da amostra (uma única pessoa). Além disso, é comum vermos na imprensa notícias que se utilizam de números falsos ou de resultados obtidos de amostragens viciadas para se defender uma tese. Outros maus usos de argumentos estatísticos consistem na interferência externa de um pesqui- sador no resultado, na desconsideração de variáveis importantes, nas perguntas mal formuladas ou tendenciosas, na imprecisão dos números, entre outros. Portanto, é preciso realizar os procedimentos e técnicas estatísticas de maneira correta e ética, a fim de não obter resultados falsos e incorretos para um determinado problema. Benjamin Disraeli é autor da frase “Há três tipos de mentiras: as mentiras, as mentiras sérias e as estatísticas” (SHIGUTI, W. A.; SHIGUTI, V.S.C. Apostila de Estatística. Disponível em: <http://www.inf.ufsc.br/~paulo.s.borges/Download/Apostila5_INE5102_Quimica.pdf>) que nos alerta sobre os perigos do mau uso da Estatística. Figura 1.2 - Benjamin Disraeli, o Conde de Beaconsfield Fonte: Wikimedia Commons 9 Estatística | Unidade 1 - Introdução à Estatística Você já viu em algum programa de TV ou na internet alguma “enquete tendenciosa” feita aos telespectadores ou leitores? Se sim, que efeito os formuladores da enquete queriam causar? Enfim, podemos notar que a Estatística está envolvida nos mais diversos contextos científicos e na análise de muitas situações cotidianas. Conscientes do potencial que as ferramentas estatísticas têm, nos motivamos a investir no aprendizado dessas técnicas. Afinal, como o uso de Estatística na nossa vida também é um fenômeno aleatório, nunca sabemos quando precisaremos dela! (Apesar de podermos opinar que a chance é grande, visto que esta disciplina está na sua grade curricular). 1.2 População e amostra Você já deve ter percebido que a cada dez anos no Brasil é realizado o censo demográfico. O objetivo desse recenseamento é obter informações sobre todos os brasileiros, tais como sexo, idade, profissão, entre outros. No entanto, há uma diferença formal entre o conceito de censo e o de Estatística. Enquanto a Estatística utiliza-se de amostras “pequenas” de uma população para obter informações, o censo deve coletá-las observando todos os elementos da população. Por exemplo, imagine que o reitor de uma faculdade queira saber qual é o número de alunos dessa faculdade que têm olhos verdes. Uma maneira de ele fazer isso seria conferir com todos os alunos da faculdade qual a cor de seus olhos - a isso se chama censo. Outra maneira seria escolher aleatoriamente um grupo menor de alunos, conferir qual a cor de seus olhos e depois deduzir quantos alunos de sua faculdade têm olhos verdes a partir dos dados obtidos utilizando a Estatística. Apesar do resultado obtido pela Estatística não ser tão preciso como o do censo, ela é preferida na maioria das vezes porque custa menos para ser realizada, é mais rápida e possui um erro que pode ser controlado. Há situações em que é inviável realizar censo. Por exemplo, se quiséssemos descobrir qual é a durabilidade média das pilhas e testássemos todas até acabarem, não restaria pilha para usar. Assim, fica evidente que a melhor solução para descobrir a durabilidade média das pilhas é selecionar um conjunto aleatório delas e recorrer à Estatística. Ao invés de se verificar todas as situações possíveis, se verifica apenas algumas delas. Isso nos leva a definir dois conceitos importantes em Estatística: o de população e o de amostra. 10 Estatística | Unidade 1 - Introdução à Estatística Figura 1.3 - População e amostra Amostra População Fonte: Elaboração própria, realizada no software GeoGebra. Numa comparação com a teoria de conjuntos, o diagrama acima (conhecido como diagrama de Venn) tem representado um retângulo, que corresponde à população de um determinado experimento, e um círculo, que corresponde a uma amostra dessa população. Apesar do conceito de população ser costumeiramente utilizado para designar o número de pessoas em um determinado local, a Estatística trabalha com uma definição mais geral dele. Chama-se de população ou uni- verso estatístico o conjunto de todos os elementos que podem ser observados num certo experimento. Por sua vez, qualquer subconjunto que pode ser extraído de uma população é chamado de amostra. Por exemplo, considere uma situação em que um guarda de trânsito deseja saber quantos motoristas de uma cidade carregam o documento de seu carro consigo ao dirigir. Nesse experimento, a população é o conjunto de todos os motoristas daquela cidade. Para tentar estimar esse número de motoristas portando documento, esse guarda decide parar todos os motoristas que passarem em frente à sua delegacia e conferir se eles estão com seu docu- mento. Nessa situação, os motoristas que passarem em frente à delegacia constituirão uma amostra da população. Imagine outroexemplo, em que o dono de uma fábrica de parafusos deseje saber quantos dos parafusos pro- duzidos numa semana são defeituosos. Se essa fábrica produzir 10 mil parafusos nessa semana, todos esses parafusos constituem a população do experimento descrito. Para facilitar a verificação, o dono da fábrica pode mandar recolher alguns lotes com 200 parafusos e verificar quantos deles são defeituosos. Cada um desses lotes representa uma amostra da população. Consideremos agora o exemplo de uma loja de roupas que tenha 500 camisetas em seu estoque. O dono da loja gostaria de saber quantas dessas camisetas são do tamanho P. Ao invés de verificar todas, ele pede que um de seus vendedores retire do estoque um conjunto aleatório contendo 20 camisetas para, a partir delas, fazer uma previsão sobre a quantidade de camisetas P existentes no estoque. Nesse exemplo, as 500 camisetas constituem a população, enquanto as 20 camisetas selecionadas aleatoriamente formam uma amostra. Utilizando argumentos da teoria dos conjuntos, que você deve ter estudado no início de seu Ensino Médio, pode- mos afirmar que de uma população finita com n elementos é possível obter 2n amostras distintas. 11 Estatística | Unidade 1 - Introdução à Estatística Considere a seguinte situação. Um vendedor deseja saber quantos de seus clientes são mulheres. Qual é a população desse experimento? Pense em três exemplos de amostras que podem ser retiradas dessa população. Para realizar uma análise sem grandes distorções de um determinado fenômeno aleatório deve-se extrair uma amostra da população que contenha essencialmente as mesmas características desse universo estatístico. Isso exige certa cautela e bom planejamento para realizar a seleção da amostra. Em geral, recomenda-se que essa amostra seja feita aleatoriamente. Quando se deseja analisar a quantidade de hemácias no sangue de uma pessoa, um coletor costuma retirar uma amostra de sangue do braço dela. A partir dessa amostra é possível afirmar com precisão qual é quantidade de hemácias em todo o sangue dessa pessoa, já que o sangue se distribui uniformemente no corpo humano. Portanto, esse processo de amostragem é fiel e não distorce as informações devido ao tipo de distribuição das hemácias no sangue, mesmo que não seja uma amostra obtida aleatoriamente. Figura 1.4 - Coleta de sangue Fonte: Wikimedia Commons A coleta de sangue em seres humanos é geralmente realizada no braço e pode e é representativa da caracterís- tica do sangue em qualquer parte do corpo, já que a composição do sangue é distribuída uniformemente nele. Agora, imagine que um prefeito deseje saber qual é a renda per capita média de um morador de sua cidade. Para isso é preciso obter uma amostra aleatória dessa população. De fato, se o prefeito optar por realizar o processo de amostragem majoritariamente em bairros nobres, ele possivelmente obterá resultados tendenciosos, indicando que a renda per capita média dos habitantes de seu município é bem maior que a da realidade. Situações como 12 Estatística | Unidade 1 - Introdução à Estatística essa contêm viés de seleção, imprimindo resultados que não conferem com a realidade. Por isso, a má seleção das amostras constitui um dos abusos cometidos em nome da Estatística. Para evitar os erros no momento da seleção da amostra, existem alguns processos de amostragem que podem ser aplicados pelo pesquisador. A seguir citamos alguns deles: • Amostragem aleatória simples (AAS): nesse processo o pesquisador enumera todos os elementos da população e posteriormente realiza um sorteio com reposição sucessivamente até obter o número de elementos desejados para a amostra. Esse procedimento é randômico, geralmente fácil de utilizar e garante que todos os elementos da população tenham mesma probabilidade de serem selecionados. Por exemplo, se um professor deseja fazer uma pesquisa com todos os alunos de uma sala que contém 50 integrantes e prefere retirar uma amostra com 5 deles, ele pode aplicar ASS enumerando todos os alunos com números de 1 a 50 e realizando o sorteio. Sorteio com reposição é aquele em que após o sorteio de um item entre todos os disponíveis, esse item continua disponível para seleção novamente. Por exemplo, se numa caixa existem três bolas de cores diferentes e se deseja retirar duas delas, é permitido num sorteio com reposição que uma bola de mesma cor seja sorteada duas vezes. Glossário • Amostragem sistemática (AS): se uma população já está ordenada (como num catálogo, por exem- plo), o investigador pode realizar a amostragem sistemática da seguinte forma: define N como sendo o número total de elementos da população e n como sendo o número de elementos que ele deseja sele- cionar na amostra; depois, calcula a razão N/n; posteriormente ele sorteia um número s entre 1 e N/n; por fim, ele forma sua amostra com os elementos numerados por s, s + Nn , s + 2N n , S + 3N n ,... Por exemplo, se o professor citado no item anterior deseja realizar uma amostragem sistemática naquela sala de aula, ele pode utilizar os números que cada aluno tem na lista de chamadas. O procedimento consiste em ele determinar a razão =Nn 50 5 = 10 , sortear um número x entre 1 e 10 (digamos que ) e selecionar a amostra com os alunos de número x, x + 10, x + 20, x + 30, x + 40 (com x = 7, a amostra é formada pelos alunos de número 7, 17, 27, 37 e 47). • Amostragem estratificada (AE): se uma população não for homogênea, o investigador pode optar pelo tipo de amostragem estratificada. Nesse caso, ele divide a população com N elementos em m grupos cujos elementos possuam características similares, cada um com ni elementos (i = 1, 2, ..., m ). Note que N = n1 + n2 + ... + nm. Cada um desses grupos é chamado estrato da população. Posteriormente, após a definição dos estratos, o investigador seleciona randomicamente um conjunto de cada estrato para for- mar a amostra. Geralmente, esse conjunto possui um número de elementos proporcional ao número de elementos do seu estrato em relação ao total de elementos da população. Por exemplo, se um prefeito deseja saber a renda per capita média dos 100 mil moradores de uma cidade que contém 10 bairros, 13 Estatística | Unidade 1 - Introdução à Estatística sendo 3 deles considerados bairros ricos e 7 considerados pobres, ele pode definir dois estratos: morado- res de bairros ricos e moradores de bairros pobres. Se ele deseja retirar uma amostra com 100 moradores, pode optar pela amostra estratificada selecionando aleatoriamente 30 moradores do estrato composto pelos moradores dos bairros ricos e 70 do estrato composto pelos moradores dos bairros pobres. Note que essa estratificação seria mais “justa” se o número de moradores em cada bairro da cidade fosse pra- ticamente o mesmo (de aproximadamente 10 mil moradores). 1.3 Tipos de variáveis Os fenômenos aleatórios possuem realizações das mais diversas naturezas. Enquanto o fenômeno das alturas das pessoas recebe como resposta um número real, o fenômeno sexo das pessoas recebe como resposta umas das opções masculino e feminino. Cada um desses fenômenos pode ser considerado uma variável e suas obser- vações ou respostas são os valores que essa variável pode assumir. Dizemos que uma variável é quantitativa quando seus valores são números vindos de uma contagem ou medida. Por sua vez, dizemos que uma variável é qualitativa quando seus valores são qualidades ou atributos não numé- ricos. Em Triola, encontramos a seguinte definição:. Os dados quantitativos consistem em números que representam contagens ou medidas. Os dados qualitativos (ou dados categóricos, ou atributos) podem ser separados em diferentes cate- gorias que se distinguem por alguma característica não-numérica. (TRIOLA, 1999, p.3). São exemplos de variáveis quantitativas: o número de cabelos na cabeça de uma pessoa, a distânciapercorrida por um carro, a altura de voo de um avião, o salário de um funcionário, entre outros. São exemplos de variáveis qualitativas: a cor do cabelo de uma pessoa, a marca de um carro, o país de fabricação de um avião, o nome de um funcionário, entre outros.0 Apesar das variáveis qualitativas serem distinguidas por possuir alguma característica não- -numérica, devemos nos atentar para a natureza dos dados, por exemplo, o CPF de uma pes- soa (875645342-77), este número não é originado de uma contagem ou de uma medida, trata-se de uma codificação que remete a uma pessoa, devemos sempre estar atentos quanto a essência das variáveis, outro exemplo, numa pesquisa de opinião a resposta pode ser codificada: 1- para sexo masculino, 2- para sexo feminino, desta forma, tanto o CPF (875645342-77) quanto (1,2) para situação anterior, são categorizadas como variáveis qua- litativas. 14 Estatística | Unidade 1 - Introdução à Estatística A seguir, vamos construir um exemplo fictício de uma exposição de cachorros que servirá para nosso estudo sobre tipos de variáveis. Exemplo 1.1: Numa cidade mineira foi realizada uma exposição de cachorros que contava com mais de 200 desses ani- mais. A fim de analisar algumas características dos cachorros à mostra, um visitante da exposição selecionou aleatoria- mente 20 deles e elaborou a seguinte tabela contendo as informações obtidas sobre alguns aspectos desses animais: Tabela 1.1 - Características de alguns cachorros de uma exposição Nome do cachorro Raça Idade (anos) Cor Altura (cm) Peso (kg) Intensidade do latido Habilidade Andy Poodle 2 Azul 25 7,0 Agudo Doméstico Babalu Maltês 3 Branco 21 3,4 Agudo Doméstico Blue Pitbull 5 Preto 51 29,0 Grave Caça Bolt Maltês 1 Branco 21 3,2 Agudo Doméstico Flufy Shih-tzu 1 Preto 20 4,5 Agudo Doméstico Kiara Buldogue 2 Branco 39 20,0 Grave Proteção Kitty Poodle 1 Branco 28 6,5 Agudo Doméstico Lala Shih-tzu 2 Marrom 27 5,7 Agudo Doméstico Lassie Pitbull 2 Marrom 49 23,0 Grave Proteção Lica Maltês 1 Branco 23 3,1 Agudo Doméstico Meg Buldogue 1 Marrom 32 23,0 Grave Proteção Nina Shih-tzu 1 Preto 20 4,1 Agudo Doméstico Rex Maltês 2 Branco 22 3,6 Agudo Doméstico Sam Maltês 2 Branco 22 3,5 Agudo Doméstico Scooby Buldogue 3 Marrom 47 25,0 Grave Caça Tino Poodle 4 Marrom 37 7,2 Agudo Doméstico Tintin Pitbull 1 Marrom 47 19,0 Grave Caça Totó Shih-tzu 2 Branco 26 5,7 Agudo Doméstico Tuta Shih-tzu 1 Marrom 21 4,5 Agudo Doméstico Xuxa Maltês 3 Branco 21 3,9 Agudo Doméstico Legenda: Nome, espécie, idade, cor, altura, peso, intensidade da voz e habilidade dos cachor- ros presentes na amostra selecionada pelo visitante da exposição. Fonte: Elaboração própria (2017). Nesse exemplo da exposição de cachorros podemos classificar as variáveis nome, espécie, cor, intensidade do latido e habilidade como variáveis qualitativas. Por sua vez, as variáveis idade, altura e peso são variáveis quantitativas. Uma variável qualitativa pode ainda ser classificada como nominal ou ordinária. Uma variável qualitativa nomi- nal é aquela cujos atributos não costumam ser ordenados. Por sua vez, uma variável qualitativa ordinal é aquela cujos atributos podem ser ordenados segundo algum critério. No exemplo 1.1 (da exposição de cachorros), as variáveis qualitativas espécie, cor e habilidade são nominais, enquanto as variáveis nome e intensidade do latido são ordinais, já que agudo é uma intensidade abaixo de grave e os nomes podem ser postos na ordem alfabética. Por sua vez, as variáveis quantitativas podem ser classificadas como discretas ou contínuas. A variável quantita- tiva discreta é aquela que apresenta uma quantidade finita de valores ou uma quantidade infinita enumerável (geralmente números inteiros). A variável quantitativa contínua é aquela que apresenta uma quantidade não 15 Estatística | Unidade 1 - Introdução à Estatística enumerável de valores, geralmente dentro de um intervalo real. No exemplo 1.1, da exposição de cachorros, podemos classificar a variável idade como discreta, pois ela assume valores 0, 1, 2, 3…, referente ao número de anos já vividos por cada cachorro. As variáveis altura e peso são contínuas, pois elas podem assumir qualquer valor real, mesmo que usualmente utilizemos aproximações desses valores. Por exemplo, segundo a tabela 1.1 o cachorro Rex tem 22 cm de altura. Possivelmente esse valor foi arredondado, já que sua altura real poderia ser até mesmo um número irracional próximo de 22, tal como 21,967725... Quadro 1.1 - Tipos de variáveis Variável Qualitativa Quantitativa Nominal Ordinal Discreta Contínua Legenda: Quadro-resumo sobre a classificação das variáveis. Fonte: Elaboração própria (2017). Adotando as classificações do quadro 1.1, como você classificaria as variáveis sexo de uma pessoa, estado civil, tamanho de uma camiseta, país de nascimento, altura de um prédio, grau de escolaridade e preço do arroz em um supermercado? 16 Estatística | Unidade 1 - Introdução à Estatística Exemplo 1.2: Considere a tabela 1.2, que possui informações sobre um conjunto de cidades brasileiras. Tabela 1.2 - Informações sobre algumas cidades brasileiras Cidade População Área (km²) Altitude (m) Mês de aniversário Estado Belo Horizonte 2.513.451 330,95 852 Dezembro MG Brasília 2.977.216 5.801,94 1.171 Abril DF Campinas 1.164.098 797,6 685 Julho SP Diamantina 47.647 3.869,83 1.280 Março MG Maringá 403.063 487,93 515 Maio PR Natal 877.662 167,26 30 Dezembro RN Rio de Janeiro 6.498.837 1.197,46 2 Março RJ São Paulo 12.038.175 1.522,99 760 Janeiro SP Legenda: Informações sobre a população, área, altitude, mês de aniversário e estado de algumas cidades brasileiras. Fonte: Elaboração própria (2017), com dados do portal Wikipedia. A tabela 1.2 apresenta algumas características de oito cidades brasileiras. A variável população é classificada como quantitativa discreta, pois o número de habitantes de uma cidade é sempre um número inteiro positivo. A variável área é classificada como quantitativa contínua, já que a área de uma cidade geralmente é um número real não necessariamente racional, apesar das aproximações que são feitas. A variável altitude também é con- siderada uma variável quantitativa contínua, pois medidas de comprimento sempre assumem valores reais não necessariamente racionais, apesar das aproximações apresentadas na tabela. A variável mês de aniversário é qualitativa ordinal, pois recebe valores não numéricos que, no entanto, podem ser ordenados de acordo com os 12 meses do ano (janeiro, fevereiro...). Por fim, a variável estado é qualitativa nominal, já que seus valores são não numéricos e não costumam ter uma ordem natural (a menos que alguém prefira pô-los em ordem alfabética). Exemplo 1.3: O técnico do time de futebol Laranjeiras FC pediu uma tabela com alguns dados dos 16 jogado- res de seu elenco contendo informações pessoais de cada um e o número de gols que cada um deles fez numa determinada temporada. A tabela fornecida ao técnico foi a seguinte: 17 Estatística | Unidade 1 - Introdução à Estatística Tabela 1.3 - Características dos jogadores de futebol do Laranjeiras FC Jogador Número da camiseta Posição Idade (em anos) Altura (em cm) Massa (em kg) Gols feitos Arnaldinho 8 Meia 32 170 72 8 Bruno 12 Goleiro 27 188 76 0 Caio 11 Atacante 28 181 77 13 Fabinho 15 Meia 17 173 71 0 Hallison 13 Lateral 23 163 65 0 Lelê 10 Atacante 30 165 70 10 Nino 6 Lateral 21 170 71 3 Pedrão 4 Zagueiro 33 185 83 1 Pipo 7 Meia 26 172 73 5 Rogério 5 Meia 21 183 82 1 Rony 9 Atacante 31 170 72 17 Tiago 14 Zagueiro 25 177 73 1 Tião 1 Goleiro 38 195 81 0 Tiburcio 16 Atacante 20 174 73 3 Ulisses 3 Zagueiro 18 180 79 2 Yuri 2 Lateral 29 177 80 1 Legenda: Informações sobrenúmero de camiseta, posição, idade, massa, altura e número de gols feitos pelos 16 jogadores do Laranjeiras FC. Fonte: Elaboração própria (2017). As variáveis da tabela 1.3 analisadas pelo técnico do Laranjeiras FC podem ser classificadas da seguinte forma: a posição dos jogadores é a única variável qualitativa nesta tabela, sendo subclassificada como nominal; o número de camisetas e o número de gols feitos pelos jogadores são variáveis quantitativas discretas, pois são dados por números inteiros positivos; a idade, a altura e a massa de cada jogador são variáveis quantitativas contínuas, pois são números reais, mesmo que sejam apresentados com valores aproximados na tabela. No exemplo 1.2 poderíamos ter considerado ainda outras tantas variáveis na análise das cidades do quadro: número de escolas na cidade, partido do prefeito, número de distritos, densidade, IDH, PIB per capita, clima predominante, ano de fundação, entre outras. Como você classificaria cada uma dessas variáveis entre os quatro tipos expostos no quadro 1.1? 18 Estatística | Unidade 1 - Introdução à Estatística 1.4 Adendo: ferramentas digitais no tratamento estatístico Nas próximas unidades dos nossos estudos, por vezes precisaremos fazer cálculos, aplicar fórmulas, esboçar grá- ficos e obter valores numéricos complicados de fazer à mão. Nessas tarefas, o auxílio das ferramentas digitais é sempre bem-vindo. Se você possui uma calculadora científica, ela pode ser sua grande parceira na realização dos cálculos estatísticos, já que ela dispõe de uma série de recursos programados para esses fins. A calculadora usual auxilia na realização das operações básicas, mas deixa o usuário na mão quando ele precisa de recursos um pouco mais avançados. Se você possui uma calculadora científica, você pode deixá-la do seu lado enquanto estuda e pode aproveitá-la para a realização dos cálculos que forem sendo sugeridos ao longo das unidades de estudo. Figura 1.5 - Calculadora científica Legenda: A calculadora científica oferece muitos recursos para cálculos estatísticos. Fonte: Wikimedia Commons Aqueles que não têm uma calculadora científica ou mesmo aqueles que preferem o uso do computador podem utilizar softwares estatísticos. Os softwares mais conhecidos são o Minitab e o S-Plus, mas eles são pagos. Um bom software estatístico gratuito é o R, que você pode baixar no seu computador e aprender a usar para suas necessidades estatísticas ao longo desse curso ou posteriormente. Além dos softwares utilizados acima, você também pode utilizar o Microsoft Office Excel caso o tenha instalado em seu computador. Conforme Levine (2008) esse software também possui importantes funções estatísticas dis- poníveis que podem nos auxiliar em várias tarefas. 19 Estatística | Unidade 1 - Introdução à Estatística Agora que você já tem uma boa base inicial do que é Estatística, acesse o fórum e inicie suas tarefas do desafio. Organize-se em grupo e comece suas pesquisas. Por fim, encerramos essa seção recomendando que você tenha disponível algum dos recursos comentados acima (e aprenda a usá-lo), a fim de poder usá-los para facilitar eventuais cálculos dispendiosos que venham a surgir neste curso ou em seu trabalho cotidiano que envolva Estatística . Para saber mais sobre o software R e baixá-lo em seu computador consulte o portal (R-PRO- JECT) - em inglês. Para aprender a trabalhar com o R, você pode ler o seguinte tutorial dis- ponível na internet em português. Acesse: R-PROJECT <https://www.r-project.org/>; LAN- DEIRO <https://cran.r-project.org/doc/contrib/Landeiro-Introducao.pdf> 20 Considerações finais Nesta unidade buscamos entender a importância da Estatística no mundo atual e apresentamos definições básicas dessa ciência. Buscamos entender: • A diferença entre os fenômenos determinísticos e aleatórios. • A aplicação da Estatística ao mundo real a partir da coleta de dados e do tratamento de informações. • Os passos do método estatístico. • A utilidade da Estatística no mundo moderno aplicada aos mais diversos contextos. • O mau uso ou uso tendencioso da Estatística para corroborar teses interesseiras. • A definição de população ou universo estatístico e a definição de amostra. • A importância da realização do processo de amostragem de maneira independente e livre de vícios. • Três diferentes procedimentos de amostragem: AAS, AS e AE. • A definição de variável em um fenômeno aleatório. • A classificação das variáveis aleatórias como qualitativas nominais ou ordinais ou como quantitativas discretas ou contínuas. • Os benefícios e possibilidades do uso das ferramentas digitais para fins estatísticos. Referências bibliográficas 21 LANDEIRO, Victor Lemes. Introdução ao uso do programa R. Manaus: Instituto Nacional de Pesquisas da Amazônia, 4 mar. 2011. Disponível em: <https://cran.r-project.org/doc/contrib/Landeiro-Introducao.pdf>. Acesso em: 2017. LEVINE, David M. Estatística: teoria e aplicações: usando Microsoft Excel em português. 5. ed. Rio de Janeiro: LTC Ed., 2008. 752 p. SHIGUTI, W. A.; SHIGUTI, V. S. C. Apostila de Estatística. Disponível em: <http://www.inf.ufsc.br/~paulo.s.borges/Download/Apostila5_INE5102_ Quimica.pdf>. Acesso em: 2017.
Compartilhar