Prévia do material em texto
<p>Introdução</p><p>Olá, estudante! Começaremos nossa jornada pela história da Estatística, uma área</p><p>do conhecimento que acompanha a humanidade desde tempos imemoriais.</p><p>Quando os seres humanos começaram a se organizar em sociedades estruturadas,</p><p>surgiu a necessidade de coletar e registrar informações importantes e muito</p><p>necessárias para a sobrevivência da coletividade. Tais dados, quase sempre sobre</p><p>populações e recursos disponíveis, permitiam planejar melhor a gestão das</p><p>pessoas e das riquezas em prol do benefício do grupo.</p><p>Com o passar do tempo, a coleta de dados estatísticos tornou-se cada vez mais</p><p>sistemática – quase sempre associada às necessidades da administração pública</p><p>de sociedades mais complexas. Ademais, com a emergência da ciência moderna, a</p><p>partir do início da Modernidade (no século XVI), surgiu a necessidade de métodos e</p><p>técnicas de mensuração para atribuir significado correto aos dados de</p><p>observações e experimentos. Assim, a Estatística passou a auxiliar não somente a</p><p>gestão das questões de interesse público imediato, mas também as atividades de</p><p>pesquisa científica que ajudam a desvendar os mistérios da natureza e que</p><p>impulsionam o progresso da humanidade.</p><p>Na Contemporaneidade, a Estatística desempenha um papel fundamental tanto</p><p>para os avanços científicos quanto para processos de tomada de decisões</p><p>políticas, econômicas ou empresariais. Lidamos o tempo todo com grandes</p><p>volumes de dados e, sem as ferramentas estatísticas e metodológicas que foram</p><p>desenvolvidas no transcurso de séculos, como poderíamos extrair informações</p><p>pertinentes a partir desses dados?</p><p>Vamos, portanto, ampliar nosso conhecimento sobre Estatística e aprender sobre</p><p>uma das áreas mais importantes para o desenvolvimento humano. Boa leitura!</p><p>A Natureza da Estatística - (Estatística Aplicada -</p><p>Ementa 2)</p><p>Claudio Téllez</p><p>Autor</p><p>Objetivos de Aprendizagem</p><p>Aprender sobre a origem e o desenvolvimento histórico da Estatística.</p><p>Refletir sobre a importância da Estatística para o desenvolvimento da</p><p>ciência e para processos de tomada de decisões.</p><p>Entender a diferença entre Estatística Dedutiva e Indutiva.</p><p>Compreender as fases do método estatístico.</p><p>Entender como a Estatística proporciona apoio aos sistemas da</p><p>informação.</p><p>Evolução histórica da Estatística</p><p>A Estatística possui uma longa história, praticamente acompanhando o</p><p>desenvolvimento humano desde os primórdios da civilização. Durante a trajetória</p><p>de sua formação e consolidação como campo do conhecimento, passou por</p><p>diversas etapas, de acordo com os contextos e as necessidades de cada época.</p><p>O surgimento da Estatística na Antiguidade</p><p>Já nas primeiras civilizações da Antiguidade, surgiu a necessidade de desenvolver</p><p>técnicas de recenseamento, tanto para a cobrança de tributos quanto para fins</p><p>militares (recrutamento). Há indícios arqueológicos de que levantamentos</p><p>demográficos foram feitos na antiga China, por volta do ano 2200 A.E.C. (Antes da</p><p>Era Comum), na Babilônia e no antigo Egito (OLIVEIRA JUNIOR; CARDOSO; DELALÍBERA,</p><p>2017).</p><p>Na época do Império Romano, o imperador Augustus, que viveu de 63 A.E.C. até 12</p><p>E.C. (Era Comum), ficou conhecido por ter ordenado o censo dos judeus, na época</p><p>em que supostamente Jesus teria nascido (MEMÓRIA, 2004). Além da contagem de</p><p>habitantes, o imperador Augustus costumava manter registros de nascimentos e</p><p>falecimentos dos cidadãos romanos, bem como da quantidade de bens</p><p>agropecuários produzidos pelo Império. Nesse contexto, foi necessário, portanto,</p><p>desenvolver métodos e ferramentas para a coleta e organização desses dados. O</p><p>palavra “censo”, aliás, origina-se do termo latino census, -us, que significa rol ou</p><p>registro das pessoas e bens feito pelos censores, que eram os magistrados</p><p>responsáveis pela determinação dos bens de cada cidadão para fins de fixação de</p><p>impostos (TORRINHA, 1942).</p><p>Outros povos antigos também realizaram censos populacionais e registros de</p><p>propriedades. De acordo com as escrituras hebraicas, Moisés teria recebido a</p><p>instrução de fazer um levantamento dos homens aptos para guerrear (COSTA,</p><p>1992). Assim, podemos verificar que as finalidades tributárias e bélicas teriam sido</p><p>as primeiras motivações para as origens mais antigas da Estatística.</p><p>Da Idade Média ao Renascimento/início da</p><p>Modernidade</p><p>No ano 1085 E.C., Guilherme, o Conquistador, normando que invadiu a Inglaterra,</p><p>solicitou que fosse feito um levantamento das terras conquistadas (MEMÓRIA, 2004),</p><p>adquirindo informações detalhadas a respeito de terras, proprietários, formas de</p><p>uso das terras, empregados e animais, a fim de efetuar cálculos mais precisos para</p><p>a cobrança de impostos e para propósitos administrativos (COSTA, 1992). Os dados</p><p>contábeis coletados foram reunidos em um livro que ficou conhecido como</p><p>Domesday book (Livro do Dia da Avaliação).</p><p>FIGURA 1 Imperador Augustus</p><p>FONTE: Davspanic / 123RF</p><p>Durante a Idade Média, levantamentos estatísticos eram feitos essencialmente com</p><p>a finalidade de arrecadação tributária, devido à própria estrutura e organização</p><p>descentralizada do sistema feudal, no qual cada senhor feudal cobrava seus</p><p>tributos. Não houve, contudo, desenvolvimento significativo das técnicas de</p><p>recenseamento, em função da falta de uma organização administrativa</p><p>incontestável e do arcabouço de crenças e valores compartilhados, que</p><p>consideravam os censos como facilitadores de possíveis práticas pecaminosas: “as</p><p>condenações por Santo Agostinho ou Santo Ambrósio do pecado do orgulho</p><p>cometidos quando dos recenseamentos da população humana perturbaram as</p><p>tentativas de contagem da população” (MARTIN, 2001, p. 15).</p><p>Foi somente no século XVI, em pleno Renascimento Italiano (início da Modernidade),</p><p>que Francesco Tatti da Sansovino (1521-1586) começou a desenvolver a estatística</p><p>descritiva, com sua obra Del governo e amministrazione di diversi regni e republiche</p><p>(Sobre o governo e administração de reinos e repúblicas diversas), de (1562), na</p><p>qual enfatizou a necessidade da coleta e descrição de dados para propósitos</p><p>políticos e administrativos. Na mesma época de Sansovino, o Concílio de Trento</p><p>(1545–1563), convocado pelo Papa Paulo III, tornou obrigatória a realização de</p><p>registros de batismos, casamentos e óbitos, o que deu novo impulso ao</p><p>desenvolvimento de técnicas de coleta e organização de dados em registros</p><p>demográficos.</p><p>FIGURA 2 Trecho do Domesday book, contendo informações sobre as terras e posses (escriba</p><p>anônimo, 1086 E.C.)</p><p>FONTE: Lobsterthermidor / WikiCommons</p><p>No século XVII, a Inglaterra passou por uma época de pestes e John Graunt (1620–</p><p>1674) desenvolveu as primeiras Tábuas de Mortalidade, em seu livro Natural and</p><p>political observations made upon the bills of mortality (Observações naturais e</p><p>políticas feitas a partir de notas de mortalidade), de (1662), contendo dados</p><p>detalhados de nascimentos e mortes, que acabaram por preparar o caminho para</p><p>que, poucos anos depois, o astrônomo Edmond Halley pudesse fazer as primeiras</p><p>inferências estatísticas sobre relações de sobrevivência (BELTRÃO; PINHEIRO, 2002).</p><p>As Tábuas de Mortalidade de Graunt e de Halley são importantes tanto para a</p><p>história da Estatística quanto para o desenvolvimento das Ciências Atuariais, por</p><p>serem utilizadas para o cálculo de prêmios de seguros a partir das probabilidades</p><p>de morte ou sobrevida de indivíduos em uma dada população.</p><p>Durante o século XVII, a monarquia francesa percebeu a importância do</p><p>recenseamento para fins de administração pública:</p><p>[...] deveria permitir o estabelecimento de necessidades</p><p>alimentares dos súditos do rei, manter os registros de polícia e o</p><p>registro dos sujeitos a taxas e impostos (gabela, talha), construir</p><p>estatística de “fogos” para estabelecer a repartição geográfica</p><p>dessas taxas e impostos, constituir listas de homens aptos para</p><p>a guerra ou fazer o inventário da subsistência (notadamente</p><p>após as crises alimentares ou guerras) (MARTIN, 2001, p. 16).</p><p>Dessa maneira, nos dois primeiros séculos da Modernidade, a mudança nas</p><p>estruturas políticas (do sistema feudal para o surgimento dos Estados modernos)</p><p>contribuiu para a percepção</p><p>de uma necessidade cada vez maior de métodos e</p><p>ferramentas de coleta e organização de dados estatísticos para fins de</p><p>administração pública.</p><p>O surgimento e a consolidação do sistema moderno de Estados, a partir dos</p><p>Tratados de Westphalia, em 1648 (CASTRO, 2012), contribuíram para a centralização</p><p>política e a decorrente demanda por dados sociais e econômicos para fins de</p><p>administração e tributação. Na mesma época, também ocorreu o início do</p><p>desenvolvimento da Teoria Matemática da Probabilidade, a partir das discussões</p><p>entre Blaise Pascal (1623–1662) e Pierre de Fermat (1601–1665), seguidos por Jacob</p><p>Bernoulli (1654–1705), que deu início a abordagens formais para a quantificação da</p><p>incerteza, e Abraham De Moivre (1667–1754) que, em sua obra The doctrine of</p><p>chance (A doutrina da probabilidade), de 1718, estudou o limite da distribuição</p><p>binomial e chegou ao formato da curva normal (MEMÓRIA, 2004). Durante os</p><p>séculos XVIII e XIX, a Teoria da Probabilidade continuou amadurecendo com as</p><p>contribuições de autores como Pierre Simon de Laplace (1749–1827) e Carl Friedrich</p><p>Gauss (1777–1855), mas foi o polímata Adolphe Quételet (1796–1874) quem</p><p>defendeu a necessidade de fundamentar a Estatística na Teoria da Probabilidade,</p><p>além de ter contribuído para a análise de dados sociais com sua obra Essai de</p><p>Physique Sociale (Ensaio de Física Social), de 1835 (MEMÓRIA, 2004).</p><p>Da “Ciência do Estado” à Estatística Moderna</p><p>O termo “Estatística” foi cunhado pelo historiador alemão Gottfried Achenwall (1719–</p><p>1772) para denotar a análise de diversos tipos de dados (econômicos, sociais e</p><p>demográficos) pertinentes à gestão do Estado, isto é, uma “ciência do Estado”. Foi a</p><p>partir do século XVIII, portanto, que a Estatística passou a adquirir uma natureza</p><p>genuinamente científica (CRESPO, 2009).</p><p>A partir dos séculos XVIII e XIX, a Estatística passou a participar cada vez mais</p><p>também das atividades de pesquisa científica. Em grande parte, isso foi</p><p>impulsionado pela fusão entre a Teoria da Probabilidade e o pensamento</p><p>estatístico.</p><p>Sir Francis Galton (1822–1911), primo de Charles Darwin (1809–1882), realizou</p><p>contribuições importantes para o desenvolvimento do conceito de regressão à</p><p>média:</p><p>[...] foi no estudo comparativo da estatura entre pais e filhos, em</p><p>1885, que Francis Galton usou, pela primeira vez, o termo</p><p>regressão, para denotar a regressão à média da população por</p><p>ele observada, pois quando os pais eram mais altos do que a</p><p>média, os filhos tendiam a ser menores do que eles e, quando os</p><p>pais eram mais baixos que a média, os filhos tendiam a ser</p><p>maiores do que eles. (MEMÓRIA, 2004, p. 23)</p><p>O desenvolvimento da Biologia a partir do século XIX e nas primeiras décadas do</p><p>século XX, principalmente após o marco fundamental estabelecido por Charles</p><p>Darwin com sua explicação teórica sobre a evolução, impulsionou ainda mais o</p><p>desenvolvimento da Estatística como ferramenta indispensável para a pesquisa</p><p>científica.</p><p>Karl Pearson (1857–1936), pesquisando sobre Teoria da Evolução, começou a</p><p>desenvolver o campo da Estatística Matemática. Em uma série de artigos, Pearson</p><p>proporcionou contribuições matemáticas à Teoria da Evolução e desenvolveu</p><p>técnicas específicas para estudos biométricos, muitas das quais são utilizadas até</p><p>hoje, tendo sido um dos primeiros a realizar testes estatísticos para verificar a</p><p>validade de hipóteses biológicas (MARTINS; VENTURINELI, 2011).</p><p>O matemático, geneticista e biólogo evolutivo Sir Ronald Fisher (1890–1962) foi um</p><p>dos autores mais importantes para a consolidação da Estatística moderna na</p><p>ciência. Em sua obra The Genetical Theory of Natural Selection (A teoria genética da</p><p>Seleção Natural), de 1930, Fisher realizou extensas aplicações de métodos</p><p>estatísticos à Teoria da Evolução (MEMÓRIA, 2004). Fisher também desenvolveu</p><p>métodos para o desenho de experimentos e contribuiu para a análise da variância.</p><p>Em sua obra O rio que saía do Éden: uma visão darwinista da vida, o etólogo e</p><p>biólogo evolutivo Richard Dawkins (1941–) referiu-se a Fisher como o “maior</p><p>sucessor de Darwin no século XX, assim com o pai da estatística moderna”</p><p>(DAWKINS, 1996, p. 23).</p><p>Estatística na Era dos Dados</p><p>Embora seja comum encontrarmos referências à nossa época como Era da</p><p>Informação, devido às profundas transformações de nossas vidas pelas tecnologias</p><p>da informação, é mais correto chamar a contemporaneidade de Era dos Dados.</p><p>Com os fluxos de comunicação acelerados e o surgimento de novas ferramentas</p><p>computacionais, a humanidade produz volumes cada vez maiores de dados – que</p><p>precisam ser adequadamente coletados, classificados e processados para a</p><p>produção de informações úteis.</p><p>FIGURA 3 Karl Pearson em sua mesa de trabalho</p><p>FONTE: Autor desconhecido / Wikimedia Commons</p><p>Para fazer o tratamento adequado desses volumes gigantescos de dados, é</p><p>necessário juntar o desenvolvimento de ferramentas estatísticas adequadas com</p><p>as novas tecnologias computacionais que vêm surgindo nos últimos anos. Entre</p><p>essas tecnologias, destaca-se a modelagem de aprendizado de máquina, um</p><p>desenvolvimento da inteligência artificial que nasceu na década de 1960 para a</p><p>criação de algoritmos capazes de identificar e aprender padrões a partir de dados</p><p>(IZBICKI; DOS SANTOS, 2020). Desde a década de 1990, o aprendizado de máquina</p><p>passou a desenvolver uma relação sinérgica com a Estatística.</p><p>Saiba mais!</p><p>Palestra: Aprendizagem de máquina em Biologia: a inteligência</p><p>artificial e os desafios das ciências biológicas neste século</p><p>Na XXIV BioSemana UFRJ, que ocorreu em julho de 2020, Carlos</p><p>Eduardo Guerra Schrago, professor e pesquisador da área de</p><p>Genética, ministrou a palestra “Aprendizagem de máquina em</p><p>biologia: a inteligência artificial e os desafios das ciências biológicas</p><p>neste século”. Trata-se de uma oportunidade para aprender como</p><p>FIGURA 4 Big Data no século XXI</p><p>FONTE: MuhammadAbuHijleh / Wikimedia Commons</p><p>técnicas de aprendizado de máquina estão ajudando a resolver</p><p>problemas em Biologia, bem como para refletir a respeito das</p><p>questões éticas associadas ao tema.</p><p>Fique por dentro, acesse:</p><p>Clique Aqui</p><p>Na atualidade, enfrentamos a necessidade de lidar com volumes gigantescos de</p><p>dados. Assim, tanto os processos analíticos que empregamos na pesquisa científica</p><p>quanto os mecanismos de tomada de decisões empresariais, econômicas e</p><p>políticas demandam a combinação de técnicas sofisticadas de Estatística com o</p><p>que há de mais novo no campo das tecnologias computacionais: aprendizado de</p><p>máquina e outros sistemas inteligentes (MONARD; BARANAUSKAS, 2003).</p><p>Divisão da Estatística: Dedutiva e Indutiva</p><p>De acordo com as necessidades estabelecidas pela pesquisa ou com a etapa na</p><p>qual o estudo se encontra, a Estatística pode ser Dedutiva ou Indutiva. Para algumas</p><p>situações, a Estatística Dedutiva, que apresenta e descreve características de um</p><p>conjunto de dados, pode ser suficiente. Caso o propósito seja estudar, a partir de</p><p>uma amostra, aspectos ou características de uma população maior, a Estatística</p><p>Dedutiva corresponde à primeira etapa que deve ser realizada antes de empregar</p><p>as ferramentas da Estatística Indutiva para realizar inferências.</p><p>Estatística Dedutiva (Descritiva)</p><p>A Estatística Dedutiva (ou Descritiva) realiza atividades de coleta, apresentação e</p><p>interpretação analítica de dados numéricos. Dessa maneira, consiste em técnicas e</p><p>métodos para a descrição precisa de conjuntos de dados. Dessa forma, a</p><p>Estatística Dedutiva é responsável por realizar a devida organização, o resumo e a</p><p>representação dos dados (LARSON; FARBER, 2015).</p><p>Uma vez que o problema a ser estudado é definido, realiza-se a coleta dos dados</p><p>pertinentes à pesquisa, os quais são registrados de forma sistemática, de acordo</p><p>com os objetivos da investigação. Pode-se fazer a coleta direta, a partir de registros</p><p>ou observações a partir das fontes originais; ou a coleta indireta, quando decorre de</p><p>interpretações dos elementos coletados diretamente.</p><p>Após, os dados coletados precisam passar por uma avaliação crítica. É importante</p><p>evitar juízos de valor, que têm o potencial de interferir</p><p>negativamente na qualidade</p><p>da análise. No entanto, cabe ao cientista ou ao estatístico ponderar sobre a</p><p>natureza dos dados, com o propósito de identificar valores inconsistentes com o</p><p>fenômeno sob investigação. Tais inconsistências podem decorrer de problemas em</p><p>equipamentos de medição, erros humanos nos registros ou interferências de fatores</p><p>externos.</p><p>Após a coleta e a análise crítica dos dados, passa-se à apresentação do material, o</p><p>que geralmente se faz por intermédio de tabelas e/ou gráficos. Os dados,</p><p>previamente apurados de acordo com critérios de classificação bem definidos, são</p><p>organizados em forma tabular (em linhas e colunas ordenadas) ou de forma</p><p>gráfica. É importante ressaltar que as duas formas de apresentação não são</p><p>mutuamente excludentes e a escolha por uma ou outra, ou por ambas, depende</p><p>dos objetivos da pesquisa.</p><p>Quando se deseja transmitir uma informação visual rápida do fenômeno sob</p><p>investigação, gráficos tendem a ser a melhor opção. Já as tabelas permitem a</p><p>visualização de detalhes numéricos mais sutis.</p><p>Finalmente, passa-se à análise dos dados, com o propósito de extrair informações</p><p>na forma de números ou valores que expressam medidas descritivas e</p><p>representativas do fenômeno sob escrutínio. É usual empregar medidas como a</p><p>média, a mediana e a moda, conhecidas como medidas de tendência central</p><p>(LARSON; FARBER, 2015).</p><p>Define-se a média de um conjunto de dados como o somatório dos valores dividido</p><p>pelo número de observações. Se cada dado apresenta um valor e são realizadas</p><p>observações, a média é calculada empregando a fórmula:</p><p>𝑥 =</p><p>𝑛</p><p>�</p><p>𝑖 = 1</p><p>𝑥𝑖</p><p>𝑛</p><p>O Σ símbolo , na fórmula para a média, é chamado de somatório. Assim, se temos,</p><p>por exemplo, cinco valores, de até , a média desses valores é dada por:</p><p>𝑥 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5</p><p>5</p><p>Por exemplo, suponha que mensuramos a altura em metros de 5 indivíduos do sexo</p><p>feminino, com idades entre 25 e 30 anos. Obtivemos os seguintes valores para as</p><p>alturas:</p><p>x1 = 1,57 m</p><p>x2 = 1,51 m</p><p>x3 = 1,64 m</p><p>x4 = 1,53 m</p><p>x5 = 1,72 m</p><p>A média das alturas é dada por:</p><p>𝑥 = 1, 57 + 1, 51 + 1, 64 + 1, 53 + 1, 72</p><p>5</p><p>= 1, 59 𝑚</p><p>Observamos que o valor central é 1,57 m. Assim, a mediana desse conjunto de</p><p>dados é 1,57 m.</p><p>Quando temos uma quantidade ímpar de dados ordenados, é fácil identificar o</p><p>dado que ocupa a posição central. Caso tenhamos um número par de dados, a</p><p>mediana corresponderá à média dos dois elementos situados no centro. Vamos</p><p>supor que tivéssemos mais um dado no conjunto anterior, x6 = 1,48 m. Agora, os</p><p>dados ordenados ficariam:</p><p>1,48 m 1,51 m 1,53 m 1,57 m 1,64 m 1,72 m</p><p>Os dados centrais, destacados em vermelho, correspondem a 1,53 m e 1,57 m. Para</p><p>calcular a mediana, precisamos da média desses dados:</p><p>1, 53 + 1, 57</p><p>2</p><p>= 1, 55 𝑚</p><p>Assim, a mediana desse novo conjunto de dados é 1,55 m.</p><p>Finalmente, a moda é o valor que aparece com maior frequência. Dado um</p><p>conjunto de dados, pode haver apenas uma moda, mais de uma moda ou</p><p>nenhuma moda (caso todos os dados sejam distintos). No exemplo anterior, não há</p><p>moda. Vamos supor, agora, que mensuramos a altura em metros de 10 indivíduos</p><p>do sexo feminino, com idades entre 25 e 30 anos, e obtivemos os seguintes</p><p>resultados:</p><p>x1 = 1,57 m; x2 = 1,51 m; x3 = 1,64 m; x4 = 1,53 m; x5 = 1,72 m</p><p>x6 = 1,53 m; x7 = 1,64 m; x8 = 1,61 m; x9 = 1,65 m; x10 = 1,58 m</p><p>A partir desses dados, notamos que os dados x4 e x6 apresentam o mesmo valor</p><p>(1,53 m), assim como os dados x3 e x7 (1,64 m). Esse conjunto de dados apresenta,</p><p>portanto, duas modas (bimodal), que correspondem aos valores 1,53 m e 1,64 m.</p><p>Na Estatística Dedutiva, além das medidas de tendência central, também é</p><p>importante sabermos trabalhar com medidas de variação ou de dispersão do</p><p>conjunto de dados. Define-se a amplitude de um conjunto de dados como a</p><p>diferença entre seus valores máximo e mínimo. Nos dados do exemplo anterior, o</p><p>menor valor medido foi 1,51 m e o maior valor medido foi 1,72 m. A amplitude desse</p><p>conjunto de dados é, portanto, 1,72 m - 1,51 m = 0,21 m.</p><p>Considerando um conjunto de dados, podemos calcular o desvio de cada um dos</p><p>dados. O desvio de um valor é definido como a diferença entre esse valor e a média</p><p>do conjunto. Assim, considere agora os seguintes dados, correspondentes aos</p><p>rendimentos anuais (em milhares de dólares), de 5 indivíduos do sexo masculino,</p><p>em 2019:</p><p>x1 = USD 72.000,00 ; x2 = USD 85.000,00; x3 = USD 87.000,00; x4 = USD 96.000,00; x5 =</p><p>USD 101.000,00</p><p>Após calcularmos a média, que corresponde a x, os desvios correspondentes para</p><p>esses dados são:</p><p>x1: (72.000,00 - 88.000,00) = - USD 16.000,00</p><p>x2: (85.000,00 - 88.000,00) = - USD 3.000,00</p><p>x3: (87.000,00 - 88.000,00) = - USD 1.000,00</p><p>x4: (96.000,00 - 88.000,00) = USD 8.000,00</p><p>x5: (101.0000,00 - 88.000,00) = USD 13.000,00</p><p>Define-se a variância como a soma dos quadrados dos desvios de todos os dados</p><p>do conjunto, dividida pelo número total de dados. Assim, a variância se dá por</p><p>intermédio da fórmula:</p><p>𝜎2 =</p><p>𝑛</p><p>�</p><p>𝑖 = 1</p><p>� 𝑥𝑖 - 𝑥 �</p><p>2</p><p>𝑛</p><p>Assim, continuando com nosso exemplo, a variância do nosso conjunto de dados é</p><p>(verifique!):</p><p>𝜎2 = � - 16 . 000, 00 �</p><p>2</p><p>+ � - 3 . 000, 00 �</p><p>2</p><p>+ � - 1 . 000, 00 �</p><p>2</p><p>+ � 8 . 000, 00 �</p><p>2</p><p>+ � 13 . 000, 00 �</p><p>2</p><p>5</p><p>= 100 . 000, 00</p><p>Uma observação aqui se faz pertinente. Às vezes, a fórmula para a variância é</p><p>apresentada com (n-1) ao invés de n no denominador. Isso se deve à relação entre</p><p>o tamanho da amostra e o tamanho da população. Ademais, dados extremos</p><p>(conhecidos popularmente como “pontos fora da curva”) dificilmente são incluídos</p><p>em uma amostra representativa de uma população. Assim, os valores para a</p><p>variância de uma amostra e a variância da população como um todo costumam</p><p>ser ligeiramente diferentes. Para corrigir essa diferença, multiplica-se a fórmula da</p><p>variância pelo fator 𝑛</p><p>� 𝑛 - 1 �</p><p>.</p><p>Aqui, como estamos trabalhando com conjuntos de dados muito pequenos e sem</p><p>referência a populações grandes, de onde tais dados teriam sido extraídos,</p><p>podemos trabalhar com n no denominador, já que estamos utilizando todos os</p><p>dados disponíveis. Devemos ter em mente, contudo, que o emprego de (n-1) no</p><p>denominador da fórmula para a variância proporciona uma estimativa melhor, a</p><p>partir de uma amostra, para a variância da população.</p><p>Finalmente, o desvio-padrão é a raiz quadrada da variância e mede o quanto os</p><p>dados se afastam da média. A vantagem do desvio-padrão é que se expressa na</p><p>mesma unidade de medida dos dados (LARSON; FARBER, 2015, p. 81). Para nosso</p><p>exemplo:</p><p>𝜎2 =</p><p>�</p><p>𝑛</p><p>� �𝑥𝑖</p><p>𝑖 = 1</p><p>- 𝑥 ) 2</p><p>𝑛</p><p>= √100 . 000, 00 = 𝑈𝑆𝐷 10 . 000, 00</p><p>Utilizando as ferramentas proporcionadas pela Estatística Dedutiva, somos capazes</p><p>de extrair informações pertinentes para a análise de conjuntos de dados.</p><p>Estatística Indutiva (ou Inferencial)</p><p>A Estatística Indutiva, ou Inferencial, consiste em um conjunto de técnicas e</p><p>ferramentas probabilísticas que possibilitam realizar extrapolações gerais a partir</p><p>do estudo estatístico de uma parte da população (amostra). Dessa maneira, a</p><p>Estatística Indutiva tem por objetivo chegar a generalizações a partir dos elementos</p><p>fornecidos pela Estatística Dedutiva. Para realizar inferências estatísticas, são</p><p>necessárias ferramentas da Teoria da Probabilidade, em particular as distribuições</p><p>de probabilidades.</p><p>A partir da análise de uma amostra de determinada população, a Estatística</p><p>Indutiva visa inferir ou estimar resultados ou comportamentos esperados para a</p><p>totalidade dessa população. A Estatística Indutiva baseia-se no conceito de</p><p>indução, isto é, em obter conhecimento científico válido a partir da reunião de</p><p>dados empíricos. Dessa maneira, “os resultados amostrais serão inferidos como</p><p>resultados válidos para a população estudada” (ARA; MUSETTI; SCHNEIDERMAN, 2003,</p><p>p. 55).</p><p>Estatísticas amostrais são utilizadas para estimar parâmetros populacionais. A</p><p>média amostral , por exemplo, é uma estimativa pontual da média populacional.</p><p>Isso significa que, dada uma população de 1.000.000 de indivíduos, pode-se estimar</p><p>a média populacional</p><p>a partir de apenas uma amostra (consideravelmente menor)</p><p>dessa população. Para que a estimativa seja válida, as técnicas amostrais devem</p><p>tomar o cuidado de evitar tendências (viés).</p><p>Saiba mais!</p><p>O vírus em evolução</p><p>A pandemia de covid, que completou um ano em março de 2021,</p><p>mobilizou a comunidade científica tanto para entender os parâmetros</p><p>epidemiológicos pertinentes (e, assim, implementar as medidas</p><p>sanitárias mais adequadas) quanto para compreender o próprio</p><p>processo de evolução do patógeno. Uma das maiores preocupações</p><p>dos cientistas é o surgimento de variantes mais transmissíveis, mais</p><p>agressivas ou mesmo resistentes à ação de anticorpos e vacinas. Para</p><p>estimar se uma dada variante pode apresentar letalidade maior,</p><p>modelos epidemiológicos e técnicas de Estatística Indutiva são</p><p>empregados pelos pesquisadores. A Estatística Indutiva também</p><p>possibilita estimar a probabilidade de surgimento de novas variantes</p><p>potencialmente perigosas. Assim, podemos verificar que a Estatística</p><p>desempenha um papel fundamental para lidar com situações que</p><p>representam riscos à vida e à saúde.</p><p>Saiba mais em:</p><p>Clique Aqui</p><p>Na atualidade, como lidamos com grandes volumes de dados, a Estatística Indutiva,</p><p>essencial para o progresso da ciência e da tecnologia, precisa contar também com</p><p>o desenvolvimento de novas abordagens computacionais. Em particular, técnicas</p><p>de aprendizagem de máquina são importantes para a identificação de erros e</p><p>padrões em grandes conjuntos de dados, possibilitando a realização de previsões</p><p>melhores.</p><p>Fases do método estatístico</p><p>De acordo com Marconi e Lakatos (2017), a atividade científica requer o emprego de</p><p>métodos científicos adequados. Para os autores, o método pode ser definido, de</p><p>maneira mais ampla, como:</p><p>[...] conjunto das atividades sistemáticas e racionais que, com</p><p>maior segurança e economia, permite alcançar o objetivo de</p><p>produzir conhecimentos válidos e verdadeiros, traçando o</p><p>caminho a ser seguido, detectando erros e auxiliando as</p><p>decisões do cientista (MARCONI; LAKATOS, 2017, p. 79).</p><p>Assim como nas Ciências Naturais e Exatas, quando se trabalha com Estatística, é</p><p>importante seguir um conjunto de etapas e atividades sistemáticas e racionais, isto</p><p>é, metódicas, para que os resultados obtidos por intermédio do estudo sejam</p><p>satisfatórios.</p><p>Atenção!</p><p>Método científico e método estatístico</p><p>O desenvolvimento da ciência moderna representa uma das maiores</p><p>conquistas intelectuais da humanidade. Embora a curiosidade</p><p>científica seja uma das características de nossa espécie, foi somente a</p><p>partir do início da Modernidade, nos séculos XVI e XVII, que a atividade</p><p>científica passou a se tornar metódica e sistemática. Para conhecer</p><p>adequadamente um fenômeno sob investigação, é importante contar</p><p>com técnicas apropriadas de mensuração (isto é, ferramentas</p><p>quantitativas), de comparação das medidas obtidas e de</p><p>extrapolação para conseguir realizar previsões a respeito dos eventos</p><p>naturais. Dessa maneira, a prática científica depende, em boa medida,</p><p>do que a Estatística tem a oferecer. Reflita a respeito da relação entre</p><p>o método científico e o método estatístico. Poderia haver ciência</p><p>moderna sem o desenvolvimento do método estatístico? É possível</p><p>fazer pesquisas científicas puramente qualitativas e dizer algo</p><p>significativo a respeito do mundo natural sem algum tipo de</p><p>tratamento estatístico, isto é, quantitativo?</p><p>Em primeiro lugar, é importante definir o problema a ser estudado, isto é, deve-se</p><p>delimitar o escopo e estabelecer com precisão aquilo que se pretende pesquisar.</p><p>Na segunda fase, realiza-se o planejamento do estudo estatístico, mediante a</p><p>determinação clara dos objetivos que se pretende atingir e a especificação das</p><p>informações que deverão ser levantadas, os dados a serem obtidos, os métodos a</p><p>serem empregados para a coleta e as ferramentas mais adequadas para o</p><p>processamento dos dados.</p><p>A terceira fase do método estatístico é a operacional. Trata-se da coleta dos dados,</p><p>que devem ser registrados de forma sistemática. A natureza da pesquisa</p><p>proporciona a orientação a respeito do modo como a coleta será feita. A esse</p><p>respeito, é possível trabalhar com dados primários, por exemplo, coletados</p><p>diretamente a partir das fontes originais, ou realizar uma coleta indireta, que resulta</p><p>de processos inferenciais feitos a partir dos dados primários.</p><p>Na quarta fase, os dados coletados na fase anterior são devidamente processados</p><p>de acordo com critérios previamente estabelecidos. É importante contar com os</p><p>dados resumidos e agrupados, a fim de maximizar o potencial de extração de</p><p>informações pertinentes. A etapa seguinte, correspondente à apresentação dos</p><p>dados, consiste na elaboração de tabelas e/ou gráficos que possibilitam o acesso</p><p>do pesquisador à natureza dos dados e que ressaltam características importantes</p><p>associadas ao fenômeno que está sob investigação.</p><p>A sexta e última fase do método estatístico consiste na análise e interpretação dos</p><p>dados. É nessa etapa que se calculam as medidas, os coeficientes e outros</p><p>parâmetros que descrevem os dados. A partir da descrição dos dados, já é possível</p><p>atingir algumas conclusões analíticas. No entanto, os valores obtidos mediante</p><p>técnicas de Estatística Dedutiva podem ser complementados com o instrumental</p><p>da Teoria da Probabilidade para chegar a generalizações (Estatística Indutiva).</p><p>Da definição do problema à inferência estatística, há um longo caminho a ser</p><p>percorrido, o que exige do pesquisador disciplina e método. Sem uma definição</p><p>clara a respeito do que se quer estudar e sem contar com um planejamento</p><p>adequado, a aplicação da Estatística pode se tornar inviável ou conduzir a</p><p>resultados equivocados.</p><p>Coleta, apuração e análise de dados</p><p>Após a delimitação do fenômeno de interesse e do escopo da pesquisa, segue uma</p><p>fase de planejamento. É nessa etapa que o pesquisador precisa estabelecer de</p><p>forma clara e não ambígua os objetivos que pretende atingir com a atividade de</p><p>pesquisa. Determinar a taxa de letalidade de um vírus? Estimar frequências de</p><p>possíveis efeitos colaterais de um fármaco em desenvolvimento? Estabelecer uma</p><p>conexão filogenética entre duas espécies? Avaliar tendências de aumento ou de</p><p>queda de taxas de desemprego ou atividade industrial? São os objetivos da</p><p>pesquisa que determinam o tipo de dados que precisarão ser coletados, bem como</p><p>as abordagens mais adequadas para a coleta, a apuração e a análise desses</p><p>dados.</p><p>1 +</p><p>Os tipos de conjuntos de dados que empregamos em Estatística dividem-se</p><p>em populações e amostras.</p><p>2 +</p><p>A população reúne a totalidade dos resultados ou medições pertinentes, uma</p><p>amostra é um subconjunto (parte) de uma população (LARSON; FARBER, 2015).</p><p>3 +</p><p>Para estabelecer que tipos de dados devem ser coletados, é preciso ter em</p><p>mente que uma amostra deve ser representativa da população.</p><p>Quando lidamos com a coleta direta de dados, o pesquisador levanta os registros</p><p>pertinentes (p. ex., certidões de nascimento, registros em arquivos, medições</p><p>realizadas com instrumentos de laboratório, etc.), que são chamados de dados</p><p>primários. Tais dados podem ser coletados de maneira contínua e, a partir deles,</p><p>pode-se estabelecer registros detalhados.</p><p>Um exemplo de coleta direta contínua é o registro de nascimentos em determinada</p><p>região. Para cada pessoa que nasce, é criado um registro com os dados referentes</p><p>a ela. Porém, a coleta direta também pode ser periódica, isto é, realizada de tempos</p><p>em tempos (de preferência, seguindo intervalos de tempo iguais e regulares). Um</p><p>censo populacional, por exemplo, pode ser realizado a cada dez anos.</p><p>Em situações excepcionais, a coleta direta pode ser ocasional. Em geral, isso é feito</p><p>para atender a uma necessidade pontual: uma pesquisa de mercado para o</p><p>lançamento de um novo produto, registros de óbitos durante uma pandemia, etc.</p><p>Em certas situações, a depender dos objetivos e da natureza da pesquisa, a coleta</p><p>pode ser indireta. Nesses casos, os dados são inferidos a partir de dados primários</p><p>obtidos previamente ou deduzidos a partir de características já conhecidas</p><p>que</p><p>dizem respeito ao fenômeno sob investigação (CRESPO, 2009)</p><p>Após a coleta, procede-se à avaliação crítica dos dados, com o propósito de</p><p>identificar discrepâncias significativas que podem ter surgido a partir de erros nos</p><p>métodos de coleta. Na sequência, os dados são apurados, isto é, processados e</p><p>disponibilizados de acordo com critérios de classificação bem definidos (CRESPO,</p><p>2009). A apuração dos dados coletados deve ser realizada de forma sistemática,</p><p>seguindo critérios cuidadosamente estabelecidos na fase de planejamento, de</p><p>acordo com a natureza e finalidade da pesquisa. Caso o processamento de dados</p><p>seja realizado de maneira descuidada, o pesquisador pode perder informações</p><p>pertinentes ou incorrer em erros de interpretação nas fases posteriores, que podem</p><p>até mesmo invalidar o estudo.</p><p>FIGURA 5 Apresentação de dados</p><p>FONTE: tadamichi / 123RF</p><p>Os dados apurados, devidamente organizados e apresentados em tabelas e/ou</p><p>gráficos, são submetidos a técnicas de análise. As ferramentas da Estatística</p><p>Dedutiva já permitem avaliar analiticamente determinadas características de uma</p><p>população relativamente pequena. Via de regra, contudo, trabalha-se com</p><p>subconjuntos amostrais representativos de uma população. Nesses casos, as</p><p>etapas da Estatística Descritiva preparam para a aplicação das técnicas analíticas</p><p>da Estatística Inferencial (CRESPO, 2009). O instrumental da Estatística Inferencial,</p><p>quando bem aplicado, possibilita obter respostas mais gerais, isto é, que dizem</p><p>respeito a toda a população, a partir da avaliação de amostras adequadas. A</p><p>análise dos resultados pode permitir, ainda, a realização de previsões.</p><p>Estatística como apoio aos Sistemas da</p><p>Informação</p><p>No campo dos Sistemas de Informação (SIs), obtém-se conhecimento e decisões</p><p>são tomadas de acordo com a coleta, o processamento e o tratamento sistemático</p><p>de informações. Para atingir resultados satisfatórios, é importante empregar</p><p>métodos adequados de resumo das informações para facilitar sua análise (BENZE,</p><p>2009). O raciocínio probabilístico e as ferramentas estatísticas também são</p><p>importantes para lidar com a variabilidade dos dados, ainda mais quando lidamos</p><p>com grandes volumes de dados, quase sempre heterogêneos e desorganizados.</p><p>Podemos entender SIs como conjuntos de interrelações entre partes que envolvem</p><p>a coleta, o processamento, o armazenamento e a distribuição de informações</p><p>pertinentes à obtenção de algum tipo de conhecimento desejado ou que servem</p><p>para orientar processos decisórios (PRADO; SOUZA, 2014). Na atualidade, empresas e</p><p>organizações lidam com volumes gigantescos de dados que vêm em grandes</p><p>fluxos e de diversas fontes. Nesse contexto, SIs desempenham um papel</p><p>fundamental para a gestão estratégica de empresas e outras entidades.</p><p>Podemos entender os dados como representantes de fatos brutos. Uma vez</p><p>organizados de maneira significativa, os dados podem se transformar em peças de</p><p>informação (STAIR; REYNOLDS, 2015). A Estatística proporciona apoio aos SIs</p><p>FIGURA 6 Pesquisadora analisando informações</p><p>FONTE: Dmytro Sidelnikov / 123RF</p><p>justamente porque proporciona ferramentas para criar ou descobrir informações a</p><p>partir das relações identificadas entre dados (muitas vezes, em conjuntos</p><p>volumosos). Assim, métodos e técnicas da Estatística permitem processar dados</p><p>para a obtenção de informações que podem, dependendo dos objetivos desejados,</p><p>orientar decisões empresariais ou econômicas, ou mesmo constituir avanços no</p><p>conhecimento científico.</p><p>Agora que você concluiu a leitura deste estudo, veja, nos vídeos a seguir, temas que</p><p>complementarão seus estudos:</p><p>Indicação de Leitura</p><p>Livro: Uma senhora toma chá…: como a Estatística revolucionou a ciência no século</p><p>XX</p><p>Autor: David Salsburg</p><p>Ano: 2009</p><p>Editora: Zahar</p><p>ISBN:978-85-378-0116-1</p><p>Comentário: O livro apresenta a história da Estatística e de sua relação com o</p><p>desenvolvimento da ciência no transcurso do século XX a partir de uma anedota</p><p>envolvendo o matemático e estatístico britânico Ronald Fisher. O autor apresenta</p><p>como cientistas tais como Karl Pearson, Francis Galton e o próprio Ronald Fisher</p><p>lançaram as bases da Estatística moderna a partir do desejo de proporcionar uma</p><p>fundamentação quantitativa rigorosa para as teorias de Charles Darwin. Salsburg</p><p>nos brinda com um livro cativante, no qual conta as histórias dos principais homens</p><p>e mulheres que desenvolveram bases sólidas para a Estatística e que contribuíram,</p><p>dessa maneira, para grandes avanços na ciência contemporânea.</p><p>Atividade</p><p>A Estatística surgiu com as primeiras civilizações humanas e acompanha o</p><p>desenvolvimento e o progresso da humanidade até os dias atuais. Nesse</p><p>processo, a Estatística passou por diversas etapas, de acordo com cada</p><p>momento específico da evolução histórica das sociedades humanas. A</p><p>esse respeito, assinale a alternativa correta.</p><p>A. Os povos antigos, tais como os egípcios e os hebreus, utilizavam a</p><p>coleta de dados estatísticos para fins de pesquisa científica.</p><p>B. A centralização política decorrente da emergência do Estado</p><p>Moderno, juntamente com o surgimento da Teoria da</p><p>Probabilidade, impulsionou o desenvolvimento da Estatística.</p><p>C. A Estatística nasceu no século XVIII como “ciência do Estado”,</p><p>possibilitando o emprego de diversas técnicas para fins</p><p>exclusivamente tributários.</p><p>D. O desenvolvimento da Biologia a partir do século XIX, impulsionado</p><p>pelas teorias de Charles Darwin, ocorreu graças à disponibilidade</p><p>de técnicas estatísticas sofisticadas.</p><p>E. Na Era da Informação, os dados são produzidos de acordo com</p><p>técnicas estatísticas bem definidas, portanto, conseguimos</p><p>analisá-los com precisão e velocidade.</p><p>Atividade</p><p>Na Estatística Dedutiva, ou Descritiva, os dados coletados e devidamente</p><p>organizados são descritos por valores que os resumem ou representam</p><p>algumas das principais características do fenômeno ou do conjunto de</p><p>fenômenos sob estudo. A respeito das medidas descritivas, assinale a</p><p>alternativa correta.</p><p>A. A média de um conjunto de dados representa a distância entre o</p><p>valor mínimo e o valor máximo encontrados nesse conjunto.</p><p>B. A mediana de um conjunto de dados é obtida a partir do somatório</p><p>dos valores dos dados do conjunto, dividido pelo número de</p><p>elementos desse conjunto.</p><p>C. A moda de um conjunto de dados é o valor que ocupa a posição</p><p>central do conjunto, quando os dados são apresentados de</p><p>maneira ordenada.</p><p>D. A amplitude de um conjunto de dados é uma medida de variação</p><p>que corresponde à diferença entre seus valores máximo e mínimo.</p><p>E. A variância de um conjunto de dados corresponde à soma dos</p><p>desvios de todos os dados do conjunto, dividida pelo número total</p><p>de dados.</p><p>Atividade</p><p>Quando se realiza uma pesquisa estatística, é importante seguir uma série</p><p>de fases ou etapas que descrevem atividades sistemáticas e racionais, isto</p><p>é, um método bem estabelecido. Dessa maneira, o trabalho estatístico é</p><p>efetuado de maneira rigorosa e os resultados obtidos têm mais chances de</p><p>serem satisfatórios. Sobre as fases do método estatístico, assinale a</p><p>afirmação correta.</p><p>A. Um estudo estatístico começa pelo planejamento, etapa na qual</p><p>são determinados os objetivos do estudo e os métodos que serão</p><p>empregados.</p><p>B. A segunda fase corresponde ao planejamento do estudo</p><p>estatístico, com a determinação dos objetivos, a especificação dos</p><p>dados necessários e a escolha das ferramentas adequadas para o</p><p>processamento e análise dos dados.</p><p>C. Na terceira etapa do método estatístico, os dados são coletados e</p><p>organizados em tabelas e/ou gráficos para facilitar a visualização</p><p>das informações.</p><p>D. Na quarta fase do método estatístico, opta-se pela coleta direta ou</p><p>indireta dos dados necessários para a pesquisa.</p><p>E. A quinta e última fase do método estatístico consiste na aplicação</p><p>de métodos de Estatística Indutiva para a realização de inferências</p><p>a partir dos dados coletados.</p><p>Síntese</p><p>Apresentamos um panorama da natureza da Estatística, começando com uma</p><p>discussão sobre a evolução histórica dessa disciplina. Após discutir como a</p><p>Estatística surgiu na Antiguidade</p><p>e se modificou no transcurso das eras, refletimos</p><p>sobre a importância dos métodos quantitativos para a detecção, a avaliação e a</p><p>análise de informações presentes em grandes conjuntos de dados.</p><p>Discutimos também as características que dividem a Estatística em duas grandes</p><p>áreas: Estatística Dedutiva e Estatística Indutiva. Apresentamos e exemplificamos o</p><p>uso de algumas das principais ferramentas da Estatística Dedutiva, a saber, os</p><p>conceitos de média, mediana, moda, amplitude, desvio, variância e desvio-padrão.</p><p>Também mostramos que a Estatística Indutiva, ou Inferencial, permite fazer</p><p>generalizações a partir da análise de apenas uma parte de uma dada população</p><p>de interesse. Descrevemos as fases do método estatístico, importantes para que os</p><p>estudos sejam realizados de maneira produtiva e consistente.</p><p>Dedicamos especial atenção à coleta, à apuração e à análise de dados, etapas que</p><p>dependem da natureza da pesquisa e que demandam cuidado e atenção por</p><p>parte do pesquisador. Finalmente, apresentamos o que são SIs e discutimos como a</p><p>Estatística proporciona apoio a esse campo contemporâneo do conhecimento.</p><p>Referências Bibliográficas</p><p>ARA, A. B.; MUSETTI, A. V.; SCHNEIDERMAN, B. Introdução à Estatística. São Paulo:</p><p>Edgard Blücher, 2003.</p><p>BELTRÃO, K. I.; PINHEIRO, S. S. Estimativa de mortalidade para a população coberta</p><p>pelos seguros privados. Rio de Janeiro: IPEA, 2002. Texto para Discussão n. 868.</p><p>BENZE, B. G. Estatística aplicada a Sistemas de Informações. São Carlos: EdUFSCar,</p><p>2009.</p><p>CASTRO, T. Teoria das Relações Internacionais. Brasília, DF: Funag, 2012.</p><p>COSTA, S. F. Introdução ilustrada à Estatística (com muito humor!). São Paulo:</p><p>Harbra, 1992.</p><p>CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2009.</p><p>DAWKINS, R. O rio que saía do Éden: uma visão darwinista da vida. Rio de Janeiro:</p><p>Rocco, 1996.</p><p>IZBICKI, R.; dos SANTOS, T. M. Aprendizado de máquina: uma abordagem estatística.</p><p>São Carlos: Rafael Izbicki, 2020.</p><p>LARSON, R.; FARBER, B. Estatística Aplicada. São Paulo: Pearson Education do Brasil,</p><p>2015.</p><p>MARCONI, M. de A.; LAKATOS, E. M. Metodologia do trabalho científico. São Paulo:</p><p>Atlas, 2017.</p><p>MARTIN, O. Da estatística política à sociologia estatística: desenvolvimento e</p><p>transformações da análise estatística da sociedade (séculos XVII-XIX). Revista</p><p>Brasileira de História, v. 21, n. 41, p. 13-34, 2001.</p><p>MARTINS, L. A. P.; VENTURINELI, K. R. Relações entre Biologia e Estatística: Karl Pearson e</p><p>o Princípio da Homotipose (1901–1902). Revista Brasileira de História da</p><p>Matemática, v. 11, n. 23, p. 39-51, 2011.</p><p>MEMÓRIA, J. M. P. Breve história da Estatística. Brasília, DF: Embrapa Informação</p><p>Tecnológica, 2004.</p><p>MONARD, M. C.; BARANAUSKAS, J. A. Conceitos sobre aprendizado de máquina. In:</p><p>REZENDE, S. O. (org.). Sistemas inteligentes: fundamentos e aplicações. Barueri:</p><p>Manole, 2003. p. 39–56.</p><p>OLIVEIRA JUNIOR, A. P. de; CARDOSO, K. M; DELALÍBERA, B. C. da S. Potencialidades</p><p>pedagógicas da história da Matemática para o ensino de Estatística na Educação</p><p>Básica. Revista Cocar, v. 11, n. 22, p. 13-34, 2017.</p><p>PALESTRA: aprendizagem de máquina em biologia: a inteligência artificial e os</p><p>desafios da. [S. l.: s. n.], 2020. 1 vídeo (1 h 35 min 39 s). Publicado pelo canal</p><p>BioSemana UFRJ. Disponível em: https://www.youtube.com/watch?v=aNrHTbOs0Qo.</p><p>Acesso em: 26 maio 2021.</p><p>PRADO, E. P. V.; SOUZA, C. A. de. Fundamentos de Sistemas de Informação. Rio de</p><p>Janeiro: Elsevier, 2014.</p><p>STAIR, R. M.; REYNOLDS, G. W. Princípios de Sistemas de Informação. São Paulo:</p><p>Cengage Learning, 2015.</p><p>TORRINHA, F. Dicionário Latino Português. Porto: Porto, 1942.</p><p>ZORZETTO, R. O vírus em evolução. Pesquisa Fapesp, mar. 2021. Disponível em:</p><p>https://revistapesquisa.fapesp.br/o-virus-em-evolucao/. Acesso em: 26 maio 2021.</p>