Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Estadual do Maranhão ESTATÍSTICA APLICADA MEDICINA VETERINÁRIA UEMA Elaborada por : Raimundo Merval Morais Gonçalves Licenciado em Matemática / UFMA Especialista em Ensino de Ciências / UEMA e–mail : mervalmorais@ig.com.br SÃO LUÍS MA AGOSTO 2014 2 INDICE p. 1. A Natureza da Estatística .................................................................................. 03 2. Séries Estatísticas ............................................................................................. 13 3. Gráficos Estatísticos .......................................................................................... 16 4. Distribuição de Frequência ................................................................................ 21 5. Medidas de Posição ........................................................................................... 25 6. Medidas de Dispersão ....................................................................................... 34 7. Medidas de Assimetria ....................................................................................... 38 8. Medidas de Curtose ............................................................................................ 40 9. Noções de Probabilidades .................................................................................. 42 10. Distribuições de Probabilidade ........................................................................... 50 11. Noções de Inferência .......................................................................................... . Intervalos de confiança . Teste de hipótese . Distribuição t de Student . Distribuição Quiquadrado 56 12. Anexos - Tabelas 67 3 ESTATÍSTICA 1. INTRODUÇÃO A origem da Estatística é desconhecida, mas surgiu na Antiguidade e se desenvolveu em paralelo com a civilização humana. Temos relatos de que os egípcios, há 3000 anos antes de Cristo já a utilizavam como provam dados estatísticos de seus povos gravados nas pirâmides. Além destes os chineses realizaram em censo demográfico no ano 2275 a.C e os romanos no ano 556 a.C, que consistia em dados relativos a nascimentos, óbitos, habitantes e quantitativo do soldados. O objetivo principal do censo era militar. No primeiro milênio da era cristã houve diversos censos demográficos, em Israel e em alguns países do Ocidente. No entanto, somente a partir do século XVI, é que a Esta- tística teve um maior desenvolvimento, surgiram as primeiras tábuas e registros orga- nizados de fatos sociais( batizados, casamentos, nascimentos, etc. ) e a partir daí passando a ser estudada por matemáticos e filósofos e incluída no currículo das gran- des Universidades. 1.1 A ESTATÍSTICA NAS EMPRESAS No mundo atual, a empresa é uma das vigasmestras da Economia dos povos. A direção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e uso da Estatística facilitarão seu trabalho de organizar, dirigir e controlar a empresa. Por meio da sondagem, de coletas de dados e de recenseamento de opiniões, pode- mos conhecer a realidade geográfica e social, os recursos naturais, humanos e finan- ceiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, mé- dio ou longo prazos. A Estatística ajudará em tal trabalho, como também na seleção e organização da es- tratégica a ser adotada no empreendimento e, ainda, na escolha das técnicas de veri- ficação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e/ou perdas. Tudo isso que se pensou, que se planejou, precisa ficar registrado, documentado para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material e, ainda, para um controle eficiente do trabalho. O esquema do planejamento é o plano, que pode ser resumido, com auxílio da Esta- tística, em tabelas e gráficos, que facilitarão a compreensão visual dos cálculos mate- mático-estatístico que lhes deram origem. O homem de hoje, em suas múltiplas atividades, lança mão de processos e técnicas estatísticas, e só estudando-os evitaremos o erro das generalizações apressadas a respeito de tabelas e gráficos apresentados em jornais, revistas e televisão, frequentemente cometido quando se conhece apenas “por cima” um pouco de Estatística. 1.2 CAMPOS DE APLICAÇÃO A Estatística encontra-se em quase todos os campos da atividade humana. O Estado e a Sociologia têm necessidade de conhecer as populações por seus efeti- vos, por sexo, idade, estado civil, profissão, nacionalidade, etc. 4 Os serviços de meteorologia tão importantes para a navegação aérea e marítima, são essencialmente estatísticos, com seus estudos de temperaturas, pressões, quedas de chuvas, umidades, ventos, etc. Na agricultura, a estatística serve como orientador seguro fornecendo informações sobre colheitas, rendimento das terras, valores da produção e outros. Na indústria e no comércio podem-se comparar produções e volumes de vendas em relação ao total por região, estudar a situação dos mercados e suas tendências. Grandes serviços a Estatística presta à Biologia desde o “homem médio” de Quetelet passando pela teoria da hereditariedade de Mendel, até as infinitas aplicações de hoje. A Geografia conclui através de estudos estatísticos as densidades demográficas, cor- rentes migratórias, clima, etc. Na Informática também encontramos importantes aplicações, entre elas: avaliação de desempenho de redes de computadores, etc.. Na Inteligência Artificial, usam aplicações em redes neurais, artificiais e mineração de dados. E ainda na História e Literatura, onde trabalhos estatísticos estudam a extensão dos períodos, coincidências, pontuações e estilos e, muitos outros. 1.3 O ESTATÍSTICO O Estatístico promove levantamento de pesquisas estatísticas em suas aplicações técnicas e científicas, investigando, elaborando e testando métodos matemáticos e sistemas em amostragem, bem como coletando, analisando e interpretando os dados relacionados com os fenômenos estatísticos, e ainda estuda e renova a metodologia estatística a fim de estabelecer a sua evolução e desenvolvimento. 1.4 BIOESTATÍSTICA A bioestatística é um ramo mais amplo da área estatística. Estatística que trata de organização e resumo de dados, e inferência de características a respeito de um grupo de pessoas ou coisas quando somente uma parte dessas características está disponível para estudo. A Bioestatística é, então, o ramo da estatística que trata principalmente de ciências biológicas e disciplinas médicas e relacionadas à saúde . Portanto, a bioestatística é o estudo da estatística com ênfase em sua aplicação às ciências da saúde. 5 2. ESTATÍSTICA : CONCEITO E DIVISÃO A necessidade de tratar e interpretar dados culminou com a origem da estatística. 2.1 CONCEITO A Estatística é a ciência dos dado. Ela envolve a coleta, classificação, síntese, organi- zação, a análise inferência e a interpretação de dados qualitativos ou numéricos a res- peito de fenômenos coletivos ou de massa. As aplicações das técnicas da Estatística são bem antigas, conforme podemos obser- var fornecendo alguns exemplos: censos foram realizados por volta de 3000 a.C na Babilônia, China e Egito ; os hebreus fizeram um levantamento dos homens de Israel aptos a guerrear por ordem de Moisés, segundo o livro de Números( Antigo Testamento ) ; os romanos realizaram também censo por ordem do imperador César Augusto ; em 1805, Guilherme, o Conquistador, ordenou realização de censo em toda a Ingla- terra para levantar informações sobre terras, proprietários, animais, empregados, etc. A palavra estatística teria sido utilizada, possivelmente, por Gottfried Achenval, aca- dêmico alemão, por volta do século XVIII. A estatística teve acelerado desenvolvimento a partir do século XVII, com os estudos de Bernoulli, Fermat, Pascal, Laplace, Gauss, Galton, Pearson, Fischer, Poisson e outros que estabeleceram suas características atuais. A Estatística é considerada por alguns autores com Ciência no sentido do estudo de uma população. É considerada como método quando utilizada como instrumento por outra Ciên- cia. A Estatística mantém com a Matemática uma relação de dependência , solicitando−lhe auxí- lio, sem o qual não poderia desenvolver−se. Com as outras Ciências mantém a relação de complemento, quando utilizada como instru- mento de pesquisa. 2.2 DIVISÃO DA ESTATÍSTICA ESTATÍSTICA DESCRITIVA É a parte da Estatística que tem como função : coletar, orga- nizar, classificar e apresentar os dados referentes a observa- ção de um fenômeno através de gráficos, tabelas, além de es- timar parâmetros desses dados. ESTATÍSTICA INDUTIVA é a parte da Estatística que tem como função analisar e interpretar os dados, apresentados pela Estatística Des- critiva, ou ainda generalizar conclusões sobre o todo, par- tindo da observação de partes desse todo A indução é um processo de raciocínio em que se partindo do conhecimento de uma parte procurase tirar conclusões sobre a realidade do todo, ou seja, busca obter re- sultados sobre populações a partir de amostras, dizendo qual é a precisão desses resultados e com que probabilidade se pode confiar nas conclusões obtidas. 6 EXEMPLO 1 : Afirmar que 25% dos eleitores do país têm a intenção de votar em certo candidato, tomando por base uma amostra de 2500 eleitores, é a realiza- ção da inferência estatística. EXEMPLO 2 : Concluir baseado em uma amostra de 120 universitários, que a renda média de todos os 5320 estudantes da universidade está compreendida entre R$ 1800,00 e R$ 2400,00 , com certo grau de certeza, é papel da estatística inferencial. O estudo dos dados da área da saúde utilizando a ciência estatística é, por muitos chamado de Bioestatística. 2.3 CONCEITOS BÁSICOS POPULAÇÃO É o conjunto de todos os elementos que possuem pelo menos uma característica em comum, que possa ser contada, medida, pesada ou ordenada de algum modo e que sirva de base para as propriedades que se deseja investigar ; AMOSTRA Subconjunto de uma população em estudo ; AMOSTRA REPRESENTATIVA Aquela que representa as mesmas características gerais da população da qual foi extraída ; AMOSTRA PROBABILISTICA Aquela em que cada elemento da população tem pro- babilidade de ser escolhido para a mesma( amostra ) ; PARÂMETRO Uma característica numérica estabelecida para toda população ; ESTATÍSTICA OU ESTIMADOR Uma característica numérica estabelecida para uma amostra ; CENSO Tipo de levantamento em que em que são investigados todos os elementos da população ; AMOSTRAGEM Conjunto de técnicas utilizadas para extração de amostras de uma população ; VARIÁVEIS São características, propriedades ou atributos que podem ser observa- dos ou ( medidos ) em cada elemento de uma população ou de uma amostra e deverá produzir um e apenas um resultado. Uma variável pode ser quantitativa ou qualitativa. VARIÁVEL QUANTITATIVA Aquela cujo resultado da observação gera uma quantida- de, um número. Exemplo : a idade de uma pessoa ; VARIÁVEL QUALITATIVA Aquela cujo resultado da observação gera um atributo, uma qualidade. Exemplo : cor dos olhos de uma pessoa ; DADOS ABSOLUTOS São valores obtidos através de uma medida ou contagem sem qualquer manipulação. 7 DADOS RELATIVOS São valores obtidos através da transformação de dados absolu- tos, geralmente através de razões ( divisões ). São dados rela- tivos os coeficientes, as taxas e os índices. ROL Conjunto de dados sob alguma ordenação( crescente ou decrescente ). 2.4 VARIÁVEIS Variável é o conjunto de resultados possíveis de um fenômeno. EXEMPLO : Para a população de professores de uma escola, podese definir varias variáveis, tais como : a) Tempo de serviço na profissão b) Idade c) Estado Civil d) Religião e) Sexo f) Número de filhos g) Cor dos olhos h) Nível de escolaridade i) Classe Social j) Renda Uma variável pode ser classificada em : Qualitativa( que pode ser nominal ou ordinal ) ou Quantitativa( que pode ser discreta ou contínua ) VARIÁVEL QUALITATIVA NOMINAL é uma qualidade sem expressar nenhuma ordem hierárquica de classificação. EXEMPLOS : cor dos olhos, estado civil, religião e sexo VARIÁVEL QUALITATIVA ORDIINAL quando a qualidade observada possui uma or- denação natural EXEMPLOS : classe social, nível de escolaridade VARIÁVEL QUANTIITATIVA DISCRETA quando a variável assume determinados valo- res no intervalo de observação, ou então, quando os valores são obtidos a partir de uma contagem. EXEMPLOS : número de filhos 8 VARIÁVEL QUANTITATIVA CONTÍNUA quando a variável assume qualquer valor no intervalo de observação. Nesse caos os valo- res assumidos são obtidos a partir de uma mensuração. EXEMPLOS : tempo de serviço, idade, renda 2.5 INDICADORES Em qualquer planejamento ou tomada de decisão é indispensável que exista um sis- tema de informação, alimentado com dados absolutos que posteriormente devem ser transformados em dados relativos. Dados absolutos ou relativos são geralmente cha- mados de indicadores . Os indicadores são classificados da seguinte forma : DADOS ABSOLUTOS São valores obtidos através de uma medida ou contagem, sem qualquer manipulação. EXEMPLO : No canil da UEMA existem 102 animais confinados, dos quais 50 são ma- chos e 52 são fêmeas. DADOS ABSOLUTOS São valores obtidos através da transformação de dados abso- lutos, geralmente através de razões( divisões ). . COEFICIENTES razões entre valores de variáveis da mesma espécie . EXEMPLO : No caso do exemplo anterior, os coeficientes são : . machos = 52 0,51 102 . fêmea = 50 0,49 102 . TAXAS são coeficientes multiplicados por uma potência de 10, em geral 100 ou 1000 . EXEMPLO : taxa dos machos = 0,51 x 100 = 51% e taxa das fêmeas = 0,49 x 100 = 49% . ÍNDICES razões entre valores de variáveis de espécies diferentes. EXEMPLO 1: Índice de renda per capita . IRPC = Renda(R$) População(hab) = 15.200.000,00 13000 = R$ 1169,20 por pessoa 9 EXEMPLO 2 : Índice de densidade demográfica IDD = Habitantes Área = 1254871 1358 = 924 hab/ km 2 EXEMPLO 3 : Índice de aluno por professor IAP = Alunos Professor = 12354 294 = 42 alunos/ professor 2.6 TAMANHO DA AMOSTRADo ponto de vista estatístico, as amostras devem ser grandes para dar maior confiança possível às conclusões obtidas. Entretanto as amostras não devem ser muito grandes, porque isso seria perda de recursos, mas também não devem mui- to pequenas, porque o resultado do trabalho seria de pouca utilidade. Então, para a escolha da amostra leve em consideração o que é usual na área, consultando a litera- tura e verifique o que seu orçamento permite fazer. Existem várias fórmulas que nos permitem determinar o tamanho da amostra, mas vamos apresentar apenas uma que nos dará a ideia do problema, então temos : 2 2 z .p(100 p) n d , onde : z nível de confiança p percentual d margem de erro n tamanho da amostra 3. AMOSTRAGEM Chama-se Amostra, a um subconjunto finito de uma população. Geralmente a Estatística trabalha com a amostra e não com a População, isto porque na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal. Para que o estudo estatístico utilizando-se da Amostra tenha confiabilidade, esta amostra deve ser representativa da população, isto é , a amostra dever possuir as mesmas características básicas da população, no que diz respeito ao fenômeno que dese- jamos pesquisar. Para recolher amostra, temos uma técnica designada por Amostragem, que garante, tanto quanto possível, o acaso na escolha . Assim cada elemento da população passa a ter a mesma chance de ser escolhi- do, o que garante à amostra o caráter de representatividade. Veremos agora, alguns tipos de Amostragem. 3.1 – AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES Este tipo de amostragem é equivalente a um sorteio lotérico. EXERCÍCIO BÁSICO : Obter uma amostra representativa para a pesquisa da estatura de 90 alunos de uma escola. 10 Se o número de elementos da amostra for grande, este tipo de sorteio é muito trabalho. Para facilitá-lo foi elaborada uma tabela chamada Tabela dos Números Aleató- rios. 3.2 – AMOSTRAGEM PROPORCIONAL ESTRATIFICADA Muitas vezes a população divide-se em subpopulações ou estratos. Como, geralmente, os elementos da amostra apresente, de estrato para estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos leve em consideração tais estratos, logo a amostra es- colhida deve ser proporcional a cada estrato. EXERCÍCIO BÁSICO : Supondo que dos 240 alunos da 1ª série do CEM Cidade Operária I I , 135 sejam do sexo masculino e 105 do sexo feminino, escolha uma amostra de 10 % para pesquisar as notas obtidas em uma avaliação de português, de um determinado mês. SOLUÇÃO : 4. FASES DO MÉTODO ESTATÍSTICO No método estatístico podemos distinguir as seguintes fases : I – DEFINIÇÃO DO PROBLEMA Nesta fase o pesquisador ou o analista deve definir ou formulação correta do que vai fazer o pesquisador. II - PLANEJAMENTO A fase do planejamento, consiste em se determinar o procedimento de como resolver o problema e de como levantar as informações sobre o assunto em estudo. No planejamento a preocupação maior reside na escolha das perguntas, bem como sua correta formulação, qualquer que seja a modalidade de coleta de dados. Também nesta fase será escolhido o tipo de levantamento a ser utilizado : a) Levantamento censitário ; b) Levantamento por amostragem Outros elementos importantes que também devem ser tratados são : cronograma das atividades, custos, etc. III – COLETA DE DADOS A coleta de dados se refere à obtenção, reunião e o registro sistemático dos da- dos do problema que estão sendo pesquisados. A coleta de dados pode ser : Direta ou Indireta. 11 a) Direta quando é feita sobre elementos informativos de registro obrigatório. Por exemplo : registro de nascimento, de casamento, de óbitos, etc. ; Há três tipos de coleta direta, que são : contínua, periódica e ocasional. b) Indireta quando é feita através de elementos conseguidos pela coleta direta, ou através do conhecimento de fenômenos que, de algum modo, estejam relacionados com o fenômeno em questão, é portanto feita através de deduções e conjec- turas. IV – CRÍTICA DE DADOS Feito o levantamento dos dados , eles devem ser "analisados", à procura de pos- síveis falhas, imperfeições e erros, a fim de não incorrermos em erros grosseiros, que pos- sam influir sensivelmente no resultados. A crítica é Externa quando visa as causa dos erros por parte do informante, por distração ou má fé ; é Interna quando visa observar os elementos originais dos dados da coleta. V – APURAÇÃO DOS DADOS A apuração dos dados é a soma e o processamento dos dados obtidos e a dis- posição mediante critérios de classificação. Pode ser Manual, Eletromecânica ou Eletrôni- ca. VI – EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada( tabelas ou / e gráficos ), tornando ,mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. VII – ANÁLISE DOS RESULTADOS O objetivo da Estatística é tirar conclusões sobre o todo, a partir de informações fornecidas por parte representativa do todo. Assim, realizadas as fases anteriores fazemos a Análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial. 12 LISTA DE EXERCÍCIOS 1. Os prontuários de um hospital veterinário estão organizados em um arquivo, por or- dem alfabética. Qual é a maneira mais rápida de amostrar 1 3 do total de prontuários ? 2. Um pesquisador tem 10 gaiolas, cada uma com seis ratos. Como o pesquisador pode selecionar 10 ratos para realizar um experimento ? 3. Um fiscal precisa verificar se as farmácias da cidade estão cumprindo um novo re- gulamento. A cidade tem 40 farmácias, mas como a fiscalização demanda muito tem- po, o fiscal resolveu optar por visitar uma amostra de 10 farmácias. O cumprimento do regulamento é, evidentemente, desconhecido do fiscal está representado na tabela a seguir. Com base na tabela a seguir : a) Escolha uma amostra para o fiscal ; b) Estime, com base na amostra, a proporção de farmácias que estão cumprindo o regulamento ; c) Com base nos dados da população, estime o parâmetro ; d) Você obteve uma boa estimativa ? Cumprimento do regulamento 1 Sim 11 Não 21 Sim 31 Sim 2 Sim 12 Sim 22 Sim 32 Sim 3 Não 13 Não 23 Não 33 Não 4 Sim 14 Não 24 Sim 34 Sim 5 Sim 15 Sim 25 Não 35 Sim 6 Não 16 Não 26 Não 36 Não 7 Sim 17 Sim 27 Não 37 Não 8 Não 18 Não 28 Sim 38 Não 9 Não 19 Não 29 Não 39 Sim 10 Sim 20 Sim 30 Não 40 Sim 4. Você possui uma lista com 10 nomes em ordem alfabética. Descreva uma forma para obter uma amostra sistemática de cinco nomes. 5. Um veterinário que estudar um determinado de distúrbio que ocorre em uma deter- minada raça de cães. Calcule o tamanho da amostra, considerando que o veterinário quer um nível de confiança de 95%( z = 1,96 ), uma margem de erro de 12% e que na população, a percentagem de animais com esse tipo de distúrbio é de 35%. 13 SÉRIES ESTATÍSTICAS 1. TABELAS Um dos objetivos daEstatística é sintetizar os valores que uma ou mais variá- veis podem assumir, para que tenhamos uma visão geral da variação dessa ou dessas vari- áveis, e é através de Tabelas e Gráficos, que nos serão fornecidas informações a respeito das variáveis em estudo. Tabela é um quadro que resume um conjunto de observações. 2. ELEMENTOS DE UMA TABELA Uma tabela compõe-se de : a) Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo . b) Cabeçalho – parte superior da tabela que específica o conteúdo das colunas . c) Coluna Indicadora – parte da tabela que específica o conteúdo das linhas . d) Linhas – são as retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos . e) Casas ou Células – espaço destinado a um só número . f) Título – conjunto de informações, as mais completas possíveis, respondendo às perguntas : O quê ? , Quando ? , Onde ? , e localizado no topo da tabela . Ainda temos os elementos complementares da tabela, que são : a fonte, as no- tas e as chamadas, que se colocam, de preferência, no seu rodapé . EXEMPLO : Preferência por refrigerantes de 60 alunos – São Luís / Ma Marcas Quant. de alunos Antártica 22 Coca-cola 15 Seven-up 4 Kuat 6 Pepsi-cola 9 Schincariol 4 Total 60 Fonte : Fictícia 3. SÉRIES ESTATÍSTICAS DEFINIÇÃO : É toda tabela que apresenta a distribuição de um conjunto de dados estatísti- cos. Nas séries estatísticas existem 3 elementos que influem nas mesmas : Tempo , Espaço ou Localidade e Espécie ou Categoria . 14 4. CLASSIFICAÇÃO As séries estatísticas se classificam conforme a variação de um dos 3 elemen- tos acima citados. 4.1 – SÉRIES HISTÓRICAS, CRONOLÓGICAS OU TEMPORAIS São séries estatísticas em que o elemento variável é o tempo. EXEMPLO : Números de cães atendidos no Hospital Veterinário da Uema – 2006 / 2012 2006 480 2007 502 2008 510 2009 550 2010 524 2011 572 2012 611 Total 3749 Fonte : Fictícia 4.2 – SÉRIES GEOGRÁFICAS, ESPACIAIS, TERRITORIAIS OU DE LOCALIZAÇÃO São séries estatísticas em que o elemento variável é o espaço geográfico. EXEMPLO : Número de cães infectados com calazar na Ilha de São Luís – 2011 São Luís 875 Paço de Lumiar 480 Raposa 502 São José de Ribamar 510 Total 2367 Fonte : Fictícia 4.3 – SÉRIES ESPECÍFICAS OU CATEGÓRICAS São séries estatísticas que tem como elemento variável as categorias ou especi- ficações. EXEMPLO: Número de animais atendidos no Hospital Veterinário da Uema – Outubro/2012 Cães 125 Gatos 93 Bovinos 37 Equinos 25 Total 280 Fonte : Fictícia 15 4.4 DISTRIBUIÇÃO DE FREQUÊNCIAS SERIAÇÃO As distribuições de frequências ou distribuição por frequências são séries em que todos os elementos( época, local e fenômeno ) são fixos. Embora o fenômeno, esteja fixo, ele agora apresenta gradações( divisões ). Nas distribuições de frequências, os dados são dispostos ordenadamente em linhas e colunas, de modo a permitir sua leitura nos senti- dos horizontal e vertical. EXEMPLOS : Tipo de veículo popular Tipos Quantidade Hatch 22 Minivan 15 Sedan 4 Utilitário 6 Total 50 Fonte : Fictícia Peso ao nascer de Nascidos vivos( kg ) 1,5 2,0 3 2,0 2,5 16 2,5 3,0 31 3,0 3,5 34 3,5 4,0 11 4,0 4,5 4 4,5 5,0 1 Total 100 Fonte : Sônia Vieira 5. SÉRIES CONJUGADAS – TABELA DE DUPLA ENTRADA Às vezes é preciso em uma só tabela apresentar a variação de mais de uma va- riável, isto é, temos que fazer a conjugação de duas ou mais séries. Quando juntamos duas séries em uma única tabela, obtemos uma Tabela de Du- pla Entrada. Neste tipo de tabela temos, duas classificações : uma horizontal e uma vertical. EXEMPLO 1 : Frequência de camundongos com e sem diabetes Camundongos Castrados Camundongos do grupo de controle Total Com diabetes 26 12 38 Sem diabetes 24 38 62 Total 50 50 100 Fonte : Aviva e Watson A conjugação, no exemplo acima foi de uma série categórica e uma série categó- rica, que dá origem à série categórica – categórica. EXEMPLO 2 : Número de animais atendidos pelos alunos do Curso de Veterinária em Paço de Lumiar e Raposa 2010 Animais Cidades Paço de Lumiar Raposa cães 112 89 gatos 95 101 bovinos 76 63 equinos 54 45 Total 337 298 Fonte : Fictícia A conjugação, no exemplo acima foi de uma série categórica e uma série geo- gráfica, que dá origem à série categórica – geográfica. 16 GRÁFICOS ESTATÍSTICOS 1. INTRODUÇÃO Atualmente, quando lemos um jornal, uma revista ou assistimos a um noti- ciário de televisão, é muito comum encontrarmos informações sobre diversas situa- ções representadas por meio de gráficos. Os gráficos assumem papel fundamental na apresentação de uma série estatística, é de suma importância visto que, praticamente, todo e qualquer relatório analítico vem acompanhado de gráficos ilustrativos. Eles facilitam a interpretação rápi- da do fenômeno que hora se analisa. Mas, para que estas afirmações se tornem váli- das, é necessário que certas normas sejam seguidas para a elaboração correta e pre- cisa delas. Ser assim não se fizer, poder-se-á ter uma visão distorcida, ou mesmo er- rônea do fenômeno estudado. Basicamente, devemos levar em conta três característi- cas para a construção de um gráfico ; simplicidade, clareza e veracidade. Após a cole- ta dos dados em uma pesquisa e uma vez construída a distribuição de frequência, podemos melhor visualizar os dados desta tabela, construindo-se gráficos. A ideia de transformar dados numéricos em figuras, ou seja, construir grá- ficos, é um recurso fundamental de estatística. Torna mais rápida a leitura das trans- formações e facilita sua compreensão. E quem será que teve uma ideia tão boa ? No decorrer da História, mais de uma pessoa pensou em retratar números. Uma delas foi o filósofo e matemático francês René Descartes( 1596 / 1650 ). Ele in- ventou os gráficos cartesianos( dá para imaginar de onde vem à palavra cartesiano, não é ? ). Nesses gráficos, pares de números se transformam em pontos. Os gráficos de segmentos que a estatística usa são baseados na invenção de Descartes. Os principais tipos de gráficos são : Diagramas, Cartogramas, Pictogra- mas. 2. DIAGRAMAS Os diagramas são gráficos geométricos dispostos em duas dimensões. Para sua construção fazemos uso do plano cartesiano. Os principais diagramas são : 2.1 – GRÁFICO EM LINHA OU EM CURVA Quando queremos representar a variação de um fenômeno no decorrer do tempo, utilizamos o gráfico de segmentos, também chamado gráfico de linhas . Este tipo de gráfico se utiliza da linha poligonal para representar a série estatística. EXEMPLO : 17 Ingestão de gordura saturada gordura( g ) pessoas 16 2 24 4 40 9 45 3 51 1 60 1 Total 20 Fonte : Blair e Taylor 2.2 – GRÁFICO DE SETORES Para os gráficos da estatística, mais importante que a contribuição de Descartes foi a do escocês William Playfair, quetrabalhava com estatísticas comerci- ais. Em 1786 ele começou a inventar maneiras de representar dados numéricos por meio de figuras. Uma de suas criações foram os gráficos de barras ou colunas. Depois em 1801, ele inventou os gráficos de setores, também chamados de " tortas " ou " piz- zas " . Este gráfico é um dos mais simples, já que este consiste em um círculo dividido em setores. O gráfico em setores só deve ser empregado quando houver no máximo sete dados. EXEMPLO : Número de animais atendidos no Hospi- tal Veterinário da Uema – Outubro/2012 Cães 125 Gatos 93 Bovinos 37 Equinos 25 Total 280 Fonte : Fictícia 2.3 – GRÁFICO EM COLUNAS OU EM BARRAS Os gráficos de barras são utilizados, em geral para comparar as coisas de mesma natureza. É a representação de série por meio de retângulos, dispostos verticalmen- te( colunas ) ou horizontalmente( barras ). Quando em colunas, os retângulos tem a mesma base e as alturas são proporcionais aos respectivos dados. 18 EXEMPLOS : a) Medida da dor percebida em 60 pacientes em um hospital de São Luís Categoria Quant. de pacientes Forte 4 Moderada 8 Leve 17 Nenhuma 31 Total 60 Fonte : Blair e Taylor b) Tamanho de cães( média ) Raças Tamanho( cm ) Akita 67 Terrier Alemão 36 Dougue Alemão 80 Dálmata 58 Pug 26 Fonte : Internet 19 3. CARTOGRAMAS Os cartogramas são ilustrações relativas a cartas geográficas. Este gráfico é utilizado para mostrar dados estatísticos diretamente relacionados com áreas geo- gráficas ou políticas. Nos cartogramas distinguimos duas aplicações : a) representar dados absolutos( população ). Neste caso, utilizamos em geral, pontos , em número proporcional aos dados ; b) representar dados relativos( densidade ). Neste caso, fazemos uso, em geral, de hachuras. EXEMPLOS : POPULAÇÃO DA REGIÃO SUL DO BRASIL – 1990 . 40.000 habitantes 4. PICTOGRAMAS O pictograma constitui um dos processos gráficos que melhor fala ao pú- blico, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. 20 LISTA DE EXERCÍCIOS 1. De acordo com o Sistema Nacional de Informações TóxicoFarmacológicas em 2005 foram registradas 23647 casos de intoxicação humana no Brasil por animais pe- çonhentos. Desse total, 8208 foram atribuídos a escorpiões ; 4944 a serpentes ; 4661 a aranhas e 5834 a outros animais peçonhentos. Construir um gráfico em barras e um gráfico de setores para representar os dados acima . 2. Um estudo com 80 passageiros que desembarcaram no aeroporto de Brasília revelou as origens apresentadas na tabela seguinte. Pedese construir um gráfico de barras. Estado Nº de passageiros São Paulo 23 Rio de Janeiro 22 Bahia 14 Rio Grande do Sul 12 Paraná 7 Mato Grosso do Sul 2 Total 80 3. Faça um gráfico de colunas justapostos para representar a tabela abaixo. 4. Os dados abaixo mostra as atividades de fostatase alcalina( UI/L) no soro de 12 cães adultos normais. Construa um gráfico de barras. 5,4 7,3 20,3 17,5 35,9 16,8 28,6 54,3 10,0 14,0 11,7 24,3 5. Os dados abaixo, mostra as médias em gramas dos pesos de ratos machos Wistar por idade em dias. Construa um gráfico de setores. Idade 30 34 38 42 46 Média 63,6 74,6 81,4 94,6 105,6 21 DISTRIBUIÇÃO DE FREQÜÊNCIA 1. INTRODUÇÃO Neste capítulo, vamos estudar a forma pela qual podemos descrever os dados estatís- ticos resultantes de variáveis quantitativas. Como já dissemos na distribuição de frequências o local, a época e o fenômeno são fixos, mas os dados estão agrupados de acordo com a intensi- dade ou variação qualitativa do fenômeno. 2. DADOS BRUTOS Feita a coleta de dados, estes, ainda não se acham organizados numericamente, por esta razão costuma-se denominá-los Dados Brutos. Se organizamos estes Dados Brutos através de uma certa ordem( crescente ou de- crescente ) então teremos um Rol . 3. DISTRIBUIÇÃO DE FREQÜÊNCIAS Frequência é o número de vezes que um determinado valor aparece em um Rol . Para que a variável seja mais facilmente estudada e observada, devemos dispor em uma tabela de duas colunas os valores ordenados e sua respectivas frequências, temos assim uma tabela que recebe a denominação de Distribuição de Frequências. As tabelas de frequências podem representar tantos valores individuais como valores agrupados. 3.1 – DISTRIBUIÇÃO DE FREQÜÊNCIAS DE DADOS TABULADOS NÃO AGRUPADOS EM CLASSE Quando a variável em estudo for discreta de variação relativamente pequena, pode- mos montar tabela de frequências onde os valores aparecem individualmente. EXEMPLO : Seja a quantidade de gordura saturada consumida por 20 pessoas . 3.2 – DISTRIBUIÇÃO DE FREQÜÊNCIAS DE DADOS AGRUPADOS EM CLASSES Quando a variável em estudo for contínua ou mesmo discreta de tamanho razoável, podemos montar tabela de frequências onde os valores aparecem agrupados em intervalos de classes. EXEMPLO : Peso ao nascer de 100 nascidos vivos 22 4. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA a) Classes são intervalos de variação da variável ( i ); b) Limite de classe são os extremos de cada classe .Toda classe possui 2 limites, um inferior ( li ) e um superior ( L s ) ; c) Amplitude do Intervalo de Classe é a medida do intervalo que define a classe ou compri- mento da classe( h ) ; d) Amplitude da distribuição é a diferença entre o limite superior da última classe e o limite inferior da primeira classe ( A t ) e) Amplitude Amostral é a diferença entre o valor máximo e o valor mínimo da amostra( AA ). f) Frequência Simples ou Absoluta é o número de observações correspondente a essa clas- se ou a um valor individuais ( ). g) Ponto Médio de uma Classe é o que divide a classe ao meio, ou seja em duas partes iguais( x i ) . 5. NÚMERO DE CLASSES No momento não existe nenhum método ou fórmula que possamos utilizar para calcu- lar o número de classe de uma distribuição de frequência. A resolução deste problema depende do observador que deverá analisar a distribuição sob todos os aspectos para concluir qual o nú- mero de classe que melhor se adaptará a mesma. Embora não existam métodos nem fórmulas para o cálculo do número de classe, po- demos fazer uso de algumas relações para chegarmos ao número de classes que melhor se adapta à distribuição de frequência que estamos trabalhando Mesmo não existindo uma fórmula que resolva o problema do número de classes po- demos utilizar as seguintes sugestões : a) k = 1 + 3,3 . log N, onde N é o tamanho da amostra. b) N 5 10 25 50 100 200 500 k 2 4 6 8 10 12 15 c) k = N 6. TIPOS DE FREQÜÊNCIA a) Frequência Simples ( ) são os valores que realmente representam o número de dados de cada classe. b) Frequência Acumulada ( F ) é a soma da frequência simples desta classe com as frequên- cias simples das colunas anteriores. 7. ROTEIRO PARA ELABORAÇÃO DE UMA TABELA DE FREQÜÊNCIAS COM DADOS AGRUPADOS EM CLASSES O roteiro aqui adotado para a construção de uma tabela de frequências,serve para facilitar o trabalho de quem irá montar a tabela. O roteiro proposto consta dos seguintes itens : 23 a) Elaborar em rol a partir dos dados brutos ; b) Encontrar a amplitude total do conjunto de valores observados( AA ) ; c) Escolher o número de classes ( k ) ; d) Determinar a amplitude do intervalo de classe ( h = AA k ) e) Determinar os limites das classes ; f) Construir a tabela de frequências. 8. REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO Uma distribuição de frequência pode ser representada graficamente pelo Histograma, pelo Polígono de frequência e pelo Polígono de frequência acumulada ou Ogiva de Galton. Qualquer um dos gráficos acima é construído utilizando-se o primeiro quadrante do sistema de eixos ortogonais. Na linha horizontal colocamos os valores da variável e na linha verti- cal as frequências. 8.1 – HISTOGRAMA É formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos in- tervalos de classe. As larguras dos retângulos são iguais às amplitudes dos intervalos de classe e as altu- ras dos retângulos devem ser proporcionais às frequências das classes EXEMPLO : 8.2 – POLÍGONO DE FREQÜÊNCIA O polígono de frequência é um gráfico em linha, sendo as frequência marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono( linha fechada ), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. EXEMPLO : 24 LISTA DE EXERCÍCIOS 1. De acordo com o Sistema Nacional de Informações TóxicoFarmacológicas em 2005 fo- ram registradas 23647 casos de intoxicação humana no Brasil por animais peçonhentos. Desse total, 8208 foram atribuídos a escorpiões ; 4944 a serpentes ; 4661 a aranhas e 5834 a outros animais peçonhentos. Construa uma distribuição de frequências e calcule as per- centagens. 2. Construa uma tabela de frequências com classe para os dados abaixo com oito classes . Pressão arterial em mmHg de cães adultos anestesiados 130 105 120 111 99 116 82 107 125 100 107 120 143 115 135 130 135 127 90 104 136 100 145 125 104 101 102 101 134 158 110 102 90 107 124 121 135 102 119 115 125 117 107 140 121 107 113 93 103 3. Uma doença pode ser classificada em três estágios( leve, moderada, severo ). Foram examinados 20 pacientes e obtidos os dados : moderado, leve, leve, severo, leve, mode- rado, moderado, moderado, leve, leve, severo, leve, moderado, moderado, leve, seve- ro, moderado, moderado, moderado, leve. Com base nestes dados, construa uma tabela de frequência e calcule as frequências relativas de cada categoria. 4. Com base nos dados apresentados no quadro abaixo, construa um tabela de fre- quência com classes e calcule todos os tipos de frequências. Pressão sanguínea diastólica de 30 enfermeiros 81 89 91 81 79 82 70 80 92 64 73 86 87 74 72 75 90 96 83 79 82 82 78 85 77 83 85 87 88 80 5. Uma pesquisa sobre idade, em anos de uma turma de calouros de Medicina Veteri- nária da UEMA, revelou os dados abaixo. Construir uma tabela de frequência e deter- mine as frequências acumuladas, e as frequências relativas. 18 17 18 20 21 19 20 18 17 19 20 18 19 18 19 21 18 19 18 18 19 19 21 20 17 19 19 18 18 19 18 21 18 19 19 20 19 18 19 20 18 19 19 18 20 20 18 19 18 18 25 6. Seja os pesos em kg de 20 coelhos hídricos Norfolk, abatidos aos três meses de idade. Construa uma distribuição de frequências com cinco classes( i = 5 ) onde l 1 = 2,50 kg. a) Encontre todos os tipos de frequências ; b) Determine os pontos médios das classes ; c) Construa um histograma da distribuição . 7. Os dados abaixo referemse ao consumo de matéria seca( em kg ) por novilhos de dois anos na Fazenda R duplo. a) Construa uma distribuição de frequências onde l 1 = 10 e h = 0,3 e determine todos os tipos de frequências ; b) Determine os pontos médios das classes ; 26 MEDIDAS DE POSIÇÃO 1. INTRODUÇÃO As medidas de posição mais importantes são as medidas de tendência central, as quais recebem esta denominação pelo fato dos dados observados tenderem, em geral a se agrupar em torno dos valores centrais de uma distribuição. Dentre estas medidas desta- car : a Média Aritmética, a Moda, a Mediana. Existem outras medidas de posição conheci- das como Separatrizes, que são : os Quartis, os Quintis, os Decis, os Percentis ou Cen- tis.. 2. MÉDIA ARITMÉTICA A Média Aritmética é a medida de posição mais comum, talvez por ser a mais utilizada. Além da média aritmética ainda temos : Média Geométrica e Média Harmônica. DEFINIÇÃO : Chama-se Média Aritmética a soma dos valores da variável observada dividida pelo número de valores observados, isto é : ixx n , onde : x média ; x i valores observados ; n números de valores observados 2.1 – CÁLCULO DA MÉDIA 1º Caso : Valores não Agrupados Para este caso fazemos uso da fórmula fornecida pela definição. EXERCÍCIO BÁSICO : Encontre a média nos conjuntos abaixo : a) M = { 1, 3, 4, 6, 7, } b) A = { 0, 2, 8, 9, 5, 3 } c) N = { 20, 12, 13, 17 } Existem outras médias, entre as quais podemos citar : Média Aritmética Ponde- rada, Média Harmônica, Média Geométrica. A média geométrica é dada por : M g = antilog ( x ) = antilog ( ix n ), onde x é a média aritmética dos logaritmos dos dados observados. EXERCÍCIO BÁSICO : Sejam os pesos em gramas de 21 porquinhas da índia, calcule a média geométrica dos pesos. 27 2º Caso : Valores Tabelados não Agrupados em Classe Neste caso, utilizamos a fórmula x = i if .x n , onde i . x i é o produto dos valores por sua respectiva frequência simples. Aqui neste cálculo as frequências simples funcionam como peso, ou seja neste caso o que calculamos nada mais do que a Média Aritmética Ponderada. EXERCÍCIO BÁSICO : Encontre a média aritmética das seguintes distribuições : a) b) 3º Caso : Valores Tabelados Agrupados em Classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio( x i ), e determinamos a média aritméti- ca como no caso anterior, ou seja : x = i i i f .x f , onde x i é o ponto médio da classe. EXERCÍCIO BÁSICO : Encontre a média aritmética das seguintes distribuições : a) b) 28 3. MODA A Moda é outra medida de tendência central. DEFINIÇÃO : Chama-se Moda o valor mais frequente em uma distribuição, ou seja, o valor que mais aparece em uma distribuição. Portanto a Moda às vezes é localizada por simples exame na distribuição. As distribuições de frequências podem ter uma ou mais modas ou nenhuma moda. Quando a distribuição possui mais de uma moda dizemos que ele é Plurimodal; e quando o conjunto não possui moda a distribuição é Amodal. A moda é trabalhada principalmente com variáveis qualitativas. 3.1 – CÁLCULO DA MODA 1º Caso : Valores não Agrupados Como já foi dito na definição a Moda será o valor que mais aparecer na distribuição. EXERCÍCIO BÁSICO : Determine a Moda nos conjuntos abaixo : a) M = { 4, 5, 5, 6, 6, 6, 7, 7, 8 } b) W = { 4, 4, 7, 7, 10, 10 } c) D = { 1, 2, 2, 2, 4, 4, 5, 5, 9, 9, 9, 12, 12 } d) N = { 1, 3, 6, 0 } 2º Caso : Valores Tabelados não Agrupados em Classe Neste caso, basta consultar a tabela e verificar a maior frequência, o valor cor- respondente a maior frequência, será a moda da distribuição. EXERCÍCIOS BÁSICOS 1. Determine a moda nas distribuições abaixo : a) b) 2. O quadro abaixo mostra as respostas de uma amostra de 1040 pessoas que foram per- guntadas se a qualidade do ar em sua cidade está melhor ou pior do estava a 10 anos atrás . Qual é a moda desta pesquisa ? 29 3º Caso : Valores Tabelados Agrupados em Classe Neste caso, a classe que apresenta a maior frequência, é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto mé- dio da classe modal. Damos a este valor a denominação de Moda Bruta, ou seja : M o = *L 2 l* , onde : l * limite inferior da classe modal ; L* limite superior da classe modal EXERCÍCIO PROPOSTO: Encontre a moda da distribuição abaixo : Existem outras maneiras de se determinar o valor da Moda, e uma delas é utili- zando a fórmula de Czuber , ou seja : M o = l i + 21 1 DD D . h , onde : l i limite inferior da classe modal D 1 – ant D 2 – post h amplitude da classe modal frequência da classe modal ant frequência da classe anterior à classe modal post frequência da classe posterior à classe modal EXERCÍCIOS BÁSICOS 1. Determine a moda nas distribuições abaixo : a) b) 30 4. MEDIANA DEFINIÇÃO : A Mediana de um conjunto de valores, ordenados segundo uma ordem( cres- cente ou decrescente ), é o valor situado de tal forma no conjunto que separa este em duas partes com o mesmo número de elementos . Elemento Mediano( E Md ) é o valor que identifica a posição da mediana. Para encontrarmos o Elemento Mediano fazemos uso das seguintes fórmulas : a) E Md = n 1 2 , se n é ímpar ; b) E Md = n 2 , se n é par , onde n é o número de elementos de um conjunto ou distribuição. 4.1 – CÁLCULO DA MEDIANA 1º Caso : Valores não Agrupados Para este caso, os valores são ordenados segundo uma ordem( crescente ou decrescente) em, seguida, encontramos o Elemento Mediano ( E Md ) e então encontra-se a Mediana. EXERCÍCIO BÁSICO : Encontre a mediana nos conjuntos abaixo : a) M = { 5, 13, 10, 2, 18, 15, 6, 16, 9 } b) F = { 12, 3, 6, 2, 15, 7 } c) D = { 4, 7, 5, 8, 12, 15, 8, 20 } 2º Caso : Valores Tabulados não Agrupados em Classe Neste caso, acrescenta-se à tabela a coluna das frequências simples acumula- da, que servirá juntamente com Elemento Mediano( E Md ), para encontrar a mediana. EXERCÍCIO BÁSICO : Encontre a mediana de cada distribuição abaixo : a) b) c) 31 3º Caso : Valores Tabelados Agrupados em Classe Quando os dados da variável em estudo estiverem agrupados em classe, o pro- blema consiste em determinar o ponto do intervalo em que está compreendida a Mediana . Para tanto, temos inicialmente que determinar a classe na qual se acha a media- na( classe mediana ). Tal classe será, evidentemente, aquela correspondente à frequência acumulada imediatamente superior ao Elemento Mediano( E Md ) . Feita a identificação da classe onde se encontra a Mediana, então podemos fa- zer uso da fórmula : M d = l i + md antE F f . h , onde : l i limite inferior da classe mediana E Md elemento mediano F ant frequência acumulada da classe anterior à classe mediana frequência simples da classe mediana l h amplitude do intervalo da classe mediana EXERCÍCIOS BÁSICOS : 1. Determine o valor da mediana nas distribuições abaixo : a) b) 32 5. QUARTIS – DECIS – PERCENTIS Os Quartis, Decis e Percentis, assim como a Mediana dividem uma distribuição em : quatro, dez e cem partes iguais respectivamente. Par o cálculo de qualquer uma das medidas acima, procedemos de modo análo- go ao cálculo da mediana, porém temos que ter o cuidado no cálculo do elemento que identi- fica a classe em que o Quartil( n = 4 ), o Kentil( n = 5 ), o Decil( n = 10 ) ou o Percentil( n = 100 ), se encontra, ou seja : P i = l i + E pi−F ant f . h , onde : l i limite inferior da classe do percentil E pi elemento percentil F ant frequência acumulada da classe anterior à classe do percentil h amplitude do intervalo da classe do percentil frequência simples da classe percentil E p i = ii. f n , onde : i posição da separtariz i total da variável em estudo EXERCÍCIO BÁSICO : 1. Nos conjuntos abaixo, encontre Q1, Q3 , D3, D8, C12, C90. a) M = { 5, 13, 10, 2, 18, 15, 6, 16, 9 } b) F = { 12, 3, 6, 2, 15, 7 } c) D = { 4, 7, 5, 8, 12, 15, 8, 20 } 2. Seja a distribuição de frequência representada na tabela abaixo : Determine as seguintes separatrizes : a) Q 3 b) K 4 c) D 6 33 LISTA DE EXERCÍCIOS 1. Considerando os conjuntos de dados : a) E = { 3, 5, 2, 6, 5 , 9, 5, 2, 8, 6 } b) D = { 20, 9, 7, 2, 12, 7, 20 , 15, 7 } c) A = { 51,6 ; 48,7 ; 50, 3 ; 49,5 ; 48,9 } d) M = { 15, 18, 20, 13, 10, 16, 14 } Calcule a média, a moda e a mediana de cada conjunto . 2. Sejam os valores da concentração de potássio ( mmol/ l ) no plasma de 14 cães. 4,37 4,87 4,35 3,92 4,68 4,54 5,24 4,59 4,66 4,40 4,73 4,83 4,21 4,54 Determine : a) a média b) a mediana 3. Sejam os pesos em gramas de 21 porquinhosdaíndia Hartley : 314 991 789 556 412 425 499 350 893 756 455 297 598 510 388 642 474 333 421 685 536 Determine : a) o peso médio; b) o peso mediano ; 4. Os seguintes dados mostram a ventilação pulmonar em repouso de 25 ovinos adultos( l / min ). 8,3 8,0 9,9 6,15,5 10,3 6,5 7,6 7,6 7,6 6,9 10,3 7,8 7,3 8,9 10,1 7,6 9,1 8,3 4,8 10,2 6,5 9,1 7,0 11,9 Construa uma distribuição de frequências com classe onde o intervalo de classe seja 1,0 l/m e o limite inferior da 1ª classe seja 4,25 e então determine : a) A média b) A mediana c) a moda 34 5. Seja os pesos em kg de 20 coelhos hídricos Norfolk, abatidos aos três meses de idade. Construa uma distribuição de frequências com cinco classes( i = 5 ) onde l 1 = 2,50 kg. a) Encontre todos os tipos de frequências ; b) Determine os pontos médios das classes ; c) Construa um histograma da distribuição . 6. Os dados abaixo referemse ao consumo de matéria seca( em kg ) por novilhos de dois anos na Fazenda R duplo. a) Construa uma distribuição de frequências onde l 1 = 10 e h = 0,3 e determine todos os tipos de frequências ; b) Determine os pontos médios das classes ; 7. Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho de peso, mostrou que após um mês em que a ração normal foi substituída pela nova ração, os animais apresentaram um aumento de peso segundo a tabela : a) Calcular o aumento médio de peso por animal. b) Se a ração antiga proporcionava em iguais circunstâncias um aumento médio de peso de 3,100 kg/animal, esta nova ração pode a princípio ser considerada mais eficiente ? 35 MEDIDAS DE DISPERSÃO 1. INTRODUÇÃO Consideremos os seguintes conjuntos de valores : N = { 7, 7, 7, 7, 7 }, B = { 5, 6, 7, 8, 9 } e C = { 2, 5, 8 10, 10 }. Se calcularmos a média aritmética de cada conjunto teremos o seguinte resultado : x N = 7 x B = 7 x C = 7 Vemos, então, que os conjuntos N, B e C apresentam a mesma Média Aritmé- tica, e é fácil verificar que o conjunto N é mais homogêneo que os conjuntos B e C ; e que por sua vez o conjunto B é mais homogêneo que o conjunto C. Esta maior ou menor homogeneidade entre os valores de um conjunto ou de uma distribuição de frequências em Estatística chama-se Dispersão ou Variabilidade . As principais medidas de dispersão são : Amplitude Total, Desvio Padrão, Va- riância e Coeficiente de Variação. 2. AMPLITUDE TOTAL A Amplitude Total é a diferença entre o maior e o menor valor observado em um conjunto ou distribuição, isto é : AT = x( máx. ) – x ( min ) . EXERCÍCIOS 1 . Encontre a amplitude total dos conjuntos do item anterior. 2 . Sejam as distribuições abaixo, encontre a amplitude de cada uma. a) x i 0 1 2 3 4 i 2 6 12 7 3 b) x i 1 2 3 4 5 6 i 2 5 8 6 3 1 3. DESVIO PADRÃO – VARIÂNCIA A variância e o desvio padrão, ao contrário da amplitude total levam em conside- ração todos os valores da variável em estudo, o que faz delas índices de dispersão bastante estáveis e, por isso mesmo, os mais empregados. 36 3.1 – CÁLCULO 1º Caso : Dados não Agrupados Para dados não agrupados podemos utilizar as fórmulas : s2 = 2 ix x n ( Variância ) s = 2s ( Desvio padrão ) EXERCÍCIO : Encontre o desvio padrão amostral do conjunto A = { 8, 19, 11, 15, 16, 18 } 2º Caso : Dados Tabelados Neste caso, temos que levar em consideração as frequência, então : 2 = 2 i i2 i i f .x1 f .x n n ou s 2 = 2 i2 i f .x1 f .x n 1 n desvio padrão populacional e s desvio padrão amostral EXERCÍCIO : Encontre o desvio padrão amostral distribuição abaixo : x i 0 1 2 3 4 i 2 6 12 7 3 3.2 INTERPRETAÇÃO DO DESVIO PADRÃO Se a amostra for grande e os dados tiverem distribuição simétrica e em forma de sino( figura ) , valem as seguintes considerações : 68% das observações ficam dentro do intervalo x s ; 95% das observações ficam dentro do intervalo x 2s ; 99% das observações ficam dentro do intervalo x 3s ; O desvio padrão reflete a variação média absoluta dos dados em torno da média aritmética. Quanto menor for o desvio padrão de um processo produtivo, menor será a varia- bilidade apresentada no produto final e, portanto, maior qualidade terá o produto. 37 4. COEFICIENTE DE VARIAÇÃO Trata-se de uma medida relativa de dispersão, muito útil para a comparação em termos relativos de grau de concentração em torno da média de séries distintas. O coeficiente de variação é calculado utilizando-se a fórmula : C.V = s x , onde s é a variância e x é a média aritmética da distribuição. EXERCÍCIO : Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de alunos de uma determinada escola. Nesse grupo de alunos , o que apresenta maior dispersão, as estaturas ou os pesos ? LISTA DE EXERCÍCIOS 1. Uma amostra da produção leiteira de vacas da Fazenda Sol Nascente forneceu o seguinte resultado. a) Determine a média, a moda e a mediana ; b) Determine Q 1, Q 3, P 10 e P 90 ; c) Determine o desvio padrão e o coeficiente de variação . 2. Em uma granja foi observada a distribuição dos frangos em relação ao peso, que era o seguinte : Peso( g ) n i 960 980 60 980 1000 160 1000 1020 280 1020 1040 260 1040 1060 160 1060 1080 80 total 1000 38 a) Qual a média da distribuição ? b) Qual a variância amostral da distribuição ? c) Construir o histograma ? d) Queremos dividir os frangos em quatro categorias, em relação ao peso, de modo que : os 20% mais leves sejam da categoria D ; os 30% seguintes sejam da categoria C ; os 30% seguintes sejam da categoria B ; os 20% seguintes sejam da categoria A ; Quais os limites de peso entre as categorias A, B, C e D ? e) O granjeiro decide separar deste lote os animais com peso inferior a dois desvios padrões abaixo da média para receberem ração reforçada, e também separar os animais com peso superior a um e meio desvio padrão acima da média para usalós como reprodutores. Qual a porcentagem de animais que serão separados em cada caso ? 3. Dado o histograma abaixo, calcular a média, a variância, a moda, a mediana e o 1º quartil 4. Calcule a variância e o desvio padrão dos dados apresentados no quadro do exer- cício 1, em cada idade e comente o resultado. 5. Os seguintes dados mostram a ventilação pulmonar em repouso de uma amostra de 25 ovinos adultos( L / min ) : 8,3 8,0 9,9 6,1 5,5 10,3 6,5 7,6 7,6 7,6 6,9 10,3 7,8 7,3 8,9 10,1 7,6 9,1 8,3 4,8 10,2 6,5 9,1 7,0 11,9 Faça uma distribuição de frequência com 6 classe e h = 1,2 , construa um histograma e determine : a) A média, a moda, a mediana, Q 1 e Q 3 ; b) o desvio padrão e a variância 39 MEDIDAS DE ASSIMETRIA 1. INTRODUÇÃO Quando uma distribuição é Simétrica, as três medidas de tendência central( Média, Moda e Mediana ) coincidem, caso contrário a distribuição chama-se Assimétrica. Quanto maior for a diferença entre as medidas de tendência central maior é a assimetria da distribuição. Assim, em uma distribuição em forma de sino, temos: I) x = Md ( x~ ) = Mo, a curva é simétrica ; II) Mo < Md ( x~ ) < x , a curva é Assimétrica positiva ; III) x < Md ( x~ ) < Mo , a curva é Assimétrica negativa. 2. CÁLCULO DA ASSIMETRIA 2.1 – COMPARAÇÃO ENTRE AS MEDIDAS DE TENDÊNCIA CENTRAL Baseando-se nas relações acima entre a média e a moda, podemos empregá-las para determinar o tipo de Assimetria, ou seja : I) se x – Mo = 0, então a assimetria é Nula ; II) se x – Mo > 0, então a assimetria é Positiva ou à Direita ; III) se x – Mo < 0, então a assimetria é Negativa ou à Esquerda . 2.2 – COEFICIENTE DE ASSIMETRIA OU ÍNDICE DE PEARSON A medida anterior, por ser absoluta, não permite a possibilidade de comparação entre as medidas de duas distribuições, para isto utilizamos o Coeficiente de Assimetria ou Índice de Pearson, ou seja : A s = 3.(x Md) s . Se 0,15 < | A s |< 1 , a assimetria é considerada Moderada ; se | A s | > 1 , en- tão a assimetria é Forte . 40 LISTA DE EXERCÍCIOS 1. Para o conjunto A = { 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9 }. Elabore uma tabela de frequência e encontre a grau de assimetria desta distribuição . 2. Classifique, quanto à assimetria, à distribuição abaixo, segundo o coeficiente de Pearson. a) b) 3. Sejam os dados da tabela abaixo. Determine o tipo de assimetria calculando o coe- ficiente de Pearson. 4. Aviva.19 Calcule a média e a mediana do conjunto de dados listados a seguir. Classifique o conjunto com relação a assimetria. 41 MEDIDAS DE CURTOSE 1. DEFINIÇÃO Denominamos Curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada Curva Normal. De acordo com o grau de curtose, podemos ter três tipos de curvas de frequência. a) Mesocúrtica se a curva de frequências apresenta um grau de achatamento equivalen- te ao da Curva Normal. b) Platicúrtica se a curva de frequências apresentar um grau de achatamento maior que o da Curva Normal. c) Leptocúrtica se a curva de frequências apresentar um grau de achatamento menor que o da Curva Normal. 42 2. CÁLCULO DO GRAU DE CURTOSE Para o cálculo do grau de curtose de uma curva de frequências podemos utilizar o Coeficiente Percentílico de Curtose, ou seja : C = )CC(2 QQ 1090 13 , onde : Q3 3º quartil ; Q1 1º quartil ; C90 90º percentil e C10 10º percentil Relativamente à Curva Normal, temos que : I) se C = 0,263 , a curva é Mesocúrtica ; II) se C < 0,263 , a curva é Leptocúrtica ; III) se C > 0,263 , a curva é Platicúrtica LISTA DE EXERCÍCIOS 1. Para o conjunto A = { 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9 }. Elabore uma tabela de frequência e encontre a grau de curtose desta distribuição . 2. Classifique, quanto à assimetria, à distribuição abaixo, segundo o coeficiente de Pearson. a) b) 3. Abaixo temos a distribuição de frequências dos pesos de uma amostra de 45 porquinhos da índia, determine . peso( g ) 40 45 45 50 50 55 55 60 60 65 65 70 i 4 10 15 8 5 3 a) a média b) a variância c) C.V 4. Com relação à questão anterior, classifique a distribuição quanto ao grau de curtose e de assimetria. 43 NOÇÕES DE PROBABILIDADES 1. INTRODUÇÃO Um automóvel será sorteado dentre os clientes de um shopping center . Paulo depositou 50 cupons em uma das urnas espalhadas pelo shopping , e Márcia depositou 20 cupons . Hoje dia do sorteio, os conteúdos de todas as urnas foram juntados, formando uma pilha de 10000 cupons. É possível medir a possibilidade de cada um dos participantes do sorteio ganhar o automóvel. Por exemplo, como Paulo possui 50 cupons dentre os 10000 que participam do sorteio, então a possibilidade de Paulo ser sorteado será de 10000 50 ; as- sim também temos que a possibilidade de Márcia ser sorteada é de 10000 20 . As frações 10000 50 e 10000 20 são chamadas de probabilidade de Paulo e Márcia ganharem o prêmio respectivamente. A probabilidade é a base da estatística inferencial, ou seja, é o mecanismo pela qual a inferência é realizada. 2. DEFINIÇÃO DE PROBABILIDADE Suponha que quatro bolas de gude, três delas pretas e uma branca, sejam colo- cadas em uma caixa. Agora, sacudimos a caixa e, depois, com os olhos fechados, coloca- mos a mão dentro do balde e tiramos uma bola . Agora, perguntamos : " Qual é a probabili- dade de que a bola retirada seja preta ? Se a sua resposta algo do tipo três quartos ou 75% , teremos que concordar com a sua resposta. Pela resposta, podemos verificar que a chance de ser sorteada uma bola preta é a quantidade de bolas pretas ( N P ) dividido pelo número total de bolas no balde( N ) , ou seja : P( A ) = PN N . DEFINIÇÃO : Num experimento aleatório equiprovável, sendo n( U ) o de elementos do espaço amostral U e n( E ) o número de elementos do evento E, então dizemos que a probabilidade de que ocorra o evento A é : P( A ) = n(E) n(U) = númerodecasosfavoráveis númerodecasospossíveis EXERCÍCIOS BÁSICOS 1. Uma família quer comprar um cachorro. Sabe–se que a probabilidade de se escolher um cachorro da espécie Doberman é 40% e desse animal ter pelagem preta é de 28%. Independente de ser Doberman ou não a probabilidade de ser preto é 50%. Represente estas probabilidades em um diagrama de Venn. 2. O gráfico de barras a seguir mostra o maior nível educacional atingido pelos funcioná- rios da empresa Cães e Gatos . 44 Encontre a probabilidade de que o nível educacional mais alto atingido por um funcionário escolhido aleatoriamente seja : a) Ph. D b) Técnico c) Mestrado 2.1 – PROPRIEDADES 1ª : Se A = , então o n( A ) = 0 e P( A ) = 0 ( probabilidade do evento impossível ) ; 2ª : Se A = U , então o n( A ) = n( U ) e P( A ) = 1 ( probabilidade do evento certo ) 3ª : Se A ≠ U, então 0 ≤ n( A ) ≤ n( U ) , logo : 0 ≤ P( A ) ≤ 1 A probabilidade de um evento acontecer é sempre um número entre 0( zero ) e 1( um ). 4ª : Se A e A são eventos complementares, então P( A ) + P( A ) = 1 3. TABELAS DE CONTIGÊNCIA Seja uma amostra composta de duas características associadas a cada gato em um grupo de vinte. Cada um dos vinte gatos é caracterizado como branco( B ) e não branco( B ), portador de uma doença ( D ), ou não portador da doença( D ). Baseado na figura acima, responda as seguintes perguntas : a) Qual é a probabilidade de selecionarmos um gato aleatoriamente dessa população e descobrir que ele é branco ? 45 b) Qual é a probabilidade de selecionarmos um gato aleatoriamente dessa população e descobrir que ele é não portador de doença ? c) Qual é a probabilidade de selecionarmos um gato aleatoriamente dessa população e descobrir que ele é branco e portador de doença ?d) Qual é a probabilidade de selecionarmos um gato aleatoriamente dessa população e descobrir que ele não é branco e portador de doença ? 3.1 TABELAS DE FREQUÊNCIAS Os dados utilizados para os cálculos do item anterior podem ser resumidos convenientemente em uma tabela, chamada de tabela de contingência, como mostra a figura abaixo EXERCÍCIO : Utilize os valores da tabela anterior e determine as seguintes probabilidades : P( B ) , P( D ) , P( B D ), P( B D ) . 4. PROBABILIDADE CONDICIONAL Em muitas aplicações estatísticas, o interesse está apenas em uma parte es- pecificada da população. Por exemplo, a pergunta : " Qual é a probabilidade de doença sendo que a seleção é feita dentre os brancos ? " SOLUÇÃO : Vejamos a figura abaixo, onde a população está sem os gatos não brancos . Temos que D B = 9 e n( B ) = 12 , logo p = ( ) ( ) n D B n B = 9 12 = 0,75 . Para esta probabilidade utilizamos a notação P( D | B ), que é lido " qual é a probabi- lidade de estar doente sendo que é branco. Essa forma de probabilidade é conhecida como probabilidade condicional . EXERCÍCIO : Utilize a tabela de frequências do exercício anterior( figura 1 ) e calcule as seguintes probabilidades : P( D | B ) e P( B | D ) . 46 4.1 – TABELAS DE PROBABILIDADES Outra forma de construir tabelas de contingência é obtida pela divisão de conta- gem em uma tabela de frequência pelo total( N ), a fim de obtermos as probabilidades. A tabela de probabilidades abaixo foi construída a partir da tabela de frequência da figura 1 As probabilidades calculadas no exercício anterior podem ser calculadas utili- zandose a tabela de frequências( figura 2 ). Você poderá notar que em algumas probabi- lidades a ordem das características não são importantes, por exemplo : P( BD ) = P( DB ), mas para as probabilidades condicionais a ordem importa, pois P( B | D ) é diferente de P( D | B ). 4.2 – EVENTOS INDEPENDENTES Outro fato interessante nos métodos estatísticos é a independência entre eventos, muito utilizado na área da saúde. DEFINIÇÃO : Seja um espaço amostral U, finito e não vazio. Sejam A e B eventos de U, então dizemos que A e B são eventos independentes se, e somente se : P( B / A ) = P( B) ou P( A / B) = P( A ) e neste caso P( A B ) = P( A ) . P( B ) . EXERCÍCIO : Seja a tabela de probabilidade abaixo. Calcule as seguintes probabilidades : P( A ) , P( B ), P( A B ), P( A B ) , P( A B ) e diga se A e B são eventos independentes ? Justifique a sua resposta. 4.2 – MULTIPLICAÇÃO DE PROBABILIDADES Sejam U um espaço amostral equiprovável, finito e não vazio. Sejam A e B eventos de U então : P( A B ) = P( A ) . P( B / A ) . Se A e B são independentes então podemos concluir que : P( A B ) = P( A ) . P( B ) , ou seja, que se a probabilidade conjunta de A e B ( probabilidade da interseção de A e B ) for igual ao produto de suas probabilidades marginais então A e B são independentes. 47 4.3 – TEOREMA DE BAYES Vamos apresentar a Regra de Bayes para completar o assunto. Em sua forma mais simples, a regar de Bayes permite que você use P( A | B ) para determinar P( B | A ) que é expressa do seguinte modo : P( B | A ) = ( | ). ( ) ( | ). ( ) ( | ). ( ) P A B P B P A B P B P A B P B . Para completar temos que sendo A e B dois eventos quaisquer então : P( A B ) = P( A ) + P( B ) P( A B ) . 5. SENSIBILIDADE, ESPECIFICIDADE E CONCEITOS RELACIONADOS A eficiência do teste em si pode ser avaliada por meio do cálculo de sua sen- sibilidade, especificidade, valor preditivo positivo e valor preditivo negativo . Para exemplificar vamos utilizar uma tabela de probabilidade, para explicar cada um desses conceitos. Observando a tabela acima temos : D doença ; D ausência de doença ; + teste positivo e teste negativo. Para entender a tabela vejamos o que temos : . 0,015 da população é portadora da doença e obtém resultado positivo ; . 0,970 da população não é portadora da doença e obtém um resultado negativo Agora veremos os conceitos seguidos de exemplos, utilizando os dados da tabela acima. DEFINIÇÃO 1 : Sensibilidade é a probabilidade de uma pessoa portadora da doença re- ceber um resultado positivo, ou seja : Sensibilidade = P( + | D ) . Utilizando a tabela temos : sensibilidade = 0,015 0,020 = 0,75 ; isto significa que apenas 75% da pessoas portadoras da doença são identificadas corretamente. 48 DEFINIÇÃO 2 : Especificidade é a probabilidade de uma pessoa não portadora da doença receber um resultado negativo, ou seja : Sensibilidade = P( | D ) . Utilizando a tabela temos : especificidade = 0,97 0,98 = 0,99 ; isto significa que se você não tiver a doença, é quase certo( mas não totalmente ) que receberá um resul- tado negativo. DEFINIÇÃO 3 : Valor preditivo positivo é a probabilidade de uma pessoa que recebe um resultado positivo ser portador da doença, ou seja : VPP = P( D | + ) . Utilizando a tabela temos : VPP = 0,015 0,025 = 0,60 ; isso significa que, se uma pessoa recebe um resultado positivo, a probabilidade de ela ser portadora da doença é de apenas 60% . DEFINIÇÃO 4 : Valor preditivo negativo é a probabilidade de uma pessoa que recebe um resultado negativo não ser portador da doença, ou seja : VPN = P( D | ) . Utilizando a tabela temos : VPN = 0,970 0,975 = 0,99 ; isso significa que, se uma pessoa recebe um resultado negativo, a probabilidade de ela não ser portadora da doen- ça é de apenas 99% . Temos ainda a Prevalência é a probabilidade da pessoa ter doença, ou seja : Prevalência = P( D ) . Pela tabela temos que P( D ) = 0,02, ou seja 2% . EXERCÍCIO : Utilize a tabela abaixo, e determine a sensibilidade, a especificidade, o valor preditivo positivo, o valor preditivo negativo e a prevalência. 5.1 – RAZÕES DE RISCO E DE CHANCES Dentro da estatística descritiva, temos duas estatísticas muito utilizadas em pesquisas relacionadas à saúde, são elas : razão de risco e razão de chances. 49 RAZÃO DE RISCO As perguntas de pesquisa normalmente questionam por exemplo se as pes- soas ou animais expostas a um fator de risco em potencial são mais ou menos propensas a desenvolver uma doença do que as que não experimentaram a exposição. Como por exemplo, qual é a probabilidade de um animal vacinado contrair a doença ? Um método comum para comparar as probabilidades de doença para animais expostos e não expos- tos é agrupa–lós em uma proporção chamada de razão de risco. Matematicamente te- mos que razão de risco é expressa como : RR = P(D | E) P(D | E) , onde D é doente, E é exposição e E não exposição.. RAZÃO DE CHANCES Em certas pesquisas a razão de risco não oferece uma comparação significa- tiva entre os grupos exposto ou não exposto. Nesses casos, a razão de chances é fre- quentemente utilizada para fins de comparação. A chance de um evento ocorrer é a razão entre a probabilidade de que ele ocorra e a probabilidade de que não ocorra.
Compartilhar