Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 UNIVERSIDADE FEDERAL DA BAHIA ESCOLA DE MEDICINA VETERINÁRIA E ZOOTECNIA DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E PRODUÇÃO ANIMAL Entende-se por Estatística: (a) Parte da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma população ou sobre uma coleção de seres quaisquer e os métodos de tirar conclusões e fazer predições com base nesses dados; (b) Conjunto de elementos numéricos relacionados a um fato social. Exemplo: O IBGE (Instituto Brasileiro de Geografia e Estatística) publica no Anuário Estatístico do Brasil informações referentes a Unidades de Conservação da Natureza, com indicação da área total e dos municípios por região, ou ainda com relação a Terras indígenas, área total, população indígena estimada, etc. (c) Método que objetiva o estudo dos fenômenos de massa, ou seja, os que dependem de uma multiplicidade de causas, e tem por fim representar, sob forma analítica ou gráfica, as tendências características limites desses fenômenos. A Bioestatística é a estatística aplicada às ciências da vida. ESTATÍSTICA DESCRITIVA: Descrição, análise e representação de um conjunto de dados, utilizando métodos numéricos e gráficos. INFERÊNCIA ESTATÍSTICA: Estabelece métodos que permitem conclusões sobre a população, a partir de uma amostra representativa desta população. POPULAÇÃO: Conjunto de elementos que têm em comum uma determinada característica. Número total de indivíduos de uma espécie, raça ou linhagem com alguma característica em comum, em uma determinada área. AMOSTRA: Subconjunto não vazio e com menor número de elementos do que o conjunto definido como população. CENSO: Coleção de dados relativos a todos os elementos de uma população. Se a população é grande, o trabalho do censo torna-se exaustivo e oneroso. Na prática, trabalha-se com uma parte da população (amostra). A INFERÊNCIA ESTATÍSTICA possibilita a tomada de decisões sobre a população com base na amostra, isto é, em uma situação em que existe incerteza e variação. As conclusões geradas podem ser igualmente ou mais confiáveis e mais amplas do que as permitidas com os resultados do censo. Isto se consegue em função da quantidade e da qualidade das informações obtidas com os LEVANTAMENTOS POR AMOSTRAGEM. As afirmações que resultam da avaliação científica são apenas inferências. O investigador estabelece o que deve acontecer na população, com base apenas na amostra, diante da impossibilidade prática de observar todos os casos possíveis. Como as inferências são baseadas em um número limitado de observações, estas vêm sempre acompanhadas de alguma incerteza (ou seja, há sempre a possibilidade de ocorrer variação aleatória) e a sua aceitabilidade é dada por um valor expresso em termos probabilísticos. A estatística tem por objetivo medir, em termos probabilísticos, a incerteza ou a certeza de uma inferência, ou seja, a probabilidade de erro ou de acerto. Por meio de testes estatísticos é possível 2 rejeitar ou não uma hipótese formulada temporariamente sobre um determinado assunto. Mas não é possível provar com certeza essa hipótese. A estatística se restringe a indicar a probabilidade de ocorrência de um evento ou de uma hipótese estar certa ou errada, ou seja, a probabilidade em que se pode confiar nas conclusões feitas. DADOS Registros de medidas, contagens ou observações. Exemplos de dados são os valores de peso corporal, altura, sexo do indivíduo e cor de pelagem. Os dados são os valores atribuídos à variável. VARIÁVEL Elemento genérico que representa o conjunto de resultados possíveis de um fenômeno ou característica. Função que associa valores aos resultados de um fenômeno. A expressão variável indica que as medidas ou observações podem ser diferentes, ou seja, exibem variabilidade. Exemplo: (a) Para o fenômeno "sexo do animal nascido" há dois resultados possíveis: macho e fêmea. (b) Para o fenômeno "número de filhotes nascidos por ninhada em uma espécie", há um número de resultados possíveis expressos por valores numéricos: 0, 1, 2, 3, 4, 5, 6, ..., n; sendo n o número máximo de filhotes por ninhada. (c) Para o fenômeno “peso do animal ao nascimento” há um número infinito de resultados possíveis expressos por valores numéricos, dentro de um intervalo definido pelo menor e pelo maior valor de peso ao nascimento de uma espécie. TIPOS DE VARIÁVEIS (1) QUALITATIVA: quando seus valores são expressos por atributos, classes, tipo (por exemplo, sexo: macho ou fêmea; pelagem: preta e branca ou vermelha e branca, estado: vivo ou morto). A variável qualitativa pode ser: (a) Nominal é aquela para a qual não existe ordenação alguma das possíveis realizações. Classes ou símbolos, não ordenados, são utilizados para identificar os grupos a que as observações pertencem. Exemplos: Sexo, grupo sangüíneo, cor da pelagem, cor dos olhos (azul ou castanho), opinião sobre determinado assunto, religião. As classes são expressas nominalmente. As classes devem ser exaustivas (qualquer dado será enquadrado em uma das classes) e mutuamente exclusivas (cada dado será elemento de uma única classe). (b) Ordinal é aquela para a qual existe certa ordem nos possíveis resultados. Exemplos: Estágio de uma doença; Classificação de indivíduos segundo seu grau de escolaridade (analfabeto, Ensino Fundamental, Ensino Médio, Ensino Superior). Propriedades rurais podem ser classificadas pelo tamanho ou nível de produção. Para variáveis clínicas histológicas, anatômicas e patológicas, é comum a classificação 0, +, ++ e +++. Nesse caso, cada classe deve ser caracterizada de forma bem clara e objetiva. Outros pesquisadores devem ser capazes de fazer a mesma analogia. Variáveis biológicas podem ser representadas por valores numéricos, porém devem ser evitadas operações aritméticas para estas quantidades. Exemplo: níveis de dor, em escala de um a cinco. (2) QUANTITATIVA: quando seus valores são expressos por números e que permitem realizar operações aritméticas (ex. peso, idade, número de ovos, tamanho da leitegada, etc.). Uma variável quantitativa que pode, teoricamente, ter qualquer valor entre dois limites recebe o nome de VARIÁVEL QUANTITATIVA CONTÍNUA. Exemplo: Altura de uma planta, medida em 3 cm. Dentro do intervalo entre o menor e o maior valor dessa variável, podem ocorrer infinitos valores. Uma variável que só pode assumir determinados valores em um intervalo, ou seja, um número finito (enumerável) de valores em um intervalo recebe o nome de VARIÁVEL QUANTITATIVA DISCRETA. Exemplo: Número de filhotes nascidos por ninhada em uma espécie de raposa. Dentro de um intervalo limitado pelo número máximo obtido na espécie há um número finito de valores. Neste intervalo somente existiriam números inteiros, nunca valores como 2,5 ou 3,76 filhotes nascidos por ninhada. Número de leucócitos/mm3 de sangue Número de ovos/ave/ano Observação: Valores observados de variáveis quantitativas discretas são geralmente inteiros consecutivos, mas há casos em que isso não se verifica. Exemplo: a relação do número de asas para o número de pernas dos insetos é uma variável quantitativa discreta que pode ter somente o valor de 0,3333 ou 0,6666, considerando 6 4 , 6 2 , 6 0 . Elementos de matemática Somatórios Os procedimentos e as fórmulas usadas em estatística têm sua descrição simplificada pelo uso do simbolismo matemático. Quando os dados consistem de medições de algum atributo em um certo número de indivíduos ou itens, como o peso de leitões, o atributo de interesse, consideradouma variável, é designado por uma letra maiúscula (geralmente as últimas do alfabeto: X, Y e Z). Para diferenciar as medições dos valores específicos da variável, utiliza-se a letra minúscula correspondente com um índice. Assim, por exemplo, x1 designa o peso do primeiro leitão colocado na balança (x1=23 kg); x2 é o peso do segundo (x2=18 kg); e assim por diante. Em geral, um valor qualquer observado é representado por xi, em que o índice i representa o número de ordem da observação. Quando há n observações no grupo, i será igual a 1,2,3,...,n. Dado um grupo de n observações, x1, x2. x3. ... xn, a sua soma é representada por: n n i i xxxxx ...32 1 1 Em que se lê: “somatória de X índice i, de 1 a n”. Em que o somatório (letra grega sigma maiúscula) indica a operação de somar e i é o índice do somatório o qual deverá abranger as observações 1 a n. Quando não há dúvida que o somatório deverá abranger todos os dados numéricos do grupo, a notação do somatório poderá ser simplificada para: ix Propriedades do somatório: (a) Sendo c uma constante: cnc n i 1 (b) Sendo c uma constante e X uma variável: ii xcxc )( (c) Sendo X e Y duas variáveis: iiii yxyx )( Exemplo: Sejam x1=2, x2=4, x3=3 e x4=1. Para indicar que estes valores devem ser somados escrevemos: xi . É fácil ver que, neste caso, xi = 2+4+3+1 = 10. Em estatística, muitas vezes é necessário obter o quadrado da soma das observações xi. Esta operação é indicada por: 2321 2 )...( ni xxxxx 4 Exemplo: Sejam x1=3, x2=4, x3=1, x4=2 e x5=3. É fácil verificar que: (xi) 2 = (3+4+1+2+3) 2 = 13 2 = 169. O quadrado da soma das observações é diferente da soma dos quadrados das observações. A soma dos quadrados de n observações é dada por: 22 3 2 2 2 1 2 ... ni xxxxx Exemplo: Para indicar a soma dos quadrados desses números escrevemos: xi 2 = 3 2 +4 2 +1 2 +2 2 +3 2 = 9+16+1+4+9 = 39. Quando c é uma constante, a diferença (Xi-c) representa o desvio de uma observação qualquer i do grupo em relação a essa constante. A soma dos quadrados dos desvios é representada por: 22 3 2 2 2 1 2 )(...)()()()( cxcxcxcxcx ni Na operação anterior reconhecemos as seguintes etapas: (a) Subtração da constante c de cada X; (b) Elevação ao quadrado de cada diferença obtida em (a); (c) Soma de quadrados obtida em (b). A soma dos quadrados dos desvios, em que a constante c é a média )(x dos dados em análise, é uma das operações fundamentais em estatística. Tal a sua importância que a expressão 2 )( x i x é denominada simplesmente Soma dos Quadrados, com símbolo SQ. Exemplo: Sejam x1=2; x2=7; x3=3. A soma dos quadrados é calculada como segue: (a) Cálculo da constante c: (c, no caso, é a média das observações) 4 3 372 x (b) Subtração da média de cada observação Xi: 2222 )43()47()42()( xxi 2222 )1()3()2()( xxi (c) Elevação ao quadrado de cada uma das observações obtidas: 194)( 2xxi (d) Soma dos quadrados obtidos: 14)( 2xxi Supondo que existam dois conjuntos de observações, isto é, o conjunto x1; x2; x3; ...; xn, e o conjunto y1; y2; y3; ...; yn. Pode haver interesse em obter a Soma dos Produtos x1y1; x2y2; x3y3; ...; xnyn. Esta soma é indicada como segue: nnii yxyxyxyxyx ...332211 Exemplo: Sejam x1=2; x2=3; x3=0 e y1=1; y2=2;y3=5. A soma dos produtos é: 8502312 ii yx OBSERVAÇÕES: iiii yxyx )( 2 2 ii xx Aproximação de valores numéricos ou arredondamento de dados A definição de uma regra para o arredondamento de dados é essencialmente valiosa para reduzir ao mínimo os erros acumulados por aproximação, quando se tratar de um grande número de operações. O resultado da aproximação de um número como 72,8, para o inteiro mais próximo, é 73, posto que 72,8 é mais próximo de 73 do que de 72. Semelhante seria 72,8146 aproximado para o centésimo mais próximo é 72,81, porque 72,8146 é mais próximo de 72,81 do que de 72,82. Ao aproximar 72,465 para o centésimo mais próximo, entretanto, deparamo-nos com um dilema, pois 72,465 dista igualmente de 72,46 e de 72,47. Usa-se, na prática, em tais casos, aproximar para o número par entre os dois igualmente distantes. Assim, o número 72,465 é aproximado para 72,46 5 e o número 183,575 é aproximado para 183,58. Pode-se citar a regra como: quando o número que antecede o cinco é par mantém-se o número. Quando é ímpar eleva-se o valor anterior para o próximo número par. Exemplo: Para somar os números 4,35; 8,65; 2,95; 12,45; 6,65; 7,55 e 9,75, pode-se fazê-lo: (a) diretamente; (b) aproximando para décimos de acordo com a convenção do número par; (c) aproximando de maneira que o algarismo anterior a 5 aumente uma unidade; (d) Aproximando para décimos simplesmente eliminando o algarismo 5. a b c d 4,35 4,4 4,4 4,3 8,65 8,6 8,7 8,6 2,95 3,0 3,0 2,9 12,45 12,4 12,5 12,4 6,65 6,6 6,7 6,6 7,55 7,6 7,6 7,5 9,75 9,8 9,8 9,7 Total 52,35 52,4 52,7 52,0 Conclusão: entre os processos de arredondamento (b), (c) e (d), o (b) é o melhor, visto que é o método que reduz ao mínimo os erros acumulados pela aproximação. Exercício: (1) A amostra de dados de peso ao nascer e ao desmame de 15 animais foram colhidas aleatoriamente a partir de um rebanho de bovinos de corte. Peso ao Nascer (X) Peso ao desmame (Y) 34 225 30 244 33 218 35 283 40 225 43 303 32 171 28 215 28 229 32 256 30 261 36 268 32 251 31 250 32 274 Obter: (a) Somatório de X e de Y; (b) Quadrado da soma das observações de X e de Y; (c) Soma de Quadrados das observações de X e de Y; (d) Soma dos desvios em relação à média aritmética simples de X e de Y; (e) Soma dos quadrados dos desvios em relação à média aritmética simples de X e de Y; (f) Soma dos produtos de X e Y. Respostas: (a) 496 15 1 i ix e 3673 15 1 i iy (b) 246016 2 15 1 i ix e 13490929 2 15 1 i iy (c) 16640 15 1 2 i ix e 914173 15 1 2 i iy (d) 0)( 15 1 xx i i e 0)( 15 1 yy i i (e) 93,238)( 2 15 1 xx i i e 73,14777)( 2 15 1 yy i i (f) 122222 15 1 i i i yx Observação: n 1i n 1i 2 i 2 i 2 i )mˆxmˆ2x()mˆx(SQ n 1i 2 n 1i i 2 i mˆnxmˆ2x 6 n 1i 2 2 n 1i in 1i i n 1i i 2 i n )x( nx n x 2x n 1i 2n 1i i 2 n 1i i 2 i n )x( n )x( 2x n 1i 2 n 1i i 2 i n )x( x 7
Compartilhar