Buscar

INTRODUÇÃO À ESTATÍSTICA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
UNIVERSIDADE FEDERAL DA BAHIA 
ESCOLA DE MEDICINA VETERINÁRIA E ZOOTECNIA 
DEPARTAMENTO DE MEDICINA VETERINÁRIA PREVENTIVA E PRODUÇÃO ANIMAL 
 
 
 
 
 
Entende-se por Estatística: 
(a) Parte da matemática em que se investigam os processos de obtenção, organização e análise de 
dados sobre uma população ou sobre uma coleção de seres quaisquer e os métodos de tirar 
conclusões e fazer predições com base nesses dados; 
(b) Conjunto de elementos numéricos relacionados a um fato social. 
Exemplo: 
O IBGE (Instituto Brasileiro de Geografia e Estatística) publica no Anuário Estatístico do Brasil 
informações referentes a Unidades de Conservação da Natureza, com indicação da área total e dos 
municípios por região, ou ainda com relação a Terras indígenas, área total, população indígena 
estimada, etc. 
(c) Método que objetiva o estudo dos fenômenos de massa, ou seja, os que dependem de uma 
multiplicidade de causas, e tem por fim representar, sob forma analítica ou gráfica, as tendências 
características limites desses fenômenos. 
A Bioestatística é a estatística aplicada às ciências da vida. 
 
ESTATÍSTICA DESCRITIVA: Descrição, análise e representação de um conjunto de dados, 
utilizando métodos numéricos e gráficos. 
 
INFERÊNCIA ESTATÍSTICA: Estabelece métodos que permitem conclusões sobre a população, a 
partir de uma amostra representativa desta população. 
 
POPULAÇÃO: 
 Conjunto de elementos que têm em comum uma determinada característica. 
 Número total de indivíduos de uma espécie, raça ou linhagem com alguma característica em 
comum, em uma determinada área. 
 
AMOSTRA: Subconjunto não vazio e com menor número de elementos do que o conjunto definido 
como população. 
 
CENSO: Coleção de dados relativos a todos os elementos de uma população. Se a população é 
grande, o trabalho do censo torna-se exaustivo e oneroso. Na prática, trabalha-se com uma parte da 
população (amostra). 
A INFERÊNCIA ESTATÍSTICA possibilita a tomada de decisões sobre a população com base na 
amostra, isto é, em uma situação em que existe incerteza e variação. As conclusões geradas podem 
ser igualmente ou mais confiáveis e mais amplas do que as permitidas com os resultados do censo. 
Isto se consegue em função da quantidade e da qualidade das informações obtidas com os 
LEVANTAMENTOS POR AMOSTRAGEM. As afirmações que resultam da avaliação científica 
são apenas inferências. 
O investigador estabelece o que deve acontecer na população, com base apenas na amostra, diante 
da impossibilidade prática de observar todos os casos possíveis. 
Como as inferências são baseadas em um número limitado de observações, estas vêm sempre 
acompanhadas de alguma incerteza (ou seja, há sempre a possibilidade de ocorrer variação 
aleatória) e a sua aceitabilidade é dada por um valor expresso em termos probabilísticos. 
 
A estatística tem por objetivo medir, em termos probabilísticos, a incerteza ou a certeza de uma 
inferência, ou seja, a probabilidade de erro ou de acerto. Por meio de testes estatísticos é possível 
 2 
rejeitar ou não uma hipótese formulada temporariamente sobre um determinado assunto. Mas não é 
possível provar com certeza essa hipótese. 
A estatística se restringe a indicar a probabilidade de ocorrência de um evento ou de uma hipótese 
estar certa ou errada, ou seja, a probabilidade em que se pode confiar nas conclusões feitas. 
 
DADOS 
Registros de medidas, contagens ou observações. Exemplos de dados são os valores de peso 
corporal, altura, sexo do indivíduo e cor de pelagem. Os dados são os valores atribuídos à variável. 
 
VARIÁVEL 
 Elemento genérico que representa o conjunto de resultados possíveis de um fenômeno ou 
característica. 
 Função que associa valores aos resultados de um fenômeno. 
A expressão variável indica que as medidas ou observações podem ser diferentes, ou seja, exibem 
variabilidade. 
Exemplo: 
(a) Para o fenômeno "sexo do animal nascido" há dois resultados possíveis: macho e fêmea. 
(b) Para o fenômeno "número de filhotes nascidos por ninhada em uma espécie", há um número de 
resultados possíveis expressos por valores numéricos: 0, 1, 2, 3, 4, 5, 6, ..., n; sendo n o número 
máximo de filhotes por ninhada. 
(c) Para o fenômeno “peso do animal ao nascimento” há um número infinito de resultados possíveis 
expressos por valores numéricos, dentro de um intervalo definido pelo menor e pelo maior valor de 
peso ao nascimento de uma espécie. 
 
TIPOS DE VARIÁVEIS 
(1) QUALITATIVA: quando seus valores são expressos por atributos, classes, tipo (por exemplo, 
sexo: macho ou fêmea; pelagem: preta e branca ou vermelha e branca, estado: vivo ou morto). 
A variável qualitativa pode ser: 
(a) Nominal é aquela para a qual não existe ordenação alguma das possíveis realizações. Classes ou 
símbolos, não ordenados, são utilizados para identificar os grupos a que as observações pertencem. 
Exemplos: 
Sexo, grupo sangüíneo, cor da pelagem, cor dos olhos (azul ou castanho), opinião sobre 
determinado assunto, religião. 
As classes são expressas nominalmente. As classes devem ser exaustivas (qualquer dado será 
enquadrado em uma das classes) e mutuamente exclusivas (cada dado será elemento de uma única 
classe). 
 
(b) Ordinal é aquela para a qual existe certa ordem nos possíveis resultados. 
Exemplos: 
Estágio de uma doença; Classificação de indivíduos segundo seu grau de escolaridade (analfabeto, 
Ensino Fundamental, Ensino Médio, Ensino Superior). Propriedades rurais podem ser classificadas 
pelo tamanho ou nível de produção. 
Para variáveis clínicas histológicas, anatômicas e patológicas, é comum a classificação 0, +, ++ e 
+++. Nesse caso, cada classe deve ser caracterizada de forma bem clara e objetiva. Outros 
pesquisadores devem ser capazes de fazer a mesma analogia. Variáveis biológicas podem ser 
representadas por valores numéricos, porém devem ser evitadas operações aritméticas para estas 
quantidades. Exemplo: níveis de dor, em escala de um a cinco. 
 
(2) QUANTITATIVA: quando seus valores são expressos por números e que permitem realizar 
operações aritméticas (ex. peso, idade, número de ovos, tamanho da leitegada, etc.). 
Uma variável quantitativa que pode, teoricamente, ter qualquer valor entre dois limites recebe o 
nome de VARIÁVEL QUANTITATIVA CONTÍNUA. Exemplo: Altura de uma planta, medida em 
 3 
cm. Dentro do intervalo entre o menor e o maior valor dessa variável, podem ocorrer infinitos 
valores. 
Uma variável que só pode assumir determinados valores em um intervalo, ou seja, um número 
finito (enumerável) de valores em um intervalo recebe o nome de VARIÁVEL QUANTITATIVA 
DISCRETA. Exemplo: 
 Número de filhotes nascidos por ninhada em uma espécie de raposa. Dentro de um intervalo 
limitado pelo número máximo obtido na espécie há um número finito de valores. Neste intervalo 
somente existiriam números inteiros, nunca valores como 2,5 ou 3,76 filhotes nascidos por ninhada. 
 Número de leucócitos/mm3 de sangue 
 Número de ovos/ave/ano 
Observação: Valores observados de variáveis quantitativas discretas são geralmente inteiros 
consecutivos, mas há casos em que isso não se verifica. Exemplo: a relação do número de asas para 
o número de pernas dos insetos é uma variável quantitativa discreta que pode ter somente o valor de 
0,3333 ou 0,6666, considerando 






6
4
,
6
2
,
6
0
. 
 
Elementos de matemática 
Somatórios 
Os procedimentos e as fórmulas usadas em estatística têm sua descrição simplificada pelo uso do 
simbolismo matemático. Quando os dados consistem de medições de algum atributo em um certo 
número de indivíduos ou itens, como o peso de leitões, o atributo de interesse, consideradouma 
variável, é designado por uma letra maiúscula (geralmente as últimas do alfabeto: X, Y e Z). Para 
diferenciar as medições dos valores específicos da variável, utiliza-se a letra minúscula 
correspondente com um índice. Assim, por exemplo, x1 designa o peso do primeiro leitão colocado 
na balança (x1=23 kg); x2 é o peso do segundo (x2=18 kg); e assim por diante. 
Em geral, um valor qualquer observado é representado por xi, em que o índice i representa o 
número de ordem da observação. Quando há n observações no grupo, i será igual a 1,2,3,...,n. 
Dado um grupo de n observações, x1, x2. x3. ... xn, a sua soma é representada por: 
n
n
i
i xxxxx 

...32
1
1
 
Em que se lê: “somatória de X índice i, de 1 a n”. Em que o somatório  (letra grega sigma 
maiúscula) indica a operação de somar e i é o índice do somatório o qual deverá abranger as 
observações 1 a n. 
Quando não há dúvida que o somatório deverá abranger todos os dados numéricos do grupo, a 
notação do somatório poderá ser simplificada para: 
 ix
 
Propriedades do somatório: 
(a) Sendo c uma constante: 
cnc
n
i

1
 
(b) Sendo c uma constante e X uma variável: 
  ii xcxc )(
 
(c) Sendo X e Y duas variáveis: 
   iiii yxyx )(
 
 
Exemplo: Sejam x1=2, x2=4, x3=3 e x4=1. Para indicar que estes valores devem ser somados 
escrevemos: xi . É fácil ver que, neste caso, xi = 2+4+3+1 = 10. 
Em estatística, muitas vezes é necessário obter o quadrado da soma das observações xi. Esta 
operação é indicada por: 
  2321
2
)...( ni xxxxx 
 
 4 
Exemplo: Sejam x1=3, x2=4, x3=1, x4=2 e x5=3. É fácil verificar que: 
(xi)
2
 = (3+4+1+2+3)
2
 = 13
2
 = 169. 
O quadrado da soma das observações é diferente da soma dos quadrados das observações. A soma 
dos quadrados de n observações é dada por: 
22
3
2
2
2
1
2 ... ni xxxxx 
 
Exemplo: Para indicar a soma dos quadrados desses números escrevemos: xi
2
 = 3
2
+4
2
+1
2
+2
2
+3
2
 = 
9+16+1+4+9 = 39. 
Quando c é uma constante, a diferença (Xi-c) representa o desvio de uma observação qualquer i do 
grupo em relação a essa constante. 
A soma dos quadrados dos desvios é representada por: 
22
3
2
2
2
1
2 )(...)()()()( cxcxcxcxcx ni 
 
Na operação anterior reconhecemos as seguintes etapas: 
(a) Subtração da constante c de cada X; (b) Elevação ao quadrado de cada diferença obtida em (a); 
(c) Soma de quadrados obtida em (b). 
A soma dos quadrados dos desvios, em que a constante c é a média 
)(x
 dos dados em análise, é uma 
das operações fundamentais em estatística. Tal a sua importância que a expressão 
2
)( x
i
x
 é 
denominada simplesmente Soma dos Quadrados, com símbolo SQ. Exemplo: Sejam x1=2; x2=7; 
x3=3. A soma dos quadrados é calculada como segue: 
(a) Cálculo da constante c: (c, no caso, é a média das observações) 
4
3
372


x
 
(b) Subtração da média de cada observação Xi: 
2222 )43()47()42()(  xxi
 
2222 )1()3()2()(  xxi
 
(c) Elevação ao quadrado de cada uma das observações obtidas: 
  194)( 2xxi
 
(d) Soma dos quadrados obtidos: 
  14)( 2xxi
 
Supondo que existam dois conjuntos de observações, isto é, o conjunto x1; x2; x3; ...; xn, e o 
conjunto y1; y2; y3; ...; yn. Pode haver interesse em obter a Soma dos Produtos x1y1; x2y2; x3y3; ...; 
xnyn. Esta soma é indicada como segue: 
nnii yxyxyxyxyx  ...332211
 
Exemplo: Sejam x1=2; x2=3; x3=0 e y1=1; y2=2;y3=5. A soma dos produtos é: 
8502312  ii yx
 
OBSERVAÇÕES: 
   iiii yxyx )(
 
    2
2
ii xx
 
Aproximação de valores numéricos ou arredondamento de dados 
A definição de uma regra para o arredondamento de dados é essencialmente valiosa para reduzir ao 
mínimo os erros acumulados por aproximação, quando se tratar de um grande número de 
operações. O resultado da aproximação de um número como 72,8, para o inteiro mais próximo, é 
73, posto que 72,8 é mais próximo de 73 do que de 72. Semelhante seria 72,8146 aproximado para 
o centésimo mais próximo é 72,81, porque 72,8146 é mais próximo de 72,81 do que de 72,82. 
Ao aproximar 72,465 para o centésimo mais próximo, entretanto, deparamo-nos com um dilema, 
pois 72,465 dista igualmente de 72,46 e de 72,47. Usa-se, na prática, em tais casos, aproximar para 
o número par entre os dois igualmente distantes. Assim, o número 72,465 é aproximado para 72,46 
 5 
e o número 183,575 é aproximado para 183,58. Pode-se citar a regra como: quando o número que 
antecede o cinco é par mantém-se o número. Quando é ímpar eleva-se o valor anterior para o 
próximo número par. 
Exemplo: Para somar os números 4,35; 8,65; 2,95; 12,45; 6,65; 7,55 e 9,75, pode-se fazê-lo: 
(a) diretamente; (b) aproximando para décimos de acordo com a convenção do número par; 
(c) aproximando de maneira que o algarismo anterior a 5 aumente uma unidade; (d) Aproximando 
para décimos simplesmente eliminando o algarismo 5. 
 
 a b c d 
 4,35 4,4 4,4 4,3 
 8,65 8,6 8,7 8,6 
 2,95 3,0 3,0 2,9 
 12,45 12,4 12,5 12,4 
 6,65 6,6 6,7 6,6 
 7,55 7,6 7,6 7,5 
 9,75 9,8 9,8 9,7 
Total 52,35 52,4 52,7 52,0 
Conclusão: entre os processos de arredondamento (b), (c) e (d), o (b) é o melhor, visto que é o 
método que reduz ao mínimo os erros acumulados pela aproximação. 
Exercício: (1) A amostra de dados de peso ao nascer e ao desmame de 15 animais foram colhidas 
aleatoriamente a partir de um rebanho de bovinos de corte. 
Peso ao Nascer (X) Peso ao desmame (Y) 
34 225 
30 244 
33 218 
35 283 
40 225 
43 303 
32 171 
28 215 
28 229 
32 256 
30 261 
36 268 
32 251 
31 250 
32 274 
Obter: (a) Somatório de X e de Y; (b) Quadrado da soma das observações de X e de Y; (c) Soma de 
Quadrados das observações de X e de Y; (d) Soma dos desvios em relação à média aritmética 
simples de X e de Y; (e) Soma dos quadrados dos desvios em relação à média aritmética simples de 
X e de Y; (f) Soma dos produtos de X e Y. 
Respostas: (a) 
496
15
1

i
ix
 e 
3673
15
1

i
iy
 (b) 
246016
2
15
1







i
ix
 e 
13490929
2
15
1







i
iy
 
 (c) 
16640
15
1
2 
i
ix
 e 
914173
15
1
2 
i
iy
 (d) 
0)(
15
1


xx
i
i
 e 
0)(
15
1


yy
i
i
 
 (e) 
93,238)( 2
15
1


xx
i
i
 e 
73,14777)( 2
15
1


yy
i
i
 (f) 
122222
15
1


i
i
i yx
 
Observação: 
 
 

n
1i
n
1i
2
i
2
i
2
i
)mˆxmˆ2x()mˆx(SQ
  
 
 

n
1i
2
n
1i
i
2
i
mˆnxmˆ2x
 
 6 







 
n
1i
2
2
n
1i
in
1i
i
n
1i
i
2
i
n
)x(
nx
n
x
2x
 



 
n
1i
2n
1i
i
2
n
1i
i
2
i
n
)x(
n
)x(
2x
  




n
1i
2
n
1i
i
2
i
n
)x(
x
 7

Outros materiais