Buscar

INTRODUÇÃO+À+ANÁLISE+COMPARATIVA+DE+DADOS+QUANTITATIVOS+-+ENG_AMB

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

2013
	
	PUC-CAMPINAS
Prof. Dr. Douglas D’Alessandro Salgado
	[Análise comparativa de dados quantitativos]
	 Cálculos e aplicações do uso de medidas de locação e de variabilidade para elaboração de Análise Exploratória para comparação de dados quantitativos. 
�
Sumário
21.	Situação – Problema: exercício a ser resolvido	�
32.	Teoria Aplicada ao Problema	�
32.1.	Descrição dos cálculos das Medidas de Locação	�
72.2.	Descrição dos Cálculos das Medidas de Variabilidade	�
103.	Resolução Comentada	�
124.	Tarefas	�
�
�
Situação – Problema: exercício a ser resolvido
Objetivo: elaborar análise comparativa de germinação de sementes submetidas a dois tipos de tratamentos do solo.
Contexto: Foi elaborado um experimento para comparar dois tipos de substratos, que irão compor um adubo para enriquecimento do solo. O objetivo é saber se existe diferença entre o efeito dos diferentes substratos sobre a germinação das sementes.
Descrição do experimento: Cinco caixotes de terra, com 100 sementes cada, receberam um adubo com substrato A e outros cinco caixotes, com o mesmo tipo de terra, com 100 sementes cada, receberam adubo com o substrato B. No fim de um período específico, foi computado o número de sementes germinadas e automaticamente convertido em percentual de germinação, por caixa.
Na Tabela 1 podem ser conferidos os percentuais de germinação para cada caixote de terra submetido aos substratos.
Tabela 1. Percentual de germinação para os diferentes substratos.
	Substratos
	Percentual de germinação (%)
	A
	4
	A
	5
	A
	4
	A
	3
	A
	4
	B
	4
	B
	4
	B
	2
	B
	2
	B
	3
Com base nessa pesquisa, pergunta-se:
Qual substrato fornece o maior nível geral de germinação?
Qual substrato fornece maior estabilidade (ou homogeneidade) de germinação? 
Teoria Aplicada ao Problema
As estatísticas denominadas de Medidas de Locação são estimativas que apontam a tendência e nível geral dos dados. As Medidas de Locação mais comuns são: a média aritmética ( QUOTE ��) a mediana (), a moda (Mo), valor mínimo (Min), 1° Quartil (Q1), o 3° Quartil (Q3) e valor máximo (Max).
As estatísticas denominadas de Medidas de Variabilidade são estimativas que apontam instabilidade, variação, dispersão, volatilidade, ou heterogeneidade dos dados e também medem imprecisão nas estimativas de Locação, como é o caso do Erro Padrão (EP) que quantifica a imprecisão da média aritmética amostral (. As Medidas de Variabilidade mais comuns são: Amplitude total (AT), Amplitude Interquartil (AIQ), Variância (S2), Desvio Padrão (S) e Coeficiente de Variação (CV%) e Erro Padrão (EP).
A seguir são comentados como se resolvem os cálculos, exemplificando-os com os dados dos percentuais de germinação do Substrato “A”.
Descrição dos cálculos das Medidas de Locação
Média aritmética (
Somam-se os dados e divide-se a soma pelo número de dados somados, Isto é,
Mediana ()
É o valor que deixa aproximadamente 50% dos dados abaixo dela, quando os dados estão ordenados. Isto é, a chance de se encontrar algum dado menor ou igual a ela corresponde a 50% (aproximadamente).
Cálculo para obtenção da Mediana
Primeiramente ordenam-se os dados, em ordem crescente, e toma-se o valor que estiver no meio dos dados ordenados. No caso de número de dados par (n par), a mediana estará entre os dois valores centrais (sendo o ponto médio entre eles).
Para facilitar a obtenção do dado central, utiliza-se a posição ordenada dos dados (j), sendo j = 1°,2°,3°,..., n°. Defini-se a posição em que se encontra a mediana como
 :
Se for exato (inteiro), isto ocorre quando n é ímpar, então simplesmente consideramos a mediana como sendo o dado correspondente à posição central (ou seja, na exata posição );
Se não for exato (não inteiro), isto ocorre quando n é par, então se arredonda (tornando-o numero inteiro) para cima e para baixo, encontrando duas posições centrais. Daí se calcula a média dos dois dados correspondentes às posições centrais.
Em outras palavras, quando n é par, a mediana passa a ser média dos dois correspondentes dados (dois dados centrais), obtidos de arredondado para cima e para baixo.
Moda (Mo)
Valor ou atributo que mais se repete, isto é, o de maior frequência. Se houver dois valores que mais se repetirem denominamos a variável de bimodal; se houver mais de dois, de multimodal;
Mínimo (Min)
 É o dado de menor magnitude (menor valor). Isto é, o primeiro valor encontrado quando se organizam os dados em ordem crescente.
1° Quartil (Q1)
É o valor que deixa aproximadamente 25% dos dados abaixo dele, quando os dados estão ordenados. Isto é, a chance de se encontrar algum dado menor ou igual a ele corresponde a 25% (aproximadamente).
Cálculo para obtenção do 1° Quartil
Primeiramente ordenam-se os dados, em ordem crescente, e toma-se o valor que estiver no meio da primeira metade dos dados ordenados. Isto é, Q1 corresponde ao valor que delimita o primeiro quarto dos dados ordenados.
Para facilitar a obtenção do Q1, utiliza-se a posição ordenada dos dados (j), sendo j = 1°,2°,3°,..., n°. Defini-se a posição em que se encontra o Q1 como:
 :
Se for exato (inteiro), então simplesmente consideramos Q1 como sendo o dado correspondente na posição ;
Se não for exato (não inteiro), então se calcula a interpolação para encontrar o valor de Q1 correspondente à posição . Exemplo, se o valor de for 1,75, então o valor de Q3 será o 1° dado somado a 75% da distância dele para o 2° dado.
3° Quartil (Q3)
É o valor que deixa aproximadamente 75% dos dados abaixo dele, quando os dados estão ordenados. Isto é, a chance de se encontrar algum dado menor ou igual a ele corresponde a 75% (aproximadamente).
Cálculo para obtenção do 3° Quartil
Primeiramente ordenam-se os dados, em ordem crescente, e toma-se o valor que estiver no meio da primeira metade dos dados ordenados. Isto é, Q3 corresponde ao valor que delimita o terceiro quarto dos dados ordenados.
Para facilitar a obtenção do Q3, utiliza-se a posição ordenada dos dados (j), sendo j = 1°,2°,3°,..., n°. Defini-se a posição em que se encontra o Q3 como:
 :
Se for exato (inteiro), então simplesmente consideramos Q3 como sendo o dado correspondente na posição ;
Se não for exato (não inteiro), então se calcula a interpolação para encontrar o valor de Q3 correspondente à posição . Exemplo, se o valor de for 5,25, então o valor de Q3 será o 5° dado somado a 25% da distância dele para o 6° dado (somente com os dados ordenados).
Máximo (Max)
É o dado de maior magnitude (maior valor). Isto é, o ultimo valor encontrado quando se organizam os dados em ordem crescente.
�
Descrição dos Cálculos das Medidas de Variabilidade
Amplitude Total (AT)
É a subtração entre o máximo e o mínimo. Isto é, 
AT =Max – Min. 
Assim temos, para os percentuais de germinação do Substrato “A” a seguinte amplitude total: AT=5 - 3, logo, AT =2
Amplitude Interquartil
É a subtração entre o 3º quartil e 1º quartil. Isto é, 
AIQ =Q3 – Q1. 
Assim temos, para os percentuais de germinação do Substrato “A” a seguinte amplitude interquartil: AIQ=5 - 3, logo, AIQ =2
Variância (S2)
Possui uma fórmula elaborada que pode ser descrita de várias maneiras. A mais tradicional é , mas a preferência para elaborarmos cálculos à mão é a seguinte: , sendo que os xi correspondem aos dados coletados; n corresponde ao tamanho da amostra número ou de dados e corresponde à média aritmética calculada.
Para facilitar entendimento do cálculo feito à mão (com ou sem auxílio de uma calculadora), utiliza-se uma tabela auxiliar muito simples. Essa tabela possui apenas duas colunas: uma com os dados originais e outra com cada valor elevado ao quadrado. Para exemplificar serão utilizados os dados dos percentuais de germinação das sementes submetidas ao Substrato A. Veja como é simples:
�
Tabela2. Tabela auxiliar de cálculo de Variância do Substrato“A”
	xi (dados de % de germinação referentes ao Substrato “A”)
	xi2 (quadrado do % de germinação referentes ao Substrato “A”)
	4
	16 (=42)
	5
	25 (=52)
	4
	16 (=42)
	3
	9 (=32)
	4
	16 (=42)
	
	Soma dos quadrados: 
Note que o valor (82) corresponde à parte mais difícil da fórmula apresentada, . Agora basta calcular a parte mais fácil: eleva-se o valor da média ao quadrado () e multiplica-se por “n” (tamanho da amostra =5). Assim, temos 5x16 = 80. Agora é obtido:
S2= [(82)-(80)] /(5-1). Logo, S2= 2/4, isto é, S2= 0,5 .
Ou seja, a Variância (S2) dos percentuais de germinação das sementes submetidas ao Substrato A, é 0,5 (S2= 0,5).
Desvio Padrão (S)
É raiz quadrada da variância S = , logo para calculá-lo basta aplicar a raiz quadrada do resultado obtido do cálculo da Variância. Assim, o cálculo do Desvio Padrão (S) dos percentuais de germinação provenientes do Substrato A é S = , ou seja, S =0,71.
Coeficiente de Variação (CV %)
Logo, temos CV% = (100x0,71)/4, ou seja CV% = 17,5%.
Erro Padrão (EP)
Mede o grau de imprecisão da média amostral, isto é de como ela pode variar.
�
Resolução Comentada
Calculado as medidas estatísticas de Locação e de Variabilidade para os percentuais de germinação, os resultados são organizados em uma tabela (Tabela 2) que permite facilitar a Análise Estatística de Comparação. Seguem, na Tabela 1, os resultados organizados para a comparação dos percentuais de germinação de sementes submetidas aos substratos A e B.
Tabela 2. Comparação de Medidas Estatísticas dos percentuais de germinação entre os Substratos (A e B)
	Tipos de Medidas
	Medidas
	Substrato A
	Substrato B
	Medidas de Locação
(ou de Posição)
	Média ()
	4,0
	3,0
	
	Mediana ()
	4,0
	3,0
	
	Moda (Mo)
	4,0
	2 e 4
	
	Mínimo (Min)
	3,0
	2,0
	
	1° Quartil (Q1)
	3,5
	2,0
	
	3° Quartil (Q3)
	4,5
	4,0
	
	Máximo (Max)
	5
	4
	Medidas de
Variabilidade
(ou de Dispersão)
	Amplitude Total (AT)
	2
	2
	
	Amplitude Interquartil (AIQ)
	1,0
	2,0
	
	Variância (S2)
	0,50
	1,0
	
	Desvio Padrão (S)
	0,71
	1,0
	
	Coeficiente de Variação (%)
	17,5%
	33,3%
	
	Erro Padrão (EP)
	0,316
	0,447
Interpretação:
Quanto à locação: o nível geral de percentual de germinação das sementes submetidas ao Substrato A é maior que o das sementes submetidas ao Substrato B, pois as Medidas de Locação do percentual de germinação são, na maioria, maiores que as do Substrato B. 
Quanto à Variabilidade: os percentuais de germinação de sementes submetidas ao Substrato A também tendem a ser mais homogêneos que os das sementes submetidas ao Substrato B, pois a maioria das Medidas de Variabilidade do percentual de germinação é menor, quando comparada com aquelas referentes ao Substrato B.
Figura 1. Comparação da distribuição do percentual de germinação por meio de boxplots. 
Figura 2. Comparação da Distribuição do percentual de germinação por meio do histograma.
Tarefas
Para responder as perguntas, refaçam a solução por meio da análise de comparação, em etapas: 
Refaçam todos os cálculos, confiram os resultados e organize-os em uma tabela igual ou similar à Tabela 2 apresentada;
Com base nas estatísticas refaça os Boxplots para comparação.
Respondam as questões e justifiquem-nas com base nas estatísticas calculadas (medidas de locação e de variabilidade).
			� PAGE \* MERGEFORMAT �1�
_1426074254
_1426074255

Outros materiais