Buscar

MÉTODOS QUANTITATIVOS 2015

Prévia do material em texto

MÉTODOS QUANTITATIVOS 
Olá pessoal! 
Durante este módulo B 2015, pudemos estudar que o emprego de técnicas de estatística e 
probabilidade, para análise e solução de problemas estão relacionados a diferentes áreas do 
conhecimento. Alguns desses métodos, utilizados tanto na descrição quanto na tomada de 
decisões são, por exemplo: percentual, média, desvio-padrão, coeficiente de correlação, 
análise de regressão, testes de hipóteses, dentre outras. Então vamos verificar alguns 
conceitos! 
Estatística: é um conjunto de métodos ou técnicas que nos auxilia a compreender e investigar 
uma ampla coleção de dados. 
 
População: é um grupo de todos os elementos em que existe o interesse de analisar um ou 
mais aspectos. 
 
Amostra: é um subconjunto ou subgrupo dos elementos que formam a população. 
 
Estatística Descritiva: é sintetizar as características mais relevantes de um conjunto de 
dados. 
 
Estatística Inferencial: utiliza-se de dados parciais (apenas uma parte de um conjunto de 
todos os dados relacionados com o problema em estudo - amostra) para obter decisões e 
gerar conclusões coerentes. 
 
Segundo Triola (1999), as duas principais classificações de dados: os qualitativos e 
os quantitativos. 
 
Dados Qualitativos: são dados categóricos ou atributos, que podem ser divididos em 
distintas categorias ou atributos diferenciados por alguma característica não numérica, como 
sexo, raça e tipo de defeito de um lote de peças. 
 
Dados Quantitativos: são aqueles formados por números que objetivam representar 
contagens ou medidas, como o peso, a altura e o número de peças, os quais podem sofrer 
operações aritméticas. 
 
No caso de dados quantitativos, uma subdivisão ainda pode ser feita. Os dados 
quantitativos podem ser: Discretos e Contínuos. 
Dados Quantitativos Discretos: são dados compostos por um conjunto finito de valores ou 
de um conjunto contável desses valores. 
Dados Quantitativos Contínuos: compostos de um número infinito de valores imagináveis 
que podem ser relacionados a pontos em uma escala contínua. 
 
Foi em 17 de fevereiro de 2015 que se comemorou o 125º aniversário do nascimento 
daquele que foi para muitos, o maior impulsionador para o grande avanço da Estatística 
Moderna, Ronald Aylmer Fisher (1890-1962). Ao introduzir o conceito de Análise da Variância 
no planeamento de experiências. 
 
A ANOVA (ANalysis Of VAriance): é um método para teste de igualdade de três ou mais 
médias populacionais através da análise das variâncias amostrais. Este método permite 
verificar se um ou mais fatores influenciam ou não na característica de uma determinada 
variável de estudo. 
Os principais pressupostos para se realizar o teste ANOVA são: 
 
 Amostras independentes, ou seja, uma observação não pode ser influenciada pela 
anterior ou pela próxima; 
 Cada grupo de observações devem provir de uma população com distribuição normal; 
 Homogeneidade das variâncias entre os grupos, ou seja, as variâncias dentro de cada 
grupo devem ser pelo menos aproximadamente iguais àquela dentro de todos os 
grupos. 
 
A ideia central do teste ANOVA de um fator, através do teste de igualdade de médias, 
analisar se um determinado fator influencia ou não na característica de uma determinada 
variável dependente. Em outras palavras, a ideia central é testar a hipótese de que três ou 
mais amostras são provenientes de populações com médias iguais. 
 
Os Erros tipo I e II na prática! 
Rejeitar a Hipótese Nula e esta ser verdadeira - Erro Tipo I . 
Aceitar (não rejeitar) a Hipótese Nula e esta ser falsa - Erro Tipo II . 
Ex.: Quando um gerente de recursos humanos decide contratar, ou não, determinado 
profissional 
Poderá ocorrer o Erro tipo II, caso o gerente contrate o profissional. Isto é: contrata e 
o profissional revela-se sem qualidades – aceitar H0 falsa. Por outro lado, quando o 
gerente dispensa (não contrata) determinado profissional, poderá estar cometendo o 
Erro tipo I – rejeitar H0 verdadeira. Isto é: não contrata e o profissional revela-se com 
qualidades, em outro emprego assemelhado. 
 
Testes paramétricos: têm requisitos sobre a natureza ou a forma das populações envolvidas. 
Testes não paramétricos: não exigem que as amostras venham de populações com 
distribuições normais ou qualquer outra distribuição particular. 
 Vantagem do uso de testes não paramétricos consiste em não exigir que as 
populações estejam normalmente distribuídas. 
 Desvantagem é que estes tendem a desperdiçar informação, porque os dados 
numéricos exatos são, em geral, reduzidos a uma forma qualitativa. 
 
A ideia central do teste de independência: verificar se dadas duas varáveis de estudo 
A e B, de uma tabela de contingência, são independentes entre si. Para tanto, utiliza-se como 
ferramenta o teste qui-quadrado para conferir se há ou não a relação de independência entre 
as variáveis de estudo. 
 
O teste de Kruskal-Wallis é um teste não paramétrico que usa postos de amostras 
aleatórias simples de três ou mais populações independentes para testar a hipótese nula de 
que as populações têm a mesma mediana. 
Ao aplicar o teste de Kruskal-Wallis, calcula-se a estatística H, que tem uma 
distribuição que pode ser aproximada pela distribuição qui-quadrado. Ao aplicar a distribuição 
qui-quadrado nesse contexto, o número de graus de liberdade do numerado é (k-1), onde k é 
o número de grupos em análise. 
 
O coeficiente de correlação de Pearson não tem esse nome por acaso. É comum 
atribuir exclusivamente a Karl Pearson o desenvolvimento dessa estatística, no entanto, como 
bem lembrou Stanton (2001), a origem desse coeficiente remonta o trabalho conjunto de Karl 
Pearson e Francis Galton (Stanton, 2001: 01). 
O coeficiente de correlação de Pearson busca quantificar o quão forte é a correlação 
linear entre duas variáveis intervalares. Este coeficiente nada mais é que uma medida 
da correlação linear independente das unidades de medida das variáveis. O 
coeficiente de Pearson oscila entre -1 e +1 ou, dado em porcentagens, entre -100% e 
+100%. Para uma relação linear forte entre as variáveis, mais próximo de seus valores 
extremos, +1 ou -1, se apresentará a medida do coeficiente de correlação r (MARTINS, 
2010). Porém, caso a medida do coeficiente encontrar-se próxima de zero, mais fraco 
é o grau desta relação, tornando-se inexistente para r = 0. Caso r = -1 interpreta-se 
como se existisse uma correlação linear inversa, ou seja, quando o valor de uma 
variável aumenta, o valor de outra diminui (ROSA, 2009). 
 
Um exemplo de correlação entre duas variáveis seria, por exemplo, temperatura e 
tempo de uma reação química, velocidade e deslocamento de uma partícula, preço e 
quantidade de vendas de um determinado produto. 
 
O modelo de regressão linear, segundo Krajewski, Ritzman e Malhotra (2009), é um 
dos modelos causais mais conhecidos e utilizados. 
Segundo Montgomery (2011) “a coleção de ferramentas estatísticas que são usadas 
para modelar e explorar relações entre variáveis que estão relacionadas de maneira 
não determinística é chamado de análise de regressão”. 
O objetivo geral desta técnica é estabelecer uma equação que relacione 
adequadamente o comportamento de uma variável resposta e uma ou mais variáveis 
explicativas, possibilitando realizar a estimativa de valores da variável de resposta. 
Esta equação pode ser linear ou não linear. Quando a reta da regressão é modelada 
segundo uma função linear, a mesma é dita regressão linear simples. 
Um método que pode ser utilizado para determinar a reta da regressão linear simples 
é o método dos mínimos quadrados, o qual, consiste na minimização da distância 
quadrática entre os pontos amostraise os valores da reta da regressão. 
Regressão é o método de análise da relação existente entre duas variáveis: uma 
dependente e uma independente. 
 
Conforme Triola (2013) uma das vantagens dos métodos não paramétricos pode ser 
aplicado a uma grande variedade de situações, porque não possuem as exigências mais 
rígidas dos métodos paramétricos correspondentes. 
Uma das desvantagens dos métodos não paramétricos é que não são tão eficientes quanto 
os testes paramétricos, de modo que, com os testes não paramétricos, precisamos, em geral, 
de evidência mais forte (tais como amostra maior ou diferenças maiores) para rejeitar a 
hipótese nula. 
 
Exercícios de aplicação de Métodos Quantitativos: 
 
a. Calcule a amplitude dos dados abaixo: 
 
33 35 35 39 41 41 42 45 47 48 
50 52 53 54 55 55 57 59 60 60 
61 64 65 65 65 66 66 66 67 68 
69 71 73 73 74 74 76 77 77 78 
80 81 84 85 85 88 89 91 94 97 
 
Solução: 
Amplitude = Maior medida – Menor medida: 
A = 97-33 = 64 
 
b. Calcule a média dos números abaixo: 
 
10 29 26 28 15 23 17 25 0 20 
 
X = 10 + 29 + 26 + 28 +15 + 23 +17 + 25 + 0 + 20 = 193 
X = 193 / 10 
X = 19,3 
 
c. Verifique o número que ocorreu com maior frequência 
7 - 6 - 8 - 7 - 6 - 4 - 5 - 7 - 7 - 8 - 5 - 10 - 6 - 7 - 8 - 5 - 10 - 4 - 6 - 7 - 7 - 9 - 5 - 6 - 8 - 6 - 7 - 10 
- 4 - 6 - 9 - 5 - 8 - 9 - 10 - 7 - 7 - 5 - 9 - 10 
 
O número 7 ocorreu com maior frequência e é denominado de Moda 
 
d. Calcule a mediana dos dados abaixo: 
10 - 7 - 12 - 6 - 10 – 9 
 
1º passo, colocar em ordem crescente: 
6 - 7 - 9 - 10 - 10 - 12. 
 
2º passo, verificar se a quantidade de dados é par ou ímpar; nesse caso é par, então a 
mediana é a média aritmética dos dois valores centrais da série, ou seja: 
6 - 7 - 9 - 10 - 10 - 12 
 
Md = (9 + 10) / 2; 
 
Md = 9,5. 
 
e. Calcule a mediana dos dados abaixo: 
10 - 7 - 12 - 6 - 10 - 9 – 7 
1º passo, colocar em ordem crescente: 
6 - 7 - 7 - 9 - 10 - 10 – 12. 
No 2º passo, verificar se a quantidade de dados é par ou ímpar; nesse caso é ímpar, então a 
mediana é o valor central da série, ou seja: 
6 - 7 - 7 - 9 - 10 - 10 – 12. 
Md = 9. 
f. Calcule o desvio padrão dos dados abaixo: 
8, 4, 6, 9, 10, 5 
 
X= (8 + 4 + 6 + 9 + 10 + 5) / 6 
X = 42/6 
X = 7 
 
Xi Xi - X S2 
4 4 – 7 = - 3 9 
5 5 – 7 = -2 4 
6 6 – 7 = - 1 1 
8 8 – 7 = 1 1 
9 9 – 7 = 2 4 
10 10 – 7 = 3 9 
∑ 0 28 
 
S2 = 28/6-1 = 28/5 
S2 = 5,6 
S = √5,6 
S = 2,36 
 
g. A tabela a seguir apresenta as quantidades, em quilos, contidas em uma amostra de 
40 pacotes de feijão. 
 
0,94 0,94 0,96 0,96 0,97 0,97 0,97 0,98 
0,98 0,98 0,98 0,98 0,98 0,98 0,99 0,99 
0,99 0,99 0,99 1,00 1,01 1,01 1,01 1,01 
1,01 1,02 1,02 1,02 1,02 1,02 1,02 1,02 
1,02 1,03 1,03 1,04 1,04 1,05 1,06 1,06 
Tabela 1 
 
Após realizados os cálculos de amplitude de cada intervalo e da quantidade média de feijões 
 
Classes Freqüência (fi) Ponto Médio 
(Pm) 
XPm  
 
i
fXPm .
2
 
0,94 | 0,96 2 0,95 0,95-1,006 0,006272 
0,96 | 0,98 5 0,97 0,97-1,006 0,00648 
0,98 | 1,00 12 0,99 0,99-1,006 0,003072 
1,00 | 1,02 6 1,01 1,01-1,006 0,000096 
1,02 | 1,04 10 1,03 1,03-1,006 0,00576 
1,04 || 1,06 5 1,05 1,05-1,006 0,00968 
Total: 40 ----- ----- 0,03136 
Tabela 2 
Calcule a variância. 
 
S2 = 0,03136 →   ifXPm .2 (0,03136 dado no exemplo) 
S2 = 0,03136 / 39 
S2 = 0,0008 
S = √0,0008 
S = 0,028 
h. Uma companhia de seguros constata que a cada cem pedidos de pagamento, três são 
fraudulentos. Qual é a probabilidade de que a companhia receba, seguidamente, 
quatro pedidos fraudulentos? 
 
P(F)=3/100=0,03 
Quatro pedidos seguidos: 
P(QF)=0,034 
P(QF) = 0,00000081 (Forma decimal) 
P(QF) = 0,000081% (Porcentagem) 
 
i. Uma bola é retirada ao acaso de uma urna que contém 6 bolas vermelhas, 8 bolas 
pretas e 4 bolas verdes. 
Desta forma será necessário demonstrar o cálculo da probabilidade dela não ser preta. 
A bola retirada não pode ser preta; logo, poderá ser vermelha ou verde. Então: 
P (Vermelha ou Verde) = P (Vermelha) + P (Verde) 
P (Vermelha ou Verde) = 6/18 + 4/18 
P (Vermelha ou Verde) = 10/18 
 
j. Cálculo de Probabilidade: 
Qual a probabilidade de obtermos o total de seis (6) pontos na jogada de dois (2) dados 
honestos? 
 
S = {36 resultados possíveis} 
A = {a soma dos dois dados é igual a 6} 
A = {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)} 
 
P(A) = 5/36 
 
k. Um determinado equipamento tem vida útil de 10000 horas com desvio padrão de 600 
seguindo uma distribuição normal. Determine a probabilidade de um equipamento, 
selecionado ao acaso, tenha vida útil entre 10000 e 11800 horas? 
S
X
z


 
 
Z= 11800 – 10000 / 600 
Z = 1800 / 600 
Z = 3 
Na tabela... 
P(0 <= X <= 3) = 0,4987 
P(0 <= X <= 3) = 49,87% 
 
Boa Prova! 
Prof. Emerson Seixas

Continue navegando