Baixe o app para aproveitar ainda mais
Prévia do material em texto
MÉTODOS QUANTITATIVOS Olá pessoal! Durante este módulo B 2015, pudemos estudar que o emprego de técnicas de estatística e probabilidade, para análise e solução de problemas estão relacionados a diferentes áreas do conhecimento. Alguns desses métodos, utilizados tanto na descrição quanto na tomada de decisões são, por exemplo: percentual, média, desvio-padrão, coeficiente de correlação, análise de regressão, testes de hipóteses, dentre outras. Então vamos verificar alguns conceitos! Estatística: é um conjunto de métodos ou técnicas que nos auxilia a compreender e investigar uma ampla coleção de dados. População: é um grupo de todos os elementos em que existe o interesse de analisar um ou mais aspectos. Amostra: é um subconjunto ou subgrupo dos elementos que formam a população. Estatística Descritiva: é sintetizar as características mais relevantes de um conjunto de dados. Estatística Inferencial: utiliza-se de dados parciais (apenas uma parte de um conjunto de todos os dados relacionados com o problema em estudo - amostra) para obter decisões e gerar conclusões coerentes. Segundo Triola (1999), as duas principais classificações de dados: os qualitativos e os quantitativos. Dados Qualitativos: são dados categóricos ou atributos, que podem ser divididos em distintas categorias ou atributos diferenciados por alguma característica não numérica, como sexo, raça e tipo de defeito de um lote de peças. Dados Quantitativos: são aqueles formados por números que objetivam representar contagens ou medidas, como o peso, a altura e o número de peças, os quais podem sofrer operações aritméticas. No caso de dados quantitativos, uma subdivisão ainda pode ser feita. Os dados quantitativos podem ser: Discretos e Contínuos. Dados Quantitativos Discretos: são dados compostos por um conjunto finito de valores ou de um conjunto contável desses valores. Dados Quantitativos Contínuos: compostos de um número infinito de valores imagináveis que podem ser relacionados a pontos em uma escala contínua. Foi em 17 de fevereiro de 2015 que se comemorou o 125º aniversário do nascimento daquele que foi para muitos, o maior impulsionador para o grande avanço da Estatística Moderna, Ronald Aylmer Fisher (1890-1962). Ao introduzir o conceito de Análise da Variância no planeamento de experiências. A ANOVA (ANalysis Of VAriance): é um método para teste de igualdade de três ou mais médias populacionais através da análise das variâncias amostrais. Este método permite verificar se um ou mais fatores influenciam ou não na característica de uma determinada variável de estudo. Os principais pressupostos para se realizar o teste ANOVA são: Amostras independentes, ou seja, uma observação não pode ser influenciada pela anterior ou pela próxima; Cada grupo de observações devem provir de uma população com distribuição normal; Homogeneidade das variâncias entre os grupos, ou seja, as variâncias dentro de cada grupo devem ser pelo menos aproximadamente iguais àquela dentro de todos os grupos. A ideia central do teste ANOVA de um fator, através do teste de igualdade de médias, analisar se um determinado fator influencia ou não na característica de uma determinada variável dependente. Em outras palavras, a ideia central é testar a hipótese de que três ou mais amostras são provenientes de populações com médias iguais. Os Erros tipo I e II na prática! Rejeitar a Hipótese Nula e esta ser verdadeira - Erro Tipo I . Aceitar (não rejeitar) a Hipótese Nula e esta ser falsa - Erro Tipo II . Ex.: Quando um gerente de recursos humanos decide contratar, ou não, determinado profissional Poderá ocorrer o Erro tipo II, caso o gerente contrate o profissional. Isto é: contrata e o profissional revela-se sem qualidades – aceitar H0 falsa. Por outro lado, quando o gerente dispensa (não contrata) determinado profissional, poderá estar cometendo o Erro tipo I – rejeitar H0 verdadeira. Isto é: não contrata e o profissional revela-se com qualidades, em outro emprego assemelhado. Testes paramétricos: têm requisitos sobre a natureza ou a forma das populações envolvidas. Testes não paramétricos: não exigem que as amostras venham de populações com distribuições normais ou qualquer outra distribuição particular. Vantagem do uso de testes não paramétricos consiste em não exigir que as populações estejam normalmente distribuídas. Desvantagem é que estes tendem a desperdiçar informação, porque os dados numéricos exatos são, em geral, reduzidos a uma forma qualitativa. A ideia central do teste de independência: verificar se dadas duas varáveis de estudo A e B, de uma tabela de contingência, são independentes entre si. Para tanto, utiliza-se como ferramenta o teste qui-quadrado para conferir se há ou não a relação de independência entre as variáveis de estudo. O teste de Kruskal-Wallis é um teste não paramétrico que usa postos de amostras aleatórias simples de três ou mais populações independentes para testar a hipótese nula de que as populações têm a mesma mediana. Ao aplicar o teste de Kruskal-Wallis, calcula-se a estatística H, que tem uma distribuição que pode ser aproximada pela distribuição qui-quadrado. Ao aplicar a distribuição qui-quadrado nesse contexto, o número de graus de liberdade do numerado é (k-1), onde k é o número de grupos em análise. O coeficiente de correlação de Pearson não tem esse nome por acaso. É comum atribuir exclusivamente a Karl Pearson o desenvolvimento dessa estatística, no entanto, como bem lembrou Stanton (2001), a origem desse coeficiente remonta o trabalho conjunto de Karl Pearson e Francis Galton (Stanton, 2001: 01). O coeficiente de correlação de Pearson busca quantificar o quão forte é a correlação linear entre duas variáveis intervalares. Este coeficiente nada mais é que uma medida da correlação linear independente das unidades de medida das variáveis. O coeficiente de Pearson oscila entre -1 e +1 ou, dado em porcentagens, entre -100% e +100%. Para uma relação linear forte entre as variáveis, mais próximo de seus valores extremos, +1 ou -1, se apresentará a medida do coeficiente de correlação r (MARTINS, 2010). Porém, caso a medida do coeficiente encontrar-se próxima de zero, mais fraco é o grau desta relação, tornando-se inexistente para r = 0. Caso r = -1 interpreta-se como se existisse uma correlação linear inversa, ou seja, quando o valor de uma variável aumenta, o valor de outra diminui (ROSA, 2009). Um exemplo de correlação entre duas variáveis seria, por exemplo, temperatura e tempo de uma reação química, velocidade e deslocamento de uma partícula, preço e quantidade de vendas de um determinado produto. O modelo de regressão linear, segundo Krajewski, Ritzman e Malhotra (2009), é um dos modelos causais mais conhecidos e utilizados. Segundo Montgomery (2011) “a coleção de ferramentas estatísticas que são usadas para modelar e explorar relações entre variáveis que estão relacionadas de maneira não determinística é chamado de análise de regressão”. O objetivo geral desta técnica é estabelecer uma equação que relacione adequadamente o comportamento de uma variável resposta e uma ou mais variáveis explicativas, possibilitando realizar a estimativa de valores da variável de resposta. Esta equação pode ser linear ou não linear. Quando a reta da regressão é modelada segundo uma função linear, a mesma é dita regressão linear simples. Um método que pode ser utilizado para determinar a reta da regressão linear simples é o método dos mínimos quadrados, o qual, consiste na minimização da distância quadrática entre os pontos amostraise os valores da reta da regressão. Regressão é o método de análise da relação existente entre duas variáveis: uma dependente e uma independente. Conforme Triola (2013) uma das vantagens dos métodos não paramétricos pode ser aplicado a uma grande variedade de situações, porque não possuem as exigências mais rígidas dos métodos paramétricos correspondentes. Uma das desvantagens dos métodos não paramétricos é que não são tão eficientes quanto os testes paramétricos, de modo que, com os testes não paramétricos, precisamos, em geral, de evidência mais forte (tais como amostra maior ou diferenças maiores) para rejeitar a hipótese nula. Exercícios de aplicação de Métodos Quantitativos: a. Calcule a amplitude dos dados abaixo: 33 35 35 39 41 41 42 45 47 48 50 52 53 54 55 55 57 59 60 60 61 64 65 65 65 66 66 66 67 68 69 71 73 73 74 74 76 77 77 78 80 81 84 85 85 88 89 91 94 97 Solução: Amplitude = Maior medida – Menor medida: A = 97-33 = 64 b. Calcule a média dos números abaixo: 10 29 26 28 15 23 17 25 0 20 X = 10 + 29 + 26 + 28 +15 + 23 +17 + 25 + 0 + 20 = 193 X = 193 / 10 X = 19,3 c. Verifique o número que ocorreu com maior frequência 7 - 6 - 8 - 7 - 6 - 4 - 5 - 7 - 7 - 8 - 5 - 10 - 6 - 7 - 8 - 5 - 10 - 4 - 6 - 7 - 7 - 9 - 5 - 6 - 8 - 6 - 7 - 10 - 4 - 6 - 9 - 5 - 8 - 9 - 10 - 7 - 7 - 5 - 9 - 10 O número 7 ocorreu com maior frequência e é denominado de Moda d. Calcule a mediana dos dados abaixo: 10 - 7 - 12 - 6 - 10 – 9 1º passo, colocar em ordem crescente: 6 - 7 - 9 - 10 - 10 - 12. 2º passo, verificar se a quantidade de dados é par ou ímpar; nesse caso é par, então a mediana é a média aritmética dos dois valores centrais da série, ou seja: 6 - 7 - 9 - 10 - 10 - 12 Md = (9 + 10) / 2; Md = 9,5. e. Calcule a mediana dos dados abaixo: 10 - 7 - 12 - 6 - 10 - 9 – 7 1º passo, colocar em ordem crescente: 6 - 7 - 7 - 9 - 10 - 10 – 12. No 2º passo, verificar se a quantidade de dados é par ou ímpar; nesse caso é ímpar, então a mediana é o valor central da série, ou seja: 6 - 7 - 7 - 9 - 10 - 10 – 12. Md = 9. f. Calcule o desvio padrão dos dados abaixo: 8, 4, 6, 9, 10, 5 X= (8 + 4 + 6 + 9 + 10 + 5) / 6 X = 42/6 X = 7 Xi Xi - X S2 4 4 – 7 = - 3 9 5 5 – 7 = -2 4 6 6 – 7 = - 1 1 8 8 – 7 = 1 1 9 9 – 7 = 2 4 10 10 – 7 = 3 9 ∑ 0 28 S2 = 28/6-1 = 28/5 S2 = 5,6 S = √5,6 S = 2,36 g. A tabela a seguir apresenta as quantidades, em quilos, contidas em uma amostra de 40 pacotes de feijão. 0,94 0,94 0,96 0,96 0,97 0,97 0,97 0,98 0,98 0,98 0,98 0,98 0,98 0,98 0,99 0,99 0,99 0,99 0,99 1,00 1,01 1,01 1,01 1,01 1,01 1,02 1,02 1,02 1,02 1,02 1,02 1,02 1,02 1,03 1,03 1,04 1,04 1,05 1,06 1,06 Tabela 1 Após realizados os cálculos de amplitude de cada intervalo e da quantidade média de feijões Classes Freqüência (fi) Ponto Médio (Pm) XPm i fXPm . 2 0,94 | 0,96 2 0,95 0,95-1,006 0,006272 0,96 | 0,98 5 0,97 0,97-1,006 0,00648 0,98 | 1,00 12 0,99 0,99-1,006 0,003072 1,00 | 1,02 6 1,01 1,01-1,006 0,000096 1,02 | 1,04 10 1,03 1,03-1,006 0,00576 1,04 || 1,06 5 1,05 1,05-1,006 0,00968 Total: 40 ----- ----- 0,03136 Tabela 2 Calcule a variância. S2 = 0,03136 → ifXPm .2 (0,03136 dado no exemplo) S2 = 0,03136 / 39 S2 = 0,0008 S = √0,0008 S = 0,028 h. Uma companhia de seguros constata que a cada cem pedidos de pagamento, três são fraudulentos. Qual é a probabilidade de que a companhia receba, seguidamente, quatro pedidos fraudulentos? P(F)=3/100=0,03 Quatro pedidos seguidos: P(QF)=0,034 P(QF) = 0,00000081 (Forma decimal) P(QF) = 0,000081% (Porcentagem) i. Uma bola é retirada ao acaso de uma urna que contém 6 bolas vermelhas, 8 bolas pretas e 4 bolas verdes. Desta forma será necessário demonstrar o cálculo da probabilidade dela não ser preta. A bola retirada não pode ser preta; logo, poderá ser vermelha ou verde. Então: P (Vermelha ou Verde) = P (Vermelha) + P (Verde) P (Vermelha ou Verde) = 6/18 + 4/18 P (Vermelha ou Verde) = 10/18 j. Cálculo de Probabilidade: Qual a probabilidade de obtermos o total de seis (6) pontos na jogada de dois (2) dados honestos? S = {36 resultados possíveis} A = {a soma dos dois dados é igual a 6} A = {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)} P(A) = 5/36 k. Um determinado equipamento tem vida útil de 10000 horas com desvio padrão de 600 seguindo uma distribuição normal. Determine a probabilidade de um equipamento, selecionado ao acaso, tenha vida útil entre 10000 e 11800 horas? S X z Z= 11800 – 10000 / 600 Z = 1800 / 600 Z = 3 Na tabela... P(0 <= X <= 3) = 0,4987 P(0 <= X <= 3) = 49,87% Boa Prova! Prof. Emerson Seixas
Compartilhar