Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise de decisão 1 Heurís2ca de representa2vidade vieses de formulação Medidas de representação e amostragem Considere o problema 1 Na próxima estação de chuvas, espera-se que no DF, 600 pessoas irão contrair a dengue. Dois programas alterna2vos para combater a doença foram propostos. Se o programa A for adotado, 200 pessoas serão salvas e não serão contaminadas. Se o programa B for adotado, há um terço de probabilidade de que 600 pessoas sejam salvas e dois terços de probabilidade que ninguém será salvo. Qual programa você escolhe? Considere o problema 2 Dentro da mesma perspec2va de que no DF, 600 pessoas irão contrair a dengue, outros dois programas alterna2vos para combater a doença foram propostos. Se o programa C for adotado, 400 pessoas contrairão a doença. Se o programa D for adotado, há um terço de probabilidade de que 600 pessoas não tenham a doença e dois terços de probabilidade que as 600 pessoas terão a doença. Qual programa você escolhe? Agora Uma regra simples é selecionar a alterna2va com o valor esperado mais alto. Calcule o valor esperado de cada alterna2va Problema 1 Uma regra simples é selecionar a alterna2va com o valor esperado mais alto. Valor esperado de A: x * p(x)è 200 * 1 = 200 B: Σ x* P(x) è (600 * 1/3) + ( 0 * 2/3) = 200 + 0 = 200 Problema 2 Valor esperado de C: x * p(x)è 400 * 1 = 400, pelos eventos complementares, 200 pessoas não terão a doença D: Σ x* P(x) è (600 * 1/3) + ( 0 * 2/3) = 200 + 0 = 200 • A forma como o problema é apresentado pode mudar a perspec2va que as pessoas tem dele. • É chamado Viés da forma Examine o caso Challenger A nave explodiu em 1986, 73 segundos depois do lançamento. A explosão aconteceu devido à falha de vedação dos anéis de borracha da nave em temperaturas baixas. Quando o problema em potencial foi levado a uma reunião pré-lançamento, os tomadores de decisão examinaram as temperaturas e a magnitude dos problemas com anéis de borracha nos sete lançamentos anteriores que 2nham 2do alguma falha com anéis de borracha. Não foi detectado qualquer padrão claro com relação aos anéis, e, portanto, tomaram a decisão de ir em frente com o lançamento. Examine o caso Challenger Infelizmente ninguém decidiu considerar mais dezessete lançamentos anteriores em que ocorreu falha com anéis de borracha. Examinando os 24 lançamentos, há uma clara conexão entre a temperatura e a falha nos anéis de borracha Medidas de tendência central, medidas de dispersão e noções de amostragem Dos dados colhidos em sala IDADE TOTAL HOMENS MULHERES MÉDIA 21.89 22.29 21.24 MODA 21 19 20 MEDIANA 21 21 21 DESVIO PADRÃO 3.7 4.46 1.63 CV 0.18 0.2 0.07 AMPLITUDE 21 21 6 ALTURA TOTAL HOMENS MULHERES MÉDIA 1.71 1.76 1.63 MODA 1.76 1.75 1.6 MEDIANA 1.73 1.76 1.62 DESVIO PADRÃO 10.87 0.05 0.07 CV 6.17 0.03 0.042 AMPLITUDE 0.32 0.19 0.26 PESO TOTAL HOMENS MULHERES MÉDIA 68.77 78.41 52.88 MODA 80 80 60 MEDIANA 70 79.5 52 DESVIO PADRÃO 15.81 10.78 8.04 CV 0.2 0.14 0.152 AMPLITUDE 67 50 30 CORRELAÇÃ O PESO X ALTURA 0.85 0.68 0.62 Caracterís2cas numéricas de um conjunto de dados Medidas de posição central • MÉDIA : é também conhecido como Esperança Matemá2ca ou Valor Esperado dos valores da variável. Nós todos temos uma idéia já bastante intui2va de média e é uma medida muito usada no mundo organizacional. • para amostra ou µ para população x Média • Para dados não agrupados • Para dados agrupados x = xi i=1 i=n ∑ n onde xi = valores da variável, n= quan2dade de valores x = xi fi i=1 n ∑ fi i=1 n ∑ xi fi n São os valores da variável ou os pontos médios das classes Frequência de cada classe, e Somatório das frequências Média • Usando a probabilidade, conforme já foi visto Usando Excel • Função média aritmé2ca • ATENÇÃO: o excel calcula média para dados não agrupados!!! E(X) = xi * p xi( ) i=1 n ∑ Outras medidas de posição central Mediana • é o valor correspondente ao ponto que divide o conjunto de dados em 2 partes de igual frequência (50% e 50%). Cálculo para dados não agrupados: • organize o conjunto de dados em ordem ascendente; • verifique a quan2dade de valores: se for ímpar a mediana é o valor correspondente à ordem: (n+1)/2, sendo n a quan2dade de valores. se for par, a mediana é a média aritmé2ca dos valores correspondentes às ordens (n/2) e (n/2) +1 Mediana Exemplo: • n ímpar: 2 3 5 6 7 9 11 a mediana é o valor correspondente à ordem (n+1)/2, ou seja: • n = 7 então, (n+1)/2 = (7+1)/2 = 4 ª ordem. Md = 6 • n par : 2 5 7 8 10 11 è n/2 = 6/2 = 3 e (n/2) + 1 = (6/2) + 1 = 4, então a • mediana é a média entre os valores 7 e 8 è Md = 7,5 Mediana • Cálculo para dados agrupados: localizar a classe cuja frequência acumulada abaixo contém o somatório de 50% ( classe da mediana), e calcular segundo a fórmula: onde: • Li = limite inferior da classe que contém a mediana • n = somatório das frequências • Fab = soma das frequências absolutas (ou simples) das classes anteriores à classe que contém a mediana • h = amplitude da classe que contém a mediana • Fmd = frequência absoluta ou simples da classe que contém a mediana • Função EXCEL: MEDIANA (sempre para dados não agrupados) Md = Li+ (n / 2)−Fab Fmd *h Moda • é o valor ou classe de valores mais freqüente. • Cálculo para dados não agrupados: basta observar qual o valor que mais ocorre. Na série: 2 3 4 5 6 7 2 4 2 7 8 9 0 , a moda é 2. Já na série abaixo, ocorrem 2 duas modas: 2 3 2 4 5 6 7 9 6 , os valores 2 e 6. Moda • Cálculo para dados agrupados: localizar a classe que contém a moda (de maior freqüência), e calcular segundo a fórmula: Onde: • Li = limite inferior da classe que contém a moda • d1 = diferença entre a freqüência absoluta ou simples da classe modal e a classe imediatamente anterior • d2 = diferença entre a freqüência absoluta ou simples da classe modal e a classe imediatamente posterior ; • h = amplitude da classe que contém a moda. Mo = Li+ d1 d1 + d2 *h Exemplos de cálculos Renda dos clientes da carteira – Julho 2015 Média • A renda média dos clientes é R$ 8.675,00 x = (5000*95)+ (7000*84)+ (9000*79)+ (11000*75)+ (13000*67) (95+84+ 79+ 75+ 67) x = 3470000 400 = 8675 Mediana Md = 8000+ (400 / 2)−179 79 *2000 = Md = 8000+ 200−179 79 *2000 = 8531,64 Md = 8531,64 Moda Mo = 4000+ 95 95+11 *2000 = 4000+ 95 106 *2000 Mo = 4000+1792, 45= 5792, 45 Mo = 5792, 45 Análise das três medidas juntas A. se média = mediana = moda è a curva é simétrica B. se média > mediana è a curva é assimétrica à direita ou posi2va C. se média < mediana è a curva é assimétrica à esquerda ou nega2va. Moda mediana média Média mediana moda A B C Dos dados colhidos em sala IDADE TOTAL HOMENS MULHERES MÉDIA 21.89 22.29 21.24 MODA 21 19 20 MEDIANA 21 21 21 DESVIO PADRÃO 3.7 4.46 1.63 CV 0.18 0.2 0.07 AMPLITUDE 21 21 6 Mediana e moda menores que a média Dos dados colhidos em sala PESO TOTAL HOMENS MULHERES MÉDIA 68.77 78.41 52.88 MODA 80 80 60 MEDIANA 70 79.5 52 DESVIO PADRÃO 15.81 10.78 8.04 CV 0.2 0.14 0.152 AMPLITUDE 67 50 30 CORRELAÇÃO PESO X ALTURA 0.85 0.68 0.62 Média menor que a mediana e que a moda Dos dados colhidos em sala ALTURA TOTAL HOMENS MULHERES MÉDIA 1.71 1.76 1.63 MODA 1.76 1.75 1.6 MEDIANA 1.73 1.76 1.62 DESVIO PADRÃO 10.87 0.05 0.07 CV 6.17 0.03 0.042 AMPLITUDE 0.32 0.19 0.26 Medidas de dispersão • Amplitude • Variância e Desvio- padrão • Coeficiente de Variação • Alémde detectar o grau de homogeneidade e heterogeneidade, servem para verificar a representa2vidade das medidas de posição ou seja, auxiliam as medidas de posição em uma melhor caracterização de um conjunto de dados Medidas de dispersão Conjunto de dados A: 60 120 140 160 220 è a média é 140 Conjunto de dados B: 140 140 140 140 140 è a média é 140 Como diferenciá-los? Com medidas de dispersão AMPLITUDE ( A) : • A = X máx - X min No exemplo dado acima tem-se: A. X máx = 220 e X min = 60, logo A = 220 - 60 = 160 B. X máx = 140 e X min = 140, logo A = 140 - 140 = 0 Medidas de dispersão • Variância - ( σ2 ) - é uma medida de dispersão mais poderosa e mais usada que a amplitude. Relaciona o valor de cada elemento do conjunto de dados com a média dos valores, ou seja, reflete a dispersão dos dados em torno da média. • Desvio Padrão (σ) É a raiz quadrada da variância. É mais u2lizado que a variância porque está na mesma medida dos valores da variável em análise. Já a variância tem a desvantagem de estar ao quadrado • COEFICIENTE DE VARIAÇÃO (C.V.): É uma medida rela2va de dispersão. Caracteriza a dispersão dos dados em termos rela2vos ao seu valor médio. É muito usado para comparar dois grupos diferentes em termos de dispersão. O grupo mais homogêneo, em relação a uma variável é o que tem menor coeficiente de variação. Medidas de dispersão – Variância Dados não agrupados, população Dados agrupados, população n = fi i=1 n ∑ sendo fi = freqüência a cada classe Xi = cada valor (para dados não agrupados) Xi = ponto médio de cada classe (para dados agrupados) X =média Quando se tratar de amostras, subs2tui-se σ por S, e n por n-1 C.V = σ µ σ 2 = xi − x( ) 2 fi i=1 n ∑ n Medidas de dispersão Desvio− padrão σ = + σ 2 para populações S = + S2 para amostras S2 = xi − x( ) i=1 n ∑ 2 n−1 Nos dados anteriores σ = + 2729 = 52, 24 σ = + 0 = = 0 caso a (60 120 140 160 220) σ 2 = (xi − x i=1 i=n ∑ )2 n σ 2 = 60−140( )2 + 120−140( )2 + 140−140( )2 + 160−140( )2 + 220−140( )2 5 σ 2 = −80( )2 + −20( )2 + 0( )2 + 20( )2 + 80( )2 5 = 6400+ 400+ 0+ 400+ 6400 5 σ 2 = 13600 5 = 2720 caso b ( 140 140 140 140 140) σ 2 = (xi − x i=1 i=n ∑ )2 n σ 2 = 140−140( )2 + 140−140( )2 + 140−140( )2 + 140−140( )2 + 140−140( )2 5 σ 2 = 0( )2 + 0( )2 + 0( )2 + 0( )2 + 0( )2 5 = 0 5 σ 2 = 0 Em relação aos dados colhidos em sala Qual o grupo mais homogêneo em relação à idade? Altura? Peso? Dos dados colhidos em sala IDADE TOTAL HOMENS MULHERES MÉDIA 21.89 22.29 21.24 MODA 21 19 20 MEDIANA 21 21 21 DESVIO PADRÃO 3.7 4.46 1.63 CV 0.18 0.2 0.07 AMPLITUDE 21 21 6 ALTURA TOTAL HOMENS MULHERES MÉDIA 1.71 1.76 1.63 MODA 1.76 1.75 1.6 MEDIANA 1.73 1.76 1.62 DESVIO PADRÃO 10.87 0.05 0.07 CV 6.17 0.03 0.042 AMPLITUDE 0.32 0.19 0.26 PESO TOTAL HOMENS MULHERES MÉDIA 68.77 78.41 52.88 MODA 80 80 60 MEDIANA 70 79.5 52 DESVIO PADRÃO 15.81 10.78 8.04 CV 0.2 0.14 0.152 AMPLITUDE 67 50 30 CORRELAÇÃ O PESO X ALTURA 0.85 0.68 0.62 Coeficiente de Variação • Para comparar dois grupos diferentes, usa-se o coeficiente de variação. Quanto menor, mais homogêneo é o grupo. • Em relação a idade, o grupo das mulheres é mais homogêneo • Em relação ao peso e altura, o grupo dos homens é mais homogêneo C.V = σ µ O Que fazer • Sempre que possível, não analisar somente a média. • U2lizar as demais medidas de tendência central como a mediana e moda • U2lizar as medidas de dispersão em conjunto para se ter uma ideia melhor do conjunto de dados
Compartilhar