Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise de decisão 1 Heurís2ca de representa2vidade vieses de formulação Amostragem e correlação A questão da representa/vidade e da amostra Uma certa cidade é atendida por dois hospitais. No hospital maior, cerca de quarenta e cinco bebês nascem a cada dia. No hospital menor, cerca de 15 bebês nascem a cada dia. Como se sabe, cerca de 50 por cento de todos os bebês são meninos. Todavia, a porcentagem exata de meninos nascidos varia de um dia para outro. Às vezes, pode ser maior que 50 por cento, às vezes menor. Para um período de um ano, cada hospital registrou os dia em que mais de 60 por cento dos bebês nascidos foram meninos. Que hospital você acha que registrou mais desses dias? A. o hospital menor B. o hospital maior C. pra2camente o mesmo (isto é, com uma tolerância de 5% entre um e outro. A questão da representa/vidade e da amostra • amostras muito pequenas irão mostrar grandes desvios • mas não há necessidade de ter amostras infinitas • além do tamanho da amostra, é necessário escolher de forma correta A questão da representa/vidade e da amostra • Você quer fazer uma pesquisa para saber o nível de renda das pessoas no DF. Como você escolheria uma amostra que fosse representa2va do universo? • Você quer fazer uma pesquisa para saber os hábitos de prá2ca de esportes em parques públicos das pessoas no DF. Como você escolheria uma amostra que fosse representa2va do universo? • Você quer fazer uma pesquisa para saber a relação entre peso e altura dos habitantes do DF, como você escolheria uma amostra que fosse representa2va do universo? Noções de amostragem • População: conjunto de elementos que tem algo em comum • Amostra: parte da população • Cálculo do tamanho da amostra: depende da caracterís2ca pesquisada e variabilidade da população em relação a esta caracterís2ca Noções de amostragem • O propósito da amostragem é fazer generalizações sobre a população básica, é necessário que a população alvo seja estabelecida de modo que se possam fazer generalizações válidas • As regras de re2rada de elementos da amostra podem ser classificadas em duas categorias: probabilís2cas e não probabilís2cas. Noções de amostragem Probabilís2cas 1. Simples ao acaso 2. Amostra sistemá2ca 3. Estra2ficada 4. Conglomerados Não probabilís2cas Intencional Noções de amostragem Tipo Caracterizado por Aleatória Lista aleatória de itens Sistemática Lista de itens Estratificada Subgrupos homogêneos Por conglomerados Subgrupos heterogêneos 1. Amostragem Simples ao Acaso Também conhecida por amostragem ocasional, acidental, casual, randômica. Todos os elementos da população têm igual probabilidade de serem escolhidos, não só antes de ser iniciado, como também até completar-se o processo de coleta. Como fazer: a) devem-se numerar todos os elementos da população; b) efetuar excessivos sorteios com reposição até completar o tamanho da amostra. Obs. quando a quan2dade total de itens for muito grande, pode-se fazer sem reposição, sem prejuízo dos resultados. Quase todos soiwares estaks2cos dispõe de função que gera números aleatórios, o que dispensa o uso da tabela de números aleatórios. 2. Amostra sistemá2ca • É uma variação da amostragem simples ao acaso, muito conveniente quando a população está naturalmente ordenada, como fichas em um fichário, listas telefônicas, números de registro, número de matrícula, etc. • Como fazer: considerando N como o tamanho da população e n o tamanho da amostra. Então, calcula-se o intervalo de amostragem N/n ou o inteiro mais próximo que chamaremos de “a”. • Sorteia-se, u2lizando a tábua do números aleatórios, um número x entre 1 e o inteiro, formando-se a amostra dos elementos correspondentes aos números x; x + a; x + 2a,.......etc, até completar o tamanho da amostra. 2. Amostra sistemá2ca • Seja N = 500 e n= 50. Então, 500/50 = 10 = a (inteiro procurado) . sorteia-se um número de 1 a 10. Por exemplo: 3. Logo, os elementos numerados por 3; 13; 23; 33; ......serão os componentes da amostra. 3. Amostragem Estra2ficada • É usada quando se pode dis2nguir subpopulações mais ou menos homogêneas, denominadas estratos, podemos usar a amostragem estra2ficada. • Estra2ficar uma população é dividi-la em subpopulações denominadas estratos, tais que n1 + n2 + ........+ nL = n, onde os estratos são mutuamente exclusivos. • Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada subpopulação. Se as diversas subamostras 2verem tamanhos proporcionais ao respec2vo número de elementos no estrato, teremos a estra2ficação proporcional. • A lógica do processo é que dentro de cada subgrupo, a variabilidade é menor que a população global, o que leva à necessidade de um menor tamanho de amostra. 4.Amostragem por Conglomerados • Pressupõe a disposição dos elementos da população em subgrupos heterogêneos. • Usado quando é possível iden2ficar dentro da população subgrupos que representam uma miniatura da população, • Pode-se escolher um destes subgrupos como a população e efetuarmos sorteios entre seus elementos. • Na prá2ca raramente ocorre um subrgrupo perfeitamente representa2vo da população, logo, sempre é necessário escolher mais de um subgrupo para cons2tuir a amostra. Amostragem não probabilís2ca • São amostragens em que há uma escolha deliberada dos elementos da amostra. • Por exemplo: uma pesquisa médica deve trabalhar com os pacientes disponíveis ou com aqueles que se apresentem como voluntários. • Nenhum destes grupos deve ser considerada como uma amostra aleatória do público em geral. • É importante observar que para se fazerem inferências esta,s-cas, (2rar conclusões sobre a população, a par2r de observações da amostra) há necessidade de que o processo seja probabilís2co, pois somente neste caso poderemos avaliar a probabilidade de erro. Correlação linear Correlação linear • Correlação” significa literalmente “co- relacionamento”, • indica até que ponto os valores de uma variável estão relacionados com os de outra. • O termo “linear” traduz a forma da correlação. Correlação linear, portanto, significa o grau de relacionamento da forma linear entre duas ou mais variáveis. Correlação linear A forma mais comum de medir o grau de relacionamento entre duas variáveis (x e y) é através do coeficiente de correlação linear de Pearson (r). A técnica de Pearson pressupõe que: a) tanto x como y são variáveis aleatórias conknuas; b) a distribuição de freqüência dos valores dos pares x , y é normal. Correlação linear Caracterís2cas de r • O coeficiente de correlação linear de Pearson tem duas propriedades que caracterizam a natureza de uma relação entre variáveis. • Primeira : é o seu sinal (+ ou -) • Segunda : é a magnitude. Correlação linear • o valor de r varia de -1,00 a + 1,00, ou seja -1,00 ≤ r ≤ 1,00 • um relacionamento posi/vo ( r posi2vo) entre duas variáveis indica que valores crescentes de uma das variáveis correspondem a valores crescentes da outra, e vice-versa • um relacionamento nega/vo (r nega2vo) significa que valores crescentes de uma variável correspondem a valores decrescentes da outra, e vice-versa • um relacionamento igual a 0 (zero) indica que não há relacionamento linear entre as duas variáveis Correlação linear – diagramas de dispersão r positivo r negativo Correlação linear ( ) ( ) ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − = ∑∑∑∑ ∑∑∑ n y y n x x n yx xy r 2 2 2 2 Usando Excel: CORREL
Compartilhar