Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATISTICA AMOSTRA DE CONVENIENCIA - É formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. Os estatísticos têm restrições ao uso de amostras de conveniência, uma vez que são comuns apenas a uma área ou população. Ex.: Pesquisa com pacientes de uma só clínica ou hospital. A2 - TIPOS DE DADOS CONCEITOS BÁSICOS SOBRE FREQUENCIAS DADOS BRUTOS – São os dados originais de uma série estatística que não se encontram prontos para análise ou estão desorganizados. ROL - É a lista ordenada dos dados de uma série estatística. Essa ordenação pode ser crescente ou descrente. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUENCIAS PONTO MÉDIO DE CLASSE (Xi) – É o valor representativo de uma classe. Para obtê-lo basta somar os limites superior e inferior da classe e dividir por 2. INTERVALO DE CLASSE (h) - É a diferença entre o limite superior e o limite inferior da classe (h=A/n - QUANTIDADE DE CLASSES). X - MAIOR VALOR OBSERVADO DA VARIÁVEL DE FREQUÊNCIAS (MÁX). x - MENOS VALOR OBSERVADO DA VARIÁVEL DE FREQUÊNCIAS (MIN). *AMPLITUDE (A) - É A DIFERENÇA ENTRE O MAIOR E MENOR VALOR OBSERVADO DA VARIÁVEL (A= X - X) * LIMITE DE CLASSE - OS LIMITES DE UMA CLASSE SÃO OS VALORES EXTREMOS. O LIMITE MÍNIMO DE UMA CLASSE É DENOMINADO LIMITE INFERIOR , E O LIMITE MÁXIMO É DENOMINADO LIMITE SUPERIOR. - DISTRIBUIÇÃO DE FREQUÊNCIAS - VARIÁVEL CONTÍNUA * FREQUENCIA RELATIVA - fri - É OBTIDA PELA DIVISÃO DA FREQUENCIA SIMPLES DA CLASSE PELO NÚMERO TOTAL DOS ELEMENTOS (fri = fi / n) * FREQUENCIA ACUMULADA - Fi - RESULTA DA SOMA DA FREQUENCIA SIMPLES DA CLASSE COM AS FREQUENCIAS SIMPLES DAS CLASSES ANTECEDENTES (Fi - f1 + f2 + f3 ... + fi) * FREQUENCIA ACUMULADA RELATIVA - Fri - É OBTIDA PELA DIVISÃO DA FREQUENCIA ACUMULADA DA CLASSE PELO NÚMERO TOTAL DOS ELEMENTOS (Fri = Fi / n) OBS.: ACRESCENTADOS ESSES VALORES à TABELA ORIGINAL, ELA PASSA A SE CHAMAR DISTRIBUIÇÃO DE FREQUÊNCIAS. --- ROTEIRO PARA ELABORAÇÃO DA TABELA DE FREQUENCIA PARA DADOS AGRUPADOS --- * TRANSFORMAR OS DADOS BRUTOS EM ROL; * ENCONTRAR A AMPLITUDE TOTAL DOS DADOS; * DETERMINAR O NÚMERO DE CLASSES DE ACORDO COM O TOTAL DE OBSERVAÇÕES. ** GERALMENTE ESCOLHE-SE ARBITRARIAMENTE ENTRE UM MÍNIMO DE 5 E UM MÁXIMO DE 20 CLASSES OU USA-SE A FÓRMULA: n = Vqtde (RAIZ QUADRADA DA QUANTIDADE). OBS.: TOMEMOS POR EXEMPLO 18 OBSERVAÇÕES, n = V18 = 4,24. RECOMENDA-SE ADOTAR UM NÚMERO INTEIRO, NESSE CASO 5 CLASSES. -- AULA 3 - MEDIDAS DE POSIÇÃO CENTRAL --- - MEDIA ARITIMETICA - PODE SER: * SIMPLES - É MÉDIA ARITIMÉTICA, OU MÉDIA DE UM CONJUNTO DE N NÚMEROS X1,X2,...Xn É DEFINIDO POR: X = (X1+X2+...Xn) / n EX.: X = (1+1+3+4+4) / 5 = 13/5 = 2,6 * PONDERADA - SE OS VALORES X1,X2...Xn OCORREREM COM FREQUENCIAS f1,f2....fn, ENTÃO: X = X1 f1 + X2 f2 + .... Xn fn = EXi fi _________________________________ f1 + f2+ .... fn Efi * SEJA Xi, O PONTO MÉDIA DA I-ÉSIMA CLASSE, ENTÃO: X = E Xi fi / E fi ----- MODA --- PODE -SE DEFINIR COMO MODA O VALOR MAIS FREQUENTE, QUANDO COMPARADA SUA FREQUENCIA COM A DOS VALORES CONTIGUOS DE UM CONJUNTO ORDENADO. A MODA PODE NÃO EXISTIR, E MESMO QUE EXISTA, PODE NÃO SER ÚNICA: * UNIMODAL - X = 4,5,5,6,6,6,7,7,8,8 - MODA = 6 (VALOR MAIS FREQUENTE) - UNIMODAL *AMODAL - Y + 2,3,4,5,6 NÃO TEM MODA - AMODAL * BIMODAL - Z= 2,4,4,4,6,7,8,8,8,9 TEM DUAS MODAS 4 E 8 - BIMODAL ---- FORMULA PARA DADOS AGRUPADOS --- Mo = Xo + h (Fm - Fa) _____________________ 2Fm - (Fa + Fp) * Xo - É O PONTO INICIAL DO INTERVALO DE CLASSE A QUE PERTENCE Fm. * h É O INTERVALO DE CLASSE *Fm É A FREQUENCIA MAXIMA *Fa E A FREQUENCIA ANTERIOR à Fm *F`É A FREQUENCIA POSTERIOR À Fm ------MEDIANA ---- É O VALOR QUE DIVIDE A DISTRIBUIÇAO EM DUAS PARTES IGUAIS. SUA FÓRMULA É: Me = Xe + h (Xm - Fiaa) ______________________ Fi *Xe - É O PONTO INICIAL DA CLASSE A QUAL PERTENCE Xm, NA FREQUENCIA ACUMULADA *h - É O INTERVALO DE CLASSE *Xm - É O VALOR MEDIANO, OU SEJA, METADE DA FREQUENCIA TOTAL -----------AULA 4 - MEDIDAS DE ORDENAMENTO E FORMA - - NA ANALISE DA DISTRIBUIÇÃO DE UMA VARIAVEL, HÁ INTERESSE EM DETERMINAR QUAL O VALOR QUE DIVIDE A DISTRIBUIÇÃO EM DUAS PARTES IGUAIS, QUATRO PARTES IGUAIS, DEZ OU CEM PARTES IGUAIS. A ESTES VALORES (SEPARATRIZES), CHAMAREMOS DE: * QUARTIS - DIVIDEM A DISTRIBUIÇÃO EM QUATRO PARTES IGUAIS. SUA FORMULA É: Qnq = X (nqn / 4 + 1/2) *qnq - SÃO O PRIMEIRO, SEGUNDO E TERCEIRO QUARTIL (i = 1,2 E 3) **nq É O NÚMERO DO QUARTIL QUE SE DESEJA OBTER ***n É O TAMANHO DA AMOSTRA **** X É O ELEMENTO DA SÉRIA ORDENADA * DECIS - DIVIDEM A DISTRIBUIÇAO ORDENADA EM DEZ PARTES IGUAIS. SUA FORMULA É: Qnq = X (nqn / 10 + 1/2) * PERCENTIS - DIVIDEM A DISTRIBUIÇÃO ORDENADA EM CEM PARTES IGUAIS. ELES PODEM SER OBTIDOS POR MEIO DE UMA EQUAÇÃO SIMILAR À USADA PARA A OBTENÇÃO DOS QUARTIS E DECIS. Pnp = X [np x n + 1] ___________ _____ [ 100 2] *np - NÚMERO DO PERCENTIL QUE SE DESEJA OBTER (1,2....99) ----AULA 5 - MEDIDAS DE DISPERSÃO - NEM SEMPRE QUANDO SE ESTÁ ESTUDANDO UM GRUPO DE DADOS, O CONHECIMENTO DE UM PROMÉDIO É SUFICIENTE PARA SE TIRAR CONCUSÃO A RESPEITO DESSES DADOS. É NECESSÁRIO TAMBÉM O CONHECIMENTO DA VARIABILIDADE DOS DADOS. ASSIM, É QUE NÃO SE JUSTIFICA CALCULAR A MÉDIA DE UM CONJUNTO DE DADOS ONDE NÃO HAJA NENHUMA VARIAÇÃO DESSES ELEMENTOS. DA MESMO FORMA, NÃO AJUDA O CONHECIMENTO DA MÉDIA QUANDO O CONJUNTO DE DADOS TIVER UMA VARIAÇÃO MUITO GRANDE. A TOMADA DE DECISÕES APENAS COM A MÉDIA, DE UM CONJUNTO DE DADOS É INADEQUADA, UMA VEZ QUE OS DADOS DIFEREM ENTRE SI, EM MAIOR OU MENOR GRAU. EX.: COMPARAR AS NOTAS DE 2 ALUNOS ALUNO A - 10,10,10 E 2 ALUNO B - 9,7,9,7 SE LEVARMOS EM CONSIDERAÇÃO AS MÉDIAS, AMBOS TERIAM O MESMO RESULTADO, CONTUDO, A VARIAÇÃO NAS NOTAS DO ALUNO B É MENOR, LOGO, ELE É UM ALUNO "MELHOR" QUE O "A". * DESVIO PADRÃO - É DEFINIDO POR: S = (E (Xi - X)² Fi )/ E Fi ) ^ (1/ 2) Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de números, o desvio padrão não se altera. Multiplicando-se ou dividindo-se cada elemento de um conjunto de números por uma constante, o desvio padrão fica multiplicado ou dividido pela constante. Para as distribuições simétricas (normais), tem-se: 68,72% das observações estão contidas entre X +OU- S 95,45% das observações estão contidas entre X +OU- 2S 99,73% das observações estão contidas entre X +OU- 3S ----- VARIANCIA E COEFICIENTE DE VARIAÇÃO--- A variância pode ser definida como uma medida de dispersão que é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância. 2 2 S = E (Xi - X) Fi _______________ EFi COEFICIENTE DE VARIAÇÃO Corresponde à relação entre o desvio padrão sobre a média. Cv = 100 . S --- X Cv - É O COEFICIENTE DA VARIAÇÃO S - É O DESVIO PADRÃO X - É A MEDIDA DOS DADOS O coeficiente de variação é dado em %, por isso a fórmula é multiplicada por 100. -------------------- AULA 6 ------------------- GRAFICOS - PARA A ELABORAÇÃO DE UM GRÁFICO DEVEM SER CONSIDERADOS OS SEGUINTES ITENS: A - UM TÍTULO GERAL, INDICANDO A SITUAÇÃO ESTUDADA, ÉPOCA E LOCAL; B - ESCALAS E AS RESPECTIVAS UNIDADES DE MEDIDA; C - CONVENÇÕES ADOTADAS; D - FONTE DE INFORMAÇÃO ASSINALANDO DE ONDE FORAM RETIRADOS OS VALORES. --- OS GRÁFICOS PODEM SER CLASSIFICADOS DE VÁRIAS MANEIRAS: 1 - QUANTO A FORMA A - DIAGRAMAS: GRÁFICOS GEOMÉTRICOS DISPOSTOS EM DUAS DIMENSÕES; B - CARTOGRAMAS: ILUSTRAÇÕES RELATIVAS A CARTAS GEOMÉTRICAS C - ESTEREOGRAMAS: GRÁFICOS VOLUMÉTRICOS COM TRÊS DIMENSÕES 2 - QUANTO AO USO A - GRAFICOS DE INFORMAÇÃO - DESTINADOS AO PÚBLICO EM GERAL, SENDO APRESENTADOS DE FORMA COMPLETA E CLARA. B - GRÁFICOS DE ANÁLISE - TABELAS DE INFORMAÇÃO TÉCNICA E QUALITATIVA. ---TIPOS DE GRÁFICOS --- - OS GRÁFICOS PODEM SE APRESENTAREM DIVERSOS TIPOS: 1 HISTOGRAMA - É FORMADO POR UM CONJUNTO DE RETâNGULOS, JUSTAPOSTOS DE TAL FORMA QUE A ÁREA DE CADA RETÂNGULO SEJA PROPORCIONAL À FREQUêNCIA DA CLASSE QUE ELE REPRESENTA. OS RETANGULOS TERÃO COMO BASE O EIXO DAS ABSCISSAS CUJA LARGURA SERÁ IGUAL A AMPLITUDE DO INTERVALO DE CLASSE 2 - DIAGRAMA - APRESENTA AS FREQUENCIAS SOB A FORMA DE COLUNAS VERTICAIS OU DE BARRAS. SÃO EMPREGADOS PARA REPRESENTAR FREQUENCIA DE DADOS CATEGORICOS OU NOMINAIS. 3 - GRÁFICO DE PARETO - REPRESENTA AS FREQUêNCIAS SIMPLES OU RELATIVAS DAS CLASSES OU DOS VALORES ANALISADOS, DE FORMA ORDENADA, GERALMENTE DA CLASSE DE MAIOR FREQUENCIA PARA A DE MENOR FREQUENCIA. É CONSIDERADO UMA FERRAMENTA PARA A QUALIDADE TOTAL, NO CAMPO DA GESTÃO DE EMPRESAS 4 - GRÁFICO DE OGIVA - REPRESENTA AS FREQUENCIAS GERALMENTE MOSTRADAS NO HISTOGRAMA 5 - GRAFICO BOXPLOT - REPRESENTA A DISPERSÃO DOS DADOS, REVELANDO A MEDIANA E OS QUARTIS (QUE SÃO MEDIDAS DE POSIÇÃO). ASSIM, É POSSÍVEL VERIFICAR A POSIÇÃO CENTRAL DO CONJUNTO ORDENADO DOS DADOS, DENOMINADO MEDIANA, E AS SUBDIVISÕES DAS SÉRIES ORDENADAS, DENOMINADAS QUARTIS. 6 - GRÁFICO DE SETORES - REPRESENTA AS FREQUENCIAS RELATIVAS OU SIMPLES SOBRE A FORMA DE SETORES DE CÍRCULO. TAMBÉM É DENOMINADO "GRÁFICO DE PIZZA". 7 - GRAFICO DE DISPERSÃO - MOSTRA A RELAÇÃO GRÁFICA EXISTENTE ENTRE DUAS VARIÁVEIS NUMÉRICAS, COMO CUSTOS E VENDAS 8 - PICTOGRAMA - CONSTRUÍDO A PARTIR DE FIGURAS OU CONJUNTOS DE FIGURAS REPRESENTATIVAS DA INTENSIDADE OU DAS MODALIDADES DO FENOMENO. **** FLAHAS NA ELABORAÇÃO DE GRÁFICOS A - GRÁFICO SUCATA B - AUSÊNCIA DE BASE RELATIVA C - EIXO VERTICAL COMPRIMIDO D - AUSêNCIA DO PONTO ZERO ----------------- AULA 7 ----- - DISTRIBUIÇÕES DE AMOSTRAGEM - ZENTGRAF (2007) APONTA QUE OS MÉTODOS DE AMOSTRAGEM PODEM APRESENTAR ALGUNS PROBLEMAS EM SUA APLICAÇÃO QUANDO: 1 - A POPULAÇÃO FOR MUITO PEQUENA 2 - OS DADOS DA POPULAÇÃO APRESENTAREM VOLATILIDADE ALTA 3 - HOUVER CASOS DE NECESSIDADE DE PREVISÃO ABSOLUTA 4 - OS DADOS DA POPULAÇÃO JÁ ESTIVEREM DISPONÍVEIS - A DISTRBUIÇÃO AMOSTRAL DE MÉDIAS, DE ACORDO COM LEVIN & FOX, POSSUEM ALGUMAS CARACTERÍSTICAS: " A MEDIDA QUE O TAMANHO DAS AMOSTRAS CRESCE, AS MÉDIAS DESSAS AMOSTRAS VÃO SE APROXIMANDO A UMA DISTRIBUÇÃO LIMITE QUE É A DISTRIBUIÇÃO NORMAL. ESTE É O TEREMA DO LIMITE CENTRAL. A MÉDICA DE UMA DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS (ÉDIA DAS MÉDIAS) É IGUAL A UMA VERDADEIRA MÉDIA POPULACIONAL. O DESVIO-PADRÃO DE UMA DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS É MENOR DO QUE A DA POPULAÇÃO. * NA PRÁTICA, UMA PESQUISA DIFICILMENTE É REALIZADA COM MAIS DE UMA OU DUAS AMOSTRAS. SERIA DIFÍCIL, DESSA FORMA, CHEGAR À CHAMADA MÉDICA DAS MÉDIAS. O ERRO PADRÃO DA MÉDIA E CALCULADA PELA DIVISÃO DO DESVIO PADRÃO DA POPULAÇÃO PELA RAIZ QUADRADA DO TAMAANHO DA AMOSTRA. --------------- AULA 8 ------------ - INTERVALOS DE CONFIANÇA - PARA COMPREENDERMOS A APLICAÇÃO DO INTERVALO DE CONFIANÇA, PRECISAMOS TER NOÇOES SOBRE A DISTRIBUIÇÃO DA CURVA NORMAL. CARACTERÍSTICAS DA DISTRIBUIÇÃO NORMAL: A - A VARIÁVEL PODE ASSUMIR QUALQUER VALOR REAL; B - O GRÁFICO DA DISTRIBUIÇÃO NORMAL É UMA CURVA EM FORMA DE SINO, SIMÉTRICA EM TORNO DA MÉDIA; C - A ÁREA TOTAL SOB A CURVA VALE 1, PORQUE CORRESPONDE A PROBABILIDADE DE A VARIÁVEL ALEATÓRIA ASSUMIR QUALQUER VALOR REAL; D - COMO A CURVA É SIMÉTRICA EM TORNO DA MÉDIA, OS VALORES MAIORES E OS MENORES DO QUE A MÉDICA OCORREM COM IGUAL PROBABILIDADE; E - A CONFIGURAÇÃO DA CURVA É DADA POR DOIS PARÂMETROS:A MÉDICA E A VARIÂNCIA. MUDANDO A MÉDIA, MUDA A POSIÇÃO DA DISTRIBUIÇÃO, MUDANDO A VARIÂNCIA, MUDA A DISPERSÃO DA DISTRIBUIÇÃO. * OS INTERVALOS DE CONFIANÇA MAIS UTILIZADOS SÃO OS DE 90%, 95% E 99%, SEGUINDO A TABELA: OS MODELOS DE APLICAÇÃO DO INTEVALO DE CONFIANÇA SÃO BASEADOS NA PREMISSA DE QUE A DISTRIBIÇÃO NORMAL PODE SER USADA COM OS SEGUINTES DADOS SEMPRE A AMOSTRA DEVE SER IGUAL\SUPERIOR A 30; QUANDO FOR MENOR DO QUE 30, O DESVIO PADRÃO É CONHECIDO. NUMERO DE UNIDADES DE DESVIO PROPORÇÃO VERIFICADA PADRÃO A PARTIR DA MÉDIA 1,645 90% 1,96 95% 2,58 99% * PARA CALCULAR UMA INTERVALO DE CONFIANÇA, UTILIZA-SE A SEGUINTE FORMULA: Xm+-Z o X Xm = MÉDIA Z = É O NÚMERO DE UNIDADES DE DESVIO PADRÃO A PARTIR DA MÉDIA o X = É O ERRO AMOSTRAL ---------------------- AULA 9 ------------- - DISTRIBUIÇÃO NORMAL DENOMINA-SE DISTRIBUIÇÃO NORMAL REDUZIDA A DISTRIBUIÇÃO NORMAL DE MÉDIA ZERO E VARIÂNCIA. AS PROBABILIDADES ASSOCIADAS À DISTRIBUIÇÃO NORMAL REDUZIDA, SÃO FACILMENTE OBTIDAS EM TABELAS (ÁREA SOB A CURVA NORMAL PADRONIZADA COMPREENDIDA ENTRE OS VALORES 0 E Z). DAÍ O INTERESSE EM ESTUDAR ESSE TIPO PARTICULAR DE DISTRBIUIÇÃO. ----------------- AULA 10 ------------------ TESTE DE HIPÓTESES TESTE DE HIPÓTESES É UM MÉTODO UTILIZADO PARA OBSERVARMOS SE DETERMINADOS DADOS SÃO COMPATÍVEIS OU NÃO COM ALGUMA HIPÓTESE LEVANTADA. ESTE PROCEDIMENTO ESTATÍSTICO TEM COMO BASE A OBSERVAÇÃO DE UMA AMOSTRA, SENDO A TEORIA DE PROBALBILIDADES UTILIZADA PARA VERIFICAR O COMPORTAMENTO DE PARAMETROS DESCONHECIDOS NUMA POPULAÇÃO. TESTE DE IPÓTESE PODE SER FEITO ATRAVÉS DE DUAS FORMAS: TESTES PARAMÉTRICOS TESTES NÃO PARAMêTRICOS * O USO TANTO DOS TESTES PARAMÉTRICOS COMO DOS NÃO PARAMÉTRICOS ESTÁ CONDICIONADO À DIMENSÃO DA AMOSTRA E À RESPECTIVA DISTRIBIIÇÃO DA VARIÁVEL EM ESTUDO. TESTES PARAMÉTRCOS SÃO BASEADOS. ** OS TESTES DE HIPÓTESES SÃO SEMPRE CONSTITUÍDOS POR 2 HIPÓTESES, A HIPÓTESE NULA H) E A HIPÓTESE ALTERNATIVA H1. - HIPÓTESE EXISTENTE, OU HIPÓTESE A SER TESTADA - H0, QUE SEMPRE ALEGA A IGUALDADE DE UM DETERMINADO PARAMETRO. - HIPOTESE ALTERNATIVA - H1, QUE SEMPRE ALEGA A DESIGULADADE DE UM DETERMINADO PARâMETRO. *** PARA A REALIZAÇÃO DOS TESTES DE HIPÓTESES, TEMOS QUE OBEDECER àS SEGUINTES ETAPAS: 1 - FORMULAÇÃO DO TESTE DE HIPÓTESES: HIPÓTESE NULA (H0) E ALTERNATIVA (H1) 2 - ESCOLHA DE DISTRIBUIÇÃO NORMAL ADEQUADA 3 - SELECIONAR O NÍVEL DE SIGNIFICâNCIA E REGIÃO CRÍTICA DO TESTE 4 - ESTABELECER REGRA DE DECISÃO 5 - SELECIONAR A AMOSTRA, CALCULAR A ESTATÍSTICA DE TESTE E INTERPRETAR SEUS RESULTADOS. * OS TESTES NÃO PARAMÉTRICOS ENVOLVEM CASOS EM QUE NÃO PODEMOS SUPOR CARACTERÍSTICAS DA POPULAÇÃO DE ONDE A AMOSTRA FOI EXTRAÍDA, COMO POR EXEMPLO, COMPORTAMENTO DE DISTRIBUIÇÃO NORMAL. SÃO OS PRINCIPAIS TESTES NÃO PARAMÊTRICOS. 1 - TESTE DO QUI-QUADRADO - UTILIZADO NA ANÁLISE DE FREQUêNCIAS, NO CASO DE ANÁLISE DE UMA CARACTERÍSTICA DA AMOSTRA. 2 - Teste do Qui-Quadrado para Independência ou Associação – utilizado na análise de frequências, no caso de análise de duas características da amostra. 3 - Teste dos Sinais – utilizado em casos emparelhados, ou seja, submetido a duas medidas. 4 - Teste de Wilcoxon – Analisa os dados emparelhados considerando também as magnitudes encontradas. 5 - Teste de Mann Whitney – Analisa se dois grupos originam-se de populações com médias diferentes. 6 -Teste da Mediana – Análise de grupos que originam-se de populações com medianas diferentes. 7 - Teste de Kruskal-Wallis - Análise de grupos que originam-se de populações com médias diferentes.
Compartilhar