Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA - Anotações de Aula - 72 h/Aula Professor Emerson Giovani Rabello Disciplina: Estatística Cursos: Administração de Empresas Ciências Contábeis 1º Semestre 2007 � SUMÁRIO 6UNIDADE 01: REVISÃO DA MATEMÁTICA ELEMENTAR 1. Conjuntos Numéricos 6 2. Números E Arredondamento 6 3. Frações 7 4. Razões 7 5. Porcentagem 8 6. Média Aritmética 8 7. Coeficientes Binomias 9 UNIDADE 02: NÚMEROS ÍNDICES 11 1. Números Índices: Noção Intuitiva 11 2. Definição De Números Índices 11 3. Números Índices Relativos De Preços 12 4. Elos De Relativos 12 5. Índices Agregativos 13 6. Índices De Custo De Vida 13 7. Deflacionamento 14 UNIDADE 03: A NATUREZA DA ESTATÍSTICA 16 1. Método Científico 16 2. Método Experimental 16 3. Método Estatístico 16 4. Definição De Estatística 16 5. Etapas Do Método Estatístico 16 UNIDADE 04: POPULAÇÃO E AMOSTRA 17 1. Variável 17 2. População 17 3. Amostra 17 4. Amostragem 17 5. Técnicas De Amostragem 18 UNIDADE 05: SÉRIES ESTATÍSTICAS 21 1. Tabelas Estatísticas 21 2. Séries Estatísticas 21 3. Dados Absolutos E Dados Relativos 23 UNIDADE 06: GRÁFICOS ESTATÍSTICOS 25 1. Gráfico Estatístico 25 2. Tipos De Gráficos Estatísticos 25 UNIDADE 07: DISTRIBUIÇÃO DE FREQUÊNCIA 29 1. Distribuição De Frequência 29 2. Elementos De Uma Distribuição De Frequência 29 3. Determinação Do Número De Classes E Intervalo 30 4. Tipos De Frequências 30 5. Representação Gráfica De Uma Distribuição 31 6. Formas Das Curvas De Frequência 32 UNIDADE 08: MEDIDAS DE POSIÇÃO 34 1. Introdução 34 2. Média ((X ) 34 3. Moda ( Mo ) 35 4. Mediana ( Md ) 37 5. Separatrizes 39 UNIDADE 09: MEDIDAS DE DISPERSÃO OU VARIABILIDADE 42 1. Definição De Dispersão 42 2. Amplitude Total (At) 42 3. Variância ( S2 ) 43 4. Desvio Padrão ( S ) 43 5. Coeficiente De Variação ( Cv ) 44 UNIDADE 10: MEDIDAS DE ASSIMETRIA E MEDIDAS DE CURTOSE 46 1. Medidas De Assimetria 46 2. Medidas De Curtose 47 UNIDADE 11: PROBABILIDADE 49 1. Experimento Aleatório 49 2. Espaço Amostral ( S ) 49 3. Ponto Amostral 49 4. Evento ( E ) 49 5. Probabilidade ( P ) 49 6. Eventos Complementares 51 7. Eventos Independentes 51 8. Eventos Mutuamente Exclusivos 51 UNIDADE 12: DISTRIBUIÇÃO BINOMIAL E DISTRIBUIÇÃO NORMAL 53 1. Distribuição De Probabilidade: Noção Intuitiva 53 2. Definição De Distribuição De Probabilidade 54 3. Distribuição Binomial 54 4. Distribuição Normal 55 UNIDADE 13: CORRELAÇÃO E REGRESSÃO 57 1. Correlação 57 2. Regressão 58 3. Interpolação E Extrapolação 58 UNIDADE 14: NOÇÕES BÁSICAS DE EXCEL 60 1. Introdução 60 2. Recursos 60 3. Funções 61 � � PLANEJAMENTO DAS AULAS AULAS CARGA HORÁRIA DESCRIÇÃO AULA 01 02 UNIDADE 01: REVISÃO DA MATEMÁTICA ELEMENTAR Números e Arredondamento; Frações; Razões e Porcentagem AULA 02 02 UNIDADE 01: REVISÃO DA MATEMÁTICA ELEMENTAR Porcentagem; Média Aritmética e Coeficientes Binomiais AULA 03 02 UNIDADE 02: NÚMEROS ÍNDICES Noção Intuitiva; Definição de N.º Índice e Índices Relativos de Preços AULA 04 02 UNIDADE 02: NÚMEROS ÍNDICES Elos de Base Móvel; Relativos em Cadeia; Índices Agregativos Simples e Ponderados AULA 05 02 UNIDADE 02: NÚMEROS ÍNDICES Índices de Custo de Vida e Deflacionamento AULA 06 02 UNIDADE 03: A NATUREZA DA ESTATÍSTICA Métodos Científico, Experimental e Estatístico; Definição e Etapas do Met. Estatístico AULA 07 02 UNIDADE 03: A NATUREZA DA ESTATÍSTICA Exercício sobre o Método Estatístico AULA 08 02 UNIDADE 04: POPULAÇÃO E AMOSTRA Definição de Variável, População, Amostra e Amostragem AULA 09 02 UNIDADE 04: POPULAÇÃO E AMOSTRA Amostragem Aleatória Simples; Amostragem Estratificada e Amostragem Sistemática AULA 10 02 UNIDADE 04: POPULAÇÃO E AMOSTRA Exercícios sobre Amostragem AULA 11 02 UNIDADE 05: SÉRIES ESTATÍSTICAS Tabelas; Séries Estatísticas; Valores Absolutos e Valores Relativos AULA 12 02 UNIDADE 06: GRÁFICOS ESTATÍSTICOS Gráficos Estatísticos e Principais tipos de Gráficos AULA 13 02 EXERCÍCIOS EM SALA (UNIDADE 05 E UNIDADE 06) AULA 14 02 UNIDADE 07: DISTRIBUIÇÃO DE FREQUÊNCIA Definição Distribuição de Freqüência.; Elementos de uma Distribuição de Freqüência AULA 15 02 UNIDADE 07: DISTRIBUIÇÃO DE FREQUÊNCIA Determinação do Nº de Classes e Intervalo e Tipos de Freqüências AULA 16 02 UNIDADE 07: DISTRIBUIÇÃO DE FREQUÊNCIA Representação Gráfica e Formas das Curvas de Freqüência AULA 17 02 EXERCÍCIOS (Prazo Limite para Entrega das Listas de Exercícios 01 a 07) AULA 18 02 AVALIAÇÃO INTERMEDIÁRIA (Valor 30 Pontos) � AULAS CARGA HORÁRIA DESCRIÇÃO AULA 19 02 UNIDADE 08: MEDIDAS DE POSIÇÃO Cálculo da Média para Dados Não Agrupados e Agrupados Com e Sem Intervalos AULA 20 02 UNIDADE 08: MEDIDAS DE POSIÇÃO Cálculo da Moda para Dados Não Agrupados e Agrupados Com e Sem Intervalos AULA 21 02 UNIDADE 08: MEDIDAS DE POSIÇÃO Cálculo da Mediana para Dados Não Agrupados e Agrupados Com e Sem Intervalos AULA 22 02 UNIDADE 08: MEDIDAS DE POSIÇÃO Separatrizes (Quartil e Porcentil) e Exercícios AULA 23 02 UNIDADE 09: MEDIDAS DE DISPERSÃO OU VARIABILIDADE Definição de Dispersão; Amplitude Total; Variância e Desvio Padrão AULA 24 02 UNIDADE 09: MEDIDAS DE DISPERSÃO OU VARIABILIDADE Coeficiente de Variação e Exercícios AULA 25 02 UNIDADE 10: MEDIDAS DE ASSIMETRIA E MEDIDAS DE CURTOSE Simetria; Assimetria; Coeficiente de Assimetria e Curtose AULA 26 02 UNIDADE 10: MEDIDAS DE ASSIMETRIA E MEDIDAS DE CURTOSE Exercícios AULA 27 02 UNIDADE 11: PROBABILIDADE Definição: Experimento Aleatório; Espaço Amostral; Ponto Amostral e Eventos AULA 28 02 UNIDADE 11: PROBABILIDADE Definição de Probabilidade; Eventos Complementares, Independentes e Mutuamente Exclusivos AULA 29 02 UNIDADE 11: PROBABILIDADE Exercícios AULA 30 02 UNIDADE 12: DISTRIBUIÇÃO BINOMIAL E DISTRIBUIÇÃO NORMAL Definição de Distribuição de Probabilidade e Distribuição Binomial AULA 31 02 UNIDADE 12: DISTRIBUIÇÃO BINOMIAL E DISTRIBUIÇÃO NORMAL Definição de Distribuição Normal; Distribuição Normal Reduzida e Exercícios AULA 32 02 UNIDADE 13: CORRELAÇÃO E REGRESSÃO Definição de Correlação; Tipos de Correlação e Cálculo do Coeficiente de Correlação AULA 33 02 UNIDADE 13: CORRELAÇÃO E REGRESSÃO Regressão Linear e Interpolação e Extrapolação AULA 34 02 UNIDADE 14: NOÇÕES BÁSICAS DE EXCEL Funções Estatísticas AULA 35 02 EXERCÍCIOS (Prazo Limite para Entrega das Listas de Exercícios 08 a 13) AULA 36 02 PROVA FINAL (Valor 30 Pontos) TOTAL 72 HORAS / AULA � UNIDADE 01: REVISÃO DA MATEMÁTICA ELEMENTAR CONJUNTOS NUMÉRICOS Naturais: ( = { 0, 1, 2, 3, 4 ...........} Inteiros: ( = { ..., -3, -2, -1, 0, 1, 2, 3, ......} Racionais: Q = { x = p/q , onde “p” e “q” ( ( e “q” ( 0 } Reais: R = { números racionais e números irracionais } NÚMEROS E ARREDONDAMENTO Os Números resultam de uma mensuração que pode ser exata, quando assume uma forma de contagem (valores discretos) ou aproximada, quando provem de uma escala contínua. Muitas vezes é necessário ou conveniente suprimir unidades inferiores às de determinada ordem. De acordo com a resolução 866/66 da Fundação IBGE, o arredondamento deve ser feito da seguinte maneira: Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3 ou 4, fica inalterado o último algarismo a permanecer. Exemplo: 53,24 ( 53,2 Quando o primeiro algarismo a ser abandonado é 6, 7, 8, ou 9, aumenta-se de uma unidade o algarismo a permanecer. Exemplo: 42,87 ( 42,9 Quando o primeiro algarismo a ser abandonado é 5 seguido de qualquer algarismo diferente de zero, aumenta-se de uma unidade o algarismo a permanecer. Exemplos: 2,352 ( 2,4 25,6501 ( 25,7 76,250002 ( 76,3 Quando o último algarismo a ser abandonadoé 5 (seguido ou não de zeros), o último algarismo a ser conservado só será aumentado de uma unidade se for ímpar. Exemplos: 24,75 ( 24,8 12,65 ( 12,6 24,7500 ( 24,8 24,6500 ( 24,6 OBS: Não se deve fazer arredondamentos sucessivos O Erro é a diferença entre o valor real da medida e o valor considerado. Exemplo: Um funcionário da prefeitura mede uma rua com o objetivo de numerar as casas em relação às medidas obtidas. O portão da casa do Sr. Antônio está a 21,5 m do início da rua (pelo lado direito). O funcionário dá o nº 21 à residência em questão, cometendo um erro de 0,5 m. Exemplo: Um operário mede o comprimento de uma sala para a colocação de um piso. A medida obtida é de 3,5 m, mas o operário anota apenas 3 m, cometendo um erro de 0,5 m. Se a largura da sala for de 2,3 m, tem-se: Área Real: 3,5 * 2,3 = 8,05 m2. Área Operário: 3 * 2,3 = 6,9 m2. Erro na Área: 8,05 – 6,9 = 1,15 m2. FRAÇÕES Fração é um número pertencente ao conjunto do números racionais (Q) na forma: x = p/q , sendo “p” e “q” ( ( e “q” ( 0. Fração Própria: é aquela cujo numerador é menor que o denominador. Exemplo: Fração Imprópria: é aquela cujo numerador é maior (ou igual) que o denominador. Exemplo: Fração Aparente: é uma fração Imprópria cujo numerador é um múltiplo do denominador. Exemplo: Para simplificar frações basta obter uma fração equivalente, dividindo-se o numerador e o denominador por um mesmo número. Exemplo: Para se comparar frações deve-se reduzir as frações a um mesmo denominador (cálculo do m.m.c.), e em seguida, comparar os numeradores. A maior fração será a que possuir o maior numerador. Exemplo: Comparar Operações com Fração: Soma: Multiplicação: Divisão: Frações Decimais: são frações cujos denominadores são potências de 10. Exemplos: RAZÕES Razão é quociente dos números que expressam as grandezas. Exemplo: Um automóvel percorre 36 km com 4 litros de álcool. Qual a razão entre a distância percorrida e o consumo de combustível? PORCENTAGEM Porcentagem é uma fração cujo o denominador é igual a 100. Exemplos: Os problemas de porcentagem podem ser resolvidos com a aplicação de uma Regra de Três Simples. Exemplo: Em uma classe de 40 alunos, 32 foram aprovados. Qual o percentual de aprovação? Exemplo: Ao comprar um livro, obtive um desconto de $3,00. Qual o preço do livro, sabendo que a taxa de desconto foi de 5%? Exemplo: Uma pessoa pagou $20,00 por uma diária em uma pousada, com 15% de desconto. Qual foi o desconto? MÉDIA ARITMÉTICA Média Aritmética Simples de um conjunto de valores é o quociente da soma desses valores pelo número total deles. Média Aritmética Ponderada de um conjunto de valores é o quociente da soma dos produtos dos valores pelo respectivos pesos e a soma dos pesos. Exemplo: Calcule a média do seguinte conjunto de valores: 2, 3, 4, 5, 6. Exemplo: Sabendo que um aluno obteve as notas 7, 6, 5 e 8 e que essas notas têm, respectivamente, os pesos 2, 2, 3 e 3, calcule a média: COEFICIENTES BINOMIAS Fatorial de um número (n!) é o produto de todos os números naturais de n até 1 Exemplos: 2! = 2 x 1 = 2 3! = 3 x 2 x 1 = 6 4! = 4 x 3 x 2 x 1 = 24 0! = 1 (por definição) 1! = 1 (por definição) Coeficiente Binomial de um número n sobre k, ou simplesmente, binomial de n sobre k é definido por: Exemplos: LISTA DE EXERCÍCIOS 01: Arredonde os números a seguir, deixando-os com uma casa decimal: a. 2,38 b. 24,65 c. 0,351 d. 4,24 e. 6,829 f. 5,550 g. 2,97 h. 89,99 Arredonde os números a seguir, deixando-os com duas casas decimais: a. 46,727 b. 253,651 c. 28,255 d. 37,842 e. 299,951 f. 45,237 g. 120,4500 h. 123,842 Arredonde os números a seguir, com a precisão de uma unidade: a. 26,6 b. 67,5 c. 128,5 d. 49,98 e. 68,2 f. 39,49 Que fração da semana corresponde 1 dia? Que fração do mês de fevereiro corresponde uma semana? Simplifique: a. 3 / 8 b. 15 / 30 c. 121 / 11 d. 96 / 144 e. 34 / 6 f. 360 / 600 Escreva em ordem crescente: a. b. Efetue: a. b. c. d. e. f. Represente na forma decimal: a. b. c. d. Represente na forma de fração: a. 0,7 b. 0,12 c. 12,75 d. 0,018 Em uma classe de 60 alunos faltaram 15. Qual a taxa de freqüência? Em SP colheram-se 1300000 sacas de café. Se 25% dessa produção destina-se ao consumo interno, qual a quantidade de sacas consumida internamente? Um nota promissória, cujo valor de face era de $50000,00, foi paga com um desconto de $2500,00. Qual a taxa de desconto? 40% dos alunos de uma escola são meninos. O total de alunos e alunas é de 2500. Quantos são os alunos e alunas da escola? � UNIDADE 02: NÚMEROS ÍNDICES NÚMEROS ÍNDICES: NOÇÃO INTUITIVA Exemplo: Considere a tabela pertinente à intenção de votos em 6 cidades. Investigue a incidência de votos em branco. Tabela 01: Intenção de Votos (Dados Absolutos) Cidade Candidato X Candidato Y Votos Brancos Votos Nulos População Entrevistada A 39544 30279 980 11549 82352 B 48872 19897 787 6210 45766 C 8139 4903 177 1324 14543 D 16263 8659 464 2997 28383 E 746 899 45 216 1906 F 3149 3120 93 517 6879 Em uma primeira análise, a cidade A apresenta o maior nº de votos em branco. Entretanto, utilizando os valores relativos (%) pode-se fazer uma análise mais detalhada: Tabela 02: Intenção de Votos (Dados Relativos) Cidade Votos Brancos População Entrevistada Votos Brancos (%) A 980 82352 1,2 B 787 45766 1,7 C 177 14543 1,2 D 464 28383 1,6 E 45 1906 2,4 F 93 6879 1,4 A cidade que apresenta um maior índice de votos brancos é a cidade E. Como visto no exemplo, muitas vezes é necessário analisar um conjunto de dados por meio de um indicador (índice). DEFINIÇÃO DE NÚMEROS ÍNDICES Número Índice é a relação entre dois estados de uma variável (ou grupo de variáveis), suscetível de variação no tempo ou espaço. O Índice representa a variação de um fenômeno em relação a um estado anterior ou de referência. Exemplo: Tabela 03: Nº de Matrículas na Escola XX Anos 1989 1990 1991 1992 1993 1994 Nº Matrículas 1050 1150 1200 1400 1560 1700 Índice (%) 100 109,5 114,3 133,3 148,6 161,9 Considerando o ano de 1989 como referencial, percebe-se um aumento progressivo das matrículas ao longo dos anos: 9,5% ( 14,3% ( 33,3% ( 48,6% ( 61,9%. NÚMEROS ÍNDICES RELATIVOS DE PREÇOS Números Índices Relativos de Preços representam a variação no preço de um bem em relação a um determinado período de tempo. Da mesma forma, pode-se utilizar o mesmo raciocínio para quantidades, valores, etc. Exemplo: Sabendo que o preço de um produto era de $50 em 1994 ede $60 em 1995, determine o relativo de preço em 1995, considerando como base o ano de 1994. ELOS DE RELATIVOS Relativos de Base Móvel: vários relativos formam elos quando cada um deles é calculado tomando como base o ano anterior. Exemplo: O preço de um produto apresentou no período de 1991 a 1994, respectivamente, os preços $240, $300, $360 e $540. Calcule os elos de relativos (Base Móvel). Relativos em Cadeia: são relativos de base-fixa, ou seja, todos os relativos do elo são calculados tomando-se uma mesma época de referência. Exemplo: No exemplo anterior, calcule os relativos em cadeia, considerando o ano de 1991 como base. ÍNDICES AGREGATIVOS Índices Agregativos representam a variação de preços de um conjunto de bens. Índice Agregativo Simples: calculado pela média aritmética simples dos relativos. Exemplo: Tabela 04: Relativos de Preços (1993 – 1994) Bens RELATIVOS DE PREÇOS (%) 1993 1994 A 100 150 B 100 125 C 100 160 Índice Agregativo Ponderado: calculado com coeficientes de ponderação (q) atribuídos à cada item, dependendo da importância de cada um (média aritmética ponderada). Fórmula de Laspeyres ou Método da Época-Base: Exemplo: Tabela 04: Preços de Bens Produzidos (1993 – 1994) Bens PREÇOS ($) 1993 1994 P q P q A 20 4 28 3 B 40 3 56 3 C 15 8 30 12 ÍNDICES DE CUSTO DE VIDA Índices de Custo de Vida (ICV) ou Índices de Preços ao Consumidor (IPC)são Números Índices que procuram medir a variação dos preços de um conjunto de bens e serviços, necessários à vida de um consumidor padrão (família padrão). É evidente que devem ser considerados preços de bens ou serviços consumidos em alimentação, vestuário, transporte, saúde, educação, serviços públicos e lazer. Sua metodologia de cálculo inclui a listagem de bens e serviços consumidos e respectivas porcentagens de gastos. Aplica-se a fórmula de Laspeyres para cada grupo e finalmente calcula-se a média ponderada dos preços vs. Porcentagens de todos os grupos. Exemplos: IPC (Índice de Preços ao Consumidor): Família com renda bruta entre 1 e 8 salários mínimos. Coleta de preços feita pelo IBGE em 10 regiões metropolitanas Período de pesquisa: dia 16 ao dia 15 do mês subsequente. ICB (Índice da Cesta Básica): Família com renda bruta entre 1 e 2 salários mínimos. IGP (Índice Geral de Preços): Calculado pela FGV pela média ponderada dos seguintes índices: Índice de Preços por Atacado (60%); Índice de Custo de Vida (30%) e Índice da construção Civil (10%), na cidade do Rio de Janeiro. DEFLACIONAMENTO Problema: Sabendo-se que um assalariado, em 1º de maio de 2004, ganhava X reais por mês, qual deveria ser o seu salário em 1º de maio de 2005 para que ele pudesse comprar os mesmos bens e serviços que no ano de 2004? Este problema trata da conversão dos Salários Nominais em Salários Reais (Poder Real de Compra). Para se calcular os Salários Reais (SR), divide-se os Salários Nominais da época em questão (ST) pelo Índice de Preços (IPT) da mesma época: Assim, se o salário de um administrador em dezembro de 2006 era de $1071 e o IGP era de 101,24%, o poder aquisitivo desse Administrador em 2006 é: Comparando os salários ST = 1071 e SR = 1058, constata-se uma redução no poder de compra (DEFLACIONAMENTO). LISTA DE EXERCÍCIOS 02: Considere a tabela: Tabela 01: Quantidade de Bens Produzidos (1991 – 1994) Bens Anos 1991 1992 1993 1994 Veículos (mil unidades) 1128,0 1165,2 780,9 859,3 Cimento (milhões de t) 24,9 27,2 26,1 25,4 Aço (milhões de t) 13,9 15,2 13,1 12,9 Petróleo (milhões de m3) 9,6 10,6 12,4 15,1 Considerando o ano de 1991 como referência, calcule os relativos em cadeia para cada tipo de bem. Represente graficamente os índices calculados anteriormente. Considere a tabela: Tabela 02: Faturamento de uma Empresa (1991 – 1994) Ano FATURAMENTO ( $ ) IP1990 = 100 91 180000 140,8 92 220000 291,1 93 430000 362,5 94 480000 410,3 Qual a evolução do faturamento real da empresa? Represente graficamente a evolução (Base: Ano 1990). Considerando o ano de 1991 como referência, calcule a evolução do faturamento real da empresa. Represente graficamente a evolução (Base: Ano 1991). � UNIDADE 03: A NATUREZA DA ESTATÍSTICA MÉTODO CIENTÍFICO O Método científico é caracterizado pelo conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. MÉTODO EXPERIMENTAL O Método Experimental consiste em manter constantes todas as causas (fatores), exceto uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. MÉTODO ESTATÍSTICO Na impossibilidade de se manter constante todas as causas de um determinado fenômeno a ser estudado, admite-se a variação de todas as causas, buscando-se registrar essas variações para se constatar as influências dessas causas sobre o fenômeno. DEFINIÇÃO DE ESTATÍSTICA Estatística é a parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados, para auxiliar no processo de tomada de decisão. ETAPAS DO MÉTODO ESTATÍSTICO Planejamento: definição do assunto e característica a ser estudada. Coleta de Dados: obtenção dos dados para descrição do fenômeno a ser estudado Crítica dos Dados: verificação dos dados coletados, eliminando possíveis fontes de erros. Apuração dos Dados: cálculos e processamento dos dados. Exposição ou Apresentação dos Dados: síntese e organização dos dados Análise dos Resultados: avaliação e dos dados e obtenção de conclusões, a partir das amostras analisadas. LISTA DE EXERCÍCIOS 03: Ler o Capítulo 1: A Natureza da Estatística do livro: Estatística Fácil (Antônio Arnot Crespo). Resolver os exercícios propostos no capítulo. � UNIDADE 04: POPULAÇÃO E AMOSTRA VARIÁVEL Variável é o conjunto dos resultados possíveis de um determinado fenômeno. Exemplos: Para o fenômeno “sexo”, são dois os resultados possíveis: masculino e feminino. Para o fenômeno “nº de filhos” há um número de resultados possíveis, expressos pelo números naturais: 0, 1, 2, 3, .....n Para o fenômeno “estatura” há infinitos resultados possíveis. Os exemplos anteriores mostram que as variáveis podem ser: QUALITATIVAS: quando seus valores são expressos por atributos (Exemplos: cor da pele, sexo, etc.). QUANTITATIVAS: quando seus valores são expressos por números (Exemplos: altura, volume, etc.). Uma variável QUANTITATIVA pode ser: CONTÍNUA: quando a variável pode assumir qualquer valor entre dois limites. DISCRETA: quando a variável só pode assumir valores pertencentes a um conjunto enumerável. Exemplos: Nº de alunos de uma escola: DISCRETA, pois só pode receber valores inteiros positivos (Não existe 2,5 alunos). Peso de alunos: CONTÍNUA, pois um aluno pode pesar 72 kg, como 72,5 kg ou diversos valores dependendo da precisão da balança. POPULAÇÃO População é o conjunto de entidades portadoras de, pelo menos, uma característica comum. Exemplo: Os estudantes constituem uma população, pois apresentam uma característica comum (ocupação). As mulheres da empresa, pois possuem uma caraterística comum (sexo). AMOSTRA Amostra é um sub-conjunto finito da população. Em geral, é necessário garantir que a amostra seja representativa da população. AMOSTRAGEM Amostragem é a técnica utilizada para se recolher amostras representativas de uma dada população. Exemplo: Exame de sangue. Tempero da comida. Escolha de passageiros para revista de bagagem em aeroportos. A amostragem é necessária por questões relacionadasa: Economia. Tempo. Operacionalidade. Em geral, recomenda-se que o nº de elementos de uma amostra (n) não seja inferior a 10 % da população (N). TÉCNICAS DE AMOSTRAGEM AMOSTRAGEM CASUAL ou ALEATÓRIA SIMPLES Este tipo de amostragem é equivalente a um sorteio, e é recomendada quando se tem uma população homogênea. Normalmente são adotados sorteios simples, mas quando o número de elementos da população é muito grande, pode-se utilizar uma Tabela de Números Aleatórios. Exemplo: Considerando a Tabela de Números Aleatórios, obtenha uma seqüência de 7 amostras de uma população de 100 elementos. 6 1 6 2 7 7 5 5 6 7 0 4 7 1 3 3 9 0 3 0 5 6 3 4 3 5 1 7 6 0 8 5 4 5 4 3 0 9 6 1 6 1 3 1 2 1 4 0 9 6 8 1 7 4 2 5 0 2 9 6 3 9 2 5 8 0 7 0 8 0 7 5 8 6 1 4 0 0 1 9 0 3 4 8 4 8 1 2 7 3 9 9 2 0 6 6 0 2 1 1 7 6 0 3 6 5 8 5 8 7 2 7 0 4 8 5 8 8 7 7 7 3 6 2 7 2 2 5 4 3 2 6 4 0 6 4 4 6 6 8 8 5 1 7 7 5 8 7 0 8 8 1 0 7 1 5 9 2 2 9 0 1 9 0 8 5 4 9 7 8 2 9 9 0 5 2 0 0 8 4 1 6 8 8 5 2 4 4 2 0 7 2 4 6 3 2 1 8 0 1 8 4 7 1 3 3 5 1 6 2 9 0 8 1 5 0 6 2 3 6 9 7 9 8 8 7 6 7 5 7 6 4 5 3 7 1 6 8 2 8 9 5 5 9 0 2 2 7 5 5 3 5 7 6 2 8 2 4 0 0 3 4 6 6 4 8 8 5 6 3 8 9 9 7 8 1 5 9 2 3 2 1 1 3 6 4 0 7 5 2 4 9 4 8 7 0 0 4 4 1 5 5 9 5 7 2 7 9 7 0 5 3 0 9 5 1 7 7 7 2 0 0 0 1 8 2 9 5 2 0 2 2 2 2 9 7 7 9 7 8 1 3 4 4 6 7 4 9 6 9 9 6 1 2 7 6 4 0 0 4 9 1 9 5 3 6 6 8 8 6 0 8 1 6 3 1 4 2 0 2 8 1 2 0 5 7 4 4 5 5 4 5 8 1 0 0 6 1 3 7 3 4 0 8 4 2 3 0 Por um sorteio simples, escolheu-se a linha 10 da Tabela de Números Aleatórios. Desta linha, podem ser retirados números de 2 dígitos para representar a seqüência das amostras: n = { 71, 59, 22, 90, 19, 08, 54 } AMOSTRAGEM PROPORCIONAL ESTRATIFICADA Neste tipo de amostragem a população é dividida proporcionalmente em sub-conjuntos (estratos). Exemplo: Considere uma empresa com 90 funcionários, sendo 54 homens e 36 mulheres. Deseja-se recolher uma amostra de 10% dos funcionários para uma pesquisa interna sobre um determinado assunto. Obtenha um Plano de Amostragem Estratificada pelo sexo dos funcionários. Sexo População 10 % Amostra M 54 5 F 36 4 TOTAL 90 9 AMOSTRAGEM PROPORCIONAL UNIFORME Neste tipo de amostragem a população é dividida proporcionalmente em sub-conjuntos (estratos) com o mesmo número de elementos. Exemplo: Professores: P1, P2, .........Pn Servidores: S1, S2, .........Sn Alunos: A1, A2, .........An AMOSTRAGEM SISTEMÁTICA Este é um tipo de amostragem aleatória, na qual os elementos da população se encontram ordenados. Exemplo: Uma empresa mantém em seus arquivos o registro de antigos clientes. Dentre um total de 10000 fichas, pode-se tirar de forma sistemática uma ficha a cada 10, totalizando uma amostra de 1000 fichas (10%). Para garantir a mesma probabilidade de retirada de cada ficha, deverá ser feito um sorteio entre as 10 primeiras fichas. Intervalo de Seleção: Suponha que a primeira ficha sorteada foi a de número 4. Assim, as fichas que irão compor a amostra são: n = { 4, 14, 24, 34, 44, 54, 64, ............9984, 9994 } LISTA DE EXERCÍCIOS 04: Classifique as variáveis em qualitativa ou quantitativa (contínua ou discreta): Cor dos Cabelos Nº de filhos Resultado da jogada de um dado Nº de hóspedes em um hotel Diâmetro de peças produzidas em uma máquina Você fará uma pesquisa para conhecer a preferência de lazer de adolescentes. A população é composta por 68 meninas e 49 meninos. Na impossibilidade de entrevistar todos, faça um levantamento por amostragem em 12 % dos adolescentes. Obtenha os componentes proporcionais estratificados por sexo da amostra. Foi realizada uma pesquisa sobre quem irá à viagem de formatura em diversas escolas da cidade X. A população envolvida na pesquisa é apresentada a seguir. Baseando-se nesses dados, estratifique uma amostra proporcional com 300 alunos. Escola População A 350 B 540 C 480 D 260 E 280 F 410 TOTAL 2310 Com o objetivo de se verificar qual o tipo de refeição de refeição deveria ser servido em um evento, selecionou-se uma amostra de 250 pessoas, sorteados entre 2000. Que tipo de amostragem foi utilizada? Um grupo de hotéis-fazenda promove acampamentos com atividades monitoradas de lazer para jovens, conforme mostrado a seguir. Elabore um Plano de Amostragem contendo 120 jovens, determinando o nº de jovens do sexo masculino e feminino de cada acampamento. Acampamento N º de Jovens Masculino Feminino A 129 102 B 97 109 C 108 89 D 149 127 E 94 113 F 118 131 G 145 124 TOTAL 840 795 Havendo interesse em fazer um estudo que pudesse estabelecer a relação entre a faixa salarial e o interesse por cinema, foi considerado um grupo de 1800 pessoas. A tabela a seguir indica o nº de pessoas por faixa salarial. Determine uma amostra estratificada de 225 pessoas. Faixa Salarial Nº Pessoas Até 3 SM 883 De 3 a 6 SM 479 De 6 a 9 SM 285 Acima de 9 SM 153 TOTAL 1800 � UNIDADE 05: SÉRIES ESTATÍSTICAS TABELAS ESTATÍSTICAS Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, de forma a fornecer uma “visão global” do comportamento dessas variáveis. Assim, são utilizadas Tabelas e Gráficos para essa síntese e apresentação dos resultados obtidos. TABELA: quadro que resume um conjunto de observações COMPOSIÇÃO DE UMA TABELA: Corpo: conjunto de linhas e colunas que contém as informações sobre a variável em estudo. Cabeçalho: parte superior da tabela que especifica o conteúdo das colunas. Coluna Indicadora: parte da tabela que especifica o conteúdo das linhas. Linhas: retas imaginárias (horizontais) que facilitam a leitura. Casas ou Células: espaços destinados aos valores. Título: conjunto de informações que esclarecem a natureza dos dados apresentados na tabela. Rodapé: Fonte ou referência. Exemplo: Tabela 01: Produção de Café no Brasil (1991 – 1995) Anos Produção (1000 t) 1991 2535 1992 2666 1993 2122 1994 3750 1995 2007 Fonte: IBGE SÉRIES ESTATÍSTICAS Toda Tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou espécie. TIPOS DE SÉRIES: SÉRIES HISTÓRICAS, CRONOLÓGICAS, TEMPORAIS OU MARCHAS Descrevem os valores em um determinado local, discriminados segundo intervalos de tempo ou períodos. SÉRIES GEOGRÁFICAS, ESPACIAIS, TERRITORIAIS OU DE LOCALIZAÇÃO Descrevem os valores em um determinado instante, discriminados segundo regiões. SÉRIES ESPECIAIS OU CATEGÓRICAS Descrevem os valores em um determinado tempo e local, discriminados segundo especificações ou categorias. SÉRIES CONJUGADAS OU DUPLA ENTRADA Representam a fusão de duas ou mais formas de discriminação. Exemplos: Série Temporal Tabela 02: Entrada de Argentinos no Brasil (1991 – 1995) Ano Nº de Turistas 1994 787117 1995 1467922 1996 1548571 Fonte: OMT Série Geográfica Tabela 03: Falta de Água Encanada 1995 Continente % Cidades África 28 América Latina 7 Ásia 63 Europa 2 Fonte: OMS Série Categórica Tabela 04: O que vai fazer com o 13º Salário (Consumidores de SP – Dezembro 2000) Continente % Pagar dívidas 53 Fazer compras 14 Poupar 14 Investir 7 Férias 6 Outros 6 Fonte: Folha de SPSéries Conjugadas Tabela 05: Terminais Telefônicos em Serviço Regiões 1991 1992 1993 Norte 342938 375658 403494 Nordeste 1287813 1379101 1486649 Sudeste 6234501 6729467 7231634 Sul 1497315 1608989 1746232 Centro-Oeste 713357 778925 884822 Fonte: Ministério das Comunicações DADOS ABSOLUTOS E DADOS RELATIVOS Dados Absolutos: são dados obtidos na forma direta (sem processamento). Dados Relativos: são dados obtidos por comparação ou razões entre os valores obtidos na coleta direta. Em geral são expressos em porcentagem, números índices, taxas, etc. Exemplo: A população de crianças envolvidas em uma pesquisa é apresentada na tabela a seguir. Calcule o percentual de crianças em cada escola. Tabela 06: Distribuição de crianças por escola Escola População % A 350 (350 / 2320) * 100 = 15,1 B 540 (540 / 2320) * 100 = 23,3 C 480 (480 / 2320) * 100 = 20,7 D 260 (260 / 2320) * 100 = 11,2 E 280 (280 / 2320) * 100 = 12,1 F 410 (410 / 2320) * 100 = 17,6 TOTAL 2320 100 Fonte: Pesquisa Particular LISTA DE EXERCÍCIOS 05: Classifique as Séries: ª Produção de Borracha Natural (1991 – 1993) Ano Toneladas 1991 29543 1992 30712 1993 40663 Fonte: IBGE b. Avicultura Brasileira (1992) Ano Nº (1000 unid) Galinhas 204160 Frangos 435465 Codornas 2488 Fonte: IBGE c. Produção Brasileira Aço Bruto (1991-93) Processo Quantidade (1000 t) 1991 1992 1993 Oxigênio 17934 18849 19698 Forno Elétrico 4274 4637 5065 EOF 409 448 444 Fonte: Instituto Brasileiro de Siderurgia O nº de turistas que visitam mensalmente um balneário em SP está apresentado na tabela a seguir. Calcule o percentual de turista em cada mês e faça uma análise dos dados. Turistas em Balneário SP (2001) Mês Nº Turistas Janeiro 41094 Fevereiro 32827 Março 19660 Abril 13695 Maio 23653 Junho 11786 Julho 29022 Agosto 21486 Setembro 24055 Outubro 2853 Novembro 20175 Dezembro 25400 Fonte: Secretaria de Turismo SP Procure exemplos de Séries Estatísticas em jornais e revistas. Guarde esse material para análise em sala de aula. � UNIDADE 06: GRÁFICOS ESTATÍSTICOS GRÁFICO ESTATÍSTICO Gráfico Estatístico: é uma forma de apresentação dos dados estatísticos cujo objetivo é o de produzir no investigador ou público uma impressão mais rápida e “viva” do fenômeno em estudo. TIPOS DE GRÁFICOS ESTATÍSTICOS GRÁFICO EM LINHA OU CURVA Este tipo de gráfico utiliza linhas poligonais para representar os dados em um sistema cartesiano de coordenadas (eixo das abscissas – x, e eixo das ordenadas – y). GRÁFICO EM COLUNAS Este tipo de gráfico utiliza retângulos verticais para representar os dados de uma série, sendo que a área desses retângulos são proporcionais à grandeza representada. GRÁFICO EM BARRAS Este tipo de gráfico utiliza retângulos horizontais para representar os dados de uma série, sendo que a área desses retângulos são proporcionais à grandeza representada. GRÁFICO EM COLUNAS OU BARRAS MÚLTIPLAS Este tipo de gráfico é geralmente empregado para representar, simultaneamente, dois ou mais fenômenos estudados, com o propósito de comparação. GRÁFICO EM SETORES Este tipo de gráfico é construído com base em um círculo, e é empregado quando deseja-se ressaltar a participação de um determinado dado em relação a ao total. Deve-se utilizar dados relativos. GRÁFICO POLAR Este tipo de gráfico é ideal para representar séries temporais cíclicas, ou seja, séries que apresentam em seu desenvolvimento determinada periodicidade. CARTOGRAMA O cartograma é a representação sobre uma carta cartográfica. PICTOGRAMA Este tipo de gráfico é representado por figuras, constituindo uma forma mais comunicativa e atraente para o usuário. LISTA DE EXERCÍCIOS 06: Representar em um Gráfico de Linha as séries: Produção de Borracha Natural (1991 – 1993) Ano Toneladas 1991 29543 1992 30712 1993 40663 Fonte: IBGE Avicultura Brasileira (1992) Ano Nº (1000 unid) Galinhas 204160 Frangos 435465 Codornas 2488 Fonte: IBGE Turistas em Balneário SP (2001) Mês Nº Turistas Janeiro 41094 Fevereiro 32827 Março 19660 Abril 13695 Maio 23653 Junho 11786 Julho 29022 Agosto 21486 Setembro 24055 Outubro 2853 Novembro 20175 Dezembro 25400 Fonte: Secretaria de Turismo SP Representar em um Gráfico de Colunas a seguinte série: Produção Brasileira Aço Bruto (1991-93) Processo Quantidade (1000 t) 1991 1992 1993 Oxigênio 17934 18849 19698 Forno Elétrico 4274 4637 5065 EOF 409 448 444 Fonte: Instituto Brasileiro de Siderurgia Procure exemplos de Gráficos Estatísticos em jornais e revistas. Guarde esse material para análise em sala de aula. � UNIDADE 07: DISTRIBUIÇÃO DE FREQUÊNCIA DISTRIBUIÇÃO DE FREQUÊNCIA Exemplo 01: Considere a tabela a seguir: Tabela 01: Estatura de 40 alunos do Colégio A (cm) 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Pode-se organizar os dados da seguinte maneira (Distribuição de Freqüência): Estatura (cm) Contagem freqüência 150 154 I I I I 4 154 158 I I I I I I I I I 9 158 162 I I I I I I I I I I I 11 162 166 I I I I I I I I 8 166 170 I I I I I 5 170 174 I I I 3 TOTAL 40 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA Classes de Freqüência ( i ): são intervalos de variação da variável. As classes são representadas simbolicamente por i = 1, 2, 3, .....k; sendo k o nº total de classes da distribuição. Limites de Classes ( L ou ): são os valores extremos da classe. L i = Limite Superior da classe. i = Limite Inferior da Classe. Amplitude de um Intervalo de Classes ( h ): representa a diferença entre o maior e menor valor da classe. H i = L i - i Amplitude Total da Distribuição ( AT ): representa a diferença entre o valor do Limite Superior da última classe ( Lk ) e o valor do Limite Inferior da primeira classe. AT = L k - 1 Amplitude Amostral ( AA ): representa a diferença entre o valor máximo e mínimo da amostra. AA = xMAX – xMIN Ponto Médio da Classe ( x i ): é o ponto que divide o intervalo de classe ao meio. Freqüência da Classe ( f i ): corresponde ao nº de observações correspondentes à classe. Número Total de Elementos ( n ): DETERMINAÇÃO DO NÚMERO DE CLASSES E INTERVALO Regra de Sturges: Intervalo de Classe: Exemplo 02: Para os dados apresentados no Exemplo 01, determine: Amplitude do Intervalo da 2ª classe: h 2 =158 – 154 = 4 cm Amplitude Total da Distribuição: AT =174 – 150 = 24 cm Amplitude Amostral: AA =173 – 150 = 23 cm Ponto Médio da 2ª classe: x 2 =(154 + 158) / 2 = 156 cm Número Total de Observações: n = 4 + 9 + 11 + 8 + 5 + 3 = 40 Número de Classes (Regra de Sturges): i = 1 + 3,3 ( log 40 = 1 + 3,3 ( (1,602) = 6,287 ( 6 Intervalo Estimado de Classes: h ( (174 – 150) / 6 = 24 / 6 = 4 TIPOS DE FREQUÊNCIAS Freqüência Simples ou Absoluta ( f i ): representa o nº de dados de cada intervalo de classe. Freqüência Relativa ( f R i ): representa a razão entre os valores da freqüência simples e o total de dados. Freqüência Acumulada ( F i ): representa a soma de todos os valores inferiores ao Limite Superior de um intervalo de classe: Freqüência Acumulada Relativa ( FR i ): representa a razão entre os valores da freqüência acumulada de uma classe e o total de dados. Exemplo 02: Obtenha a distribuição de freqüênciacompleta para os dados do Exemplo 01 Estatura (cm) x i f i f R i F i FR i 150 154 152 4 0,100 4 0,100 154 158 156 9 0,225 13 0,325 158 162 160 11 0,275 24 0,600 162 166 164 8 0,200 32 0,800 166 170 168 5 0,125 37 0,925 170 174 172 3 0,075 40 1,000 TOTAL 40 1 ----- ---- REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO HISTOGRAMA: formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios ( xi ) dos intervalos de classe. Exemplo 03: Construa o Histograma para a distribuição de freqüência do Exemplo 01 POLÍGONO DE FREQUENCIA SIMPLES: é um gráfico em linha, sendo as freqüências simples marcadas nos pontos médios dos intervalos de classe. Exemplo 04: Construa o Polígono de Freqüência Simples para a distribuição de freqüência do Exemplo 01 POLÍGONO DE FREQUENCIA ACUMULADA: é um gráfico em linha, sendo as freqüências acumuladas marcadas nos pontos médios dos intervalos de classe. Exemplo 05: Construa o Polígono de Freqüência Acumulada para a distribuição de freqüência do Exemplo 01 FORMAS DAS CURVAS DE FREQUÊNCIA CURVAS EM FORMA DE SINO CURVAS EM “ J ” CURVAS EM “ U ” DISTRIBUIÇÕES RETANGULARES LISTA DE EXERCÍCIOS 07: Faça a distribuição de freqüência completa para a série a seguir. Considere 5 classes com amplitude de 2 cada. Tabela 01: Notas obtidas por 50 alunos 1 2 3 4 5 6 6 7 7 8 2 3 3 4 5 6 6 7 8 8 2 3 4 4 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 Conhecidas as notas de 50 alunos, obtenha a distribuição de freqüência, considerando 10 intervalos de classes e o valor 30 para o limite inferior do primeiro intervalo de classe. Tabela 02: Notas Finais obtidas por 50 alunos 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 57 35 85 88 59 80 41 50 53 65 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54 Para cada distribuição de freqüência a seguir, construa: Histograma, Polígono de Freqüência Simples e curva de Freqüência Acumulada. Peso (cm) f i Salário ($) f i 40 44 2 500 700 8 44 48 5 700 900 20 48 52 9 900 1100 7 52 56 6 1100 1300 5 56 60 4 1300 1500 2 60 64 1 1500 1700 1 TOTAL 27 TOTAL 26 Classes) f i Área (m2) f i 4 8 2 300 400 14 8 12 5 400 500 46 12 16 9 500 600 58 16 20 6 600 700 76 20 24 2 700 800 68 24 28 1 800 900 62 TOTAL 25 TOTAL 324 � UNIDADE 08: MEDIDAS DE POSIÇÃO INTRODUÇÃO Os estudos relativos à distribuição de freqüência permitem a descrição global dos valores da variável de interesse. Porém, para uma caracterização específica de uma população, algumas medidas de posição (Média, Moda e Mediana) são necessárias. Além das medidas de posição, outros indicadores, como as medidas de dispersão, assimetria e curtose, também são importantes para a caracterização das populações. Estas medidas serão estudadas em unidades posteriores. MÉDIA ((x ) Média: Dados Não Agrupados Para dados não agrupados, utiliza-se a média aritmética simples: Exemplo: A produção leiteira diária de uma vaca, anotada durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros. Qual a produção média diária? As vezes, a média pode ser um nº diferente de todos da série. Exemplo: Calcule a média da série: 2, 4, 8 e 9 Média: Dados Agrupados Sem Intervalos de Classe Para dados agrupados sem intervalos de classe, utiliza-se a média aritmética ponderada: Exemplo: Nº de Meninos f i f i x i 0 2 0 1 6 6 2 10 20 3 12 36 4 4 10 TOTAL 34 78 Média: Dados Agrupados Com Intervalos de Classe Para dados agrupados com intervalos de classe, utiliza-se a média aritmética ponderada, sendo ( xi ) o valor médio do intervalo: Exemplo: Estatura (cm) x i f i f i x i 150 154 152 4 608 154 158 156 9 1404 158 162 160 11 1760 162 166 164 8 1312 166 170 168 5 840 170 174 172 3 516 TOTAL 40 6440 MODA ( Mo ) Moda é o valor que ocorre com maior freqüência nos dados obtidos em uma coleta. Esta medida de posição é muito utilizada quando se deseja obter rapidamente um valor para a caracterização de uma população. Moda: Dados Não Agrupados Séries Unimodais: possuem um único valor modal Exemplo: 3, 4, 4, 5, 6, 7, 8, 9, 9, 9, 10, 11, 12, 12, 13 Mo = 9 Séries Multimodais: possuem mais de um valor modal Exemplo: 2, 4, 6, 8, 8, 8, 10, 12, 12, 12, 14, 16, 16, 18, 20 Mo1 = 8 Mo2 = 12 Séries Amodais: não possuem um valor modal Exemplo: 20, 40, 60, 80, 85, 87, 100, 120, 126, 200 Mo = Não Existe Moda: Dados Agrupados Sem Intervalos de Classe Neste caso, basta encontrar o valor com maior freqüência simples. Exemplos: x i f i x i f i x i f i 25 5 25 2 25 3 30 35 30 2 30 8 35 12 35 2 35 6 40 29 40 2 40 8 45 18 45 2 45 5 Mo = 30 Unimodal Mo = Não Existe Amodal Mo1= 30 Mo2= 40 Bimodal Moda: Dados Agrupados Com Intervalos de Classe Para o cálculo da Moda com dados agrupados com intervalos de classe, deve-se encontrar a Classe Modal, correspondente à classe com maior freqüência simples. Assim, pode-se aplicar a expressão: Exemplo: Calcule a Moda para a distribuição a seguir: i Estatura (cm) x i f i 1 150 154 152 4 2 154 158 156 9 3 158 162 160 11 4 162 166 164 8 5 166 170 168 5 6 170 174 172 3 TOTAL 40 MEDIANA ( Md ) A Mediana é uma separatriz, pois divide o conjunto de valores em 2 partes iguais (com o mesmo nº de elementos). O valor da Mediana se encontra no centro de uma série estatística organizada (ordenada). Mediana: Dados Não Agrupados Série com nº ímpar de termos: Exemplo: 2, 3, 4, 6, 8, 9, 11, 12, 13, 15, 18 n =11 6º termo Md = 9 Série com nº par de termos: média aritmética entre os termos Exemplo: 1, 2, 3, 4, 6, 7, 9, 11, 12, 13, 15, 16 n =12 entre o 6º e 7º termos Md = (7+9)/2 = 8 Mediana: Dados Agrupados Sem Intervalos de Classe Para dados agrupados sem intervalos de classe, a Mediana é dada pelo termo da ordem calculada por: . Deve-se considerar o intervalo de classe com Freqüência Acumulada limitada por esse valor. Exemplo: Calcule a Mediana i Nº de Meninos f i F i 1 0 2 2 2 1 6 8 3 2 10 18 4 3 12 30 5 4 4 34 TOTAL 34 78 Observando as Freqüências Acumuladas, constata-se que a Classe da Mediana é a Terceira. Logo: Md = 2. Mediana: Dados Agrupados Com Intervalos de Classe Para o cálculo da Mediana com dados agrupados com intervalos de classe, deve-se encontrar a Classe da Mediana. Assim, pode-se aplicar a expressão: Exemplo: Calcule a Mediana para a distribuição a seguir: i Estatura (cm) x i f i Fi 1 150 154 152 4 4 2 154 158 156 9 13 3 158 162 160 11 24 4 162 166 164 8 32 5 166 170 168 5 37 6 170 174 172 3 40 TOTAL 40 ----- SEPARATRIZES QUARTIL: divide a série em 4 partes iguais. Q1: corresponde à separação dos 25% primeiros elementos da série. Q2: corresponde à separação dos 50% primeiros elementos da série (equivalente à Mediana). Q3: corresponde à separação dos 75% primeiros elementos da série. O calculo dos Quartis é similar ao cálculo da Mediana, sendo que a Classedo Quartil é determinada por: PERCENTIL: divide a série em 100 partes iguais. P10: corresponde à separação dos 10% primeiros elementos da série. P47: corresponde à separação dos 47% primeiros elementos da série (equivalente à Mediana). Pn: corresponde à separação dos “n” % primeiros elementos da série. O calculo dos Percentis é similar ao cálculo da Mediana, sendo que a Classe do Percentil é determinada por: Exemplo: Calcule Q1, Q2, Q3 e P65 da distribuição: i Peso (kg) f i Fi 1 10 30 8 8 2 30 50 26 34 3 50 70 57 91 4 70 90 42 133 5 90 110 27 160 6 110 130 16 176 TOTAL 176 ----- Primeiro Quartil ( Q1 ): Segundo Quartil ( Q2 ): Terceiro Quartil ( Q3 ): Percentil 65 ( P65 ): LISTA DE EXERCÍCIOS 08: Dadas as séries, calcule a Média, a Moda e Mediana: 11, 15, 16, 18, 22, 23, 26, 28, 13, 33, 22 19, 24, 26, 29, 29, 29, 33, 38, 38, 39, 39, 39, 41, 45 23, 25, 25, 27, 29, 29, 31, 33, 33, 33, 35, 37 45, 49, 54, 56, 60, 64, 67, 72 17, 22, 26, 28, 31, 37, 40, 46, 52, 58, 63, 64, 72 28, 36, 41, 49, 54, 65, 72, 88 Complete as Tabelas e calcule a Média, a Moda e Mediana: i x i f i i x i f i i x i f i 1 120 15 1 37 8 1 12 16 3 2 130 32 2 40 12 2 16 20 6 3 140 22 3 43 9 3 20 24 2 4 150 39 4 46 12 4 24 28 2 5 160 26 5 49 5 TOTAL TOTAL 6 51 7 TOTAL i Salário ($) f i i Peso (kg) f i 1 450 550 8 1 30 50 2 2 550 650 10 2 50 70 8 3 650 750 11 3 70 90 12 4 750 850 16 4 90 110 1 5 850 950 13 5 110 130 5 6 950 1050 5 TOTAL 7 1050 1150 1 TOTAL Para a última Tabela do exercício anterior, calcule Q1, Q3, P43 e P82. � UNIDADE 09: MEDIDAS DE DISPERSÃO OU VARIABILIDADE DEFINIÇÃO DE DISPERSÃO Considere os seguintes conjuntos de dados: X = 70, 70, 70, 70 Y = 68, 69, 70, 71, 72 Z = 5, 15, 50, 120, 160 Calculando a média de cada um desses conjuntos: Os 3 conjuntos possuem a mesma média. Entretanto, é fácil notar que o conjunto X é mais homogêneo que o conjunto Y, que por sua vez é mais homogêneo que o conjunto Z. Chama-se Dispersão ou Variabilidade a maior ou menor diversificação dos valores em torno de uma medida de posição central. Portanto, para se caracterizar uma distribuição, além dos valores de posição, deve-se considerar valores de medidas de dispersão, tais como: Amplitude Total, Variância, Desvio Padrão e Coeficiente de Variação. AMPLITUDE TOTAL (AT) Amplitude Total: Dados Não Agrupados A Amplitude Total é a diferença entre o maior e menor valor observado: Exemplo: 40, 45, 48, 52, 54, 62, 70 AT = 70 – 40 = 30 Amplitude Total: Dados Agrupados Sem Intervalos de Classe A Amplitude Total é a diferença entre o maior e menor valor observado: Exemplo: Nº de Meninos f i 0 2 1 6 2 10 3 12 4 4 TOTAL 34 AT = 4 – 0 = 4 meninos Amplitude Total: Dados Agrupados Com Intervalos de Classe A Amplitude Total é a diferença entre o Limite Superior da última classe e o Limite Inferior da primeira classe: Exemplo: i Estatura (cm) x i f i 1 150 154 152 4 2 154 158 156 9 3 158 162 160 11 4 162 166 164 8 5 166 170 168 5 TOTAL 40 AT = 170 – 150 = 20 cm A Amplitude Total tem o inconveniente de só levar em consideração os valores extremos da série, desprezando os valores intermediários. A AT é apenas uma indicação aproximada da dispersão dos dados. VARIÂNCIA ( s2 ) Variância: Dados Não Agrupados Variância: Dados Agrupados Para dados agrupados com intervalos de classe, ( xi ) é o ponto médio do intervalo. DESVIO PADRÃO ( s ) Desvio Padrão: Dados Não Agrupados Desvio Padrão: Dados Agrupados Para dados agrupados com intervalos de classe, ( xi ) é o ponto médio do intervalo. COEFICIENTE DE VARIAÇÃO ( CV ) O Coeficiente de Variação é dado pelo quociente do desvio padrão e média, multiplicado por 100: Exemplo: Complete a distribuição e calcule a AT, s2, s e CV: i Estatura (cm) x i f i x i2 f i . x i f i . x i2 1 150 154 152 4 23104 608 92416 2 154 158 156 9 24336 1404 219024 3 158 162 160 11 25600 1760 281600 4 162 166 164 8 26896 1312 215168 5 166 170 168 5 28224 840 141120 6 170 174 172 3 29584 516 88752 TOTAL 40 157744 6440 1038080 AT = 174 – 150 = 24 cm Média: LISTA DE EXERCÍCIOS 09: 1. Complete as distribuições e calcule a AT, s2, s e CV: i x i f i 1 500 8 2 600 10 3 700 11 4 800 16 5 900 13 6 1000 5 7 1100 1 TOTAL 64 i Renda ($) f i 1 30 50 2 2 50 70 8 3 70 90 12 4 90 110 10 5 110 130 5 TOTAL 37 � UNIDADE 10: MEDIDAS DE ASSIMETRIA E MEDIDAS DE CURTOSE MEDIDAS DE ASSIMETRIA SIMETRIA: uma distribuição é simétrica quando a média e a moda coincidem. ASSIMETRIA: uma distribuição é assimétrica à esquerda quando a média é menor que a moda. uma distribuição é assimétrica à direita quando a média é maior que a moda. Assim, pode-se estabelecer um critério para a medida da assimetria de uma distribuição: Exemplos: Distribuição A Distribuição B Distribuição C Peso (kg) f i Peso (kg) f i Peso (kg) f i 2 6 6 2 6 6 2 6 6 6 10 12 6 10 12 6 10 30 10 14 24 10 14 24 10 14 24 14 18 12 14 18 30 14 18 12 18 22 6 18 22 6 18 22 6 TOTAL 60 TOTAL 78 TOTAL 78 Outro critério de medida de assimetria é o Coeficiente de Assimetria (AS): MEDIDAS DE CURTOSE Curtose: representa o grau de achatamento da distribuição em relação à curva normal COEFICIENTE DE CURTOSE: C = 0,263 ( Mesocúrtica C < 0,263 ( Leptocúrtica C > 0,263 ( Platicúrtica Exemplo: Sabendo-se que uma distribuição apresenta Q1 = 24,4 cm; Q3 = 41,2 cm; P10 = 20,2 cm e P90 = 49,5 cm; determine a curtose em relação à Curva Normal. Conclui-se que a distribuição é levemente Platicúrtica. LISTA DE EXERCÍCIOS 10: Considere os seguintes resultados relativos a três distribuições de freqüência: Distribuições Média Moda A 52 52 B 45 50 C 48 46 Determine o tipo de simetria de cada uma delas. Uma distribuição de freqüência apresenta as seguintes medidas: Média = 48,1, Mediana = 47,9 e Desvio Padrão = 12,45. Calcule o coeficiente de assimetria. Considere as seguintes medidas relativas a três distribuições de freqüência: Distribuições Q1 Q3 P10 P90 A 814 935 772 1012 B 63,7 80,3 55 86,6 C 28,8 45,6 20,5 49,8 Calcule os respectivos graus de curtose Classifique cada uma das distribuições em relação à curva normal Considere a seguinte distribuição de freqüência relativa ao peso de 100 operários: Distribuição A Peso (kg) f i 50 58 10 58 66 15 66 74 25 74 82 24 82 90 16 90 98 10 TOTAL 100 Determine o grau de assimetria Calcule o grau de curtose Classifique a distribuição em relação à curva normal � UNIDADE 11: PROBABILIDADE EXPERIMENTO ALEATÓRIOExperimentos Aleatórios são aqueles que, mesmo repetido várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. ESPAÇO AMOSTRAL ( S ) Espaço Amostral é o conjunto de todos os resultados possíveis de um experimento. Exemplos: Lançamento de uma moeda: S = { cara; coroa } Lançamento de um dado: S = { 1, 2, 3, 4, 5, 6 } Lançamento de duas moedas: S = { (cara, cara); (cara, coroa); (coroa, coroa); (coroa, cara) } PONTO AMOSTRAL Ponto Amostral é cada um dos elementos do Espaço Amostral, que corresponde a um resultado. EVENTO ( E ) Evento é qualquer subconjunto do Espaço Amostral de um determinado Experimento Aleatório. Seja E ( S (evento E contido no Espaço Amostral); então: Se E = S ( E é chamado “Evento Certo”. Se E ( S ( E é chamado “Evento Elementar”. Se E = ( ( E é chamado “Evento Impossível”. Exemplo: No lançamento de um dado, S = { 1, 2, 3, 4, 5, 6 } A = { 2, 4, 6 } ( S ( A é um evento de S B = { 1, 2, 3, 4, 5, 6 } ( S ( B é um evento certo de S C = { 4 } ( S ( C é um evento elementar de S D = { 9 } ( S ( D é um evento impossível de S PROBABILIDADE ( P ) Dado um Experimento Aleatório, sendo S o seu Espaço Amostral, considere que todos elementos de S tenham a mesma chance de ocorrer, ou seja, S é um conjunto equiprovável. Assim, a probabilidade de um evento A ( A ( S ) ocorrer é dada por: Exemplo: Qual a probabilidade de sair CARA em um lançamento de uma moeda? Exemplo: Qual a probabilidade de sair um Nº PAR em um lançamento de um dado? Exemplo: Qual a probabilidade de sair um Nº MENOR OU IGUAL A 6 em um lançamento de um dado? Exemplo: Qual a probabilidade de sair o Nº 4 em um lançamento de um dado? Exemplo: Qual a probabilidade de sair um Nº MAIOR QUE 6 em um lançamento de um dado? Pelos resultados dos exemplos anteriores, pode-se concluir que: A probabilidade de ocorrência de um evento certo é igual a 1. A probabilidade de ocorrência de um evento impossível é zero. A probabilidade de ocorrência de um evento qualquer é um nº entre 0 e 1. A probabilidade de ocorrência de um evento elementar é 1 / n. EVENTOS COMPLEMENTARES Sendo “ p “ a probabilidade que um evento ocorra (sucesso) e “ q “ a probabilidade que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação: Assim, se a probabilidade de se realizar um evento é p = 0,25, a probabilidade de que ele não ocorra é: q = 0,75. Exemplo: Sabendo que a probabilidade de tirar o nº 4 em um lançamento de um dado é 1/ 6; detrmine a probabilidade de não tirar o nº 4. EVENTOS INDEPENDENTES Dois eventos são independentes quando a realização (ou não realização) de um dos eventos não afeta a probabilidade de realização do outro e vice-versa. Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização de cada evento: Exemplo: Lançando 2 dados simultaneamente, determine a probabilidade de obtermos o nº 1 no primeiro e o nº 5 no segundo dado. EVENTOS MUTUAMENTE EXCLUSIVOS Dois ou mais eventos são mutuamente exclusivos quando a realização (ou não realização) de um dos eventos exclui a probabilidade de realização do(s) outro(s). Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de realização de cada evento: Exemplo: Lançando 1 dado, determine a probabilidade de obtermos o nº 1 ou o nº 5. LISTA DE EXERCÍCIOS 11: Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho de 52 caras? Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas? Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: A probabilidade dessa peça ser defeituosa. A probabilidade de essa peça não ser defeituosa. No lançamento de dois dados, calcule a probabilidade se obter soma igual a 5. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus? Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde? De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus? Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 52 cartas? Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um baralho de 52 cartas? No lançamento de um dado, qual a probabilidade de se obter um número não inferior a 5? São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro baralho e uma carta do segundo. Qual é a probabilidade de tirarmos uma dama e um rei, não necessariamente nessa ordem? Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10. � UNIDADE 12: DISTRIBUIÇÃO BINOMIAL E DISTRIBUIÇÃO NORMAL DISTRIBUIÇÃO DE PROBABILIDADE: NOÇÃO INTUITIVA Considere a distribuição de freqüência relativa ao nº de acidentes diários em um estacionamento (coletados em um mês): Nº Acidentes f i 0 22 1 5 2 2 3 1 TOTAL 30 Em 1 dia, a probabilidade de não ocorrer acidentes é: Em 1 dia, a probabilidade de ocorrer 1 acidente é: Em 1 dia, a probabilidade de ocorrer 2 acidentes é: Em 1 dia, a probabilidade de ocorrer 3 acidentes é: Assim, pode-se criar uma Distribuição de Probabilidade: Nº Acidentes Probabilidade 0 0,73 1 0,17 2 0,07 3 0,03 TOTAL 1 Exemplo: Mostre a Distribuição de Probabilidade de um lançamento de dados Nº (X) Probabilidade 1 1 / 6 2 1 / 6 3 1 / 6 4 1 / 6 5 1 / 6 6 1 / 6 TOTAL 1 DEFINIÇÃO DE DISTRIBUIÇÃO DE PROBABILIDADE Seja uma variável aleatória X, que pode assumir os valores x1, x2, x3, .....xn, correspondentes aos pontos do espaço amostral. Assim, a cada valor de xi associa-se uma probabilidade pi de ocorrência, de forma que: Os valores de xi (x1, x2, x3, .....xn ) e de pi (p1 , p2,, p3, .....pxn ) definem uma Distribuição de Probabilidade. Ao se definir a Distribuição de Probabilidade, estabelece-se uma correspondência unívoca entre os valores da variável aleatória X e os seus valores de p. A Função de Probabilidade é representada por: DISTRIBUIÇÃO BINOMIAL Considere as seguintes condições de um experimento: O experimento pode ser repetido nas mesmas condições finitas vezes ( n ). A repetição dos experimentos devem ser independentes. Em cada experimento devem aparecer dois resultados possíveis: “sucesso” ou “insucesso”. A probabilidade de sucesso ( p ) e a probabilidade de insucesso ( q ) se mantêm constantes ao longo das repetições. Nestas condições, podem-se resolver problemas da seguinte natureza: “Determinar a probabilidade de se obter “k” sucessos em “n” tentativas” O cálculo das probabilidades pode ser dado por: : é a probabilidade de que o evento se realize “k” vezes em “n” experimentos. : é a probabilidade de sucesso em um único experimento. : é a probabilidade de insucesso em um único experimento. : Coeficiente Binomial Esta expressão define a Distribuição Binomial. Exemplo: Uma moeda é lançada 5 vezes seguidas. Calcule a probabilidade de serem obtidas 3 caras. Exemplo: Doistimes de futebol A e B jogam entre si, 6 vezes. Encontre a probabilidade do time A ganhar 4 jogos. DISTRIBUIÇÃO NORMAL Características da Distribuição Normal: A variável aleatória X pode assumir todo e qualquer valor real. A representação gráfica da Distribuição normal é uma curva em forma de sino, simétrica em torno da média (Curva de Gauss) A área limitada pela curva e o eixo das abscissas é igual a 1. A curva normal é assintótica em relação ao eixo das abscissas. O cálculo das probabilidade pode ser feito com a utilização da Distribuição Normal Reduzida (média (x = 0 e desvio padrão = 1), com uma variável auxiliar (z): Distribuição Normal Reduzida de 0 a Z z 0 1 2 3 4 5 6 7 8 9 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0200 0,0240 0,0280 0,0320 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549 0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 Exemplo: Seja x a variável aleatória que representa os diâmetros dos parafusos produzidos em uma máquina. Suponha que essa variável siga uma Distribuição Normal com média ((x ) = 2 cm e com um desvio padrão ( s ) = 0,04 cm. Qual a probabilidade que um parafuso tenha o diâmetro entre 2 e 2,05 cm? LISTA DE EXERCÍCIOS 12: Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de uma moeda. Jogando-se um dado 3 vezes, determine a probabilidade de se obter um múltiplo de 3 duas vezes. Dois times de futebol A e B jogam entre si, 6 vezes. Encontre a probabilidade do time A: Ganhar 2 jogos ou 3 jogos. Ganhar pelo menos 1 jogo. A probabilidade de um atirador acertar o alvo é 2 / 3. Se ele atirar 5 vezes, qual a probabilidade de acertar exatamente 2 tiros? Seis parafusos são escolhidos ao acaso da produção de um máquina, que apresenta 10% de peças defeituosas. Qual a probabilidade de serem defeituosos dois desses parafusos? Para a distribuição Normal, calcule as probabilidade: P ( -1,25 < z < 0 ) P ( -0,5 < z < 1,48 ) P ( 0,8 < z < 1,23 ) P ( z > 0,60 ) P ( z < 0,92 ) � UNIDADE 13: CORRELAÇÃO E REGRESSÃO CORRELAÇÃO Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe uma correlação entre elas. Exemplo: Considere uma amostra formada por 10 alunos de uma escola e suas respectivas notas de matemática (X) e de estatística (Y): Nº Notas Matemática (X) Estatística (Y) 01 5 6 08 8 9 24 7 8 38 10 10 44 6 5 58 7 7 59 9 8 72 3 4 80 8 6 92 2 2 Os pontos obtidos revelam a existência de uma correlação linear positiva entre as notas de matemática e estatística, ou seja, há um aumento linear das notas de matemática e estatística. TIPOS DE CORRELAÇÃO: COEFICIENTE DE CORRELAÇÃO Para se determinar a medida de correlação linear, pode-se utilizar o Coeficiente de Correlação de Pearson: Os valores de r estão entre –1 e 1. Assim: Se r = 1: Correlação Linear Positiva Se r = -1: Correlação Linear Negativa Se r = 0: Não há Correlação Linear REGRESSÃO A Análise de Regressão tem por objetivo descrever, por meio de um modelo matemático, a relação entre duas variáveis, a partira de “ n “ dados. Assim, supondo X a variável independente e Y a variável dependente, pode-se determinar um ajuste linear dessas variáveis: Y = aX + b Sendo a e b os coeficientes da reta definidos por: Exemplo: Considere a Distribuição a seguir. Determine uma equação linear para correlação das variáveis. Nº Notas xi yi xi2 Matemática (X) Estatística (Y) 01 5 6 30 25 08 8 9 72 64 24 7 8 56 49 38 10 10 100 100 44 6 5 30 36 58 7 7 49 49 59 9 8 72 81 72 3 4 12 9 80 8 6 48 64 92 2 2 4 4 Total 65 65 473 481 Logo a Equação da Reta que melhor representa a relação entre as variáveis é: Y = 0,86 x + 0,89 INTERPOLAÇÃO E EXTRAPOLAÇÃO No exemplo anterior, não havia o valor de x = 4. Para se estimar o valor correspondente de y para x = 4, pode-se utilizar a equação dada pela análise de regressão: Para x = 4 ( y = 0,86 . 4 + 0,89 = 4,33 Neste caso, houve uma interpolação de valores de x e uma extrapolação dos valores de y LISTA DE EXERCÍCIOS 13: Considere a Distribuição a seguir. Determine uma equação linear para correlação das variáveis. (X) (Y) 2 30 4 25 6 22 8 18 10 15 12 11 14 10 ( 56 ( 131 � UNIDADE 14: NOÇÕES BÁSICAS DE EXCEL INTRODUÇÃO Este material foi elaborado com o intuito de apresentar algumas das ferramentas de análise disponíveis no Excel para Análise de dados (análise estatística). As informações aqui compiladas, quase em sua totalidade, foram extraídas da Ajuda do Microsoft Excel 2000, o qual disponibiliza explicações detalhadas dos seus recursos. RECURSOS Classificar linhas com base no conteúdo de duas ou mais colunas Para obter melhores resultados, a lista classificada deve apresentar rótulos de colunas. Clique em uma célula da lista que você deseja classificar. No menu Dados, clique em Classificar. Nas caixas Classificar por e Em seguida por, clique nas colunas que você deseja classificar. Se você desejar classificar por mais de três colunas, classifique primeiro pelas colunas menos importantes. Por exemplo, se a sua lista contém informações sobre um experimento e você precisa organizá-la por Salinidade, pH, Concentração inicial, Concentração final, classifique a lista duas vezes. Primeiro, clique em Concentração final, na caixa Classificar por e classifique a lista. Em seguida, clique em Salinidade na caixa Classificar por, clique em pH na primeira caixa Em seguida por, e clique em Concentração inicial na segunda caixa Em seguida por, e classifique a lista. Selecione quaisquer outras opções de classificação desejadas e, em seguida, clique em OK. Repita as etapas 2 a 4, se necessário, usando as colunas seguintes mais importantes. Fórmulas Fórmula ( uma seqüência de valores, referências de célula, nomes, funções ou operadores de uma célula que juntos produzem um novo valor. Uma fórmula começa sempre com um sinal de(=). As fórmulas calculam valores segundo uma ordem específica. Uma fórmula no Microsoft Excel sempre começa com um sinal de igual (=). O sinal de igual informa ao Excel que os caracteres a seguir constituem uma fórmula. Depois do sinal de igual estão os elementos a serem calculados (os operandos), que são separados por operadores de cálculo. O Excel calcula a fórmula da esquerda para a direita, de acordo com uma ordem específica para cada operador da fórmula. Você pode alterar a ordem das operações usando parênteses. No exemplo abaixo, os parênteses na primeira parte da fórmula forçam o Excel a calcular B4+25 primeiro e, em seguida, dividir o resultado pela soma dos valores nas células D5, E5 e F5. =(B4+25)/SOMA(D5:F5) Inserir uma fórmula Clique na célula na qual você deseja inserir a fórmula. Digite = (um sinal de igual). Se você clicar em Editar fórmula ou em Colar função , o Microsoft Excel inserirá um sinal de igual para você. Insira a fórmula. Pressione ENTER. Inserir uma fórmula que contém uma função Clique na célula na qual você deseja inserir a fórmula. Para iniciar a fórmula com a função, clique em Editar fórmula na barra de fórmulas. Clique na seta abaixo próxima à caixa Funções . Clique na função que você deseja adicionar à fórmula. Se a função não aparecer na lista, clique em Mais funções para obter uma lista de funções adicionais. Insira os argumentos Ao concluir a fórmula, pressione ENTER. FUNÇÕES Uso de funções pré-definidas para calcular valores As funções são fórmulas predefinidas que efetuam cálculos usando valores específicos, denominados argumentos, em uma determinada ordem ou estrutura. Por exemplo, a função SOMA adiciona valores ou intervalos de células. ALEATÓRIO (Rand) Retorna um número aleatório maior ou igual a 0 e menor que 1 distribuído igualmente. Um novo número aleatório é retornado toda vez que a planilha for calculada. Sintaxe ( ALEATÓRIO( ) Comentários: Para gerar um número real aleatório entre a e b, use: ALEATÓRIO()*(b-a)+a Se você quiser utilizar ALEATÓRIO para gerar um número aleatório, mas não quiser mudar os números toda vez que a célula for calculada, poderá inserir =ALEATÓRIO() na barra de fórmula e pressionar F9 a fim de mudar a fórmula para um número aleatório. Exemplos: Para gerar um número aleatório maior ou igual a 0, mas menor que 100, digite: RAND()*100 ALEATÓRIOENTRE (Randbetween) Retorna um número aleatório entre os números especificados. Um novo número aleatório será retornado sempre que a planilha for calculada. Se esta função não estiver disponível, execute o Programa de Instalação para instalar as Ferramentas de análise. Após instalar as Ferramentas de análise, é necessário ativá-las selecionando o comando Suplementos no menu Ferramentas. Sintaxe à ALEATÓRIOENTRE (inferior;superior) Inferior é o menor inteiro que ALEATÓRIOENTRE retornará. Superior é o maior inteiro que ALEATÓRIOENTRE retornará. SOMA Retorna a soma de todos os números na lista de argumentos. Sintaxe ( SOMA(núm1;núm2; ...) Exemplos: SOMA(3; 2) é igual a 5 SOMA(A2:C2) é igual a 50 SOMA(B2:E2; 15) é igual a 150 MÉDIA Retorna a média aritmética dos argumentos. Sintaxe ( MÉDIA(núm1;núm2; ...) Dica : Ao calcular a média das células, lembre-se da diferença entre as células vazias e as que contêm o valor nulo, sobretudo se você tiver desmarcado a caixa de seleção Valores zero na guia Exibir comando Opções, menu Ferramentas. As células vazias não são contadas, mas aquelas que contêm valores nulos são. Exemplos: Se A1:A5 se chamar Pontos e contiver os números 10, 7, 9, 27 e 2, então: MÉDIA(A1:A5) é igual a 11 MÉDIA(Pontos) é igual a 11 MED Retorna a mediana dos números indicados. A mediana é o número no centro de um conjunto de números; isto é, metade dos números possui valores que são maiores do que a mediana e a outra metade possui valores menores. Sintaxe ( MED(núm1;núm2; ...) Se houver um número igual de números no conjunto, então MED calcula a média dos dois números do meio. Consulte o segundo exemplo a seguir. Exemplos: MED(1; 2; 3; 4; 5) é igual a 3 MED(1; 2; 3; 4; 5; 6) é igual a 3,5, a média de 3 e 4 DESVPAD Calcula o desvio padrão a partir de uma amostra. O desvio padrão é uma medida do grau de dispersão dos valores em relação ao valor médio (a média). Sintaxe ( DESVPAD(núm1;núm2;...) DESVPAD considera que seus argumentos são uma amostra da população. Se seus dados representarem a população toda, você deverá calcular o desvio padrão usando DESVPADP. desvio padrão é calculado usando o método "não-polarizado" ou "n-1". DESVPAD usa a seguinte fórmula: Exemplos: Suponha que 10 ferramentas feitas na mesma máquina durante a produção são coletadas como uma amostra aleatória e medidas em termos de resistência à ruptura. Os valores da amostra (1345, 1301, 1368, 1322, 1310, 1370, 1318, 1350, 1303, 1299) são armazenados em A2:E3, respectivamente. DESVPAD estima o desvio padrão da resistência à ruptura para todas as ferramentas. DESVPAD(A2:E3) é igual a 27,46 DESVPADP Calcula o desvio padrão com base na população total fornecida como argumentos. O desvio padrão é uma medida do grau de dispersão dos valores em relação ao valor médio (a média). Sintaxe ( DESVPADP(núm1;núm2;...) DESVPADP considera que seus argumentos são a população inteira. Se os dados representarem uma amostra da população, você deverá calcular o desvio padrão usando DESVPAD. Para tamanhos grandes de amostras, DESVPAD e DESVPADP retornam valores aproximadamente iguais. DESVPADP usa a seguinte fórmula: VAR Estima a variância a partir de uma amostra de uma população. Sintaxe ( VAR(núm1;núm2; ...) VAR considera que os argumentos são uma amostra da população. Se os dados representarem toda a população, você deverá calcular a variância usando VARP. VAR usa a seguinte fórmula: Exemplos: Suponha que 10 ferramentas feitas na mesma máquina durante um processo de produção sejam coletadas como uma amostra aleatória e medidas em termos de resistência à ruptura. Os valores da amostra (1345, 1301, 1368, 1322, 1310, 1370, 1318, 1350, 1303, 1299) são armazenados em A2:E3, respectivamente. VAR estima a variância para a resistência à ruptura das ferramentas. VAR(A2:E3) é igual a 754,3 VARP Calcula a variância com base na população total. Sintaxe ( VARP(núm1;núm2; ...) VARP considera que seus argumentos são para a população toda. Se os dados representarem uma amostra da população, você deverá calcular a variância usando VAR. A equação para VARP é: Exemplos: Usando os dados do exemplo VAR e considerando que apenas 10 ferramentas são produzidas durante o processo de produção, VARP mede a variância da resistência à ruptura para todas as ferramentas. VARP(A2:E3) é igual a 678,8 MODO Retorna o valor que ocorre com mais freqüência (moda) em uma matriz ou intervalo de dados. Assim como MED, MODO é uma medida de local. Sintaxe à MODO(núm1;núm2; ...) Exemplos: MODO({5,6. 4. 4. 3. 2. 4}) é igual a 4 QUARTIL Retorna o quartil do conjunto de dados. Quartis são normalmente usados em dados de vendas e de pesquisas para dividir a população em grupos. Por exemplo, você pode usar QUARTIL para descobrir 25% de maior renda de uma população. Sintaxe ( QUARTIL(matriz;quarto) Matriz é a matriz ou intervalo de célula de valores numéricos cujo valor quartil você deseja obter. Quarto indica o valor a ser retornado Se quarto for igual a QUARTIL retornará 0 Valor mínimo 1 Primeiro quartil (25º percentil) 2 Valor médio (50º percentil) 3 Terceiro quartil (75º percentil) 4 Valor máximo Comentários: Se matriz estiver vazio ou contiver mais de 8.191 pontos de dados, QUARTIL retornará o valor de erro #NÚM!.
Compartilhar