Prévia do material em texto
RESPOSTAS EXERCICIO 1- Abaixo está tipo de variável estatística para cada item, categorizado como Qualitativa (representa uma qualidade ou categoria) ou Quantitativa (representa uma quantidade numérica). As quantitativas são ainda subdivididas em Discretas (contagem, números inteiros) ou Contínuas (medição, podem assumir qualquer valor em um intervalo). Variável Tipo Subtipo (se Justificativa Principal Quantitativa) Salários dos Quantitativa Contínua É uma medição que pode empregados de uma assumir qualquer valor indústria. numérico em um intervalo (ex: R$ 2.500,50, 2.500,51, etc.). Opinião de Qualitativa Ordinal Representa uma categoria com consumidores sobre uma ordem natural (Ótimo > determinado produto Bom > Ruim). (Ex: Ótimo, Bom, Ruim). Número de Quantitativa Discreta É uma contagem de itens (0, 1, respostas certas de 2, 10). Não pode ser um alunos num teste com valor fracionário. dez itens. Temperatura diária Quantitativa Contínua É uma medição que pode da cidade de assumir qualquer valor em um Aquidauana. intervalo (ex: 28,5°C, 28,51°C, etc.). Porcentagem da Quantitativa Contínua Embora seja uma porcentagem, receita de municípios valor é o resultado de uma aplicada em medição/razão e pode assumir educação. qualquer valor em um intervalo (ex: 15,3%, 15,35%).Opinião dos Qualitativa Nominal Representa uma categoria empregados sobre a (Sim/Não ou A favor/Contra) realização ou não de sem ordem natural. cursos obrigatórios de treinamento. QI de um indivíduo. Quantitativa Contínua Embora seja frequentemente arredondado para um número inteiro, o QI é uma escala de medida subjacente que teoricamente pode assumir valores contínuos. É geralmente tratado como variável contínua em análises. Breve Explicação dos Tipos Qualitativa Nominal: Categorias que não possuem uma ordem. (Ex: cor dos olhos, estado civil). Qualitativa Ordinal: Categorias que possuem uma ordem ou hierarquia. (Ex: nível de escolaridade, classificação militar). Quantitativa Discreta: Valores numéricos obtidos por contagem, geralmente limitados a números inteiros. (Ex: número de carros, número de filhos). Quantitativa Contínua: Valores numéricos obtidos por medição, que podem assumir qualquer valor real dentro de um intervalo. (Ex: peso, altura, tempo). EXERCICIO 2- Para construir as distribuições de frequência, primeiro extraímos os dados relevantes da tabela para cada variável. A tabela completa possui 36 empregados. Distribuições de Frequência - Tabela 2.1 1. Estado Civil Esta é uma variável Qualitativa Nominal. Estado Civil Frequência Absoluta (fi) Frequência Relativa (%) Casado 18 36 18 = 50,00% Solteiro 18 18 = 50,00% 36 Total 36 100,00% 2- Região de Procedência Esta é uma variável Qualitativa Nominal.Região de Procedência Frequência Absoluta Frequência Relativa (%) Capital 17 17 ≈ Interior 13 ≈ Outra 6 ≈ Total 36 100,00% 3. Número de Filhos dos Empregados Casados Esta é uma variável Quantitativa Discreta. Primeiro, filtramos apenas os 18 empregados casados e listamos número de filhos: 1, 2, Número de Filhos (xᵢ) Frequência Absoluta Frequência Relativa (%) 0 1 1 9 18 9 50,00% 2 5 18 ≈ 3 2 ≈ (Não Informado) 1 ≈ Total 18 100,00% Nota: Um empregado casado tem número de filhos como na tabela (registro 12), o que foi tratado como uma categoria separada para fins de contagem, pois valor é ausente ou não informado. 4. Idade (em Anos) Esta é uma variável Quantitativa Contínua. A amplitude total ($R$) dos dados é dada por: $R = \text{Idade Máxima} - \text{Idade Mínima}$. Idade Mínima: 22 anos Idade Máxima: 48 anos R = 48 - 22 = 26 Para determinar número de classes (k), podemos usar a Regra de Sturges: k ≈ onde n 36. k ≈ 3, ≈ 1 3, 3 556) ≈ 6, 13. Usaremos k = 6 classes. A amplitude das classes (h) é dada por: h ≈ = ≈ 4,33. Usaremos uma amplitude h = 5 para facilitar a construção. Classes de Idade (Amplitude h = 5): Classes de Idade (anos) Frequência Absoluta Frequência Relativa (%) 20 25 3 3 ≈ 8,33% 10Nota: A notação a b significa que a classe inclui limite inferior (a) e exclui limite superior (b ). Exceção: a última classe inclui limite superior, se necessário, para abarcar valor máximo (48 anos). EXERCICIO 3 Para construir histogramas, utilizaremos as frequências absolutas (o número de aluguéis em cada classe) para cada zona. eixo horizontal (x) representará as classes de aluguéis (codificados) e eixo vertical (y) representará a frequência absoluta. Como as classes não têm a mesma amplitude (2 3, 3 5, 5 7, 7 10, 10 15), as alturas das barras devem ser proporcionais às densidades de frequência para uma representação totalmente precisa, mas, para uma visualização e comparação inicial, uso das frequências absolutas no eixo também é comum e eficaz, especialmente se as bases das barras forem ajustadas visualmente à amplitude da classe. Histograma da Zona Urbana (Total: 200) Classes de Aluguéis (codificados) Amplitude (A) Frequência Absoluta (f) 1 10 2 40 2 80 7 10 3 50 10 15 5 20 No histograma da Zona Urbana, a classe modal (com maior frequência) com 80 aluguéis. A distribuição se concentra fortemente nessa classe, que sugere que a maioria dos aluguéis urbanos se situa nessa faixa de valor codificado.Histograma da Zona Rural (Total: 100) Classes de Aluguéis (codificados) Amplitude (A) Frequência Absoluta (f) 1 30 2 50 7 2 15 7 10 3 5 10 15 5 0 No histograma da Zona Rural, a classe modal com 50 aluguéis. A distribuição tem uma concentração significativamente maior nas classes de aluguéis mais baixos. Discussão e Comparação das Distribuições A comparação dos dois histogramas revela diferenças notáveis no padrão de aluguéis entre as zonas: Centralidade (Classe Modal): Urbana: A moda (maior concentração) está na classe de valor mais alto (5 7). Isso indica que valor "típico" de aluguel urbano é maior. Rural: A moda está na classe de valor mais baixo (3 5). Isso indica que valor "típico" de aluguel rural é menor. Assimetria (Formato da Distribuição): Urbana: A distribuição é mais simétrica em torno da sua classe modal (5 7), embora tenda a ter uma cauda levemente mais longa para a direita (valores mais altos), se considerarmos a queda de 80 para 50, e depois para 20. Rural: A distribuição é fortemente assimétrica à direita (ou positivamente assimétrica). Ocorre um rápido declínio nas frequências à medida que valor do aluguel aumenta (30, 50, 15, 5, 0). Isso significa que a grande maioria dos aluguéis rurais é de valores baixos. Amplitude e Dispersão: Urbana: Apresenta aluguéis em todas as classes, estendendo-se até a classe mais alta (10 15). A dispersão (variabilidade nos valores) é maior. Rural: Não apresenta aluguéis na classe mais alta (10 15). Os dados são mais concentrados nas classes de valores mais baixos. Conclusão: Os aluguéis da Zona Urbana são, em geral, de valores mais altos e apresentam maior variabilidade nos preços. Os aluguéis da Zona Rural são predominantemente de valores mais baixos e a distribuição é muito mais concentrada nesses valores inferiores. EXERCICIO 4-PASSO 1: Vamos construir a distribuição de frequência dos pesos de 40 estudantes e, em seguida, construir o histograma e polígono de frequência. 1. Construção da Distribuição de Frequência A variável Peso é quantitativa contínua. Temos n = 40 observações. A. Determinação de Parâmetros 1. Amplitude Total (R): Peso Máximo (Max): 88,0 kg Peso Mínimo (Min): 59,5 kg R = Max Min = 88,0 59, 28, 2. Número de Classes (k): Usaremos a Regra de Sturges: k ≈ 3,3 log₁₀(n). Adotaremos k = 6 classes. 3. Amplitude da Classe (h): 22 Para facilitar a tabulação e interpretação, usaremos a amplitude padronizada h = 5,0. 4. Limites das Classes: Começaremos com um limite inferior ligeiramente menor ou igual ao peso mínimo (59,5 kg). Escolheremos limite inferior de 58, kg. B. Tabela de Distribuição de Frequência A tabela a seguir apresenta a distribuição de frequência, utilizando a notação a b (inclui limite inferior, exclui superior).Classes de Peso Ponto Médio Frequência Frequência Frequência (kg) (xₘ) Absoluta Acumulada (Fᵢ) Relativa (%) 60,5 4 4 10,00% 68, 65,5 7 11 17,50% 70,5 13 24 32,50% 75,5 8 32 20,00% 80,5 6 38 15,00% 85,5 2 40 5,00% 90,5 40 0,00% Total 40 100,00% Nota: Uma classe extra (88, 93, 0) foi adicionada com fi 0 para garantir fechamento do polígono de frequência no eixo horizontal, conforme a prática estatística comum. PASSO 2 : Histograma e Polígono de Frequência HISTOGRAMA : é composto por retângulos contíguos (juntos), cujas bases representam as classes de peso e cujas alturas são proporcionais às frequências absolutas (ou densidades de frequência, neste caso, como as amplitudes são iguais, a altura é diretamente a frequência). eixo X = Classes de Peso (kg) eixo : Frequência absoluta (fi) A maior concentração de pesos está na classe 68, 73, 0 kg, com 13 estudantes. A distribuição parece ser ligeiramente assimétrica à direita (positiva), com uma cauda se estendendo para pesos maiores. Polígono de Frequência é construído ligando-se os pontos médios da parte superior de cada barra do histograma. 1. Plotamos os pontos correspondentes ao ponto médio de cada classe e sua respectiva frequência absoluta (e.g., (60, 5; 4), (65, 5; 7), etc.). 2. Para "fechar" polígono no eixo x, adicionamos dois pontos com frequência zero: Um ponto médio de uma classe anterior fictícia: (55, 5; 0) (Classe 53, 58, 0). Um ponto médio da classe posterior fictícia (já incluída na tabela): (90, 5; 0) (Classe 88,0 93, 0). 3- Ligamos todos esses pontos com segmentos de reta. O polígono de frequência sobreposto ao histograma ilustra a forma da distribuição, destacando o pico de concentração em 70,5 kg.EXERCICIO 5- A variável em estudo é o Número de Erros por Página (x), uma variável quantitativa discreta. A amostra total é de n=50 páginas. Para calcular a média, mediana e desvio padrão, usaremos a tabela de frequência fornecida e calcularemos o somatório dos produtos xᵢ fi e Erros (xᵢ) Frequência 25 0 0 1 20 20 1 20 2 3 6 4 12 3 1 3 9 9 4 1 4 16 16 Total A. Número Médio de Erros por Página A média é dada por = 33 0,66 erros/página 50 MEDIANA: A mediana é o valor que divide a distribuição em duas metades (50%). Para n = a média dos valores na posição e + 1, ou seja, a média das posições Consultando a frequência acumulada: Páginas a têm erros. Páginas a têm 1 erro. erro na posição é erro na posição Md 0+1 2 = 0,5 erros Embora 0,5 não seja um valor de erro real, essa é a mediana exata entre os dois valores centrais. Se a variável fosse estritamente tratada como discreta, a mediana seria 0, pois 50% dos dados estão em 0.Desvio Padrão (s) Primeiro, calculamos a Variância (s²) para dados não agrupados em classes: Usando total da amostra (n = 50): s² 57 50 = 57 50 (0,4356) = 35,22 ≈ 0,7188 49 49 49 Agora, Desvio Padrão (s): = 7188 ≈ 0, 8478 erros 2. Representação Gráfica Como a variável é Quantitativa Discreta (número de erros), gráfico mais apropriado é Gráfico de Barras ou Gráfico de Linhas (Bastões). Eixo x: Número de Erros (0,1,2,3,4) Eixo y: Frequência (25, 20, 3, 1, 1) gráfico mostraria a barra mais alta em erros (25 páginas) e a segunda mais alta em 1 erro (20 páginas), com as demais barras muito baixas, indicando que a grande maioria das páginas tem ou 1 erro. Distribução de Frequência Erros de Impresão Amostna de 50 Páginas 30 25 30 20 Frequénica (Númor de Págimss) 25 10 10 20 3 5 3 1 5 0 0 1 2 3 4 Núméro de Erros por Página3. Número Total de Erros Esperado número médio de erros por página é a melhor estimativa para número de erros esperados em qualquer página. Média de Erros/Página: 0,66 Número Total de Páginas no Livro: 500 Erros Esperados = Média por Página X Número Total de Páginas Erros Esperados = 0,66 500 = 330 erros EXERCICIO 6- Primeiro, organizamos os dados em ordem crescente (n=10$):2,50; 2,55; 2,57; 2,59; 2,60; 2,61; 2,62; 2,63; 2,64; 2,64. 1. Média A média é a soma de todos valores dividida pelo número de observações (n = 10). = 10 2. Mediana (Md) A mediana é valor central da distribuição. Como n par, a mediana é a média dos dois valores centrais, que estão nas posições 5° valor (ordenado): 2,60 6° valor (ordenado): 2, 61 Md = 2 = 5,21 2 = 2,605%3. Desvio Padrão (s) desvio padrão mede a dispersão dos dados em relação à média. Usaremos a fórmula para amostras (n - 1 no denominador). A. Cálculo da Variância (s²) A variância é calculada como s² = xᵢ 2,59 -0,015 0,000225 2,64 0,035 0,001225 2,60 -0,005 0,000025 2,62 0,015 0,000225 2,57 -0,035 0,001225 2,55 -0,055 0,003025 2,61 0,005 0,000025 2,50 -0,105 0,011025 2,64 0,035 0,001225 2,63 0,025 0,000625 Soma 0 s² = 0,0188 = 0,0188 9 ≈ Cálculo do Desvio Padrão (s) 00208889 ≈ 0, 0457% EXERCICIO 7- Vamos analisar a amostra de n=50 quarteirões para construir a distribuição de frequência em 5 intervalos, o histograma e determinar as medidas de posição central e dispersão. 1. Distribuição de Frequência (5 Classes) A variável Número de Casas é quantitativa discreta. A. Determinação de Parâmetros 1. Amplitude Total (R): Valor Máximo (Max): 97 Valor Mínimo (Min): 22. Amplitude da Classe (h): número de classes (k) foi estipulado em 5 (k = 5). Usaremos uma amplitude exata de h = 19 e começaremos a primeira classe no valor mínimo (2). Tabela de Distribuição de Frequência A tabela a seguir apresenta a distribuição de frequência com 5 classes, utilizando a notação a b (inclui o limite inferior, exclui superior, exceto na última classe). Classes de Casas Ponto Médio (xₘ) Frequência Absoluta (fᵢ) 11,5 15 21 40 30,5 11 40 59 49,5 10 59 78 68,5 9 78 97 87,5 5 Total 50 2. Histograma o Histograma é a representação gráfica da distribuição de frequência. Ele demonstra a concentração dos dados, que é maior nas classes com menor número de casas. o eixo horizontal representa as classes de Número de Casas, e o eixo vertical representa a Frequência Absoluta. Observação: A distribuição é assimétrica à direita (positiva), com o pico na primeira classe e uma cauda longa se estendendo para classes com maior número de casas.Classes de Casas Frequência Absoluta 15 21 40 11 40 59 10 59 78 9 78 97 5 3. Medida de Posição Central: Media (x) Para dados agrupados em classes, a média é aproximada usando ponto médio (xₘ) de cada classe: ≈ n Classes xₘ xₘƒᵢ 11,5 15 172,5 21 40 30,5 11 335,5 49,5 10 495,0 68,5 9 616,5 78 97 87,5 5 437,5 Total 50 2057,0 50 = 41, 14 casas/quarteirão 4. Medida de Dispersão: Desvio Padrão (s) o desvio padrão mede a variabilidade dos dados. Usaremos a fórmula para a amostra (n 1). A. Cálculo da Variância (s²) para dados agrupados 22 n - 1 Precisamos calcularfi 11,5 15 132,25 1983,75 30,5 11 930,25 10232,75 49,5 10 2450,25 24502,50 68,5 9 4692,25 42230,25 87,5 5 7656,25 38281,25 Total 50 = 117230,5 s² ≈ 117230,5 50 s² ≈ 117230, 5 50 1692, 50 49 s² ≈ 117230, 5 84625 = 32605,5 ≈ 49 49 B. Cálculo do Desvio Padrão (s) S = 665, 418 ≈ 25,80 casas/quarteirão EXERCICIO 8- A pesquisa envolveu n=100 famílias. A variável "Número de filhos" é quantitativa discreta. 1. Mediana (Md) A Mediana é o valor que divide a distribuição em duas metades (50%). Como n = 100 é par, a Mediana é a média dos valores nas posições e 1. Calcular a Frequência Acumulada (Fᵢ): Número de filhos (xᵢ) I Frequência (fᵢ) 2. Identificar Posições: Tanto a quanto a observação caem na classe onde Fᵢ atinge 65, ou seja, na classe de 2 filhos. 3. Resolução: Md = 2+2 2 = 2 filhos A mediana do número de filhosFaça upgrade para Google PI 2. Moda (Mo) A Moda é valor que apresenta a maior frequência na distribuição. Frequência Máxima: 28 famílias. Valor Correspondente: 2 filhos. Resolução: Mo = 2 filhos A moda do número de filhos é 2. 3. Problema e Cálculo da Média A. Problema o principal problema para calcular a média (x = é a última classe: "mais que 5" (frequência = 5). Essa classe é aberta e não possui um ponto central definido (xᵢ). Não sabemos se essas 5 famílias têm 6, 7, 10 ou mais filhos. A escolha do valor para essa classe afetará o resultado da média. Suposição e Resolução Para calcular a média, devemos fazer uma suposição sobre o valor (ponto médio) da classe "mais que 5". 1. Suposição: Assumiremos que número de filhos nessas 5 famílias é 6. (Geralmente, se escolhe limite inferior da classe aberta, ou um valor baseado no padrão da distribuição). 2. Cálculo da Média com a Suposição (X=6): Filhos (xᵢ) Frequência fi (Suposição) I 5 30 Total I 100 Σ 211 3. Média Calculada: Com a suposição de que as famílias da classe aberta têm 6 filhos, a média é de 2,11 filhos. EXERCICIO 9-