Baixe o app para aproveitar ainda mais
Prévia do material em texto
1ª LISTA DE EXERCÍCIOS DE ESTATÍSTICA Disciplina : Estatística Profa: MS.Daniela Brassolatti Conteúdo: ● Conceitos básicos ● Distribuição de frequências ● Tabelas ● Representações Gráficas ● Medidas de Tendência Central ● Medidas de Dispersão ● Medidas de Separatrizes ● Medidas de Assimetria e curtose ● Ramos e Folhas ● Box-plot (1) Classifique cada uma das variáveis abaixo em qualitativa (nominal / ordinal) ou quantitativa (discreta / contínua). a) Ocorrência de hipertensão pré-natal em grávidas com mais de 35 anos (sim ou não são possíveis respostas para essa variável) b) Intenção de voto para presidente (possíveis respostas são os nomes dos candidatos, além de não sei). c) Perda de peso de maratonistas na Corrida de São Silvestre, em quilos. d) Intensidade da perda de peso de maratonistas na Corrida de São Silvestre (leve,moderada,forte). e) Grau de satisfação da população brasileira com relação ao trabalho de seu presidente (valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito). f) Cor dos cabelos dos alunos de uma escola g) Precipitação pluviométrica, durante um ano em uma estação meteorológica de Vitória. h) Raça dos alunos de uma certa escola. i) Número de ações negociadas na bolsa de valores de São Paulo. j) Número de filhos de casais residentes em Vila Velha. k) Salário dos funcionários de uma empresa. l) Diâmetro externo de peças produzidas por certa máquina. m) Número de peças produzidas por hora por certa máquina. n) Pontos obtidos em cada jogada de um dado. o) Sexo dos filhos dos casais residentes em Viana. p) Número de exemplares dos livros da biblioteca da Unip. (2) Considerando as notas de um teste de inteligência aplicado a 100 alunos: 64 78 66 82 74 103 78 86 103 87 73 86 78 101 85 98 75 73 90 86 78 86 78 101 85 98 75 73 90 86 86 84 86 76 76 83 103 86 84 85 82 90 83 81 85 72 81 96 81 85 68 96 86 70 72 74 84 99 81 89 68 96 86 70 72 74 84 99 81 89 71 73 63 105 74 98 78 78 83 96 95 94 88 62 91 83 98 93 83 76 94 75 67 95 108 98 71 92 72 73 Forneça uma distribuição de frequência em classes e construa um gráfico adequado para esta variável. (3) A distribuição abaixo indica o Nº de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: Nro de acidentes 0 1 2 3 4 5 6 7 Nro motoristas 20 10 16 9 6 5 3 1 Determine: a) O número de motoristas que não sofreram nenhum acidente. b) O número de motoristas que sofreram pelo menos 4 acidentes. c) O número de motoristas que sofreram menos de 3 acidentes. d) O número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes. e) A percentagem dos motoristas que sofreram no máximo 2 acidentes. (4) Quinze pacientes de uma clínica de ortopedia foram entrevistados quanto ao número de meses previsto para a fisioterapia, se haverá (S) ou não (N) sequelas após o tratamento e o grau de complexidade da cirurgia realizada: Alto (A), médio (M) ou baixo (B). Os dados são apresentados na tabela abaixo: a) Classifique cada uma das variáveis (Fisioterapia, Sequelas, Cirurgia) b) Para cada variável, construa uma distribuição de frequência e faça uma representação gráfica. c) Para o grupo de pacientes que não ficaram com sequela, faça um gráfico de barras para a variável Fisioterapia. (5) Um novo medicamento para cicatrização está sendo testado e um experimento é feito para estudar o tempo (em dias) de completo fechamento em cortes provenientes de cirurgia. Uma amostra em 30 cobaias forneceu os valores: a) Organize uma tabela de frequência sem intervalos de classe. b) Que porcentagem das observações estão abaixo de 16? c) Classifique como rápida as cicatrizações iguais ou inferior a 15 dias e como lenta as demais. Faça um gráfico adequado. (6) Foram feitas medidas em operários da construção civil a respeito da taxa de hemoglobina no sangue (em gramas/cm ): a) Construa uma tabela de frequência em classes. b) Construa o histograma. c) Taxas abaixo de 12 ou acima de 16 são consideradas alteradas e requerem acompanhamento médico. Obtenha a tabela de frequência da variável Acompanhamento Médico com dois valores sim ou não e faça um gráfico adequado para a variável acompanhamento médico. (7) A tabela a seguir apresenta os salários, em reais, dos funcionários de duas empresas. Empresa A Empresa B 400 1200 300 280 700 190 230 420 110 230 330 420 350 620 340 620 550 2100 380 520 190 310 620 380 480 720 310 620 1700 3200 1100 840 210 630 160 240 1800 1320 920 780 1100 510 160 190 200 230 990 355 720 830 400 2900 830 320 3500 230 120 290 340 720 130 190 980 320 1540 920 420 380 590 1320 2720 3000 Faça uma descrição comparativa usando o ramos e folhas em cada caso, para isso utilize a primeira e segunda casas decimais e elimine as demais casas. * Por exemplo o número 280, considere 02 como a casa decimal e elimine o 80 * Por exemplo o número 2720, considere 27 como a casa decimal e elimine o 20 e assim por diante (8) As diferenças entre os valores da média, moda e mediana são indicadores da forma da distribuição em termos de assimetria. Se MÉDIA = MEDIANA - DISTRIBUIÇÃO SIMÉTRICA Se MÉDIA > MEDIANA - CURVA POSITIVAMENTE ASSIMÉTRICA Se MÉDIA < MEDIANA - CURVA NEGATIVAMENTE ASSIMÉTRICA Dessa forma, para uma amostra de 15 clientes de um pequeno mercado os seguintes montantes de vendas foram observados: 10 10 25 25 25 35 40 53 90 125 135 245 271 309 410 a) Determine a média, a moda e a mediana para esses valores de vendas b) Como você descreveria a distribuição dos dados do ponto de vista da assimetria? Explique. c) Qual das medidas (média, moda e mediana) você acha mais ideal para descrever seus dados? Explique! (9) Na tabela seguinte estão registradas as 20 maiores empresas por lucro no ano 1995. EMPRESA LUCRO EM MILHÕES Petrobás 619.7 Fiat 475.5 Aracruz celulose 356.5 Vale do rio doce 338.5 Usiminas 336.0 Telesp 310.5 Brahma 257.5 Cemig 223.3 Nestlé –SP 209.7 Souza Cruz 198.4 Cia Sider de Tubarão 190.5 Petrobás Distribuidora 189.3 Cia Brasileira de aluminío 176.9 Camargo Correa 162.4 Semp Toshiba Amazonas 155.5 Vasp 155.5 Copene 148.9 Gessy Lever 142.7 Embratel 141.9 Souza Cruz Trading 136.6 a) Pede-se calcular o valor da média, moda e mediana do lucro das 20 maiores empresas por lucro durante 1995. b) Explique a forma da distribuição do lucro das 20 maiores empresas em termos de assimetria ou simetria. (10) Na tabela de distribuição de frequências a seguir estão apresentadas as espessuras (em mm) de 40 chapas de aço. a. Determine a média, moda e mediana b. Determine o desvio-padrão e o coeficiente de variação [86,96[ 8 [96,106[ 5 [106,116[ 10 [116,126[ 6 [126,136[ 1 [136,146[ 5 [146,156[ 5 (11) Medidas as estaturas de 1017 indivíduos , obtivemos média= 162,2 cm e s =8,01 cm. O peso médio desses mesmos indivíduos é 52 Kg, com um desvio-padrão de 2,3 Kg. Esses indivíduos apresentam maior variabilidade em peso ou altura? Explique! (12) Mediu-se a pressão sanguínea diariamente de um paciente durante várias semanas. Essas medidas acusaram média de 188 com desvio-padrão de 14,2. Um segundo paciente foi também submetido à mesma mensuração diária com uma média de 136 e desvio-padrão de 8,6.dos dois pacientes qual tem pressão relativamente mais variável? (13) Abaixo temos medidas descritivas de dados de pressão intraocular de uma amostra de 243 indivíduos, divididos em 5 grupos, segundo a condição clínica da doença glaucoma. Faça um box-plot em cada caso e descreva a principais informações oriundas desta análise. Grupo 1: Normais Mínimo 10 Máximo 18 Quartil 1: 12 Quartil 3: 15 Md: 13 Grupo 2: Suspeitos Mínimo 13 Máximo 30 Quartil 1: 20 Quartil 3: 25 Md:23 Grupo 3: Doentes Mínimo 22 Máximo 40 Quartil 1: 28 Quartil 3: 35 Md:31 Grupo 4: em tratamento Mínimo 11 Máximo 32 Quartil 1: 18 Quartil 3: 22 Md:20 Grupo 5: operados Mínimo 4 Máximo 22 Quartil 1: 10 Quartil 3: 15 Md:13 (14) Considere os dados de Sexo e Raça para os dados abaixo: Sex o F M M F M F F F M M M M M M F F F M F F F F M M F M M Raç a B B B B B B B B B B B B B B B B B P B B B A B B B B N a) Construa a tabela de frequências para cada uma das variáveis. b) Faça os gráficos de barras para cada uma das variáveis. c) Qual é a moda (maior frequência) de cada variável? (15) Eis as notas de uma prova para 18 alunas do primeiro ano de uma faculdade: 154 109 137 115 152 140 154 178 101 103 126 126 137 165 165 129 200 148 e para 20 alunos do primeiro ano 108 140 114 91 180 115 126 92 169 146 109 132 75 88 113 151 70 115 187 104 (a) Faça um ramo-e-folhas face-a-face destes dados (faça um ramo único para meninos e meninas, coloque a folhas dos meninos de um lado e das meninas do outro). (b) Ache a média ( ) e a mediana (Md) para ambos os conjuntos de notas. (c) Os dados para mulheres contém um outlier alto. Calcule a média e a mediana para estes dados, com o outlier e sem ele. Como a remoção do outlier afeta a média? Como afeta a mediana? Seus resultados ilustram a maior robustez da mediana? (d) Determine o desvio-padrão (s) para ambos os conjuntos. (e) Determine o coeficiente de variação ( cv) para ambos os conjuntos de notas. Compare os dois conjuntos de notas quanto à homogeneidade. (16) É dado na Fig. 1 o histograma para um conjunto de dados. Qual dos box-plots é consistente com o histograma na descrição da distribuição dos dados. Justifique sua escolha. Fig. 1: Histograma e box-plots (17) Considere o seguinte conjunto de dados de uma variável numérica: a) Calcule as medidas de posição (média, moda, mediana, primeiro e terceiro quartil) , dispersão (amplitude, variância, desvio-padrão)e as medidas de assimetria e curtose para os dados. b) Faça o histograma, gráfico de ramo e folhas e Box-plot para os dados. c) Comente também sobre os formatos dos dados (assimetria, posição, variabilidade, modalidade (modas)), além da presença ou não de outliers. d) Para os dados agrupados na tabela de frequências do histograma, calcule média, moda, mediana, variância e desvio-padrão. Média, mediana, variância e desvio-padrão são próximos dos dados não-agrupados (obtidos no item a))? (18) A Fig. 2 apresenta os Box-plots das notas dos conjuntos de dados referentes às alunas (F) e aos alunos (M) e a todos os estudantes (T). Fig. 2: Box-plots dos conjuntos de dados (a) Para cada um dos conjuntos de dados, estime graficamente a mediana, o primeiro e o terceiros quartis e uma medida de dispersão; (b) Faça uma breve comparação dos grupos de alunos e alunas. As mulheres, como grupo, têm maiores notas do que os homens? Que grupo de notas se apresenta mais disperso? A Tabela 1 apresenta algumas informações adicionais sobre esses conjuntos de dados: 18 alunas do primeiro ano de uma faculdade: 154 109 137 115 152 140 154 178 101 103 126 126 137 165 165 129 200 148 20 alunos do primeiro ano 108 140 114 91 180 115 126 92 169 146 109 132 75 88 113 151 70 115 187 104 Tabela 1: Algumas medidas-resumo dos conjuntos de dados Conjunto Quantidade. (n) Média ( ) Desvio-padrã o (s) Alunas (F) 18 141,06 26,44 Alunos (M) 20 121,25 32,85 Todos os alunos (T) Calcule! Calcule! 31,24 (c) Utilize o coeficiente de variação (cv) e compare os conjuntos em relação aos resultados obtidos. Qual grupo foi mais homogêneo? (d) Observe a variabilidade dos três conjuntos (F, M e T) e conjecture se o sexo é importante para ajudar a explicar a variação das notas. (19) Os dados da tabela abaixo são de Pesos (em Kg) de 50 Homens e 40 Mulheres. a) Construa as medidas-resumo de posição (média, quartis, mínimo e máximo), de dispersão (distância interquartílica, amplitude, variância, desvio-padrão e coeficiente de variação), assimetria e curtose para os dados totais (Feminino e Masculino) e separadamente, por Sexo. b) Faça os gráficos de histograma (freq. Relativa e de densidade), ramo-e-folhas e Box-plot para os dados totais (Feminino e Masculino) e separadamente, por Sexo. c) Interprete os dados, usando os resultados obtidos nos itens a) e b), explicando, se houver, diferenças atribuídas à variável Sexo. Comente também sobre os formatos dos dados (assimetria, posição, variabilidade, modalidade (modas)), além da presença ou não de outliers. Mas cu li no 64,0 64,3 64,7 65,9 66,8 67,1 67,2 67,2 67,2 67,6 67,9 68,5 68,6 68,7 68,8 68,9 68,9 69,0 69,4 69,4 69,5 69,7 69,7 69,7 69,9 69,9 70,0 70,0 70,4 70,6 70,7 70,7 70,8 70,9 71,0 71,4 71,5 71,5 71,8 71,8 72,0 72,3 72,4 72,4 72,8 72,8 74,1 75,4 75,6 75,6 Fem in in o 64,1 64,6 64,6 65,5 65,6 65,6 65,8 65,8 65,8 65,8 65,9 65,9 66,0 66,1 66,1 66,1 66,2 66,3 66,5 66,5 66,6 66,6 66,7 66,8 66,9 67,1 67,4 67,6 67,6 67,7 67,8 67,9 67,9 68,0 68,1 68,5 68,8 69,7 70,2 71,9 (20) Dados sobre uma amostra de 20 funcionários de uma empresa indivíduo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Nºde filhos 0 2 3 2 1 4 5 3 6 7 4 3 2 1 3 5 6 3 2 1 Fonte: Dados fictícios a) Calcule as medidas de posição (média, moda, mediana, primeiro e terceiro quartil) e dispersão (amplitude, variância, desvio-padrão) para os dados. b) Faça o histograma para os dados. (21) Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinado município do Estado: Milímetros de chuva a) Determinar o número de classes pela regra de Sturges; b) Construir a tabela de frequências absolutas simples; c) Determinar as frequências absolutas acumuladas; d) Determinar as frequências simples relativas; (22) Considere os dados da população da sua turma (obtera lista de presença da sala) a) Realize uma amostra aleatória simples de n = 10 alunos. Use a tabela de números aleatórios. Explique o critério! b) Apresente os dados amostrais correspondentes as variáveis coletadas para esta população (altura, sexo, idade, peso, num. irmãos, escolaridade pai/mãe) c) Considere os dados ordenados em ordem alfabética e realize uma amostra sistemática de tamanho n = 5. Calcule o intervalo de seleção N/n e defina os elementos da amostra. d) Considerando a população da sua turma, faça amostragem estratificada proporcional com n = 8, considerando a variável sexo. (23) Os dados a seguir são de peso (kg) de 120 mulheres. 65 71 70 46 75 61 68 76 75 65 84 72 47 79 62 69 77 79 58 63 75 48 79 63 76 78 73 59 64 76 49 82 64 77 79 82 67 65 77 50 83 65 80 80 76 68 74 78 51 65 66 81 74 81 80 52 68 67 59 81 66 82 53 75 68 64 66 69 63 54 76 69 70 61 71 40 66 55 78 70 80 64 71 72 56 78 71 85 65 72 42 72 57 81 72 70 67 73 43 72 58 85 73 71 68 75 44 73 59 66 74 72 70 77 45 73 60 68 75 72 a) Sorteie uma amostra aleatória de tamanho 20 utilizando a tabela dos números aleatórios. b) Apresente os valores do peso dos indivíduos sorteados. c) Faça a média da amostra. d) Este valor é o parâmetro, o estimador ou a estimativa do peso médio? e) Sorteie uma amostra sistemática de tamanho 20. Indique o intervalo de amostragem e o começo casual sorteado. Indique o número de identificação de cada elemento da amostra. f) Calcule a média da amostra sistemática g) Compare com o peso médio obtido no item c. Você esperaria o mesmo resultado? Justifique. h) Qual dos dois valores você diria que representa melhor o conjunto de dados? Justifique. (24) Os dados a seguir são provenientes do grupo Western Collaborative Group Study, criado na Califórnia em 1960-61. Foram estudados 3154 homens de meia idade para investigar a relação entre padrões de comportamento e risco de doença coronariana. Os dados apresentados são de 40 homens para os quais foram medidos os níveis de colesterol (mg/100ml) e realizada uma categorização segundo comportamento. O comportamento de tipo A é caracterizado pela urgência, agressividade e ambição. O de tipo B é relaxado, não competitivo e menos preocupado. Tipo A: nível de colesterol 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325 Tipo B: nível de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213 a) Quais variáveis que estão sendo estudadas? Identifique a natureza de cada variável. b) Apure os dados e apresente a variável nível de colesterol em uma tabela de frequências , considerando os níveis A e B. c) Classifique a variável nível de colesterol em duas categorias: nível normal (abaixo de 160 mg/100ml) e nível elevado (160 mg/100ml e mais) e faça uma tabela bidimensional cruzando as variáveis: nível de colesterol (normal e alto) e tipo de comportamento (A e B). Interprete os resultados. (25) Os dados a seguir são de uma pesquisa que investigou as concentrações de minerais no leite materno, no período de 1984 a 1985. Foram coletadas amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital Maternidade Odete Valadares, em Belo Horizonte. As mães foram divididas em período de lactação: colostro e leite maduro. cálcio (µg/mL de leite) – grupo colostro 113 181 254 311 334 145 221 256 312 344 163 225 275 313 372 163 231 296 323 375 167 241 303 325 375 437 cálcio (µg/mL de leite) – grupo maduro 159 175 181 188 200 206 213 214 217 231 238 238 242 244 256 259 260 263 264 275 277 279 281 293 302 303 314 344 394 a) Calcule a quantidade média de cálcio (µg/mL de leite) em cada grupo. b) Calcule a quantidade mediana de cálcio (µg/mL de leite) em cada grupo. c) Desenhe o box plot da concentração de cálcio (µg/mL de leite) representando os dois grupos em um só gráfico. d) Comente o gráfico box plot quanto a dispersão dos dados, existência de valores aberrantes e igualdade de medianas. (26) Os dados a seguir são provenientes de um estudo que avalia o crescimento de crianças de 7 a 10 anos de uma escola pública do município de São Paulo no ano de 2008. Os dados apresentados são de 16 meninos e 16 meninas para os quais foram aferidos a circunferência do braço (CB) (cm): Meninos 18,3 19,3 20,9 19,0 20,5 16,3 21,0 17,8 21,6 22,6 27,3 26,7 29,0 22,0 25,2 19,5 Meninas 21,5 16,1 18,6 19,9 17,9 23,7 20,0 19,4 23,5 18,0 23,0 17,9 20,3 23,1 17,8 18,2 a) Calcule a circunferência braquial (cm) média e mediana para cada sexo. b) Calcule a variância, o desvio-padrão e o coeficiente de variação de Pearson da circunferência braquial (cm) para cada sexo. c) Meninos e meninas são parecidos quanto a circunferência braquial (cm)? d) E quanto à variabilidade? (27) A Faculdade deseja realizar uma pesquisa de opinião sobre a qualidade de um curso que tem cerca de 700 alunos, perguntando aspectos relativos ao encadeamento das disciplinas no currículo. Foi decidido que será utilizado o método de amostragem aleatório simples para selecionar os respondentes para compor a amostra. Este é o método de amostragem mais apropriado? Justifique sua resposta. (28) Uma operadora telefônica pretende saber a opinião de seus assinantes comerciais sobre seus serviços na cidade de Vargem Alegre. Supondo que há 25037 assinantes comerciais, e a amostra precisa ter no mínimo 800 elementos. Mostre como seria organizada uma amostragem sistemática para selecionar os respondentes. (29) Classifique as seguintes variáveis em: (QN) Qualitativa nominal, (QO) Qualitativa ordinal (QC)Quantitativa contínua, (QD)Quantitativa discreta ( ) Cor dos olhos ( ) Número de filhos de um casal ( ) Peso de um indivíduo ( ) Altura de um indivíduo ( ) Número de alunos de uma escola ( ) Tipo sangüíneo ( ) Posicionamento das empresas no mercado ( ) Fator RH ( ) Sexo ( ) Comprimento de um segmento de reta ( ) Área de um círculo ( ) Raça ( ) Quantidade de livros de uma biblioteca ( ) Escolaridade dos funcionários de uma empresa ( ) Religião ( ) Salário dos empregados de uma empresa ( ) Comprimento dos parafusos produzidos em uma fábrica ( ) Estado civil ( ) O nível sócio-econômico dos residentes em um bairro de Ipatinga ( ) Tempo de vida de uma lâmpada ( ) Profissão ( ) Número de ações negociadas diariamente na bolsa de valores ( ) Volume de água contida numa piscina ( ) A classificação dos alunos no último vestibular (30) A seguir são apresentados casos práticos de amostragem ou censo. Em alguns casos podem ser possíveis as aplicações de mais de um tipo de amostragem (o texto está mais genérico permitindo interpretações diferentes) e em outros casos, um único tipo de amostragem é possível (o textoestá mais específico). Nas questões de 01 a 06 defina: a) Se é um caso de amostragem ou censo; b) Se for amostragem defina se a amostragem é probabilística ou não probabilística; c) Se a amostragem for probabilística defina qual o tipo: Aleatória simples, sistemática, estratificada ou conglomerado; d) Se a amostragem não for probabilística defina qual o tipo: Por cotas, por julgamento; e) Justifique sua resposta apontando as características da amostragem que o conduziu a fazer esta opção. Observação: É interessante que você discuta com seus colegas as diversas possibilidades existentes para cada caso. Casos: 1) Polícia rodoviária escolhendo um veículo na rodovia para parar, ver a documentação e fazer inspeção. 2) Escolha de um número de bingo através de um sorteio das pedras em uma sacola. 3) Pesquisa realizada sobre veículos, utilizando levantamento da Anfavea, o qual estabelece o número de vendas de veículos por tipo de veículo e potência. O número de veículos escolhido para a amostra foi proporcional à quantidade vendida por tipo e potência e os veículos pesquisados foram selecionados aleatoriamente de uma relação fornecida pelo DENATRAN. 4) Escolha de 10 aeromoças num processo de seleção de uma empresa aérea entre 380 currículos enviados. 5) Pesquisa realizada por uma empresa de locação de veículos no aeroporto de confins - MG com dados de perfil dos passageiros fornecidos pela INFRAERO. Cada pesquisador recebeu uma cota de pessoas a serem pesquisadas de acordo com os diversos perfis e a escolha ficou para o julgamento do pesquisador. 6) Amostragem pela ADEMG, no campo do estádio Mineirão, com os torcedores que assistiram o jogo Brasil e Argentina, para saber quais os percentuais de torcidas dos times Cruzeiro, Atlético, América e outros que estavam presentes, escolhendo em cada portão de entrada as pessoas que estavam com os bilhetes terminados pelo números 03 e 07. Os números 03 e 07 foram selecionados através da TNA. O trabalho de pesquisa iniciou na abertura dos portões e terminou no fechamento dos mesmos.
Compartilhar