Prévia do material em texto
UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE TECNOLOGIA Lista de Exercícios 01 Introdução à Estatística e à Coleta de Dados na Engenharia Prof.: Carlos Estêvão R. Fernandes Disciplina: Probabilidade e Estatística para EEMA (CT007) Além das questões propostas abaixo, recomenda-se resolver todas as questões do primeiro capítulo do livro �Introdução à Estatística�, de M. Triola, 10ed., LTC. 1. Associe os conceitos apresentados nos retângulos às características ou de�nições listadas abaixo (cada retângulo tem apenas uma de�nição): obj.1 e 2 Estudo Retrospectivo Modelo Probabilístico Modelo Empírico Experimento Planejado Modelo Determinístico Modelo Mecanicista Baseado na experimentação (conhecimentos práticos) Resultados incertos quanti�cados pela chance de ocorrência Baseado em leis físicas (conhecimento cientí�co) Metodologia Cientí�ca ou de Engenharia Registro de grandezas do processo pela simples observação Dados coletados dos registros históricos Resultados rigorosos e exatos Inferência estatística sobre uma população Variações deliberadas nas variáveis de controle do processo 2. Associe os conceitos na coluna da direita aos elementos apresentados na coluna da esquerda: obj.1 e 2 ( ) População ( ) Experimento aleatório ( ) Modelo mecanicista ( ) Metodologia Cientí�ca ( ) Modelo probabilístico ( ) Experimento Planejado ( ) Estudo de observação ( ) Modelo Empírico ( ) Inferência estatística (A) Coleta de dados com mínima interferência no processo (B) Não especi�ca resultados exatos mas uma chance de ocor- rência (C) Coleção de todos os objetos, resultados ou elementos de interesse num problema (D) Conhecimento baseado em experimentos práticos (E) Abordagem para formular e resolver problemas e gerar co- nhecimento pela aplicação de conhecimentos cientí�cos e empíricos na validação de hipóteses (F) Permite estabelecer relações de causa-e-efeito (G) Estudo de uma população a partir de amostras coletadas aleatoriamente (H) Especi�ca resultados com base em conhecimentos físicos (cientí�cos) ( I ) Pode fornecer diferentes resultados mesmo quando repetido sob as mesmas condições 3. Classi�que as a�rmativas abaixo em Verdadeiras (V) ou Falsas (F): obj.1 e 2 ( ) A Inferência Estatística permite que se tire conclusões sobre uma população a partir de amostras coletadas de forma aleatória. ( ) Modelos mecanicistas podem ser também probabilísticos mas não empíricos. ( ) Estudos retrospectivos são baseados na experimentação (conhecimentos práticos). ( ) Experimentos Planejados permitem estabelecer relações de causa-e-efeito. ( ) Modelos deterministas podem ser também probabilísticos mas não empíricos, pois seus resultados são rigorosos e exatos. 4. Responda o que se pede sobre estudos estatísticos em problemas de Engenharia: (a) Complete os espaços em branco nas a�rmativas abaixo e responda à questão: obj.1 e 2 • Estudos que baseiam-se em amostras aleatórias coletadas de populações futuras (protótipos) são chamados . • A é o ramo da Estatística que permite que se tire con- clusões sobre uma população a partir de amostras coletadas de forma aleatória. • Modelos podem ser também probabilísticos mas não , pois seus resultados são baseados em . • Experimentos permitem estabelecer relações de causa-e- efeito. (b) Cite duas forma de coletar dados que permitem a realização de estudos estatísticos em problemas de Engenharia. Apresente uma vantagem de cada. obj.3 5. Leia o texto abaixo e responda ao que se pede: Num estudo sobre a pressão em sistemas de refrigeração, engenheiros se basearam na Lei Geral dos Gases Perfeitos para deduzir que, uma vez conhecida a temperatura T , a pressão P seria dada por: P = nRT V , (1) onde R é a constante universal dos gases perfeitos, V é o volume do sistema de refrigeração e n é o número de mols de gás introduzidos no sistema. Após alguns testes, os engenheiros perceberam que as pressões medidas na prática não coincidiam muito bem com o modelo acima, então realizaram experimentos em diversas circunstâncias e coletaram dados que os levaram à seguinte equação: P = nRT V − nb − an 2 V 2 , (2) onde a e b são constantes Reais conhecidas. Os resultados obtidos com o modelo acima se aproximam muito mais dos valores medidos, mas ainda não coincidem perfeitamente com o valor e P dado pelo modelo (2). Os engenheiros voltaram a utilizar os dados coletados nos experimentos para deduzir que o erro entre o valor medido e o valor teórico obtido pela equação (2) varia aleatoriamente (para mais ou para menos) de acordo com o grá�co abaixo: 68,27% 95,45% 99,73% 0 5-5 10 15-10-15 Unidade: kPa (3) onde os valores do eixo horizontal correspondem aos erros observados (dados em kPa). (a) Classi�que os modelos citados no texto como Determinístico (D), Probabilístico (P), Mecanicista (M) ou Empírico (E). Mais de uma classi�cação se aplica para cada modelo. obj.2 Equação da pressão (1) Equação da pressão (2) Grá�co do erro (3) (b) Os valores relativos à pressão do sistema medidos nos experimentos são registrados em kPa. Em que nível de mensuração encontram-se estes dados? obj.4 (c) Os dados relativos à temperatura utilizada em cada experimento são inicialmente anotados em graus Celsius. Em que nível de mensuração se enquadram estes valores? obj.4 (d) Em relação à coleta de dados realizada neste estudo, associe a coluna da esquerda com a da direita: obj.1 ( ) Estudo observacional longitudinal ( ) Experimento planejado ( ) Estudo observacional transversal ( ) Estudo observacional retrospec- tivo (A) Após uma hora de funcionamento, os engenheiros me- dem a pressão em diversas réplicas do sistema, ano- tando também a temperatura do gás naquele ins- tante. (B) Os engenheiros se basearam em dados de pressão e temperatura registrados ao longo do último ano pelos inspetores de qualidade da fábrica. (C) Os engenheiros �xaram alguns níveis especí�cos de temperatura e deixaram algumas réplicas do sis- tema funcionando até atingir a temperatura desejada. Neste instante, a pressão era medida e a média da pressão das diferentes réplicas foi anotada para cada valor de temperatura utilizado. (D) Durante um período de 24h, os engenheiros medem a pressão em uma réplica do sistema a cada uma hora de funcionamento, anotando também a temperatura do gás naqueles instantes. 6. A �m de realizar estudo sobre doença que afeta os cascos de bovinos no Ceará, a Secretaria de Desenvolvimento Agrário do Estado investiga o número de cascos afetados pela doença em cada animal. Associe os elementos da coluna da esquerda com os da direita, no que diz respeito à coleta de dados: obj.1 (A) A �m de compreender a in�uência da alimentação na incidência da doença os técnicos isolaram três gru- pos de animais, tratanto cada grupo com uma dieta especí�ca e mantendo inalterados todos os demais aspectos de manejo. (B) Os técnicos registram diversas informações sobre o manejo dos animais (alimentação, condições de con- �namento, vacinas, água, etc). Anotações sobre a quantidade de cascos afetados por animal são toma- das uma vez por mês durante 12 meses. (C) Com base em dados do IBGE coletados nos últimos 5 anos, os técnicos registram diversas informações sobre a quantidade de animais e suas condições. (D) Os técnicos registram diversas informações sobre o manejo dos animais (alimentação, condições de con- �namento, vacinas, água, etc). Anotações sobre a quantidade de cascos afetados por animal são toma- das uma vez ao �m do estudo em diferentes propri- edades rurais. ( ) Estudo observacional transversal ( ) Estudo observacional longitudinal ( ) Experimento planejado ( ) Estudo observacional retrospectivo Ainda sobre a pesquisa descrita na questão acima, responda os itens 7 a 9 abaixo. 7. Qual a melhor maneira de coletar os dados para esta pesquisa de forma a evitar que a amostra seja tendenciosa? obj.3 (a) Selecionar 10 municípios aleatoriamente e inspecionar 10 animais sorteados em cada município. (b) Inspecionar 10 animais aleatoriamente em cada uma das 10 maioresfazendas do estado. (c) Inspecionar 100 animais escolhidos aleatoria- mente no estado. (d) Inspecionar 10 animais aleatoriamente toma- dos ao acaso em cada um dos cinco municí- pios de maior PIB e dos cinco de menor PIB do estado. (e) Todos os métodos anteriores são válidos e não introduzem tendenciosidade na amostra. 8. Ao analisar as condições dos cascos, os técnicos registram o número de cascos afetados pela doença por animal. Os dados registrados são: obj.4 (a) Qualitativos e numéricos, de nível ordinal (b) Quantitativos de nível intervalar (c) Quantitativos de nível racional (d) Qualitativos e não-numéricos, de nível nomi- nal (e) Quantitativos e não-numéricos, de nível ordi- nal 9. Os técnicos concluem que o número X de cascos afetados por animal segue o seguinte modelo: p(k) = 115(k + 1), com k ∈ {0, 1, 2, 3, 4}, onde p(k) é a probabilidade do número X ser igual a k. Sobre este modelo, pode-se dizer que é um: obj.2 (a) Modelo empírico e determinista (b) Modelo probabilístico e empírico (c) Modelo determinista e mecanicista (d) Modelo probabilístico e mecanicista (e) Modelo mecanicista e empírico 10. Pesquisadores da UFC estão investigando os efeitos de um novo fertilizante biológico no desenvolvimento da abóbora. Para tanto, registram o peso (em Kg) de algumas abóboras (produzidas com e sem o fertilizante). Com base em registros de anos anteriores, há fortes indícios para considerar que o peso médio de uma abóbora madura é de µ = 6Kg. Assim, os pesquisadores decidem registrar o peso (em Kg) que está acima (+) ou abaixo (−) da média, ou seja X − µ. (a) Qual o nível de mensuração dos dados registrados pelos pesquisadores? obj.4 (b) Que tipo de estudo foi realizado para determinar a média populacional? obj.1 (c) Concluiu-se com a pesquisa que dentre as abóboras produzidas com o novo fertilizante, 50% superam a média µ em mais de 2Kg, 30% superam a média µ em menos de 2Kg e 20% �cam abaixo da média. Ao apresentar estas conclusões, que tipo de modelo os pesquisadores estão propondo? obj.2 (d) Com base em uma teoria clássica da bioquímica, os pesquisadores puderam ainda propor uma fórmula para calcular a quantidade ideal de fertilizante a ser usada em uma dada área de plantação. Que tipo de modelo esta fórmula representa? obj.2 (e) descreva um método de coleta de dados baseado em uma amostragem aleatória que não introduza tendenciosidade na amostra. obj.3 11. Numa pesquisa sobre acidentes rodoviários em certa região, alguns motoristas que morre- ram em acidentes de carro naquela região durante o período de um ano foram selecionados aleatoriamente e, com base nos registros do departamento de trânsito, suas idades (em anos) foram anotadas. Com base nisto, responda: (a) Qual o nível de mensuração dos dados observados? obj.4 (b) Esta pesquisa se trata de um estudo observacional ou de um experimento planejado? obj.1 (c) Seria possível classi�car esta pesquisa com um estudo retrospectivo, transversal ou longitudinal? Ou estas classi�cações não se aplicam? Em caso a�rmativo, qual a melhor classi�cação e por que? obj.1 12. Em um centro de pesquisas da Petrobrás, 15 amostras de óleo coletadas no mesmo dia em 15 diferentes plataformas em alto mar são analisadas quanto à viscosidade e à pureza. Os seguintes códigos são associados às amostras em função dos resultados das análises: 1 = Viscosidade Normal/Pureza Normal; 2 = Viscosidade Baixa/Pureza Normal; 3 = Viscosidade Normal/Pureza Baixa; 4 = Viscosidade Baixa/Pureza Baixa. A seguir são listados os códigos resultantes das análises realizadas nas 15 amostras obtidas: 3 1 1 2 2 4 2 3 1 4 1 2 4 1 1. Com base nisto, responda: (a) Qual o nível de mensuração dos dados observados? obj.4 (b) Qual a média aritmética dos dados observados? como você interpreta este valor? o valor obtido é uma estatística ou um parâmetro? obj.4 e 5 (c) Esta pesquisa se trata de um estudo observacional ou de um experimento planejado? obj.1 (d) Seria possível classi�car esta pesquisa com um estudo retrospectivo, transversal ou longitudinal? Ou estas classi�cações não se aplicam? Em caso a�rmativo, qual a melhor classi�cação e por que? obj.1 (e) E se as amostras fossem obtidas da mesma plataforma com intervalos de uma semana entre coletas, como você classi�caria a pesquisa? obj.1 13. Num estudo para testar a e�cácia de uma nova droga, um grupo de pessoas será tratado com a droga enquanto outro grupo receberá um placebo (substância neutra, sem efeito farmacológico sobre a patologia considerada). (a) Esta pesquisa se trata de um estudo observacional ou de um experimento planejado? obj.1 (b) Seria possível classi�car esta pesquisa com um estudo retrospectivo, transversal ou longitudinal? Ou estas classi�cações não se aplicam? Em caso a�rmativo, qual a melhor classi�cação e por que? obj.1 (c) Descreva uma forma de selecionar as pessoas que participarão deste estudo de maneira a garantir que a amostra será aleatória e representativa da população considerada. obj.3 (d) Um médico propõe a seus pacientes um desconto no preço da consulta caso ele aceite participar do estudo. Que problemas você vê neste método de amostragem? obj.3 14. Um condomínio residencial consiste de quatro prédios de seis andares com três apartamen- tos em cada andar, totalizando 72 apartamentos. A �m de realizar um estudo sobre o consumo de água no condomínio, o síndico decide realizar uma amostragem que o permita obter 12 amostras do consumo mensal de água (referente ao mês corrente). (a) O estudo realizado pode ser classi�cado como: (mais de um item pode estar correto) ( ) Experimento planejado ( ) Estudo o observacional ( ) Longitudinal ( ) Transversal ( ) Retrospectivo ( ) Estudo enumerativo ( ) Estudo analítico obj.1 e 3 Em cada item abaixo, classi�que o tipo de estratégia de amostragem adotado pelo síndico e indique se é uma estratégia estatisticamente válida (probabilística ou não): (b) Escrever os números dos 72 apartamentos em pedaços de papel e sortear aleatoria- mente 12 deles (sem reposição). obj.3 Estratégia de amostragem: ( ) Probabilística (estatisticamente válida) ( ) Não probabilística (estatisticamente inválida) (c) Escolher o prédio com maior número de moradores e tomar os apartamentos dos quatro andares mais elevados do prédio escolhido. obj.3 Estratégia de amostragem: ( ) Probabilística (estatisticamente válida) ( ) Não probabilística (estatisticamente inválida) (d) Escolher aleatoriamente três apartamentos de cada prédio. obj.3 Estratégia de amostragem: ( ) Probabilística (estatisticamente válida) ( ) Não probabilística (estatisticamente inválida) (e) Numerar os andares dos prédios e sortear aleatoriamente 4 andares (dentre todos os prédios). Depois, para cada andar sorteado, usar todos os apartamentos do andar na amostra. obj.3 Estratégia de amostragem: ( ) Probabilística (estatisticamente válida) ( ) Não probabilística (estatisticamente inválida) (f) Contar começando no primeiro apartamento do primeiro prédio até o último do quarto prédio, e usar na amostra o primeiro apartamento a cada 6 contados. obj.3 Estratégia de amostragem: ( ) Probabilística (estatisticamente válida) ( ) Não probabilística (estatisticamente inválida) 15. Em uma escola onde há cinco equipes esportivas (futebol, basquete, vôlei, atletismo e natação) deseja-se realizar uma enquete sobre os hábitos alimentares dos alunos-atletas. A escola gostaria de de�nir uma estratégia de amostragem aleatória (probabilística) para decidir quais alunos irão responder a um questionário. (a) Explique como a amostragem poderia ser realizada utilizando uma estratégia por conglomerados (agrupamentos). obj.3 (b) Explique como a amostragem poderia ser realizada utilizando uma estratégia siste- mática. obj.3 (c) Considere que o número de alunos em cada equipe esportiva é o indicado na ta- bela abaixo. Se a escola decidisse por uma estratégia estrati�cada (por equipe esportiva) qual o número de amostras que se deveria tomar de cada equipe es- portiva a �m de obter 20 amostras, mantendoo número de amostras de cada equipe proporcional ao tamanho da equipe (responda na própria tabela). obj.3 Setor organizacional Tamanho do setor Número de amostras Futebol 16 Basquete 12 Volei 10 Atletismo 7 natação 5 16. No problema da questão anterior, considere que os alunos são numerados sequencialmente e depois sorteiam-se aleatoriamente 15 números, correspondendo aos alunos que irão res- ponder ao questionário. O questionário é então aplicado mensalmente durante de um ano escolar. (a) Qual foi a estratégia de amostragem adotada nesse caso? obj.3 ( ) Aleatória estrati�cada ( ) Aleatória por conglomerados ( ) Aleatória sistemática ( ) Aleatória simples ( ) Não probabilística de conveniên- cia (b) O estudo realizado pode ser classi�cado como: (mais de um item pode estar correto) obj.1 ( ) Experimento planejado ( ) Estudo o observacional ( ) Longitudinal ( ) Transversal ( ) Retrospectivo (c) Em uma das perguntas do questionário os alunos devem indicar o volume de água (em litros) ingerido no dia. Estes coletados podem ser classi�cados como: obj.4 ( ) Discretos ( ) Contínuos ( ) Quantitativos ( ) Qualitativos 17. Em cada item abaixo, assinale a opção correta de acordo com o código abaixo, no que diz respeito à coleta de dados e tipos de estudos estatísticos: (A) Amostragem probabilística (estrati�cada) (B) Amostragem aleatória sistemática (C) Amostragem aleatória simples (D) Amostragem aleatória tendenciosa (E) A amostragem não é considerada aleatória (F ) Modelo probabilístico e mecanicista (G) Modelo determinista e empírico (H) Estudo observacional e retrospectivo (I) Experimento planejado (J) Estudo o observacional e longitudinal (K) Estudo observacional e transversal (L) Estudo enumerativo e analítico (M) Modelo empírico e probabilístico (N) Modelo mecanisista e determinista (a) Em uma escola onde há 300 estudantes, os nomes dos alunos são listados em ordem alfabética e um número de 1 a 300 é associado a cada nome, em ordem crescente. A direção da escola usa um computador para gerar 50 números aleatórios e os alunos cujos nomes estão associados àqueles números sorteados são chamados para responder a uma enquete. Que tipo de amostragem é esta? obj.3 (b) Uma escola escolhe 3 alunos-atletas selecionados aleatoriamente de cada uma das equipes esportivas da escola para participar de uma enquete sobre o quotidiano de treinos dos alunos-atletas da escola. Que tipo de amostragem é essa? obj.3 (c) A �m de avaliar a evolução da aprendizagem de matemática dos alunos ao longo dos quatro anos do ensino fundamental II, a direção da escola decide selecionar um grupo de alunos de cada turma, do sexto ao nono ano, e observar ao �m deste ano letivo a nota média anual em matemática de cada aluno. Este estudo estatístico pode ser classi�cado como: obj.1 (d) Engenheiros analisaram milhares de pastilhas de silício produzidas numa fábrica e concluíram com base nos dados observados que o número k de falhas por mm3 tem probabilidade de ocorrer dada por pk = (1/2) k+1, para k = 0, 1, 2, 3, . . . O modelo proposto pode ser classi�cado como: obj.2 18. No processo de torneamento de peças de aço, sabe-se que os fatores que mais in�uenciam no índice de rugosidade (η) das peças são a pressão (P ) e a temperatura (T ) da fundição1. A �m de determinar os valores de P e T que levam ao menor índice de rugosidade η, engenheiros realizaram testes variando estes dois parâmetros e concluíram que o índice de rugosidade é dado por: η = αP + β T + γ, onde α, β e γ são constantes conhecidas. (a) Assinale as opções que correspondem corretamente à classi�cação do modelo desco- berto e à pesquisa realizada pelos engenheiros: obj.1 e 2 O modelo descoberto é: ( ) mecanicista ( ) empírico ( ) probabilístico ( ) determinista A pesquisa realizada de classi�ca como um: ( ) experimento planejado ( ) estudo observacional transversal ( ) estudo observacional longitudinal 19. A direção de uma empresa está realizando uma pesquisa sobre a opinião dos funcionários a respeito do novo programa de controle da qualidade implantado. A tabela abaixo indica o número de funcionários em cada setor organizacional da empresa. A empresa gostaria de de�nir uma estratégia de amostragem aleatória (probabilística) para decidir quais funcio- nários responderão a um questionário. Setor organizacional Tamanho do setor Número de amostras Direção 2 Financeiro 3 Contabilidade 5 Comercial 7 Engenharia 10 Recursos Humanos 2 Serviços gerais 1 (a) Considere uma estratégia estrati�cada (por setor organizacional) e estabeleça o nú- mero de amostras que se deve tomar em cada setor a �m de obter 12 amostras, mantendo o número de amostras de cada setor proporcional ao tamanho do setor (responda na própria tabela). obj.3 1 Os dados desta questão são �ctícios. (b) Se, ao invés da estratégia acima, a diretoria decidisse sortear 3 setores organizacionais e aplicar o questionário a todos os funcionários daqueles setores sorteados, como você classi�caria a estratégia de amostragem? obj.3 (c) Se, ao invés disso, a diretoria atribuísse um número de 1 a 30 a cada um dos funcio- nários e usasse um programa de computador para sortear aleatoriamente 12 números, como você classi�caria a estratégia de amostragem? obj.3 20. Numa pesquisa sobre o trânsito, investiga-se o número de acidentes em certa ci- dade. Para tanto, ao longo de vários dias, anotam-se as quantidades de acidentes registrados diariamente pela autoridade de trânsito da cidade. (a) Com base no enunciado, responda: obj.1 e 4 Os dados observados são: ( ) contínuos; ( ) discretos; O nível de mensuração dos dados é: ( ) nominal; ( ) ordinal; ( ) intervalar; ( ) racional; A pesquisa se trata de: ( ) estudo observacional; ( ) experimento planejado; A coleta de dados é feita de forma: ( ) retrospectiva; ( ) longitudinal; ( ) transversal; (b) Utilizando os dados obtidos é possível estimar as chances de acidente em diversas ruas e avenidas da cidade. Para tanto, é possível estabelecer um modelo: obj.2 ( ) mecanicista e determinista ( ) determinista e empírico ( ) probabilístico e determinista ( ) probabilístico e empírico ( ) determinista e probabilístico 21. A �m de realizar estudo sobre doença que afeta os cascos de bovinos no Ceará, a Secretaria de Desenvolvimento Agrário do Estado investiga o número de cascos afetados pela doença em cada animal. A �m de compreender a in�uência da alimentação na incidência da doença os técnicos isolaram três grupos de animais, tratando cada grupo com uma dieta especí�ca e mantendo inalterados todos os demais aspectos do manejo (condições de con�namento, vacinas, água, temperatura, umidade, etc). Anotações sobre a quantidade de cascos afetados por animal são tomadas uma vez por mês durante 12 meses. (a) Ao realizar a pesquisa desta forma, os técnicos estão realizando um estudo (ou experimento) de que tipo? obj.1 e 3 (marque as alternativas corretas) ( ) observacional ( ) transversal ( ) planejado ( ) amostragem aleatória simples ( ) longitudinal (b) Os técnicos concluem que o número X de cascos afetados por animal segue o seguinte modelo: p(xi) = 2C(xi + 1), com xi ∈ {0, 1, 2, 3, 4}, onde C é uma constante e p(xi) = P (X = xi). Sobre este modelo, pode-se dizer que é um modelo: obj.2 (marque as alternativas corretas): ( ) determinista ( ) mecanicista ( ) probabilístico ( ) empírico