Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade 1: Conceitos, definições e terminologia 1.1 Primeiras Palavras Uma das dificuldades do estudante de estatística é não ter claro o que são alguns termos utilizados, ou seja, não ter conhecimento de nomes utilizados e que são recorrentemente nos materiais de estudo disponíveis. Nesta unidade, serão apresentados conceitos, definições e termos que utilizaremos ao longo do curso. Esses conceitos, definições e termos são necessários para desenvolvermos uma linha de raciocínio na resolução de problemas de engenharia. 1.2 Problematizando o tema A começar pelas classificações usualmente utilizadas em livros de estatística, o leitor pode visualizar os diferentes conjuntos de técnicas estatísticas aplicáveis em diversos tipos de problemas industriais a partir do quadro 1.1, que mostra algumas dessas classificações. Quadro 1.1: Termos geralmente utilizados para classificar as diferentes técnicas estatísticas Testes paramétricos Testes não paramétricos Análise Univariada Análise Multivariada Análise exploratória Análise confirmatória Distribuição de probabilidade Distribuição amostral Parâmetros populacionais Estatística/estimativa Estatística descritiva Estatística indutiva Censo Amostra Variáveis quantitativas (escala) Variáveis qualitativas (escala) Neste curso, abordaremos algumas das técnicas ilustradas no quadro 1.1, dentre as quais destacamos: testes paramétricos, análise univariada, distribuição de probabilidade, análise exploratória e confirmatória, amostra, estatística descritiva e escalas de medidas. Outras técnicas, como a análise multivariada e testes não paramétricos, não serão abordados. Essa qualificação, bem como de outros termos não apresentados no quadro 1.1, são estranhos a muitos estudantes e leitores. Para minimizar esse problema e dar base para o desenvolvimento dos próximos assuntos do curso, esta unidade tem como objetivos: Propiciar aos alunos clara compreensão dos termos utilizados na área da estatística aplicada à engenharia. Possibilitar aos alunos e leitores a compreensão geral de como são classificadas as principais técnicas estatísticas aplicadas ao desenvolvimento de pesquisas e análises de problemas de engenharia. 1.3 Matriz de dados A primeira etapa das análises estatísticas é a coleta e organização dos dados. Há vários pacotes estatísticos disponíveis no mercado e todos têm a mesma estrutura de entrada de dados. Essa estrutura é significativa já no planejamento dos procedimentos estatísticos a serem utilizados. A entrada de dados para análise é na forma matricial, como está exemplificada no quadro 1.2. Na primeira coluna estão objetos de análise, denominados de casos, que podem ser pessoas, componentes ou materiais, empresas, ou qualquer outro objeto em análise. Nas demais colunas estão as variáveis relacionadas aos objetos, por exemplo, tamanho, cor, forma, idade, enfim qualquer característica física, sensorial ou estética. Os exemplos que serão mostrados ao longo desta unidade facilitarão a compreensão e a utilidade da estrutura matricial de dados. Quadro 1.2: Organização da entrada de dados para análise. Variáveis Casos A B C D 1 2 3 4 EXEMPLO 1: O registro de absenteísmo de motoristas de ônibus de uma grande cidade foi feito em quatro diferentes meses. Para cada absenteísmo foram registradas as seguintes variáveis: o mês em que ocorreu o absenteísmo, o dia da semana, garagem, dias perdidos, tempo de empresa do motorista, tipo de mudanças que acarretou na empresa, sexo do motorista, tempo perdido ou atrasos. Foram observados dez motoristas, portanto dez casos, e oito variáveis. Os dados estão na tabela 1.1. Tabela 1.1: Matriz de dados do exemplo 1. Caso M ês D ia G a ra g e m D ia s P er d id o s T em p o d e em p re s a T ip o d e m u d an ça S ex o T e m p o p e rd id o 1 1 1 5 6 5 3 0 7,5 2 1 2 5 1 9 13 1 7,5 3 4 6 3 2 8 9 0 7,5 4 2 3 3 3 7 7 1 7,5 5 3 5 3 1 8 7 0 2,5 6 1 1 4 1 10 3 0 4,2 7 1 7 1 6 5 5 0 7,5 8 2 6 5 1 2 13 0 7,5 9 3 7 5 4 5 10 0 7,5 10 4 3 1 2 6 9 1 7,5 Fonte: Adaptado de Jobson, 1998. Observe que as variáveis têm escalas distintas; por exemplo, sexo assume dois valores (0 e 1), zero é para indicar o sexo feminino e um, o sexo masculino. Dia da semana assume possíveis valores de 1 a 7 e tempo perdido é uma escala contínua. Outro aspecto a ser observado é que as variáveis podem ser classificadas em duas categorias: i) as variáveis de grupo, ii) variáveis que podemos chamar de pesquisa. As variáveis de grupo caracterizam os objetos, tais como sexo, tempo de empresa, idade e garagem onde o trabalha o motorista. Variáveis de pesquisa seriam dias perdidos, tempo perdido e tipo de mudança. As variáveis de grupo são úteis para comparar grupos, por exemplo, observar se indivíduos do sexo feminino perdem mais dias de trabalho que os do sexo masculino. Outras comparações podem ser feitas com o tempo de casa e idade em relação a dias perdidos e atrasos. 1.3.1 Escalas de medidas Escalas de medidas podem ser classificadas em quantitativa e qualitativa. Quantitativa é aquela em que as variáveis variam em magnitude, por exemplo, peso, idade, altura etc. Qualitativa é aquela que difere no tipo, por exemplo, status de material, sexo, estado civil, nacionalidade, cor dos cabelos etc. A escala quantitativa envolve a obtenção de valores em uma escala de medidas. A unidade de medida pode ser infinitamente divisível (km, metros, centímetros, milímetros) ou indivisível (tamanho da família). Escala qualitativa pode ser nominal ou ordinal. Estado civil é uma variável que envolve uma escala nominal. Um exemplo de escala ordinal é a opinião sobre um produto ou serviço em uma escala de 1 a 5. Deste modo, a escala de medida quantitativa pode ser classificada como contínua ou discreta. Já a escala de medida qualitativa é classificada como nominal ou ordinal. 1.3.2 Coleta de dados Uma das características de qualidade dos projetos de pesquisa é a confiabilidade dos dados. A confiabilidade do projeto refere-se à consistência dos dados, ou seja, a garantia de que resultados similares são obtidos quando os mesmos casos são medidos em outro momento ou por outras equivalentes variáveis, ou quando outras amostras de casos são usadas da mesma população. Em outras palavras, os resultados obtidos em determinado momento por um método ou procedimento experimental tem que ser reproduzível em outro momento por métodos semelhantes. Aos resultados obtidos dá-se o nome de estimativa e cada estimativa deve estar sujeita somente a erros amostrais. Se os procedimentos de coleta de dados forem aplicados adequadamente não se poderá dizer que as diferenças de resultados sejam decorrentes de possíveis erros do processo de estimativa. 1.3.3 Amostragem A maioria das técnicas estatística usadas nas análises dos dados assume que os dados selecionados na matriz representam uma amostra aleatória de uma população de objetos bem definida. A amostra tem que ser representativa. Uma amostra probabilística é quando se conhece a chance de um indivíduo pertencer à amostra. Amostra aleatória é um caso especial de amostra probabilística. Em alguns casos utiliza-se de amostras não probabilísticas, tais como: amostras de riscos (voluntários), amostra representativa pelo julgamento de um especialista. Sem uma amostra representativa, afirmações probabilísticas não podem ser feitas. Amostragem aleatória simples é um método alternativo para a amostragem probabilística. As técnicas estatísticas podem ser exploratória ou confirmatória, dependendodos objetivos da pesquisa. 1.4 Definições Característica: é uma determinada propriedade de um objeto ou artefato que auxilia na diferenciação entre itens de uma mesma amostra ou população. Item: é um objeto ou uma quantidade de material ou artefato no qual um conjunto de observações pode ser feitas, isto é, o resultado obtido das observações de um objeto ou uma quantidade de material ou artefato. Observação: é o resultado do processo de verificação da presença ou ausência de determinado atributo ou a realização de medidas de uma variável. Nota: para variáveis mensuráveis, utiliza-se o termo “valor observado” para o resultado obtido. Parâmetro: uma constante ou coeficiente que descreve alguma característica da população (exemplo: desvio padrão, média, amplitude, variância, coeficiente de regressão, coeficiente de variação, kurtose, coeficiente de assimetria etc). População: é um conjunto de itens ou indivíduos do qual podem ser atribuídos valores de uma ou mais características. Nota: a população pode ser real ou conceitual. Amostra: é um subconjunto da população, escolhida de maneira que o grau de incerteza dos valores da amostra seja conhecido. Estatística: Quantidade calculada de uma amostra para, em geral, estimar algum parâmetro populacional. Nota: a média e a variância amostral são estimadores não tendenciosos da média e da variância populacional. Universo: um grupo de populações, freqüentemente refletindo diferentes características dos itens ou materiais em consideração. Subgrupo: um conjunto de unidades ou quantidade de material obtido subdividindo um grupo maior de unidades ou quantidades de materiais. Evento: ocorrência de algum atributo. Amostragem não probabilística: pode ser uma amostragem intencional ou uma amostragem a esmo quando há inacessibilidade a todos os elementos da população. Populações infinitas ou conceituais: quando não há acessibilidade a todos os elementos da população ou quando a população não existe, é o caso da produção de um componente de uma máquina. Técnicas de análises univariadas e multivariadas: os métodos estatísticos univariados são aqueles que tratam somente da análise da variação de uma única variável aleatória, isoladamente. Técnicas multivariadas ocorrem quando várias variáveis (duas ou mais) são tratadas simultaneamente. Exemplos de estudos multivariados: • Pesquisa de mercado sobre as diferentes características físicas e estéticas que combinadas têm maior probabilidade de vendas dos produtos de uma indústria cerâmica. • Pesquisa sobre os fatores críticos de sucesso da operacionalização de programas de melhoria contínua. • Principais fatores que determinam o sucesso de um indivíduo na carreira profissional. Variável aleatória: é a ocorrência de um dado evento de modo imprevisível. A ocorrência do evento depende de um grande número de fatores incontroláveis, aleatórios. Exemplos: • Ocorrências de números pares em dez lançamentos de um dado; • Determinada propriedade física de uma peça cerâmica produzida por um determinado processo; • Número de itens/peças defeituosas produzidas por um determinado processo em um dia de produção; • Fração/proporção de peças defeituosas produzidas em um dia de produção por um processo industrial. O exemplo 1 é um caso de estudo multivariado, assim com o exemplo 2, apresentado a seguir. Exemplo 2: Uma amostra da R.C.M.P. (Royal Canadian Mounted Police Officers) foi questionada sobre assuntos relacionados ao estresse das suas atividades regulares. O propósito da pesquisa foi dimensionar o estresse dos policiais. Além das informações pessoais, 18 variáveis foram incluídas na pesquisa. As variáveis de estresse analisadas foram as seguintes: 1. Recursos insuficientes; 2. Falta de clareza nas responsabilidades do trabalho; 3. Conflitos pessoais; 4. Investigação onde há pessoas com ferimentos ou vítimas fatais; 5. Trabalho lidando com produtos nocivos ou tóxicos; 6. Uso de armas de fogo; 7. Aviso a parentes sobre óbitos ou ferimentos graves; 8. Tolerância a abuso verbal em público; 9. Insucessos na tentativa de resolver uma série de infrações; 10. Falta de ambulâncias e médicos; 11. Pobre apresentação do caso por um promotor (sentimento de tempo perdido); 12. Excessiva carga de trabalho; 13. Não estar junto da unidade de comando; 14. Reclamações frívolas por parte do público; 15. Envolvimento em perseguições de alta velocidade; 16. Envolvimento em violência física com um ofensor; 17. Investigação de brigas domésticas; 18. Separação de brigas em bares. Exemplo 3: perda de carga de um processo filtragem de uma indústria química. A perda de carga é uma variável de controle que mede o tempo de filtragem de um equipamento. Exemplo 4: um processo de conformação a quente de coifas e gaxetas de borrachas, utilizadas na proteção de dispositivos mecânicos, produz 80 artefatos a cada prensada, que tem um ciclo total de 10 minutos. Inspeções visuais são feitas pelo operador a cada hora (1 a cada 6 prensadas são inspecionadas 100%). O supervisor da linha de montagem reclama da variação do nível de qualidade das gaxetas e coifas. Foi solicitado ao supervisor da fabricação de artefatos de borrachas para manter o processo sob controle e reduzir a fração de peças defeituosas. Exemplo 5: um engenheiro mecânico deseja verificar o efeito de um processo químico de limpeza em placas eletrônicas. O processo em questão não pode mudar o peso das placas. As análises são feitas por pesagem. Mede-se a placas antes e após o tratamento químico. Se a diferença de massa, antes a após o tratamento, for estatisticamente significativa, rejeita-se o processo. Os exemplos 3, 4 e 5 são problemas univariados. Esses tipos de problemas serão tratados neste curso, deixando para outro momento o estudo de problemas que necessitam do uso de técnicas multivariadas. 1.5 Considerações finais Nesta unidade você teve contato preliminar com os termos usualmente utilizados em estudos estatísticos. Você deverá rever os termos e definições apresentadas neste capítulo ao longo do curso.
Compartilhar