Baixe o app para aproveitar ainda mais
Prévia do material em texto
RETRATO DA RELAÇÃO ENTRE OS HÁBITOS E AS CONDIÇÕES DE PERMANÊNCIA ESTUDANTIS E A CONSTRUÇÃO DA CARREIRA DOS ESTUDANTES DA TURMA DE AMOSTRAGEM 2016/1 DO BACHARELADO EM ESTATÍSTICA DA UNIVERSIDADE FEDERAL DE SÃO CARLOS: UM LEVANTAMENTO AMOSTRAL Álaze Gabriel Gifted1 Professora: Dra. Cecília Candollo SÃO PAULO, 2016 1Graduado em Gestão Empresarial (2012). Pós-graduado no MBA em finanças e controladoria (2014). Universidade Bráz Cubas. Pós-graduado em Docência e Pesquisa para o Ensino Superior (2015). Bacharelando em Ciências Contábeis. Universidade Metropolitana de Santos. Bacharelando em Estatística. Universidade Federal de São Carlos. Bacharel e Mestre em Teologia. Universidade da Bíblia. E-mail: alaze_p7sd8sin5@yahoo.com.br CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA DEPARTAMENTO DE ESTATÍSTICA BACHARELADO EM ESTATÍSTICA RETRATO DA RELAÇÃO ENTRE OS HÁBITOS E AS CONDIÇÕES DE PERMANÊNCIA ESTUDANTIS E A CONSTRUÇÃO DA CARREIRA DOS ESTUDANTES DA TURMA DE AMOSTRAGEM 2016/1 DO BACHARELADO EM ESTATÍSTICA DA UNIVERSIDADE FEDERAL DE SÃO CARLOS: UM LEVANTAMENTO AMOSTRAL Álaze Gabriel Gifted Trabalho apresentado digital e oralmente à Profª. Dra. Cecília Candollo como requisito parcial para aprovação na disciplina de Amostragem 2016/1, do bacharelado em Estatística da Universidade Federal de São Carlos campus São Carlos. SÃO CARLOS 2016 RESUMO (DESCRIÇÃO DO TRABALHO) Este trabalho busca retratar a relação entre os hábitos e as condições de permanência estudantis e a construção da carreira dos estudantes da turma de Amostragem 2016/1 do bacharelado de Estatística da Universidade Federal de São Carlos, campus São Carlos. Para tanto, utiliza-se as seguintes metodologias: o método fenomenológico-hermenêutico, como eixo epistemológico de investigação, e o eixo hipotético-dedutivo, como o seu eixo lógico de investigação. Como eixo técnico, adotou-se neste trabalho a Amostragem Aleatória Simples sem reposição. Primeiramente, eu estipulei B = 2 e nível de confiança igual a 95% - 1 - α = 0,95, α = 0,05, α/2 = 0,025, Zα= 1,96. Mas como a variância amostral (s²) é desconhecida, então eu decidi estimá-la por meio de uma amostra-piloto. Utilizando, então, o bom senso, eu escolhi um tamanho inicial para a amostra (n0) igual a 8, sorteei 8 números, de 1 a 42, no Excel por meio do comando = ALEATÓRIOENTRE (1; 42), em seguida selecionei da lista de participantes da disciplina de Amostragem no AVA Moodle os seus respectivos e-mails e para eles enviei o questionário online para coleta dos dados. Deste modo, eu utilizei um questionário impresso para realização do pré-teste e um questionário online, elaborado na plataforma virtual Survio, para aplicação do teste na amostra-piloto e na amostra efetiva. Daí, com os dados coletados, eu calculei o total e a proporção amostral das variáveis de interesse qualitativas, e a média, a variância, o desvio padrão, o coeficiente de variação e o intervalo de confiança para a média população, com índice de confiança de 95%, das variáveis de interesse quantitativas. Palavras-chave: Levantamento amostral. Amostragem Aleatória Simples sem reposição. Estatística Descritiva. Estatística Inferencial. LISTA DE TABELAS TABELA 1 – Questionário. Página 47. TABELA 2 – Fórmula de cálculo do tamanho efetivo da amostra. Página 52. TABELA 3 – Fórmula de cálculo do tamanho da amostra-piloto (n0). Página 52. TABELA 4 – Fórmula de cálculo da variância amostral com base no tamanho da amostra-piloto (n0). Página 52. TABELA 5 - Fórmula de cálculo da variância amostral com base no tamanho da amostra-piloto (n0). Página 53. TABELA 6 - Cálculo do tamanho efetivo da amostra. Página 53. TABELA 7 – Totais amostrais. Página 54. TABELA 8 – Legenda 1. Página 55. TABELA 9 – Proporções amostrais. Página 57. TABELA 10 - Médias, variâncias, desvios-padrão e coeficientes de variação amostrais. Página 59. TABELA 11 – Legenda 2. Página 60. TABELA 12 – Intervalo de confiança para média, com sigma desconhecido, para N > 30. Página 60. LISTA DE FIGURAS FIGURA 1 – Distribuição Assimétrica Positiva. Página 25. FIGURA 2 – Distribuição Simétrica, ou Normal. Página 25. FIGURA 3 – Distribuição Assimétrica Negativa. Página 26. FIGURA 4 – Distribuição Mesocúrtica. Página 30. FIGURA 5 – Distribuição Leptocúrtica. Página 31. FIGURA 6 – Distribuição Platicúrtica. Página 31. FIGURA 7 – Estimação de parâmetros. Página 35. SUMÁRIO 1 INTRODUÇÃO …..................................................................................................... 6 1.1 Justificativa …..................................................................................................... 6 1.2 Variáveis de interesse …...................................................................................... 6 1.3 Objetivos …......................................................................................................... 7 2 METODOLOGIA …................................................................................................. 8 2.1 Pilar epistemológico …........................................................................................ 8 2.2 Pilar lógico …....................................................................................................... 8 2.3 Pilar técnico …..................................................................................................... 8 3 RESULTADOS E DISCUSSÃO…......................................................................... 47 3.1 O instrumento de pesquisa utilizado …........................................................... 47 3.2 A pré-testagem do instrumento de coleta dos dados ….................................. 51 3.3 A determinação do tamanho efetivo da amostra …........................................ 52 3.4 Os totais e as proporções amostrais…............................................................. 53 3.5 As médias, as variâncias, os desvios-padrão e os coeficientes de variação amostrais …............................................................................................................................. 58 3.6 Intervalo de confiança para a média populacional das variáveis de interesse quantitativas …....................................................................................................................... 60 4 CONCLUSÕES E CONSIDERAÇÕES FINAIS …............................................. 61 5 REFERÊNCIAS ….................................................................................................. 64 6 1 INTRODUÇÃO 1.1 Justificativa Esse tema se justifica devido ao meu interesse em retratar a relação entre os hábitos e condições estudantis e a construção da carreira dos estudantes da turma de Amostragem 2016/1 do bacharelado em Estatística da Universidade Federal de São Carlos. Pesquisas científicas sobre gestão da carreira mostram que o sucesso da nossa trajetória de carreira adequada gestão do nosso tempo, o que implica disciplinar corretamente os nossos hábitos cotidianos (PERES, 2011; VIEIRA; CASTRO; JÚNIOR, 2010). Deste modo, os hábitos de estudar, praticar esportes, cuidar da saúde física, mental e espiritual, descansar, alimentar, dentre outros, é o que determina o sucesso ou o fracasso da nossa carreira (PERES, 2011; VIEIRA; CASTRO; JÚNIOR, 2010). 1.2 Variáveis de interesse 1. Nome; 2. Sexo; 3. Idade (em anos); 4. Renda (em reais); 5. Nível de instrução; 6. Tempo de instrução (em anos); 7. Quantidade de pessoas no grupo familiar; 8. Estado civil; 9. Estado de origem; 10. Cidade natal; 11. Cidade atual; 12. Bairro onde reside atualmente; 13. Natalidade/fecundidade (no. Filhos); 14. Pretensão com o cursode Estatística; 15. Tipo de domicílio; 16. Cor/raça; 17. Tempo de atuação no mercado de trabalho (em anos); 18. Escolaridade dos pais; 19. Caracterização da trajetória profissional; 20. Tipo de deslocamento para a universidade (ônibus, carro, bicicleta, a pé, etc.); 21. Quantidade de refeições que consome do Restaurante Universitário; 22. Quantidade de cursos extra-curriculares em que está ou costuma estar inserido; 23. Situação afetiva atual; 24. Tipo de acesso à internet; 25. Conteúdo virtual que acessa com mais frequência; 26. Revistas que costuma ler; 27. Tempo gasto com TV (inclusive TV online); 28. Tempo gastro com rádio (músicas); 29. Tempo gasto com filmes; 30. Tempo gasto com os esportes; 31. Tempo gasto com os estudos; 32. Tempo gasto com espiritualidade; 33. Tempo gasto com cuidados com a saúde. 7 1.3 Objetivos 1.3.1 Geral: Retratar a relação entre os hábitos e as condições estudantis com a construção da carreira dos estudantes da turma de Amostragem 2016/1 do bacharelado em Estatística da Universidade Federal de São Carlos, buscando melhor conhecê-la coletivamente. 1.3.2 Específicos: 1. Discutir os procedimentos técnicos necessários para operacionalizar adequadamente um levantamento amostral; 2. Discutir o passo a passo da construção e da utilização de uma Amostra Aleatória Simples sem reposição. 8 2 METODOLOGIA 2.1 Pilar epistemológico O pilar epistemológico refere-se ao conjunto de pressupostos ontológicos, morfológicos, gnosiológicos, teóricos e éticos, norteadores da pesquisa científica em um nível estratégico. É, portanto, o pilar estratégico, ou diretivo, da pesquisa científica. Considera sensivelmente a concepção de homem, de vida, de mundo, de ciência e de ética que o pesquisador tem tanto quanto as suas relações com o objeto da sua investigação (GILES, 1979; PIAGE, 1973; KÖCHE, 1997; TEIXEIRA 2012; EL-GUINDY, 2004; VERGARA, 2012; SPINK, 2012; BRASIL, 2012). Por essas razões, os seus enfoques (métodos) podem ser apropriadamente denominados bases estratégicas da investigação ou bases diretivas constitucionais da investigação (GIFTED, 2015). Esta proposta de trabalho de pesquisa caracteriza-se como um estudo fenomenológico- hermenêutico, porque visa a exploração descritiva da relação entre os hábitos e as condições de permanência estudantis e a construção da carreira dos estudantes da turma de Amostragem 2016/1 do bacharelado em Estatística da Universidade Federal de São Carlos, campus São Carlos. A base diretiva da investigação fenomenológico-hermenêutica concebe a ciência como a compreensão dos fenômenos em suas diversas manifestações; o homem é tido como projeto, ser inacabado, ser de relações com o mundo e com os outros; defende a transição de uma visão sincrônica (o rx do fenômeno) para uma visão diacrônica; defende a transcrição de uma visão isolacionista, homogênea, não-conflitiva para uma visão dinâmica. Seu caráter é cientificista, isto é, o conhecimento é teórico, abstrato, resultado do raciocínio. Ela tem por objetivo a exploração descritiva do comportamento de um fenômeno, isto é, de um fato observado externamente. Por essa razão, o grau de aproximação entre sujeito pesquisador e objeto investigado por uma pesquisa dirigida por essa base é levemente sensível, e ela foca, não nas causas e nos efeitos, mas na descrição da realidade do objeto investigado (TEIXEIRA 2012; VERGARA, 2012; GIFTED, 2015; EL-GUINDY, 2004; SPINK, 2012; BRASIL, 2012). 2.2 Pilar lógico O pilar lógico refere-se ao conjunto de pressupostos estruturais do pensamento, norteadores da pesquisa científica em um nível tático. É, portanto, o pilar tático, ou gerencial, da pesquisa científica. Considera o ponto exato de partida do raciocínio utilizado bem como as nuances dos seus avanços. Por essa razão, os seus enfoques (métodos) podem ser apropriadamente denominados bases táticas da investigação ou bases estruturais do pensamento da investigação (CRESWELL, 2010; TRIVIÑOS, 1987; GIFTED, 2015). A base estrutural de pensamento silogístico-indutiva, também denominada lógica teorética, é aquela que parte de um conjunto de proposições que seguem uma ou mais tendências teoréticas específicas (particulares) e ruma para conclusões generalizadas (gerais). Por essa razão ela é mais utilizada em estudos cientificistas, ou seja, aqueles mais voltados para o campo das abstrações. (MARCONI; LAKATOS, 2003; 2007; 2008; GIL, 1999; 2010; POPPER, 1972; KANT, 2001; 2004). 2.3 Pilar técnico O pilar técnico refere-se ao conjunto de pressupostos de abordagem, de modalidade sequencial (pesquisa mista), de base e subbase procedimentais (pesquisa observacional), de técnicas e subtécnicas, de instrumentos, de recursos (inclusive o tempo) e de lócus, 9 norteadores da pesquisa científica em um nível operacional. É, portanto, o pilar operacional, ou funcional, da pesquisa científica. Considera as fases pré-implementatória (trabalho ou redação de ensaio), implementatória (execução do trabalho ou da redação de ensaio) e pós- implementatória (publicação dos resultados finais) da investigação científica (MARCONI; LAKATOS, 2003; 2007; 2008; GIL, 1999; 2010; ECO, 2012; THIOLLENT, 2003; 2011; YIN, 2010; MARTINS, 2008; SOARES, 2003). Por essa razão, os seus enfoques (métodos) podem ser apropriadamente denominados bases operacionais da investigação ou bases funcionais da operação de investigação (GIFTED, 2015). As abordagens de investigação podem ser qualitativa (dados e linguagem alfabéticos), quantitativa (dados e linguagem numéricos) e mista (um pouco quali, um pouco quanti) (CRESWELL, 2010; RODRIGUES, 2006; TRIVIÑOS, 1987). As modalidades sequenciais, inerentes aos métodos mistos de investigação, podem ser estratégia explanatória sequencial, estratégia exploratória sequencial, estratégia transformativa sequencial, estratégia de triangulação concomitante, estratégia incorporada concomitante e estratégia transformativa concomitante (CRESWELL, 2010; GIFTED, 2015). As bases procedimentais de investigação podem ser a observacional, a experimental, a estatística e ou a clínica (GIL, 1999; 2010). Cada uma delas é classificada de acordo com as técnicas de coleta de dados utilizadas, sendo, portanto, a observação, a experimentação, a amostragem e a testagem, respectivamente. As técnicas de investigação podem ser de coleta (levantamento bibliográfico, levantamento documental, entrevista, intervenção, experimentação, amostragem, testagem), de registro (planificação manual, planificação eletrônica), de sistematização (suposições, hipóteses, indagações, suspeitas, curiosidades, conjecturas), de organização (categorização, codificação, tabulação), de análise ou interpretação (AB, AC, AD, AF, AR, exegese- hermenêutica, etc.), de formalização (TCC, dissertação, tese, artigo, resenha, periódico, revista, software, patente, obra de arte) e de apresentação (exposição oral, exposição visual, exposição mista) (SEVERINO, 2007; GIL, 1999; 2010). Os instrumentos de investigação tratam-se dos materiais utilizados para a coleta dos dados. Podem ser o protocolo observacional, o protocolo de entrevista, o protocolo amostral, o diário de campo, as escalas sociais, os testes, o questionário, o formulário (MARCONI; LAKATOS, 2003; 2007; 2008; BOLFARINE; BUSSAB, 2004; KASMIER, 1982; CORREA, 2003; MORETTIN; BUSSAB, 2010; KASMIER, 1982). Os recursos tratam-se dos requisitos necessários à viabilidade da investigação científica. Podem ser tecnológicos (hardware, software, materiais escolares, laboratórios de informática, bibliotecas), financeiros (valores monetários, bolsas de estudo, ajudas de custo, premiações), humanos (grupos de pesquisa, orientadores, coorientadores,coautores, examinadores, colaboradores, normas justas) e tempo (cronogramas executáveis, metas alcançáveis) (MARCONI; LAKATOS, 2003; 2007; 2008; GIL, 1999; 2010; CRESWELL, 2010; RODRIGUES, 2006; TRIVIÑOS, 1987). Os lócus tratam-se dos espaços físicos, isto é, os lugares onde são realizadas as etapas da investigação científica. Podem ser de coleta (uma biblioteca), de registro (um telecentro), de sistematização (uma praça), de organização (um albergue), de análise ou interpretação (uma feira de domingo), de formalização (uma universidade) e de apresentação (um encontro universitário) (MARCONI; LAKATOS, 2003; 2007; 2008; GIL, 1999; 2010; CRESWELL, 2010; RODRIGUES, 2006; TRIVIÑOS, 1987). Para a escolha das fontes selecionadas foram considerados os seguintes critérios: a) conteúdo específico sobre os procedimentos técnicos necessários para a adequada operacionalização dos levantamentos amostrais; b) conteúdo sobre a metodologia da pesquisa científica; c) viabilidade de acesso e análise dos materiais selecionados. Pretende-se observar todas as fontes selecionadas; pretende-se coletar os dados, mediante um questionário de 10 amostragem pré-elaborado, após o que se planeja organizá-los, sistematizá-los, analisá-los e apresentá-los de acordo com os procedimentos técnicos de pesquisa para levantamento bibliográfico, levantamento documental e levantamento amostral apresentados por Gil (1999; 2010), Marconi e Lakatos (2007), Rodrigues (2007), Luna (2011; 2012), Bolfarine e Bussab (2004), Morettin e Bussab (2010), Kazmier (1982), Correa (2003) e Köche (1997; 2011). a) Abordagem de pesquisa mista A abordagem de pesquisa mista é aquela que utiliza tanto a linguagem quanto os dados predominantemente utilizados são os qualitativos e, concomitantemente, os quantitativos. Enquanto os primeiros servem como lente teórica da investigação, os segundos servem como fundamentos precisos dos resultados produzidos. Essa abordagem já é hoje bastante comum em estudos inter e multidisciplinares, e seu uso na área da Educação é crescente (DAL- FARRA; LOPES, 2014; CRESWELL, 2010). Como modalidade sequencial de pesquisa, foi selecionada para a execução desta proposta de trabalho de pesquisa a estratégia transformativa sequencial de métodos mistos, que Creswell (2010, p. 248) explana do seguinte modo: [...] A estratégia transformativa sequencial é um projeto de duas fases, com uma lente teórica (p. ex., gênero, raça, teoria da ciência social) se sobrepondo aos procedimentos sequenciais. Tem também uma fase inicial (quantitativa ou qualitativa), seguida de uma segunda fase (qualitativa ou quantitativa), a qual se desenvolve sobre a fase anterior. A lente teórica é apresentada na introdução de uma proposta, molda uma questão de pesquisa direcional que visa explorar um problema (p. ex., desigualdade, discriminação, injustiça), cria sensibilidade à coleta de dados de grupos marginalizados ou sub-representados e termina com um chamado à ação. [...] Não é nem um pouco fácil utilizar tal abordagem, motivo pelo qual Creswell (2010, p. 243) justifica: Combinar os dados (e, em um sentido mais amplo, a combinação das questões de pesquisa, da filosofia, da interpretação) é difícil principalmente quando se considera que os dados qualitativos consistem de texto e imagens e de dados quantitativos, números. Há duas questões diferens aqui: Quando um pesquisador faz a combinação dos dados em um estudo de métodos mistos? E como ela ocorre? A primeira questão é muito mais fácil de responder do que a segunda. A combinação dos dois tipos de dados pode ocorrer em diversos estágios: na coleta dos dados, na análise dos dados, na interpretação dos dados, ou nas três fases. [...] Hoje, na ciência moderna, já existem várias estratégias sequenciais desenvolvidas para a pesquisa de abordagem mista, objetivando facilitar a sua compreensão e o seu uso (CRESWELL, 2010). Creswell (2010), professor universitário que ministra cursos e escreve sobre metodologia qualitativa e pesquisa de métodos mistos há mais de 35 anos, apresenta em sua obra seis estratégias sequenciais para as pesquisas científicas de métodos mistos, cujo uso já se faz crescente em várias áreas do conhecimento, em especial a das Ciências Exatas, a das Ciências Sociais Aplicadas e da Educação. b) A base procedimental: observação 11 A observação é a técnica mais utilizada para a coleta de dados, e se faz presente em toda pesquisa científica, haja vista que é por meio dela que se realiza a revisão bibliográfica e ou documental do tema selecionado para investigação. Sobre os tipos de observação, Marconi e Lakatos (2008, p. 77-80) apresenta oito: A técnica da observação não estruturada ou assistemática, também denominada espontânea, informal, ordinária, simples, livre, ocasional e acidental, consiste em recolher e registrar os fatos da realidade sem que o pesquisador utilize meios técnicos especiais ou precise fazer perguntas diretas. É mais empregada em estudos exploratórios e não tem planejamento e controle previamente elaborados. [...] A observação sistemática também recebe várias designações: estruturada, planejada, controlada. Utiliza instrumentos para a coleta dos dados ou fenômenos observados. Realiza-se em condições controladas, para responder a propósitos preestabelecidos. Todavia, as normas não devem ser padronizadas nem rígidas demais, pois tanto as situações quanto os objetos e objetivos da investigação podem ser muito diferentes. Deve ser planejada com cuidado e sistematizada. [...] Na observação não participante, o pesquisador toma contato com a comunidade, grupo ou realidade estudada, mas sem integrar-se a ela: permanece de fora. Presencia o fato, mas não participa dele; não se deixa envolver pelas situações; faz mais o papel de espectador. Isso, porém, não quer dizer que a observação não seja consciente, dirigida, ordenada para um fim determinado. O procedimento tem caráter sistemático. [...] [A observação participante] consiste na participação real do pesquisador com a comunidade ou grupo. Ele se incorpora ao grupo, confunde-se com ele. Fica tão próximo quanto um membro do grupo que está estudando e participa das atividades normais deste. [...] Em geral, são apontadas duas formas de observação participante: a) Natural. O observador pertence à mesma comunidade ou grupo que investiga; b) Artificial. O observador integra-se ao grupo com a finalidade de obter informações. […] Como o próprio nome indica, [a observação individual] é a técnica de observação realizada por um pesquisador. Nesse caso, a personalidade dele se projeta sobre o observado, fazendo algumas inferências ou distorções, pela limitada possibilidade de contato. Por outro lado, pode intensificar a objetividade de suas informações, indicando, ao anotar os dados, quais são os eventos reais e quais são as interpretações. É uma tarefa difícil, mas não impossível. Em alguns aspectos, a observação só pode ser feita individualmente. [...] A observação em equipe é mais aconselhável do que a individual, pois o grupo pode observar a ocorrência por vários ângulos. Quando uma equipe está vigilante, registrando o problema na mesma área, surge a oportunidade de confrontar seus dados posteriormente, para verificar as predisposições. Normalmente, as observações [na vida real] são feitas no ambiente real, registrando- se os dados à medida que forem ocorrendo, espontaneamente, sem devida preparação. A melhor ocasião para o registro é o local onde o evento ocorre. Isto reduz as tendências seletivas e a deturpação na reevocação. [...]A observação em laboratório é aquela que tenta descobrir a ação e a conduta que tiveram lugar em condições cuidadosamente dispostas e controladas. Entretanto, muitos aspectos importantesda vida humana não podem ser observados sob condições idealizadas no laboratório. [...] (grifos meus) Todavia, embora a literatura crítica apresente vários tipos de observação, existem basicamente dois tipos dela: a direta, ou participante, que constitui uma técnica aplicada in loco, ou seja, no local onde se encontra o objeto do estudo; e a indireta, ou não participante, que constitui uma técnica aplicada à distância do local onde se encontra o objeto de estudo. Quer a observação participante, utilizada por exemplo na pesquisa-ação, em estudos de casos 12 observacionais e na etnografia participante, quer a observação não participante, utilizada por exemplo na pesquisa bibliográfica, na pesquisa documental ou na etnografia não participante, existem cuidados importantes que precisam ser tomados. Sobre esse aspecto, Martins (2008, p. 109) salienta: A observação consiste em um exame minucioso que requer atenção na coleta e análise dos dados. Para tanto, a observação deve ser precedida por um levantamento de referencial teórico e resultados de outras pesquisas relacionadas ao estudo. Formalmente, é desejável a construção de um protocolo de observação, que, evidentemente, fará parte do protocolo do Estudo de Caso. Observar não é apenas ver. A validade (será que se está observando aquilo que de fato se deseja observar?) e a confiabilidade, ou fidedignidade (será que sucessivas observações do mesmo fato ou situação oferecem resultados semelhantes?) poderão ser atingidas se a observação for, rigorosamente, controlada e sistemática. Implica em um planejamento cuidadoso do trabalho e preparação do observador. O plano delimitará o fenômeno a ser estudado, indicará o que se deve observar, as maneiras de se observar, a duração, periodicidade, modo de registros e controles para garantia da validade e confiabilidade. [...] A observação pode ser direta, denominada observação participante (OP), quando o observador-pesquisador partipa dos eventos a serem estudados, ou pode ser indireta, denominada observação não participante (ONP), quando o observador-pesquisador se vale somente da literatura crítica sobre os eventos a serem estudados sem, contudo, deles participar. Distinguindo os dois tipos de observação, Martins (2008, p. 25) explana: [...] A OP é uma modalidade especial de observação na qual o pesquisador não é apenas um observador passivo. Ao contrário, o pesquisador pode assumir uma variedade de funções dentro de um Estudo de Caso e pode, de fato, participar dos eventos que estão sendo estudados. O observador-pesquisador precisará ter permissão dos responsáveis para realizar o levantamento e não ser confundido com elementos que avaliam, inspecionam ou supervisionam atividades. O grande desafio do investigador é conseguir aceitação e confiança dos membros do grupo social onde realiza o trabalho de campo [...] As principais formas da observação participante são a entrevista, bastante utilizada nos estudos de caso, nas pesquisas de campo em geral, nas biografias e nas etnografias participantes (VERGARA, 2012; YIN, 2010), e a intervenção, utilizada nas pesquisas-ação (THIOLLENT, 2011). Por sua vez, as principais formas da observação não participante são os levantamentos bibliográficos (dados secundários), e os levantamentos documentais (dados primários), utilizados em todas as pesquisas quando da revisão da literatura e outras partes (GIL, 1999; 2010; SEVERINO, 2007). A base procedimental observacional indica que o meio técnico utilizado para a coleta dedados é a observação e os meios instrumentais a ela inerentes. Por observação entende-se a técnica de coleta de dados em que o pesquisador observa o objeto investigado, quer participe ou não desse processo. Quando o observador-pesquisador participa do processo de investigação, diz-se que se trata de uma pesquisa observacional participante; quando, entretanto, o observador-pesquisador não participa do processo de investigação, diz-se que se trata de uma pesquisa observacional não participante. A observação participante (OP) visa coletar dados primários, enquanto a observação não participante (ONP), dados secundários. Por essa razão, na OP podem ser realizadas a 13 pesquisa-ação, os estudos de caso, as biografias participantes e as etnografias participantes. Já na ONP podem ser realizadas as pesquisas bibliográficas, as pesquisas documentais, as biografias não participantes e as etnografias não participantes. Neste diapasão, Bêrni e Fernandez (2012, p. 176-177) explanam: Os dados primários obedecem ao delineamento de um estudo que gerará a base informacional nos estilos alternativos de condução de experimentos ou de obtenção de informações por meio do questionamento direto dos agentes envolvidos com o fenômeno. Tal é o caso, seguindo o exemplo, das testemunhas de um acidente de trânsito. Entre os dados primários a ser coletados, destacam-se a observação direta ou participante, a entrevista formal ou informal, a entrevista estruturada por meio de questionário, a entrevista livre baseada em roteiro, a discussão em grupo (distinguindo-se a construção de grupos focais), a consulta a documentos pessoais, diários, correspondência ativa e passiva, histórias de vida. [...] Se precisar de mais informação secundária, o pesquisador deverá recorrer a estatísticas previamente disponíveis em livros técnicos, relatórios de pesquisa, artigos em revistas técnicas, anais de congressos, documentos oficiais (censos, inquéritos, resoluções, informes), documentos pessoais, correspondência ativa e passiva, história de vida, diários publicados ou privados, documentos administrativos, contábeis e jurídicos. Com base nos pressupostos apresentados, deduz-se que a base procedimental observacional é parcialmente empírica (OP) e parcialmente não empírica (ONP), dessemelhantemente das demais bases procedimentais, que são todas completamente empíricas. Além disso, deduz-se que ela é a mais utilizada por parte dos pesquisadores em geral, por causa da facilidade da sua compreensão e, especialmente, do seu uso. Porfim, deduz-se também que toda pesquisa teórica, ou básica, baseia-se nos procedimentos observacionais, valendo-se de seus meios técnicos e instrumentais. c) Técnicas gerais de pesquisa: levantamento bibliográfico, documental e amostral Levantamento bibliográfico O levantamento bibliográfico busca mapear um conjunto de bibliografias previamente selecionadas para análise. A metodologia bibliográfica oferece meios que auxiliam na definição e resolução dos problemas já conhecidos, permitindo tanto explorar novas áreas onde os mesmos ainda não se cristalizaram suficientemente como também analisar um tema sob novo enfoque ou abordagem, produzindo novas conclusões. (SEVERINO, 2007). Ele é utilizado para a revisão da literatura e, portanto, necessário a todas as espécies de pesquisa. Configura-se na técnica de coleta de dados dos livros e dos trabalhos acadêmicos em geral, tais como TCC’s, monografias, dissertações, teses, artigos científicos, resenhas científicas, etc. Os seus instrumentos fundamentais são as bibliografias. O levantamento bibliográfico oferece meios que auxiliam na definição e resolução dos problemas já conhecidos, como também permite explorar novas áreas onde os mesmos ainda não se cristalizaram suficientemente. Permite também que um tema seja analisado sob novo enfoque ou abordagem, produzindo novas conclusões. Além disso, permite a cobertura de uma gama de fenômenos muito mais ampla, mormente em se tratando de pesquisa cujo problema requeira a coleta de dados muito dispersos no espaço. Sobre essa técnica de pesquisa para coleta de dados, Rodrigues (2007, p. 43) assinala:14 Bibliográfica é a pesquisa limitada à busca de informações em livros e outros meios de publicação. É o oposto da pesquisa de campo, distinguindo-se também e igualmente por oposição da pesquisa in victro. Geralmente, a pesquisa bibliográfica integra o âmbito da pesquisa ex-post-facto, pelo simples fato de que os livros e artigos de revista ou periódico qualquer tratam, via de regra, de fatos consumados, não sendo habitual a pesquisa bibliográfica baseada em leitura do tipo futurologia. O levantamento bibliográfico pressupõe trabalhos anteriores que servem como fonte ou lente teórica para embasamento de estudos mais abrangentes e ou aprofundados. Sobre esse aspecto, Severino (2007, p. 122) destaca: A pesquisa bibliográfica é aquela que se realiza a partir do registro disponível, decorrente de pesquisas anteriores, em documentos impressos, como livros, artigos, teses, etc. Utiliza- se de dados ou de categorias teóricas já trabalhados por outros pesquisadores e devidamente registrados. Os textos tornam-se fontes dos temas a serem pesquisados. O pesquisador trabalha a partir das contribuições dos autores dos estudos analíticos constantes dos textos. Realmente, toda pesquisa acadêmica requer em algum momento a realização de trabalho que possa ser considerado como levantamento bibliográfico. Prova disso é que nas dissertações e teses da atualidade, em sua maioria, há um capítulo especial dedicado à revisão bibliográfica cuja finalidade principal é fundamentar o trabalho acadêmico teórica e consistentemente, identificando, não raro, o estágio atual do conhecimento referente ao tema. Gil (2010, p. 29) explana sobre tal tipo de pesquisa com os seguintes dizeres: A pesquisa bibliográfica é elaborada com base em material já publicado. Tradicionalmente, esta modalidade de pesquisa inclui material impresso, como livros, revistas, jornais, teses, dissertações e anais de eventos científicos. Todavia, em virtude da disseminação de novos formatos de informação, estas pesquisas passaram a incluir outros tipos de fontes, como discos, fitas magnéticas, CDs, bem como o material disponibilizado pela internet. Ressaltando a relevância de tal tipo de pesquisa, Gil (2010) destaca que ela permite ao investigador a cobertura de uma gama de fenômenos muito mais ampla do que aquela que poderia pesquisar diretamente, em especial quando o problema de pesquisa requer dados muito dispersos pelo espaço. Entretanto, não se esquece de salientar que, como fontes secundárias, as bibliografias podem apresentar dados coletados ou processados de forma equivocada, tornando possível a reprodução e/ou ampliação desses erros em trabalhos nelas fundamentadas. Por essa razão, Gil (2010, p. 30) fornece sugestões úteis para reduzir tal possibilidade, dizendo: Para reduzir essa possibilidade, convém aos pesquisadores assegurarem-se das condições em que os dados foram obtidos, analisar em profundidade cada informação para descobrir possíveis incoerências ou contradições e utilizar fontes diversas, cotejando-as cuidadosamente. De acordo com Gil (1999; 2010), não existem regras fixas para a realização de 15 pesquisas bibliográficas, mas existem algumas tarefas que a experiência demonstra serem importantes. Dessaforma, este trabalho segue o seguinte roteiro: - Exploração das fontes bibliográficas: primeiro, na fase de elaboração desta proposta de trabalho, foram examinadas as bibliografias fundamentais sobre a metodologia da pesquisa cientifica e conteúdo geral sobre levantamentos amostrais (BOLFARINE; BUSSAB, 2004; MORETTIN; KASMIER, 1982; BUSSAB, 2010; KASMIER, 1982; GIFTED, 2015); depois, na fase de execução, serão examinados conteúdos específicos sobre os procedimentos técnicos necessários para a adequada operacionalização dos levantamentos amostrais (BOLFARINE; BUSSAB, 2004; KASMIER, 1982; CORREA, 2003; MORETTIN; BUSSAB, 2010). - Leitura do material: conduzida de forma informativa, seletiva, reflexiva e interpretativa, objetivado reconhecer, reter, criticar construtivamente e avalizar as partes essenciais para o desenvolvimento do estudo (DINIZ; DA SILVA, 2008). - Elaboração de fichas: como de costume, eu elaborei de fichas de citações, de resumo e bibliográfica, sobre as bibliografias clássicas, contendo as partes mais relevantes dos materiais consultados; - Ordenação e análise das fichas: uma vez organizadas e ordenadas de acordo com o seu conteúdo, conferindo sua confiabilidade, eu apliquei a Análise de Discurso produzindo um resenha crítica de cada uma delas; - Conclusões: serão obtidas, durante e após a execução desta proposta de trabalho, por meio de Análise de Conteúdo. Para a execução desta proposta de trabalho, os levantamentos do tipo bibliográfico, documental e amostral contornarão problemas relacionados a tempo e recursos financeiros, uma vez que um estudo dessa natureza necessariamente envolveria pesquisa de campo e mais tempo para a coleta e análise de dados, mais característicos a um estudo de caso. Ressalta-se ainda que os materiais assim selecionados e organizados constituem uma base de dados consistente para a elaboração de estudos mais avançados dentro dessa área e temática. Levantamento documental O levantamento documental, visa a coleta de dados primários, ou seja, aqueles que ainda não foram submetidos a algum tipo de manipulação, embora possa coletar também dados secundários, como, por exemplos, comentários de terceiros em um documentos em que conste a legislação aplicável a algum tema, etc.. Configura-se na técnica de coleta de dados de documentos pessoais, registros institucionais, registros estatísticos e da comunicação de massa em geral, isto é, tv, rádio, jornais, revistas, internet, etc. Sobre essa técnica de pesquisa, Gil (1999, p. 160) salienta: As fontes de “papel” muitas vezes são capazes de proporcionar ao pesquisador dados suficientemente ricos para evitar a perda de tempo com levantamentos de campo, sem contar que em muitos casos só se torna possível a investigação social a partir de documentos. 16 Os documentos, instrumentos de pesquisa próprios dos levantamentos documentais, são comumente compostos por informações originais do autor – e é exatamente o tipo delas que diferem os levantamentos documentais dos bibliográficos, e, portanto, primárias, tais como as encontradas em um prontuário médico, na legislação, nos demonstrativos financeiros e contábeis de uma empresa ou de uma instituição, etc.. Entretanto, os documentos podem conter informações interpretativas dos originais, tais como nas notas explicativas e comentários realizados, por terceiros nos mesmos documentos citados, ou a eles anexados (LUNA, 2011; 2012; GIL, 1999; 2010; MARCONI; LAKATOS, 2003; 2007; 2008; KÖCHE, 1997; 2011; SOARES, 2003). Sobre estes aspectos dos documentos, Luna (2011, p. 56; 2012) nos empresta as suas ideias tal como segue: O documento, como fonte de informação, assume diferentes formas: literatura pertinente a um assunto, anuários estatísticos e censos, prontuários médicos, legislação, etc. São todos exemplos de fontes documentais. Como ocorre em relação às demais fontes, as informações obtidas em documentos podem ser diretas e indiretas. No caso particular de documentos, essa distinção costuma assumir a denominação de fontes primárias (diretas) e secundárias (indiretas). As obras originais de um autor são consideradas como primárias, enquanto as traduções e comentários sobre esse autor já são consideradas fontes secundárias. De um modo geral, quanto mais “oficial” for um documento, mais primária será a fonte. O levantamento documental visa a coleta de dados primários, ou seja, aqueles que ainda nãoforam submetidos a algum tipo de manipulação, enquanto o levantamento bibliográfico visa a coleta de dados secundários sobre um tema, quando não existem dados primários sobre ele ou quando a sua coleta é comprovadamente inviável. Entretanto, vale destacar que nos documentos, ou em anexo aos mesmos, podem haver dados secundários; por essa razão, correto afirmar que os documentos são fontes de dados primários ou secundários. Os documentos são tipificados por Gil (1999, p. 160-165) em documentos pessoais, registros institucionais, registros estatísticos e da comunicação de massa em geral, isto é, TV, rádio, jornais, revistas, internet, etc., tal como se segue: 1) Registros estatísticos [...] Entidades governamentais como a Fundação IBGE dispõem de dados referentes a características socioeconômicas da população brasileira, tais como: idade, sexo, tamanho da família, nível de escolaridade, ocupação, nível de renda etc. Os órgãos de saúde fornecem dados a respeito de incidência de doenças, causas de morte etc. Uma entidade como o Departamento Intersindical de Estatística e Estudos Socioeconômicos dispõe de dados sobre desemprego, salários, greves, negociações trabalhistas etc. Organizações voluntárias têm dados referentes a seus membros e também às populações que atendem. Institutos de pesquisa vinculados aos mais diversos campos do conhecimento. Além disso, número cada vez maior de entidades vem-se preocupando em manter bancos de dados. Isto se verifica em hospitais, escolas, agências de serviço social, entidades de classe, repartições públicas etc. [...] 2) Registros institucionais escritos Além dos registros estatísticos, também podem ser úteis para a pesquisa social os registros escritos fornecidos por instituições governamentais. Dentre esses dados estão: projetos de lei, relatórios de órgãos governamentais, atas de reuniões de casas legislativas, sentenças judiciais, documentos registrados em cartórios etc. [...] 3) Documentos pessoais Há uma série de escritos ditados por iniciativa de seu autor que possibilitam informações relevantes acerca de sua experiência pessoal. Cartas, diários, memórias 17 e autobiografias são alguns desses documentos que podem ser de grande valia na pesquisa social. [...] 4) Comunicação de massa Os documentos de comunicação de massa, tais como jornais, revistas, fitas de cinema, programas de rádio e televisão, constituem importante fonte de dados para a pesquisa social. Possibilitam ao pesquisador conhecer os mais variados aspectos da sociedade atual e também lidar com o passado histórico. Neste último caso, com eficiência provavelmente maior que a obtida com a utilização de qualquer outra fonte de dados. [...] (grifos meus) Embora a pesquisa bibliográfica e a documental sejam bastante semelhantes, por ambas se respaldarem em materiais elaborados e já publicados, Gil (2010) aponta que a principal diferença entre elas encontra-se na natureza das fontes. Sobre a identificação das mesmas, Gil, 2010, p. 31, elucida dizendo que “o que geralmente se recomenda é que seja considerada fonte documental quando o material consultado é interno à organização, e fonte bibliográfica quando for obtido em bibliotecas ou bases de dados”. Para Marconi e Lakatos (2007), a pesquisa documental consiste na análise de fontes primárias, isto é, elaboradas pelo próprio autor, enquanto a pesquisa bibliográfica consiste na análise de fontes secundárias, isto é, transcritas de fontes primárias contemporâneas ou retrospectivas. Com base nos pressupostos apresentados, deduz-se que o levantamento bibliográfico, enquanto um tipo de observação indireta, consiste na coleta e no tratamento sistematizado de dados secundários, e que o levantamento documental, enquanto um tipo de observação que tanto pode ser direta (dados primários) quanto indireta (dados secundários), consiste na coleta e no tratamento sistematizado de dados híbridos, isto é, tanto primários quanto secundários (KÖCHE, 1997, 2011; GIL, 1999; 2010; MARCONI; LAKATOS, 2003; 2007; 2008; LUNA, 2011; 2012; RODRIGUES, 2007; ECO, 2012; SOARES, 2003). Levantamento amostral O levantamento amostral, tal como toda outra técnica geral da pesquisa científica precisa de uma planejamento minucioso que especifique cada uma das suas fases, e os procedimentos técnicos necessários para a adequada operacionalização de cada uma delas (CORREA, 2003; BOLFARINE; BUSSAB, 2004; KASMIER, 1982; MORETTIN; BUSSAB, 2010). No caso específico da aplicação de técnicas de amostragem, por se tratar de metodologias quantitativas, dessemelhante dos levantamentos bibliográficos e documentais, que são essencialmente qualitativos, possuem peculiares, cujos cuidados necessários são ressaltados por Bolfarine e Bussab (2004, p. 14) com os seguintes dizeres: Ao optar por uma pesquisa quantitativa, levantamento ou experimentação, é necessário que o pesquisador planeje, execute, corrija e analise adequadamente o procedimento proposto e usado. Isto significa tomar uma série de medidas e cuidados antes da realização, durante a aplicação e depois da pesquisa efetuada. Sem esses passos dificilmente pode-se garantir resultados convincentes e confiáveis. Um estatístico experiente desenvolve os seus próprios procedimentos, escritos ou não, para conduzir ou orientar uma pesquisa quantitativa, mas ter a muita dificuldade em transmitir esses conhecimentos sem a prática e o convívio cotidiano com o aprendiz. Um dos métodos para transferir conhecimento e agilizar o treinamento nesta atividade 18 e através da apresentação de uma lista de tópicos que devam ser abordados em uma pesquisa quantitativa, ou melhor, apresentando o chamado “checklist”. Estas listas nunca são definitivas ou completas. Em primeiro lugar elas traduzem as idiossincrasias de seus formuladores, e em segundo, dificilmente conseguem prever todas as possíveis situações de um mundo tão rico e complexo como as pesquisas quantitativas. Portanto, devem ser usadas como um guia aproximado para planejamento e execução de um plano amostral. O checklist mencionado por Bolfarine e Bussab (2005, p. 265-267) consta no apêndice B de seu libro intitulado Elementos de Amostragem. Eles apontam a importância da observância, durante a realização de um levantamento amostral, dos seguintes aspectos: a. Identificação ao dos objetivos e populações: • apresentar as razões e antecedentes da pesquisa; • definir os objetivos gerais, operacionais e alternativos; • identificar as unidades de análise e resposta; • estabelecer a população alvo; • especificar as subpopulações de interesse (estratos); • identificar os possíveis sistemas de referência (frames); • descrição da população referenciada; • especificação dos parâmetros populacionais de interesse; • descrição da população amostrada; b. Coleta das informações: • escolher o tipo de investigação: experimentação, amostragem, censo, descritivo, analítico, etc. • estabelecer o modo de coleta: entrevista direta, observação, individual, em grupo, por carta, telefone, por instrumento, etc. • operacionalizar os conceitos: variáveis e atributos; • elaborar o instrumento de mensuração/coleta dos dados (questionário); c. Planejamento e seleção da amostra: • determinar o orçamento e custos do levantamento; • escolher as unidades amostrais; • definir o plano amostral; • fixar o tamanho da amostra; • escolher os melhores estimadores e seus erros amostrais; • selecionar as unidades amostrais; • prever procedimentos para os erros não amostrais (não resposta, mudanças no sistema de referências, etc.); d. Processo de coleta dos dados (campo): • elaborar os manuais dos entrevistadores e críticos; • montar a equipe de coleta de dados; • prever treinamento para entrevistadores,supervisores, checadores, listadores, etc.; • definir processos de controle contínuo de qualidade do campo; • prever procedimentos para situações inesperadas; e. Processamento dos dados: • identificar programas para a entrada dos dados; • criar planos de consistência e qualidade das informações; • planejar e criar banco de dados e dicionário de variáveis; • preparar os programas dos planos tabulares iniciais; f. Análise dos resultados (modelos estatísticos): • planejar as análises iniciais sobre a qualidade dos dados levantados: descritivas e/ou modelares; • apresentar o desempenho da amostra: qualitativa e quantitativamente; • descrever a população amostrada; • definir modelos de análise que respondam os objetivos iniciais; • efetuar análises exploratórias; g. Apresentação dos resultados: 19 • relatórios h. Disponibilidade dos dados (divulgação do banco de dados): • banco de dados; • conceitos, variáveis e indicadores (dicionário). Uma amostra é uma parcela de uma população que, adequadamente selecionada, passa a representar o seu todo em todas as variáveis de interesse investigadas. Por essa, o levantamento amostral precisa ser bem planejado para se conseguir uma amostra representativa (CORREA, 2003; BOLFARINE; BUSSAB, 2004; KASMIER, 1982; MORETTIN; BUSSAB, 2010). Sobre estes aspectos, Bolfarine e Bussab (2004, p. 26) apontam: O propósito da amostra é o de fornecer informações que permitam descrever os parâmetros do universo de maneira mais adequada possível. A boa amostra permite a generalização ao de seus resultados dentro de limites aceitáveis de dúvidas. Além disso os seus custos de planejamento e execução devem ter sido minimizados. Embora estes conceitos sejam de fácil aceitação, a sua implementação não é assim tão trivial. Qualquer amostra fornece informações, porém não é qualquer uma que permite estender os resultados para a população da qual foi retirada. Ouve-se frequentemente o argumento de que uma boa amostra é aquela que é representativa. Indagado sobre a definição de uma amostra representativa, a resposta mais comum é algo como: “aquela que é uma micro representação do universo”. Mas para se ter certeza de que uma amostra seja uma micro representação do universo para uma dada característica de interesse, deve-se conhecer o comportamento dessa mesma característica da população. Então, o conhecimento da população seria tão grande que tonar-se-ia desnecessária a coleta da amostra. Neste diapasão, as técnicas de amostragem são agrupadas de duas formas: a amostragem probabilística, a qual objetiva produzir resultados não tendenciosos sobre a amostra, em que todos os elementos da população apresentam uma probabilidade maior que zero e menor que 1 para ser selecionados na amostra de tal forma que seja possível conhecer precisamente uma medida que descreva a possibilidade da sua ocorrência, também chamada de probabilidade de inclusão; e a amostragem não probabilística, a qual também é utilizada para retratar representativamente o universo populacional selecionado, mas que não permite saber com que precisão, pois não é possível estabelecer uma margem de erro e níveis de confiança (BOLFARINE; BUSSAB, 2004; KASMIER, 1982; CORREA, 2003; MORETTIN; BUSSAB, 2010). Destacando as principais técnicas de amostragem utilizadas nos levantamentos amostrais, Bolfarine e Bussab (2004, p. 58) pontuam: Os tipos de planejamentos amostrais mais utilizados e que serão abordados com mais detalhes nos capítulos seguintes são: Amostragem Aleatória Simples (AAS). Seleciona-se sequencialmente cada unidade amostral com igual probabilidade, de tal forma que cada amostra tenha a mesma chance de ser escolhida. A sele c ao pode ser feita com ou sem reposição. Amostragem Estratificada (AE). A população é dividida em estratos (por exemplo, pelo sexo, renda, bairro, etc.) e a AAS é utilizada na seleção de uma amostra de cada estrato. Amostragem por Conglomerados (AC). A população é dividida em subpopulações (conglomerados) distintas (quarteirões, residências, famílias, bairros, etc.). Alguns dos conglomerados são selecionados segundo a AAS e todos os indivíduos nos 20 conglomerados selecionados são observados. Em geral é menos eficiente que a AAS ou AE, mas por outro lado, é bem mais econômica. Tal procedimento amostral é adequado quando é possível dividir a população ao em um grande número de pequenas subpopulações. Amostragem em Dois Estágios (A2E). Neste caso, a população é dividida em subpopulações como na AE ou na AC. Num primeiro estágio, algumas subpopulações são selecionadas usando a AAS. Num segundo estágio, uma amostra de unidades é selecionada de cada subpopulação selecionada no primeiro estágio. A AE e a AC podem ser consideradas, para certas finalidades como casos particulares da A2E. Amostragem Sistemática (AS). Quando existe disponível uma listagem de indivíduos da população, pode-se sortear, por exemplo, um nome entre os 10 primeiros indivíduos, e então observar todo décimo indivíduo na lista a partir do primeiro indivíduo selecionado. A seleção do primeiro indivíduo pode ser feita de acordo com a AAS. Os demais indivíduos que farão parte da amostra são então selecionados sistematicamente. Este levantamento amostral consiste em uma Amostragem Aleatória Simples sem reposição, que utiliza como sistema de referências a lista de participantes na plataforma virtual Moodle tendo-se retirado os quatro nomes informados pela professora, perfazendo o total de 42 unidades componentes da população-alvo investigada. O estudante da turma de Amostragem 2016/1 foi tomado como o elemento amostral e também como o elemento de resposta. Foram operacionalizados os seguintes procedimentos técnicos: Primeiramente, eu estipulei B = 2 e nível de confiança igual a 95% - 1 - α = 0,95, α = 0,05, α/2 = 0,025. Mas como a variância amostral (s²) é desconhecida, então eu decidi estimá- la por meio de uma amostra piloto. Utilizando, então, o bom senso, eu escolhi um tamanho inicial para a amostra (n0) igual a 8, sorteei 8 números, de 1 a 42, no Excel por meio do comando = ALEATÓRIOENTRE (1; 42), em seguida selecionei da lista de participantes da disciplina de Amostragem no AVA Moodle os seus respectivos e-mails e para eles enviei o questionário online para coleta dos dados. Daí, com os dados coletados, eu calculei o total e a proporção amostral das variáveis de interesse qualitativas, e a média, a variância, o desvio padrão e o coeficiente de variação das variáveis de interesse quantitativas. Como hipóteses de pesquisa, foram considerados, previamente, os seguintes resultados esperados: a maioria dos estudantes na faixa etária de 18 a 25 anos, com apenas Ensino Médio Completo (entre 11 e 13 anos de instrução), sem filhos, residente em local financiado pela UFSCar ou em casa dos pais, com renda per capita entre R$880,00 e R$1.760,00 (de 1 a 2 salários mínimos paulistas), com trajetória profissional curta (de 0 a 3 anos), fragmentada e diversificada (devido à realidade do mercado de trabalho brasileiro para jovens de 18 a 25 anos), utilitários do ônibus municipal e do ônibus universitário para deslocamento até a UFSCar, consumidores de 11 refeições no RU (em razão de praticidade para estudar), com poucas atividades extra-curriculares (para deixar mais tempo para o curso de Estatística), solteiro com algum tipo de relacionamento sem compromisso (ir saindo, ir ficando, conhecendo); que, em sua maioria, acesse a internet dos laboratórios da UFSCar durante o dia, e à noite, feriados e nos fins de semana das suas respectivas residências; que a maioria divida o seu tempo entre estudos, esportes, TV, rádio, filmes, alimentação, descanso, espiritualidade e relacionamento amoroso;a minoria tem graduação e pós-graduação completa, longa atuação no mercado de trabalho e mais de 100 horas semanais com os estudos. Conforme ressaltados por Peres (2011), os estudantes mais focados no tempo gasto e na qualidade dos seus estudos durante a graduação, são, não raro, os melhores profissionais, comumente iniciam a atuação na sua área, após a sua conclusão do curso, ocupando posições táticas e estratégicas nas organizações, são ótimos analistas e construtores de uma sociedade melhor. 21 Interessa saber: a) sobre todas as variáveis de interesse quantitativas, os seguintes estimadores pontuais: a média amostral, a variância amostral, o desvio padrão amostral, o coeficiente de variação amostral, e o intervalo de confiança para a média populacional, com índice de confiança de 95%; b) sobre todas as variáveis de interesse investigadas, com exceção do nome do respondente, os seguintes estimadores pontuais: o total e a proporção. Para tanto, segue uma suma teórica sobre as principais medidas da Estatística Descritiva utilizadas, e de seus respectivos métodos de cálculo: Medidas de posição a) Média Aritmética ou x Seja um conjunto de dados { x1 , x2 , x3 , ... , xn }. Então a média aritmética é n x x n i i 1 (1.01) É importante ressaltar que a notação usada, x , corresponde à média aritmética de dados amostrais. A média aritmética de uma população é representada pela letra grega , calculada da mesma forma. Exemplo 1.01: Calcular a média aritmética do conjunto { 3 , 4 , 6 , 8 , 8 , 9 , 10 , 10 , 11 }. Observação: Neste material, salvo menção em contrário, todo exercício considerará os dados como sendo amostrais. Propriedades: P1: Se uma constante k for somada a cada um dos elementos do conjunto, a média aritmética do mesmo será acrescida de k. kxkxxx ii Exemplo 1.02: Sejam os conjuntos { 1 , 3 , 4 , 6 , 9 } e { 201 , 203 , 204 , 206 , 209 }. Calcular e comparar as médias aritméticas para ambos. P2: Se todos os elementos de um conjunto forem multiplicados por uma constante k, a média aritmética dos mesmos também será multiplicada pelo mesmo valor. xkkxxx ii Exemplo 1.03: Sejam os conjunto { 2 , 3 , 6 , 6 , 8 } e { 6 , 9 , 18 , 18 , 24 }. Calcular e comparar as médias aritméticas para ambos. 22 P3: A soma dos desvios dos valores de um conjunto em relação à sua média é nula. 0 i ii xxxx Exemplo 1.04: Verificar a soma dos desvios em relação à média aritmética dos valores do conjunto {2, 4, 6, 7, 9}. a.1) Média Aritmética para Dados Agrupados Sejam N valores agrupados em n classes, com pontos médios Xi e freqüências fi . Então a média aritmética é: b) Mediana ( x~ ou Me) A mediana, ou valor mediano, de um conjunto de dados é o número que divide este conjunto em duas partes iguais. É importante ressaltar que este valor não pertence necessariamente ao conjunto. Dados Simples. Há dois casos a considerar: 1) Quantidade ímpar de valores: neste caso a mediana é o valor que ocupa a posição central, quando os valores estão em ordem crescente. Exemplo 1.14: Calcular a mediana do conjunto {3, 4, 6, 8, 8, 9, 10, 10, 11}. Como os valores já estão ordenados, basta verificar que elemento ocupa a posição central. Neste caso x~ = 8. 2) Quantidade par de valores: aqui a mediana é a média dos dois elementos centrais, quando os valores estão em ordem crescente. Exemplo 1.15: Calcular a mediana do conjunto {2, 3, 5, 6, 7, 9, 10, 13, 14, 15}. 8 2 97~ x 23 Dados Agrupados Para dados agrupados em uma distribuição de freqüências pode-se aplicar a fórmula dada a seguir: h fme fcN Lix 2~ onde: Li = limite inferior da classe que contém a mediana. fc = freqüência acumulada crescente da classe anterior à classe que contém a mediana. fme = freqüência simples da classe que contém a mediana. h = amplitude da classe que contém a mediana. A classe que contém a mediana é aquela cuja freqüência acumulada crescente é imediatamente superior, ou igual, a N/2. c) Moda (Mo) A moda, ou valor modal, de um conjunto de dados é o valor com maior freqüência. Este valor pode não existir ou, caso exista, pode não ser único. Dados Simples: Basta verificar qual elemento possui a maior freqüência. Exemplo 1.18: Para o conjunto {2, 3, 4, 4, 4, 5, 6, 7, 7, 8, 9, 10} a moda é 4. Exemplo 1.19: Para o conjunto {1, 2, 2, 2, 2, 3, 3, 5, 5, 5, 5, 6, 7, 8, 8} os valores modais são 2 e 5. Exemplo 1.20: O conjunto {2, 3, 4, 5, 7, 8, 9, 10, 11, 13, 15} não possui moda. Dados Agrupados: Para valores agrupados em uma distribuição de freqüências pode-se aplicar a fórmula obtida a seguir. Suponha-se que a figura (1.01), a seguir, represente parte do histograma de uma distribuição de freqüências cujo valor modal deseja-se calcular. O retângulo mais alto representa a classe modal, isto é, a de maior freqüência. A B 1 E I F 2 D C 24 Li I’ Li + h O valor modal, Mo, coincide com I’ , abscissa do ponto I , que é a intersecção dos segmentos AD e BC. Os triângulos AIC e BID são semelhantes. Então: BD FI AC EI 21 '' IhLiLiI '' 12 IhLiLiI '' 11122 IhLiLiI hLiLiII 12121 '' Como I’ = Mo: Simplificando-se, a expressão fica: onde: Li = limite inferior da classe modal (com maior freqüência simples). Δ1 = diferença entre as freqüências simples da classe modal e da classe anterior. Δ2 = diferença entre as freqüências simples da classe modal e da classe posterior. h = amplitude da classe modal. d) Relação Entre Média, Mediana e Moda A assimetria de uma distribuição de freqüências é o grau de desvio dos valores em 25 relação a um valor central. A determinação do tipo de assimetria tem grande utilidade em algumas aplicações da Estatística, como no Controle Estatístico de Processo (CEP), por exemplo. Tipos de Assimetria Com relação ao tipo de assimetria, uma distribuição de freqüências pode ser: Assimétrica Positiva: xxMo ~ 0 5 10 15 20 25 30 Figura 1. Distribuição Assimétrica Positiva. Simétrica, ou Normal: xxMo ~ 0 5 10 15 20 Figura 2. Distribuição Simétrica, ou Normal. Assimétrica Negativa: 26 Moxx ~ 0 5 10 15 20 25 30 Figura 3. Distribuição Assimétrica Negativa. Separatrizes (Medidas de Posição) Já foi visto que a mediana divide um conjunto de dados ordenados em duas partes iguais. De forma análoga, há medidas estatísticas que dividem um conjunto em quatro, dez ou cem partes. Estas medidas são chamadas separatrizes. A medida que divide o conjunto em 100 partes iguais é o percentil, definido a seguir. a) Percentil (Pn) Também chamado centil , divide um conjunto em cem partes iguais. Dados Simples Para um conjunto de dados simples os percentis podem ser determinados de forma análoga a utilizada para a determinação da mediana. Dados Agrupados Para dados agrupados em uma distribuição de freqüências pode-se utilizar a fórmula dada a seguir: h fP fcNn LiPn 100 . onde: n = 1, 2, 3, ..., 99 é o percentil que se deseja calcular. N = soma das freqüências. fc = freqüência acumulada crescente da classe anterior à classe que contém o n-ésimo percentil. fP = freqüência simples da classe que contém o n-ésimo percentil. 27 h = amplitude da classe que contém o n-ésimo percentil. A classe que contém o n-ésimo percentil é aquela cuja freqüência acumulada crescente é imediatamente superior, ou igual, a n*N/100. b) Quartil e Decil O quartil é a medida que divide um conjunto em quatro partes iguais. Pode ser calculado pelas seguintes relações: Q1 = P25 Q2 = P50 Q3 = P75 O decil divide o conjunto em dez partes iguais. Assim, usando raciocínio análogo ao utilizado para o cálculo do quartil, tem-se: D1 = P10 D2 = P20 D3 = P30 Medidas de Dispersão, ou Variabilidade Tão importante quanto o cálculo de uma medida de posição, geralmente a média aritmética, é a determinação da variação dos valores em torno desta medida. Esta variação é denominada dispersão, e suas principais medidas são dadas a seguir. a) Variância (σ2 ou s2) A variância de um conjunto de dados é a média dos quadrados dos desvios dos valores em relação à sua média. Isto é, dado um conjunto { x1 , x2 , x3 , ... , xn }, a variância é dada por Dados Populacionais: Dados Amostrais: 1 1 2 2 n xx s n i i Observação: Neste material, salvo menção em contrário, os dados serão sempre 28 considerados como amostrais. As fórmulas dadas acima podem ser substituídas, respectivamente, por: 21 2 2 n x n i i 11 2 11 2 2 nn x n x s n i i n i i Conhecidas como fórmulas reduzidas, e que (apesar da aparência) tornam os cálculos consideravelmente mais rápidos. Variância para Dados Agrupados Sejam N valores agrupados em n classes, com pontos médios Xi e freqüências fi . Então a variância é: Dados Populacionais n i i n i ii f fX 1 1 2 2 Dados Amostrais 1 1 2 2 N fxX s n i ii onde: n i ifN 1 . Da mesma forma que no caso da variância para dados simples, as fórmulas para variância de dados agrupados também podem ser substituídas por fórmulas reduzidas. Neste caso, elas ficam, respectivamente: 29 2 1 1 2 2 n i i n i ii f fX 11 2 1 2 2 NN fX N fX s n i iiii b) Desvio Padrão (σ ou s) É a mais conhecida, e utilizada, medida de dispersão. O desvio padrão de um conjunto de dados nada mais é que a raiz quadrada da variância do mesmo. Observação: A exemplo dos exercícios envolvendo a variância, todos os exercícios envolvendo o cálculo do desvio padrão devem considerar os dados como amostrais, salvo menção em contrário. Propriedades: P1: Se uma constante k é somada a todos os valores de um conjunto, o desvio padrão não se altera. skxsx ii P2: Se todos os valores de um conjunto são multiplicados por uma constante k, o desvio padrão também fica multiplicado por k. kskxsx ii c) Coeficiente de Variação O coeficiente de variação é definido como a razão entre o desvio padrão e a média aritmética. Então: d) Escore Reduzido (z) Seja um conjunto {x1, x2, x3, ..., xn}. O escore reduzido do i-ésimo elemento é dado 30 por: s xx z ii Quando os dados estão agrupados em um distribuição de freqüências, calcula-se o escore reduzido dos pontos médios. Medidas de Assimetria e Curtose a) Definições e Conceitos O conceito de assimetria foi apresentado em 1.07 , p. 56. Ali também foi apresentada uma forma de determinar o tipo de assimetria de um conjunto de dados. Em algumas aplicações, contudo, a simples determinação do tipo de assimetria não é suficiente, fazendo-se necessário o cálculo do coeficiente de assimetria. A curtose de um conjunto de dados é o achatamento de uma curva de freqüências em relação a uma curva simétrica, ou normal. Com relação à curtose, uma curva de freqüências pode ser classificada como: 0 10 20 30 40 50 Figura 4. Distribuição Mesocúrtica. 0 20 40 60 80 Figura 5. Distribuição Leptocúrtica. 31 0 5 10 15 20 25 30 35 Figura 6. Distribuição Platicúrtica. b) Coeficientes de Pearson para Assimetria O primeiro e o segundo coeficientes de Pearson para a assimetria são dados, respectivamente, por s MoxAss 1 s xxAss ~3 2 Comentário: na prática, há situações nas quais as relações entre média, mediana e moda apresentadas em 1.07, não se verificam. Isto é, a mediana ( x~ ) não assume um valor intermediário entre a média ( x ) e a moda (Mo). Neste caso pode-se aplicar uma “regra não escrita”, que consiste em desconsiderar o valor da moda na determinação do tipo de assimetria. Para o cálculo do coeficiente de assimetria deve-se adotar, portanto, o segundo coeficiente de Pearson. Por outro lado, independentemente da ocorrência ou não deste fato, é consenso que o cálculo deste coeficiente deve ser feito sempre com base em uma única fórmula, das duas dadas acima. c) Coeficiente Percentílico de Curtose Uma medida de curtose muito usada na prática é o coeficiente percentílico de curtose, dado por: 1090 2575 2 PP PP k A determinação do tipo de curtose é feita com base nas relações a seguir: k < 0,263 => Leptocúrtica k = 0,263 => Mesocúrtica 32 k > 0,263 => Platicúrtica d) Teoria Elementar da Probabilidade d.1 - Conceitos A teoria da probabilidade é aplicada à Estatística Indutiva, ou Inferencial, que tem se mostrado uma importante ferramenta de apoio à tomada de decisões sob condições de incerteza. Embora não haja uma definição precisa do que é probabilidade, o assunto pode ser estudado sob três enfoques, dados a seguir. d.1.1 Enfoque Clássico Seja um experimento com n possíveis resultados. Supondo-se que m destes resultados, m n, sejam favoráveis à ocorrência de um evento, então a probabilidade de ocorrência do evento é: n mp Interpretação: “A probabilidade de ocorrência de um evento é a razão entre o número de casos favoráveis e o número de casos possíveis”. d.1.2 Enfoque Relativo Sob este enfoque a probabilidade de ocorrência de um evento é determinada com base na proporção de ocorrências deste evento em um certo número de observações, ou experimentos. d.1.3 Enfoque Subjetivo É adotado quando há apenas uma oportunidade para a ocorrência do evento. Neste caso o que se observa é um certo “grau de crença” (KASMIER, 1982), ou expectativa. Também é conhecido como enfoque personalístico. Um princípio muito importante no estudo da teoria da probabilidade é o Princípio Fundamental da Contagem (PFC). De acordocom este princípio, se dois eventos sucessivos podem ocorrer de m e n modos, respectivamente, então o número de modos pelos quais m e n podem ocorrer é dado por (m.n). d.1.4 Experimento Aleatório É todo experimento, ou observação, cujo resultado não seja previsível, estando sujeito unicamente ao acaso. São exemplos de experimento aleatório: número de falhas apresentadas por um equipamento, número de nascimentos em uma certa semana, número de clientes atendidos em um dia qualquer em um estabelecimento comercial e o número de ganhadores de uma loteria, entre outros. d.1.5 Espaço Amostral (S) 33 É o conjunto de todos os possíveis resultados de um experimento aleatório. Como é um conjunto, está sujeito a todas as propriedades vistas no capítulo 0 , p. 6. Cabe acrescentar, ainda, que um espaço amostral pode ser: a) Discreto: quando é um conjunto enumerável; b) Contínuo: quando não é conjunto enumerável. d.1.6 Evento (E) É um subconjunto de um espaço amostral, cujos elementos são os resultados favoráveis, mencionados em 4.01.01. Dois, ou mais, eventos atendem a todas as propriedades e operações sobre conjuntos já mencionadas, tais como união, intersecção, etc. d.1.7 Evento União Sejam dois eventos, A e B. O evento união, ou A B , ocorre sempre que se observar a ocorrência de um resultado favorável a A ou a B. d.1.8 Evento Intersecção Sejam dois eventos, A e B. O evento intersecção ocorre sempre que se observar a ocorrência de um resultado favorável a A e a B. d.1.9 Evento Complementar Seja um evento A. O evento complementar ocorre sempre que se observar a ocorrência de um resultado desfavorável a A. d.1.10 Eventos Mutuamente Exclusivos Dois eventos, A e B, são mutuamente exclusivos quando não há possibilidade de ocorrência de um resultado favorável a ambos, como no evento união. Isto significa dizer que: A ∩ B = Ø d.1.11 Probabilidade de um Evento (p ou P(E)) É dada por: )( )()( Sn EnEPp d.1.12 Propriedades: Sejam A e B dois eventos quaisquer de um espaço amostral S. São válidas as seguintes propriedades: 1) 0≤P(A)≤1 2) P(A U B) = P(A + B) = P(A) + P(B) – P(A ∩ B) 34 3) P(S) = 1 4) Sejam A1 , A2 , ... , An todos os eventos de um espaço amostral S. Então: n i iAP 1 1)( d.1.13 Variável Aleatória (V.A.) De um modo simplificado, pode-se dizer que uma variável é chamada aleatória quando seus valores são determinados por processos aleatórios. d.1.14 Tipos de Variável Aleatória. Uma variável aleatória pode ser: a) Discreta: Quando o espaço amostral é um conjunto enumerável; b) Contínua: Quando o espaço amostral é um conjunto não enumerável. d.1.15 Função de Probabilidade Seja X uma v. a. discreta. Uma função p( X ) é uma função de probabilidade se, para cada valor de X: a) 0≤p(X) b) n ) 1 1( i iXP c) p(k) = P(X=k) d.1.16 Função Densidade de Probabilidade Seja X uma v. a. contínua. Uma função f( X ) é uma função densidade de probabilidade (fdp) se, para cada valor de X: a) 0≤f(X) b) 1)( dXXf c) P(a≤X≤b) = b a dXXf )( d.1.17 Expectância (E(X) ou µ) É a média, ou valor esperado, de uma variável aleatória. É definida como i ii XPXXE )( , v. a. discreta dXXXfXE )( , v. a. contínua d.1.18 Variância (V(X) ou σ2, ou s2) 35 Seja uma v. a. X. A sua medida de dispersão, ou variabilidade, em torno da média é dada por: i ii XPXXV )()( 22 , v. a. discreta dXXfXXV )()( 22 , v. a. contínua d.1.19 Parâmetro O termo parâmetro origina-se da língua grega, para (ao lado) + metron (medida). Um parâmetro é representado geralmente por uma letra grega. Em Estatística é usado para designar uma grandeza mensurável, que caracteriza uma população. Como exemplo de parâmetros pode-se citar a média (µ) e a variância (σ2 ou s2) . Na prática é comum que os parâmetros de uma população sejam desconhecidos. Nestes casos os valores dos parâmetros são determinados através de um processo conhecido como estimação. Um estimador, do latim aestimare (avaliar), é um valor característico de uma amostra, de tamanho n, extraída de uma população, de tamanho N, sobre a qual deseja-se tirar alguma conclusão. Os estimadores são representados por letras latinas e, algumas vezes, são designados por estatísticas. Exemplos de estimadores são a média amostral ( x ) e a variância amostral (s2), que foram estudados nos capítulos 1 e 2, respectivamente. A principal finalidade da estimação de parâmetros é o estudo de uma população com base em valores obtidos a partir de uma amostra extraída da mesma. Figura 7. Estimação de parâmetros. d.1.20 Estimador Um estimador é considerado eficiente quando apresenta as seguintes propriedades: - É não viciado, ou “não tendencioso”. Seja S o estimador de um parâmetro . Neste caso a média de S deve ser igual ao parâmetro µ. Isto é, E(S) = µ. - Deve possuir mínima variância. - Deve ser consistente. Isto significa que, a medida que o tamanho da amostra ( n ) aumenta, a diferença entre o estimador e o parâmetro diminui. σ2 x s 2 36 - Deve ser suficiente, isto é, deve ser função de uma estatística que resuma o máximo possível de informações a respeito do parâmetro. Um estimador que reúna as duas primeiras características é referido como sendo “uniformemente não-viciado de variância mínima” (UNVM). A média e a variância amostrais são exemplos de estimadores UNVM. d.1.21 Estimação por Ponto: Também denominada Estimação Pontual, consiste em apresentar como estimador para um dado parâmetro um valor numérico único. Isto significa, por exemplo, estimar a média populacional µ como igual a x . Este procedimento, embora não seja incorreto, apresenta, contudo, um sério inconveniente: o estimador pode não ser um valor suficientemente próximo do valor do parâmetro. Este fato pode comprometer seriamente a qualidade do estimador. Estimação por Intervalos de Confiança: Também denominada Estimação Intervalar, consiste em determinar um intervalo numérico. A este intervalo está associada uma probabilidade (µ) de que o mesmo contenha o valor efetivo do parâmetro estimado. A referida probabilidade é denominada “Nível de Confiança”. O valor (1 - ) também é conhecido como “Margem de Erro”. a) Níveis de Confiança e Valores Críticos: Para uma distribuição normal há uma probabilidade de 68,27% de que o valor do parâmetro pertença ao intervalo ( x - E; x + E). Para os intervalos dados por ( x - 2E; x + 2E) e ( x - 3E; x + 3E) as probabilidades são, respectivamente, 95,45% e 99,73%. Estas probabilidades são os níveis de confiança para os respectivos intervalos. Os valores 1, 2 e 3 são denominados “valores críticos”. b) Intervalos de Confiança para a Média A primeira providência a ser tomada na construção de um intervalo de confiança para estimar a média é verificar se o desvio padrão populacional (σ) é conhecido. Se a resposta for positiva, os valores críticos são tomados com base na Distribuição Normal, sendo os valores do quadro 7.03 os mais utilizados na prática. Os limites do intervalo são: n zx n zx cc para amostragem com reposição, e: 11 N nN n zx N nN n zx cc 37 para amostragem sem reposição, onde N é o tamanho da população. Quando o desvio padrão populacional é desconhecido, o que se nota com mais freqüência na prática, não é aconselhável
Compartilhar