Prévia do material em texto
CENTRO UNIVERSITÁRIO RITTER DOS REIS - CAMPUS FAPA BACHARELADO EM ADMINISTRAÇÃO DISCIPLINA: Estatística PROFESSORA: Thaís Ribeiro Pagliarini Ana Cláudia Giúly dos Santos Thiago Kerche ENSAIO DE ANÁLISE DE DADOS PORTO ALEGRE 2017 ‘’Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. ” (Dugé de Bernonville) Sumário 1. Introdução ............................................................................................................. 4 2. Desenvolvimento .................................................................................................. 5 4. Distribuição de Frequência ................................................................................... 8 5. Representação Gráfica da Distribuição de Frequência ........................................ 9 6. Medidas de Tendência Central ........................................................................... 10 7. Medidas de Dispersão ........................................................................................ 11 8. Probabilidade ...................................................................................................... 13 9. Analise Estatística do Problema ......................................................................... 14 10. Conclusão ....................................................................................................... 15 11. Referências Bibliográficas ............................................................................... 16 4 1. Introdução Este ensaio de análise de dados tem como objetivo realizar uma pesquisa quantitativa descritiva, ou seja, apontar numericamente a frequência e a intensidade dos comportamentos dos indivíduos de um determinado grupo e população, onde realiza-se o estudo, a análise, o registro e a interpretação dos fatos do mundo físico sem a interferência do pesquisador. O tema da pesquisa é ‘’Biblioteca, um espaço de estudo e descobertas’’. A partir do tema delimitado resolvemos pesquisar a frequência que os alunos de Administração/2016 UniRitter campus FAPA retiraram livros na biblioteca. 5 2. Desenvolvimento 1) Delimitação do tema: O tema desta análise de dados é referente a quantidade de livros que os alunos de Administração da UniRitter/FAPA retiraram livros no ano de 2016. 2) O Problema de Pesquisa: Porque em determinados meses são retirados mais livros do que em outros? 3) Metodologia: Foi solicitado para bibliotecária Aline de Fraga dados sobre a biblioteca. As informações foram captadas através de um e-mail para a bibliotecária que continha uma breve apresentação do trabalho, um formulário enviado pela professora para a coleta de dados e um questionário que continha as seguintes perguntas: Quantidade de retiradas no ano de 2016 pelo curso de administração/ campus FAPA e quantidade de livros retirados no mês? Após isso, Aline nos forneceu um relatório com todos dados das retiradas de livros mês a mês no ano de 2016. Neste ensaio de análise será considerada a quantidade de empréstimos feitos pelos alunos do curso de Administração do ano 2016 da UniRitter/FAPA. A nossa análise foi feita através de levantamento de dados de forma indireta, pois obtemos os dados através de terceiros de forma quantitativa discreta, pois foi gerada por um processo de contagem, assumindo valores inteiros. Conforme planilha em anexo. CURSO DE ADMINISTRAÇÃO (UNIRITTER/FAPA) 2016 MESES EMPRÉSTIMO Fevereiro 1 Março 10 Abril 15 Maio 5 Junho 23 Julho 2 Agosto 5 Setembro 31 Outubro 16 Novembro 23 Dezembro 9 TOTAL: 140 6 3. Amostragem Estratificada Uma Amostra Estratificada é uma amostra probabilística que se caracteriza por um procedimento com duas etapas, nomeadamente: 1º. Divisão da população em subgrupos chamados estratos; 2º. Escolha da amostra aleatória simples de forma independente em cada subgrupo ou estrato. Esta técnica de amostragem parte do pressuposto de que todos os elementos da população ou universo têm a mesma probabilidade de serem incluídos na amostra. Desta forma, os resultados obtidos com a análise dos dados da amostra poderão ser transponíveis, como determinado grau de certeza, para toda a população ou universo. A divisão da população em estratos justifica-se pelo pressuposto de que em cada grupo a variável estudada apresente comportamento substancialmente diferente e que, simultaneamente, dentro de cada grupo, esse comportamento seja relativamente homogéneo. A estratificação da amostra permitirá assim a obtenção de um maior grau de certeza nos resultados sem necessidade de aumentar o número de elementos da mesma pois garantirá que todos os subgrupos estão adequadamente representados. Sendo assim, foi feita a amostra estratificada conforme os relatórios fornecidos pela bibliotecária no qual está discriminado mês a mês o número de retirada de livros. Para o cálculo foi utilizado erro amostral de 5%. = 1/(0.05)² = 1/0.0025 = 400 = 140 x 400 = 56.000 = 103.70 (arredondamento 104) 140 + 400 540 7 Segue Tabela: Janeiro 0 0 0 Fevereiro 1 1÷140 = 0.0071 x 104 = 1 Março 10 10÷140 = 0.071428 x 104 = 7 Abril 15 15÷140 = 0.1071428 x 104 = 11 Maio 5 5÷140 = 0.0357142 x 104 = 4 Junho 23 23÷140 = 0.1642857 x 104 = 17 Julho 2 2÷140 = 0.0142857 x 104 = 1 Agosto 5 5÷140 = 0.0357142 x 104 = 4 Setembro 31 31÷140 = 0.2214285 x 104 = 23 Outubro 16 16÷140 = 0.1142857 x 104 = 12 Novembro 23 23÷140 = 0.1642857 x 104 = 17 Dezembro 9 9÷140 = 0.0642857 x 104 = 7 Total ---------- 140 ------------------------- 104 1.1 Anexo 8 4. Distribuição de Frequência Quando se estuda uma massa de dados é de frequente interesse resumir as informações de variáveis. Costuma-se, frequentemente, para uma melhor compreensão dos mesmos, distribuí-los em classes ou intervalos determinando-se o número de indivíduos pertencentes a cada classe ou intervalo. Desta forma, um arranjo tabular dos dados, juntamente com as frequências correspondentes aos mesmos é denominado distribuição de frequência ou tabela de frequência. Aplicaremos no nosso trabalho uma tabela sem intervalo de classe que é a simples condensação dos dados conforme as repetições de seus valores. Calculo média aritmética: = 140/12 = 12 Meses fi Fi fri % Fri % xi*fi 1 0 0 0 % 0 % 1x0 = 0 0-12 = (-12) (-12)² = 144 2 1 1 0,71 % 0,71 % 2x1 = 2 1-12 = (-11) (-11)² = 121 3 10 11 7,14 % 7,86 % 3x10 = 30 10-12 = (-2) (-2)² = 4 4 15 26 10,71% 18,57 % 4x15 = 60 15-12 = 3 3² = 9 5 5 31 3,57 % 22,14 % 5x5 = 25 5-12 = (-7) (-7)² = 49 6 23 54 16,43 % 38,57 % 6x23 = 138 23-12 = 11 11² = 121 7 2 56 1,43 % 40,00 % 7x2 = 14 2-12 = (-10) (-10)² = 100 8 5 61 3,57 % 43,57 % 8x5 = 40 5-12 = (-7) (-7)² = 49 9 31 92 22,14 % 65,71 % 9x31 = 279 31-12 = 19 19² = 361 10 16 108 11,43 % 77,14 % 10x16 = 160 16-12 = 4 4² = 16 11 23 131 16,43 % 93,57 % 11x23 = 253 23-12 = 11 11² = 121 12 9 140 6,44 % 100 % 12x9 = 108 9-12 = (-3) (-3)² = 9 140 100 % 1109 1104 9 0 1 2 3 4 5 6 78 9 10 11 12 0 1 2 5 5 9 10 15 16 23 23 31 Intervalo Xi 5. Representação Gráfica da Distribuição de Frequência Histograma: são gráficos de barras que mostram a variação sobre uma faixa específica. É uma ferramenta que nos possibilita conhecer as características de um processo ou um lote de produto permitindo uma visão geral da variação de um conjunto de dados. Polígono de Frequência: Um polígono de frequência é um gráfico que se realiza através da união dos pontos mais altos das colunas num histograma de frequência (que utiliza colunas verticais para mostrar as frequências). Os polígonos de frequência para dados agrupados, por sua vez, constroem- se a partir da marca de classe que coincide com o ponto médio de cada coluna do histograma. Quando são representadas as frequências acumuladas de uma tabela de dados agrupados, obtém-se um histograma de frequências acumuladas, que permite dispor em diagrama o seu polígono correspondente. 10 6. Medidas de Tendência Central A Estatística trabalha com diversas informações que são apresentadas por meio de gráficos e tabelas e com diversos números que representam e caracterizam um determinado conjunto de dados. Dentre todas as informações, podemos retirar valores que representem de algum modo, todo o conjunto. Esses valores são denominados “Medidas de Tendência Central ou Medidas de Centralidade”. As medidas de centralidade são a Média Aritmética, a Moda e a Mediana. Vamos mostrar a seguir o que vem a ser cada uma delas. Média: é definida como a soma dos valores dividida pelo número de valores. Usando o conceito físico de ponto de equilíbrio, a média indica o centro de um conjunto de valores. = 1109/140 = 7,92 (arredondamento para 8) Moda: de um conjunto de valores é definida como o valor que ocorre com maior frequência. Moda de dados agrupados sem intervalo de classe: É o valor da variável que apresentar maior frequência relacionada. Como nossa tabela é sem intervalo, o mês de setembro é o que tem número de maior frequência absoluta, sendo representado pelo número: Mo = 9 Mediana: o valor do meio que separa a metade maior da metade menor no conjunto de dados. A mediana e a moda são as únicas medidas de tendência central que podem ser usadas para nível de medição, onde valores recebem rank relativos aos outros, mas não são medidos absolutamente. Md ∑fi = 140/2 = 70 2 A mediana é a classe correspondente à frequência acumulada imediatamente superior a 70 ou seja o mês de setembro representado pelo número 9. 11 7. Medidas de Dispersão Variância: é a média aritmética dos quadrados dos desvios. S²= 1.104 = 1104 = 7,94 140- 1 139 Desvio Padrão: mede a dispersão dos valores individuais em torno da média. S = √1.104 = √1104 = 140 -1 139 √7,94 = 2,82 Coeficiente de Variação: O coeficiente de variação é a estatística utilizada quando se deseja comparar a variação de conjuntos de observações que são diferentes na média ou são medidos em grandezas que também são diferentes. CV = 2,82 x 100 = 0,235x100 = 23,50% 12 12 Como o coeficiente de variação analisa a dispersão em termos relativos, ele será dado em %. Quanto menor for o valor do coeficiente de variação, mais homogêneos serão os dados, ou seja, menor será a dispersão em torno da média. Sendo assim analisamos: - Quanto a qualidade de dispersão: Média dispersão - Quanto a medida central adequada: Média - Quanto ao comportamento da variável: Padrão regular 13 8. Probabilidade Probabilidade: são medidas estatísticas que medem o grau de incerteza da ocorrência de um de determinado fenômeno. 1) Qual a probabilidade de a retirada dos livros ser superior a 5, entre os meses de janeiro a dezembro? 7/12 = 0,58 Conforme nossa tabela 7 meses tiveram retiradas acima de 5 livros. Calculo probabilidade: x = 7 n = 12 p = 0,58 q = 0,42 P(7) = 12! . 0,587 . 0,42(12-7) (12-7)! . 7! P(7) = 12! . 0,587 . 0,425 = 0,2285x100 = 22,85% 5! . 7! 14 9. Analise Estatística do Problema A quantidade média de livros retirados pelos alunos do Curso de Administração do Campus FAPA / UniRitter é de 8 livros. A menor retirada é 0 e a maior é 31 livros. A moda é representada pelo mês de setembro (9). O coeficiente de variação encontrado representa 23,50% de afastamento em relação à média, então as retiradas de livros dos alunos do curso de Administração do Campus FAPA / UniRitter se tratam de um grupo de média dispersão (CV de 15% a 30%), e a medida indicada para representar a variável é a média. A medida da mediana mais precisamente é apontada no mês de setembro (9) isto é, as retiradas mais presentes na faculdade são no mês de setembro de 2016. Medidas de Tendência Central Média 8 Moda 9 Mediana 9 Medidas de Dispersão Variância 7,94 Desvio Padrão 2,92 Coeficiente de Variação 23,50% A probabilidade de retirada de livros no ano de 2016 no período de janeiro a dezembro ser superior a 5 unidades é resultante de 22,85%. 15 10. Conclusão O objetivo da pesquisa é determinar a frequência que os alunos de Administração/2016 UniRitter campus FAPA retiraram livros na biblioteca, sendo assim após coleta de dados e analisando o total (620) de alunos matriculados em Administração relacionado com os dados da pesquisa percebemos que há um número muito pequeno de retiradas de livros na biblioteca (140), em relação a quantidade de alunos matriculados. Após feita coleta, critica, apuração, exposição e análise de dados, constatamos conforme observação do histograma que nos períodos de prova, grau A e grau B, as frequências de retiradas na biblioteca aumentam relativamente nos meses de Abril, Junho, Setembro e Novembro. No entendimento do grupo, concluímos que a causa de as retiradas maiores terem sito citada nos meses acima é pelos alunos terem trabalhos para executar e também para estudos de provas. 16 11. Referências Bibliográficas FONSECA, J. J. S. Metodologia da pesquisa científica. Fortaleza: UEC, 2002. Apostila. GIL, Antonio Carlos. Métodos e técnicas de pesquisa social. 5. ed. São Paulo: Atlas, 2006. GIL, Antonio Carlos. Como elaborar projetos de pesquisa. 5. ed. São Paulo: Atlas, 2008. Stevenson, William J. Estatística Aplicada à Administração. ed. São Paulo: Harbas, 2001