Prévia do material em texto
UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EM GESTÃO E TECNOLOGIA CURSO DE ADMINISTRAÇÃO DISCIPLINA ESTATISTICA APLICADA UMA APLICAÇÃO DE ANALISE DE REGRESSÃO LINEAR PARA ESTIMAÇÃO DA RECEITA COM PATROCINADORES DE UMA EQUIPE ESPORTIVA. Professora: Dra. Monica Fabiana Bento Moreira Thiersch monicathiersch@ufscar.br Alunos: Alexandre Marcos Storti Filho Felipe Gomes de Souza Sorocaba, 23 de Novembro de 2017 3 Sumário Sumário ................................................................................................................................ 3 RESUMO ............................................................................................................................ 4 INTRODUÇÃO .................................................................................................................. 4 JUSTIFICATIVA .............................................................................................................. 5 1. MÉDIA DE PUBLICO POR PARTIDA E NUMERO DE TORCEDORES .... 6 2. RECEITA COM PATROCINADORES ............................................................... 7 3. REGRESSÃO LINEAR .......................................................................................... 8 3.1. DIAGRAMA DE DISPERSÃO .............................................................................. 9 3.2. CÁLCULO DA REGRESSÃO UTILIZANDO O EXCEL ............................... 11 3.2.1. A RETA DE REGRESSÃO ① ........................................................................ 12 3.2.2. ERRO PADRÃO DA ESTIMATIVA ② ........................................................ 13 3.2.3. COEFICIENTE DE DETERMINAÇÃO ③ – R ² ......................................... 14 3.2.4. COEFICIENTE DE CORRELAÇÃO ③ – r .................................................. 14 3.2.5. ERROS PADRÕES DOS COEFICIENTES ⑤ ............................................. 15 3.2.6. TESTE DE HIPÓTESE COM A DISTRIBUIÇÃO F ⑥ ............................. 15 4. APRESENTAÇÃO DOS RESULTADOS ........................................................... 15 4.1. ESTIMATIVA DE RECEITA COM PATROCINADORES PARA O E.C. SÃO BENTO ................................................................................................................................ 17 5. CONSIDERAÇÕES FINAIS ................................................................................ 17 6. BIBLIOGRAFIA CONSULTADA ...................................................................... 18 4 RESUMO A presente contribuição trata da utilização de Métodos Quantitativos para estimar o total de receita com patrocinadores para um clube com base no número de torcedores e sua média de público em jogos. Valendo-se de recursos computacionais (análise de dados do EXCEL). INTRODUÇÃO A competição no mercado pelas empresas diante da globalização é uma realidade e faz com que aumentem a concorrência entre elas. Diante dessa realidade as empresas procuram maximizar os seus resultados seja diminuindo custos ou aumentando o os lucros A estatística é uma ciência muito importante, pois através dela, podemos compreender alguns fenômenos que nos rodeiam. A estatística é uma ciência que coleta, organiza, analisa, interpreta e apresenta dados. De acordo com o livro “Estatística Aplicada à Administração e à Economia”, de David P. Doane e Lori E. Seward, a estatística é chamada por muitos especialistas de ciência dos dados, ou uma trilogia de tarefas envolvendo modelagem de dados, análise e tomada de decisão. A American Statistical Association (ASA) traz a seguinte definição: “Análise estatística envolve coletar informação, avaliá-la, concluir e orientar quais informações são confiáveis e que previsões podem ter credibilidade.”. Na atualidade, as empresas em geral, tanto as de grande como as de pequeno porte, devem traçar estratégias para alcançar seus objetivos. Há muitas vezes, a necessidade destas organizações descreverem e preverem o comportamento de certas variáveis importantes para a tomada de decisões, tais como: custos, receitas, despesas e resultados. Para alcançar os melhores resultados, as empresas devem agir com eficiência e eficácia. Para isso, é necessário ter uma visão holística da organização, além disso, analisar as variáveis relevantes nos negócios é outro ponto importante. As variáveis podem ser previstas intuitivamente, utilizando pesquisas de mercado, por exemplo. Porém, essas pesquisas resolvem o problema somente em termos de curto prazo, já 5 que, à medida que os horizontes se ampliam, as previsões se tornam mais difíceis de serem realizadas. Com isso, o estudo das relações entre variáveis consegue resolver eficazmente tanto problemas de curto prazo, como de longo prazo. Existem duas técnicas utilizadas nesse estudo que são a regressão e a correlação. Ambas as técnicas compreendem a análise de dados amostrais para obter informações sobre se duas ou mais variáveis são relacionadas e qual é o comportamento desse relacionamento. A análise de regressão, bastante empregada nas áreas de negócios, é utilizada principalmente com a intenção e o propósito de previsão. Essa previsão consiste em determinar uma função matemática que busca descrever o comportamento ou natureza de determinada variável dependente com base nos valores de uma ou mais variáveis independentes. A análise de correlação visa medir o grau de relacionamento entre variáveis e é mais enfatizada em estudos das áreas das ciências humanas, como a sociologia, por exemplo. Neste trabalho, iremos abordar o modelo de regressão linear simples, com a intenção de fazer uma previsão nas vendas de café em pó, de um mercado de pequeno porte, situado na zona norte de Sorocaba. Com este trabalho, deseja-se projetar as quantidades de café em pó a ser vendido nos próximos meses do ano. Todavia, este trabalho pode servir para previsão de qualquer tipo de produto, além de ser eficaz para as empresas que desejam ter uma boa previsão de vendas futuras, seja de curto prazo ou em longo prazo. JUSTIFICATIVA O motivo da realização deste trabalho, está no fato de que, levado ao conhecimento dos clubes e patrocinadores, estes possam utilizar o método, a fim de se programar nas previsões de investimentos em função do número de torcedores e média de público das partidas, levando em consideração a metodologia científica, utilizando-se de estatística e recursos computacionais como o Excel. Á medida que utilizamos tais métodos, obtém-se melhores informações para a administração no fluxo do processo decisório, merecendo assim uma melhor reflexão sobre a matéria. A importância da aplicação de técnicas formais, como a análise de regressão, para tentar 6 estabelecer modelos, são úteis não apenas para descrever o que aconteceu, mas também para serem utilizados, com muito cuidado, para finalidades de projeções. LIMITAÇÃO DO ESTUDO O estudo está limitado a aplicação da ferramenta Regressão do Excel, com vistas a identificar a função estimada da receita em faturamento com patrocinadores para um clube da primeira divisão ao nível de significância de 95%, considerando os valores em moeda de poder aquisitivo constante. A análise de regressão linear foi realizada considerando os eventos observados no período de Janeiro a Novembro de 2017. 1. MÉDIA DE PUBLICO POR PARTIDA E NUMERO DE TORCEDORES De início, para obter os dados, acessamos os sites de mídia especializada que utilizou de pesquisa realizada pelo Ibope, para obtermos os dados.Com isso, conseguimos angariara média de público por partida dos clubes da série A do campeonato brasileiro, no período compreendido entre Janeiro de 2017 a Novembro de 2017, totalizando 20 clubes, para serem utilizados como base de nosso estudo. Figura 1 Média de público por jogos. 7 Figura 2 Número de torcedores por equipe. 2. RECEITA COM PATROCINADORES Para obter os dados, acessamos as pesquisas realizadas pelo ITAÚ BBA: Análise Econômico Financeira dos Clubes de Futebol Brasileiros | 2017 e a pesquisa realizada por AMIR SOMOGGI: finança dos clubes brasileiros, nas quais é possível se observar os montantes arrecadados com patrocinadores. Com isso, conseguimos analisar a receita com patrocinadores por clube da série A do campeonato brasileiro, no período compreendido entre Janeiro de 2017 a Novembro de 2017, totalizando 20 clubes, para serem utilizados como base de nosso estudo 8 3. REGRESSÃO LINEAR Analisando e compilando as informações encontradas chegamos aos dados bem como são mostrados na tabela 1. Tabela 1 dados compilados TIMES TORCEDORES (em milhões) MÉDIA DE PUBLICO RECEITA COM PATROCINADORES (em milhões) FLAMENGO 32,50 19989 R$ 66 CORINTHANS 27,30 34445 R$ 72 PALMEIRAS 10,60 31099 R$ 91 SÃO PAULO 13,60 33029 R$ 35 GRÊMIO 6,00 21565 R$ 36 ATLÉTICO MG 7,00 14878 R$ 32 SANTOS 4,80 12139 R$ 22 FLUMINENSE 3,60 14183 R$ 16 INTERNACIONAL 5,60 19711 R$ 34 CRUZEIRO 6,20 18712 R$ 27 VASCO 7,20 12673 R$ 14 ATLÉTICO PR 2,40 15102 R$ 9 BOTAFOGO 3,40 15264 R$ 9 SPORT 2,40 10785 R$ 9 BAHIA 3,40 18116 R$ 9 VITÓRIA 2,60 9333 R$ 9 CORITIBA 2,00 11649 R$ 9 PONTE PRETA 0,25 6125 R$ 6 CHAPECOENSE 1,50 9186 R$ 3 AVAÍ 0,50 6448 R$ 2 ATLÉTICO GO 0,18 5015 R$ 2 Em primeiro momento, é possível supor que a previsão desejada poderia ser feita a partir da média, porém, nem sempre uma simples média proporciona uma previsão adequada das vendas futuras. Para isso, é necessário que se faça uma análise mais apurada da situação. Dessa forma a análise de regressão linear possibilita os seguintes procedimentos: Descrever e compreender a relação entre o número de total de torcedores e de público por jogos e o valor arrecadado com patrocinadores e assim projetar (estimar) uma nova observação ou ajustar 9 e controlar investimentos. Conhecida a relação entre o número total de torcedores e média público com o valor arrecadado com patrocínios podemos usar uma das observações para prever a outra, ou podem-se realizar ajustes na procura de melhores resultados. Dessa maneira, utilizamos a tabela anteriormente levantada para chegar à conclusão que o número de torcedores e a média de público seriam valores exatos e controlados no experimento (variável independente x) e que as receitas com patrocinadores seriam variáveis aleatórias e não controladas no experimento (variável dependente y). 3.1. DIAGRAMA DE DISPERSÃO O diagrama de dispersão é um gráfico bidimensional, por meio da qual podemos analisar o comportamento das variáveis em estudo, cada ponto no gráfico representa a plotagem dos valores das coordenadas X (número de torcedores/público médio) e Y (Receita com patrocinadores). Além disso, para se ter uma boa previsão, o diagrama de dispersão é o primeiro passo, pois ele mostra a relação entre as variáveis e indica se existe relação entre elas, além do mais, ele mostra se a relação é direta ou indireta, linear ou não linear. O primeiro passo é representar os pares de observações em um gráfico de dispersão, conforme pode-se ver nos gráficos a seguir. O registro dos 20 conjuntos de dados no gráfico (xi, yi), desenham uma figura indicando uma tendência de crescimento positivo, isto é, na medida que o número de torcedores ou a média de público aumenta, o valor da receita com patrocinadores também aumenta e vice versa. 10 Figura 3 Gráfico de dispersão da receita com patrocinadores em função da média de público Figura 4 Gráfico de dispersão da receita com patrocinadores em função do número de torcedores 11 Para estabelecer uma lógica matemática entre variáveis que tem uma relação linear, denominadas como variável independente e variável dependente, um modelo interessante é o próprio modelo da reta de regressão. 3.2. CÁLCULO DA REGRESSÃO UTILIZANDO O EXCEL O Excel tem diversas funções estatísticas que podem ser aplicadas para a obtenção dos valores dos coeficientes de regressão e projeção, neste caso, a ferramenta que possibilita a geração de um relatório de análise que mede o nível de efetividade e utilidade da regressão, é a ferramenta Regressão. Para usar a ferramenta regressão começamos abrindo o menu [Ferramentas]/ [Análise de dados] /[Regressão] que gera uma caixa de diálogo onde deveremos definir o “Intervalo Y de entrada” (correspondente a receita com patrocinadores), o “Intervalo X de entrada” (correspondente ao número de torcedores e público médio) e o “Nível de confiança” (em nosso estudo de = 95%). Figura 5 Caixa de diálogo para regressão no Excel 12 Após preencher os dados, pressionando a tecla OK, os seguintes resultados serão apresentados em Nova planilha: RESUMO DOS RESULTADOS Estatística de regressão R múltiplo④ 0,880 R-Quadrado③ 0,775 R-quadrado ajustado 0,750 Erro padrão② 12,385 Observações 21 ANOVA gl SQ MQ F ⑥F de significação Regressão 2 9495,540 4747,770 30,951 1,49E-06 Resíduo 18 2761,127 153,396 Total 20 12256,667 Coeficientes① Erro padrão⑤ Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% Interseção -9,658 6,271 -1,540 0,141 -22,834 3,517 -22,834 3,517 TORCEDORES (em milhões) 1,247 0,449 2,777 0,012 0,303 2,190 0,303 2,190 MÉDIA DE PUBLICO 0,002 0,000 3,510 0,003 0,001 0,003 0,001 0,003 Para avaliarmos a utilidade dos resultados rebuscaremos os conceitos para análise de Regressão Linear Simples descritos por LAPPONI (1995, 231-264) para os itens de ① a ⑥ relacionados na planilha. 3.2.1. A RETA DE REGRESSÃO ① A reta de regressão é representada pela equação ÿ = β0 + β1x1 + β2x2 onde, ÿ é a variável dependente e x1 e x2 são as variáveis independentes. Se os n valores amostrais formassem uma reta, então a equação da reta ajustada conteria os n pontos amostrais. Em geral, os n valores não estarão contidos numa reta, O objetivo é obter, a partir dos n dados amostrais, os 13 valores dos coeficientes a e b da reta ÿ = β0 + β1x1 + β2x2, denominados como coeficientes de regressão, ou simplesmente coeficientes ou constantes, que têm os seguintes significados: Os coeficientes β1 e β2 definem o aumento (ou diminuição) da variável y por unidade de variação das variáveis x1 ex2; A constante a é denominada como intercepto y, sendo igual ao valor de ÿ quando x é igual a zero1 (Interseção). A definição do critério para o ajuste de uma reta sobre o gráfico dos n pontos observados pode ser feito de diversas formas. Podemos entender que, quanto menor for a soma dos desvios de todos os pares de observações, melhor será o poder de explicação do modelo. Por exemplo, se y é a variável independente e x a variável dependente, isto é x = f(y), o valor dos coeficientes da reta de regressão são calculados com a fórmula: A regressão realizada é, na realidade, uma estimativa da relação entre as variáveis,relação essa que é desconhecida. Portanto, os coeficientes da regressão, a e b, são estimativas pontuais dos dois parâmetros populacionais correspondentes, denominados como e. ÿ = β0 + βx ÿ = + x + e Onde, o valor e (resíduo) representa a dispersão na população, devido ao fato de não existir um relacionamento perfeito entre as duas variáveis na população. De uma outra maneira, existem outras variáveis que não foram consideradas na regressão e que também tem uma certa influência, minoritária, nos resultados. Desta forma temos: ÿ = -9,658 + 1,247X1 +0,002X2 3.2.2. ERRO PADRÃO DA ESTIMATIVA ② O erro padrão da estimativa se informa de forma aproximada quão grande são os erros de estimativa (os resíduos) do grupo de dados, medindo na própria unidade de y. Ao ajustar uma reta, se espera que ela explique o grupo de dados. Se os dados estiverem contidos numa reta, se obterá uma reta coincidente com os pontos observados e, dessa maneira, a soma dos quadrados dos desvios será igual a zero e a reta ajustada explica completamente. Logo, temos um erro de 12,385 14 3.2.3. COEFICIENTE DE DETERMINAÇÃO ③ – R ² Uma forma de medir o grau de associação dos pares de valores referentes a duas variáveis de um mesmo experimento é calculando o coeficiente de correlação entre as variáveis. Definindo o coeficiente de determinação R² como: R² = Variação explicada/variação total, se demonstra que: O coeficiente de determinação R² é sempre positivo, e pode ser interpretado como a porcentagem (0 a 100%) r 2 do total da soma dos quadrados dos desvios das observações y com relação à média y que podem ser explicados (ou atribuídos) pelo uso de x para prever y na reta de regressão. Se demonstra, também, que o coeficiente de determinação é igual ao quadrado do coeficiente de correlação; e vice versa. Logo para os dados analisados temos que: 77,47% das variáveis Y (receitas com patrocinadores) são explicadas pelas variáveis X1 e x2 (número de torcedores e média de público). 3.2.4. COEFICIENTE DE CORRELAÇÃO ③ – r O coeficiente de correlação é mais indicado para ser usado como medida da força da relação entre as variáveis. Com dito antes o coeficiente de correlação corresponde a raiz do coeficiente de determinação, logo temos: Para os dados analisados temos 88,02% de correlação entre as variáveis. 15 3.2.5. ERROS PADRÕES DOS COEFICIENTES ⑤ O erro padrão do coeficiente b, denominado como Sb indica aproximadamente quão distante o coeficiente b está do coeficiente da população devido à variabilidade amostral. A fórmula usada e a seguinte, com n-2 graus de liberdade2: Da fórmula pode-se deduzir que erro padrão do coeficiente b é proporcional ao erro padrão de estimativa Se, diminuindo com o valor do desvio padrão de x e o tamanho da amostra menos 1. Erro Padrão do coeficiente a O erro padrão do coeficiente a, denominado Sa indica aproximadamente quão distante o coeficiente a está do coeficiente da população devido a variabilidade amostral. A fórmula usada é a seguinte, com n-2 graus de liberdade. 3.2.6. TESTE DE HIPÓTESE COM A DISTRIBUIÇÃO F ⑥ A distribuição F é usada para realizar testes de significância da equação da reta de regressão como um todo. A distribuição F testa a hipótese de que nenhum dos coeficientes de regressão tenha significado. A estatística F tem o seguinte significado: F = Variância Explicada/Variância não Explicada 4. APRESENTAÇÃO DOS RESULTADOS O valores dos coeficientes β0, β1 e β2 são respectivamente -9,658(Interseção), 1,247(Variável X1) e 0,002(Variável X2) formando uma equação de ajustamento da reta: Y= - 9,658 + 1,247X1 +0,002X2 Com um erro padrão da estimativa ② igual a 12385 podemos determinar as equações que limitam o nível de explicação e controle da regressão denominado de limite inferior e limite superior: Limite Inferior: Y= -9,658 + 1,247X1 +0,002X2 - 12385 Limite Superior: Y= -9,658 + 1,247X1 +0,002X2 + 12385. A reta de ajustamento e as retas dos limites retratam as equações que podem ser observadas no gráfico de controle abaixo 16 Figura 6 Gráfico da reta de ajustamento e de limites da regressão Figura 7 Gráfico 2 da reta de ajustamento e de limites da regressão O coeficiente de determinação ③ (R-Quadrado), cujo o resultado foi de 0,7747, significa que cerca de 77,47% das receitas com patrocinadores (os pontos dentro de intervalo de controle) são explicadas pelo número de torcedores e média de público e que cerca de 32,53% do 17 das receitas com patrocinadores (os pontos fora do intervalo de controle) não são explicadas pelo número de torcedores e médica de público. O Coeficiente de correlação ④ (R múltiplo) de resultado 0,880 indica que existe um grande relacionamento (correlação) entre a receita com patrocinadores e o número de torcedores e média de público. O erro padrão② auferiu o resultado de 12385. Os erros foram bons, pois são percentualmente pequenos em relação aos resultados dos próprios coeficientes. O nível de significância obtido⑥ (F Significação) igual a 0,0000015 é menor que o nível de significância escolhido de 0,05 (1-0,95), logo deve-se aceitar a regressão que investiga o comportamento das receitas com patrocínios em função do número de torcedores e média de público. 4.1. ESTIMATIVA DE RECEITA COM PATROCINADORES PARA O E.C. SÃO BENTO Utilizando-se da reta de regressão obtida (ÿ = -9,658 + 1,247X1 +0,002X2) podemos estimar a receita com patrocinadores para o Esporte Clube São Bento caso ele venha a ter acesso a primeira divisão. Para tal utilizaremos como variáveis o número de torcedores igual a 180.000(X1) e estimar uma média de público ótima que seja igual a lotação máxima do estádio utilizado em seus jogos o Estádio Walter Ribeiro (CIC) com capacidade para 13722 torcedores. Assim temos que o valor estimado da receita com patrocinadores (ÿ) é igual -9,658 + 1,247x180000 + 0,002x13722. Desta forma obtemos o valor estimado de 12,24 milhões de Reais. 5. CONSIDERAÇÕES FINAIS Na realização deste estudo chega-se à conclusão de que o uso de Métodos Quantitativos sempre foi levado em consideração na resolução de problemas administrativos na organizações, porém de maneira limitada, devido a diversos fatores, dos quais destacamos a grande dificuldade de operacionalização de modelos matemáticos, embora se tenta superar essa falha com o enfoque da utilização da tecnologia, através, principalmente de software e uso do recurso computacional e meios eletrônicos. Ficou evidente que com a globalização, as entidades mais versáteis em satisfazer os seus clientes estarão com um diferencial competitivo em relação 18 aos seus concorrentes e assim garantindo sua missão e continuidade no mercado. De acordo com autores, ficou também evidente, que a utilização desses métodos não apresentam soluções ótimas para todos os problemas, mas devem ser encarados como um instrumento que poderá assistir, se bem estruturado, as estimativas numa visão sistêmica, e assim contribuir com informações que alimenta o processo decisório. Destacamos neste trabalho a utilização do método de Regressão Linear, instrumento importante utilizado na resolução de problemas, e apresentamos um exemplo prático, pelo qual evidenciamos a importância de seu uso como fonte de recurso que alimenta o sistema de decisão. Enfocamos, o uso do recurso computacional e a utilização do aplicativo “Regressão” do EXCEL como ferramenta auxiliar nesse processo de geração da informação. 6. BIBLIOGRAFIA CONSULTADA MOREIRA, Monica FabianaBento. Modelos de regressão linear – Slides em sala de aula. LAPPONI, Juan Carlos. Estatística usando o Excel versões 4 e 5. São Paulo: Lapponi Treinamento e Editora Ltda., 1995. SOMOGGI, Amir. Finanças dos clubes brasileiros – disponível em: https://pt.slideshare.net/AmirSomoggi/finanas-dos-clubes-brasileiros-em-2016-maio-de-2017- amir-somoggi ITAÚ BBA. Análise Econômico Financeira dos Clubes de Futebol Brasileiros | 2017 – disponível em: https://www.itau.com.br/_arquivosestaticos/itauBBA/contents/common/docs/Analise_dos_Clube s_Brasileiros_de_Futebol_Itau_BBA_2017.pdf GLOBO. O público nos estádios do Brasil – disponível em: http://app.globoesporte.globo.com/futebol/publico-no-brasil/ 19 LANCE IBOPE. Última pesquisa lance ibope maiores torcidas do Brasil - disponível em: http://www.lance.com.br/futebol-nacional/flamengo-segue-com-maior-torcida-mas- vantagem-para-timao-cai.html