Buscar

N1 Midias Sociais

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Leitura de dados do Twitter, usando linguagem R
Introdução
As redes sociais mudaram a forma com que as pessoas se comunicam   e aprendem, é uma constante evolução, crescimento diário de conteúdo. Hoje até alguns recém-nascidos já possuem uma conta em mídia social (F. FILHO, 2019). 
São nítidas a evolução e a rapidez das publicações das informações. Hoje uma empresa que não lê seus dados é confirmar muito no conhecimento profissional, sem ter algo valido para tomar uma decisão.
De acordo com pesquisa de mercado da Nielsen, divulgada em janeiro de 2015 (ROCHA, 2015), ou seja, 6 anos atrás, a propaganda na web apresentou crescimento de 32,4% em 2015, no mundo todo.
Uma análise em rede social não é somente a leitura de um registro e sentir como a sua empresa está sendo vista pelos olhos dos consumidores e concorrentes.
A mineração de dados é de extrema importância, porém sem uma manutenção nesse processo, será um trabalho com data final, diferente do negócio que não tem previsão para finalizar ou se manter da mesma forma.
Conectando ao Twitter
Para poder acessar as informações do Twitter se faz necessários através de API (WIKIPÉDIA, 2021), é necessário que o usuário crie um aplicativo para que se possa obter quatro dados para autenticação: Consumer Key, Consumer Secret, Access Token e Access Secret no próprio site do Twitter (WIKIR, 2018).
Configuração de conexão
Com as informações de acessos validadas e em mãos, é necessário instalar o pacote TwitterR no computador que irá fazer a extração dos dados (CINELI, 2021)
Figura 1. Exemplo de conexão com o tiwtter no aplicativo rstudio
R é uma linguagem de programação multi-paradigma orientada a objetos, programação funcional, dinâmica, voltada à manipulação, análise e visualização de dados. Atualmente é mantido por uma comunidade de colaboradores voluntários que contribuem com código fonte da linguagem e com a expansão de funcionalidades por bibliotecas (WIKIPÉDIA, 2021) 
Para uma maior facilidade, é necessário a instalação do aplicativo RStudio (RSTUDIO, 2021), pois é nele que será codificado as instruções para ler dados do Twitter.
No caso a busca será feita por palavras chaves, assim será possível filtrar o que está sendo comentado. Os parâmetros usados nessa pesquisa são: #BancoACME e #ACME.
Extraindo dados
Uma vez extraído os comentários baseados nos parâmetros informados na extração, é possível armazenar os parâmetros de acesso a API do Twitter e recuperar os tweets  (TWITTER, 2021), armazenando-os em uma estrutura de fácil leitura dos dados, conhecida como dataframe
Depois disso, esses posts são colocados em uma estrutura de dados conhecida como dataframe. Pode-se observar um exemplo desses dados na figura a seguir:
Figura 2. Retorno de dados do Twitter (dataframe)
Limpeza de dados
Agora nós já temos os dados que foram capturados de acordo com a parametrização. Porém, para realizar a contagem dos termos que mais aparecem, será necessário um processo de limpeza do texto, deixando somente o que é realmente importante para o resultado final (ZHAO, 2011).
Nos comentários algumas palavras possuem acento, como exemplo poupança. Porém em outros tweets a palavra poupança está sem o caractere “ç”, sendo que se trata do mesmo assunto. Para que isso não ocasione um erro na contagem, é preciso remover os acentos e caracteres especiais, para que todas os comentários sejam computados de forma correta.
Para finalizar as transformações no texto, iremos remover caracteres que não irão ser importantes para nossa análise, como pontuação, números, palavras muito comuns ou funcionais na linguagem (que chamamos de stopwords (MARCEL, 2009)), além de caracteres de uso comum no Twitter.
Apresentação dos resultados
Finalizados as transformações, se faz necessário a criação do “term-document matrix”, que é uma matriz utilizada para contar a quantidade de vezes que um termo aparece em cada documento.
Também se faz necessário, a partir dos termos classificar o que é sentimento bom ou ruim, ou seja, o que pode ajudar ou atrapalhar a reputação de uma empresa e ou serviço. Essa tabela será um repositório de dados em constante modificação, pois a qualquer momento poderá surgir um termo novo e o mesmo deverá ser classificado.
Com esses dados, montaremos um dashboard (NASCIMENTO, 2017) principal e um operacional. O dashboard principal irá apresentar um conjunto de gráficos que ajuda o usuário a ter uma visão mais gerencial do que está analisando. 
Já o dashboard operacional, ajudará o usuário final a entender os dados apresentados no dashboard principal, ou seja, será possível filtrar comentário, períodos, usuários, localidade desses usuários, palavras que representam sentimentos bons ou ruins e qualquer informação disponível para analise.
Figura 3. Protótipo de dashboard principal usando a linguagem QlikSense
Figura 4. Protótipo de dashboard operacional usando a linguagem QlikSense
Referências Bibliográficas
1. ROCHA, Mattheus. Importância das redes sociais em estratégias de marketing digital. 2015. Disponível em: https://www.academiadomarketing.com.br/importancia-das-redes-sociais-em-estrategias-de-marketing-digital/ . Acesso em: 08 jan. 2021.
2. F. FILHO, Eduardo. Recém-nascidos de celebridades promovem produtos em mídias sociais e movimentam um mercado cada vez mais lucrativo. 2019. Disponível em: https://istoe.com.br/bebe-s-a/ . Acesso em: 08 jan. 2021.
3. WIKIPÉDIA. Interface de programação de aplicações. Disponível em: https://pt.wikipedia.org/wiki/Interface_de_programa%C3%A7%C3%A3o_de_aplica%C3%A7%C3%B5es . Acesso em: 07 jan. 2021.
4. WIKIR. Como ler dados do Twitter. 2018. Disponível em: https://www.ufrgs.br/wiki-r/index.php?title=Como_ler_dados_do_Twitter . Acesso em: 06 jan. 2021.
5. CINELI, Carlos. Capturando dados do Twitter com R. Disponível em: https://www.ibpad.com.br/blog/comunicacao-digital/capturando-dados-do-twitter-com-r/ . Acesso em: 07 jan. 2021.
6. WIKIPÉDIA. R (linguagem de programação). Disponível em: https://pt.wikipedia.org/wiki/R_(linguagem_de_programa%C3%A7%C3%A3o) Acesso em: 08 jan. 2021.
7. RSTUDIO. RStudio. 2021. Disponível em: https://docs.rstudio.com/evaluation/ . Acesso em: 08 jan. 2021.
8. MARCEL, Frank. STOP WORDS – COMO FUNCIONAM PALAVRAS DE PARADA? 2009. Disponível em: https://www.agenciamestre.com/seo/stop-words-como-funcionam-palavras-de-parada/ . Acesso em: 07 jan. 2021.
9. ZHAO, Yanchang. Text Mining. 2011. Disponível em: http://www.rdatamining.com/examples/text-mining . Acesso em: 08 jan. 2021.
10. WIKIPÉDIA. Document-term matrix. Disponível em: https://en.wikipedia.org/wiki/Document-term_matrix . Acesso em: 07 jan. 2021.
11. NASCIMENTO, Rodrigo. O que é dashboard? 2017. Disponível em: http://marketingpordados.com/analise-de-dados/o-que-e-dashboard-%F0%9F%93%8A/ . Acesso em: 08 jan. 2021.
12. TWITTER. Sobre diferentes tipos de Tweets. Disponível em: https://help.twitter.com/pt/using-twitter/types-of-tweets . Acesso em: 08 jan. 2021.

Continue navegando