Buscar

Monitoramento e investigação_ Trabalhando com buscadores _ Texto

Prévia do material em texto

28/07/2021 Monitoramento e investigação: Trabalhando com buscadores | Texto
https://cursos.abraji.org.br/mod/page/view.php?id=4989 1/7
Página inicial / Meus cursos / Monitoramento e investigação / Semana 2 | 12 a 18 de julho / Trabalhando com buscadores | Texto
Monitoramento e investigação de conteúdos digitais
Trabalhando com buscadores | Texto
Feito: Ver
 Sumário
1. Introdução
2. Estratégias
3. Ferramentas
1. Google
2. Buscas avançadas
3. Google em redes sociais
4. Twitter
4. Materiais e recursos
5. Instrutor
Introdução
Com praticamente toda a informação do mundo na internet, acabamos não tendo como escapar: toda investigação jornalística vai
começar por uma busca online.
Boas buscas podem nos ajudar a seguir alguns princípios que usamos muito na verificação de fatos: se estamos diante de um conteúdo
original; quem criou ou publicou por primeiro o conteúdo; quando foi criado; onde foi criado; por que o conteúdo foi criado.
Os buscadores são os nossos maiores amigos nesses momentos, e seu poder vai além das palavras-chave que costumamos usar. Com a
ajuda de símbolos e outros comandos, que chamamos de operadores, podemos refinar buscas para recebermos resultados mais próximos
do que queremos.
O campo de busca de sites como o Google funciona como uma linha de comando. E nós somos os programadores, mesmo se não tivermos
noções avançadas de programação.
Estratégias
Como estamos interagindo com uma máquina, precisamos abordá-la da forma adequada. Afinal, ela precisa entender o que queremos.
Para isso, nós precisamos ter ideia do contexto da nossa busca.
Um exemplo: se queremos saber quando seremos vacinados em São Paulo e buscarmos simplesmente por "vacinação em São Paulo", os
resultados podem ser bem amplos: tratar de vários tipos de vacinação tanto na cidade como no estado de São Paulo.
O resultado que queremos vai estar ali, mas talvez não nas primeiras colocações.
Para não perdermos tempo vasculhando as páginas de resultados, o ideal é já partirmos diretamente para o que queremos. Por exemplo:
vacinação covid são paulo capital 39 anos
Assim, o buscador já deve retornar um resultado bem mais limpo e, provavelmente, com a informação na primeira tela.
As palavras-chave que escolhemos são essenciais para isso. Antes de pesquisar um assunto, vale imaginar uma "nuvem" de palavras que
podem nos trazer resultados desejados.
Caso nossa pesquisa seja sobre assuntos relacionados à pandemia, podemos partir de algumas:
pandemia
https://cursos.abraji.org.br/
https://cursos.abraji.org.br/course/view.php?id=89
https://cursos.abraji.org.br/mod/page/view.php?id=4989
28/07/2021 Monitoramento e investigação: Trabalhando com buscadores | Texto
https://cursos.abraji.org.br/mod/page/view.php?id=4989 2/7
coronavirus
covid 19
covid19
caronavirus
lockdown
quarentena
confinamento
vacina
pfizer
pfaizer
pifaizer
coronavac
astrazeneca
astra zeneca
tratamento precoce
atendimento precoce
cloroquina
hidroxicloroquina
ivermectina
invermectina
vitamina d
azitromicina
mascara pff2
Buscadores com inteligência artificial mais avançada podem "deduzir" melhor nossas intenções e retornar termos semelhantes, sinônimos
ou corrigir erros de digitação. Mas nem todos fazem essa função. Às vezes também podemos querer ter mais controle sobre o que será
interpretado. Por isso, pode ser válido tentar imaginar várias "versões", mesmo que erradas, de alguns termos.
Um bom aliado para essas horas é o Google Trends. O site reúne tendências de busca, interesses, aponta assuntos relacionados e uma boa
quantidade de estatísticas. Qualquer assunto pode ser pesquisado ali. A seção sobre coronavírus é bastante interessante e pode trazer
boas ideias.
Buscas com viés?
Ideologia afeta a linguagem que as pessoas utilizam. A nossa própria escolha de palavras também pode nos trazer universos bastante
diferentes de resultados. Devemos sempre levar isso em conta na hora de buscar.
Um exemplo: se queremos buscar repercussões sobre a coronavac em sites de extrema-direita, talvez seja importante incluirmos termos
que esses grupos costumam utilizar, como "vacina chinesa".
Ferramentas
1. Google e outros
Não importa onde você quer buscar algum conteúdo: em quase todos os casos, o Google será a primeira opção. Buscadores como o Bing,
da Microsoft, ou o Duck Duck Go, podem ser alternativas interessantes, mas dificilmente retornarão resultados muito diferentes. Por isso,
o campo de busca a ser dominado prioritariamente é mesmo o Google.
Antes de tudo, valem algumas dicas:
tente buscar sem estar logado com sua conta pessoal ou principal no Google. Crie uma conta alternativa para o trabalho ou busque no
modo anônimo do navegador. Como os resultados são, de alguma forma, personalizados, podem acontecer pequenas confusões ou até
omissões, caso haja algum filtro ativado (como o Safesearch).
https://trends.google.com.br/trends/
https://trends.google.com/trends/story/US_cu_4Rjdh3ABAABMHM_en_pt-BR
https://www.google.com/
http://www.bing.com/
https://duckduckgo.com/
28/07/2021 Monitoramento e investigação: Trabalhando com buscadores | Texto
https://cursos.abraji.org.br/mod/page/view.php?id=4989 3/7
a dica anterior também é importante por questões de privacidade. O Google é um "colecionador" de dados — ou seja, vai armazenar
cada ação que você fizer no buscador. Se você costuma usar computador compartilhado, perder o celular ou coisa parecida, todo o seu
histórico vai estar lá.
se as buscas envolvem algum tema muito sensível, considere a opção de usar uma VPN e um navegador com mais proteção à
privacidade, como o Tor.
2. Buscas avançadas
O próprio Google ensina a fazer buscas avançadas e também tem uma página com os campos prontos para quem não decorou os
operadores. Mas vamos nos concentrar nas mais importantes no processo de verificação:
Aspas
A primeira opção é colocar palavras exatas entre aspas: "remedio milagroso para covid" (não se preocupe com acentos). É bem útil para
encontrar cópias de algum conteúdo de desinformação que esteja circulando. Uma dica é copiar parte do conteúdo a ser verificado – de
preferência algum trecho peculiar --, colar no campo de busca e inserir as aspas.
Operadores Booleanos: OR e AND
Para expandirmos as nossas buscas, ou seja, recebermos resultados para mais de um termo, digite 'OR', em maiúsculas, entre todas as
palavras ou expressões que você procura: cloroquina OR ivermectina OR azitromicina, ou tratamento OR atendimento precoce – assim o
resultado inclui todos os sites que mencionam 'precoce' junto com 'tratamento' ou 'atendimento' –, ou "tratamento precoce" OR
"atendimento precoce".
Se dois termos estão separados por um espaço, a maioria dos buscadores já "deduz" que estamos buscando por ambos. Mas o termo AND
pode reforçar isso para o buscador. Se buscamos por (cloroquina AND ivermectina AND azitromicina), o resultado só vai mostrar as
páginas que publicaram os três termos, e excluir as que só têm um ou dois deles.
Para retirar sites com determinadas palavras e "despoluir" a busca, coloque um sinal de menos antes das palavras que você não quer no
resultado: vacinacao gripe -covid. Alguns sites de busca usam a expressão NOT.
Coringa
Também pode ser interessante trocar alguns termos por um asterisco. Um exemplo: "variante * do coronavírus" pode retornar sites com a
expressão "variante DELTA do coronavírus", "variante BRASILEIRA do coronavírus", "variante P1 do coronavírus", entre outros.
Fórmula
Algumas variáveis também podem ser agrupadas entre parênteses, como uma fórmula matemática: (astrazeneca OR pfizer) AND (efeito
OR reacao).
Ou, em um exemplo um pouco mais complexo:
(astrazeneca OR "astra zeneca" OR pfizer OR pfaizer OR pifaizer OR coronavac OR "vacina chinesa") AND (efeito OR reacao OR trombose)
Intervalos numéricos
Colocando dois pontos finais entre os números e uma unidade de medida em seguida, é possível buscar entre intervalos numéricos: covid
casos 50000..100000, prejuízo $3000000..$5000000, desmatamento 2010..2019.
Busca no tempo
A filtragem por datatambém pode ser bem útil. A maioria dos buscadores pode exibir resultados exclusivos de publicações feitas dentro
de um intervalo de datas.
Essa opção é muito útil para excluirmos publicações recentes ou muito antigas, que possam estar poluindo nossa busca.
https://support.google.com/websearch/answer/2466433?hl=pt-BR
https://www.google.com/advanced_search
28/07/2021 Monitoramento e investigação: Trabalhando com buscadores | Texto
https://cursos.abraji.org.br/mod/page/view.php?id=4989 4/7
Assim também podemos encontrar publicações de uma época determinada. Vale lembrar que podem acontecer falhas nesses resultados
(como, por exemplo, quando uma página antiga é atualizada).
Nesse caso, no Google, não usamos o campo de busca: na opção "Ferramentas" que aparece logo acima do resultado de uma busca, há o
menu com o item "Em qualquer data" acionado. Clicando nele, novas opções aparecem, inclusive a "intervalo personalizado": com esta, é
possível restringir a busca a períodos bem específicos.
Dentro de sites
Para pesquisar apenas páginas hospedadas em um site específico, coloque "site:" antes de um site ou domínio. Por exemplo,
site:youtube.com ou site:.gov.br.
Versões arquivadas
Se precisar procurar pela versão de um site armazenada no cache do Google, use "cache:" antes do endereço do site. Esta opção é útil para
buscar por versões anteriores de alguma publicação que pode ter sido alterada. Também é possível acessar essa opção em qualquer
resultado de busca. É só clicar na seta que aparece ao lado de cada url.
Tipos de documento
A opção Filetype também pode ser útil para filtrar publicações. Exemplos: filetype:pdf, filetype:xls, filetype:doc.
In
O termo "intitle:" restringe a busca aos títulos das páginas. Já o termo "intext:" restringe aos corpos de textos. Também é possível usar o
"inurl:" para restringir a busca a palavras que aparecem no endereço das páginas. Caso estejamos buscando por mais de um termo,
podemos adicionar um "all" antes do operador: allintitle, allintext ou allinurl.
Relacionados
28/07/2021 Monitoramento e investigação: Trabalhando com buscadores | Texto
https://cursos.abraji.org.br/mod/page/view.php?id=4989 5/7
O Google também aceita o termo "related:", seguido de uma url. Inserindo "related:www.google.com" podemos ver sites concorrentes do
Google nos resultados.
3. Google em redes sociais
Muitas postagens em redes sociais têm um código identificador único, que normalmente fica no final da URL. É possível copiar esse
código e colar no campo de busca do Google para descobrir onde esse conteúdo pode ter sido compartilhado.
O Google é um ótimo buscador para listas do Twitter, por exemplo. A dica para encontrar listas públicas de outros usuários é escrever na
caixa de busca do Google o seguinte termo: site:twitter.com/*/lists "palavra-chave".
Como já aprendemos antes, esse comando informa ao buscador que queremos delimitar nossa busca ao Twitter [site:twitter.com], que
estamos buscando em todos os perfis do Twitter [/*/], que buscamos por listas [lists], que tenham no nome a referência ao tema que
estamos buscando. Esse tema estará descrito em lugar de "palavra-chave". 
Veja este exemplo: site:twitter.com/*/lists cientistas
Também podemos aplicar operadores em redes como o Instagram. Um exemplo: site:instagram.com médico recomenda cloroquina
4. Twitter
Por ser uma rede social com comunicações mais imediatas, o Twitter é uma boa fonte de buscas em tempo real. No entanto, grandes
eventos (como um desastre ou a morte de alguém famoso, por exemplo) podem gerar resultados poluídos. Para isso, o campo de busca
do site aceita uma série de opções "escondidas" — algumas até mesmo fora da janela de busca avançada (este também tem o acesso
discreto).
Buscar diretamente no site do Twitter pode ser suficiente para a maioria dos casos. Mas a melhor opção é rodar as buscas no TweetDeck,
que é um aplicativo mais avançado para quem usa essa rede social de forma intensa.
Independentemente da ferramenta, os operadores são os mesmos. Para os básicos, vale ganhar tempo digitando no campo de busca
termos como "from:", "since", "until". Já para outras buscas, como a geográfica, o ideal é usar os campos que o Twitter já delimita.
5. LinkedIn
O LinkedIn é um ótimo site para encontrar pessoas (ou fontes, no nosso caso). Podemos buscar nesse site através do Google ou também
internamente, já que ele aceita operadores booleanos e até outros mais complexos. A própria barra de busca já traz vários recursos e
filtros que podem ser usados intuitivamente.
https://www.google.com/search?q=site%3Atwitter.com%2F*%2Flists+cientistas
https://twitter.com/search-advanced
https://tweetdeck.twitter.com/
https://br.linkedin.com/
https://www.linkedin.com/help/linkedin/answer/76721/como-usar-pesquisa-booleana-no-linkedin?lang=pt
https://booleanstrings.com/linkedin-search-operators/
28/07/2021 Monitoramento e investigação: Trabalhando com buscadores | Texto
https://cursos.abraji.org.br/mod/page/view.php?id=4989 6/7
6. Outros
Alguns sites e redes sociais podem não ter conteúdo exibido nas buscas do Google. Assim, sempre vale fazer uma segunda busca em
algumas redes. Exemplos:
Reddit: buscando diretamente no campo de busca ou usando ferramentas de monitoramento do Reddit como o TrackReddit.com.
4chansearch.com: para buscas no 4chan e sites de arquivos do 4chan.
Gab.ai: plataforma semelhante ao Twitter para onde muitos usuários migraram.
Facebook: além do campo de busca nativo da rede social, ferramentas como o Who posted what? podem ser úteis para ir mais a fundo em
alguma investigação.
Canais do Discord, grupos do Facebook e grupos do WhatsApp também valem ser buscados, mas os resultados nem sempre são
favoráveis.
Também podemos investigar a propriedade de um determinado site. Nas páginas brasileiras (final .br), podemos buscar na ferramenta
whois do Registro.br. Veja aqui o resultado para um conhecido site.
Para sites de outros países, existem muitos serviços que ajudam. O viewDNS.info é um dos principais. Ele faz pesquisas básicas de
domínios e endereços IP, mas também inclui pesquisas como endereços IP históricos para um domínio e localizadores de IP.
*** Muitas dessas ferramentas de terceiros costumam perder funções com o tempo ou mesmo serem desativadas. As próprias funções
nativas das redes também podem mudar com frequência e muitas vezes sem aviso. Por isso, vale tentar se manter atualizado ou atualizada
e também construir uma "caixa de ferramentas" particular, de preferência com mais de uma opção para cada função. A First Draft News
mantém uma lista atualizada com várias delas que pode servir muito bem como ponto de partida.
Materiais e recursos
Considere aprofundar o seu treinamento em ferramentas do Google para jornalistas. O curso de verificação traz alguns exercícios bem
didáticos. Para a nossa matéria, recomendo a Aula 2.
Outras fontes de informação:
Refinar pesquisas na Web - Ajuda da Pesquisa do Google
Google Advanced Search Operators: 52 Google Search Commands
Bellingcat's Online Investigation Toolkit
Google Search Operators
First Draft News — Verifying Online Information
First Draft - Basic Toolkit - start.me
First Draft - Advanced Toolkit - start.me
OSINT Framework
Power Searching with Google - Free Online Course
Boolean Strings | By Irina Shamaeva
Sobre o/a instrutor/a
Helio Miguel Filho, jornalista formado pela UFPR com passagens por veículos paranaenses e pela prefeitura de Curitiba, editor de
distribuição do Comprova nas quatro fases do projeto. Posso ser encontrado no Twitter, no LinkedIn e também no heliomsf@gmail.com.
Este curso tem o apoio do
https://www.reddit.com/
http://www.trackreddit.com/
http://4chansearch.com/
http://gab.ai/
https://pt-br.facebook.com/
https://whopostedwhat.com/
https://registro.br/
https://registro.br/tecnologia/ferramentas/whois/?search=www.uol.com.br
https://viewdns.info/
https://firstdraftnews.org/
http://bit.ly/FirstDraftToolkit
https://newsinitiative.withgoogle.com/training/?language=pt-BR
https://newsinitiative.withgoogle.com/training/course/verificationhttps://newsinitiative.withgoogle.com/training/lesson/5817244248440832?course=verification
https://support.google.com/websearch/answer/2466433?hl=pt-BR
https://www.spyfu.com/blog/google-search-operators/
https://docs.google.com/document/d/1BfLPJpRtyq4RFtHJoNpvWQjmGnyVkfE2HYoICKOGguA/edit#
http://www.googleguide.com/advanced_operators_reference.html
https://firstdraftnews.org/wp-content/uploads/2019/10/Verifying_Online_Information_Digital_AW.pdf?x98737
http://bit.ly/FirstDraftToolkit
https://start.me/p/wMv5b7/first-draft-advanced-toolkit
https://osintframework.com/
https://www.codespaces.com/power-searching-with-google.html
https://booleanstrings.com/
https://twitter.com/heliomiguel
https://www.linkedin.com/in/heliomiguel/?locale=pt_BR
mailto:heliomsf@gmail.com
28/07/2021 Monitoramento e investigação: Trabalhando com buscadores | Texto
https://cursos.abraji.org.br/mod/page/view.php?id=4989 7/7
Você acessou como Ellem Kesia Garcia da Silva (Sair)
Redefinir o tour de usuário nessa página
Monitoramento e investigação
Resumo de retenção de dados
Obter o aplicativo para dispositivos móveis
 
Última atualização: Sunday, 11 Jul 2021, 21:55
◄ Trabalhando com buscadores | Vídeo
Seguir para...
Link para rever a sessão online com Bernardo Barbosa ►
https://cursos.abraji.org.br/user/profile.php?id=12290
https://cursos.abraji.org.br/login/logout.php?sesskey=FRCBqmpI09
https://cursos.abraji.org.br/course/view.php?id=89
https://cursos.abraji.org.br/admin/tool/dataprivacy/summary.php
https://download.moodle.org/mobile?version=2021051700.02&lang=pt_br&iosappid=633359593&androidappid=com.moodle.moodlemobile
https://cursos.abraji.org.br/mod/page/view.php?id=4988&forceview=1
https://cursos.abraji.org.br/mod/url/view.php?id=5016&forceview=1

Continue navegando