Formação

Help Desk

Como compartilhar documentos sensíveis, minerar o Twitter e monitorar alterações em sites

Como compartilhar documentos sensíveis, minerar o Twitter e monitorar alterações em sites

Publicado originalmente em inglês por Alastair Otter no site do GIJN. Traduzido por Breno Costa, do GIJN Português

Quando se trata de gerenciamento de documentos, uma das minhas ferramentas favoritas é o DocumentCloud. Alguns dos excelentes recursos do DocumentCloud incluem sua capacidade de criar versões em texto de PDFs e gerar estatísticas a partir dos arquivos que você sobe no sistema. Mas e se você precisar analisar milhares ou até centenas de milhares de documentos? Então, provavelmente você vai querer dar uma olhada no Overview, uma ferramenta de mineração de documentos construída tendo jornalistas investigativos em mente.

O Overview pode importar documentos de diversas fontes, incluindo o DocumentCloud, e pode manipular desde algumas dezenas de páginas até milhões de páginas. O Overview pode gerar visualizações dos dados dos documentos de várias formas diferentes, desde nuvens de palavras a gráficos de rede (aqueles com pontos interconectados). Ele também tem uma variedade de ferramentas de busca que simplificam a busca por informações específicas. Uma das melhores características do sistema é que é possível agrupar automaticamente seus documentos em pastas com base no conteúdo deles. E, como o DocumentCloud, ele possui reconhecimento óptico de caracteres (OCR) integrado para que você possa visualizar seus documentos no formato original ou em texto simples. Adicione a isso a capacidade de adicionar tags e notas e, de repente, analisar milhares de documentos não parece tão assustador.

Quem tuitou isso?
O Twitter pode ser uma ótima fonte de dados para os jornalistas, mas minerar conversas no Twitter é bem difícil, a menos que você saiba se virar com programação e como usar a API do Twitter. Uma das minhas descobertas recentes favoritas, no entanto, facilita muito esse trabalho. O Treeverse é uma extensão do Chrome que torna a localização de todos os participantes de uma thread no Twitter algo tão fácil quanto clicar em um tweet.

O Treeverse pode ser baixado na Chrome App Store. Depois de instalar a extensão, abra o Twitter, encontre uma thread ativa e abra o tweet original. Com o tweet aberto, clique no ícone da extensão do Treeverse e será exibida uma visão em árvore de todos os participantes da conversa. Ao clicar em um participante, os tweets dele serão carregados na barra lateral para você junto com os tweets anteriores que culminaram no dele. As threads também ganham cores, baseadas na data em que os tweets foram postados, o que cria uma experiência visual agradável.

Minerando dados do Twitter
Enquanto estamos no Twitter, uma das melhores ferramentas para minerar informações sobre usuários do Twitter é o FollowerWonk. O sistema tem uma ampla gama de ferramentas para analisar usuários da plataforma. Você pode comparar, por exemplo, os perfis de vários usuários do Twitter e ver a atividade deles na rede, os usuários em comum que eles seguem ou têm como seguidores. Um dos recursos mais úteis do FollowerWonk é a opção de encontrar usuários pesquisando por suas bios no Twitter. Isso é ótimo para encontrar usuários em setores ou especialidades específicos.

Sem lágrimas
Em algum momento, na maioria dos projetos de investigação, você vai precisar compartilhar documentos, seja com colaboradores ou com fontes. É claro que existem dezenas de serviços online que podem ser usados para isso, como o Dropbox e o Google Drive, e o e-mail também é bom em muitos casos. Mas e se o documento for confidencial e você não quiser correr o risco de ser interceptado? Ou se você precisa compartilhar o documento anonimamente? Uma das ferramentas mais fáceis de usar em casos assim é o OnionShare.

O OnionShare é um software de código aberto e roda na maioria dos sistemas operacionais, incluindo Windows, Mac OS e Linux. Uma vez instalado o software, o usuário pode arrastar e soltar arquivos no OnionShare. Quando ele começar a compartilhar os arquivos, o OnionShare irá configurar um servidor seguro no navegador Tor e irá gerar uma URL. O destinatário então abre essa URL usando o Tor, seguro e anônimo, para fazer o download dos arquivos.

Por padrão, o OnionShare encerrará a conexão assim que os arquivos forem baixados, de forma que eles não fiquem dando bobeira para que outros os encontrem.

Um passo além
Se você precisar de algo mais permanente do que o OnionShare, será necessário configurar uma rede privada (VPN). As VPNs são úteis para proteger a comunicação dentro de uma organização, mas têm fama de serem custosas ou difíceis de configurar. A ferramenta Outline, no entanto, não nem uma coisa nem outra.

Criado pela Jigsaw, o Outline simplifica a configuração de uma VPN usando serviços como a DigitalOcean, que custam apenas alguns dólares por mês. O Outline inclui uma ferramenta de gerenciamento para configurar quantas VPNs você quiser, bem como um sistema que é usado para acessar sua VPN recém-configurada.

Sempre vigilante
Há muito boas razões pelas quais você pode querer monitorar um site em busca de alterações em páginas. Talvez você precise ver as edições feitas em uma página de perfil, numa lista, uma página com regras ou em um site de uma empresa. Em vez de abrir o site todas as manhãs para procurar modificações, simplifique sua vida com uma ferramenta de monitoramento. Há um bom número de ferramentas de monitoramento de sites disponíveis e eu particularmente gosto do Versionista e do VisualPing. Ambos são bem simples de usar: adicione uma URL e seu endereço de e-mail e esses sistemas lhe enviarão um alerta sempre que detectarem uma alteração no site escolhido. Ambos os serviços também armazenam versões do site que você está monitorando para que você possa ver a evolução da página ao longo do tempo. Ambos os serviços oferecem um serviço básico gratuito, bem como serviços mais avançados por uma taxa.

Alastair Otter é coordenador de TI do GIJN. Ele também é sócio do Media Hack Collective, uma iniciativa de jornalismo de dados com sede em Joanesburgo, onde ele programa visualizações de dados interativos e gerencia vários sites de mídia online.

Ilustração: Jonathan Gray/Open Knowledge Foundation

Assinatura Abraji