Abraji lança maior ferramenta do Brasil para encontrar ações judiciais citando políticos
  • 10.09
  • 2018
  • 10:00
  • Abraji

Acesso à Informação

Abraji lança maior ferramenta do Brasil para encontrar ações judiciais citando políticos

A Associação Brasileira de Jornalismo Investigativo (Abraji) lança nesta segunda-feira (10.set.2018) o projeto Publique-se, uma plataforma de busca que reúne documentos de mais de 30 mil processos judiciais cujos textos citam mais de 9 mil políticos brasileiros. Nenhuma outra ferramenta no Brasil até hoje identificou e reuniu tantos processos citando candidatos a cargos públicos.

A ideia é facilitar o acesso a provas, relatórios, comprovantes e documentos anexados a esses processos para ajudar repórteres em investigações jornalísticas sobre candidatos a cargos públicos. A ferramenta é gratuita e pode ser acessada no endereço publique-se.org.br.

Nesta primeira etapa, o projeto baixou dados de centenas de milhares de ações no Supremo Tribunal Federal (STF) e no Superior Tribunal de Justiça (STJ). Casos notórios de outros tribunais envolvendo grandes investigações sobre o poder público serão acrescentados numa segunda etapa.

“Houve um imenso esforço de captura e tratamento de dados para possibilitar a busca dentro desses documentos. O que você vai achar ali não são apenas processos que têm determinado político como réu ou investigado, mas todas as referências àquele político dentro de documentos em diferentes processos – mesmo que ele não seja parte naquele processo. Certamente há muita pauta escondida ali”, diz Tiago Mali, coordenador do projeto.

Ser citado em uma ação judicial não significa que o político tenha necessariamente participado de esquema de corrupção ou que tenha tido conduta reprovável. A transparência com relação a essas informações, no entanto, é passo importante para uma fiscalização mais ativa das instituições e dos agentes públicos por parte dos jornalistas. Fizemos uma lista de boas práticas para utilizar os dados do Publique-se.

Idealizado pela Abraji, o projeto contou com parceria da Associação Brasileira de Jurimetria (ABJ) na captura e tratamento dos dados e conta com o patrocínio do Instituto Betty e Jacob Lafer.

Como funciona 
A base de documentos da primeira etapa do projeto foi criada a partir de downloads automatizados dos bancos de dados de processos eletrônicos do STF e do STJ. Os arquivos baixados passaram por uma ferramenta de reconhecimento de caracteres (OCR) para que seja possível pesquisar o texto dentro deles – muitos dos PDFs são imagens cujo texto não é pesquisável.

Após a extração de texto, o projeto identificou dentro das milhões de páginas de documentos aquelas que mencionam o CPF de cidadãos que se candidataram a qualquer eleição brasileira a partir de 2006 – são mais de 1 milhão de CPFs diferentes. Foram mantidos na ferramenta apenas os processos que citam dentro do seu texto o CPF de algum político.

A partir desta base, que no momento do lançamento reúne documentos de mais de 30 mil processos, é possível buscar diretamente por nomes de políticos ou fazer uma “busca livre” por termos de interesse que estejam presentes nos documentos de processos que citam políticos.

A primeira rodada de download em massa dos documentos foi feita entre os meses de fevereiro e março deste ano, reunindo todos os processos eletrônicos de diferentes anos presentes nas páginas do Judiciário. Uma segunda rodada, que acrescentará os processos iniciados após esse download, está em andamento e deve ser incorporada à ferramenta antes do primeiro turno das eleições.

Assinatura Abraji