Acesso à Informação
projetos
Pinpoint
O que é o Pinpoint?
Projeto desenvolvido pelo Google, o Pinpoint é uma ferramenta de pesquisa e análise de PDFs, imagens com texto, documentos escritos à mão e até áudios em diversos idiomas, inclusive português. Desde agosto de 2021, a Abraji é curadora do projeto no Brasil e já disponibilizou 50 coleções na plataforma, que somam mais de meio milhão de arquivos de interesse público.
As duas primeiras coleções criadas a partir dessa parceria trazem documentos da CPI da Pandemia e do inquérito 4.828, que investiga manifestações antidemocráticas. Além de facilitar o acesso a essas informações, a ideia é também permitir que os jornalistas possam usar todas as funcionalidades da ferramenta.
Recursos do Pinpoint
Na tela do Pinpoint, é possível filtrar os documentos em um menu, ao lado direito, por nomes de pessoas, empresas e instituições, além de localizações geográficas (cidades, UFs, nomes de rodovias, CEPs etc.). Também é possível combinar esses filtros. Depois, ao clicar no documento, o programa abre o arquivo com a informação filtrada em destaque.
Operadores de busca avançados, como uso de aspas, AND e OR em letras maiúsculas, símbolo de menos, também funcionam na ferramenta.
O Pinpoint utiliza o mesmo motor de inteligência artificial da busca do Google para identificar automaticamente nomes de pessoas, locais e empresas mencionadas nos documentos e nos áudios, o que facilita a apuração de reportagens. A tecnologia utilizada se chama OCR (um acrônimo em inglês para Reconhecimento Ótico de Caracteres), que permite a pesquisa por palavras-chave em diferentes formatos de documentos.
É possível pesquisar informações em documentos em arquivos:
- PDF (incluindo digitalizações, texto e imagens em formato PDF)
- Áudio (.MP3, .MP4, .M4A, .WAV, .FLAC, .WMA, .AAC, .RA, .RAM, .AIF, .AIFF, .OGG)
- Vídeo (áudio extraído e transcrito, vídeo não armazenado). Formatos: .MP4, .MPEG, .MOV, .WMV, .AVI, .3GPP, .WEBM, .MP2T, .FLV, .OGV, .MKV, .M4V.
- E-mails (.EML) e arquivos de e-mails (.MBOX)
- Imagens (.JPEG, .PNG, .GIF, .BMP, .TIFF)
- Texto (.TXT, .RTF)
- Texto estruturado (.CSV, .XML, .TSV)
- Word (.DOC, .DOCX)
- Excel (.XLS, .XLSX)
- PowerPoint (.PPT, .PPTX)
- Páginas da web (.HTML)
- Documentos Google (Google Docs e Google Slides)
Bases já disponibilizadas pela Abraji
Desde a ativação do Pinpoint, a Abraji já disponibilizou importantes coleções de documentos, com destaque para materiais que fornecem dados mais específicos sobre eleições, informações sobre candidatos, pandemia de covid-19, dados do Ministério da Saúde, atos antidemocráticos e defesa da democracia.
A CPI da Pandemia, instaurada em abril de 2021, contou com uma coleção com mais de 2.900 arquivos únicos no Pinpoint da Abraji. Outro importante destaque foram as coleções de documentos sobre a Ditadura Militar no Brasil, disponibilizados em março de 2022. Em parceria com o projeto Brasil: Nunca Mais Digit@l (BNM Digit@l), a Abraji trouxe para o Pinpoint uma coleção com os 710 processos do Superior Tribunal Militar, documentos integrantes do acervo “Brasil: Nunca Mais”.
Em junho do mesmo ano, foram adicionadas duas coleções com 10.884 documentos de jurisprudências do Supremo Tribunal Militar (STM) e 1.589 boletins do Exército. Os documentos do STM no Pinpoint permitiram a consulta da jurisprudência do órgão de janeiro de 2010 a julho de 2022, adquiridos em site do STM.
Durante as eleições de 2022, foram disponibilizados dados como certidões criminais de candidatos e prestações de contas eleitorais e transcrições de propagandas de Lula e Bolsonaro. A ferramenta também foi fundamental na concentração de documentos e informações a respeito dos atos antidemocráticos de 8 de janeiro de 2023, em Brasília. Foram 2.308 arquivos de contratos firmados pelo Senado e 14 documentos relacionados à realização e ao financiamento de atos antidemocráticos no segundo semestre de 2022, além de documentos de candidatos que foram presos na ocasião.
O Pinpoint da Abraji incluiu também 9.145 arquivos com as decisões da Controladoria-Geral da União (CGU) sobre pedidos de Lei de Acesso à Informação (LAI), fundamental para a manutenção da transparência pública e acesso à informação, um dos pilares da associação.
Avaliação de mérito e importância da checagem
A Abraji esclarece que não há nenhuma avaliação de mérito nas informações contidas nas coleções que disponibiliza. As informações são de assuntos de interesse público e jornalístico e são apenas o ponto de partida de uma investigação jornalística. Indícios de condutas ilícitas devem ser verificados com outras fontes e mais dados. Além disso, o fato de qualquer pessoa ser investigada não significa que ela é culpada.
Todos os dados devem ser checados, inclusive com políticos e empresas citadas. Sempre deve-se ter cuidado com pessoas e empresas homônimas. A Abraji não se responsabiliza pelos defeitos ou vícios que possam existir nas fontes de dados públicas usadas para criar as coleções no Pinpoint.
Como creditar as coleções da Abraji dentro do Pinpoint
As informações disponibilizadas no Pinpoint pela Abraji são públicas, mas o trabalho de curadoria, seleção, diferentes tipos de download (manual, pedidos de LAI, webscraping, OSINT), descrição e pesquisa é feito pela associação. Por isso, dar o crédito é importante para a manutenção do trabalho e monitoramento do impacto que a equipe da Abraji realiza. Caso você ou a sua organização use as informações disponibilizadas, favor indicar que a informação foi “obtida em uma coleção pública da Abraji sobre o tema, dentro do Pinpoint do Google”, de preferência com o link para a análise de referência.
Dúvidas e sugestões sobre o projeto escreva para: [email protected].