Um guia do jornalista de dados para construir uma hipótese
  • 01.07
  • 2021
  • 18:10
  • Eva Constantaras e Anastasia Valeeva

Formação

Um guia do jornalista de dados para construir uma hipótese

Texto originalmente publicado pelo DataJournalism.com

Introdução

2020 levou o jornalismo de dados em duas direções drasticamente diferentes. Por um lado, o movimento Black Lives Matter [Vidas Negras Importam] pressionou a comunidade de jornalismo de dados a questionar a equidade em campo: qual é o jornalismo de dados produzido por, para e sobre? Por outro lado, a pandemia ofereceu uma infinidade de oportunidades para demonstrar a propagação do coronavírus através de painéis claros, muitas vezes impessoais, de desespero e morte que quantificaram a escala da pandemia.

As melhores reportagens baseadas em dados uniram estas duas tendências em poderosas investigações sobre as desigualdades generalizadas da pandemia, transformando as estatísticas em exemplos concretos de danos específicos às pessoas, que poderiam ser mitigados se tratados. Uma palavra descreve estas excelentes produções jornalísticas: intencionais.

Os desafios do jornalismo de dados diante da polarização da mídia, da desinformação e da informação enganosa são grandes, pois luta para encontrar seu papel nos esforços de reconstruir um ecossistema de informação saudável para os cidadãos. Como pergunta Lisa Charlotte Rost do Datawrapper em seu blog post Less News, More Context [Menos Notícias, Mais Contexto], "Com quais informações minha audiência pode navegar melhor neste mundo?".

Quase 10 anos lecionando jornalismo de dados nos ensinaram que os jornalistas que produzem as investigações mais poderosas são os que começaram com uma ideia poderosa, uma ideia poderosa formulada como uma hipótese. Este método, Story Based Inquiry [A Investigação a partir de Histórias] iniciado por Mark Lee Hunter, foi adotado por muitos jornalistas de dados e aperfeiçoado ainda mais para projetos de dados, como o Método Markup. Para nós, ele permite que repórteres de todo o mundo explorem e expliquem os fatores de desigualdade que sustentam as notícias da atualidade.

Uma hipótese -- muitas histórias

Depois de rever dezenas de trabalhos sobre o controle do coronavírus quase idênticos, nos deparamos com uma apresentação para o Prêmio Sigma 2020 que sugeria que os jornalistas tinham mergulhado nos dados sabendo o que estavam procurando. O levantamento sobre o número desproporcional de mortes entre negros brasileiros, pela Agência Pública, uma iniciativa de jornalismo investigativo sem fins lucrativos, nos levou a mais histórias publicadas pela Pública sobre disparidades raciais na distribuição de vacinas e acesso a leitos de UTI entre comunidades indígenas.

Print retirado da matéria original da Agência Pública

Embora os dados por trás das histórias estivessem disponíveis para os leitores, o foco era a história, não os dados. Eles construíram um jornalismo de dados temático em torno das disparidades no acesso à saúde, e uma abordagem baseada em hipóteses permitiu que se aprofundem cada vez mais: iniciaram com algo como “brasileiros negros, que já pontuam baixo no índice geral de desenvolvimento, estão morrendo em taxas mais rápidas do que a população em geral” e então se propuseram a ver se a suposição era verdadeira ou não. Relatos relacionados refinaram essa premissa para investigar desigualdades pertinentes à equidade em saúde durante a pandemia. O restante dessa matéria explora como aplicar essa abordagem você mesmo.

Print retirado da matéria original da Agência Pública

Formulando uma hipótese

Vamos ler algumas e formular a hipótese como uma declaração:

Talvez você tenha sugerido algo como "A distribuição de vacinas é desigual" ou um tanto mais específico, como "As vacinas estão mais disponíveis para países de alta renda em geral e, em um nível individual, para as pessoas ricas, não para as pobres".

Ambas estão certas. Contudo, para poder usar uma hipótese como ferramenta para sua própria matéria, a segunda funciona melhor. Ela formula não apenas a ideia, mas também os meios de prová-la. Este método é emprestado das ciências sociais, como muitas técnicas de jornalismo de dados.

Você não precisa mostrar essa hipótese como uma ferramenta para o seu leitor, mas deve apresentar ao seu editor: é basicamente a mensagem-chave do artigo. E como queremos que seja convincente, precisa ser ainda mais específica. Quais são os indicadores exatos que você usará para responder suas perguntas? Qual é a unidade de medida? Em que período ou extensão geográfica estamos olhando e em que nível de granularidade? Isso é chamado de processo de operacionalização.

Vejamos outra para formar sua hipótese como um relatório bem específico sobre os indicadores.

Legenda: Como a pandemia está tirando as mulheres de empregos

Você deve ter percebido que o próprio texto tem tanto uma ideia geral (“o desemprego não é neutro em termos de gênero”) como afirmações mais específicas que a comprovam, como esta: “Os setores mais afetados pela crise pandêmica - restaurantes, varejo, área estética, turismo, educação, trabalho doméstico e trabalho de cuidado para jovens e idosos - têm alto índice de empregos femininos ”.

Vamos escrever os requisitos básicos para uma hipótese viável usando uma suposição como exemplo: "Grupos socioeconomicamente marginalizados têm mais probabilidade de morrer de coronavírus".

  • Pode ser comprovado ou refutado com dados. Por exemplo, "Pessoas pobres têm mais probabilidade de morrer de coronavírus do que pessoas ricas".
  • É específico sobre o que está sendo medido. ‘Cidadãos que vivem em bairros com renda anual mais baixa de acordo com o último censo estão morrendo a uma taxa mais elevada do que aqueles que vivem em bairros mais ricos’.
  • Os dados estão disponíveis. ‘Registros de óbitos por coronavírus e dados de renda estão disponíveis por bairro’.
  • O tópico é importante para o público. ‘A desigualdade no acesso à saúde ressoa universalmente.’

Como evitar armadilhas comuns

Agora, vamos analisar os erros comuns de hipóteses e como podemos evitá-los.

  • Metade ou ambas as metades da hipótese não podem ser comprovadas com dados. Em muitos países, nem dados específicos de geolocalização nem dados de renda com base na geolocalização estão disponíveis. Por exemplo, no caso do Brasil, apenas os dados raciais estavam disponíveis, então a hipótese tinha que se concentrar na raça por área geográfica, não na renda.

Print retirado da matéria original da Agência Pública

  • A hipótese é muito confusa. A ideia para uma história baseada em dados pode, às vezes, partir de uma ideia muito ampla e geral como: "À medida que a pandemia se aprofunda, a maioria dos países da UE fica mais pessimista". Para que funcione (e para que todos se envolvam), você precisa explicar a si mesmo e ao seu público o que quer dizer exatamente, como vai medir e por que isso é importante. Nesta matéria da Reuters, a hipótese pode ter sido algo como “os suecos e suas políticas pandêmicas foram otimistas e abertos e eles escaparam da crise econômica que se espalhou pela Europa”. Observe que o texto caminha sobre uma linha tênue, apresentando várias correlações entre atitude e indicadores econômicos sem fazer uma afirmação causal.
     
  • Não há dados. Muitas ideias para histórias que usam dados acabam cedo porque não há dados para prová-las. Muitas histórias excelentes que empregam dados surgiram de jornalistas sendo engenhosos com os dados que possuíam, fazendo da lacuna desses registros uma reportagem ou criando seus próprios dados. Por exemplo, é assim que jornalistas por todo o mundo, e na Índia e no Quirguistão lidaram com a insuficiente apuração global de mortes por COVID-19 construindo hipóteses em torno de questões da qualidade de dados.
     
  • A hipótese é muito ampla. O tópico é melhor para um livro do que para uma única história. Frequentemente, jornalistas tentam abordar coisas demais em uma única reportagem. Levaria muito tempo para explorar todas as variáveis que podem influenciar o problema geral. Então, por que não focar em um aspecto específico do seu problema e explicá-lo de A a Z? Em vez de ter um painel de dados enorme e ambicioso com muitas informações demográficas, mas sem narrativa, analise e identifique histórias específicas e atraentes que justifiquem ter uma base de dados. Tal como em nosso exemplo de perda de emprego na Índia, o jornalista tem uma hipótese focada na perda de emprego relacionada aos setores onde as mulheres trabalham. Esta reportagem segue uma hipótese conexa, mas distinta: a ocupação com o cuidado durante a pandemia está forçando as mulheres a deixarem o mercado de trabalho.

Ambas revelam percepções específicas sobre as barreiras à recuperação econômica enfrentadas pelas mulheres, sem se perder em generalizações óbvias sobre a desigualdade de gênero.

  • A hipótese é muito restrita: ela apenas mede como um fator influencia uma tendência e descarta outras fontes de dados que também podem contribuir para ela. Aqui está um exemplo de como o site Rappler, nas Filipinas, lidou com a dificuldade de identificar um padrão no aumento de casos de coronavírus. Embora partam de uma hipótese sobre picos em áreas comerciais movimentadas, também abordam a possível influência de fatores como a concentração de violações aos protocolos de saúde e segurança.

  • A hipótese já foi comprovada e é de conhecimento geral.

Muitos jornalistas de dados em todo o mundo se esquivaram de matérias do tipo “o processo de compra é corrupto” porque é claro que é! Em vez disso, eles usam exemplos bem restritos para buscar a responsabilidade em nível local. A equipe de dados da Pajwok Afghan News seguiu uma hipótese relacionada à inflação de preços para a aquisição de suprimentos médicos específicos. A Dataphyte, na Nigéria, perseguiu de forma tão agressiva as irregularidades em contratações individuais que forçou o governo a divulgar mais detalhes sobre os acordos.

Uma boa notícia é que quase sempre você pode fortalecer uma hipótese fraca fazendo a pesquisa necessária para torná-la mais verificável, específica, interessante e concisa. Outra é que, mesmo que sua hipótese seja falsa, o que você descobriu provavelmente ainda é uma reportagem cativante e talvez até mais atraente.

Da hipótese às questões

E agora vamos nos aprofundar um pouco mais. A abordagem orientada por hipóteses também se presta bem ao desenvolvimento, por consultas, de perguntas que provem se suas suposições são verdadeiras ou falsas. Aderir a questões de pesquisa que sondam sua hipótese serve ao mesmo propósito que escrever antecipadamente perguntas para entrevistar uma fonte difícil: permite organizar seus pensamentos e garantir que você obtenha as respostas de que precisa.

Vamos ler esta matéria baseada em dados e extrair as principais constatações. Em seguida, faremos a engenharia reversa das hipóteses e questões:

Título -  Sem precedentes: mais de 200 terras indígenas na Amazônia estão em alto risco de contrair Covid-19

Se listarmos os argumentos de dados nesta reportagem, podemos obter algo assim:

  • Na maioria das Terras Indígenas (TIs) na Amazônia foi identificada em estado crítico devido à pandemia de coronavírus no Brasil.
  • Dos 1.228 municípios brasileiros onde há pelo menos um trecho de TIs, apenas 108 possuem leito de UTI, portanto, menos de 10% dos municípios brasileiros com terras indígenas possuem leitos de UTI.
  • Mais de 80% de todas as TIs do país estão concentradas no Norte, justamente a região que, junto com o Nordeste, concentra o menor número de UTIs do país.
  • A taxa de mortalidade materna de indígenas é a mais alta entre todas as raças, mesmo quando se controla o nível socioeconômico. O número de mortes entre as pessoas das comunidades indígenas está subestimado.
  • Entre as 10 regiões que foram identificadas como as mais vulneráveis ao coronavírus, sete não foram oficialmente reconhecidas como sendo de indígenas protegidos.
  • Cerca de quatro em cada cinco lares em territórios indígenas não contava com abastecimento de água e um terço não possuía banheiro para uso exclusivo.
  • Em 17 TIs, pelo menos um quinto da população tinha mais de 50 anos de idade, o que é considerado um fator de risco para o coronavírus.
  • Os pesquisadores pediram o estabelecimento de estratégias específicas para o cuidado dos povos indígenas.
  • Outra solução recomendada foi a construção de hospitais de campanha exclusivamente para os povos indígenas.

Print retirado do matéria original da Agência Pública

Podemos fazer a engenharia reversa de uma hipótese a partir desta lista de respostas, fazer uma de perguntas:

Hipótese

  • As comunidades indígenas estão enfrentando uma crise de saúde aguda durante a pandemia devido a centros de saúde com poucos recursos e condições de saúde básicas.

Problema

  • As comunidades indígenas estão morrendo a uma taxa desproporcionalmente alta?
  • As comunidades indígenas têm pior acesso a leitos de UTI do que o restante do país?

Impacto

  • Qual a proporção de terras indígenas considerada em estado crítico agora?
  • As comunidades indígenas são consideradas em condições mais críticas durante a pandemia do que o restante do país?
  • Qual a proporção de pessoas de comunidades indígenas considerada de alto risco?

Causa

  • Como as taxas de mortalidade materna de povos indígenas se comparavam à população em geral antes da pandemia?
  • Como o acesso à água potável nas comunidades indígenas se comparava aos demais habitantes antes da pandemia?
  • Quão completos estão os registros de óbitos em territórios indígenas em comparação com o restante do país?
  • Quão completos são os registros de óbitos entre as comunidades indígenas?
  • Quão completo está o cadastro de Territórios Indígenas?

Solução

  • Que estratégias podem ser empregadas para fechar a lacuna no acesso à saúde e mitigar a vulnerabilidade dos povos indígenas?

Podemos ver que essas questões afetam diferentes partes do problema. Enquanto alguns descrevem a escala das dificuldades, outros focam seu impacto em um determinado grupo de pessoas, e outros mergulham nas causas e fatores por trás disso. Finalmente, há dúvidas sobre as possíveis soluções ou maneiras de mitigar essas consequências.

Você pode aplicar esta lista geral de perguntas a quase todas as reportagens que utilizam dados, mergulham nas raízes do problema, e têm como objetivo construir uma narrativa concisa em torno deles:

Problema:

  • Quão grande é o problema?
  • Está piorando ou melhorando?

Impacto:

  • Qual categoria de pessoas tem maior probabilidade de sofrer as consequências    do problema / beneficiar-se da situação?
  • Como o problema afeta esse grupo de pessoas?

Causa:

  • Quais são as principais causas que explicam por que o problema está afetando desproporcionalmente essas pessoas?
  • Quais fatores contribuíram para isso?

Solução:

  • O que precisa ser corrigido para que o grupo de pessoas afetadas possa mitigar as consequências ou resolver o problema para elas?
  • Quanto custaria? E existe uma fonte de dinheiro para isso?
  • Alguém já tentou resolver este problema, aqui ou em outro lugar?
  • Como podemos medir a eficácia?

Essas perguntas ajudam a história a permanecer focada na hipótese específica que os jornalistas se propuseram a provar ou refutar. Elas garantem que aprofundem o problema e o expliquem de vários ângulos usando dados. Uma grande hipótese de dados consiste em questões que podem ser respondidas por meio deles para prová-la ou refutá-la.
 
Conclusão

Portanto, uma boa hipótese pode ser comprovada com os dados existentes e gerar novos conhecimentos sobre uma questão. Ela também mede o problema, as causas, o impacto e as soluções.

Uma hipótese é uma ótima maneira de construir reportagens em torno de um problema ou tema com o qual seu público se preocupa. Por exemplo, verifique estas variações da premissa anterior:

  • As comunidades indígenas estão encarando uma crise econômica aguda durante a pandemia devido aos programas de recuperação econômica com poucos fundos e à falta crônica de investimento local.
  • As comunidades indígenas estão enfrentando uma crise educacional profunda durante a pandemia como consequência de um sistema educacional com poucos recursos e à crônica falta de acesso à internet.

Muitos dos assuntos preferidos cobertos por jornalistas de dados são universais: política, saúde, educação, economia. Ler como outros jornalistas de dados exploram e explicam essas questões é uma maneira de encontrar inspiração para gerar matérias significativas sobre e para sua comunidade e ajudá-las a entender questões urgentes como a desigualdade. A adoção de uma metodologia orientada por hipóteses estabeleceu um fluxo de trabalho para construir reportagens de destaque orientadas por dados em torno de problemas complexos, muitas vezes mal compreendidos, que não desaparecerão tão cedo e exigem um envolvimento significativo e informado dos cidadãos para alterar o status quo.

Biografia dos Autores



Eva Constantaras
é jornalista de dados especializada na formação de equipes de jornalismo de dados no Global South. Essas equipes têm noticiado de toda a Ásia, Oriente Médio, América Latina e África sobre tópicos que vão desde a ajuda estrangeira interrompida e insegurança alimentar a indústrias extrativas e saúde pública. Como bolsista de jornalismo de dados do Google e bolsista da Fulbright, ela desenvolveu uma abordagem pedagógica e um manual para o ensino de jornalismo investigativo e de dados em ambientes de alto risco. Siga-a no Twitter: @evaconstantaras

 

Anastasia Valeeva é instrutora de jornalismo de dados e pesquisadora de dados abertos. Ela ensinou jornalismo de dados na Europa, Bálcãs, Ásia Central e Rússia e atualmente é professora de jornalismo de dados na American University of Central Asia, no Quirguistão. Também é cofundadora da School of Data Quirguistão. Ela pesquisou o uso de dados abertos no jornalismo investigativo como parte de sua bolsa Reuters Institute for the Study of Journalism, em Oxford. Siga-a no Twitter: @anastasiajourno

* Texto traduzido por Cau Duarte

Assinatura Abraji