Formação

Help Desk

Oito maneiras simples de deixar a planilha fazer as contas para que você possa focar na história

Oito maneiras simples de deixar a planilha fazer as contas para que você possa focar na história

Publicado originalmente em inglês no site do GIJN. Traduzido por Ana Beatriz Assam.

Ainda é a risada mais fácil de se arrancar de um grupo de jornalistas - profissionais ou estudantes - em todo o mundo. Tudo o que precisa ser dito é: "Todos nós sabemos que você entrou no jornalismo por causa da matemática".

As risadas surgem porque a maioria dos jornalistas se vê principalmente como contadores de histórias e artistas de palavras. Para eles, números são preocupantes, entediantes ou interferem no fluxo de um artigo.

Além disso, a ideia da incapacidade de jornalistas em lidar com números foi aumentada por matemáticos e estatísticos ao longo das décadas. Eles se debruçaram em cima de jornais e sites, ouviram o rádio e assistiram a notícias transmitidas pela TV com o objetivo de encontrar erros e falta de conhecimento matemático sempre que jornalistas reportavam com números.

O livro “Como um Matemático lê o Jornal”, de John Allen Paulos, foi implacável em sua busca pelos infortúnios matemáticos dos jornalistas. Esse livro seguiu o anterior, “Analfabetismo em Matemática e Suas Consequências”, que foi mais amplo em suas críticas à deficiência matemática em muitas profissões, mas incluiu jornalistas entre aqueles que estavam equivocados.

Os livros de Paulos e as críticas de outros estatísticos implicam que os jornalistas odeiam números e não são capazes de fazer contas e, talvez, nunca serão. Mas isso se tornou mentira nas últimas duas décadas. Essa mudança pode ser ligada ao surgimento de jornalistas usando dados e à percepção de que eles costumam usar algum tipo de matemática todos os dias. Seja para decifrar orçamentos, examinar salários ou observar taxas de acidentes ou assassinatos, atualmente, a maioria dos jornalistas está constantemente contando e comparando números.

Com certeza, até a década de 1980, era raro o jornalista que entendia a diferença entre média e mediana, podia calcular uma diferença percentual ou uma taxa simples. No Kansas City Star, onde trabalhei na década de 1980, havia um editor de textos que sabia fazer diferença percentual a mão e às vezes ele tinha uma pequena fila de repórteres em sua mesa esperando que fizesse esse cálculo para cada uma de suas histórias.

Um grande exemplo de inumerismo (incapacidade para realizar e compreender operações aritméticas simples) ao longo dos anos é que as notícias favoreciam os proprietários de equipes esportivas - sem perceber - durante as negociações de trabalho entre proprietários e jogadores. Essas matérias citavam a média do salário dos jogadores em vez da mediana, permitindo assim que os enormes salários de alguns jogadores estelares inflassionassem a média. Se os repórteres tivessem usado a mediana, teriam visto como poucos jogadores chegam a média e que a ideia de que todos os jogadores são milionários era falsa.

Em outros casos, os jornalistas relataram que era justo para os trabalhadores obter o mesmo percentual de aumento nos salários, sem perceber que um aumento de 3% para alguém que ganha R$ 150.000 (que é R$ 4.500) é muito maior que um aumento de 3% para alguém que ganha R$ 30.000 (que é R$ 900). Os jornalistas também falharam no uso de taxas para colocar números brutos em perspectiva. 

Uma cidade seria chamada de “a capital do assassinato” de um país com base no número total de assassinatos, apesar de ter uma taxa de homicídio muito menor do que outras cidades. Um cruzamento rodoviário seria considerado o mais perigoso com base no número total de colisões, em vez da taxa de colisões em comparação com o trânsito.

Um cruzamento que tem cem acidentes de trânsito por ano, quando o tráfego dele é de 100.000 carros, é menos arriscado do que um cruzamento que tem cem colisões por ano, com apenas 10.000 carros passando por ele no mesmo período.

Mas a vergonha pública dos jornalistas que cometeram erros matemáticos deixou repórteres, como a experiente jornalista e instrutora de jornalismo de dados Sarah Cohen escreveu em seu livro "Numbers in the Newsroom" (Números da Redação), com “a impressão de que não podemos usar números sem temer retaliação”. (O livro de Cohen é um valioso guia sobre jornalismo e matemática.)


Sempre verifique a matemática por trás de reportagens sobre uma "capital de assassinato" - às vezes, não o número não é tão robusto quanto parece.

No entanto, foi no final da década de 1980 que um pequeno grupo de jornalistas começou a abraçar o poder dos números e cálculos precisos quando começaram a trabalhar com dados. Eles também descobriram as planilhas. E, inspirados no livro de Philip Meyer, "Jornalismo de Precisão", passaram a ver o poder da matemática e dos números, em vez de desprezá-los ou evitá-los.

Oficinas de jornalismo de dados ministradas por Meyer na Universidade da Carolina do Norte e pela Investigative Reporters and Editors (IRE) com sua organização parceira, a Computer-Assisted Reporting Conference (NICAR), atraíram centenas de jornalistas ansiosos para aprender a análise de dados. Nesses workshops e depois nas conferências da NICAR, eles receberam treinamento que incluía matemática — treinamento que raramente era oferecido em salas de aula para jornalistas ou redações. De fato, os professores de jornalismo que queriam se manter atualizados na profissão foram a essas oficinas e tornaram-se os poucos incluindo matemática e números em suas aulas de aula.

Nesses workshops, eu e meus colegas descobrimos que o ensino anterior de matemática não tinha a abordagem e a perspectiva adequadas. A melhor abordagem desmistifica a matemática e foca no básico que permite aos jornalistas aplicarem a matemática de forma prática - isto é, resumir números, colocá-los no contexto e determinar se os números são enganosos ou mentirosos.

O resultado das oficinas - que se espalharam pelo mundo - foi uma maior compreensão dos números e, portanto, a capacidade de escrever mais claramente sobre eles. Os números não seriam entediantes se revelassem disparidades étnicas chocantes, um grande número de viadutos comprometidos ou taxas alarmantes de homicídio.

Além disso, o uso de planilhas eletrônicas, seja Microsoft Excel ou Google Sheets, facilitou a tarefa porque os jornalistas podiam confiar em cálculos automáticos assim que os números eram inseridos. Isso também aumentou a confiança dos jornalistas na interpretação de estatísticas e pesquisas, além de encorajá-los a empregar métodos estatísticos mais avançados.

Uma manifestação dessa mudança no jornalismo pode ser vista no número de sites e colunas de notícias dedicadas à interpretação de números. Entre os lugares dedicados a isso estão uma coluna de sábado de Jo Craven McGinty sobre números no The Wall Street Journal, a coluna Upshot no The New York Times e o site FiveThirtyEight de Nate Silver.

Outra manifestação é o Prêmio Philip Meyer, prêmio internacional concedido pelo IRE, que reconhece os melhores usos da ciência social no jornalismo. Ano após ano, desde 2005, esse prêmio mostra o progresso que foi feito na capacidade de raciocinar e aplicar conceitos numéricos simples do campo do jornalismo. Por exemplo, uma investigação feita pela Bayerischer Rundfunk e pelo Der Spiegel, "Sem lugar para estrangeiros: por que Hanna é convidada para visitar o apartamento e Ismail não", revelou discriminação contra estrangeiros no mercado imobiliário alemão por meio de uma pesquisa em larga escala com proprietários. Eles descobriram que locatários em potencial com nomes árabes e turcos eram frequentemente ignorados.

 


A diferença entre a chance de um estrangeiro e um nativo conseguirem um lugar para morar são maiores em Munique e Frankfurt, e menores em Lezipig e Magdeburg.

Em outro vencedor do prêmio, o BuzzFeed e a BBC usaram um milhão de simulações de partidas de tênis para descobrir tanto padrões suspeitos em apostas, quanto jogadores que perderam suas partidas mas estatisticamente não deveriam ter perdido.

Nos EUA, jornalistas em diversas redações mostraram fraudes generalizadas em exames nacionais, mostrando que os resultados eram altos demais com base na análise das pontuações dos anos anteriores. Em uma investigação semelhante em que também houve uso da matemática, a ProPublica descobriu uma tendência preocupante: trabalhadores temporários se machucam até seis vezes mais que funcionários permanentes, e seus ferimentos são mais graves.

E há muitos exemplos de histórias menores, mas eficazes, usando números. Anos atrás, uma repórter, que acabara de receber treinamento em planilhas, descobriu que a cidade que ela cobria apresentava variações percentuais mal calculadas em seu orçamento anual. Alguns repórteres encontraram associados políticos de governos recebendo salários muito maiores do que os empregados regulares. Outros calcularam custos excessivos nos programas do governo.

A planilha como uma ferramenta básica e inicial

Com apenas uma planilha, um jornalista pode deixar o software fazer a contagem e o cálculo, permitindo que ele se concentre no propósito e no resultado de sua consulta. Também abre as portas para o entendimento de estatísticas mais avançadas e o uso ou uso indevido de estatísticas por governos e empresas.

As ferramentas matemáticas em uma planilha podem ser divididas em dois grupos: gerenciamento de dados e cálculos.

O gerenciamento de dados, no qual a contagem é concluída automaticamente na planilha, inclui:

  • Filtrar dados com base em um critério;
  • Ordenar os dados para dar significado aos números, visualizando-os de maior para menor ou vice-versa;
  • Agrupar por tópicos em categorias e somar ou contar os números associados a cada categoria.

Cálculos básicos importantes, alguns dos quais podem ser executados automaticamente e alguns que devem ser realizados pelo jornalista, incluem:

  • Agrupar uma coluna ou linha de números;
  • Determinar a média ou mediana de uma coluna;
  • Calcular a diferença percentual;
  • Calcular uma taxa;
  • Calcular uma razão.

Gerenciamento de dados

  • Filtrando

Vamos começar com a filtragem. Há um banco de dados de acidentes com barcos de passeio nos EUA que contém detalhes de acidentes que culminaram em mortes. Aqui está uma amostra desses dados, que provavelmente é coletada em muitos outros países.

 

Uma versão resumida do banco de dados de acidentes de barco recreativo mantido pela Guarda Costeira dos EUA.

Ao usar a função de filtro em uma planilha, um jornalista pode responder rapidamente a seguinte pergunta: quantas pessoas morreram por afogamento que não estavam usando coletes salva-vidas e não sabiam nadar? Acontece que quase dois terços das mortes por afogamento incluem pessoas que não sabiam nadar e não usavam colete salva-vidas. Um pedaço dos dados aparece abaixo.

 

Essa planilha filtrada mostra apenas as mortes acidentais de barco causadas por afogamento e nas quais a vítima não usava colete salva-vidas e não sabia nadar.

Tudo o que o jornalista precisa fazer é clicar no ícone do filtro, escolher uma das setas que aparecem nas colunas e escolher os critérios. O valor jornalístico de usar esta ferramenta fica imediatamente claro porque o repórter agora tem uma história mostrando que algumas das mortes poderiam ter sido evitadas.

  • Classificação

A simples classificação dos números pode trazer significado para eles, ou pode tirar o viés político deles.

Por exemplo, a Organização Mundial de Saúde divulga um relatório anual sobre a expectativa de vida saudável de homens e mulheres em cada país. O relatório anual é emitido com os países listados em ordem alfabética. (Abaixo está uma versão simplificada dos dados criados pela eliminação de algumas das colunas de informação.)


Uma versão resumida do banco de dados de Expectativa de Vida Saudável da Organização Mundial da Saúde.

Classifique os países pela maior expectativa de vida para a mais baixa, e você pode ver as maiores diferenças - potencialmente o começo de uma história sobre por que alguns países têm expectativas mais altas e outros mais baixas. Você pode fazer um cálculo simples de subtrair a expectativa de vida de homens da expectativa de mulheres e ordenar por essa diferença.


Os dados de expectativa de vida útil da saúde com a diferença calculada entre as idades de homens e mulheres classificados pela maior diferença para a menor.

Como você pode ver, muitas das maiores diferenças estão em países que faziam parte da antiga União Soviética. Mais uma vez, este poderia ser o começo de uma história sobre o porquê disso.

  • Agrupando

Agrupar números em categorias e contá-los ou somá-los (ou ambos) pode fornecer uma visão geral valiosa de um conjunto de dados. Uma planilha tem uma excelente ferramenta para agrupar, chamada de Tabela Dinâmica. Vamos dar uma olhada em como essa ferramenta pode ajudar a descobrir qual revendedor vende mais armas no estado norte-americano do Missouri.

Ao clicar na aba Inserir e, em seguida, no ícone da Tabela Dinâmica, os jornalistas podem optar por contar pelo número de licenças de uma empresa.

O ícone Tabela Dinâmica foi selecionado no canto esquerdo.

A Tabela Dinâmica permite contar o número de cada empresa com licenças escolhendo em uma lista em uma tela de seleção.
 

Esta tabela dinâmica mostra o número de concessionárias licenciadas com um nome comercial exclusivo.

Classificando do maior para o menor com base no número de licenças, é possível ver que a empresa Walmart tem mais licenças para vender armas no Missouri.

 

Esses dados mostram o número de concessionárias licenciadas por nome exclusivo da empresa, classificado pelo maior número para o menor.

Nesses exemplos de gerenciamento de dados, o jornalista só precisa fazer um cálculo: subtração (no conjunto de dados de expectativa de vida saudável, em que as idades masculinas são subtraídas da idade feminina). O software faz todas as outras contas e ordenações.

  • Cálculos

Somando uma coluna ou linha de números

Os jornalistas podem rapidamente totalizar colunas de números usando a fórmula ou ícone para somar uma coluna.

O ícone em uma planilha é uma maneira de fazer uma soma, mas se houver linhas em branco, é melhor colocar o intervalo específico de números. Aqui está uma lista de salários em uma agência fictícia do governo.

O ícone pode ser usado para um grupo, mas por causa da linha em branco, ele parará nessa linha. É mais fácil fazer este cálculo com a fórmula =sum(b2:b9) do que se preocupar em perder uma linha ao especificar o intervalo.

 

Este é um conjunto de dados fictícios sobre salários municipais ganhos por nomeados políticos com o total de salários adicionados no ano anterior.

O brilhante de uma planilha é que ela mapeia os dados, o que permite que as fórmulas sejam calculadas e copiadas com facilidade. Em vez de fazer cálculos com números, os jornalistas podem usar os “endereços” dos números.

  • Determinando a média ou mediana de uma coluna

Fique atento: a média pode obscurecer o efeito de um grande número no cálculo (como um CEO ou um super astro da equipe) ou de um pequeno número (como um grupo de trabalhadores mal pagos). Uma mediana, na qual metade dos números é maior e metade é menor, pode servir como um detector de mentiras e pode corrigir esses valores atípicos, comumente chamados de outliers.

Por exemplo, uma equipe de cinco atletas tem uma estrela e quatro jogadores regulares. Se a média é calculada com a fórmula =MÉDIA(b3:b7), então o salário médio é de R$ 158.000, fazendo parecer que a maioria dos jogadores está ganhando R$ 158.000.

 

Um conjunto de dados fictícios dos salários do jogo para jogadores profissionais de basquete.

No entanto, a mediana com a fórmula =MED(b3:b7) mostra que o salário médio é de R$ 50.000, o que é uma indicação muito mais precisa do que a maioria dos jogadores está ganhando. Ao relatar apenas a média, um jornalista levaria a audiência a pensar que os jogadores estão ganhando muito mais do que estão.

  • Cálculo da diferença percentual

Calcular uma diferença percentual é uma das ferramentas mais poderosas que um jornalista pode usar pois coloca os números em proporção. Por exemplo, um jornalista pode querer analisar o impacto dos aumentos de salário dos indivíduos de uma agência. Nas duas colunas da planilha da agência, estão listados os salários do ano passado e os salários deste ano. Como pode ser visto abaixo, o cálculo da diferença percentual não é de R$ 7.000 (a diferença) dividida pelo salário anterior (R$ 45.000), mas sim pela fórmula =D2/B2. (O sinal = é necessário para qualquer fórmula.)

Então, para calcular uma diferença percentual, o salário do ano passado é subtraído do salário deste ano. Então, a diferença é dividida pelo salário do ano passado. Com este cálculo, pode ser visto o impacto real em cada trabalhador.


Este conjunto de dados mostra a diferença percentual calculada entre os salários do ano passado e os salários deste ano.

A diferença percentual é usada em muitos relatórios - orçamentos e transações, por exemplo - para mostrar números brutos e como eles se comparam.

  • Calculando uma taxa

As taxas são utilizadas em todo o mundo, sejam elas para acidentes de trânsito, mortalidade, criminalidade ou muitos outros problemas. As taxas são usadas para que comparações mais justas possam ser feitas entre categorias, muitas vezes abordando riscos. Por exemplo, uma cidade poderia ter 600 assassinatos por ano e outra poderia ter 400 assassinatos por ano. Mas, se a população da cidade com 600 assassinatos por ano é muito maior, então a taxa de homicídios é muito menor e, portanto, o risco de ser assassinado é muito menor. (As taxas de criminalidade podem ser mais complexas do que isso, mas esse é um uso frequente das taxas.)

 

Uma taxa é calculada considerando o número de incidentes por população (o que pode significar pessoas, número de veículos se é trânsito e assim por diante). No caso das taxas de homicídios, seria o número de assassinatos dividido pela população da cidade. Neste exemplo, a cidade dos EUA com mais assassinatos (Chicago) não tem a maior taxa de homicídios.

  • Calculando uma razão

As razões são extremamente úteis quando se escreve sobre números. Pode ser muito mais conciso escrever que um número é o dobro do outro, em vez de ser 100% mais alto. Pode ser bastante surpreendente descobrir que um grupo de pessoas é presa duas vezes mais que outro, ou um remédio tem uma taxa de sucesso três vezes maior do que outro.

Por exemplo, um grupo étnico tem 8.000 pessoas presas a cada ano. Outro grupo tem 4.000 pessoas presas a cada ano. Usando a fórmula = 8.000 / 4.000 a razão é determinada como sendo 2 para 1, ou o dobro disso. Se o primeiro grupo étnico representa apenas 10% da população total, então um jornalista tem o início de uma investigação para responder essa pergunta.

Conclusão

Essas funções e cálculos básicos permitem que os jornalistas superem o medo dos números e comecem a fazer uso da matemática em suas histórias. Se o crescimento do jornalismo de dados nos mostra alguma coisa, é que a adoção dessas novas habilidades beneficia tanto o campo do jornalismo quanto as redações, com perguntas mais precisas, melhores comparações e maior contexto. Tudo isso contribui para o que todo repórter se esforça para conseguir: jornalismo significativo e perspicaz. E isso não é motivo de riso.


Brant Houston é co-fundador e presidente do conselho da Global Investigative Journalism Network. Ele é autor do guia Data for Journalists, agora em sua quinta edição. Repórter investigativo há 17 anos, atuou como diretor executivo por mais de uma década e agora é representante da Fundação Knight na Universidade de Illinois, especializado em jornalismo investigativo.

Assinatura Abraji