manual de jornalismo de dados - como os jornalistas podem usar dados para melhorar suas reportagens...

321

Upload: jocenir-ribeiro

Post on 25-Sep-2015

73 views

Category:

Documents


6 download

DESCRIPTION

O objetivo da obra é ser uma fonte útil para qualquer um que possa estar interessado em se tornar um jornalista de dados, ou em aventurar-se no jornalismo de dados.

TRANSCRIPT

  • Introduo

    O que o jornalismo de dados?

    Por que jornalistas devem usar dados?

    Por que o Jornalismo de Dados importante?

    Alguns exemplos selecionados

    Jornalismo de dados em perspectiva

    O jornalismo guiado por dados numa perspectiva brasileira

    Existe jornalismo de dados e visualizao no Brasil?

    Na Redao

    O Jornalismo de dados da ABC (Australian Broadcasting Corporation)

    Jornalismo de Dados na BBC

    Como trabalha a equipe de aplicativos de notcias no Chicago Tribune

    Bastidores do Guardian Datablog

    Jornalismo de dados no Zeit Online

    Como contratar um hacker

    Aproveitando a expertise dos outros com Maratonas Hacker

    Seguindo o Dinheiro: Jornalismo de dados e Colaborao alm das Fronteiras

    Nossas Histrias Vm Como Cdigo

    Kaas & Mulvad: Contedo pr-produzido para comunicao segmentada

    Modelos de Negcio para o Jornalismo de Dados

    Estudos de Caso

    Basmetro: Passando o poder da narrativa para o usurio

    InfoAmaznia: o dilogo entre jornalismo e dados geogrficos

    The Opportunity Gap: projeto de oportunidades em escolas

    Uma investigao de nove meses dos Fundos Estruturais Europeus

    A crise da Zona do Euro

  • Cobrindo o gasto pblico com OpenSpending.org

    Eleies parlamentares finlandesas e financiamento de campanha

    Hack Eleitoral em tempo real (Hacks/Hackers Buenos Aires)

    Dados no Noticirio: WikiLeaks

    Hackatona Mapa76

    A cobertura dos protestos violentos no Reino Unido pelo The Guardian

    Boletins escolares de Illinois (EUA)

    Faturas de hospitais

    Care Home Crisis: A crise da empresas de sade em domiclio

    O telefone conta tudo

    Quais modelos se saem pior na inspeo veicular britnica?

    Subsdios de nibus na Argentina

    Jornalistas de dados cidados

    O Grande Quadro com o Resultado das Eleies

    Apurando o preo da gua via crowdsourcing

    Coletando dados

    Guia rpido para o trabalho de campo

    Seu Direito aos Dados

    Lei de Acesso Informao no Brasil: Um longo caminho a percorrer

    Pedidos de informao funcionam. Vamos us-los!

    Ultrapassando Obstculos para obter Informao

    A Web como uma Fonte de dados

    O Crowdsourcing no Guardian Datablog

    Como o Datablog usou crowdsourcing para cobrir a compra de ingressos na

    Olimpada

    Usando e compartilhando dados: a letra da lei, a letra mida e a realidade

  • Entendendo os Dados

    Familiarizando-se com os dados em trs passos

    Dicas para Trabalhar com Nmeros

    Primeiros passos para trabalhar com dados

    O po de 32 libras

    Comece com os dados e termine com uma reportagem

    Contando histrias com dados

    Jornalistas de dados comentam suas ferramentas preferidas

    Usando a visualizao de dados para encontrar ideias

    Comunicando os dados

    Apresentando os dados ao pblico

    Como construir um aplicativo jornalstico

    Aplicativos jornalsticos no ProPublica

    A visualizao como carro-chefe do jornalismo de dados

    Usando visualizao para contar histrias

    Grficos diferentes contam histrias diferentes

    O faa-voc-mesmo da visualizao de dados: nossas ferramentas favoritas

    Como mostramos os dados no Verdens Gang

    Dados pblicos viram sociais

    Engajando pessoas nos seus dados

  • O que este livro (e o que ele no )

    A inteno deste livro ser uma fonte til para qualquer um que possa estar

    interessado em se tornar um jornalista de dados, ou em aventurar-se no

    jornalismo de dados.

    Muitas pessoas contriburam na sua composio, e, atravs do nosso esforo

    editorial, tentamos deixar essas diferentes vozes e vises brilharem. Ns

    esperamos que ele seja lido como uma conversa rica e informativa sobre o que

    jornalismo de dados, por que ele importante, e como faz-lo.

    Infelizmente, ler este livro no vai te dar um repertrio completo de todo o

    conhecimento e habilidade necessrios para se tornar um jornalista de dados.

    Para isso, seria necessria uma vasta biblioteca de informaes composta por

    centenas de experts capazes de responder questes sobre centenas de tpicos.

    Felizmente, essa biblioteca existe: a internet. Ainda assim, ns esperamos que

    este livro possa te dar a noo de como comear e de onde procurar se voc

    quiser ir alm. Exemplos e tutoriais servem para serem ilustrativos e no

    exaustivos.

    Ns nos consideramos muito sortudos por termos tido tanto tempo, energia, e

    pacincia de todos os nossos voluntrios, e fizemos o melhor para tentar usar

    isso com sabedoria. Esperamos que, alm de ser uma fonte de referncia til, o

    livro sirva tambm para documentar a paixo e o entusiasmo, a viso e a energia

    de um movimento que est nascendo. O livro uma tentativa entender o que

    acontece nos bastidores dessa cena de jornalismo de dados.

    O Data Journalism Handbook um trabalho em curso. Se voc acha que h

    qualquer coisa que precisa ser corrigida ou est ausente, por favor nos avise

    para que ela seja includa na prxima verso. Ele tambm est disponvel de

    maneira gratuita em uma licena Creative Commons de Atribuio +

    Compartilhamento, e ns encorajamos fortemente a compartilh-lo com

    qualquer um que possa estar interessado.

    Liliana Bounegru (@bb_liliana)

    Lucy Chambers (@lucyfedia)

    Jonathan Gray (@jwyg)

    Maro de 2012

    - See more at:

    http://datajournalismhandbook.org/pt/0_paginas_preliminares_3.html#sthash.CkL0

    MKly.dpuf

  • Viso Geral do Livro

    A designer de infogrficos Lulu Pinney criou este lindo pster, que d um

    panorama geral do contedo do Data Journalism Handbook.

  • Introduo

    O que o jornalismo de dados? Qual o seu potencial? Quais so seus limites?

    De onde ele vem? Nesta seo iremos explicar o que o jornalismo de dados e o

    que ele pode significar para as organizaes jornalsticas. Paul Bradshaw

    (Birmingham City University) e Mirko Lorenz (Deutsche Welle) discorrem um

    pouco sobre o que h de diferente nesse tipo de reportagem. Jornalistas de

    dados de destaque nos contam por que o consideram importante e quais so

    seus exemplos favoritos. Finalmente, Liliana Bounegru (Centro Europeu de

    Jornalismo) coloca o jornalismo de dados em seu contexto histrico mais

    amplo.

    O que h neste captulo?

    O que o jornalismo de dados?

    Por que jornalistas devem usar dados?

    Por que o Jornalismo de Dados importante?

    Alguns exemplos selecionados

    Jornalismo de dados em perspectiva

    O jornalismo guiado por dados numa perspectiva brasileira

    Existe jornalismo de dados e visualizao no Brasil?

  • O que o jornalismo de dados?

    Eu poderia responder, simplesmente, que um jornalismo feito com dados. Mas

    isso no ajuda muito.

    Ambos, "dados" e "jornalismo", so termos problemticos. Algumas pessoas

    pensam em "dados" como qualquer grupo de nmeros, normalmente reunidos

    numa planilha. H 20 anos, este era praticamente o nico tipo de dado com o

    qual os jornalistas lidavam. Mas ns vivemos num mundo digital agora, um

    mundo em que quase tudo pode ser (e quase tudo ) descrito com nmeros.

    A sua carreira, 300 mil documentos confidenciais, todos dentro do seu crculo

    de amizades; tudo isso pode ser (e ) descrito com apenas dois nmeros: zeros e

    uns. Fotos, vdeos e udio so todos descritos com os mesmos dois nmeros:

    zeros e uns. Assassinatos, doenas, votos, corrupo e mentiras: zeros e uns.

    O que faz o jornalismo de dados diferente do restante do jornalismo? Talvez

    sejam as novas possibilidades que se abrem quando se combina o tradicional

    "faro jornalstico" e a habilidade de contar uma histria envolvente com a escala

    e o alcance absolutos da informao digital agora disponvel.

    Estas possibilidades aperecem em qualquer estgio do processo, seja usando

    programas para automatizar o trabalho de combinar informao do governo

    local, polcia e outras fontes civis, como Adrian Holovaty fez no ChicagoCrime e

    depois no EveryBlock; seja usando um softtware para achar conexes entre

    centenas de milhares de documentos, como o The Telegraph fez com o MPs'

    expenses.

  • Imagem 1. Chamado para ajudar a investigar os gastos dos Membros do Parlamento (MPs) - (the

    Guardian)

    Jornalismo de dados pode ajudar um jornalista a formular uma reportagem

    complexa atravs de infogrficos envolventes. Por exemplo, as palestras

    espetaculares de Hans Rosling para visualizar a pobreza no mundo com

    o Gapminder atraram milhes de visualizaes em todo mundo. E o trabalho

    popular de David McCandless em destrinchar grandes nmeroscomo colocar

    gastos pblicos dentro de contexto, ou a poluio gerada e evitada pelo vulco

    islandsmostra a importncia de um design claro, como o doInformation is

    Beautiful.

    Ou ainda o jornalismo de dados pode ajudar a explicar como uma reportagem se

    relaciona com um indivduo, como a BBC e o Financial Times costumam fazem

    com seus oramentos interativos (em que se pode descobrir como o oramento

    pblico afeta especificamente voc, em vez de saber como afeta uma "pessoa

    comum"). Ele pode tambm revelar o processo de construo das notcias, como

    o Guardian fez de maneira to bem-sucedida compartilhando dados, contextos e

    questes com o Datablog.

    Os dados podem ser a fonte do jornalismo de dados, ou podem ser as

    ferramentas com as quais uma notcia contadaou ambos. Como qualquer

    fonte, devem ser tratados com ceticismo; e como qualquer ferramenta, temos de

    ser conscientes sobre como eles podem moldar e restringir as reportagens que

    ns criamos com eles.

  • Paul Bradshaw, Birmingham City University

    Por que jornalistas devem usar dados?

    O jornalismo est sitiado. No passado, ns, como uma indstria, contvamos

    com o fato de sermos os nicos a operar a tecnologia para multiplicar e

    distribuir o que havia acontecido de um dia para o outro. A imprensa servia

    como um porto: se algum quisesse impactar as pessoas de uma cidade ou

    regio na manh seguinte, deveria procurar os jornais. Isso acabou.

    Hoje as notcias esto fluindo na medida em que acontecem, a partir de

    mltiplas fontes, testemunhas oculares, blogs, e o que aconteceu filtrado por

    uma vasta rede de conexes sociais, sendo classificado, comentado e, muito

    frequentemente, ignorado.

    Esta a razo pela qual o jornalismo de dados to importante. Juntar

    informaes, filtrar e visualizar o que est acontecendo alm do que os olhos

    podem ver tem um valor crescente. O suco de laranja que voc bebe de manh, o

    caf que voc prepara: na economia global de hoje existem conexes invisveis

    entre estes produtos, as pessoas e voc. A linguagem desta rede so os dados:

    pequenos pontos de informao que muitas vezes no so relevantes em uma

    primeira instncia, mas que so extraordinariamente importantes quando vistos

    do ngulo certo.

    Agora mesmo, alguns jornalistas pioneiros j demonstram como os dados

    podem ser usados para criar uma percepo mais profunda sobre o que est

    acontecendo ao nosso redor e como isto pode nos afetar.

    A anlise dos dados pode revelar "o formato de uma histria" (Sarah Cohen), ou

    nos fornecer uma "nova cmera" (David McCandless). Usando os dados, o

    principal foco do trabalho de jornalistas deixa de ser a corrida pelo furo e passa

    a ser dizer o que um certo fato pode realmente significar. O leque de temas

    abrangente: a prxima crise financeira em formao, a economia por trs dos

    produtos que usamos, o uso indevido de recursos ou os tropeos polticos. Tudo

    isso pode ser apresentado em uma visualizao de dados convincente que deixe

    pouco espao para discusso.

    Exatamente por isso jornalistas deveriam ver nos dados uma oportunidade. Eles

    podem, por exemplo, revelar como alguma ameaa abstrata, como o

    desemprego, afeta as pessoas com base em sua idade, sexo ou educao. Usar

  • dados transforma algo abstrato em algo que todos podem entender e se

    relacionar.

    Eles podem criar calculadoras personalizadas para ajudar as pessoas a tomarem

    decises, seja comprar um carro, uma casa, decidir um rumo educacional ou

    profissional ou ainda verificar os custos de se manter sem dvidas.

    Eles podem analisar a dinmica de uma situao complexa, como protestos ou

    debates polticos, mostrar falcias e ajudar todos a verem as possveis solues

    para problemas complexos.

    Ter conhecimento sobre busca, limpeza e visualizao de dados transformador

    tambm para o exerccio da reportagem. Jornalistas que dominam estas

    habilidades vo perceber que construir artigos a partir de fatos e ideias um

    alvio. Menos adivinhao, menos busca por citaes; em vez disso, um

    jornalista pode construir uma posio forte apoiada por dados, o que pode

    afetar consideravelmente o papel do jornalismo.

    Alm disso, ingressar no jornalismo de dados oferece perspectivas de futuro.

    Hoje, quando redaes cortam suas equipes, a maioria dos jornalistas espera se

    transferir para um emprego em relaes pblicas ou assessoria de imprensa.

    Jornalistas de dados e cientistas de dados, contudo, j so um grupo procurado

    de funcionrios, no s nos meios de comunicao. As empresas e instituies

    ao redor do mundo esto buscando "intrpretes" e profissionais que saibam

    entrar fundo nos dados e transform-los em algo tangvel.

    H uma promessa de futuro nos dados e isso o que o excita as redaes,

    fazendo-as procurar por um novo tipo de reprter. Para freelancers, a

    proficincia com dados fornece um caminho para novas ofertas e remunerao

    estvel tambm. Veja deste modo: em vez de contratar jornalistas para

    preencher rapidamente as pginas e os sites com contedo de baixo valor, a

    utilizao dos dados poderia criar demanda para pacotes interativos, nos quais

    passar uma semana resolvendo uma questo a nica maneira de faz-los. Esta

    uma mudana bem-vinda em muitas partes da mdia.

    H uma barreira impedindo os jornalistas de usarem este potencial:

    treinamento para aprender como trabalhar com dados passo-a-passo, da

    primeira questo at um furo obtido pelo trabalho com os dados.

    Trabalhar com dados como pisar em um vasto e desconhecido territrio.

    primeira vista, os dados brutos so intrigantes aos olhos e mente. Esses dados

  • so complicados. bastante difcil mold-los corretamente para a visualizao.

    Isto requer jornalistas experientes, que tm energia para olhar aqueles dados

    brutos, por vezes confusos, por vezes chatos, e enxergar as histrias escondidas

    l dentro.

    Mirko Lorenz, Deutsche Welle

    A Pesquisa

    O Centro Europeu de Jornalismo realizou uma pesquisa para saber mais sobre

    as necessidades de formao dos jornalistas. Descobrimos que h uma grande

    vontade de sair da zona de conforto do jornalismo tradicional e investir tempo

    em dominar novas habilidades. Os resultados da pesquisa nos mostraram que

    os jornalistas veem a oportunidade, mas precisam de um pouco de apoio para

    acabar com os problemas iniciais que os impedem de trabalhar com dados.

    Existe uma confiana de que se o jornalismo de dados for adotado mais

    universalmente, os fluxos de trabalho, ferramentas e os resultados vo melhorar

    muito rapidamente. Pioneiros como The Guardian, The New York Times, Texas

    Tribune, e Die Zeit continuam a elevar o nvel com suas histrias baseadas em

    dados.

    Ser que o jornalismo de dados permanecer restrito a um pequeno grupo de

    pioneiros, ou ser que cada organizao de notcias em breve vai ter sua prpria

    equipe dedicada ao jornalismo de dados? Esperamos que este manual ajude

    mais jornalistas e redaes a tirar proveito deste campo emergente.

  • Imagem 2. Pesquisa do Centro Europeu de Jornalismo sobre necessidades de treinamento.

    Por que o Jornalismo de Dados importante?

    Perguntamos a alguns dos principais profissionais da rea por que eles acham

    que o o jornalismo de dados um avano importante. Aqui est o que disseram.

    Filtrando o Fluxo de Dados

    Quando a informao era escassa, a maior parte de nossos esforos estavam

    voltados caar e reunir dados. Agora que a informao abundante, process-

    la tornou-se mais importante. O processamento acontece em dois nveis: 1)

    anlise para entender e estruturar um fluxo infinito de dados e 2) apresentao

    para fazer com que os dados mais importantes e relevantes cheguem ao

    consumidor. Como acontece na cincia, o jornalismo de dados revela seus

    mtodos e apresenta seus resultados de uma forma que possam ser replicados.

    Philip Meyer, Professor Emrito da Universidade da Carolina do Norte, em

    Chapel Hill

    Novas abordagens para a narrativa

    O jornalismo de dados um termo que, ao meu ver, engloba um conjunto cada

    vez maior de ferramentas, tcnicas e abordagens para contar histrias. Pode

  • incluir desde a Reportagem com o Auxlio do Computador (RAC, que usa dados

    como uma "fonte") at as mais avanadas visualizaes de dados e aplicativos de

    notcias. O objetivo em comum jornalstico: proporcionar informao e anlise

    para ajudar a nos informar melhor sobre as questes importantes do dia.

    Aron Pilhofer, New York Times

    Como o fotojornalismo, s que com laptop

    O jornalismo de dados s se diferencia do "jornalismo de palavras" porque

    usamos ferramentas distintas. Ambos trabalham buscando a notcia, fazendo

    reportagem e contando histrias. como o fotojornalismo; s que substitui a

    cmera pelo laptop.

    Brian Boyer, Chicago Tribune

    O Jornalismo de Dados o Futuro

    O jornalismo movido por dados o futuro. Os jornalistas precisam ser

    conhecedores dos dados. Costumava-se conseguir novas reportagens

    conversando com pessoas em bares; e pode ser que, s vezes, voc continue

    fazendo isso. Mas agora isso tambm possvel se debruando sobre dados e se

    equipando com as ferramentas corretas para analis-los e identificar o que h de

    interessante ali. Tendo isso em perspectiva, possvel ajudar as pessoas a

    descobrir como todas essas informaes se encaixam e o que est acontecendo

    no pas.

    Tim Berners-Lee, fundador da World Wide Web (WWW)

    O processamento de dados encontra o a lapidao do texto

    O jornalismo de dados est diminuindo a distncia entre os tcnicos estatsticos

    e os mestres da palavra. Faz isso ao localizar informaes que fogem ao padro e

    identificar tendncias que no so apenas relevantes de um ponto de vista

    estatstico, mas tambm relevantes para decodificar a complexidade do mundo

    de hoje.

    David Anderton, jornalista freelancer

    Atualizando o Seu Conjunto de Competncias

    O jornalismo de dados um novo conjunto de competncias para buscar,

    entender e visualizar fontes digitais em um momento em que os conhecimentos

    bsicos do jornalismo tradicional j no so suficientes. No se trata da

    substituio do jornalismo tradicional, mas de um acrscimo a ele.

  • Em um momento em que as fontes esto se tornando digitais, os jornalistas

    podem e devem estar perto dessas fontes. A internet abriu um mundo de

    possibilidades alm da nossa compreenso atual. O jornalismo de dados

    apenas o comeo do processo de evoluo de prticas antigas para se adaptar ao

    mundo online.

    O jornalismo de dados cumpre dois objetivos importantes para as organizaes

    de mdia: encontrar notcias nicas (que no sejam de agncias), e executar a

    funo fiscalizao do poder. Especialmente em tempos de perigo financeiro,

    essas metas so bastante importantes para os jornais.

    Do ponto de vista de um jornal local, o jornalismo de dados crucial. Existe um

    ditado que diz que "uma telha solta na frente da sua porta mais importante

    que uma revolta em um pas distante". O fato que se coloca diante de voc e

    provoca impacto direto na sua vida. Ao mesmo tempo, a digitalizao est em

    todos os lugares. Porque jornais locais tm esse impacto direto na regio em que

    so distribudos e as fontes tornam-se cada vez mais digitais, um jornalista

    precisa saber como encontrar, analisar e visualizar histrias usando dados como

    matria-prima.

    Jerry Vermanen, NU.nl

    Um remdio para a assimetria da informao

    A assimetria da informaono a falta de informao, mas a incapacidade de

    absorv-la e process-la na velocidade e no volume com que chega at ns --,

    um dos problemas mais significativos enfrentados pelos cidados ao fazer

    escolhas sobre como viver suas vidas. Informaes obtidas pela imprensa e a

    mdia influenciam escolhas e aes dos cidados. O bom jornalismo de dados

    ajuda a combater a assimetria da informao.

    Tom Fries, Fundao Bertelsmann

    Uma resposta para o uso de dados por assessorias de imprensa

    A disponibilidade de ferramentas de medio e a diminuio de seus preos

    em uma combinao autossustentvel com foco na performance e na eficincia

    em todos os aspectos da sociedadelevaram tomadores de deciso a

    quantificar os progressos de suas polticas, monitorar tendncias e identificar

    oportunidades.

    As empresas continuam adotando novas mtricas mostrando quo boa so as

    suas performances no mercado. Os polticos adoram se gabar sobre redues

  • dos nveis de desemprego e aumentos do PIB. A falta de viso jornalstica em

    temas como os escndalos da Enron, Worldcom, Madoff ou Solyndra a prova

    da falta de habilidade dos jornalistas para ver atravs e alm dos nmeros.

    mais fcil aceitar o valor de face dos nmeros do que o de outros fatos, j que

    carregam uma aura de seriedade mesmo quando so complemente fabricados.

    A fluncia no uso de dados ajuda os jornalistas a analisar os nmeros com senso

    crtico, e certamente os ajudar a ganhar terreno em seus contatos com

    assessorias de imprensa.

    Nicolas Kayser-Bril, Journalism++

    Oferecendo interpretaes independentes de informaes oficiais

    Aps o terremoto devastador e o consequente desastre na usina nuclear de

    Fukushima, em 2011, o jornalismo de dados foi ganhando corpo e importncia

    entre membros da mdia no Japo, pas geralmente atrasado com relao ao

    jornalismo digital.

    Estvamos perdidos quando o governo e especialistas no tinham dados

    confiveis sobre os danos provocados. Quando os oficiais esconderam do

    pblico informaes do sistema SPEEDI (rede de sensores japoneses que deve

    prever a propagao de radiao entre outras coisas), no estvamos preparados

    para decodificar os dados, mesmo que tivessem vazado. Voluntrios comearam

    a coletar dados sobre radiao usando seus prprios dispositivos, mas ns no

    estvamos armados com o conhecimento de estatstica, interpolao e

    visualizao desses dados, entre outras coisas. Jornalistas precisam ter acesso

    aos dados brutos, e aprender a no confiar apenas nas interpretaes oficiais

    deles.

    Isao Matsunami, Tokyo Shimbun

    Lidar com o dilvio informacional

    Os desafios e oportunidades trazidos pela revoluo digital continuam

    disruptivos para o jornalismo. Numa era de abundncia de informao,

    jornalistas e cidados precisam de ferramentas melhores, seja quando

    estivermos fazendo a curadoria de material proibido por governos do Oriente

    Mdio, processando dados surgidos de ltima hora, ou buscando a melhor

    maneira de visualizar a qualidade da gua para uma nao de consumidores.

    medida que lutamos contra os desafios do consumo apresentados por esse

    dilvio de informaes, novas plataformas de publicao tambm permitem a

  • qualquer pessoa ter o poder de reunir e compartilhar dados digitalmente,

    transformando-os em informao. Embora reprteres e editores tm sido os

    tradicionais vetores para coletar e disseminar informao, no ambiente

    informacional de hoje as notcias mais quentes aparecem antes na internet, e

    no nas editorias de jornais.

    Ao redor do mundo o vnculo entre os dados e o jornalismo est em forte

    ascenso. Na era do big data, a crescente importncia do jornalismo de dados

    reside na capacidade de seus praticantes de fornecer contexto, clareza e, talvez o

    mais importante, encontrar a verdade em meio expanso de contedo digital

    no mundo. Isso no significa que as organizaes de mdia de hoje no tenham

    um papel crucial. Longe disso. Na era da informao, jornalistas so mais

    necessrios que nunca para fazer a curadoria, verificar, analisar e sintetizar a

    imensido de dados. Neste contexto, o jornalismo de dados tem uma

    importncia profunda para a sociedade.

    Hoje, entender um grande volume de dados ("big data"), particularmente dados

    no estruturados, um objetivo central para cientistas de dados ao redor do

    mundo, estejam eles em redaes, em Wall Street ou no Vale do Silcio. Um

    conjunto crescente de ferramentas comuns, quer empregadas por tcnicos

    governamentais de Chicago, tcnicos de sade ou desenvolvedores de redaes,

    fornece ajuda substancial para atingir esse objetivo.

    Alex Howard, OReilly Media

    Nossas vidas so dados

    Fazer bom jornalismo de dados difcil porque o bom jornalismo difcil.

    Significa descobrir como obter os dados, entend-los e encontrar a histria. s

    vezes h becos sem sada e no h uma grande reportagem. Afinal, se fosse

    apenas uma questo de pressionar um boto certo, no seria jornalismo. Mas

    isso o que faz o jornalismo de dados valer pena e, em um mundo onde nossas

    vidas esto cada vez mais compostas por dados, a rea torna-se essencial para

    uma sociedade justa e livre.

    Chris Taggart, OpenCorporates

    Uma forma de economizar tempo

    Jornalistas no tm tempo para gastar na transcrio de documentos ou

    tentando obter dados de PDFs, de modo que aprender um pouco de

  • programao (ou saber onde buscar pessoas que podem ajudar) incrivelmente

    valioso.

    Um reprter da Folha de S.Paulo estava trabalhando com um oramento local e

    me chamou para agradecer o fato de termos colocado online as contas da cidade

    de So Paulo (dois dias de trabalho para um nico hacker!). Ele disse que vinha

    transcrevendo essas informaes manualmente ao longo de trs meses,

    tentando construir uma reportagem. Eu tambm lembro de ter solucionado uma

    questo ligada a um PDF para o Contas Abertas, uma organizao de notcias de

    monitoramento parlamentar: 15 minutos e 15 linhas de cdigo conseguiram o

    mesmo resultado que um ms de trabalho.

    Pedro Markun, Transparncia Hacker

    Uma parte essencial do pacote de ferramentas dos jornalistas

    importante ressaltar a parte jornalstica ou o lado da reportagem do

    jornalismo de dados. O exerccio no deve ser o de analisar e visualizar por si s,

    mas tambm de usar os dados como uma ferramenta para se aproximar da

    verdade e do que est acontecendo no mundo. Vejo a capacidade de analisar e

    interpret-los como parte essencial do kit atual de ferramentas jornalsticas,

    mais do que uma disciplina parte. Por fim, trata-se de fazer boas reportagens e

    contar histrias da forma mais apropriada.

    Esse novo jornalismo outro meio de analisar o mundo e fazer com que os

    governantes prestem contas. Com uma quantidade cada vez maior de dados,

    mais importante que nunca que os jornalistas estejam conscientes dessas

    tcnicas. Isso deveria estar no arsenal de tcnicas de reportagem de qualquer

    jornalista, seja aprender diretamente a trabalhar com os dados ou colaborar

    com algum que cumpra esse papel.

    O real poder do jornalismo de dados ajudar a obter e provar informaes

    quando, por outros meios, seria muito difcil. Um bom exemplo disso uma

    reportagem de Steve Doig que analisava os danos provocados pelo furaco

    Andrew. Ele juntou dois conjuntos diferentes de dados: um mapeava o nvel de

    destruio causado pelo furao, e o outro mostrava a velocidade dos ventos.

    Isso permitiu identificar reas onde construes enfraquecidas e prticas de

    construo no confiveis contriburam para aumentar o impacto do desastre. O

    trabalho ganhou um Prmio Pulitzer em 1993 e continua sendo um grande

    exemplo do potencial do jornalismo de dados.

  • Idealmente, usa-se dados para identificar fatos que fogem ao padro, reas de

    interesse ou coisas que so surpreendentes. Neste sentido, eles podem agir

    como um norte ou como pistas. Os nmeros podem ser interessantes, mas

    apenas escrever sobre eles no suficiente. Voc ainda vai precisar fazer

    reportagem para explicar o que eles significam.

    Cynthia OMurchu, Financial Times

    Adaptao a Mudanas no nosso ambiente informacional

    Novas tecnologias digitais trazem novas formas de produzir e disseminar

    conhecimento na sociedade. O jornalismo de dados pode ser entendido como

    uma tentativa da mdia de se adaptar s mudanas e responder a elas em um

    ambiente repleto de informao, incluindo o relato de histrias mais interativas

    e multidimensionais que permitem aos leitores explorar as fontes subjacentes s

    notcias e incentiv-los a participar da criao e avaliao de reportagens.

    Csar Viana, Universidade de Gois

    Um jeito de ver coisas que voc no enxergaria de outra forma

    Algumas histrias podem apenas ser entendidas e explicadas por meio da

    anlisee s vezes da visualizaode dados. Conexes entre pessoas ou

    entidades poderosas continuariam ocultas, mortes causadas por polticas contra

    drogas seguiriam escondidas, polticas ambientais que destroem a natureza

    seguiriam inabalveis. Mas cada ponto acima no permaneceu nessa situao

    devido a dados que os jornalistas obtiveram, analisaram e ofereceram aos

    leitores. Os dados podem ser to simples como uma planilha bsica ou um

    registro de chamadas de celular, ou to complexos como notas de avaliaes de

    escolas ou informaes sobre infeco hospitalar. No fundo, porm, todas essas

    histrias so temas que merecem ser contados.

    Cheryl Phillips, The Seattle Times

    Uma forma de contar histrias mais ricas

    Podemos pintar histrias de toda a nossa vida por meio de nossos rastros

    digitais. Do que consumimos e pesquisamos a onde e quando viajamos, nossas

    preferncias musicais, nossos primeiros amores, as realizaes de nossos filhos,

    e at os nossos ltimos desejos, tudo isso pode ser monitorado, digitalizado,

    armazenado na nuvem e disseminado. Esse universo de informaes pode vir

    tona para contar histrias, responder a questes e oferecer uma compreenso da

  • vida de uma maneira que atualmente supera at mesmo a reconstruo mais

    rigorosa e cuidadosa de anedotas.

    Sarah Slobin, Wall Street Journal

    Voc no precisa de dados novos para dar um furo

    s vezes, os dados j so pblicos e esto disponveis, mas ningum olhou para

    eles com cuidado. No caso do relatrio da Associated Press sobre 4.500 pginas

    de documentos revelados que descrevem aes de empresas de segurana

    privada contratadas durante a guerra do Iraque, o material foi obtido por um

    jornalista independente ao longo de vrios anos. Ele fez diversos pedidos, por

    meio da lei de acesso informao dos EUA (Freedom of Information Act) ao

    Departamento de Estado dos Estados Unidos. Eles escanearam os documentos

    em papel e os subiram no site DocumentCloud, o que tornou possvel fazer uma

    anlise abrangente da situao.

    Jonathan Stray, The Overview Project

  • Alguns exemplos selecionados

    Ns pedimos a alguns de nossos voluntrios que dessem seus exemplos

    favoritos de jornalismo de dados e dissessem o que gostavam neles. Aqui esto:

    "Do no Harm", do Las Vegas Sun

    Meu exemplo favorito o a srie Do No Harm de 2010 do Las Vegas Sun sobre

    servio hospitalar. O The Sun analisou mais de 2,9 milhes de registros

    financeiros de hospitais, que revelaram mais de 3.600 leses, infeces e erros

    mdicos que poderiam ter sido prevenidos. Eles obtiveram as informaes por

    meio de uma requisio de dados pblicos e identificaram mais de 300 casos

    nos quais pacientes morreram por conta de erros que poderiam ter sido

    evitados. A reportagem possui diferentes elementos, que incluem: um grfico

    interativo que permite ao leitor ver, por hospital, onde leses decorrentes de

    cirurgia aconteceram mais que o esperado; um mapa e uma linha do tempo que

    mostra infeces se alastrando hospital por hospital e um grfico interativo que

    permite aos usurios ordenar os dados por leses evitveis ou por hospital para

    ver onde as pessoas esto se machucando. Gosto deste trabalho porque muito

    fcil de entender e navegar. Os usurios podem explorar os dados de uma

    maneira muito intuitiva.

    Alm disso, a iniciativa causou um impacto real: o legislativo de Nevada reagiu

    com seis projetos de lei. Os jornalistas envolvidos trabalharam arduamente para

    obter e limpar os dados. Um dos jornalistas, Alex Richards, mandou as

    informaes de volta aos hospitais e para o Estado no mnimo uma dzia de

    vezes para que as falhas fossem corrigidas.

    Anglica Peralta Ramos, La Nacin (Argentina)

  • Imagem 3. Do No Harm (The Las Vegas Sun)

    Banco de dados da Folha de Pagamento do Governo

    Eu adoro o trabalho que organizaes pequenas e independentes esto

    desempenhando todo dia, tais como a ProPublica ou o Texas Tribune que tm

    em Ryan Murphy um grande reprter de dados. Se eu tivesse que escolher,

    elegeria o projeto de Banco de Dados dos salrios de empregados do governo

    do Texas Tribune. Este projeto coleta 660 mil salrios de empregados pblicos

    em um banco de dados para usurios procurarem e ajudarem a gerar matrias a

    partir dele. Voc pode procurar por agncia, nome ou salrio. simples,

    informativo e est tornando pblica uma informao antes inacessvel. fcil de

    usar e automaticamente gera matrias. um grande exemplo de por que o

    Texas Tribune consegue a maioria de seu trfego das pginas de dados.

    Simon Rogers, the Guardian

  • Imagem 4. Salrios dos empregados do Governo (The Texas Tribune)

    Visualizao integral dos Registros da Guerra do Iraque, Associated Press

    O trabalho de Jonathan Stray e Julian Burgess em cima dos Registros de Guerra

    do Iraque uma iniciativa inspiradora na anlise e visualizao de textos

    utilizando tcnicas experimentais para ganhar profundidade em temas que

    valem a pena serem explorados dentro de um grande conjunto de dados

    textuais.

    Por meio de tcnicas de anlise de texto e algoritmos, Jonathan e Julian criaram

    um mtodo que mostrava blocos de palavras-chave contidas nos milhares de

    relatrios do governo americano sobre Guerra do Iraque vazados pelo

    Wikileaks, tudo de uma forma visual.

    Embora haja restries aos mtodos apresentados e a abordagem seja

    experimental, o trabalho mostra um enfoque inovador. Em vez de tentar ler

    todos os arquivos e revirar os registros de guerra com uma noo preconcebida

    do que poderia ser achado com determinadas palavras-chaves, esta tcnica

    calcula e visualiza tpicos e termos-chave de particular relevncia.

    Com a crescente quantidade de informao textual (emails, relatrios, etc) e

    numrica vindo ao domnio pblico, achar maneiras de identificar reas vitais

  • de interesse ser mais e mais importante um subcampo excitante do

    jornalismo de dados.

    Cynthia OMurchu, Financial Times

    Imagem 5. Analizando os Registros de Combate (Associated Press)

  • Murder Mysteries

    Uma das minhas obras favoritas de jornalismo de dados o projeto Murder

    Mysteries de Tom Hardgrove do Scripps Howard News Service. Ele construiu

    um banco de dados detalhado de mais de 185 mil assassinatos no resolvidos a

    partir de dados governamentais e da requisio de registros pblicos. A partir

    disso, ele desenvolveu um algoritmo que procura por padres sugerindo a

    possvel presena de serial killers. Este projeto completo: trabalho rduo

    montando uma base de dados melhor que a do prprio governo, anlise

    inteligente usando tcnicas de cincias sociais e apresentao interativa dos

    dados online de modo que os leitores possam eles mesmos explorarem.

    Steve Doig, Walter Cronkite School of Journalism, Arizona State University

  • Imagem 6. Murder Mysteries (Scripps Howard News Service)

    Message Machine

    Eu adoro a reportagem e a postagem nerd do blog Message Machine da

    ProPublica. Tudo comeou quando alguns tuiteiros mostraram curiosidade

    sobre terem recebido diferentes emails da campanha presidencial de Obama. Os

    colegas da ProPublica notaram e pediram para seu pblico encaminhar

    qualquer email que tivesse recebido da campanha. A forma como mostram os

    dados elegante, uma apresentao visual da diferena entre muitos emails

  • distintos que foram enviados naquela noite. extraordinrio porque eles

    coletaram os prprios dados (reconhecidamente uma pequena amostra, mas

    grande o suficiente para montar uma reportagem). Mas ainda mais incrvel

    porque eles esto contando a histria de um fenmeno emergente: big data

    usado em campanhas polticas para disparar mensagens especificamente

    preparadas para cada pessoa. Isso s um gostinho das coisas por vir.

    Brian Boyer, Chicago Tribune

    Imagem 7. Message Machine (ProPublica)

    Chartball

    Um dos meus projetos de jornalismo de dados favoritos o trabalho de Andrew

    Garcia Phillips no Chartball. Andrew um grande f de esportes com um apetite

    voraz por dados, um olho espetacular para design e capacidade de programar.

    Com o Chartball ele visualiza no apenas a histria, mas detalha os sucessos e

    fracassos de cada um dos jogadores e dos times de beisebol. Ele coloca em

    contexto, cria um grfico atraente e seu trabalho profundo, divertido e

    interessante. E olha que eu nem me importo tanto com esportes.

    Sarah Slobin, Wall Street Journal

  • Imagem 8. Vitrias e derrotas em tabelas (Chartball)

  • Jornalismo de dados em perspectiva

    Em agosto de 2010, eu e alguns colegas do Centro Europeu de Jornalismo

    organizamos o que acreditamos ser uma das primeiras conferncias

    internacionais sobre jornalismo de dados, realizada em Amsterd. Naquele

    momento, no havia muitas discusses sobre o tema e poucas organizaes

    eram amplamente reconhecidas por trabalhar na rea.

    Um dos mais importantes passos para dar visibilidade ao termo foi a forma

    como grupos de mdia como The Guardian e The New York Times lidaram com

    a imensa quantidade de dados divulgados pelo WikiLeaks. Nesse perodo, o

    termo passou a ser usado de maneira mais ampla (ao lado de Reportagem com

    Auxlio do Computador, ou RAC) para descrever como jornalistas estavam

    usando dados para melhorar suas reportagens e para aprofundar investigaes

    sobre um tema.

    Ao conversar com jornalistas de dados experientes e tericos do Jornalismo no

    Twitter, me parece que uma das primeiras definies do que hoje reconhecemos

    como jornalismo de dados foi feita em 2006, por Adrian Holovaty, fundador do

    EveryBlock, um servio de informao que permite ao usurios descobrir o que

    est acontecendo na sua regio, no seu quarteiro. No seu pequeno ensaio "Uma

    maneira fundamental na qual sites de jornais tm que mudar", ele defende que

    jornalistas devem publicar dados estruturados, compreensveis por mquinas,

    ao lado do tradicional "grande borro de texto":

    Por exemplo, digamos que um jornal publicou uma notcia sobre um incndio

    prximo. Ler essa histria num celular bacana e elegante. Viva a tecnologia!

    Mas o que realmente quero ser capaz de explorar os dados brutos dessa

    histria, um a um, com diferentes camadas. Ter a infraestrutura para comparar

    detalhes deste incndio com os detalhes dos anteriores: data, horrio, local,

    vtimas, distncia para o quartel do Corpo de Bombeiros, nomes e anos de

    experincia dos bombeiros que foram ao local, tempo que levaram para chegar,

    e incndios subsequentes, quando vierem a ocorrer.

    Mas o que torna essa forma peculiar diferente de outros modelos de jornalismo

    que usam banco de dados ou computadores? Como e em que extenso o

    jornalismo de dados diferente das vertentes de jornalismo do passado?

  • Reportagem com Auxlio do Computador (RAC) e o Jornalismo de Preciso

    H uma longa histria de uso de dados para aprofundamento da reportagem e

    distribuio de informao estruturada (mesmo que no legvel por mquinas).

    Talvez o mais relevante para o que hoje chamamos de jornalismo de dados a

    Reportagem com Auxlio do Computador (RAC) que foi a primeira tentativa

    organizada e sistemtica de utilizar computadores para coletar e analisar dados

    para aprimorar a notcia.

    A RAC foi usada pela primeira vez em 1952 pela rede de TV americana CBS,

    para prever o resultado da eleio presidencial daquele ano. Desde a dcada de

    60, jornalistas (principalmente os investigativos, principalmente nos Estados

    Unidos) tm analisado bases de dados pblicas com mtodos cientficos para

    fiscalizar o poder de forma independente. Tambm chamado de "jornalismo de

    interesse pblico", defensores dessa tcnicas baseadas no auxlio do

    computador tm procurado revelar tendncias, contrariar o senso comum e

    desnudar injustias perpetradas por autoridades e corporaes. Por exemplo,

    Philip Meyer tentou desmontar a percepo de que apenas os sulistas menos

    educados participaram do quebra-quebra nas manifestaes de 1967 em Detroit.

    As reportagens da srie "A cor do dinheiro", publicadas nos anos 80 por Bill

    Dedman, revelaram preconceito racial sistemtico nas polticas de emprstimo

    dos principais bancos. No seu artigo "O que deu errado", Steve Doig procurou

    analisar os padres de destruio do Furaco Andrew no incio dos anos 90,

    para entender as consequncias das polticas e prticas falhas de

    desenvolvimento urbano. Reportagens movidas por dados prestaram valiosos

    servios pblicos e deram prmios cobiados aos autores.

    No incio dos anos 70, o termo jornalismo de preciso foi cunhado para

    descrever esse tipo de apurao jornalstica: "o emprego de mtodos de pesquisa

    das cincias sociais e comportamentais na prtica jornalstica" (em The New

    Precision Journalism de Philip Meyer). O jornalismo de preciso foi proposto

    para ser praticado nas instituies jornalsticas convencionais por profissionais

    formados em jornalismo e em cincias sociais. Nasceu como resposta ao "New

    Journalism", que aplicava tcnicas de fico reportagem. Meyer defendia que

    eram necessrios mtodos cientficos para coleta e anlise de dados, em vez de

    tcnicas literrias, para permitir que o jornalismo alcanasse sua busca pela

    objetividade e verdade.

  • O jornalismo de preciso pode ser entendido como reao a algumas das

    inadequaes e fraquezas do jornalismo normalmente citadas: dependncia dos

    releases de assessorias (mais tarde descrito como "churnalism" ou "jornalismo

    de batedeira"), predisposio em acatar as verses oficiais, e por a vai. Estas so

    decorrentes, na viso de Meyer, da no aplicao de tcnicas e mtodos

    cientficos como pesquisas de opinio e consulta a registros pblicos. Como feito

    nos anos 60, o jornalismo de preciso serviu para retratar grupos marginais e

    suas histrias. De acordo com Meyer:

    O jornalismo de preciso foi uma forma de expandir o arsenal de ferramentas

    do reprter para tornar temas antes inacessveis, ou parcialmente acessveis, em

    objeto de exame minucioso. Foi especialmente eficiente para dar voz minoria e

    grupos dissidentes que estavam lutando para se verem representados.

    Um artigo influente publicado nos anos 80 sobre a relao entre o jornalismo e

    as cincias sociais ecoa o discurso atual em torno do jornalismo de dados. Os

    autores, dois professores de jornalismo americanos, sugerem que nas dcadas

    de 70 e 80, a compreenso do pblico sobre o que notcia se amplia de uma

    concepo mais direta de "fatos noticiosos" para "reportagens de

    comportamento" (ou reportagens sobre tendncias sociais). Por exemplo, ao

    acessar os bancos de dados do Censo ou de outras pesquisas, os jornalistas

    conseguem "extrapolar o relato de eventos isolados e oferecer contexto que d

    sentido ao fatos especficos".

    Como podamos esperar, a prtica do uso de dados para incrementar a

    reportagem to antiga quanto a prpria existncia dos dados. Como Simon

    Rogers aponta, o primeiro exemplo de jornalismo de dados no The Guardian

    remonta a 1821. Foi uma lista, obtida de fonte no oficial, que relacionava as

    escolas da cidade de Manchester ao nmero de alunos e aos custos de cada uma.

    De acordo com Rogers, a lista ajudou a mostrar o verdadeiro nmero de alunos

    que recebiam educao gratuita, muito maior do que os nmeros oficiais

    revelavam.

  • Imagem 9. Jornalismo de dados no The Guardian em 1821 (the Guardian)

    Outro exemplo seminal na Europa Florence Nightingale e seu relato

    fundamental,"Mortalidade no Exrcito Britnico", publicado em 1858. No seu

    relato ao Parlamento ingls, ela usou grficos para defender o aperfeioamento

    do servio de sade do exrcito britnico. O mais famoso o seu grfico crista

    de galo, uma espiral de sees em que cada uma representa as mortes a cada

    ms, que destacava que a imensa maioria das mortes foi consequncia de

    doenas prevenveis em vez de tiros.

    Imagem 10. Mortalidade do exrcito britnico por Florence Nightingale (imagem da Wikipedia)

  • Jornalismo de dados e a Reportagem com Auxlio do Computador

    Atualmente h um debate sobre "continuidade e mudana" em torno do rtulo

    "jornalismo de dados" e sua relao com vertentes jornalsticas anteriores que

    empregaram tcnicas computacionais para analisar conjuntos de dados.

    Alguns defendem que h diferena entre RAC e jornalismo de dados. Defendem

    que RAC uma tcnica para apurar e analisar dados de forma a aprimorar uma

    reportagem (normalmente investigativa), enquanto o jornalismo de dados se

    concentra na maneira como os dados permeiam todo o processo de produo

    jornalstico. Nesse sentido, o jornalismo de dados dedica tantas vezes, at

    maisateno aos dados propriamente ditos em vez de apenas empreg-los

    como forma de descobrir ou melhorar uma reportagem. Por isso, vemos o

    Datablog do The Guardian e o jornal Texas Tribune publicando conjunto de

    dados lado a lado com as notcias - ou at mesmo apenas os dados sozinhos

    para as pessoas analisarem ou explor-los.

    Outra diferena que, no passado, jornalistas investigativos enfrentariam

    escassez de informaes em relao a questo que estavam tentando responder

    ou ponto que buscavam esclarecer. Embora, evidentemente, isso continua a

    acontecer, h ao mesmo tempo uma abundncia de informaes que os

    jornalistas no necessariamente sabem como manipular. No sabem como

    extrair valor dos dados. Um exemplo recente o Combined Online Information

    System, maior banco de dados de gastos pblicos do Reino Unido. Este banco

    de dados foi por muito tempo cobrado pelos defensores da transparncia mas,

    quando foi lanado, deixou jornalistas perplexos e confusos. Como Philip Meyer

    escreveu recentemente para mim: "Quando a informao era escassa, a maior

    parte dos nossos esforos eram dedicados caa e obteno de informao.

    Agora que abundante, o processamento dessa informao mais importante."

    Por outro lado, alguns ponderam que no h diferena significativa entre o

    jornalismo de dados e a Reportagem com Auxlio do Computador. J senso

    comum que mesmo as mais modernas tcnicas jornalsticas tem um histrico e,

    ao mesmo tempo, algo de novo. Em vez de debater se o jornalismo de dados

    uma novidade completa ou no, uma posio mais produtiva seria consider-lo

    parte de longa tradio, mas que agora responde a novas circunstncias e

    condies. Mesmo que no haja uma diferena entre objetivos e tcnicas, o

    surgimento do termo "jornalismo de dados" no incio do sculo indica nova fase

    em que o absoluto volume de dados que esto disponveis onlinecombinado

  • com sofisticadas ferramentas centradas no usurio, plataformas de

    crowdsourcing e de publicao automtica --permitem que mais pessoas

    trabalhem com mais dados mais facilmente do que em qualquer momento

    anterior da histria.

    Jornalismo de dados significa alfabetizao de dados do pblico

    A internet e as tecnologias digitais esto alterando fundamentalmente a forma

    como a informao publicada. O jornalismo de dados uma parte do

    ecossistema de prticas e ferramentas que surgiram em torno dos servios e

    sites de dados. Citar e compartilhar fontes e referncias faz parte da natureza da

    estrutura de links da internet, a forma como estamos acostumados a navegar

    pela informao hoje em dia. Voltando um pouco no tempo, o princpio na base

    da fundao da estrutura de links da web o mesmo princpio de citao usado

    nos trabalhos acadmicos. Citar e compartilhar as fontes e dados por trs da

    notcia uma das maneiras mais bsicas em que o jornalismo de dados pode

    aperfeioar o jornalismo, aquilo que o fundador da WikiLeaks, Julian Assange,

    chama de "jornalismo cientfico".

    Ao permitir que cada um mergulhe com ateno nas fontes de dados e descubra

    informao relevante para si mesmo, ao mesmo tempo que checa afirmaes e

    desafia suposies comumente aceitas, o jornalismo de dados efetivamente

    representa a democratizao de recursos, ferramentas, tcnicas e mtodos antes

    restritos aos especialistas; seja reprteres investigativos, cientistas sociais,

    estatsticos, analistas ou outros especialistas. Ao mesmo tempo em que citar e

    oferecer links para as fontes de dados caracterstica do jornalismo de dados,

    estamos caminhando para um mundo em que os dados esto perfeitamente

    integrados ao tecido da mdia. Jornalistas de dados tm papel importante ao

    ajudar a diminuir as barreiras para compreenso e imerso nos dados, e

    aumentar a alfabetizao de dados dos seus leitores em grande escala.

  • No momento, a comunidade de pessoas que se auto-denominam jornalistas de

    dados bastante diferente da comunidade mais madura da RAC. Tomara que,

    no futuro, vejamos laos mais fortes entre essas duas comunidades, da mesma

    forma que vemos novas organizaes no governamentais e organizaes de

    mdia cidad como a ProPublica e o Bureau de Jornalismo Investigativo

    trabalharem de mos dadas com redaes tradicionais em investigaes. Ao

    mesmo tempo em que a comunidade de jornalismo de dados possa ter formas

    inovadoras para entregar dados e apresentar notcias, a abordagem

    profundamente analtica e crtica da comunidade da RAC tem muito a ensinar

    ao jornalismo de dados.

    Liliana Bounegru, Centro Europeu de Jornalismo

  • O jornalismo guiado por dados numa perspectiva brasileira

    A partir do final dos anos 2000, as prticas de Jornalismo Guiado por

    Dados (JGD) no apenas estavam em vias de se estabelecer nas redaes da

    Amrica do Norte e Europa, como tambm haviam se tornado a principal

    estratgia de grande parte da imprensa para a recuperao da audincia, que

    vem caindo h dcadas. Pode-se dizer que, hoje, o jornalismo guiado por dados

    est na moda. Alm da popularizao das ferramentas e do apelo comercial de

    visualizaes e outros produtos relacionados ao JGD, foi importante para isso a

    adoo de polticas de acesso informao e transparncia por governos de todo

    o mundo. Conhecidos como polticas de dados abertos (open data) ou

    transparncia pblica (open government), estes mecanismos inundaram a

    Internet com bases de dados antes muito difceis de se obter. Os jornalistas,

    portanto, tm hoje o material e as ferramentas para o o JGD ao alcance das

    mos.

    Servios online, como Google Drive, Infogr.am, DocumentCloud e CartoDB,

    apenas para citar alguns, permitem construir, organizar e analisar bancos de

    dados, bastando um computador e habilidade com a lngua inglesa para us-los.

    Em maio de 2012, a Presidncia da Repblica sancionou a Lei n 12.527,

    conhecida como Lei de Acesso Informao, que obriga todos os rgos

    pblicos brasileiros a divulgar dados administrativos e a atender a solicitaes

    de informao qualquer cidado. Estes dois fatores reavivaram o interesse da

    imprensa brasileira pela aplicao de tcnicas computacionais na produo de

    notcias.

    So os prprios reprteres, individualmente, os principais disseminadores dos

    conceitos de JGD no cenrio mundial. Voc pode encontrar aqui uma lista de

    quase cem referncias com links para esses trabalhos. No Brasil, existem cada

    vez mais jornalistas se preparando para atuar nesta especialidade, alm dos

    veteranos da Reportagem Assistida por Computador (RAC) dos anos 1990. Um

    dos principais indcios deste interesse foi a criao de uma equipe dedicada

    apenas ao jornalismo guiado por dados na redao de O Estado de So Paulo,

    pioneira no Brasil, no ano de 2012. Em maio daquele ano, a equipe do Estado

    Dadoslanou o Basmetro, um dos primeiros aplicativos jornalsticos

    brasileiros. Em agosto do mesmo ano, a Folha de S. Paulo passou a hospedar o

    blog FolhaSPDados, cujo objetivo criar visualizaes grficas e mapas

    relacionados s reportagens publicadas no veculo impresso e no site da

  • empresa. A mesma Folha passou a hospedar o blog Afinal de Contas, dedicado a

    analisar o noticirio a partir de anlises de dados. Outros veculos, como a

    Gazeta do Povo, do Paran, tm usado a experincia da redao com jornalismo

    investigativo na produo de grandes reportagens baseadas em dados. J o

    gacho Zero Hora, por exemplo, vem se dedicando ao tema do jornalismo

    guiado por dados e transparncia pblica atravs de reportagens e do blog Livre

    Acesso, inaugurado em 2012 para acompanhar a aplicao da Lei de Acesso

    Informao no pas.

    No campo do jornalismo independente, o principal exemplo o InfoAmaznia,

    criado em 2012 pelo Knight Fellow Gustavo Faleiros, em parceria com o

    webjornal O Eco e a Internews. Em 2013, O Eco criou o Ecolab, um Laboratrio

    de Inovao em Jornalismo Ambiental. A Agncia Pblica outra redao

    independente a aplicar tcnicas de JGD, embora o faa esparsamente. Apesar

    disso, foi responsvel por uma das principais contribuies ao JGD no Brasil,

    por meio de uma parceria com o Wikileaks, para oferecer a biblioteca de

    documentos diplomticos PlusD, entre outras bases de dados.

    Estes exemplos sugerem estarmos vivenciando os primeiros passos de um

    movimento de institucionalizao das prticas de jornalismo guiado por dados

    nas redaes brasileiras. As bases do sucesso do JGD no pas, entretanto, foram

    lanadas nos anos 1990.

    Breve histrico do Jornalismo Guiado Por Dados no Brasil

    Ainda durante o governo de Fernando Collor de Mello como presidente do

    Brasil, o jornalista Mrio Rosa, ento empregado no Jornal do Brasil, usou o

    Sistema Integrado de Administrao Financeira do Governo Federal (Siafi) para

    verificar o superfaturamento na compra de leite em p pela Legio Brasileira de

    Assistncia, ento presidida pela primeira-dama, Rosane Collor. Lcio Vaz

    relata o caso no livro A tica da malandragem:

    Assinada pelo jornalista Mrio Rosa, a matria estava completa, com dados

    jamais vistos, como nmeros de ordens bancrias (Obs.) e de empenhos

    (reservas feitas no Oramento da Unio). Mrio havia descoberto o Sistema

    Integrado de Administrao Financeira (Siafi), uma expresso que se tornaria

    muito conhecida de jornalistas e polticos nos anos seguintes. O acesso a esse

    sistema, que registra os gastos do governo federal, possibilita fazer uma

    completa radiografia de todos os pagamentos feitos a empreiteiras,

    fornecedores, Estados e municpios. Uma mina de diamante para os reprteres.

  • O jornalismo ganhava uma nova e importante fonte de informao, mais

    tcnica, quase cientfica. Estavam superados os mtodos mais arcaicos de

    apurao, que envolviam, eventualmente, o enfrentamento com jagunos.

    Na poca, o acesso a este tipo de base de dados governamental era vedado a

    cidados e jornalistas. O prprio autor da reportagem, Mrio Rosa, s pde

    realizar pesquisas no Siafi porque o ento senador Eduardo Suplicy (PT-SP) lhe

    emprestou a senha a que tinha direito no desempenho de suas atividades

    parlamentares. A partir desta e de outras reportagens, o Governo Federal

    decidiu permitir oficialmente o acesso de jornalistas ao Siafi, tornando-o uma

    das primeiras bases de dados pblicas a serem franqueadas a reprteres no

    Brasil.

    Ascnio Seleme, hoje diretor de redao de O Globo, foi outro reprter que,

    ainda nos anos 1990, usou a senha de um parlamentar para realizar pesquisas

    no Siafi, em colaborao com o analista econmico Gil Castelo Branco, diretor

    da Organizao No-GovernamentalContas Abertas. Estes dois casos so,

    provavelmente, os primeiros exemplos de JGD na histria do jornalismo

    brasileiro.

    Ao longo dos anos 1990, reprteres como Fernando Rodrigues e Jos Roberto

    de Toledo, da Folha de S. Paulo, comeam a usar tcnicas de RAC. A partir de

    cursos ministrados na redao por tutores do National Institute for Computer-

    Assisted Reporting dos Estados Unidos, uma subdiviso da associao

    Investigative Reporters and Editors (IRE/NICAR), estas tcnicas foram

    disseminadas na redao e depois passaram a integrar o currculo do programa

    de trainees da Folha. A partir de 1998, Fernando Rodrigues comeou a construir

    o banco de dados Polticos do Brasil, lanado na Web e em livro. Em 2002, Jos

    Roberto de Toledo se torna um dos scios-fundadores e vice-presidente

    da Associao Brasileira de Jornalismo Investigativo (Abraji), entidade

    fundamental na disseminao dos conceitos e tcnicas da RAC no Brasil, tendo

    treinado mais de quatro mil jornalistas.

    A estruturao da Abraji se deu a partir de um seminrio promovido pelo

    Centro Knight para o Jornalismo nas Amricas em dezembro de 2002, cujos

    principais palestrantes foram Brant Houston, autor de um manual de RAC e

    ento diretor do IRE, e Pedro Armendares, da organizao mexicana Periodistas

    de Investigacin, que era um dos tutores dos cursos de RAC organizados pela

    Folha de S. Paulo.

  • Embora seja uma associao voltada ao jornalismo investigativo em geral, a

    Abraji atuou na ltima dcada principalmente na divulgao da RAC e na defesa

    do acesso informao, como uma das entidades integrantes do Frum de

    Direito de Acesso a Informaes Pblicas, criado em 2003, e atravs de cursos e

    palestras dois fatores fundamentais para a emergncia do jornalismo guiado

    por dados ao longo da dcada de 2000. Duas outras entidades tiveram um papel

    importante no estabelecimento destas prticas nas redaes brasileiras: as

    organizaes no-governamentais Transparncia Brasil e Contas Abertas.

    A primeira foi criada em 2000 com o objetivo de construir e manter bases de

    dados sobre financiamento eleitoral, histrico de vida pblica e processos

    sofridos por parlamentares em nvel municipal, estadual e federal, notcias

    sobre corrupo publicadas nos principais jornais brasileiros e sobre o

    desempenho dos juzes membros do Supremo Tribunal Federal. A segunda

    entidade, criada em 2005, acompanha o processo de execuo oramentria e

    financeira da Unio, atravs de monitoramento do Siafi, e promove o

    treinamento de jornalistas para fiscalizar gastos pblicos. As bases de dados

    mantidas pela Transparncia Brasil e Contas Abertas permitiram a reprteres

    realizar reportagens investigativas ao longo da dcada, quando o acesso s

    informaes do Estado dependia de gesto caso-a-caso junto a rgos do

    governo e s redaes no investiam neste tipo de recurso.

    Um indcio da crescente importncia das bases de dados para as redaes ao

    longo da dcada de 2000 est na lista de vencedores do Prmio Esso de Melhor

    Contribuio Imprensa, vencido em 2002 e 2006 por Fernando Rodrigues,

    pelo arquivo de declaraes de bens de polticos brasileiros Controle Pblico e

    pelo livro Polticos do Brasil, respectivamente; pela Transparncia Brasil, em

    2006, e pela Contas Abertas, em 2007. Em 2010, a reportagem vencedora do

    Prmio Esso, o mais importante do jornalismo brasileiro, foi a srie Drios

    Secretos, publicada pela Gazeta do Povo, do Paran. Para elucidar os

    movimentos de contratao de funcionrios na Assembleia Legislativa do

    Paran, os reprteres construram um banco de dados com todas as nomeaes

    realizadas pela casa entre 2006 e 2010, a partir de dirios oficiais impressos.

    Cruzando os dados no software para criao de planilhas Microsoft Excel,

    puderam descobrir casos de contratao de funcionrios-fantasmas e

    nepotismo.

  • Dados so a tbua de salvao da imprensa?

    Esse breve histrico sugere que o jornalismo guiado por dados no foi

    assimilado pelas redaes brasileiras atravs da divulgao promovida por

    associaes profissionais internacionais, imprensa e jornalistas, que tem se

    intensificado desde 2010, mas vem sendo constitudo como prtica na cultura

    jornalstica brasileira em paralelo com o processo de informatizao. Todavia,

    pode-se inferir que o interesse crescente de empresas e profissionais do mundo

    inteiro pelo jornalismo guiado por dados alimenta e incentiva o interesse pelo

    tema nas redaes do Brasil. Nmeros da ferramenta de buscas Google mostram

    que, a partir de 2010, h um volume crescente de procura por pginas

    relacionadas ao jornalismo guiado por dados, como pode ser verificado na

    figura abaixo.

    Imagem 11. Volume de buscas por data journalism entre janeiro de 2010 e agosto de 2013

    (Google Trends, 18 set. 2013)

    O primeiro ponto de inflexo na curva de interesse pelo termo data journalism

    (jornalismo de dados) no Google coincide com a criao de uma seo dedicada

    ao tema, o DataBlog, pelo jornal britnico The Guardian, no final de 2010, e

    atinge seus dois maiores picos em maio de 2012, quando o jornal americano

    Seattle Times ganha o prmio de melhor reportagem em jornalismo guiado por

    dados da associao Global Editors Network, e em abril de 2013, quando o The

    Guardian publica no repositrio de vdeos YouTube um documentrio sobre a

    histria do jornalismo guiado por dados na redao do veculo britnico.

    O interesse da imprensa pelo jornalismo guiado por dados, porm, j era

    evidente dois anos. No dia 11 de janeiro de 2009, a New York Magazine, editada

    pelo grupo controlador do New York Times, trazia na capa a manchete O novo

    jornalismo e uma foto de duas pginas de cinco membros dos setores de

    Tecnologias para Redao Interativa, grficos e multimdia da empresa,

    acompanhada do subttulo O que estes cybergeeks renegados esto fazendo no

    New York Times? Talvez o salvando. A matria conta a histria da formao do

  • grupo de Tecnologias para Redao Interativa dentro da organizao, cujos

    membros, liderados por Aron Pilhofer, so classificados na reportagem como

    nerds, desenvolvedores/reprteres ou reprteres/desenvolvedores e

    cybergeeks.

    O New York Times uma das maiores e mais respeitadas empresas de

    jornalismo do mundo e, para alm do sucesso mercadolgico, pode ser

    considerada a prpria encarnao da cultura e da mitologia da profisso. O

    interesse das redaes brasileiras e mundiais pelas prticas de jornalismo

    guiado por dados no est ligado apenas a seus benefcios para as rotinas

    produtivas e o atendimento do interesse pblico, mas tambm esperana de

    salvar uma indstria em decadncia justamente por efeito das tecnologias

    digitais.

    Marcelo Trsel, Pontifcia Universidade Catlica do Rio Grande do Sul

  • Existe jornalismo de dados e visualizao no Brasil?

    Existe jornalismo de dados e de visualizao no Brasil? Existe. Est crescendo?

    Quero acreditar que est, mas no de jeito sistemtico e organizado, e no na

    grande mdia. Sendo honesto, tenho pouca esperana de que estas tcnicas e

    ferramentas vo criar razes profundas nela com algumas excees notveis

    , pelo menos at que no aconteam algumas mudanas profundas. Aqui esto

    alguns dos principais motivos:

    1. A alergia ao pensamento lgico, racional, e quantitativo: Tenha em

    conta s os seguintes fatos: Alguns dos principais jornais do pas continuam

    a publicar horscopos sem pudor nenhum; as TVs nacionais cobrem

    aparies de virgens e santos como se fossem fatos, e no iluses; a principal

    revista semanal de informao geral uma fonte substancial de exemplos de

    grosseira falta de critrio estatstico e visual. Estes so s sintomas de um

    fenmeno subjacente que pode gerar um clima pouco propcio para o

    desenvolvimento da profisso.

    2. A falta de conhecimento dos rudimentos de mtodos de pesquisa:

    O jornalista brasileiro, como muitos outros de tradio mediterrnea (no se

    esqueam que sou espanhol) , em geral, um escritor-humanista, no um

    pesquisador-cientista. Como ter os dois perfis fundamental em qualquer

    redao, a mdia brasileira precisa hoje menos do primeiro e mais do

    segundo. Em algumas palestras no pas, enquanto comentava exemplos de

    grficos ou histrias que poderiam ser melhoradas, falei casualmente: Aqui

    podem ver um caso claro de quando melhor usar a mediana e no a

    mdia, s para ficar chocado pelos olhares de confuso de uma parte da

    audincia. Se ns no sabemos algo to bsico como o que uma mediana, o

    que dizer de desvio padro, anlises de regresso, valor-p, ou mtodos

    bayesianos, to em moda hoje graas ao sucesso de Nate Silver no The New

    York Times?

    3. O ensino universitrio do jornalismo: A falta de sabedoria cientfica e

    tecnolgica culpa, em grande parte, de um sistema de educao que no

    tem se adaptado s necessidades dos jornalistas de hoje. Em um mundo em

    que os dados so cada vez mais acessveis, em que empresas e governos

    contratam especialistas para manipular dados antes de apresent-los ao

    pblico, o corpo profissional, que na teoria teria que servir de filtro, carece

    das habilidades necessrias para cumprir com seu trabalho adequadamente.

  • Pior, por culpa do prximo ponto que descrevo, tambm est se blindando

    contra colegas que possam ajudar nessa tarefa.

    4. A obrigatoriedade do diploma: A deciso nscia de fazer o diploma

    universitrio de jornalismo obrigatrio para o exerccio da profisso pode

    dificultar o emprego de gente com perfil diverso para as redaes a no ser

    em posies de segunda categoria. Alem disso, a exigncia do diploma

    servir tambm como desculpa para que os departamentos de Jornalismo

    no sintam a necessidade de se renovarem para oferecer aos estudantes um

    melhor treinamento em habilidades conceituais e tecnolgicas.

    Por que isto um grande desafio? Hoje muito difcil achar jornalistas

    diplomados que, ao mesmo tempo, tenham conhecimentos cientficos ou

    tcnicos profundos. No s que o jornalista mdio no saiba mexer com

    dados; que no sabe nem ler uma tabela de nmeros, colocar eles em contexto,

    e extrair histrias, o que muito mais importante. Como consequncia, a

    grande mdia precisa contar com especialistas (cientistas, economistas,

    socilogos, etc.) como reprteres e editores, e tambm com profissionais de

    cincias da computao para colaborar na anlise profunda e na gesto de

    dados.

    Me permitam fazer um parntese neste ponto, e ser muito claro. Um hacker que

    desenvolve ferramentas para que os cidados acessem dados pblicos, e que

    segue as regras ticas prprias da profisso, to jornalista quanto o reprter

    que escreve sobre o ltimo escndalo do Governo, gostem os partidrios do

    diploma obrigatrio ou no. Se for contratado por um meio de comunicao,

    deve ser na posio de jornalista ou, pelo menos, com salrio e poder de deciso

    equivalentes aos de um reprter ou editor no mesmo nvel.

    Eu leciono infografia e visualizao numa escola de Comunicao e Jornalismo.

    No conheo nenhum caso de ex-estudante que tenha mostrado o seu diploma

    para um empregador durante uma entrevista. Os jovens jornalistas so

    avaliados pelas suas habilidades e conhecimentos.

    Por que ter esperana

    Na situao atual, portanto, impensvel que mesmo os melhores jornais do

    pas reproduzam o que grandes meios de comunicao dos Estados Unidos

    The New York Times, The Washington Post, The Boston Globe, LA Times,

    ProPublica, The Texas Tribune esto conseguindo: juntar equipes

  • multidisciplinares que sistematicamente criam complexos e profundos projetos

    de jornalismo de dados, visualizaes e infogrficos interativos.

    Essas publicaes no consideram o jornalismo de dados acessrio ou enfeite,

    mas elemento central das suas coberturas que no s do prestgio, mas

    tambm atraem leitores. Em recentes palestras, Jill Abramson, diretora

    executiva do The New York Times, se referiu aos seus departamentos de news

    applications (aplicativos interativos de notcia), multimdia e infografia como

    pilares essenciais do jornal e do seu rumo futuro. Um dos exemplos mais citados

    por ela Snow Fall, uma cobertura multimdia, que de forma muito orgnica

    mistura texto com imagem, animaes e infografias.

    Tendo em conta este panorama desolador, porque acho que o jornalismo de

    dados e a visualizao podem crescer e, por sinal, esto crescendo no Brasil? No

    que que baseio minha esperana?

    Em primeiro lugar, em corajosas iniciativas dentro dos grandes veculos

    jornalsticos. So produto geralmente do esforo no suficientemente

    reconhecido e sustentado de pequenos grupos de profissionais com vontade e

    energia. A equipe do Estado Dados e o blog Afinal de contas, de Marcelo Soares

    na Folha de S. Paulo so bons exemplos. So ainda s sementes de um

    fenmeno que teria que florescer nos prximos anos, mas pelo menos existem.

    Tem tambm projetos isolados, espordicos, feitos por outros veculos da mdia,

    como as revistas poca e Veja, e jornais como o Correio, na Bahia, o Estado, e a

    Folha. Porm, falta dar continuidade a estes casos notveis.

  • Em segundo lugar, indivduos e organizaes alm da mdia tradicional esto

    mostrando uma criatividade invejvel. No tenho inteno de ser exaustivo na

    listagem de projetos que tem chamado a minha ateno nos ltimos tempos,

    mas gostaria de destacar alguns que combinam os dados com um interessante

    trabalho de design e visualizao:InfoAmazonia e sua impressionante

    combinao de bancos de dados e representao cartogrfica; o Radar

    Parlamentar, que analisa matematicamente os padres de voto dos

    congressistas; as propostas resultantes do W3C, como o Retrato da Violncia

    Contra a Mulher no RS e Para Onde vai Meu Dinheiro; e o projeto Escola que

    queremos.

    Quem sabe, talvez sejam estes hackers, desenvolvedores, designers, jornalistas

    independentes, organizaes no governamentais, e fundaes os que ocupem

    um espao hoje quase vazio, e os que cumpram uma parte importante da tarefa

    de informao pblica que, em tempos anteriores, correspondeu mdia

    tradicional. O futuro promete, em qualquer caso. Alberto Cairo,

    Universidade de Miami

  • Na Redao

    Como o jornalismo de dados encontra espao em redaes pelo mundo? Como

    os pioneiros do jornalismo de dados convenceram seus colegas de que era uma

    boa ideia publicar bases de dados ou lanar aplicativos baseados em dados? Os

    jornalistas devem aprender a programar ou trabalhar em conjunto com

    desenvolvedores talentosos? Nesta seo olharemos para o papel do jornalismo

    de dados na Australian Broadcasting Corporation, BBC, Chicago Tribune,

    Guardian, Texas Tribune e Zeit Online. Aprenderemos como identificar e

    contratar bons desenvolvedores, como fazer com que as pessoas se

    comprometam com um tema atravs de hackatonas (maratonas hackers) e

    outros eventos, como colaborar alm das fronteiras e modelos de negcio para

    jornalismo de dados.

    O que h neste captulo?

    O Jornalismo de dados da ABC (Australian Broadcasting Corporation)

    Jornalismo de Dados na BBC

    Como trabalha a equipe de aplicativos de notcias no Chicago Tribune

    Bastidores do Guardian Datablog

    Jornalismo de dados no Zeit Online

    Como contratar um hacker

  • Aproveitando a expertise dos outros com Maratonas Hacker

    Seguindo o Dinheiro: Jornalismo de dados e Colaborao alm das Fronteiras

    Nossas Histrias Vm Como Cdigo

    Kaas & Mulvad: Contedo pr-produzido para comunicao segmentada

    Modelos de Negcio para o Jornalismo de Dados

  • O Jornalismo de dados da ABC (Australian Broadcasting

    Corporation)

    A Australian Broadcasting Corporation a empresa pblica de radiofuso na

    Austrlia. O oramento anual gira em torno de um 1 bilho de dlares

    australianos, que abastece sete redes de rdio, 60 estaes locais de rdio, 3

    servios digitais de televiso, um novo servio internacional de televiso e uma

    plataforma online para transmitir a oferta cada vez maior de contedo gerado

    pelo usurio. Na ltima contagem, havia mais de 4.500 funcionrios em tempo

    equivalente a integral e quase 70% deles produzem contedo.

    Ns somos uma radiofusora nacional intensamente orgulhosa de nossa

    independncia; embora sejamos financiados pelo governo, temos autonomia

    garantida por lei. Nossa tradiao o servio pblico independente de

    jornalismo. A ABC reconhecida como a empresa de mdia mais confivel no

    pas.

    Estes so tempos estimulantes; sob a gesto de um diretor administrativo (o ex-

    executivo de jornal Mark Scott), os produtores de contedo da ABC foram

    encorajados a ser "geis", como diz o mantra corporativo.

    claro que mais fcil falar do que fazer.

    Mas uma inciativa recente para incentivar essa produo foram competies nas

    quais os funcionrios faziam rpidas apresentaes (pitchs) de projetos

    multiplataforma que gostariam de desenvolver - as ideias vencedoras recebiam

    o financiamento da empresa. Assim foi concebido o primeiro projeto de

    jornalismo de dados da ABC.

    No comeo de 2010, entrei em um desses pitchs para mostrar minha proposta

    para trs dos avaliadores. Eu estava remoendo esta ideia h algum tempo,

    ambicionando algo como o jornalismo de dados que o, agora legendrio,

    Guardian Datablog estava oferecendo. E isso foi s o comeo.

    Meu raciocnio era de que, sem dvida, dentro de 5 anos a ABC teria sua prpria

    diviso de jornalismo de dados. Era inivitvel, opinei. Mas a questo era como

    chegaramos l e quem comearia.

    Para os leitores que desconhecem a ABC, pensem em uma grande burocracia

    construda ao longo de 70 anos. Seus carros-chefes sempre foram rdio e

    televiso. Com o advento do website, na ltima dcada a oferta de contedo

    desenvolveu-se em texto, fotos e num grau de interatividade inimaginvel no

  • passado. O espao virtual estava forando a ABC a repensar os modos de obter

    lucro e o seu contedo. claro que um trabalho contnuo.

    Mas algo mais estava acontecendo com o jornalismo de dados. O governo 2.0

    (que, como descobrimos, largamente ignorado na Austrlia) estava comeando

    a oferecer novas maneiras de contar histrias at ento limitadas a zeros e uns.

    Eu disse tudo isso para as pessoas durante minha rpida apresentao. Tambm

    disse que precisvamos identificar novos conjuntos de habilidades e treinar

    jornalistas em novas ferramentas. Precisvamos de um projeto para comear.

    E eles me deram o dinheiro para isso.

    Em 24 de Novembro de 2011, o projeto multiplataforma online de notcias da

    ABC foi lanado com Coal Seam Gas by the Numbers (Gs Metano de Carvo em

    Nmeros).

    (Nota da traduo: O gs metano retirado do carvo um tipo de gs natural

    usado como combustvel. Como foram descobertas grandes e valiosas reservas

    desse gs na Austrlia, e sua explorao pode envolver problemas ambientais,

    ele se tornou um dos principais assuntos em discusso no pas)

    Imagem 1. Coal Seam Gas by the Numbers (ABC News Online)

    Foi feito com cinco pginas de mapas interativos, visualizao de dados e texto.

    No era exclusivamente jornalismo de dados, mas um hbrido de diferentes

    formas de jornalismo nascido da mistura das pessoas na equipe e do tema, um

    dos assuntos mais quentes na Australia.

  • A "jia da coroa" do projeto era um mapa interativo mostrando poos de

    metano e concesses de explorao na Austrlia. Os usurios podem pesquis-

    los por localizao e alternar entre o layout que mostra a concesso ou os poos.

    Dando um zoom no mapa, podem acompanhar o responsvel pela explorao, a

    condio do poo, e a sua data de perfurao. Outro mapa mostra onde h

    explorao do gs prxima a aquferos australianos.

    Imagem 2. Mapa interativo de poos de gs e concesses na Austrlia (ABC News Online)

    Ns fizemos visualizaes de dados que trataram especificamente do problema

    da gerao de um subproduto de gua com grande concentrao de sal. Outra

    parte do projeto investigou o despejo de produtos qumicos numa bacia de rios.

    Nosso Time

    Um desenvolvedor web e webdesigner

    Um jornalista que liderou o projeto

    Um pesquisador, trabalhando meio-perodo, com expertise em extrao de

    dados, planilhas de Excel, e "limpeza" dos dados

    Um jornalista iniciante trabalhando meio perodo

  • Um consultor de produo executiva

    Um consultor acadmico, com experincia em minerao de dados,

    visualizao de grficos e habilidades avanadas de pesquisa

    Os servios de um gerente de projetos e a assistncia administrativa da

    unidade multiplataforma da ABC

    Importante destacar que ns tambm tivemos um grupo de jornalistas de

    referncia e outras pessoas que amos consultando conforme precisvamos

    De Onde Conseguimos os Dados?

    As informaes para os mapas interativos foram retiradas de shapefiles (um

    tipo comum de dado geoespacial) baixados de sites do governo.

    Outros dados sobre a gua e o sal vieram de diferentes relatrios

    As informaes sobre os lanamentos de qumicos vieram de licenas

    ambientais emitidas pelo governo.

    O Que Aprendemos?

    O projeto Coal Seam Gas by the Numbers foi ambicioso no contedo e na escala.

    O mais importante para mim foio que aprendemos e como poderamos fazer

    isso de uma maneira diferente da prxima vez"

    O projeto juntou um monte de pessoas que normalmente no se encontravam

    na ABC: em termos leigos, os hacks e os hackers. Muitos de ns no falvamos a

    mesma lngua e nem mesmo acompanhvamos o trabalho do outro grupo.

    Jornalismo de dados disruptivo!

    Lies prticas:

    Estar num mesmo local vital para a equipe. Nosso desenvolvedor e

    designer trabalhou fora da ABC e veio para as reunies. Isso,

    definitivamente, no o ideal! Coloque todos na mesma sala dos jornalistas.

    Nosso consultor de produo executiva tambm estava em outro andar do

    prdio. Precisvamos estar muito mais perto para que tivssemos a

    possibilidade de "dar uma passada" rapidamente.

    Escolha uma histria que exclusivamente orientada pelos dados

  • Olhando o Contexto

    Grandes organizaes de mdia precisam se engajar na construo de

    capacidades para enfrentar os desafios do jornalismo de dados. Meu palpite

    que h um monte de geeks e hackers se escondendo nos departamentos mais

    tcnicos das empresas desesperados para sair. Ento precisamos de workshops

    "hack e hacker" onde os geeks escondidos, jornalistas jovens, desenvolvedores

    web e webdesigners saiam para brincar com os jornalistas mais experientes e

    compartilhem habilidades e que sejam orientados.

    Ipso facto, o jornalismo de dados interdisciplinar. Equipes de jornalismo de

    dados so feitas de pessoas que no tenham trabalhado juntas antes. O espao

    digital borrou as fronteiras.

    Vivemos em um meio poltico fraturado e de desconfiana. O modelo de negcio

    que antes entregava jornalismo profissional independenteimperfeito como

    ele est beira do colapso. Devemos nos perguntar, como muitos j esto

    fazendo, como o mundo se parecer sem um "quarto poder" vivel. O intelectual

    e jornalista norte-americano Walter Lippman observou em 1920 que "admite-se

    que uma opinio pblica forte no pode existir sem o acesso a notcias.'' Essa

    declarao no menos verdadeira agora. No sculo 21, todo mundo est na

    blogosfera. difcil diferenciar mentirosos, dissimulados e grupos de interesse

    de jornalistas profissionais. Praticamente qualquer site ou fonte pode ser feito

    de forma a parecer ter credibilidade e ser honesto. As manchetes de confiana

    esto morrendo na vala. E, neste novo espao de lixo jornalstico, links podem

    levar o leitor, infinitamente, a outras fontes mais inteis, mas de aparncia

    brilhante, que continuam linkando de volta ao salo de espelhos digitais. O

    termo tcnico para isso : bullshit baffles brains (besteira que confunde

    crebros: expresso em ingls para indicar fraudes).

  • No meio digital, todo mundo um contador de histrias, certo? Errado. Se o

    jornalismo profissionale com isso quero dizer aquele que abraa uma

    narrativa tica, equilibrada e corajosa na busca da verdadequiser sobreviver,

    o ofcio dever reafirmar-se no espao digital. Jornalismo de dados apenas

    mais uma ferramenta que nos permitir navegar nesse espao. onde vamos

    mapear, remexer, classificar, filtrar, extrair e ver aparecer a histria no meio de

    todos aqueles zeros e uns. No futuro trabalharemos lado a lado com os hackers,

    os desenvolvedores, os designers e os programadores. uma transio que

    requer sria capacitao. Precisamos de gestores de notcias que "saquem'' a

    conexo jornalismo/ meio digital para comear a investir nessa construo.

    Wendy Carlisle, Australian Broadcasting Corporation

  • Jornalismo de Dados na BBC

    O termo "jornalismo de dados" pode abranger uma srie de disciplinas e usado

    de diversas formas em organizaes jornalsticas. Por isso, pode ser til definir o

    que entendemos por "jornalismo de dados" aqui na BBC. Em linhas gerais, o

    termo abrange projetos que utilizam dados para realizar uma ou mais das

    seguintes aes:

    Permitir que um leitor descubra informao pessoalmente relevante

    Revelar uma histria extraordinria e at ento desconhecida

    Ajudar o leitor a entender melhor uma questo complexa

    Essas categorias podem se sobrepor e, num ambiente on-line, muitas vezes

    podem se beneficiar de algum nvel de visualizao.

    Faa-o pessoal

    No site da BBC News, utilizamos dados para fornecer servios e ferramentas aos

    nossos usurios h mais de uma dcada.

    O exemplo mais consistente, publicado primeiramente em 1999, so as

    nossas Tabelas da rede escolar, que utilizam dados publicados anualmente pelo

    governo. Os leitores podem encontrar escolas locais, inserindo um cdigo

    postal, e compar-las de acordo com uma srie de indicadores. Jornalistas de

    Educao tambm trabalham com a equipe de desenvolvimento para arrastar os

    dados s suas matrias antes da publicao.

    Quando comeamos a faz-las, no havia site oficial que providenciasse uma

    maneira para o pblico explorar os dados. Mas agora que o Ministrio da

    Educao tem o seu prprio servio de comparativo, passamos a nos concentrar

    mais sobre as histrias que emergem a partir dos dados.

    O desafio nesta rea deve ser o de proporcionar o acesso aos dados nos quais h

    um claro interesse pblico. Um exemplo recente de um projeto que exps um

    grande conjunto de dados, normalmente no disponveis para o pblico, foi a

    reportagem especial Every Death on Every Road (Cada morte em Cada estrada).

    Ns fornecemos uma busca por cdigo postal, permitindo que os usurios

    encontrem a localizao de todas as fatalidades ocorridas nas estradas do Reino

    Unido na ltima dcada.

    Ns fizemos visualizaes de alguns dos principais fatos e nmeros que

    emergem a partir dos dados da polcia e, para dar ao projeto uma sensao mais

  • dinmica e uma face humana, fizemos uma parceria com a London Ambulance

    Association e a rdio e TV BBC de Londres para monitorar acidentes em toda a

    capital medida que aconteciam. Isto foi relatado online e em tempo real, e

    tambm atravs do Twitter utilizando a hashtag #crash24, e as colises

    foram mapeadas medida que eram relatadas.

    Ferramentas Simples

    Alm de proporcionar maneiras de explorar grandes conjuntos de dados,

    tambm tivemos sucesso ao criar ferramentas simples para usurios, que

    fornecem informaes pessoalmente relevantes. Estas ferramentas interessam

    queles sem tempo disponvel, que podem no querer uma longa anlise. A

    capacidade de compartilhar facilmente um fato pessoal algo que tornarmos

    padro.

    Um exemplo a nossa ferramenta The world at 7 billion: Whats your

    number (O mundo em 7 bilhes: Qual o seu nmero?), publicada para

    coincidir com a data oficial em que a populao mundial ultrapassou 7 bilhes.

    Ao inserir a data de nascimento, o usurio podia descobrir qual "nmero" ele

    era, em termos de populao mundial, quando nasceu. Esse nmero podia ser

    compartilhado depois atravs do Twitter ou Facebook. O aplicativo usava dados

    fornecidos pelo fundo de desenvolvimento da populao das Naes Unidas. Era

    muito popular, e tornou-se o link mais compartilhado em 2011 no Facebook do

    Reino Unido.

  • Imagem 3. O mundo em 7 bilhes (BBC)

    Outro exemplo recente o da calculadora do oramento da BBC, que permitia

    aos usurios descobrirem quo melhor ou pior ser para as suas contas quando

    a nova lei oramentria do Reino Unido entrar em vigore compartilhar esse

    dado. Fize