Ainda lembrando o post abaixo, mas não comparando exatamente, este post do meu blog sobre política mostra como um estudo cheio de condicionais deu origem a um título oba-obista:
O post meio que desmonta a certeza do título.
quinta-feira, 29 de janeiro de 2009
Wecsley não é necessariamente bandido
Um sujeito que eu admiro, o Rogério, atendeu na internet durante uns cinco anos sob o pseudônimo de Ruy Goiaba. Com seu humor ácido, ele fazia a mais competente crítica cultural do Brasil. Um dia, ele inventou a Fundação Wecsley, - uma ONG que se dedica à recuperação e ao acompanhamento psicológico de pessoas com nomes esdrúxulos. Em dez anos de atuação, nossos voluntários evitaram milhares de parricídios, matricídios e suicídios, tornando mais alegre a vida de milhões de Máicons, Wandergleysons e Bucetildes. Hoje, todos eles são pessoas reintegradas à sociedade e exercem plenamente sua cidadania, apesar dos risinhos de amigos e colegas.
Para ele, se Rayfran, Uilquelano, Vitalmiro e Amair tivessem sido encaminhados à fundação em tempo hábil, eles nunca teriam se envolvido no assassinato da freira Dorothy Stang.
Não consegui deixar de lembrar da Fundação Wecsley quando li esta notícia do G1, hoje:
- Nomes incomuns podem levar jovens ao crime, diz estudo
Pesquisa dos EUA liga nomes de jovens delinquentes a crimes cometidos.
Sempre que eu vejo essas notícias muito taxativas e muito esdrúxulas, fico com o pé atrás. MUITO atrás. Porque eu sei que isso pode ter a ver com a nossa má compreensão da matemática e da metodologia de pesquisa.
Como a gente não entende muito de matemática, não entende muito bem a diferença entre correlação e causa.
Correlação é o seguinte: 100% dos seres humanos bebem água, 100% dos humanos são mortais. Os dois fatores estão correlacionados, porque todo mundo que bebe água um dia morre. Mas, exceto em casos de afogamento, é difícil que beber água cause a morte de alguém. Existe um fator externo que leva a beber água e a morrer. Por exemplo, todos os seres humanos bebem água e morrem porque têm um organismo que funciona de tal e tal jeito.
Existem métodos estatísticos para determinar se a correlação entre dois fatores é forte ou fraca. Isso pode dar dicas para compreendê-los. No Excel, existe uma função chamada "Correl", em que você pode comparar duas colunas de dados. Por exemplo, as dimensões de educação e saúde do IDH. Você vai ver uma correlação alta (maior do que 0,7) entre os dois. Mas será que uma causa a outra?
A incerteza é sobre se é apenas uma correlação (o fator que garante educação e saúde está fora delas próprias, na administração) ou uma causação (mais educação, mais busca por saúde, menos doenças evitáveis). Essa é a diferença que dificilmente nós entendemos por sermos analfabetos numéricos. E é essa diferença que faz correlações cheias de condicionais virarem causações absolutas nas manchetes.
Voltando aos Wecsleys criminosos. O economista Steve Levitt, co-autor do livro Freakonomics, é craque no assunto. O capítulo 6 de seu livro ("A Roshanda by any other name", no original) analisa a correlação entre nomes estrambóticos e o sucesso escolar. Hoje, Levitt pegou exatamente a matéria publicada no Brasil pelo G1 e nos EUA pelo Washington Times para analisar. A primeira providência que ele tomou foi procurar o estudo original.
(Parêntese para uma das minhas questões favoritas sobre o jornalismo online. A possibilidade de linkar para o original é uma das maiores vantagens da internet, mas o jornalismo online ainda a usa muito pouco. Especialmente quando se trata de estatísticas ou estudos, seria muito interessante que isso fosse mais freqüente, porque dificilmente a notícia traz todos os condicionantes.)
Logo de saída, no "abstract" do estudo, Levitt encontrou uma ressalva que derruba os títulos do G1 e do Washington Times:
- "Nomes incomuns possivelmente não são a causa do crime, mas podem estar correlacionados a fatores que aumentam a tendência à delinqüência juvenil."
Levitt traduz essa declaração para termos mais compreensíveis:
- É mais ou menos como dizer: sabemos que as pessoas que regularmente usam macacão laranja são mais possivelmente criminosas, porque macacão laranja vem a ser o uniforme da prisão estadual. Usar macacão laranja não é a causa da atividade criminosa, mas é altamente correlacionado ao envolvimento com crimes no passado.
Levitt também vê outros problemas na metodologia do estudo.
Os autores calculam a probabilidade criminosa de um nome ao contar quantos criminosos há com um nome estrambótico X e dividi-la pela quantidade total de cidadãos que portam aquele nome. Como a quantidade de criminosos dentro do total da sociedade é relativamente pequena, isso ao mesmo tempo infla a percentagem de Wecsleys criminosos, desinfla a quantidade de Joões bandidos (a quantidade de Joões com folha corrida deve ser relativamente pequena em comparação com o total dos Joões) e deixa completamente de lado os outros nomes estrambóticos que não têm passagem policial.
Existe uma correlação entre ser jornalista e não saber matemática. Mas a causa certamente não está no jornalismo, porque a toda hora ele nos exige um pouco de raciocínio com números e grandezas.
As melhores aulas do mundo
Acaba de entrar no ar o Academic Earth, uma espécie de diretório de vídeos online que reúne aulas e palestras acadêmicas disponíveis em vários sites. De graça, você pode assistir aulas com os melhores do mundo.
Não há nenhuma aula especificamente de jornalismo. Mas há sobre assuntos que são notícia. Por exemplo, você pode assistir uma palestra de duas partes de Larry Summers, dada em Harvard, com o título "Aprendendo e reagindo à crise financeira".
Outras palestras são mais instrumentais. Você pode ver Larry Page, fundador do Google, falando sobre os bastidores do mecanismo de busca e de seus serviços.
Não há nenhuma aula especificamente de jornalismo. Mas há sobre assuntos que são notícia. Por exemplo, você pode assistir uma palestra de duas partes de Larry Summers, dada em Harvard, com o título "Aprendendo e reagindo à crise financeira".
Outras palestras são mais instrumentais. Você pode ver Larry Page, fundador do Google, falando sobre os bastidores do mecanismo de busca e de seus serviços.
Mapas dos leitores
Neste post, mostrarei os mapas que os leitores já fizeram. Pode ser um manancial de idéias para quem for fazer algo do gênero.
Começo pelo Diego Teodoro, que mapeou as obras que ele viu em andamento em São José dos Campos em período eleitoral, no ano passado. Pra melhorar esse mapa, acho que valia a pena olhar no Diário Oficial quanto custaram e incluir a informação em cada balãozinho.
Exibir mapa ampliado
E você, também tem um mapa? Mande pra cá!
Começo pelo Diego Teodoro, que mapeou as obras que ele viu em andamento em São José dos Campos em período eleitoral, no ano passado. Pra melhorar esse mapa, acho que valia a pena olhar no Diário Oficial quanto custaram e incluir a informação em cada balãozinho.
Exibir mapa ampliado
E você, também tem um mapa? Mande pra cá!
quarta-feira, 28 de janeiro de 2009
Mapeie as demissões
Se você cobre economia, deve ler todo dia notícias sobre demissões. Os cortes contam-se às centenas, e as empresas são tantas que a gente até perde a conta.Por que não colocá-las num mapa, para visualizar melhor, não perder a conta e eventualmente garantir pautas interessantes? Você pode usar o Google Maps para isso, organizando dados da sua apuração ou da dos outros. Como o Google Maps é de uso livre, você também pode publicar esse mapa no site do jornal ou no seu blog.
(Aliás, não precisa ser necessariamente sobre demissões. Eu já fiz mapas de censura judicial e violência nas eleições. Mas peguei esse aspecto por conta do grande problema mundial atual.)
Arregace as mangas e vamos lá.
1) Identifique as notícias do fenômeno que você quer mapear
Se você vai mapear as notícias que seu jornal cobre é preciso identificá-las nos seus arquivos ou anotações. Se você vai fazer para um blog, pesquise na internet.
Vou fazer de um jeito bem rápido e imperfeito. Pesquisei pela palavra "demite" no Google Reader - porque é a que mais facilmente estará presente em títulos de notícias sobre demissões pontuais. Se você procurar por "demissões", virão muitas notícias conjunturais. Sempre que for pesquisar na Web, pense nas palavras mais específicas possíveis - menos vale mais, como na Regra Três do Vinicius de Morais.

Eu selecionei aqui algumas notícias específicas sobre demissões em empresas, publicadas desde 15 de janeiro.
2) Extraia as informações delas
É bom saber o que medir. Eu, especialmente, quero medir quantos funcionários foram demitidos e onde. As notícias nem sempre são tão específicas. Esta aqui do G1 diz onde e quantos foram demitidos (502 funcionários da John Deere em Horizontina/RS), mas esta aqui não é tão clara - a Sadia é uma empresa de porte nacional, e os 350 podem estar espalhados por várias sedes. Na dúvida, nesse caso, eu prefiro arbitrariamente creditar as demissões na sede da empresa.
Com essas informações comparáveis, extraídas dos dados apurados (por você ou pelos outros), você pode fazer uma planilha para seu próprio controle - o que sempre dá samba. Você pode colocar várias variáveis a medir - onde, quantos, economia esperada, etc. E no final de um período x, com o acúmulo das demissões, você pode ter subsídios para uma boa matéria.
(Mas isso deixa pra quando eu for falar de bancos de dados. Sou tão obsessivo com isso que mantenho planilhas até sobre os shows do Deep Purple e jogos da Seleção Brasileira, ainda que de futebol eu mal e mal conheça só a bola.)
3) Localize as empresas no mapa
Para este e os próximos passos, você precisa necessariamente ter uma conta no Google - é a que você usa para o Gmail ou o Orkut. E estar logado com ela, claro.
Muitas empresas foram cadastradas no Google Maps, seja por serviços de listas amarelas ou por usuários. Vamos lá:
PanAmericano demite 370 e terceiriza 867 funcionários
Coloco na caixa de busca do Google Maps as palavras-chave "Banco Panamericano" e "São Paulo". Vêm vários resultados.

Uma visita ao site do banco esclarece que a sede é a da Paulista. Então eu clico nela. Repare o que diz no balãozinho:

Se quiser ver melhor a geografia, aproxime usando a régua no canto esquerdo do mapa.
4) Crie o seu mapa e salve o local
Tá vendo ali no balãozinho onde diz "Salvar em Meus Mapas"? Clica lá. Ele vai perguntar em qual mapa você quer salvar. Vá até "Criar novo mapa". Bata em OK. Edite os dados do canto esquerdo, dando um título e uma descrição ao mapa. Também defina se você quer que o mapa seja público ou reservado:

5) Edite os dados do ponto
Você pode escolher o que mostrar quando abrir cada ponto no seu mapa. Neste caso, eu preferi colocar o nome da empresa e, entre parênteses, a quantidade de funcionários. Na caixa de texto, coloquei o lead da notícia das demissões e, entre parênteses, o link para ela. Use a opção "editar HTML":

Quando você clicar no OK, o ponto estará editado. Olhe como ficou o canto ali da esquerda:

Aí eu faço o mesmo com as outras notícias. Sim, precisa de paciência pra fazer vários de uma só vez. Mas depois é um ou dois ou três por dia. Aí fica fácil.
Desta vez, eu não marquei um por um um dos pontos. Mas veja o mapa que eu criei na época das eleições, com os casos de violência contra candidatos:
Exibir mapa ampliado
Você pode clicar nos pontos e ver os textos. Pode também mover o mapa. Pode aumentar ou diminuir a visualização. Para fazer isto, clique em seu mapa onde diz "Link", no canto superior direito, e copie o que está no "Colar HTML para incorporar ao website":

Sim, é um código de "embed" como os do YouTube.
Se você fizer um mapa assim, seja do que for, a partir destas dicas, mande o endereço pra mim que eu mostro aqui.
Marcadores:
Google Maps,
idéias,
mapeamento,
monitoramento
terça-feira, 27 de janeiro de 2009
Fleuma britânica e edições sorrateiras
O The Independent, ao noticiar os motivos da mudança dos critérios de aprovação de edições na Wikipedia, sobre a qual escrevi no domingo, descreveu assim a questão dos mortos-vivos:- Os pedidos de revisão seguiram-se à embaraçosa revelação de que as páginas sobre o senador Robert Byrd e o senador Edward Kennedy, dois proeminentes políticos americanos, falsamente deram a impressão de que cada um havia morrido.
Eu ainda acho que as edições flagrantemente errôneas são o menor dos problemas da Wikipedia. As piores são as feitas sorrateiramente, com engenho e arte, por interessados em passar uma determinada versão daquela história. Hoje, qualquer político tem um assessor de imprensa, por exemplo. Eles sabem escrever de maneira profissional.
Ponha-se no lugar de uma grande empresa ou instituição que está envolvida em atividades com grandes conseqüências políticas. Você não mexeria no seu verbete? Nos EUA, um estudante de pós-graduação criou o WikiScanner, que monitora alterações na Wikipedia feitas por IPs de grandes empresas ou instituições conhecidas.
Uma das monitoradas é a Diebold, que fabrica urnas eletrônicas nos EUA (e comprou a Procomp, que faz ou fazia as urnas eletrônicas brasileiras). Veja aqui os verbetes que foram alterados por computadores com seu IP. Muita coisa é besteira mesmo. Mas vejam quantas vezes foram alterados os verbetes sobre candidatos republicanos às eleições de 2008. E especialmente quantas vezes foram feitas lá dentro alterações ao verbete da própria Diebold. Tudo bem: a empresa é quem mais sabe de si própria. Mas e quando uma alteração feita de dentro da empresa simplesmente elimina todas as referências a críticas feitas a ela, como fez a Diebold?
Sim, é fácil de notar que foi eliminado, e o sistema da Wikipedia permite trazer de volta. Mas e quando a manipulação é sutil o suficiente pra ser imperceptível aos olhos dos curiosos bem-intencionados que voluntariamente editam a enciclopédia digital? Voilà.
Por tudo isso, é sempre saudável checar fora da Wikipedia - e de qualquer outro lugar onde qualquer um possa fazer edições - as informações que você consultar lá. Como eu disse no domingo, use-a como usaria um banheiro público.
domingo, 25 de janeiro de 2009
Copernic portátil

Quando falei sobre o Copernic, outro dia, a Ana Estela levantou a questão do acesso remoto aos arquivos - o que eu chamei de "portabilidade". Hoje, fiquei sabendo do Copernic Mobile, que gera um "espelho" dos seus arquivos que pode ser acessado por qualquer celular que tenha acesso à Web.
Ainda não instalei no meu computador. Preciso pensar bem algumas questões de privacidade. Por exemplo: se alguém tem o acesso ao banco de dados do Copernic, teoricamente teria acesso ao "espelho" de tudo o que eu tenho no computador. Não acho isso interessante. Preciso estudar mais o sistema pra ter mais confiança antes de instalar.
Algum leitor já usa?
Corretor ortográfico online
Acabo de ficar sabendo a respeito do Ortografa!, uma espécie de "tradutor" que adapta frases de até 100 caracteres para a nova ortografia.
Eu já estava começando a me sentir tão datado quanto meu ortopedista, que há uns meses me receitou um remédio para "dôr" no joelho. "Denunciando a idade, doutor?", brinquei. Esse acento caiu em 1971. Mas aí outro dia me pegaram com a boca na botija usando trema. Quem sou eu pra pegar no pé do médico?
Eu já estava começando a me sentir tão datado quanto meu ortopedista, que há uns meses me receitou um remédio para "dôr" no joelho. "Denunciando a idade, doutor?", brinquei. Esse acento caiu em 1971. Mas aí outro dia me pegaram com a boca na botija usando trema. Quem sou eu pra pegar no pé do médico?
Tonho da Lua e a Wikipedia
A Wikipedia é uma faca de dois gumes, se me perdoam o clichê. Ela tem grandes qualidades e grandes defeitos - e geralmente estes são os irmãos gêmeos malvados daquelas, como as personagens da Glória Pires na novela "Mulheres de Areia". Como dizia o Tonho da Lua, "a Ruthinha é boa e a Raquel é malvada". Se me perdoam a referência admitidamente tosca.Um desses pares de gêmeos, por exemplo, está na autoria. A qualidade inerente a ela é que a Wikipedia é aberta o bastante para qualquer um poder atualizá-la dentro do que tenha algo a acrescentar; o defeito disso é que você nunca sabe se quem pôs a mão no verbete antes de você aparecer é um especialista, um chutador, um vândalo, um curioso bem-intencionado ou um manipulador.
Agora, um dos co-criadores da Wikipedia sugere, segundo o New York Times, que novas edições de verbetes devem ser seguradas até que um usuário credenciado as aprove. Isso já começou na Wikipedia em alemão, diz o jornal. Recentemente, diz o Washington Post, os senadores Edward Kennedy e Robert Byrd tiveram suas mortes "anunciadas" por vândalos no serviço.
Segurar as edições para peneirar bizarrices é uma medida interessante, mas não elimina o problema básico.
Não é difícil reconhecer as ações dos vândalos. As outras, nem tanto. Os curiosos bem-intencionados, que formam a maioria dos usuários da Wikipedia, dificilmente estão equipados para reconhecer a diferença entre uma edição feita por um especialista e uma competente manipulação feita pelos que têm interesses escusos. Desenvolvi um pouco mais esse raciocínio neste post, publicado no meu outro blog em novembro de 2007.
Nesse âmbito majoritário dos curiosos bem-intencionados, a edição de janeiro da revista Piauí publicou um simpático perfil de um guri de 14 anos cujo passatempo principal é contribuir com verbetes para a Wikipedia. Se você o lê pensando no personagem, ele é divertido. Se você o lê pensando na ferramenta, ele justifica preocupações.
- Assim como médicos e advogados, enciclopedistas virtuais costumam se dividir em especialidades. As de Mateus são geografia, história e música. Quando decide inaugurar um verbete, ele acessa o Google e digita um nome pelo qual tenha interesse. Por exemplo: “Ilhas Seicheles”. Se já existe definição na Wikipédia, segue adiante. Se não existe, trata de confeccioná-la. Foi assim que instituiu “Espanha”, “México” e “Instituto Cervantes”, a maior parte deles traduzida da página em espanhol. Mirador, Barsa e Britânica, consulta apenas em último caso: “Elas não são modificáveis. Têm erros que se perpetuam”, ensina.
Quando um assunto lhe é de extremo interesse, Mateus concorda em colaborar mesmo sem colher o ônus da criação. Foi o caso de “Mercado Comum do Sul – Mercosul”. “Tem figuras, texto bom, você fica interessado em chegar ao final. As informações sobre o protocolo de Brasília, fui eu que inseri”, explica, garboso, o aluno da 9ª série. De tão completo, o artigo acabou virando destaque na página de abertura da Wikipédia – um luxo no mundo dos enciclopedistas virtuais.
No alto da tela do computador, a contagem regressiva começou em 120 minutos. Mateus abriu o verbete “Grammy Latino para Gravação do Ano”. Há meses que o jovem destina ao menos uma hora por dia – normalmente entre a novela das sete e a das oito – à edição do artigo sobre os prêmios musicais. Ainda se considera longe do fim. “São nove anos, 49 subcategorias por ano. Eu tenho que consultar a Wikipédia em inglês e em espanhol a toda hora para não publicar nenhum erro”, explicou.
(...)A discussão do momento dizia respeito à definição do escritor dinamarquês Hans Christian Andersen. “Tem um wikipedista aqui classificando ele como autor de literatura gay e outro dizendo que isso é errado”, traduziu o jovem com os olhos fixos na tela do computador. “Não vou me meter, sabe? Não sei nada sobre esse cara aí”, alegou com um muxoxo, antes de seguir adiante. No universo virtual, quando um mediador (que pode ser qualquer internauta) não é capaz de pôr fim a uma guerra de edição, o debate é levado à página de votações e eliminações. É a justiça wikipediana, ambiente que dá direito até a lobby em prol de uma causa enciclopédica.
Antes que algum wikipedista venha atirar pedras aqui, faço um breve parêntese. Eu também contribuo com a Wikipedia dentro das áreas que eu conheço bem. O verbete sobre o Deep Purple, por exemplo, foi escrito por mim até o trecho onde fala do retorno da banda, em 1984. Um dia arrumo tempo pra terminar.
Nos meus cursos, eu costumo dizer que a Wikipedia não é fonte, e sim pauta. Ela costuma dar pistas razoáveis sobre onde checar as informações (se um safado não passou lá imediatamente antes de você).
Na dúvida, eu a uso como uso um banheiro público: tomando muito cuidado com onde ponho a mão. E lembro sempre de lavar as mãos - ou, no caso, checar - depois.
E você, como usa a Wikipedia?
sexta-feira, 23 de janeiro de 2009
Jornalismo 'top de linha', pelo quarto ano seguido

Desde 2006, meu maestro soberano Philip Meyer é patrono de um prêmio de jornalismo que reconhece as reportagens de apuração mais complexa publicadas no ano. Ontem, saíram os três vencedores da quarta edição. "O prêmio reconhece os melhores usos de métodos da ciência social no jornalismo", diz a descrição oficial.
Trata-se do "top de linha" do jornalismo. Esses trabalhos combinam levantamento de informações públicas, por meio do Freedom of Information Act, análise sofisticada de estatísticas e a sempre eficaz arte de sujar os sapatos.
Em termos de dinheiro, o prêmio Philip Meyer é modesto comparado até aos prêmios brasileiros: US$ 500, US$ 300 e US$ 200, respectivamente, para cada colocação. O significado desse prêmio para o desenvolvimento do jornalismo, porém, é bem mais valioso. Na inscrição dos trabalhos, é preciso descrever todo o processo de apuração. É a complexidade da apuração, e não o produto final ou seu impacto, que pesa mais na avaliação. As descrições dos trabalhos ficam, depois, disponíveis para os sócios da IRE, para que possam aprender com a experiência dos colegas.
Vale a pena conhecer esses trabalhos, especialmente para os que julgam ser o jornalismo de precisão algo como ficção científica. Até pra ter com o que se martirizar na frente do espelho na próxima vez em que você disser "ah, mas isso não é pra jornalista".
Conheça os vencedores deste ano:
- 1º LUGAR: "Salvando bebês: expondo mortes repentinas de crianças", Scripps Howard News Service
"Os repórteres Thomas Hargrove, Lee Bowman e Lisa Hoffman fizeram um trabalho magistral ao expor lapsos burocráticos que impedem a busca pelas causas de mortes repentinas de bebês. Fazendo bom uso de fortes ferramentas estatísticas, a equipe analisou as agudas diferenças nos diagnósticos de causas de morte entre os estados e produziu a primeira prova rigorosa do valor das câmaras de revisão locais e estaduais sobre mortes de crianças, presentes em algumas jurisdições. Alguns meses após a publicação do projeto, o então senador Barack Obama apresentou um projeto de lei federal que exige dos examinadores médicos que façam investigações do local da morte em todos os casos de morte inesperada de bebês."
2º LUGAR: "Falhas Fatais", Kansas City Star
"Os repórteres Mike Casey e Rick Montgomery analisaram 1,9 milhão de registros da Administração Nacional de Segurança no Tráfego em Auto-Estradas para descobrir a falha da entidade em considerar a falta de airbags como um problema significativo de segurança. O trabalho de Casey e Montgomery sugere que quase 300 pessoas são mortas anualmente em acidentes pelo fato de seus airbags não terem inflado quando deviam. Inicialmente, a NHTSA contestou fortemente as conclusões, mas acabou fazendo sua própria análise dos dados e chegou às mesmas conclusões. Este projeto combinou o melhor das técnicas que Philip Meyer defende com o estado mental investigativo que se recusa a aceitar um não como resposta quando o que está em jogo (neste caso, vida e morte) é muito alto."
3º LUGAR: "Pegando pesado? - Táticas de policiamento suburbano", Philadelphia Inquirer
"Mark Fazlollah, Dylan Purcell, Melissa Dribben e Keith Herbert, da equipe do Inquirer, estudaram dados de prisão e Justiça de departamentos de polícia nos subúrbios que cercam a Filadélfia e encontraram cidades onde negros eram presos em números extraordinários por ofensas menores, como vadiagem e atravessar a rua sem observar as regras. Reportagem subseqüentes expuseram prisões onde milhares de revistas vexatórias ilegais eram conduzidas, cães policiais sendo usados para controlar crianças negras que iam a pé da escola para casa e ocorrências por tráfico sendo preenchidas com antecedência às prisões."
Nos anos anteriores, escrevi sobre os prêmios Philip Meyer no site da Abraji (2006), no blog "Deu no Jornal", da Transparência Brasil (2007) e no meu blog particular "E Você Com Isso" (2008). Reproduzo aqui os vencedores daqueles anos:
2008
- 1º LUGAR: "Falsificando as notas", Dallas Morning Herald
A pauta é parecida com a do jornal da Filadélfia que ganhou o terceiro lugar em 2007, mas a execução foi mais ambiciosa. A série de três dias mostrou sérias evidências de fraude nos testes-padrão, por mais de 50 mil estudantes de escolas públicas e particulares do estado do Texas. O jornal foi o primeiro a fazer uma reportagem sobre isso, em 2004, quando ainda sequer havia o prêmio Philip Meyer. Desta vez, os repórteres Joshua Benton e Holly Hacker analisaram um gigantesco banco de dados de notas e respostas de testes de centenas de milhares de estudantes individuais que fizeram os testes ao longo de dois anos. O rigor empregado pela série fez com que o estado anunciasse controles mais fortes sobre as condições em que os testes são feitos nas escolas do Texas, para se adaptarem aos métodos estatísticos de detecção de fraudes usados pelo jornal.
2º LUGAR: "Questão de vida ou morte", Atlanta Journal-Constitution
A pena de morte ainda é lei em vários pontos dos Estados Unidos. Em alguns estados, porém, ela é mais cruel. Em 1972, uma decisão da Suprema Corte americana classificou a aplicação da pena no estado da Geórgia – o mesmo onde se passa o filme “E o Vento Levou” – como “arbitrário e capcioso”. Nessa série de quatro duas, os repórteres Bill Rankin, Heather Vogell, Sonji Jacobs e a analista de bancos de dados Megan Clarke mergulharam em dados de 2.300 condenações por assassinato registradas desde 1995. Paralelamente, a pesquisadora Alice Wertheim fez um banco de dados com as condenações a pena de morte desde 1982. Os jornalistas fizeram diversas análises nos dados e conseguiram demonstrar que as condenações à pena de morte variavam de acordo com características demográficas dos réus e com o lugar onde viviam. Com isso, o Legislativo estadual decidiu considerar mudanças nas leis de pena de morte e o Judiciário local tomou iniciativas para melhorar o processo de revisão dos casos.
3º LUGAR: "Empresas de Seguro - Serviço ou Safadeza", Kansas City Star
Três repórteres passaram quase um ano analisando um banco de dados com mais de 35 milhões de registros de reclamações contra mais de 2.400 companhias de seguros dos Estados Unidos. A idéia era verificar quais são as reclamações dos clientes dessas empresas e como elas respondem a isso. A preocupação com o consumidor, segundo descobriram os repórteres Mike Casey, Mark Morris e David Klepper, varia muito conforme a empresa, o lugar do país e o tipo de cobertura. Logo na primeira reportagem, era mostrado o caso de uma mulher cujo plano de saúde não cobria internação hospitalar – e ela só descobriu isso ao receber uma conta de US$ 16 mil. Na última reportagem, o jornal demonstrava que as empresas de seguros passam por virtualmente nenhuma supervisão pública e que os encarregados pela pouca supervisão que há vêm das próprias empresas em que devem ficar de olho. A partir da análise do jornal, o Legislativo Americano passou a propor mudanças na regulamentação dos planos de seguros.
2007
- 1º LUGAR: "O dia perfeito para receber", Wall Street Journal
Foi uma série de reportagens publicadas ao longo de 2006 que expôs a prática de mudar a data de recibos de compra de ações para beneficiar quem tem informações privilegiadas com um pagamento maior. Os autores, Charles Forelle e James Bandler, usaram um modelo estatístico para calcular as chances selvagemente improváveis de que as datas de pagamento de ações simplesmente fossem muito favoravelmente lucrativas para dezenas de executivos de algumas das empresas mais conhecidas dos EUA. As reportagens sobre o escândalo levaram à abertura de uma investigação do órgão federal que fiscaliza a Bolsa para avaliar sabotagem em títulos de mais de 100 empresas até agora.
2º LUGAR: "Relatório Especial: Avaliando o Tratamento Cardíaco em Hospitais", Gannett News Service
É um pacote de matérias publicado em vários jornais dos EUA, que avaliou como mais de 3 mil hospitais seguiam as recomendações médicas de melhores práticas para tratar pacientes que sofreram ataques cardíacos. As matérias escritas pelo editor de banco de dados Robert Benincasa e pela repórter Jennifer Brooks mostravam que pacientes de áreas pobres e regiões rurais tinham menos chance de receber os cuidados recomendados. Sua análise usou um banco de dados nacional detalhando o tratamento dado a cada paciente e usou uma metodologia de escores compostos para avaliar cada hospital.
3º LUGAR: "Investigação das notas em Camden", Philadelphia Inquirer
Foi uma série de reportagens que expôs um escândalo de fraudes no teste-padrão usado pelo distrito escolar de Camden, em Nova Jersey. O trabalho dos repórteres Melanie Burney, Frank Kummer e Dwight Ott revelou que os resultados de testes aplicados em diversas escolas de Camden eram dramaticamente mais altos do que o que poderia ser esperado com base em performances passadas, e acabou levando à demissão do superintendente do distrito escolar, a uma investigação e ao monitoramento rigoroso do distrito pelo departamento estadual de educação. (O livro Freakonomics cita casos semelhantes para propor um modelo de análise desse tipo de coisa.)
2006
- 1º LUGAR: "Epidemia desnecessária", The Oregonian
O repórter Steve Suo demonstrou como o Legislativo americano e a DEA (departamento governamental responsável pelo combate às drogas) poderiam ter impedido uma epidemia de uso de metanfetaminas – presentes em drogas como o Ecstasy e em medicamentos controlados, como a Efedrina – se tivessem regulamentado melhor a importação dos produtos químicos necessários para sua produção. Em 1997, cerca de 5 milhões de americanos haviam provado metanfetaminas. Hoje, estima-se que cerca de 13 milhões usem de alguma forma – fumando, inalando, injetando ou ingerido. Apenas nove laboratórios no mundo inteiro produzem esses 12 elementos, e desde os anos 80 os laboratórios que os usam para fabricar medicamentos precisam manter registros de importação atualizados. Brechas legais, estimuladas pela ação de lobbies que usam como argumento a dependência de pacientes desses medicamentos, permitem que fabricantes de tóxicos tenham acesso aos produtos. Suo fez análises de dados sobre internações médicas, prisões, preço e pureza de metanfetaminas e importação de produtos químicos. A reportagem demonstra que, em dois períodos em que as autoridades federais impediram o acesso de cartéis aos produtos químicos, os crimes e internações pelo uso de metanfetaminas caiu na mesma proporção em que o preço da droga no mercado negro aumentou.
2º LUGAR: "Dispensados e desonrados", Knight-Ridder
Chris Adams e Alison Young, da sucursal de Washington da rede de jornais, mostram como a burocracia emperra as solicitações de veteranos que voltaram de guerras com deficiências físicas. Mais de 13.700 deles morreram antes de serem atendidos, e até 572 mil ex-combatentes podem não estar até hoje recebendo pensão por invalidez causada por guerras. Hoje, cerca de um terço do orçamento do VA (órgão do governo dos EUA que atende os ex-combatentes) é destinado a pagar pensões por invalidez a ex-combatentes. Os registros analisados pelos repórteres mostram as diferenças regionais no atendimento às demandas dos veteranos. Também revelam os tipos de doenças mais comuns enfrentadas pelos ex-combatentes: esquizofrenia e demência associada a trauma cerebral. A lentidão da burocracia não discrimina idade. Os repórteres encontraram um veterano da 2ª Guerra Mundial que teve o estômago rasgado por uma bala aos 19 anos, em 1945, e apenas em 1981 descobriu que sua pensão não cobria todos os danos que sofreu. A partir daí, passou 21 anos em uma batalha legal por seus direitos.
3º LUGAR: "O sumiço dos pântanos", St.Petersburg Times
Os repórteres Matthew Waite e Craig Pittmann demonstraram como 84 mil acres (quase 340 km²) de área pantanosa foram devastados por construções na Flórida após o governo George Bush (pai) anunciar uma política nacional para evitar perdas de áreas pantanosas, em 1990. Os repórteres usaram imagens de satélite de vários anos e sistemas de informações geográficas para calcular o tamanho exato da perda de área. Também analisaram os registros de permissão para exploração imobiliária de áreas pantanosas. Segundo a investigação, entre 1999 e 2003, foram aprovadas mais de 12 mil permissões de exploração – e apenas uma foi negada. A série de reportagens também contabilizou alguns prejuízos sofridos pelos governos com as construções nessas áreas. O condado de Collier, por exemplo, gastou US$ 30 milhões para indenizar moradores de bairros inundados que um dia foram áreas pantanosas.
quinta-feira, 22 de janeiro de 2009
Os dados do crime
Dados estatísticos não devem ser feitos ociosamente. Geralmente, mede-se um fenômeno para melhor conhecê-lo e poder agir sobre ele. Por isso são feitas estatísticas sobre desemprego, crime e outros.
Ocorre que, especialmente em países pouco desenvolvidos, há um vezo institucional que lembra o analfabetismo funcional, aquela situação em que o cidadão sabe identificar as palavras mas não compreende o que elas dizem. Muitas vezes existe informação, mas ela não é usada para formular políticas públicas.
É o caso das estatísticas sobre crime e criminalidade, segundo o pesquisador Renato Sérgio de Lima, chefe da Divisão de Estudos Socioeconômicos da Fundação Sistema Estadual de Análise de Dados (Seade). Sua pesquisa foi publicada na mais recente edição da revista Novos Estudos, do Cebrap. Leia abaixo trechos da notícia da Agência Fapesp a respeito da pesquisa:
E onde entra o jornalismo nisso?
Há bons trabalhos de reportagem sobre as deficiências do sistema de coleta de informações sobre a segurança pública. Alguns eu destaquei em outros blogs, em anos anteriores. Seguem abaixo os links para eles, caso tenham curiosidade:
Cokrigagem ("E Você Com Isso?", agosto de 2008)
Termômetros quebrados ("Deu no Jornal", maio de 2007)
Ocorre que, especialmente em países pouco desenvolvidos, há um vezo institucional que lembra o analfabetismo funcional, aquela situação em que o cidadão sabe identificar as palavras mas não compreende o que elas dizem. Muitas vezes existe informação, mas ela não é usada para formular políticas públicas.
É o caso das estatísticas sobre crime e criminalidade, segundo o pesquisador Renato Sérgio de Lima, chefe da Divisão de Estudos Socioeconômicos da Fundação Sistema Estadual de Análise de Dados (Seade). Sua pesquisa foi publicada na mais recente edição da revista Novos Estudos, do Cebrap. Leia abaixo trechos da notícia da Agência Fapesp a respeito da pesquisa:
- De acordo com Lima, as estatísticas criminais no Brasil foram produzidas sem quaisquer vínculos com pressupostos de transparência e accountability, termo em inglês que significa algo como “responsabilização” e que remete à obrigação de membros de um órgão administrativo ou representativo de prestar contas a seus representados.
Esses dados ainda seriam vistos por vários segmentos das instituições de justiça e segurança pública como atividade secundária e desnecessária. “No Brasil, as polícias avançaram na incorporação das estatísticas no planejamento operacional de suas ações, sobretudo no que diz respeito às ferramentas de análise criminal e georreferenciamento. Porém, o Judiciário e o Ministério Público ainda enfrentam enormes desafios neste campo”, apontou.
(...) Ao analisar a trajetória da produção de estatísticas no país, o estudo aponta que as instituições de justiça criminal no Brasil não superaram a dimensão do registro dos fatos criminais, ocorrências policiais e prisionais, porque produzem estatísticas quase sempre com objetivo operacional e sem uma grande preocupação de planejamento e eventual ajuste de rota. As polícias, no entanto, seguem o caminho contrário.
“As polícias têm revolucionado suas ações com o apoio de ferramentas de análise criminal que nada mais são do que a transformação de dados em informação e conhecimento. Elas começaram a perceber que, para aumentar a eficiência democrática no enfrentamento da criminalidade, deveriam associar os dados produzidos, considerando-os de forma integrada”, disse.
Segundo ele, diferentes camadas de dados começaram a compor um estoque de conhecimento que permitiu, por exemplo, a integração de áreas das polícias civil e militar e a identificação de áreas e locais mais violentos ou de maior incidência de determinados delitos. O cruzamento desses dados com os de outras instituições e órgãos públicos oferecem informações sobre ocupação urbana e existência de equipamentos públicos.
“Por meio do tratamento agregado de ocorrências policiais e demais registros administrativos, conseguimos avançar muito no desenho de políticas públicas. Isso não significa afirmar que as polícias tenham alcançado a excelência em termos de democracia e garantia de direitos, fato que exigiria discutir inúmeras permanências de situações de violação de direitos, mas que elas têm adotado as estatísticas como insumos efetivos de planejamento”, disse.
E onde entra o jornalismo nisso?
Há bons trabalhos de reportagem sobre as deficiências do sistema de coleta de informações sobre a segurança pública. Alguns eu destaquei em outros blogs, em anos anteriores. Seguem abaixo os links para eles, caso tenham curiosidade:
Cokrigagem ("E Você Com Isso?", agosto de 2008)
Termômetros quebrados ("Deu no Jornal", maio de 2007)
Marcadores:
bancos de dados,
direito de acesso,
numeralha
quarta-feira, 21 de janeiro de 2009
Esse manja mesmo
Se vocês curtiram os posts abaixo, não deixem de ler a descrição de como o professor Steve Doig calculou que a posse do Obama tinha 800 mil espectadores. Ele obteve até mesmo uma foto aérea tirada de um satélite militar.
Calculando o Réveillon da Paulista

Um bom teste da metodologia abaixo é pegar uma notícia recente. O Rômulo, no blog da Ana Estela, questionou os números do Réveillon da Paulista:Réveillon da Paulista deve receber mais de 2 milhões (Folha de S.Paulo, estimativa dos organizadores)
Cerca de 2,4 milhões participaram do Réveillon na Paulista (O Estado de S.Paulo, estimativa da PM)
Embora a Paulista seja toda interditada, o palco fica entre as ruas Ministro Rocha Azevedo e Frei Caneca. Dali até quase o Masp, lota de gente, em densidades variadas. Pelo que eu lembro do Réveillon de 2000, a multidão ia se dispersando gradualmente e no Masp já tinha espaço suficiente pra garrafas voarem e o pessoal correr.
Não tenho uma foto aérea do Réveillon mostrando até onde ele vai, mas eu diria que o grosso da multidão vai mais ou menos da Frei Caneca até o Masp. Assim:

Uma distância de 425,2 metros multiplicada pela largura da rua, de 46 metros, dá 19.559 metros quadrados. Vamos chutar uma densidade alta, de 4 pessoas por metro quadrado, aumentando um pouco. Isso daria no máximo 80 mil pessoas nessa área.
Você pode argumentar que existe população circulante, que tem espectadores nas ruas laterais e que tem gente que assiste de dentro dos prédios. Mas, mesmo que esse pessoal todo TRIPLICASSE o que cabe mais ou menos de gente entre a Frei Caneca e o Masp, daria no máximo cerca de um décimo dos 2,4 milhões alardeados pela prefeitura.
É preciso lembrar, porém, que isso são dados aproximados. Tem aí uma boa margem de erro. Mas ela não é grande o suficiente para dar um aumento de 1000% (ou dez vezes). Os milhões, até metodologia em contrário, soam a chutatística.
NÚMERO É DINHEIRO
A questão que fica aí é a seguinte: quem ganha inflando as estatísticas?
Elas têm um propósito publicitário nítido, é claro. Em São Paulo, quanto mais gente tem, mais gente vem. Mas também não se pode esquecer que números são convertidos em dinheiro, muitas vezes.
Quanto mais gente assiste a um show, maior costuma ser o cachê do artista. Quanto mais gente participa de uma mobilização, mais dinheiro os organizadores precisam para preparar a próxima - e mais argumentos eles têm para arrecadar mais.
Um público de 240 mil espectadores não seria nada mau para um show do cantor sertanejo Daniel, do grupo de forró Saia Rodada e do grupo de axé Babado Novo. Mas é um baita público. Imenso.
Pense em Woodstock: o organizador calculava que 500 mil pessoas tenham ido lá (numa área de 2,4 quilômetros quadrados). O da Ilha de Wight, onde Jimi Hendrix fez seu penúltimo show, em 1970, teria tido estimados 600 mil. O festival California Jam, onde o Deep Purple teve seu maior público, em 1974, reuniu estimados 200 mil espectadores. Os 2,4 milhões da prefeitura são pouco menos que o dobro da soma dos públicos estimados desses três lendários festivais da história do rock. Genial.
Só que, se cabe na Paulista no máximo um décimo disso contando a população flutuante e as ruas ao lado, minha dúvida é: será que o cachê dessas bandas de forró e axé é calculado pelo público? É uma dúvida importante, até porque vai grana minha nisso.
Como medir áreas no Google Maps
A Ana fez uma pergunta interessante nos comentários do post abaixo: como se faz para usar as ferramentas da internet para medir áreas e distâncias?
O Google Earth permite traçar linhas (em todas as versões) ou polígonos (na versão paga), o que ajuda a medir suas áreas. Mas eu, pessoalmente, uso pouco o Google Earth porque ele é um programa muito pesado. Se eu o uso no meu computador, não consigo usar quase mais nada.
Melhor solução é usar o Google Maps, mas como ele não tem uma ferramenta específica para áreas (só distâncias) é preciso um tanto de engenho e arte. Existem algumas ferramentas disponíveis em alguns sites que ajudam, mas elas ainda são imperfeitas.
A melhor que eu encontrei é a ferramenta de mapas da Zonum Solutions, que permite escolher que medida usar (área, elevação, distância, etc), marcar pontos no mapa e ter o dado imediatamente.

Aqui, eu aproximei o mapa até onde eu queria medir, escolhi a medida que eu queria (área em km2) e selecionei com quatro pontos a área da Avenida Paulista, do Masp até a Consolação. Dá 0,058 km quadrados, ou 56.606 metros quadrados puxando pela medida deles. Dependendo da concentração da multidão, a área comportaria de 141.515 pessoas - a uma taxa meio apertada, mas ainda encarável, de 2,5 por metro quadrado - a 339.636 sardinhas - a uma taxa absurda de 6 por metro quadrado.
A desvantagem: essa ferramenta não permite busca - ao menos não nos browsers que eu tenho em casa (Chrome, Firefox, Explorer e Safari). Assim, você precisa ter noção geográfica da região pra localizar visualmente. Eu consigo fazer isso na Paulista, mas não conseguiria fazer em Washington porque não conheço a cidade e não sei como me localizar.
Saída mais difícil
Se você não sabe se localizar na região, abra o Google Maps e pesquise o ponto de referência da área que você quer medir. Por exemplo, Masp:

Clique em "Meus Mapas", ali na aba da esquerda. Desça até o último: "Ferramenta para Medição de Distâncias". Agora, clique no primeiro e no último ponto da linha que você quer medir. Por exemplo, do Masp à Consolação.

Anote os 981,5 metros (eu arredondei) e Clique em "Remover o último ponto". Clique agora do outro lado da Paulista para ver a largura da rua.

Anote os 46 metros (também arredondei).
Você sabe que uma quinta série do primário bem-feita é muito importante para qualquer cidadão. Para os jornalistas, então, uma quinta série bem feita deveria ser obrigatória, muito mais do que qualquer diploma. (A Fenaj que me desculpe.)
Então, vamos lembrar do que a professora ensinava lá naquelas tardes em que eu não via a hora de ler gibi no recreio: nos retângulos, a área é medida multiplicando-se a altura pela largura. Portanto, são 981,5 vezes 46. Diferentemente da quinta série, você pode usar calculadora ou até o Excel que ninguém vai baixar sua nota por isso.
Isso vai dar uma área de 45.149 metros quadrados. Dá menos que os 56.606 metros quadrados da ferramenta anterior? Dá; mas isso tem muito a ver com a mão que fez. As distâncias que eu marquei, a olho, não eram exatamente as mesmas, e se for olhar bem o meu polígono da ferramenta anterior invadiu o Conjunto Nacional.
Tendo como pesquisar, você pode ter uma localização mais exata. Tendo as coordenadas, pode ser ainda melhor.
O Google Earth permite traçar linhas (em todas as versões) ou polígonos (na versão paga), o que ajuda a medir suas áreas. Mas eu, pessoalmente, uso pouco o Google Earth porque ele é um programa muito pesado. Se eu o uso no meu computador, não consigo usar quase mais nada.
Melhor solução é usar o Google Maps, mas como ele não tem uma ferramenta específica para áreas (só distâncias) é preciso um tanto de engenho e arte. Existem algumas ferramentas disponíveis em alguns sites que ajudam, mas elas ainda são imperfeitas.
A melhor que eu encontrei é a ferramenta de mapas da Zonum Solutions, que permite escolher que medida usar (área, elevação, distância, etc), marcar pontos no mapa e ter o dado imediatamente.

Aqui, eu aproximei o mapa até onde eu queria medir, escolhi a medida que eu queria (área em km2) e selecionei com quatro pontos a área da Avenida Paulista, do Masp até a Consolação. Dá 0,058 km quadrados, ou 56.606 metros quadrados puxando pela medida deles. Dependendo da concentração da multidão, a área comportaria de 141.515 pessoas - a uma taxa meio apertada, mas ainda encarável, de 2,5 por metro quadrado - a 339.636 sardinhas - a uma taxa absurda de 6 por metro quadrado.
- (Parêntese. Não acho impossível que caibam 6 pessoas por metro quadrado. Em 2003, o Deep Purple tocou em Porto Alegre com o Sepultura e os Hellacopters. Durante os shows das duas primeiras bandas, eu e alguns amigos fomos caminhando devagarinho até chegar ao máximo de proximidade possível, onde estávamos expostos a todo tipo de chute, soco, aperto e - no caso das meninas - bolinação. Levando em conta as cabeças à minha frente, eu achei que estava a uns 5m do palco, mas podia ver o Ian Gillan tão de perto que ele parecia estar logo à minha frente. Quando o Gigantinho esvaziou, vi que eu estava a menos de 2m do palco. A distância parecia maior pela quantidade de sardinhas ali amontoadas.)
A desvantagem: essa ferramenta não permite busca - ao menos não nos browsers que eu tenho em casa (Chrome, Firefox, Explorer e Safari). Assim, você precisa ter noção geográfica da região pra localizar visualmente. Eu consigo fazer isso na Paulista, mas não conseguiria fazer em Washington porque não conheço a cidade e não sei como me localizar.
Saída mais difícil
Se você não sabe se localizar na região, abra o Google Maps e pesquise o ponto de referência da área que você quer medir. Por exemplo, Masp:

Clique em "Meus Mapas", ali na aba da esquerda. Desça até o último: "Ferramenta para Medição de Distâncias". Agora, clique no primeiro e no último ponto da linha que você quer medir. Por exemplo, do Masp à Consolação.

Anote os 981,5 metros (eu arredondei) e Clique em "Remover o último ponto". Clique agora do outro lado da Paulista para ver a largura da rua.

Anote os 46 metros (também arredondei).
Você sabe que uma quinta série do primário bem-feita é muito importante para qualquer cidadão. Para os jornalistas, então, uma quinta série bem feita deveria ser obrigatória, muito mais do que qualquer diploma. (A Fenaj que me desculpe.)
Então, vamos lembrar do que a professora ensinava lá naquelas tardes em que eu não via a hora de ler gibi no recreio: nos retângulos, a área é medida multiplicando-se a altura pela largura. Portanto, são 981,5 vezes 46. Diferentemente da quinta série, você pode usar calculadora ou até o Excel que ninguém vai baixar sua nota por isso.
Isso vai dar uma área de 45.149 metros quadrados. Dá menos que os 56.606 metros quadrados da ferramenta anterior? Dá; mas isso tem muito a ver com a mão que fez. As distâncias que eu marquei, a olho, não eram exatamente as mesmas, e se for olhar bem o meu polígono da ferramenta anterior invadiu o Conjunto Nacional.
Tendo como pesquisar, você pode ter uma localização mais exata. Tendo as coordenadas, pode ser ainda melhor.
segunda-feira, 19 de janeiro de 2009
Calcular multidões? Yes, we can.

O jornalista Steve Doig, discípulo de Philip Meyer, aposta: vai ser uma loucura a quantidade de chutatísticas divergentes sobre a multidão que vai assistir à posse do Obama. Não por ser a posse do Obama, mas porque os números sempre são usados como arma para demonstrar força política. É assim lá, é assim aqui.Nisso, que se dane a precisão. Os organizadores sabem que os jornalistas adoram números mas têm sérios problemas com a maldita matemática, então a gente entra na dança. Os mais cuidadosos costumam apresentar as estimativas dos organizadores lado a lado com as da polícia. Na mais comum, só pegam as estimativas de um dos lados. Mas dá pra medir, sim - embora seja mais trabalhoso. Nos anos 80, especialmente a partir dos comícios pelas Diretas na Praça da Sé, a Folha consagrou a técnica de pegar uma foto aérea, calcular a área e multiplicar: caberia algo entre 4 e 6 pessoas por metro quadrado.
Em artigo para a MSNBC, Doig sugere metodologia parecida e conta a origem dela:
- O método vem do final dos anos 60 e de um professor de jornalismo da Universidade de Califórnia em Berkeley chamado Herbert Jacobs, cujo gabinete ficava numa torre de onde se via a praça onde os estudantes freqüentemente se reuniam para protestar contra a guerra do Vietnã. A praça era marcada com linhas cruzadas regulares, o que permitiu a Jacobs ver quantos quadrados eram preenchidos pelos estudantes e quantos estudantes, em média, se aglomeravam na área.
Após reunir dados de numerosas amostras, Jacobs criou alguns macetes que ainda são usados hoje por quem leva a sério a estimativa de multidões. Uma multidão mais solta, em que cada pessoa está à distância de um braço do corpo de seus vizinhos mais próximos, precisa de quase um metro quadrado por pessoa. Uma multidão mais aglomerada ocupa 0,42 metro quadrado por pessoa. Uma turba realmente assustadora com densidade de mosh-pit daria 0,23 metro quadrado por pessoa.
O truque, então, é medir adequadamente os metros quadrados totais da área ocupada pela multidão e dividi-los pelo número apropriado, dependendo da avaliação sobre a densidade da multidão. Graças a fotos aéreas ou aplicativos de mapeamento como o Google Earth, até áreas abertas podem ser prontamente medidas atualmente.
Quando era ombudsman da Folha, mestre Mário Magalhães observou o quanto as medidas da multidão eram usadas pra puxar a brasa para assados militantes. A Parada Gay daquele ano orgulhava-se de 3,5 milhões de participantes. Magalhães lembrou que, no maior fora-Collor da história, em 18 de setembro de 1992, os organizadores falavam em 1 milhão de participantes, a polícia falava em 650 mil e a medição por foto aérea, feita pelo DataFolha, cravava 70 mil. Mário fez as contas: caso os números dos organizadores, apurados sabe-se lá com que metodologia, estivessem corretos, a multidão da parada gay seria "equivalente a 50 atos como o do auge dos caras-pintadas".
Para não dar muito erro amanhã, Doig dá algumas dicas:
- Se o pessoal se amontoar nos 0,33 quilômetros quadrados do National Mall entre as ruas 1 e 14 Noroeste em apertados meio metro quadrado por pessoa, cerca de 700 mil poderiam se enfiar lá. A área aberta em torno do Monumento a Washington, entre as avenidas Constitution e Independence, até a 17 Noroeste, podem acomodar outros 700 mil na mesma densidade. E, presumindo que uma multidão mais solta longe da posse vá ficar nos degraus do Capitólio, talvez mais um meio milhão possa estar circulando pela área do Mall defronte ao Memorial Lincoln.
Assim, é pelo menos fisicamente possível acomodar algo próximo a 2 milhões de americanos na faixa de 3,4 quilômetros entre os degraus do Capitólio e os pés de Lincoln. Graças às espantosas realidades logísticas para hospedar, alimentar e transportar uma multidão de visitantes que quadruplicariam a população do distrito, há boas chances de que a multidão real será menor do que isso. Apenas fotos aéreas pós-posse poderão nos dizer ao certo.
Doig também lembra que a inflação das multidões também se presta à criação de mitos. "Um dia, tanta gente vai dizer que esteve na multidão que testemunhou a posse de Barack Obama quantos os que dizem hoje que ouviram o Jimi Hendrix tocar em Woodstock há 40 anos. As pessoas adoram se gabar de terem sido testemunhas da história - mesmo quando não foram."
sexta-feira, 16 de janeiro de 2009
Mais um trabalho excelente do New York Times
Margot Williams, bibliotecária do New York Times em Washington, compilou os documentos sobre o que se sabe a respeito dos prisioneiros de Guantánamo. Colocou no ar os dados sobre todos os 779 prisioneiros de que há registro de haverem estado lá, incluindo uma lista de 248 prisioneiros que ainda estão lá.O serviço também permite verificar em quantos e quais documentos aparece a palavra "tortura".
Margot é extremamente meticulosa, atenciosa e bem-humorada - o toque do seu celular é a confissão do Khalid Sheikh Mohammed (baixe aqui). Tive a honra de conhecê-la há alguns meses, na Noruega. Em entrevista ao ProPublica, ela descreve seu método de trabalho e aponta o que ainda pode melhorar nele. Cada uma dessas aspas tem uma das características que eu respeito muito e que a Margot tem de sobra:
- "This is only one side, it’s not presenting the defense teams’ sides. I’m hoping to get those documents in, but that’s hard because most of them haven’t been posted."
Ela reconhece as limitações do trabalho - exatamente porque deseja melhorá-lo.
- "I’ve read the 16,000 pages. That’s where I pull the information that goes in the database. I am a reader of documents. There’s no substitute for reading every line of every page. As they said on the 9/11 commission report, it’s about putting together the mosaic and seeing the patterns."
Margot é um gênio no uso do banco de dados, mas ela sabe que nada substitui a boa e velha leitura. Mesmo que seja de 16 mil páginas de documentos oficiais. A partir dessa leitura é que ela tira os dados para montar seu banco.
- "In my mind’s eye, this is the form I’d hope the government would make them available in rather than dumping them in unusable formats. I’m glad we’ve made the documents more useful for people to figure out for themselves who these [prisoners] are."
Sua preocupação principal é com o acesso dos cidadãos à informação pública. O trabalho, da forma como foi feito, também poderia ter sido feito pelo governo, mas não foi. Da forma como está, qualquer cidadão que queira conhecer melhor o que o governo faz com seu dinheiro pode ir lá e pesquisar.
quinta-feira, 15 de janeiro de 2009
O verdadeiro novo jornalismo

Gay Talese? Norman Mailer? Truman Capote? O jornalismo deles era novo há quase meio século.
Quando for pensar em novo jornalismo hoje, pense em Aron Pilhofer, por exemplo. É esse cavalheiro no canto esquerdo.
Nunca ouviu falar? Pois ainda tem tempo: a revista New York publicou um perfil do grupo de jornalistas nerds liderado pelo Aron no New York Times.
Eles trabalham basicamente com bancos de dados aplicados à internet - como este, sobre as vítimas da guerra do Iraque, ou este, comparando bilheterias de filmes americanos, ou este, comparando a arrecadação de campanha dos vários pré-candidatos à eleição americana.
Além de fascinados pelo uso de dados no jornalismo, eles também são humildes.
Conversei longamente com o Aron em 2007, durante a Summer School do Centre for Investigative Journalism em Londres. Perguntei a ele para que lado ele via o jornalismo na internet indo. "Sei tanto quanto você", ele disse. "Mas tenho a sorte de me deixarem experimentar bastante".
segunda-feira, 12 de janeiro de 2009
O marceneiro e os bancos de dados
Há vários anos, ouvi o conselho do meu mestre Elio Gaspari sobre o impressionante banco de dados que ele usa há mais de duas décadas para arquivar textos e outros materiais em seu computador. Ele arquiva no computador todas as notícias que possam lhe interessar, bem como registros de entrevistas, áudios e trechos de livros. Quando precisa escrever sobre algum assunto - a reunião que gerou o AI-5, por exemplo, como no segundo volume de sua série sobre a ditadura -, ele simplesmente faz uma busca pelas palavras-chave em seu banco de dados e imediatamente tem acesso a todas as informações que coletou sobre o assunto durante praticamente toda a sua carreira.
Sempre pensei em fazer um banco de dados da mesma espécie, mas ficava frustrado pela falta de tempo e/ou disciplina para mantê-lo em dia. Sempre. Aí descobri o Copernic Desktop Search.
Basicamente, o que ele faz é indexar automaticamente todos os arquivos que você tem em seu computador. Assim, você pode fazer buscas para chegar à informação que deseja. Pode pesquisar por palavra-chave e filtrar por tipo de arquivo ou data de atualização no computador. Dentro dele, você decide se quer que ele mostre só arquivos de som, fotos, e-mails, contatos ou outros. Se é um arquivo de texto, ou uma planilha, ele mostra um preview. Assim:

Existem outros programas que fazem coisas semelhantes, como o Google Desktop. Mas acho o Copernic mais anônimo.
A maior vantagem dele é que a única disciplina que ele exige da gente é instalar o programa e (caso prefira) organizar os seus arquivos em pastas temáticas dentro do computador. Eu, por exemplo, mantenho uma pasta só para as transcrições de entrevistas, onde tomo o cuidado de indexar cada uma com códigos informando a data, o personagem e o local para onde fiz a entrevista.
O Copernic tem duas desvantagens fundamentais:
1) Num banco de dados feito no Access ou no Filemaker, como o do Elio, você pode linkar o arquivo de som, vídeo ou imagem e escrever uma legenda, uma transcrição, uma descrição dele. O Copernic, porém, tem sua força pesquisando apenas o que está escrito - e, no caso de arquivos multimídia, ele só pesquisa o que consta do nome do arquivo.
2) Como bem lembrou a Ana Estela, esse tipo de banco de dados não é portátil. Você não pode carregá-lo no bolso dentro de um pen drive, por exemplo, porque ele basicamente está instalado no seu computador e indexa os arquivos que estão soltos lá dentro. Em vez de carregar no bolso, portanto, você pode no máximo carregar seu banco de dados numa mochila.
De qualquer forma, eu acho que as vantagens superam as desvantagens, especialmente porque o Copernic nos poupa muito trabalho.
Marcadores:
bancos de dados,
cinto de utilidades,
copernic
domingo, 11 de janeiro de 2009
O câmbio e os shows internacionais

Sou fã incondicional do Deep Purple, como bem sabe quem me conhece. Mas, por conta da crise, é possível que neste ano eu e os outros fãs deles não possamos vê-los ao vivo logo de saída.
Uma das minhas idéias para este ano é fazer vários posts estudando os números do noticiário da perspectiva de um leigo. Tal como muitos de vocês, eu fiquei feliz quando entrei na faculdade de jornalismo por ter me livrado da matemática. Precisei quebrar a cara uma vez para resolver me dedicar um pouco a ela. O Excel me ajuda muito nisso, mas ele não faz tudo. Então, procuro estudar um pouco mais os números. Não sou um craque em matemática, estou longe disso, mas aprendi a gostar de olhar os números com um pouco mais de cuidado, especialmente quando aplicados a assuntos do cotidiano.
Neste primeiro post sobre os números no noticiário, resolvi é ver o que o câmbio tem a ver com essa história de o Deep Purple estar demorando pra marcar shows no Brasil.
1) O dólar anda corcoveando. Voltou aos níveis de 2005, depois de uma longa trajetória de queda. Ainda não estabilizou direito. Como os cachês e outros custos são cotados em dólar, o mercado dos espetáculos está em alerta desde outubro. Três meses antes, o mesmo mercado comemorava o bom momento do câmbio para trazer os shows. A conta é fácil: quando o câmbio está baixo, pagando-se menos reais os artistas recebem mais dólares.
2) Em 1999, o câmbio deu uma corcoveada com a maxidesvalorização empreendida logo após a reeleição do presidente Fernando Henrique Cardoso. O Deep Purple tinha marcado uma turnê que incluiria Porto Alegre, mas a produtora local acabou desmarcando o show de lá porque ficou caro demais. Perdi a chance de vê-los naquele ano, infelizmente. Foi a penúltima vez em que eles pisaram no Brasil com o tecladista Jon Lord.
3) Está lenta a marcação dos shows do Purple no primeiro semestre, e possivelmente um dos fatores é a crise mundial. Lembrem que a economia começou a encrespar lá por setembro, o que pegou todo o período de antecedência razoável para marcar datas para os primeiros meses do ano.
4) Estamos quase no meio de janeiro e o único show marcado para fevereiro é o da Argentina, dia 14/2. A seqüência lógica seria o Deep Purple vir para o Brasil na mesma viagem, como costuma fazer, mas até agora nada foi anunciado. Se demorar mais uma semana, pode ter impacto nas vendas de ingressos, porque seria muito em cima da hora.
5) No ano passado, chegou a ser anunciado um show em Manaus e o Deep Purple cancelou, prometendo para os organizadores incluir a cidade na turnê mais ou menos em março deste ano. Isso foi antes da crise. Agora, conversei com os organizadores e eles disseram que chegou a vir a nova proposta dos shows para março, mas ela foi recusada. Não conversei com produtores de São Paulo, Rio e outras cidades.
6) Quando o câmbio está em fase de segura-peão, fica caro trazer a banda. O gráfico abaixo, feito no Excel, mostra a cotação do dólar e as vindas do Purple ao Brasil desde o início do plano real. Não inclui a turnê de 1991, porque teria que atualizar a cotação dia a dia pelo real. Observe que o Deep Purple (e certamente não só ele) vem quando o dólar está estável, caindo ou subindo moderadamente. Por mais que o dólar esteja no nível de 2005, quando os músicos vieram, naquele ano o câmbio vinha caindo e neste ele vem subindo. Faz toda diferença: imagine comprar um quilo de bananas a R$ 2,30 e correr o risco de pagar R$ 2,50 quando ele chegar. Agora, imagine comprar 50 toneladas de bananas com essa incerteza: a diferença seria de R$ 10 mil.
sábado, 10 de janeiro de 2009
Reflexões sem dor
Pena que o Yahoo Pipes não filtra os comerciais da televisão, também.
Com o feed do G1, está funcionando que é uma beleza. Com o da Ilustrada Online, melhor ainda.
Com o feed do G1, está funcionando que é uma beleza. Com o da Ilustrada Online, melhor ainda.
quinta-feira, 8 de janeiro de 2009
Coando o RSS pra tirar o Big Brother
Desde ontem, meus feeds começaram a me inundar de notícias sobre o Big Brother. Eu não tenho paciência sequer para assistir à atração, quanto mais para ler sobre ela. E você? Vote na enquete aí do lado.Os próximos dias serão cheios de revelações imperdíveis sobre os gostos pessoais de cada um, as manias de cada qual, quem comeu quem, quem disse que besteira, quem brigou com quem e de que passatempos eles participaram. Você pode preferir a BBC, mas o BBB vai perseguir você.
Ê, laiá, como dizia o meu ex-estagiário Rodolfo Vianna.
Só há um remédio: filtrar os feeds antes que eles cheguem ao meu Google Reader. Até recentemente, eu considerava isso quase impossível para o meu quase nulo conhecimento de programação, mas aí descobri uma ferramenta interessante: o Yahoo Pipes.

O Pipes é um recurso mais técnico do que a média dos que eu uso no dia-a-dia. Basicamente, ele abre formas para que cada usuário crie seu próprio conteúdo para a Web misturando fontes da própria rede. Ele pode pegar dados da Bolsa e criar seu próprio gráfico atualizado minuto a minuto, ou pode fazer um mapa com a população dos EUA estado por estado.
Minha necessidade é mais prosaica. Eu apenas não quero ler sobre o Big Brother. Especialmente não quero ler sobre o Big Brother no feed do G1, que já é o que mais me enche a caixa, com uma média de 205,4 notícias por dia.
(Parêntese. O segundo colocado, o feed do O Globo, traz 162,7 notícias por dia. O terceiro, do Guardian, traz uma média de 57,1. Ou seja: o G1 me entope com quase quatro vezes o conteúdo do Guardian. E ainda vai me entupir de notícias do BBB? Eu fora.)
Outro dia eu mostro o passo-a-passo. Mas a idéia é simples: eu escolho o feed, ligo o filtro, cadastro as palavras que eu NÃO quero que o G1 mostre (BBB, "Big Brother"), digo onde elas podem estar (título, descrição) e mando o Pipes filtrar:

Aí eu salvo, clico em "Properties" e depois, na caixinha onde se coloca o título, clico em "Run Pipe". Aí vem esta tela:

Nesse ponto, só precisa clicar no ícone do RSS - aquele radinho cor de laranja - e bater na opção "Get as RSS". Pegue esse link e cadastre no seu Google Reader. Ou, melhor, clicar no botãozinho do Google. Ele adiciona imediatamente. Pronto: agora você está livre das notícias sobre o Big Brother. O único risco que você corre é o de não passar em concurso público.
Quer usar o meu G1 depurado? Então pegue-o aqui. Estou filtrando também as notícias sobre a Eloá, OK?
Nos próximos dias, vou acompanhar os dois feeds em paralelo só pra ver a diferença entre eles. Posto aqui as novidades. Fiquem ligados.
- LEIA MAIS: Pelo direito de não ler sobre o Big Brother (4.jan.2008)
Viu no que dá levar a sério? (14.jan.2008)
Nem ele (18.jan.2008)
Uma triste equação e uma longa digressão (28.out.2008)
Os efeitos da equação (30.out.2008)
O churnalismo e o submercado (30.out.2008)
O jornalismo online e os produtos intermediários (15.dez.2008)
quarta-feira, 7 de janeiro de 2009
Voltando à ativa
Salvem. Andei meio sumido no final de ano, perdido em meio a churrasco, bom chimarrão, fandango, trago e mulher (as mulheres da família, diga-se), e só agora estou terminando de colocar meu ritmo em dia.
Não esqueci os posts que estou devendo aqui. Inspirado na minha mestra Yoda Ana Estela, aqui vai a lista das dívidas pendentes. Uma eu prometi aqui ainda no ano passado; outra, prometi por e-mail no comecinho deste ano; a terceira é uma que eu prometi pra mim mesmo e que já comecei a mexer em outro post.
O primeiro deve ser o segundo. Quero ver se consigo começar hoje.
EDITADO: Só vai dar pra começar amanhã. Mas é por um ótimo motivo.
Não esqueci os posts que estou devendo aqui. Inspirado na minha mestra Yoda Ana Estela, aqui vai a lista das dívidas pendentes. Uma eu prometi aqui ainda no ano passado; outra, prometi por e-mail no comecinho deste ano; a terceira é uma que eu prometi pra mim mesmo e que já comecei a mexer em outro post.
- 1) A terceira parte das dicas do Google Reader, sobre como usar as tags.
2) Um post sobre os tipos de programa possíveis para fazer bancos de dados.
3) Mais posts sobre o uso dos números na apuração.
O primeiro deve ser o segundo. Quero ver se consigo começar hoje.
EDITADO: Só vai dar pra começar amanhã. Mas é por um ótimo motivo.
Assinar:
Postagens (Atom)
"How to Lie with Statistics"
"Precision Journalism"
"A Mathematician Reads the Newspaper"
"A Lógica do Cisne Negro"
"Ensaios Céticos"