quinta-feira, 21 de maio de 2009

Aprendendo com Mark Felt

Neste final de semana, a revista Veja deu uma matéria sobre mais um pedaço da longa crise do governo Yeda Crusius. Era um recibo de doação feita pela empresa de tabaco Alliance One à sua campanha. A empresa teria como comprovar a doação, mas a contabilidade da campanha da governadora não teria como comprovar o recebimento.

Hoje, o PSDB gaúcho detalhou a arrecadação feita pelo partido para doar via comitê para a campanha em 2006. Noves fora o fato de boa parte da arrecadação, inclusive essa doação, ter sido feita por vias tortas, para não aparecer, depois da eleição - o que é chato e pouco transparente mas não é ilegal -, eles tinham sim como comprovar a doação.

Na hora, lembrei do mais valioso conselho dado pelo Garganta Profunda ao Bob Woodward no livro "Todos os Homens do Presidente". É uma obra que eu já li umas três, quatro vezes. Li, anotei e sempre descubro algo novo. Mas esse trecho é especial. Os repórteres tinham acabado de cometer um erro em sua apuração.

O erro era minúsculo: Woodward e Bernstein tinham obtido de um funcionário do comitê de reeleição a informação de que o chefe da Casa Civil da Casa Branca, H.R.Haldeman, era quem controlava um fundo secreto para bancar operações clandestinas como a invasão do comitê democrata no prédio Watergate. Eles puseram na matéria que o funcionário teria dito isso durante depoimento. O erro era que ele não disse - apenas estava pronto a dizer, caso perguntassem, mas ninguém perguntou.

Mark Felt, o Garganta Profunda, chama Woodward a um encontro e lhe passa este sermão com o qual todos podemos aprender:

    "Numa conspiração como esta... numa investigação de conspiração... a corda tem que apertar devagar em torno do pescoço de todos. Se você for subindo convincentemente a partir das beiradas, consegue dez vezes as evidências de que precisa contra os Hunts e Liddys. Eles se sentem inapelavelmente acabados... podem não falar logo, mas a pressão está sobre eles. Aí, você sobe e faz a mesma coisa no nível seguinte. Se você atirar muito alto e errar, todos passam a se sentir mais seguros. Os advogados trabalham dessa maneira. Eu tenho certeza de que repórteres inteligentes também deveriam. Você atrasou a investigação em meses. Isso põe todo mundo na defensiva - editores, agentes do FBI, todo mundo volta para a toca depois de uma dessas."

É uma pena. Mas todo o avanço que a revista tinha feito uma semana antes, ao relatar as gravações a que teve acesso, ricocheteou.

quarta-feira, 13 de maio de 2009

Quanto custaram os ataques do PCC

Há três anos, o medo dos ataques do Primeiro Comando da Capital (PCC) parou São Paulo por dois dias. Na sexta-feira que antecedeu o Dia das Mães, criminosos se rebelaram nas prisões e atiraram contra policiais e agentes penitenciários de folga. Lembro da tensão naquela manhã e da boataria à tarde. "Eles vão atirar em quem estiver com as lojas abertas!", diziam alguns. Lembro da tranqueira dos megaengarrafamentos no final da tarde, quando todo mundo queria chegar logo em casa pra não tomar tiros que nunca houveram. E lembro do silêncio da madrugada, cortado apenas pelas sirenes.

Os 10 dias em que o PCC parou e depois perturbou São Paulo, há três anos, custaram diretamente R$ 722.404,54 aos cofres públicos. O dado vem de análise que eu fiz a partir dos gastos das secretarias de Segurança Pública e Administração Penitenciária entre 12 e 21 de maio de 2006. (Veja minha planilha aqui.)

No ano passado, em meio ao escândalo dos cartões corporativos do governo federal, o governo de São Paulo colocou os dados do cartão de pagamentos estadual na internet - só que em PDF, um formatinho por si inanalisável. Mas lá estavam dados de 2000 em diante, o que seria uma preciosidade se transformado em banco de dados. Então, usei um programa que tenho aqui (o utilíssimo Able2Extract, mas precisei comprar a versão profissional devido ao volume de dados), converti para Excel e separei os gastos dessas duas secretarias naqueles dias. Tem coisas interessantes ali. Por exemplo: naqueles dias, as duas secretarias gastaram R$ 85.772,71 com combustível. Agentes delas sacaram R$ 422.680,85 em dinheiro vivo.

Só no primeiro dia, a preços de hoje, as duas secretarias abasteceram 8.616 litros de diesel (18.817 litros nos 10 dias), 1.030 litros de álcool (5.962 litros nos 10 dias) e 547 litros de gasolina (14.240 litros nos 10 dias). Os nomes dos postos estão lá - e eu fico imaginando, por exemplo, como estavam os policiais que abasteceram R$ 6 mil em diesel, ou 2.820 litros a preços de hoje, no dia 12, no posto Matrinxã, na estrada que vai para Carapicuíba. Quantas viaturas seriam? E quantas seriam as que abasteceram R$ 8 mil em gasolina, ou 3.378 litros a preços de hoje, no posto Dila, no Guarujá?

Logo depois da correria, o terror. Ônibus queimados. Vários assassinatos, supostamente de criminosos (muitos sem folha corrida alguma). A polícia dava um número, os IMLs recolhiam outro muito maior. No final, deu 170 mortos. Corria o boato de que, em certas áreas da cidade, se você estivesse na rua na hora errada e portando a cor da pele errada, poderia ser morto. Nunca esqueço de uma matéria da Folha em que a repórter entrevistou um cara da perifa perguntando se ele não tinha medo de ser atacado pelo PCC. Ele responde que do PCC ele não tinha medo, porque todo mundo que o PCC matou era quem eles queriam matar mesmo. Tinha medo era da polícia, que matou sem saber se era ou não quem eles queriam.

Os R$ 422.680,75 sacados para custear as operações policiais foram saques em dinheiro vivo, justificados como "operação policial", "diárias" ou outros itens. Eles foram crescendo ao longo dos dias:

    R$ 56.278,76 no dia 12 (10 mortes);
    R$ 62.493,16 no dia 15 (117 mortes);
    R$ 104.847,22 no dia 16 (89 mortes);
    R$ 81.443,41 no dia 17 (62 mortes);
    R$ 24.171,12 no dia 18 (51 mortes);
    R$ 93.447,18 no dia 19 (14 mortes)

Tudo isso você pode calcular na planilha que eu linkei.

Muita coisa daqueles dias ficou nebulosa e dificilmente será esclarecida. Há interesses políticos nisso - que também dificilmente serão esclarecidos. Tão mal esclarecidos quanto 33 dos 54 atentados cometidos contra civis entre 12 e 21 de maio de 2006, supostamente por policiais a serviço ou de folga. Segundo a Folha, as investigações desses casos foram encerradas sem que fossem resolvidas. Provavelmente nunca serão. Até porque provas importantes sumiram, como revelou o Estadão em 2007:

    Um apagão nos gravadores do Centro de Operações da Policia Militar (Copom) sumiu com provas importantes para a apuração dos 104 casos de pessoas mortas por policiais durante a reação aos ataques do Primeiro Comando da Capital (PCC) em 2006. Segundo a PM, os gravadores responsáveis pelos registros das comunicações do centro com os carros da PM entraram em pane, coincidentemente, ao mesmo tempo que o aparelho restaurador de fitas, o Data Digital Storage (DDS), também apresentou problemas técnicos, não ''permitindo restaurar as comunicações''.

Mas também tenho ótimas lembranças daqueles dias: foi ali que um amigo argentino me ligou, convidando para fazer minha primeira reportagem para o Los Angeles Times (com byline na capa e tudo): Inmates unleash torrent of violence on Brazilian city

sexta-feira, 8 de maio de 2009

Como a farra aérea pesa no bolso

Estavam com saudades da seção Numeralha? Pois ela está de volta.

Por provocação do amigo Fabiano "Oggh" Denardin, editor sênior dos gibis DC na Panini Comics, fiz umas contas sobre quanto a farra aérea dos deputados e senadores custa no bolso do cidadão. Sim, porque é a gente quem paga.

Segundo o Congresso em Foco, Miami é o destino favorito de suas excelências. Foram 93 voos de deputados para lá. Veja a lista completa de voos e passageiros aqui.

Pra simplificar a conta, digamos que os deputados tenham partido direto de São Paulo, do aeroporto de Guarulhos, para Miami. É uma passagem só. Se o cara veio de outro estado, ele ainda tem a passagem do estado dele até São Paulo, o que encarece a brincadeira.

Consultei o site da TAM. Eles trabalham com três classes de passagem para Miami:
    * Econômica (R$ 1.493,36 ida e volta)

    * Executiva (R$ 8.520,90 ida e volta)

    * Primeira Classe (R$ 18.280,56 ida e volta)

Pois bem. Pra ter o imposto de renda descontado do salário, o sujeito tem que ganhar no mínimo R$ 1.313,69 . É um salário plausível para iniciantes em qualquer profissão - estágios decentes pagam em média quase isso. Bom: o Leão garfa todo mês 15% do salário desse cidadão. Isso dá R$ 197,05 por mês.

Às contas, então. Para bancar um vôo de deputados para lá, ele precisa trabalhar e pagar de imposto:

    * Sete meses e meio, se sua excelência for na classe econômica;

    * 43 meses e meio, ou mais de três anos e meio, se sua excelência for na classe executiva;

    * mais de 92 meses e meio, ou mais de sete anos e meio, se sua excelência for de primeira classe.

Sinceramente? Como quem paga somos nós, duvido que eles vão de classe econômica.

E isso é pra bancar apenas um deputado em apenas um passeio de ida e volta. O imposto também é usado pra bancar todo o resto do funcionamento do poder público.

quinta-feira, 7 de maio de 2009

Transparência opaca à paulista

A Prefeitura de São Paulo colocou na internet as listas dos funcionários de suas secretarias, um ano depois de a cidade aprovar lei sobre o assunto. (Leia mais a respeito no blog do Fabiano Angélico).

Bom, né? Nem tanto. Por vários motivos:

1) Tal como o cartão corporativo do governo do estado e a lista de funcionários da Câmara Municipal, os dados estão em formato PDF. Ou seja: a menos que o freguês saiba convertê-los num banco de dados (que é como eles estão na origem), é o mesmo que entregar-lhe calhamaços de folhas de papel. E ao menos uma secretaria tem mais de 500 páginas de funcionários.

2) Cada secretaria tem um padrão diverso de divulgação. Não são todas as que informam o DAS dos funcionários, por exemplo - o que permitiria calcular facilmente a distribuição dos salários num banco de dados. Disso também decorre um esforço maior na "faxina" dos dados para fazer um banco de dados.

3) Eles colocaram secretaria por secretaria, subprefeitura por subprefeitura - em vez de agregar. Algumas secretarias sequer tiveram suas listas publicadas. São elas: Cultura, Educação e Esportes, Lazer e Educação. Há três hipóteses para isso: ou é um erro do site, ou houve atraso da secretaria, ou estão escondendo mesmo.

4) Os PDFs serão atualizados mensalmente, é o que promete a prefeitura. Mas cada um deles foi atualizado numa data diferente. Azar o do abelhudo que desejar manter seus registros atualizados.

Isso, pra mim, não é transparência. É opacidade. Eles têm os dados em banco de dados. Foram obrigados por lei a divulgar. Então, fizeram-no do jeito que mais dificultasse a vida de quem quiser observar o que eles fazem. Se isso não é deliberado, não sei o que pode ser.

Bom: converti as listas de todas as secretarias para um só arquivo Excel. Não converti as das subprefeituras por falta de tempo hábil. Como o arquivo é grande, não coube no Google Docs e nem no Zoho. Consegui pôr no Scribd. Para analisar no seu Excel, precisa fazer o download (use este link).

Lista de funcionários da Prefeitura Municipal de São Paulo - abril de 2009

quarta-feira, 6 de maio de 2009

G1 faz experiência colaborativa

O G1 está fazendo uma experiência interessante:

    Você conhece alguma rua com problema de iluminação em São Paulo? Postes com luzes apagadas - seja por atos de vandalismo ou problema elétrico - podem ser indicados. Na área de comentários, mais abaixo, escreva o endereço e o tipo de problema.

    As indicações serão colocadas no mapa e, dentro de alguns dias, o G1 fará uma reportagem completa sobre o tema, mostrando os locais indicados e ouvindo o que a Eletropaulo tem a dizer.

Em poucas horas, foram postadas nos comentários 20 indicações de lugares mal-iluminados.

Em experiência anterior, em 20 de abril, eles mapearam falhas no asfalto na cidade (o popular buraco de rua) usando a mesma metodologia. Após a publicação do mapa, mostrando as falhas da prefeitura, eles deram retorno ao G1 dizendo ter consertado 18 daqueles buracos apontados pelos leitores.

Meu único reparo: isso devia ser um serviço permanente, não apenas para coletar dados
que serão usados em uma só reportagem mais adiante.

Experiências como essa são muito interessantes. Aproveitam o que de melhor os leitores têm a oferecer - e aproveitariam ainda mais se usassem fotos também.

Gosto da idéia do jornalismo colaborativo, com um porém: se o leitor-colaborador não for pautado, ele vai mandar notícia chupada de outros sites ou foto do seu cachorro fazendo xixi no poste. Leitor não sabe o que é pauta, nem tem obrigação de saber. Mas colabora bem se for convidado e se explicarem o que se quer dele.

terça-feira, 5 de maio de 2009

Pra não perder os contatos

A Ana Estela e a Cris, no Novo em Folha, me pediram uma dica sobre manutenção da agenda de contatos em meio digital. Eu disse o seguinte:

    "Quando for escolher um celular novo, tipo smartphone, ou mesmo agenda eletrônica, veja se ela conecta no computador via cabo USB. Se ele ou ela faz isso, é bastante provável que tenha um programa que 'converse' com o Outlook. Precisa ver modelo a modelo como é. Às vezes precisa baixar da Internet."

    "Acho que é importante ter os dados de contato em pelo menos dois aparelhos (o computador e um portátil). Se puder ter em dois aparelhos e mais um backup online, pode trocar de computador e perder o aparelho à vontade que ninguém te pega."

Agora, o Google botou no ar como serviço autônomo o Google Contatos. Você não precisa usar o GMail (eu quase não uso) para utilizá-lo.

Embora ele não tenha sincronização automática com seus aparelhos portáteis, como tem para os compromissos no Google Agenda, o Contatos importa listas de telefones em formato CSV.

O que é o CSV? Significa "comma-separated values" - ou seja, ele vai converter o banco de dados em texto, separando as colunas por vírgulas. Isso é um formato universal de comunicação de dados entre bancos de dados. O Datasus, banco de dados do Sistema Único de Saúde, permite cruzamento de informações e fornece as tabelas em CSV para você importar para o Excel ou para o Access.

Na prática, como funciona isso?

Digamos que você mantém seus contatos em seu computador no seu programa de e-mails, seja ele o Outlook ou algum outro. Todos têm essa função. Vou dar o passo a passo com o Outlook que é o que eu uso. Clique em "arquivo", depois "importar e exportar". Assim:


No "Assistente para importação e exportação", escolha a opção "Exportar para um arquivo", depois "Avançar":


Agora, escolha "Valores separados por vírgulas", depois "Avançar":


Agora, escolha que pasta você quer transformar em CSV. Repare que, pra este fim, você está escolhendo "contatos". Mas você também pode converter seu calendário ou até seus e-mails.


Agora, escolha um nome para um arquivo e uma pasta onde guardá-lo (no "procurar"). Depois clique em "avançar" e "concluir":


Pronto. Você tem agora todos os seus contatos num formato maleável que pode ser importado pelo Excel, pelo Access, por outro programa de e-mail ou por um programa online de contatos. Por curiosidade, clique duas vezes sobre o arquivo para ver com que cara ele fica.

Vamos ao Google Contatos. No canto superior direito, você vê três links: "importar", "exportar" e "imprimir". Clicando no primeiro, você pode importar seus contatos. Vem esta tela, onde você seleciona o arquivo e depois bate em "importar":




Vai demorar uns segundos, mas enfim chega a mensagem:


Pronto. AGORA, ninguém me pega. Muito mais simples do que redigitar todos os meus contatos de uma agenda para outra, como eu tive de fazer uma vez.

segunda-feira, 4 de maio de 2009

Pra mudar o jogo?


Deve ser lançado neste mês o site de buscas Wolfram Alpha. Ele promete ser mais revolucionário do que o Google foi há uma década: em vez de dar uma lista de links como resposta a uma consulta, ele promete dar a própria resposta.

É uma tarefa e tanto: até agora, o que os buscadores fazem é basicamente comparar as palavras da consulta com as palavras disponíveis em todos os arquivos de seu banco de dados, organizar por relevância e apresentar os resultados ao usuário. O que o Wolfram pretende fazer, segundo seu criador, é diferente: é ELABORAR uma resposta adequada para a pergunta específica do usuário, usando as informações dos trilhões de textos disponíveis em seu banco de dados.

Eu acho muito ambicioso e só acredito vendo. Mas estou louco pra ver. Se for verdade e funcionar mesmo como ele diz, é revolucionário mesmo - e pode inclusive ter consequências para o jornalismo como se pratica hoje.

A Thomson Reuters, no ano passado, já andou prometendo deixar de usar jornalistas humanos para escrever matérias sobre indicadores. Só precisaria receber os indicadores, de forma estruturada; um computador calcularia as relações e geraria um texto automático. Isso é relativamente fácil de fazer, tendo frases-padrão e um banco de dados onde se possa calcular o sobe-e-desce.

Duvido que o resultado venha a ser muito mais burocrático do que esta notícia aqui, escrita por um ser humano. As frases-padrão estão lá. Como essa, há semelhantes todo dia em todos os sites de notícias do mundo inteiro. Estranho apenas que só recentemente a Thomson Reuters tenha anunciado algo assim - e sem ainda lançar, ao que eu saiba.

Um software que cumpra a promessa do Wolfram Alpha, caso realmente venha a existir (e em mais de uma língua além do inglês), poderia evoluir pra fazer mais ou menos o mesmo com informações muito mais complexas do que o sobe-e-desce dos indicadores. Grande parte do churnalismo hoje disponível na Web, em grande concentração de base declaratória e releaseira, não é muito mais complexo e nem mais profundo do que isso.

Também no ano passado, o jornalista-programador Pedro Valente fez uma apresentação sobre a relação entre informações estruturadas e jornalismo. Tem muito a ver:



O que pode valer a pena pra levar os jornalistas a pensar: o que eu, um ser humano treinado, posso acrescentar a esta história que um computador (ou um gravador, no caso do jornalismo declaratório onipresente) não pode? Tem bastante coisa aí que pode ser feita. No ano passado, o Sergio Leo comentou essa notícia da Thomson Reuters dizendo mais ou menos isso.

Vejam o que diz o criador do projeto, Stephen Wolfram, sobre como seria possível cumprir a promessa do Wolfram Alpha:

    Muito do conhecimento acumulado pela humanidade está agora na Web - em bilhões de páginas de texto. E, com os mecanismos de busca, podemos pesquisar com eficiência por termos e expressões específicas naquele texto. Mas não podemos computar a partir disso. E, de fato, só podemos responder perguntas que literalmente já foram respondidas antes. Podemos pesquisar, mas não podemos descobrir nada de novo.

    Então, como lidar com isso? Bem, algumas pessoas pensaram que a forma de avançar seria de alguma forma compreender automaticamente a linguagem natural que existe na Web. Talvez taggear semanticamente a Web pra tornar isso mais fácil. Mas, armado com Mathematica e NKS (meus projetos anteriores), descobri que há outra maneira: explicitamente implementar métodos e modelos, como algorítimos, e fazer uma curação explícita de todos os dados para que sejam imediatamente computáveis.

    Não é fácil fazer isso. Cada tipo diferente de método e modelo - e dado - tem suas próprias características e personalidades. Mas, com uma mistura de automação com Mathematica e NKS, e vários especialistas humanos, fico feliz em dizer que chegamos bastante longe.

    Mas OK. Digamos que tivemos sucesso em criar um sistema que sabe muita coisa e que pode descobrir muita coisa. Como podemos interagir com ele?

    A forma como os humanos normalmente se comunicam é por meio da linguagem natural. E, quando se está lidando com todo o espectro do conhecimento, acho que essa é a única opção realista pra se comunicar com computadores, também.

    Claro, fazer os computadores lidarem com a linguagem natural é algo incrivelmente difícil. E, por exemplo, ainda estamos muito longe de fazer os computadores compreenderem sistematicamente grandes volumes de texto em linguagem natural na Web.

    Mas, se você já tornou o conhecimento computável, não precisa fazer esse tipo de compreensão em linguagem natural.

    Tudo o que você precisa fazer é aceitar as questões que as pessoas fazem em linguagem natural e representá-la de maneira precisa, que caiba nas computações que se possa fazer. É claro, mesmo isso nunca foi feito antes, em generalidade nenhuma. E fica mais difícil com o fato de que não se quer apenas lidar com uma língua como o inglês: o que se quer é usar todo tipo de abreviatura que as pessoas de todos os campos possíveis possam usar.

    Eu não tinha certeza nenhuma de que funcionaria. Mas fico feliz em dizer que, com um mix de vários algorítimos e heurísticas espertos, várias descobertas e curações linguísticas, e o que provavelmente podem ser consideradas várias inovações teóricas, estamos de fato conseguindo fazer funcionar.