quinta-feira, 16 de setembro de 2010

Estatística no Tribunal

Continuando na nossa série forense, li há alguns dias no (excelente) blog de estatística bayesiana do Christian Robert (http://xianblog.wordpress.com/ - às vezes técnico demais, mas pra quem gosta de "aventura" recomendo fortemente, hehe) um post sobre o papel da estatística no julgamento da enfermeira holandesa Lucia de Berk.


O caso, resumidamente, é o seguinte:

Após a morte de um bebê no Hospital da Criança Juliana, em Haia, outras nove mortes ou incidentes graves foram verificados no hospital, que também notou que a enfermeira Lucia estava sempre em seu turno de trabalho quando houve incidentes. Ela foi então considerada suspeita, e o caso teve ampla repercussão e causou enorme comoção no país - lembrem que estamos falando de um hospital infantil.

Em seu primeiro julgamento, em março de 2003, ela foi acusada de quatro homicídios e três tentativas de homicídio, e condenada à prisão perpétua. Lucia sempre negou os crimes. Um dos argumentos mais fortes da acusação consistiu em um modelo estatístico apresentado por um psicólogo forense que considerou que a probabilidade de que uma enfermeira estivesse, ao acaso, envolvida em tantos incidentes seria de apenas 1:342.000.000 (sim, não digitei errado. Um em trezentos e quarenta e dois milhões), que, de fato, é absurdamente pequena. Um analista forense, comentando o caso para a imprensa, afirma que seria impossível condenar a acusada sem a “prova estatística”.

Mas calma aí que fica pior.

Na apelação (Julho, 2004), Lucia foi acusada por novos casos ocorridos nos outros hospitais nos quais trabalhava (sendo dois por envenenamento), e condenada a prisão perpétua com tratamento psicológico forçado (embora os peritos em psicologia não tenham visto nada de anormal nela...), sentença que em março de 2006 foi novamente mudada para prisão perpétua "simples". Devido a problemas com a análise estatística do caso original (relatado acima), apontados por alguns especialistas, o tribunal retira a análise estatística do processo (lembram do nosso analista?). Ainda assim o novo veredito usa termos como “muito improvável”. Claramente, o raciocínio do juiz está baseado em estatística.

Bem, em outubro de 2008 o caso foi reaberto, em parte devido a um abaixo assinado, enviado à suprema corte, que continha a assinatura de vários cientistas. Alguns estatísticos, entre eles Richard Gill, Piet Groneboom, e Peter de Jong, tentam desenvolver um modelo estatístico alternativo, mais realista, para o caso de Lucia. Esse novo modelo, descrito num artigo espantosamente didático e inteligível para não-iniciados como eu, levava em consideração a heterogeneidade de “chances” entre enfermeiras (ou seja, o raciocínio de que há variação individual entre enfermeiras para o "risco" de incidentes graves), e um modelo de Poisson clássico para a probabilidade dos incidentes. Estão sentadinhos? Sério. É bem recomendável.

Lembram, né? 1:342.000.000 foi o cálculo original. Bom, o trabalho dos autores mencionados acima chega a uma chance de 1:7. Cara, 1:7!!!! É só um pouquinho pior do que tirar um "seis" atirando um dado!!! No pior caso para Lucia (dependendo de quais incidentes eram considerados) essa chance cai pra 1:26. Menor que o 1:7, mas cerca de 13 MILHÕES de vezes maior do que aquela probabilidade ridiculamente pequena sugerida no primeiro julgamento.

Vai dizer, chato ser condenado à prisão perpétua por uma chance de cerca de 4%, né? Os autores ainda fazem questão de ressaltar que tudo isso, claro, depende da qualidade dos dados, e isso é um outro ponto crítico. Dependendo de como uma investigação é conduzida, os dados coletados podem sofrer um grande viés de relato. Nesse caso, o impacto do viés de relato pode ser facilmente entendido da seguinte forma; os policiais foram aos hospitais nos quais Lucia trabalhava em busca de outros incidentes durante os turnos de Lucia. O mesmo esforço não foi usado para buscar incidentes nos turnos nos quais Lucia não trabalhava. Naturalmente, a investigação acabará representando em excesso qualquer tipo de evento ocorrido quando Lucia estava no hospital. Esse tipo de viés é muito conhecido também na pesquisa médica, onde eventos positivos tendem a ser reportados (e lembrados) com maior freqüência.

Após a reabertura do caso as acusações foram retiradas, e Lucia foi libertada em Março de 2010. Além da questão estatística, um novo exame químico foi feito que descartava a hipótese de envenenamento naqueles dois casos adicionais citados anteriormente. A questão da estatística aqui é importante porque não há dúvida de que argumentos estatísticos são sim importantes em casos forenses. Afinal, é complicado entender o mundo de uma forma independente de estatística (ou estou exagerando?). Toda a questão de reconhecimento de paternidade (viram o recente veto presidencial à obrigatoriedade de fazer teste de DNA?), por exemplo, se baseia em estatística. Por outro lado, é claro que a argumentação estatística pode estar mal aplicada em um tribunal. Aliás, QUALQUER ciência forense pode, em um determinado caso, representar má ciência.

Se a Ciência não nos dá certezas (por definição), as partes devem se perguntar “há diferentes interpretações para esses fatos?”. Aliás, os juízes devem se perguntar isso, ou ainda mais especificamente, os juízes têm que estar cientes das limitações tanto dos métodos quanto do próprio conhecimento científico. Na ciência publicada, a controvérsia é saudável, rende papers, joga a ciência prá frente. Porém, quando a vida de uma pessoa (do réu) está em jogo, as coisas se tornam mais sérias.

Bom, e aí? Lucia é inocente?

Eu não sei, e na verdade, só ela sabe. E com esse tipo de incerteza também temos que aprender a lidar: a tal Verdade assim com “V” maiúsculo, não pode ser revelada nem pela ciência nem por um tribunal... Justiça com incerteza... Viver com a incerteza... eis a questão.

sábado, 11 de setembro de 2010

De volta (e pra cadeia!)

Bem... Devido a alguma preguiça, a algumas aulas, e a uma virose absolutamente cretina, estamos de volta com o Bio-Blogando, e sim, a idéia é deixar um texto semanal em média por aqui. A ver.


Como uma espécie de exposição pública da minha vergonha pelo período de inatividade, resolvi comentar uma matéria da Science de 16 de Julho (http://www.sciencemag.org/cgi/content/summary/329/5989/262) - meio velhinha pra uma notícia, portanto, mas vamos lá.



O texto trata da captura, no dia 7 de Julho, de um serial killer californiano responsável por pelo menos 10 assassinatos na metade dos anos 80. A história da captura, resumidamente é a seguinte: na Califórnia foi permitido que se criasse, para auxiliar em investigações policiais, um banco de DNA (na verdade um bando com o perfil genético desses indivíduos para marcadores genéticos semelhantes aos usados para paternidade) de indivíduos condenados por qualquer crime. O banco conta atualmente com 1,3 milhão de entradas. O material genético coletado na cena dos crimes na década de 80 foi genotipado e uma busca contra esse banco feita em 2008 retornou vazia. A busca, é importante dizer, é feita de modo a relatar um ranking de suspeitos baseados em similaridade genética, o que significa dizer que o banco não se concentra apenas em matches (identificações) perfeitas, ampliando em princípio o poder do método.

Em 2010, uma nova busca foi realizada, resultando agora em um indivíduo: Christopher Franklin, um jovem negro condenado por porte de arma. Devido ao grau de similaridade entre o perfil genético de Christopher e o do assassino, e também à data dos crimes, as suspeitas da polícia recaíram então sobre o pai de Christopher, Loonie Franklin Jr, agora com 57 anos. Com autorização judicial, a polícia coletou um pedaço de pizza jogado no lixo (parece CSI, né?), extraiu DNA, fez os testes, e BINGO! O perfil genético de Loonie e do assassino eram idênticos, levando rapidamente à prisão de Loonie.

É complicado ler uma história dessas e não ficar orgulhoso do bom uso da ciência e, mais especificamente, da genética, como ferramenta na resolução desse tipo de problema. Ninguém acharia justo que o Sr Loonie permanecesse em liberdade, certo? Pois é, mas segundo algumas pessoas, pode sim haver alguns problemas. Vamos a eles, porque pensar na complexidade do mundo é algo muito divertido.

1. Notem que o software aponta por similaridade e embora os chefes do laboratório afirmem o programa é incapaz de sugerir um suspeito com 25% (equivalente a tio/sobrinho, meios-irmãos, ou avô/neto, por exemplo) ou menos de compartilhamento, é impossível estar 100% seguro que o programa não possa, eventualmente, sugerir um suspeito totalmente não-relacionado com o culpado. Nesse caso, as chances estão contra os negros e latinos, maioria da população carcerária que compôs a amostra.

2. Como conseqüência do nosso 1º ponto, qualquer pessoa pode tornar-se suspeita de ter cometido um crime simplesmente por ter algum parentesco com alguém já condenado por outro crime. Seu tio que você nunca viu foi condenado por algo? Você é um suspeito em potencial para todo e qualquer crime a ser investigado com o método acima.

3. Existe também a questão do direito ao acesso à informação genética individual. Ainda que possamos assumir que no caso dos condenados a justiça entendeu que eles perderam o direito a manterem em privado parte das informações do seu DNA, isso acaba, devido ao parentesco, se estendendo a toda a família do condenado. O recado é que se você tem parentes condenados, você tem menos direito de manter seu DNA em segredo.

Eu vejo ainda possibilidade para uma 4ª questão. Tradicionalmente, nosso sistema de justiça considera que depois de cumprida a pena, quita-se a dívida do sujeito com a sociedade (não estou nem dizendo que concordo, apenas que a lógica é essa). Bom, se as informações do indivíduo não são apagadas do banco de dados após cumprida a pena, é claro que algo não está funcionando nessa lógica...

Por outro lado, o Estado coleta medidas biométricas de todos nós (impressões digitais no mínimo). Ok, essas não são herdáveis, e são únicas mesmo para gêmeos idênticos... Por outro lado, o que vimos acima é essencialmente diferente de uma investigação mais tradicional que também pode chegar aos suspeitos errados pelos mais diferentes motivos? Ou será que só é tecnologicamente diferente? E será que quando é tecnologicamente diferente as pessoas tendem a achar que é mais eficiente? Eu acho tudo isso muito complicado... E vocês?