Echoes: O GÊNIO DE FISHER E O EXPERIMENTO ALEATÓRIO

A postagem anterior trouxe uma parte do livro Cause and correlation in biology, de Bill Shipley. Julgo que as observações levantadas são extremamente pertinentes dentro da Ecologia. Afinal, o que buscamos são "explicações" (causas) para os fenômenos ecológicos que estudamos. Por exemplo, para modelar as alterações na distribuição da diversidade beta de alguma metacomunidade relacionadas (causadas), por exemplo, ao uso da terra, ou às variações climáticas, um pesquisador deve, necessariamente, encontrar relações causais entre essas variáveis. Porém, a inferência causal em nível de metacomunidades, em geral,deve ser realizada em amplas escalas espaciais, o que limita a utilização de experimentos aleatorizados. O texto de Shipley procura inverter um pouco a lógica inferencial. Ao invés de esperar uma causa pela aplicação aleatória de um tratamento, define-se, a priori, a estrutura causal que se pensa estar atuando no sistema a partir de correlação diretas e indiretas entre as variáveis e, depois, estabelece-se uma ligação com a inferência estatística. Abaixo, mais uma parte do texto de Shipley.

Pelo fato desse livro (Cause and correlation in biology) lidar com inferências causais de dados observacionais, deve-se olhar primeiro mais atentamente em como biólogos inferem causas de dados experimentais. Do que se tratam esses métodos experimentais que permitem aos cientistas falar confortavelmente sobre causas? Do que se trata inferir causalidade de dados não-experimentais que os deixa nervosos? Pode-se distinguir entre dois tipos básicos de experimentos: controlados e aleatórios. Apesar do experimento controlado ter precedente histórico, o experimento aleatório tem precedência na força de suas inferências causais.

Fisher descreveu os princípios do experimento aleatório no seu clássico O desenho de experimentos (Fisher 1926). Desde que ele desenvolveu muitos dos métodos estatísticos no contexto da agronomia, vamos considerar um experimento aleatório típico desenhado para determinar se a adição de um fertilizante nitrogenado pode causar um aumento no rendimento da colheita de uma variedade particular de trigo. Um campo é dividido em 30 parcelas de solo (50 cm x 50 cm) e semeado. A variável tratamento consiste no uso de fertilizante, o qual é aplicado em 0 kg ou 20 kg por hectare. Para cada parcela, colocamos um pequeno pedaço de papel em um chapéu. Metade dos pedaços tem um “0” e a outra metade tem um “20” escrito. Após misturar completamente os pedaços de papel, seleciona-se, aleatoriamente, um para cada parcela para determinar o nível de tratamento que cada parcela irá receber. Após aplicar o nível apropriado de fertilizante independentemente para cada parcela, não se faz qualquer outra manipulação até o dia da colheita, no qual se pesam as sementes que foram colhidas em cada parcela.

O peso de sementes por parcela é distribuído normalmente dentro de cada grupo de tratamento. Aquelas parcelas que receberam “0” fertilizante produziram 55 g de sementes com um erro padrão de 6. As parcelas que receberam 20 kg de fertilizante por hectare produziram 80 g de sementes com um erro padrão de 6. Excluindo-se a possibilidade de que um evento aleatório muito raro tenha ocorrido (com uma probabilidade de aproximadamente 5 x 10^-8), tem-se uma muito boa evidência de uma associação positiva entre adição de fertilizante e o aumento do rendimento da colheita de trigo. Aqui, vemos a primeira vantagem da aleatorização. Pelo fato de aleatorizar a posição do tratamento, gera-se uma distribuição amostral que permite calcular a probabilidade de observar um dado resultado por acaso se, na realidade, não há efeito do tratamento. Isso ajuda a distinguir entre associações por acaso daquelas sistemáticas. Desde que um erro que o pesquisador pode cometer é confundir uma diferença real com uma diferença devido a flutuações da amostragem, a distribuição amostral permite calcular a probabilidade de cometer esse erro. Mas Fisher e muitos outros estatísticos de lá para cá declararam adicionalmente que o processo de aleatorização permite diferenciar entre associações devidas a efeitos causais do tratamento e associações devidas a alguma variável que é uma causa comum tanto do tratamento quanto das variáveis respostas. O que permite ser tão confiante nessa conclusão sobre uma associação (uma “correlação”) entre a adição de fertilizante e o aumento de rendimento da colheita para declarar que a adição de fertilizante realmente causa o aumento da colheita?

Dado que duas variáveis (X e Y) são associadas, só pode haver três explicações causais elementares, mas não mutuamente exclusivas: X causa Y, Y causa X, ou há outras causas que são comuns a X e Y. Aqui, não se faz distinção entre causas diretas e indiretas. Lembrando que a transitividade é uma propriedade das causas, ou seja, X causa Y não exclui a possibilidade que variáveis intervenham na cadeia de causas (X→Z₁→ Z₂→... → Y) entre elas. Pode-se, com total confiança, excluir a possibilidade de que as sementes produzidas causaram a quantidade de fertilizante que foi adicionada. Primeiro, já se sabe a única coisa que pode ter causado a quantidade de fertilizante que foi adicionado para cada parcela: o número que o pesquisador viu escrito no pedaço de papel atribuído a cada parcela. Segundo, o fertilizante foi adicionado antes das plantas começarem a produzir sementes. O que permite excluir a possibilidade de que a associação observada entre a adição de fertilizante e o rendimento foi devida a alguma causa comum aos dois que não foi observada? Esse foi o gênio de Fisher. Os tratamentos foram designados aleatoriamente para as unidades amostrais (i.e., as parcelas com suas plantas associadas). Por definição, tal processo aleatório assegura que a ordem na qual os pedaços de papel são escolhidos (e, portanto, a ordem na qual as parcelas recebem o tratamento) tem uma causa independente de qualquer atributo da parcela, seu solo, ou da planta no momento da aleatorização.

Retomando os passos lógicos. Começou-se pela assertiva de que, se houvesse uma relação causal entre a adição de fertilizante e a colheita, então também haveria uma relação sistemática entre essas duas variáveis nos dados: causa implica correlação. Quando se observa uma relação sistemática que não pode racionalmente ser atribuída a flutuações amostrais, conclui-se que há algum mecanismo que causa essa associação. Correlação não implica necessariamente uma associação causal da adição de fertilizante e o rendimento da colheita, mas implica alguma relação causal que é responsável pela associação. Há apenas três tais relações causais elementares e o processo de aleatorização excluiu duas delas. O que restou foi a extraordinária probabilidade de que a adição de fertilizante causou o aumento de colheita. Não se pode excluir categoricamente as duas outras alternativas causais, pois sempre é possível que se tenha "azar" no experimento. Talvez as alocações aleatórias resultem, por acaso, que aquelas parcelas que receberam 20 kg de fertilizante por hectare tivessem solo com uma alta capacidade de retenção de umidade ou outro atributo que, realente, causasse o aumento da colheita? Em qualquer investigação empírica, experimental ou observacional, só se pode apresentar um argumento que está acima de uma dúvida razoável, não uma certeza lógica.

O papel chave do processo de aleatorização parece ser assegurar, até uma probabilidade que pode ser calculada da distribuição amostral produzida por aleatorização, que nenhuma causa comum sem controle tanto para o tratamento, quanto para a variável resposta poderia produzir uma associação espúria. Fisher foi mais longe quando disse que a aleatorização “alivia o experimentador da ansiedade de considerar e estimar a magnitude das inúmeras causas pelas quais os dados podem ser perturbados”. Isso é estritamente verdadeiro? Considere-se novamente a possibilidade de que a umidade do solo afeta a colheita. Por designar aleatoriamente o fertilizante às parcelas pode-se assegurar, em média, que as parcelas de tratamento e controle têm solos com os mesmos conteúdos de umidade, portanto removendo qualquer correlação por acaso entre o tratamento recebido pela parcela e seu conteúdo de umidade. Mas o número de atributos das unidades experimentais (i.e. as parcelas com seus solos e plantas) é limitado somente pela nossa imaginação. Vamos imaginar que haja 20 atributos diferentes das unidades experimentais que poderiam causar a diferença na colheita. Qual a probabilidade de que, pelo menos uma dessas, fosse suficientemente concentrada, por acaso, nas parcelas do tratamento para produzir uma diferença significativa nas colheitas mesmo se o fertilizante não tenha efeito causal? Se essa probabilidade não parece ser muito grande, pode-se facilmente listar 50 ou 100 atributos que poderiam causar a diferença nas colheitas. Desde que há um grande número de causas potenciais, então a probabilidade de que pelo menos uma delas fosse concentrada, por acaso, nas parcelas de tratamento não é negligenciável, mesmo se tivessem sido usadas muito mais do que 30 parcelas.

A aleatorização serve, então, para dois propósitos na inferência causal. Primeiro, ela assegura que não há efeito causal vindo das unidades experimentais para a variável tratamento ou de uma causa comum a ambas. Segundo, ela ajuda a reduzir a probabilidade na amostra de uma correlação por acaso entre a variável tratamento e alguma outra causa do tratamento, mas não remove isso completamente. Citando Howson e Urbach (1989):

Qualquer que seja o tamanho da amostra, dois grupos de tratamentos diferirão com absoluta certeza em algum respeito, certamente, em infinitos aspectos, qualquer um dos quais deve, de forma desconhecida para nós, estar causalmente implicado no resultado da tentativa. Então a aleatorização não pode garantir que os grupos sejam livres de viés por fatores de ruídos desconhecidos (i.e. variáveis correlacionadas com o tratamento). E, desde que não se podem saber quais desses fatores desconhecidos estão atuando, não se está em posição de calcular a probabilidade do desenvolvimento desse viés também.

Isso não deve ser interpretado como uma fraqueza severa do experimento de aleatorização em qualquer sentido prático, mas enfatiza que mesmo experimentos aleatórios não proveem qualquer segurança automática de inferência causal, livre de pressupostos subjetivos.

Igualmente importante é o que não é requerido pelo experimento aleatório. A lógica de experimentação até o tempo de Fisher era a do experimento controlado, no qual era crucial que todas outras variáveis fossem experimentalmente fixadas em valores constantes. R. A. Fisher (1970) explicitamente rejeitou esse como um método inferior, destacando que é logicamente impossível saber se “todas as outras variáveis” foram englobadas. Isso não significa que Fisher não advogava controlar fisicamente outras causas em adição à aleatorização. De fato, ele recomendou explicitamente que o pesquisador fizesse isso sempre que possível. Por exemplo, na discussão da comparação entre colheitas de diferentes variedades, ele sugeriu que elas fossem plantadas em solo que “parecesse uniforme”. No contexto de experimentos em potes, ele recomendou que o solo fosse totalmente misturado antes de colocá-lo nos potes, que a água fosse equalizada, que eles recebessem a mesma quantidade de luz, etc. A força do experimento aleatório está no fato de que não temos controle físico – ou até nem somos conscientes de – outras variáveis causalmente relevantes de modo a reduzir (mas não excluir logicamente) a possibilidade de que a associação observada é devida a alguma causa comum não medida na amostra.

Mesmo assim, força não é a mesma coisa que onipotência. Pode-se perceber que a lógica do experimento aleatório tem, escondida, uma fraqueza ainda não discutida que restringe severamente sua utilidade para os biólogos; uma fraqueza que não é removida mesmo com um tamanho amostral infinito. Para funcionar deve-se ser capaz de designar aleatoriamente valores da causa hipotética para as unidades experimentais independentemente de quaisquer atributos dessas unidades. Essa designação deve ser direta e não mediada por outros atributos das unidades experimentais. Ainda assim, uma grande proporção de estudos biológicos envolve relações entre atributos diferentes dessas unidades experimentais.

No experimento descrito acima, as unidades experimentais são as parcelas de solo com suas plantas de trigo. Os atributos dessas unidades incluem aqueles do solo, do meio ambiente do entorno e das plantas. Imagine que um pesquisador queira testar o seguinte cenário causal: o fertilizante adicionado aumenta a quantidade de nitrogênio absorvido pela planta. Isso aumenta a quantidade de enzimas fotossintéticas que utilizam o nitrogênio nas folhas e, portanto, a taxa fotossintética líquida. A fixação maior de carbono devido à fotossíntese causa o aumento da colheita (Figura 1.1).

Figura 1.1 – Um cenário hipotético causal que não é passível para um experimento aleatório.

A primeira parte desse cenário é perfeitamente abordada pelo experimento aleatório, pois a absorção de nitrogênio é um atributo da planta (a unidade experimental), enquanto a quantidade de fertilizante adicionada é controlada completamente pelo pesquisador independentemente de qualquer atributo da parcela ou das plantas. O resto da hipótese é proibitivo para o experimento aleatório. Por exemplo, tanto a taxa de absorção de nitrogênio e a concentração de enzimas fotossintéticas são atributos da planta (a unidade experimental). É impossível designar aleatoriamente os níveis de absorção de nitrogênio para cada planta independentemente de qualquer um dos seus outros atributos. Mesmo assim, esse é o passo crucial no experimento aleatório que permite distinguir correlação de causa. É verdade que o pesquisador pode induzir uma mudança tanto na taxa de absorção de nitrogênio pela planta, quanto na concentração de enzimas fotossintéticas nas suas folhas, mas em qualquer caso, essas mudanças são devidas à adição do fertilizante. Após observar uma associação entre o aumento da absorção de nitrogênio e concentração de enzimas a aleatorização na adição de fertilizante não exclui diferentes cenários causais, apenas alguns dos quais são mostrados na Figura 1.2.

Figura 1.2 – Três cenários causais diferentes que poderiam gerar uma associação entre o aumento da absorção de nitrogênio e o aumento da concentração de enzimas na planta após a adição de fertilizante em um experimento aleatório.

Quando se lê livros sobre desenho experimental, os olhos geralmente passam pelas palavras “unidade experimental” sem parar para considerar o que essas palavras significam. A unidade experimental é a “coisa” na qual os níveis de tratamentos serão designados aleatoriamente. A unidade experimental também é uma unidade experimental. As relações causais, se existem, são entre a variável tratamento externa e cada um dos atributos da unidade experimental que mostram uma resposta. Em biologia, as unidades experimentais (por exemplo plantas, folhas ou células) são todos integrados, os quais não podem ser desmembrados sem afetar as outras partes. Não é geralmente possível designar aleatoriamente valores de um atributo de uma unidade experimental independente do comportamento de seus outros atributos. Quando essas designações aleatórias não podem ser feitas, então não se pode inferir causa de um experimento aleatório. Um momento de reflexão mostrará que esse problema é muito comum em biologia. Biologia do organismo, celular e molecular estão cheios dele. Fisiologia é um emaranhado sem esperança. Evolução e ecologia, dependentes que são da fisiologia e morfologia, estão geralmente além de seu alcance. Se aceita-se que não se podem estudar relações causais sem experimentos aleatórios, então uma proporção grande de pesquisa biológica terá perdido qualquer conteúdo causal demonstrável.

A utilidade do experimento aleatório também é severamente reduzida por restrições práticas. Deve-se lembrar de que a inferência é da alocação aleatória do tratamento para as unidades experimentais. A unidade experimental deve ser aquela que seja relevante para a hipótese científica de interesse. Se a hipótese se refere a unidades de grandes proporções espaciais (populações, ecossistemas, paisagens), então a unidade experimental deve consistir nessas unidades. Alguém querendo saber se o aumento nas concentrações de dióxido de carbono irá alterar a estrutura da comunidade de florestas terá que usar florestas inteiras como unidades experimentais. Tais experimentos nunca são feitos e não há nada na lógica inferencial dos experimentos aleatórios que permita a alguém aumentar a escala a partir de unidades experimentais diferentes em pequena escala. Até mesmo quando uma aleatorização apropriada pode ser feita em princípio, elas não podem ser feitas na prática, devido a restrições financeiras ou éticas.

O biólogo que deseja estudar relações causais usando experimentos aleatórios é, portanto, severamente limitado nas questões que podem ser feitas. Os cientistas com inclinações filosóficas que insistem que uma resposta positiva de um experimento aleatório é uma definição operacional de uma relação causal teriam que concluir que a causalidade é irrelevante para a maior parte da ciência.

terça-feira, 31 de dezembro de 2013

O GÊNIO DE FISHER E O EXPERIMENTO ALEATÓRIO

2 comentários:

Seguidores

Total de visualizações de página