A postagem anterior trouxe uma parte do livro Cause and correlation in biology, de Bill Shipley. Julgo que as observações levantadas são extremamente pertinentes dentro da Ecologia. Afinal, o que buscamos são "explicações" (causas) para os fenômenos ecológicos que estudamos. Por exemplo, para modelar as alterações na distribuição da diversidade beta de alguma metacomunidade relacionadas (causadas), por exemplo, ao uso da terra, ou às variações climáticas, um pesquisador deve, necessariamente, encontrar relações causais entre essas variáveis. Porém, a inferência causal em nível de metacomunidades, em geral,deve ser realizada em amplas escalas espaciais, o que limita a utilização de experimentos aleatorizados. O texto de Shipley procura inverter um pouco a lógica inferencial. Ao invés de esperar uma causa pela aplicação aleatória de um tratamento, define-se, a priori, a estrutura causal que se pensa estar atuando no sistema a partir de correlação diretas e indiretas entre as variáveis e, depois, estabelece-se uma ligação com a inferência estatística. Abaixo, mais uma parte do texto de Shipley.
Pelo
fato desse livro (Cause and correlation in biology) lidar com inferências causais de dados observacionais, deve-se
olhar primeiro mais atentamente em como biólogos inferem causas de dados
experimentais. Do que se tratam esses métodos experimentais que permitem aos
cientistas falar confortavelmente sobre causas? Do que se trata inferir
causalidade de dados não-experimentais que os deixa nervosos? Pode-se
distinguir entre dois tipos básicos de experimentos: controlados e aleatórios. Apesar
do experimento controlado ter precedente histórico, o experimento aleatório tem
precedência na força de suas inferências causais.
Fisher
descreveu os princípios do experimento aleatório no seu clássico O desenho de experimentos (Fisher 1926).
Desde que ele desenvolveu muitos dos métodos estatísticos no contexto da
agronomia, vamos considerar um experimento aleatório típico desenhado para
determinar se a adição de um fertilizante nitrogenado pode causar um aumento no rendimento da colheita de uma variedade particular de trigo. Um campo é dividido em 30
parcelas de solo (50 cm x 50 cm) e semeado. A variável tratamento consiste no
uso de fertilizante, o qual é aplicado em 0 kg ou 20 kg por hectare. Para cada parcela,
colocamos um pequeno pedaço de papel em um chapéu. Metade dos pedaços tem um
“0” e a outra metade tem um “20” escrito. Após misturar completamente os
pedaços de papel, seleciona-se, aleatoriamente, um para cada parcela para
determinar o nível de tratamento que cada parcela irá receber. Após aplicar o
nível apropriado de fertilizante independentemente para cada parcela, não se
faz qualquer outra manipulação até o dia da colheita, no qual se pesam as
sementes que foram colhidas em cada parcela.
O
peso de sementes por parcela é distribuído normalmente dentro de cada grupo de
tratamento. Aquelas parcelas que receberam “0” fertilizante produziram 55 g de
sementes com um erro padrão de 6. As parcelas que receberam 20 kg de
fertilizante por hectare produziram 80 g de sementes com um erro padrão de 6. Excluindo-se
a possibilidade de que um evento aleatório muito raro tenha ocorrido (com uma
probabilidade de aproximadamente 5 x 10-8), tem-se uma muito boa
evidência de uma associação positiva entre adição de fertilizante e o aumento
do rendimento da colheita de trigo. Aqui, vemos a primeira vantagem da aleatorização.
Pelo fato de aleatorizar a posição do tratamento, gera-se uma distribuição amostral que permite calcular a probabilidade de observar um dado resultado por
acaso se, na realidade, não há efeito do tratamento. Isso ajuda a distinguir
entre associações por acaso daquelas sistemáticas. Desde que um erro que o
pesquisador pode cometer é confundir uma diferença real com uma diferença
devido a flutuações da amostragem, a distribuição amostral permite calcular
a probabilidade de cometer esse erro. Mas Fisher e muitos outros estatísticos
de lá para cá declararam adicionalmente que o processo de aleatorização permite
diferenciar entre associações devidas a efeitos causais do tratamento e
associações devidas a alguma variável que é uma causa comum tanto do tratamento
quanto das variáveis respostas. O que permite ser tão confiante nessa conclusão
sobre uma associação (uma
“correlação”) entre a adição de fertilizante e o aumento de rendimento da colheita para
declarar que a adição de fertilizante realmente causa o aumento da colheita?
Dado
que duas variáveis (X e Y) são associadas, só pode haver três explicações
causais elementares, mas não mutuamente exclusivas: X causa Y, Y causa X, ou há
outras causas que são comuns a X e Y. Aqui, não se faz distinção entre causas
diretas e indiretas. Lembrando que a transitividade é uma propriedade das
causas, ou seja, X causa Y não exclui a possibilidade que variáveis intervenham
na cadeia de causas (X→Z1→ Z2→... → Y) entre elas.
Pode-se, com total confiança, excluir a possibilidade de que as sementes produzidas
causaram a quantidade de fertilizante que foi adicionada. Primeiro, já se sabe a única coisa que pode ter
causado a quantidade de fertilizante que foi adicionado para cada parcela: o
número que o pesquisador viu escrito no pedaço de papel atribuído a cada
parcela. Segundo, o fertilizante foi adicionado antes das plantas começarem a
produzir sementes. O que permite excluir a possibilidade de que a associação
observada entre a adição de fertilizante e o rendimento foi devida a alguma causa
comum aos dois que não foi observada? Esse foi o gênio de Fisher. Os
tratamentos foram designados aleatoriamente para as unidades amostrais (i.e.,
as parcelas com suas plantas associadas). Por definição, tal processo aleatório
assegura que a ordem na qual os pedaços de papel são escolhidos (e, portanto, a
ordem na qual as parcelas recebem o tratamento) tem uma causa independente de
qualquer atributo da parcela, seu solo, ou da planta no momento da
aleatorização.
Retomando
os passos lógicos. Começou-se pela assertiva de que, se houvesse uma relação
causal entre a adição de fertilizante e a colheita, então também haveria uma
relação sistemática entre essas duas variáveis nos dados: causa implica correlação. Quando se observa uma relação
sistemática que não pode racionalmente ser atribuída a flutuações amostrais,
conclui-se que há algum mecanismo que causa essa associação. Correlação não
implica necessariamente uma associação causal da adição de fertilizante e o rendimento da
colheita, mas implica alguma relação
causal que é responsável pela associação. Há apenas três tais relações causais
elementares e o processo de aleatorização excluiu duas delas. O que restou foi
a extraordinária probabilidade de que a adição de fertilizante causou o aumento
de colheita. Não se pode excluir categoricamente as duas outras alternativas
causais, pois sempre é possível que se tenha "azar" no experimento. Talvez as
alocações aleatórias resultem, por acaso, que aquelas parcelas que receberam 20
kg de fertilizante por hectare tivessem solo com uma alta capacidade de retenção
de umidade ou outro atributo que, realente, causasse o aumento da colheita? Em
qualquer investigação empírica, experimental ou observacional, só se pode
apresentar um argumento que está acima de uma dúvida razoável, não uma certeza
lógica.
O
papel chave do processo de aleatorização parece ser assegurar, até uma
probabilidade que pode ser calculada da distribuição amostral produzida por
aleatorização, que nenhuma causa comum sem controle tanto para o tratamento,
quanto para a variável resposta poderia produzir uma associação espúria. Fisher
foi mais longe quando disse que a aleatorização “alivia o experimentador da
ansiedade de considerar e estimar a magnitude das inúmeras causas pelas quais
os dados podem ser perturbados”. Isso é estritamente verdadeiro? Considere-se
novamente a possibilidade de que a umidade do solo afeta a colheita. Por
designar aleatoriamente o fertilizante às parcelas pode-se assegurar, em média, que as parcelas de tratamento
e controle têm solos com os mesmos conteúdos de umidade, portanto removendo
qualquer correlação por acaso entre o tratamento recebido pela parcela e seu
conteúdo de umidade. Mas o número de atributos das unidades experimentais (i.e.
as parcelas com seus solos e plantas) é limitado somente pela nossa imaginação.
Vamos imaginar que haja 20 atributos diferentes das unidades experimentais que
poderiam causar a diferença na colheita. Qual a probabilidade de que, pelo
menos uma dessas, fosse suficientemente concentrada, por acaso, nas parcelas do
tratamento para produzir uma diferença significativa nas colheitas mesmo se o
fertilizante não tenha efeito causal? Se essa probabilidade não parece ser
muito grande, pode-se facilmente listar 50 ou 100 atributos que poderiam causar
a diferença nas colheitas. Desde que há um grande número de causas potenciais,
então a probabilidade de que pelo menos uma delas fosse concentrada, por acaso,
nas parcelas de tratamento não é negligenciável, mesmo se tivessem sido usadas muito mais do que 30 parcelas.
A
aleatorização serve, então, para dois propósitos na inferência causal.
Primeiro, ela assegura que não há efeito causal vindo das unidades
experimentais para a variável tratamento ou de uma causa comum a ambas.
Segundo, ela ajuda a reduzir a probabilidade na amostra de uma correlação por
acaso entre a variável tratamento e alguma outra causa do tratamento, mas não
remove isso completamente. Citando Howson e Urbach (1989):
Qualquer que
seja o tamanho da amostra, dois grupos de tratamentos diferirão com absoluta certeza em algum respeito,
certamente, em infinitos aspectos, qualquer um dos quais deve, de forma
desconhecida para nós, estar causalmente implicado no resultado da tentativa.
Então a aleatorização não pode garantir que os grupos sejam livres de viés por
fatores de ruídos desconhecidos (i.e. variáveis correlacionadas com o
tratamento). E, desde que não se podem saber quais desses fatores desconhecidos
estão atuando, não se está em posição de calcular a probabilidade do
desenvolvimento desse viés também.
Isso não deve ser interpretado
como uma fraqueza severa do experimento de aleatorização em qualquer sentido
prático, mas enfatiza que mesmo experimentos aleatórios não proveem qualquer
segurança automática de inferência causal, livre de pressupostos subjetivos.
Igualmente
importante é o que não é requerido pelo experimento aleatório. A lógica de
experimentação até o tempo de Fisher era a do experimento controlado, no qual
era crucial que todas outras variáveis fossem experimentalmente fixadas em
valores constantes. R. A. Fisher (1970) explicitamente rejeitou esse como um
método inferior, destacando que é logicamente impossível saber se “todas as
outras variáveis” foram englobadas. Isso não significa que Fisher não advogava
controlar fisicamente outras causas em adição à aleatorização. De fato, ele
recomendou explicitamente que o pesquisador fizesse isso sempre que possível. Por
exemplo, na discussão da comparação entre colheitas de diferentes variedades,
ele sugeriu que elas fossem plantadas em solo que “parecesse uniforme”. No
contexto de experimentos em potes, ele recomendou que o solo fosse totalmente
misturado antes de colocá-lo nos potes, que a água fosse equalizada, que eles recebessem
a mesma quantidade de luz, etc. A força do experimento aleatório está no fato
de que não temos controle físico – ou até nem somos conscientes de – outras
variáveis causalmente relevantes de modo a reduzir (mas não excluir
logicamente) a possibilidade de que a associação observada é devida a alguma
causa comum não medida na amostra.
Mesmo
assim, força não é a mesma coisa que onipotência. Pode-se perceber que a lógica
do experimento aleatório tem, escondida, uma fraqueza ainda não discutida que
restringe severamente sua utilidade para os biólogos; uma fraqueza que não é
removida mesmo com um tamanho amostral infinito. Para funcionar deve-se ser
capaz de designar aleatoriamente valores da causa hipotética para as unidades
experimentais independentemente de quaisquer atributos dessas unidades. Essa
designação deve ser direta e não mediada por outros atributos das unidades
experimentais. Ainda assim, uma grande proporção de estudos biológicos envolve
relações entre atributos diferentes dessas unidades experimentais.
No
experimento descrito acima, as unidades experimentais são as parcelas de solo
com suas plantas de trigo. Os atributos dessas unidades incluem aqueles do
solo, do meio ambiente do entorno e das plantas. Imagine que um pesquisador
queira testar o seguinte cenário causal: o fertilizante adicionado aumenta a
quantidade de nitrogênio absorvido pela planta. Isso aumenta a quantidade de
enzimas fotossintéticas que utilizam o nitrogênio nas folhas e, portanto, a
taxa fotossintética líquida. A fixação maior de carbono devido à fotossíntese
causa o aumento da colheita (Figura 1.1).
Figura 1.1 – Um cenário
hipotético causal que não é passível para um experimento aleatório.
A
primeira parte desse cenário é perfeitamente abordada pelo experimento aleatório,
pois a absorção de nitrogênio é um atributo da planta (a unidade experimental),
enquanto a quantidade de fertilizante adicionada é controlada completamente
pelo pesquisador independentemente de qualquer atributo da parcela ou das
plantas. O resto da hipótese é proibitivo para o experimento aleatório. Por
exemplo, tanto a taxa de absorção de nitrogênio e a concentração de enzimas
fotossintéticas são atributos da planta (a unidade experimental). É impossível
designar aleatoriamente os níveis de absorção de nitrogênio para cada planta
independentemente de qualquer um dos seus outros atributos. Mesmo assim, esse é
o passo crucial no experimento aleatório que permite distinguir correlação de
causa. É verdade que o pesquisador pode induzir uma mudança tanto na taxa de absorção de nitrogênio pela planta, quanto
na concentração de enzimas fotossintéticas nas suas folhas, mas em qualquer
caso, essas mudanças são devidas à adição do fertilizante. Após observar uma
associação entre o aumento da absorção de nitrogênio e concentração de enzimas
a aleatorização na adição de fertilizante não exclui diferentes cenários
causais, apenas alguns dos quais são mostrados na Figura 1.2.
Figura 1.2 – Três cenários
causais diferentes que poderiam gerar uma associação entre o aumento da
absorção de nitrogênio e o aumento da concentração de enzimas na planta após a
adição de fertilizante em um experimento aleatório.
Quando
se lê livros sobre desenho experimental, os olhos geralmente passam pelas
palavras “unidade experimental” sem parar para considerar o que essas palavras
significam. A unidade experimental é a “coisa” na qual os níveis de tratamentos
serão designados aleatoriamente. A unidade experimental também é uma unidade experimental. As relações
causais, se existem, são entre a variável tratamento externa e cada um dos
atributos da unidade experimental que mostram uma resposta. Em biologia, as
unidades experimentais (por exemplo plantas, folhas ou células) são todos
integrados, os quais não podem ser desmembrados sem afetar as outras partes. Não
é geralmente possível designar aleatoriamente valores de um atributo de uma
unidade experimental independente do comportamento de seus outros atributos. Quando essas designações aleatórias não podem ser feitas, então
não se pode inferir causa de um experimento aleatório. Um momento de reflexão
mostrará que esse problema é muito comum em biologia. Biologia do organismo,
celular e molecular estão cheios dele. Fisiologia é um emaranhado sem
esperança. Evolução e ecologia, dependentes que são da fisiologia e morfologia,
estão geralmente além de seu alcance. Se aceita-se que não se podem estudar
relações causais sem experimentos aleatórios, então uma proporção grande de
pesquisa biológica terá perdido qualquer conteúdo causal demonstrável.
A
utilidade do experimento aleatório também é severamente reduzida por restrições
práticas. Deve-se lembrar de que a inferência é da alocação aleatória do
tratamento para as unidades experimentais. A unidade experimental deve ser aquela
que seja relevante para a hipótese científica de interesse. Se a hipótese se
refere a unidades de grandes proporções espaciais (populações, ecossistemas,
paisagens), então a unidade experimental deve consistir nessas unidades. Alguém
querendo saber se o aumento nas concentrações de dióxido de carbono irá alterar
a estrutura da comunidade de florestas terá que usar florestas inteiras como
unidades experimentais. Tais experimentos nunca são feitos e não há nada na
lógica inferencial dos experimentos aleatórios que permita a alguém aumentar a
escala a partir de unidades experimentais diferentes em pequena escala. Até
mesmo quando uma aleatorização apropriada pode ser feita em princípio, elas não
podem ser feitas na prática, devido a restrições financeiras ou éticas.
O
biólogo que deseja estudar relações causais usando experimentos aleatórios é,
portanto, severamente limitado nas questões que podem ser feitas. Os cientistas
com inclinações filosóficas que insistem que uma resposta positiva de um
experimento aleatório é uma definição operacional
de uma relação causal teriam que concluir que a causalidade é irrelevante para
a maior parte da ciência.