quinta-feira, 12 de maio de 2011

Analisando diversidade

Olá, vou transcrever um texto muito interessante sobre análise de diversidade. O autor é Lou Jost e foi baixado de sua página na internet (http://www.loujost.com/Statistics%20and%20Physics/Diversity%20and%20Similarity/SampleChapter.pdf). A versão para o português é minha. Essa é a primeira parte.

Ficheiro:Fungi of Saskatchewan.JPG
Hoje em dia, na Ecologia, há um campo confuso e embaralhado denominado análise de diversidade, mas o campo não é realmente confuso. Nós o tornamos assim pela confusão de vários aspectos complexos e pelo intercâmbio desses aspectos sob uma única palavra, "diversidade". Todos esses aspectos são claramente relacionados à diversidade, mas qual deles, se algum, bate com nosso conceito intuitivo de "diversidade"? Se não formos cuidadosos em manter esses diferentes aspectos da complexidade da composição separados e, se os usarmos de forma intercambiável em fórmulas gerais requerendo diversidade, estaremos fadados a acabar com resultados estranhos.

Por exemplo, o índice de Gini-Simpson 1-Σ pi^2 é normalmente recomendado como um índice de diversidade (Magurran 2004, Lande 1996) e igualado à "diversidade". Ele mede a probabilidade de que dois  indivíduos amostrados pertençam a espécies diferentes, mas esse aspecto da complexidade composicional não parece coincidir com um conceito biológico lógico de diversidade. Imagine uma comunidade com um milhão de espécies igualmente comuns. Seu índice de Gini-Simpson é 0,999999. Uma praga ataca essa comunidade e elimina 99,99% das espécies, deixando apenas 100 espécies. Ecólogos e conservacionistas considerariam isso uma enorme diminuição na diversidade, tanto em termos da variedade de interações experimentada por um organismo antes e depois da praga, quanto em termos do valor de conservação das comunidades pré- e pós-praga. As ferramentas de análise de diversidade deveriam ser capazes de indicar a magnitude dessa diminuição para serem úteis em situações menos dramáticas. Mesmo assim, o índice de Gini-Simpson da comunidade pós-praga é 0,99, somente 1% menos do que o mesmo índice da comunidade pré-praga. Um ecólogo que igualasse esse índice com "diversidade" concluiria que a praga, que matou quase todas as espécies, não teve um grande efeito na diversidade da comunidade.

Muitos outros índices de diversidade utilizados usualmente também são pobres quando os comparamos à definição biológica de diversidade.

Alguns biólogos não estão preocupados que esses índices forneçam resultados difíceis de interpretação. Esses biólogos pensam que os valores reais dos índices não são importantes, desde que eles possam ser utilizados para calcular a significância estatística na queda da diversidade após uma praga ou outro distúrbio. Nessa visão, que é comum na literatura que aborda a diversidade, a significância estatística do resultado é o produto final do estudo. Um momento de reflexão, entretanto, mostra que isso não é razoável. A significância estatística de uma mudança em um índice de diversidade tem pouco a ver com a real magnitude ou significância biológica da mudança, a qual é a questão científica realmente importante. Para ajudar a tornar isso claro, considere o exemplo de lançar uma moeda N vezes para ver se há viés (i.e. se a moeda está viciada - comentário meu). Uma boa medida da significância estatística do viés da moeda é o valor de p obtido (utilizando a distribuição binomial e a hipótese nula que a proporção de caras é 0,5) (Nota: p é um teste estatístico que, nesse caso, pode ser utilizado para saber se o número de caras é significativamente diferente do esperado, ou seja, 0,5 - 50%). Entretanto, se N é grande o suficiente, até mesmo o mais minúsculo desvio de um número médio de caras de 0,5, digamos 0,50001, pode resultar em um valor de p altamente significativo, digamos 0,0001. Esse valor altamente significativo do valor de p prova que a moeda está viciada, mas diz absolutamente nada sobre o tamanho ou a importância prática do viés. Uma medida que revela a real magnitude do viés é o excesso da proporção de caras obtido. Se o número médio de caras é 0,50001, o excesso na proporção de caras é 0,00001, um viés que não é importante para a maioria dos casos, mas se "caras" saírem em 75% das vezes, o viés não pode ser ignorado mesmo em poucas tentativas. Ecólogos são geralmente culpados em parar após calcular o valor de p, quando a questão mais interessante é o verdadeiro tamanho do efeito, o equivalente ao excesso de proporção de caras no lançamento da moeda. Entretanto, para julgar a real magnitude da mudança na diversidade, precisamos de medidas que se comportem mais intuitivamente do que os índices discutidos acima. Os aspectos da complexidade composicional medida por esses índices não são boas combinações para o que a maioria dos biológos querem dizer com "diversidade" e não nos ajudam a julgar a real magnitude de um efeito."

Na próxima postagem: "Verdadeira diversidade de ordem q".