
Fonte: NASA Exoplanet Catalog. Disponível em: https://science.nasa.gov/exoplanet-catalog/k2-18-b
A mídia comercial do mundo inteiro noticiou a suposta detecção das linhas espectrais das moléculas metano (CH₄) e dióxido de carbono (CO₂), além de uma possível assinatura do dimetilsulfeto (DMS), na atmosfera do exoplaneta K2-18b, com base em dados espectrográficos coletados no infravermelho pelo Telescópio Espacial James Webb. Segundo os autores do estudo, essas moléculas podem estar associadas à atividade biológica, como, por exemplo, o metabolismo de fitoplâncton aqui na Terra. O planeta é classificado como um sub-Netuno (Figura 1), com possível presença de água líquida sob uma atmosfera rica em hidrogênio, e orbita uma anã vermelha. A hipótese de condições habitáveis tem sido levantada por alguns pesquisadores, em função de o planeta estar próximo ao limite inferior da chamada zona de habitabilidade de sua estrela, onde a água poderia existir no estado líquido (Figura 2).
Todavia, é sempre necessário cautela diante de notícias sobre descobertas potencialmente disruptivas, especialmente quando veiculadas pela imprensa generalista. Essas moléculas também podem ser produzidas por processos abióticos, e há ainda a questão da própria robustez estatística da detecção. Devemos lembrar que jornalistas não são cientistas e tampouco têm a obrigação de sê-lo. No entanto, deparei-me com um artigo que me chamou atenção por afirmar que os pesquisadores tinham 99,7% de confiança na detecção das linhas espectrais, restando apenas 0,3% de dúvida.
Essa interpretação de 99,7% como um indicativo de detecção positiva, e de 0,3% como a chance de um falso positivo, está incorreta. O que parece ter ocorrido é que os autores identificaram um pico de intensidade no espectro do exoplaneta em uma posição coincidente com as linhas espectrais de interesse. O procedimento plausível é o seguinte:
- Foram determinados, com base em espectros de laboratório, os comprimentos de onda correspondentes às linhas espectrais das moléculas investigadas.
- A largura espectral observada foi usada como estimador da dispersão, ou seja, como o desvio padrão da distribuição.
- Procuraram-se picos de intensidade centrados nessas posições, dentro de uma largura de um desvio padrão, o que incluiria aproximadamente 67% das ocorrências, assumindo uma distribuição normal.
Nenhum pico relevante parece ter sido identificado nesse primeiro intervalo. A busca foi então expandida para dois desvios padrão, abrangendo cerca de 95% das ocorrências, também sem sucesso. Somente ao ampliar o intervalo para algo próximo de três desvios padrão, ou cerca de 99,9% da distribuição, foi possível encontrar sinais compatíveis com as moléculas.
Baseando-se exclusivamente nesse tipo de análise, considero essa “descoberta” estatisticamente controversa. A meu ver, isso se deve a dois fatores principais: por um lado, muitos pesquisadores demonstram fragilidade conceitual na aplicação correta de métodos probabilísticos e estatísticos. Por outro, existe uma pressão estrutural no meio acadêmico que favorece anúncios precipitados e abordagens metodologicamente frágeis, seja para obter visibilidade, conquistar financiamento público ou garantir uma posição institucional. Isso é especialmente verdadeiro em sistemas como o dos Estados Unidos, onde a permanência no sistema universitário depende, muitas vezes, de métricas de produtividade científica.