Proteínas artificiais são produzidas por IA

E se a IA pudesse prever a composição de uma nova molécula de medicamento da mesma forma que um buscador descobre o que você está procurando ou um programa de e-mail que antecipa suas respostas? Esse é o objetivo de uma nova abordagem que faz uso de IA como processamento de linguagem natural (mesma tecnologia que permite que o ChatGPT da OpenAI gere respostas semelhantes às humanas) para analisar e sintetizar proteínas.

Uma matéria publicada pelo The Wall Street Journal, diz que pesquisas na internet e textos de e-mail possuem algo em comum com os códigos biológicos: ambos são representados por uma série de letras. As proteínas são compostas por aminoácidos e cada um deles corresponde a uma única letra do alfabeto, ou seja, proteínas são representadas por uma série de letras.

A matéria ainda explica que os algoritmos de linguagem natural podem ser aplicados a esses dados biológicos para criar modelos de linguagem de proteínas. Esses modelos codificam o que pode ser chamado de “gramática das proteínas”, regras que ditam quais combinações de aminoácidos produzem propriedades terapêuticas específicas, para prever as sequências de letras que podem se tornar a base de novas moléculas de fármacos. Com esses resultados, o tempo de descoberta de novos fármacos pode diminuir de anos para meses.

A equipe do pesquisador Ali Mani, da startup Profluent, usou a IA ProGen para criar novas proteínas microbianas. A ProGen, que funciona de forma parecida com geradores de texto, aprendeu a “gramática das proteínas” para poder formar as 280 milhões de proteínas existentes.

Os cientistas puderam especificar grupos de proteínas semelhantes, assim como escolhemos um assunto para a IA de texto abordar. Para o teste, escolheram um grupo de proteínas com atividade antimicrobiana. Em seguida, programaram verificações no processo da ferramenta para que ela não produzisse aminoácidos sem sentido e testaram a amostra das moléculas em células.

Das 100 moléculas sintetizadas, 66 participaram de reações químicas parecidas com as de proteínas naturais, o que sugeriu que as proteínas artificiais também podem “matar bactérias”. Os pesquisadores, então, adicionaram as 5 proteínas com reações mais intensas registradas a uma amostra da bactéria Escherichia coli e 2 dessas proteínas conseguiram matar a bactéria. O teste foi fotografado com raios-X e foi possível constatar que, ainda que as sequências de aminoácidos fossem até 30% diferentes de qualquer proteína existente, as formas quase combinavam com as proteínas naturais.

Assim como a Profluent, outras empresas também estão investindo nessa abordagem. Um exemplo é a NVIDIA com o serviço BioNeMo que inclui modelos de linguagem grande (LLMs) pré-treinados e suporte nativo para formatos comuns de arquivos para proteínas, DNA, RNA e química. Com ele é possível gerar milhões de sequências de proteínas em apenas alguns segundos. O serviço combinado com autocodificadores variacionais funciona como um filtro e desenvolve proteínas que não estavam no radar de ninguém há anos.

Apesar dos resultados, esse tipo de abordagem ainda enfrenta grandes obstáculos, pois modificações excessivas à base da proteína podem induzir efeitos colaterais não intencionais. As moléculas totalmente sintéticas exigirão testes rigorosos para garantir que sejam seguras para o corpo humano. Mas se os algoritmos funcionarem, trarão uma nova força à promessa de IA para transformar a descoberta de fármacos.

Em nosso blog, saiba mais sobre a abordagem baseada em IA que pode acelerar a descoberta de medicamentos ao identificar novos anticorpos de alta ligação com targets de doenças. ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ 

Proteínas artificiais são produzidas por IA