NVIDIA · 大模型

NVIDIA 发布 Evo 2 生物分子基础模型

NVIDIA 联合非营利生物医学机构在 DGX Cloud 上训练了 Evo 2,这是目前公开最大的基因组 AI 模型,能够理解所有生命域的遗传密码。Evo 2 已通过 BioNeMo 平台开放,为生物分子科学提供从序列预测到功能注释的底层能力,有望加速药物发现与合成生物学研究。

域名
blogs.nvidia.com
评分
5 · 重大发布
发布
2025-02-19
NVIDIA 发布 Evo 2 生物分子基础模型

导读

NVIDIA 发布 Evo 2 生物分子基础模型,覆盖 DNA、RNA、蛋白质三种生物大分子的统一表征。 Evo 系列是 NVIDIA 与 Arc Institute 合作的项目,Evo 1 已是 ICML 2024 上最受关注的开 源生物 AI 模型之一,Evo 2 在数据规模、模型规模、跨域任务上做了大幅扩展。

Evo 2 训练数据涵盖 9.3 万亿核苷酸,跨越古菌、细菌、真核生物完整谱系,参数量达到 40B,能在零样本设定下完成基因功能预测、变异致病性评估、蛋白质设计、CRISPR sgRNA 优化等任务。和 AlphaFold 系列聚焦蛋白结构不同,Evo 2 处理的是"序列层"的生物语言。

模型权重在 HuggingFace 开放下载,配套的 BioNeMo 框架提供推理与微调工具。生物 AI 创 业公司和学术实验室可以直接基于 Evo 2 做下游任务,无需从头训练。NVIDIA 用 Evo 2 把 生物领域纳入了 CUDA 生态的覆盖范围。

原文摘要

Scientists everywhere can now access Evo 2, a powerful new foundation model that understands the genetic code for all domains of life. Unveiled today as the largest publicly available AI model for genomic data, it was built on the NVIDIA DGX Cloud platform in a collaboration led by nonprofit biomed…