2025, 41(3):Ⅰ-VIII. DOI: 10.13345/j.cjb.250197 CSTR: 32114.14.j.cjb.250197
摘要:生物制造是可持续发展重大战略方向,我国高度重视生物制造产业的发展,国家和地方相继出台生物制造专项政策,大力发展生物制造已成不可阻挡之势。当前,随着系统生物学、合成生物学的不断发展,生物大数据、信息技术正快速与生物技术融合,为生物体系设计、创制及应用提供新理论、新方法、新技术,推动生物制造发展进入人工智能驱动时代。为了把握AI驱动生物制造创新发展脉络,本刊特组织出版专刊,邀请国内多家单位的专家学者,分别从AI驱动底层技术、生物元器件智能设计合成、人工细胞智能设计再造和智能生物过程控制优化4个方面阐述AI驱动生物制造的机遇和挑战、发展现状,展望未来的发展趋势,为更好推动生物制造领域的技术创新和产业发展提供参考。
2025, 41(3):901-916. DOI: 10.13345/j.cjb.240653 CSTR: 32114.14.j.cjb.240653
摘要:生物制造技术是一种融合生物学、化学和工程学的前沿制造方法,利用可再生生物质和生物体作为生产介质,通过发酵过程规模化生产目标产品。与传统石化路线相比,生物制造在减少CO2排放、降低能耗和成本方面具有显著优势。随着系统生物学、合成生物学的发展和生物大数据的积累,人工智能、大模型和高性能计算等信息技术与生物技术的融合,生物制造正逐步进入数据驱动时代。本文综述了面向生物制造的数据库、知识库与大语言模型的最新研究进展,探讨了该领域的发展方向、难点以及新兴技术方法,为相关领域的科研工作提供了参考和启示。
2025, 41(3):917-933. DOI: 10.13345/j.cjb.240604 CSTR: 32114.14.j.cjb.240604
摘要:计算模拟驱动的生物元件、代谢网络乃至细胞系统的机理解析、定向改造和按需设计,可为解决不同层次的生物学问题提供新的技术方案,已成为生物制造的核心研究内容。在蛋白元件的计算模拟方面,基于物理原理的传统方法利用计算机软件和数学模型来模拟生物体系中蛋白行使功能的物理和化学过程,是理解复杂生物体系和指导实验设计的有力工具。随着生物系统模拟尺度的不断扩大,传统计算模拟技术面临计算精度和计算速度难以平衡的困境。近年来,生物数据量呈现爆炸式增长,使得构建高性能人工智能(artificial intelligence, AI)模型成为可能,为蛋白计算模拟带来了新思路和新契机,AI和物理原理融合驱动的蛋白计算模拟技术应运而生。本文对基于物理原理的传统蛋白计算模拟方法及其应用进行了详细介绍,并对融合AI和物理原理的最新计算模拟技术进行了梳理和讨论,进而提出在AI模型中结合严谨的化学知识和既定的物理原理,可有效提升数据处理和模式识别能力,从而提高计算效率和预测的准确性,使其具有更强的解释能力、通用性和稳健性。目前,AI与物理原理融合驱动的计算模拟技术已在生物催化领域展现出巨大的潜力和价值。本文聚焦于主流和先进的蛋白计算模拟技术,通过对这些技术的系统性回顾和前瞻性分析,梳理了蛋白质计算模拟技术的发展脉络,以推动其在酶催化机制解析、蛋白从头设计与理性改造等领域的应用,助力生物制造的发展。
2025, 41(3):934-948. DOI: 10.13345/j.cjb.240683 CSTR: 32114.14.j.cjb.240683
摘要:蛋白质突变效应预测是生物信息学和蛋白质工程领域的一个关键挑战。近年来,深度学习,特别是蛋白质语言模型的发展为该领域带来了新的机遇。本文综述了蛋白质语言模型在蛋白质突变效应预测中的应用,重点讨论了3类主要模型:基于序列的模型、基于结构的模型以及结合序列和结构信息的模型,详细分析了这些模型的原理、优势和局限性,并探讨了无监督学习和监督学习在模型训练中的应用。此外,还讨论了当前面临的主要挑战,包括高质量数据集的获取、数据噪声的处理等。最后,展望了未来研究方向,包括多模态融合、少样本学习等新兴技术的应用前景。本综述为研究者提供了一个全面的视角,以推动蛋白质突变效应预测领域的进一步发展。
2025, 41(3):949-967. DOI: 10.13345/j.cjb.240865 CSTR: 32114.14.j.cjb.240865
摘要:随着合成生物学的兴起,CRISPR-Cas系统作为基因编辑的核心工具在医药、农业和工业生物技术等领域展现了巨大潜力。本文综述了人工智能(artificial intelligence, AI)技术在CRISPR-Cas系统设计、挖掘与改造中的应用进展。AI技术,特别是机器学习,通过分析高通量测序数据,优化sgRNA设计、提升编辑效率、预测脱靶效应。本文讨论了AI在单链引导RNA (single guide RNA, sgRNA)设计与评估中的应用,并对基于机器学习的CRISPR阵列、Cas蛋白的注释与挖掘,以及AI在CRISPR相关的基因编辑关键蛋白改造中的潜力也进行了重点探讨。这些研究不仅提高了基因编辑的效率和精确性,还为基因组工程开辟了新的可能性,也为实现智能化和精准化的基因组编辑奠定了基础。
2025, 41(3):968-992. DOI: 10.13345/j.cjb.240599 CSTR: 32114.14.j.cjb.240599
摘要:核酸元件是重要的功能性核酸序列,在生物制造中通过基因表达调控、代谢途径优化和基因编辑等方面来影响目标产物的合成,因此核酸元件的设计和优化对细胞工厂的构建有重要作用。通过人工智能技术可以准确有效地预测功能性核酸元件,设计和优化功能稳定的元件序列,同时解析其作用机制,为生物制造提供强大的技术支持。近年来,人工智能技术在生物制造中通过设计启动子、核糖体结合位点和终止子等核酸元件及其组合,可以大幅度减少实验工作量,加快生物制造进程。但是由于生物系统的复杂性和高质量训练数据不足等问题,导致核酸元件的智能设计在生物制造中的应用较为单一。本文综述了应用于生物制造的各种DNA和RNA核酸元件,基于人工智能算法构建的核酸元件预测和设计工具及人工智能技术在生物制造中的应用案例。未来通过整合人工智能技术、合成生物学和高通量技术等,有望开发更高效准确的核酸元件设计方法,加速其在生物制造中的应用。
2025, 41(3):993-1010. DOI: 10.13345/j.cjb.240629 CSTR: 32114.14.j.cjb.240629
摘要:天然元件服务于细胞长期进化获得的生存本能,难以满足工程细胞在工业等特殊环境下高效执行生物功能的需求。酶作为生物催化剂,在生物合成途径中发挥着关键作用,它们能够显著提高生化反应的速率和选择性。然而,天然酶的催化效率、稳定性、底物特异性和耐受性等方面往往不能满足工业生产的需求。因此,挖掘、设计和改造酶以适应特定的生物制造过程至关重要。近年来,人工智能(artificial intelligence, AI)技术在蛋白的挖掘、评估、改造和从头设计中发挥着越来越重要的作用。AI技术可以通过机器学习和深度学习算法,分析大量的生物信息学数据,预测蛋白的功能和特性,从而加速蛋白的发现和优化过程。此外,AI还可以辅助科研人员从头设计新的蛋白结构,通过模拟和预测其在不同条件下的性能,为蛋白的设计提供指导。本文综述了面向生物制造的蛋白元件挖掘、评估、改造以及从头设计的最新研究进展,探讨了该领域的热点问题、难点以及新兴技术方法,旨在为相关领域的科研工作提供指导。
2025, 41(3):1011-1022. DOI: 10.13345/j.cjb.240603 CSTR: 32114.14.j.cjb.240603
摘要:基于转录调控蛋白的生物传感器已在代谢工程、合成生物学、代谢物监测等领域发挥重要作用。该工具具有高度模块化、正交性、易于构建及操作等优良特性,但在实际应用中,天然调控蛋白对目标化合物的响应仍然存在响应程度较低、特异性不符合需求等缺陷。本文综述了近年来在计算机模拟和人工智能技术辅助下,采用蛋白质工程手段,智能设计、改造转录调控蛋白以提升其工作性能所取得的研究进展。主要包括利用蛋白质结构预测、配体结合模拟等优化改造策略快速获取目标突变体,或借助对突变体数据分析并经机器学习等构建数学模型,预测转录调控蛋白突变响应效果等。相较于传统方式,计算机模拟和人工智能辅助技术可实现对生物元件更精准快捷地设计构建,将推动新型生物传感器的创制研发,更好地满足实际应用的需求。
2025, 41(3):1023-1051. DOI: 10.13345/j.cjb.240605 CSTR: 32114.14.j.cjb.240605
摘要:合成生物学是生物学、工程学和计算机科学等多学科交叉融合的新兴前沿领域,旨在通过“自下而上”的工程化设计理念,逐级构建元件、器件和线路,以创造自然界中不存在的人工生物系统,或对已有的生物系统进行目标性改造。随着合成生物产业的飞速发展,对基因线路规模和复杂度的需求也在不断提升。然而,传统依赖经验和试错的方法在元件与线路构建中具有较低的效率和成功率,已无法满足合成生物科技创新转化的需求。这促使元件与线路的开发范式逐渐从人力型、经验型的试错模式向标准化、智能化的工程模式转变。机器学习能够揭示生物数据中隐含的结构和关联,为合成生物元件和线路的智能设计提供强大支持。本文综述了生物元件与线路设计中常用的机器学习算法,以及它们在合成启动子、RNA调控元件、转录因子等生物元件和简单基因线路智能设计中的典型应用,探讨了当前面临的主要挑战及潜在的解决方案。最后,本文展望了机器学习与合成生物系统设计未来的融合趋势,并强调了跨学科合作的重要性。
2025, 41(3):1052-1078. DOI: 10.13345/j.cjb.250061 CSTR: 32114.14.j.cjb.250061
摘要:生物制造是使用工程细胞实现化学品、医药、能源、材料产品的规模化生产,也是应对全球环境危机,实现“双碳”目标,推动经济社会绿色转型的一种新兴生产力。高效设计并构建工程细胞需要精准、全面的数字细胞模型。测序仪、质谱、光谱、微流控等前沿装备的迭代升级,数据科学、人工智能、自动化等高新技术集群的突破性进展,使得细胞组分动态变化的精确测量、海量生物数据的快速获取、细胞过程数理模型的精准构建成为可能。本文系统归纳了系统生物学中细胞建模的数理框架:首先从网络拓扑、随机过程、动力学方程等维度剖析了常见数学模型架构及其使用范围,继而分类评述了生长分裂、形态发生、DNA复制、转录调控、生化代谢、信号转导、群体感应等单一细胞过程的建模策略,重点探讨了整合多个细胞过程构建全细胞模型的研究进展,最后讨论了数据不足、机制解析不充分、多维数据整合困难、计算复杂度指数增长等限制细胞生命过程数学刻画的若干关键挑战。本文汇总了系统生物学中细胞生命过程精确模拟的数理基础,增进了对细胞运作分子机制的理解,对未来工程生物的设计与构建具有重要意义。
2025, 41(3):1079-1097. DOI: 10.13345/j.cjb.240935 CSTR: 32114.14.j.cjb.240935
摘要:蛋白质是生命活动的基础,研究蛋白表达机制对于揭示细胞组织规律与促进生物技术发展至关重要。蛋白质表达是一个涵盖转录、翻译、折叠、转运与翻译后修饰等精密调控的复杂过程,结合蛋白表达数据构建其模型对理解蛋白表达的各种细胞因素和调控机制具有重要意义。本文重点评述了近年来蛋白表达过程机理模型构建和通过人工智能方法分析各种因素对蛋白表达的影响。化学反应网络模型可从转录翻译的底层过程对蛋白表达进行数学建模,可分析各种胞内成分如聚合酶、tRNA等对蛋白表达的影响,但模型参数数量巨大,难以直接实验确定,参数拟合是一个需要解决的难题。与之相对,数据驱动的人工智能模型主要研究目标蛋白的氨基酸序列和相应基因及调控区核苷酸序列对蛋白表达的影响,进而指导通过序列设计提高蛋白表达量。将机理模型和人工智能模型相结合,综合考虑胞内因素和表达序列特征的影响,有望进一步加深对蛋白表达系统的理解,为高价值目标蛋白的高效表达和细胞中不同蛋白的协调表达调控提供理论和技术支持。
2025, 41(3):1098-1111. DOI: 10.13345/j.cjb.240565 CSTR: 32114.14.j.cjb.240565
摘要:能量代谢调控在代谢工程领域发挥重要作用,主要通过调控细胞内ATP、还原型电子载体的供给强度和方式来实现物质和能量代谢的平衡或物质和能量利用最大化。能量代谢既可以通过改变物质代谢流分配提升生产效率,也可以通过改变酶催化反应的热力学参数,影响反应平衡减少能量消耗,从而降低生产成本。因此能量代谢调控有望成为微生物细胞工厂改造的有力工具,用于提高细胞生产目标代谢物的生产能力,降低生产成本。本文重点论述了目前常用能量代谢调控方式及其对细胞工厂的影响,为微生物细胞工厂的高效构建提供了参考。
2025, 41(3):1112-1132. DOI: 10.13345/j.cjb.240966 CSTR: 32114.14.j.cjb.240966
摘要:细胞中自发或由酶催化的代谢反应组成了高度复杂的代谢网络,其与细胞生理代谢活动运作密切相关。细胞生理代谢网络模型的重构有助于从系统层面上解析基因型与生长表型之间的关联,为细胞生理代谢活动精准刻画与生物绿色制造等研究提供重要的计算生物学工具。本文系统介绍了全基因组尺度代谢网络模型(genome-scale metabolic models, GEMs)、动力学模型、酶约束代谢模型(enzyme-constrained genome-scale metabolic models, ecGEMs)等不同类型细胞生理代谢网络模型发展与应用的最新研究进展;同时还介绍了GEMs自动化构建研究进展以及条件特异性GEMs建模策略。人工智能技术为高精度细胞生理代谢网络模型构建提供了全新机遇,本文进一步总结了人工智能技术在动力学模型和酶约束模型构建等领域的应用。各类细胞生理代谢网络模型的高质量重构将为今后的定量合成生物学与系统生物学等研究提供强大计算支撑。
2025, 41(3):1133-1151. DOI: 10.13345/j.cjb.240937 CSTR: 32114.14.j.cjb.240937
摘要:感应代谢与环境变化并做出自适应调控是细胞生命活动的关键。近年来,随着合成生物学技术的进步,越来越多的细胞感知代谢和环境差异的机制被揭示,同时相关应用也日益广泛。然而,目前缺乏关于细胞代谢与环境适应调控的研究的系统性综述。本文介绍了细胞感知代谢和环境差异的关键跨膜蛋白及感应蛋白;总结了细胞在应对胞内外代谢差异时的天然自适应调控机制;从动态调控、理性代谢工程改造和适应性进化这3个方面探讨了基于细胞自适应调控的应用场景,并展望未来的发展方向。本文不仅为细胞感知代谢和环境变化的机制研究提供了系统性视角,还为合成生物学领域的进一步创新应用奠定了理论基础。随着未来技术的不断发展,深入理解细胞自适应调控机制有望推动新型生物制造平台的开发与应用。
2025, 41(3):1152-1178. DOI: 10.13345/j.cjb.250065 CSTR: 32114.14.j.cjb.250065
摘要:生物制造是新质生产力的重要代表,是通过工程细胞或无细胞体系实现物质高效转化的创新生产方式。其生产过程具有时空异质性、复杂性及动态性,给过程系统认知、优化调控带来了显著挑战。本文总结了生物过程多组学数据获取及分析的关键技术,归纳了基于多组学数据的生物过程建模方法,深入探讨了多组学和建模在过程参数调整、发酵控制、环境应激机制解析、营养供给优化及生产实时监测等关键环节的实际应用,详细阐释了多组学数据深度整合及模型构建在提升生物过程操作精度方面的巨大潜力。此外,本文讨论了目前生物过程优化面临的若干挑战,并探索了可能的解决策略。未来通过克服这些挑战,可以更好地理解和控制复杂的生物过程,推动生物制造领域的快速发展。
2025, 41(3):1179-1196. DOI: 10.13345/j.cjb.250032 CSTR: 32114.14.j.cjb.250032
摘要:生物制造作为新兴产业,其核心挑战在于实现发酵过程的精准优化与高效放大。本文聚焦发酵过程的关键环节——实时感知与智能控制,系统综述了在线检测技术、人工智能驱动的优化策略及数字孪生技术的应用进展。首先,从常规参数(温度、pH、溶解氧)到高级传感技术(在线活细胞传感、光谱分析、尾气监测)的在线检测手段,为实时获取微生物代谢状态提供了数据基础。其次,传统基于专家经验的静态控制逐步向人工智能驱动的动态优化演进,机器学习(如人工神经网络、支持向量机)与遗传算法等技术的整合显著提升了补料策略与工艺参数的调控效率。最后,数字孪生技术通过融合实时传感数据与多尺度模型(细胞代谢动力学与反应器流场模拟),为发酵过程的全生命周期优化与理性放大提供了新范式。未来,基于智能感知与数字孪生的闭环控制系统将加速合成生物学成果的产业化,推动生物制造向高效、智能、可持续方向迈进。
2025, 41(3):1197-1218. DOI: 10.13345/j.cjb.240598 CSTR: 32114.14.j.cjb.240598
摘要:生物过程是利用活性生物细胞或酶实现底物生物转化的一种绿色可持续、环境友好的加工过程,在生物制造中起着关键作用。具有双重属性的生物过程多层次多尺度间的复杂关联导致生物过程的优化十分困难,深入认识介尺度机理是了解生物过程动态变化和梳理多尺度复杂关系的关键之一。介尺度的数值模拟为介尺度现象的认识提供了一种新途径,人工智能(artificial intelligence, AI)优化与介尺度模拟的结合为生物过程的优化注入了新的活力。本文综述了生物过程中介尺度模拟和AI优化的研究进展,探讨了可能的发展方向,以期促进介尺度模拟和AI优化在生物过程中的应用与发展。
通信地址:中国科学院微生物研究所 邮编:100101
电话:010-64807509 E-mail:cjb@im.ac.cn
技术支持:北京勤云科技发展有限公司