生物质是生产化学品和燃料的重要原料,作为一种新兴的可再生能源,生物质的转化利用受到广泛研究关注。纤维素是自然界中存在最广泛的生物质原料,其中葡萄糖作为纤维素的单体,在生物质转化过程中是基本的中间体,所以葡萄糖热裂解反应网络对更好的理解设计生物质转化过程有重要意义。然而,葡萄糖作为一种多官能团分子,其反应网络十分复杂,可能的反应路线众多,传统的量化方法受限于计算代价难以大规模搜索,而经典力场方法对反应的描述不够理想,如何实现对复杂反应网络的深度搜索是这一领域的重要挑战。
近期复旦大学化学系刘智攀教授课题组(JACS,12月4日在线论文)通过结合神经网络方法和随机行走势能面搜索方法(SSW),构建了针对有机反应的神经网络势函数,实现了对葡萄糖热裂解反应网络的深度搜索。利用神经网络势函数,他们搜集了超过150000对反应数据,得到了6407种基元反应,以此构建起葡萄糖热裂解反应网络。通过结合进一步的第一性原理计算验证,葡萄糖热裂解中几个重要产物(HMF, FF 和 HAA)的低能垒通道得到了自动化定位,其中关于HMF生成机理提出的逆迈克尔加成式路线,相较于之前工作中的机理能垒更低而且对脱水过程的区位选择性更强;FF和HAA路径则共享关键的3-羰基己糖中间体。
由于大规模反应搜索要求势函数有对各种不同可能键连模式的普遍稳定性和构象空间的敏感性,因此一个可用于反应探索的神经网络构建,在该研究中起到了重要作用。刘智攀教授课题组在过去10年中,深入研究势能面搜索方法,于2017年提出了基于随机势能面行走(SSW)的全局势能面搜索方法构建势能面数据集,从而建立全局神经网络(NN)势函数的架构,即SSW-NN方法。为了研究有机反应体系,作者从QM9数据集中选择不同第一近邻化学环境的两千多种结构组合出发,进行反应数据集构建,筛选得到了约~9万代表性结构,拟合得到全局NN势函数,势函数的能量和力的均方根误差分别为10.05 meV/atom和0.242 eV/Å。
基于SSW-NN方法得到的势函数,作者大规模探索了葡萄糖反应网络。文章采用SSW-RS方法结合神经网络势函数进行单步反应搜索,通过收集到的反应数据库确定进一步的搜索目标,重复迭代这一过程完成深度反应搜索。利用低计算代价的神经网络势函数优势,作者收集了超过150000对反应数据,包括4455种不同的中间体和6407种不同的基元反应。整合这些结果并对高价值路径进行第一性原理计算验证,数据结果给出了葡萄糖热裂解几种关键产物(HMF, FF 和 HAA)的低能垒反应通道。其中,对同一反应的不同构型过渡态的计算结果还表明,葡萄糖作为一种多羟基化合物,分子空间构型和氢键网络对其反应能垒的影响十分巨大(能垒变化可达~1 eV),这一特性决定了大规模势能面搜索对确定低能垒路径和深入理解这一体系的重要性。
HMF作为重要的平台呋喃化合物,在葡萄糖的生物质转化过程中一直受到重要关注。葡萄糖热裂解生成HMF包含三分子脱水反应,过去提出的路径中都包含羟基的1.2-脱水反应,而这一高能垒的脱水过程也是过去不同机理中的普遍决速步骤。对此,论文通过大规模的反应搜索发现,不同于传统路径中难以避免的低选择性1,2-脱水反应,整个机理路线中的脱水过程可以全部采用区位选择性的逆迈克尔加成的脱水反应,以此得到了低于过往机理的低能垒路径(低0.19 eV)。同时,论文对热裂解三个主要产物提出的路径,可与关键中间体,同位素标记等实验证据相吻合。此外,论文建立的人工神经网络构建流程可通用于目标其他反应体系的势函数构建,构架上也可进一步移植应用于研究表面催化反应体系。
论文工作得到了科技部纳米科技重点研发专项“纳米催化机器学习与动态模拟”和自然科学基金委“碳基能源转化”重大研发计划支持,论文的第一作者为复旦大学17级直博生康沛林,通讯作者为商城青年研究员,刘智攀教授。
具体请参见论文J. Am. Chem. Soc. 2019, DOI: 10.1021/jacs.9b11535。