近期,我中心许正宏教授团队在RBS及终止子等基因调控元件的构效关系研究中取得进展,具体发表情况如下:
1. “Deciphering the rules of ribosome binding sites differentiation in context dependence”正式发表于ACS Synthetic Biology (https://pubs.acs.org/doi/abs/10.1021/acssynbio.2c00139)
2. “Sequence and thermodynamic characteristics of terminators revealed by FlowSeq and the discrimination of terminators strength”正式发表于Synthetic and Systems and Biotechnology (https://doi.org/10.1016/j.synbio.2022.06.003)
3. “Characterization and implications of prokaryotic ribosome-binding sites across species”正式发表于Systems Microbiology and Biomanufacturing(https://doi.org/10.1007/s43393-022-00094-8)。
细菌基因表达涉及多步骤的反应,转录和翻译是原核生物基因表达的两个主要过程。启动子/RNA聚合酶分子对以及核糖体结合位点(RBS)/核糖体分子对的相互作用决定了转录或翻译的起始和终止,是基因表达的限速步骤。启动子、终止子和RBS不仅是构建遗传回路的必需部分,同时也是是代谢工程中目标基因精准调控的重要元件。但是目前启动子相关研究较多,而终止子、RBS的构效关系研究不足,导致终止子和RBS的可预测性差、通用性差。因此,在实际的基因回路构建中,这两种元件的理性化设计依据不充分,靶基因调控的试错成本较高,严重限制了代谢工程和合成生物学领域途径调控效率。因此,开发正交性好、可预测、可编辑的基因调控元件至关重要。
团队围绕RBS的正交性差,即其强度受到基因背景干扰严重的问题,开发了大规模元件突变文库-FlowSeq技术采集表型和基因型相关参数高通量采集-多基因背景的交叉分析研究技术方法,阐明了RBS的序列特征和与翻译效率和背景依赖性之间的关联,总结了降低背景依赖性、具有强度可编辑能力的RBS的通用设计模板。建立了基于one-class SVM的RBS背景依赖性预测模型。研究得到的结果为“即插即用”的RBS调控元件开发提供了实用工具。
在终止子的研究中,团队主要围绕终止子序列热力学特征解析,以及终止子分别对上下游基因表达强度的调控作用分析开展研究。通过序列-活性分析阐明了终止子的序列特征、结构特征以及表达强度之间的关联,首次发现了强终止子不仅可以及时有效的下游基因转录,同时对上游基因的表达具有积极意义。研究建立了基于XGBoost算法的终止子强度的判别模型,并通过合成终止子序列进行了验证。研究得到的结果为理性开发高性能终止子提供了基础参数。
以上研究成果以张晓娟教授和许正宏教授为通讯作者,博士研究生段艳婷、硕士研究生翟伟绩分别为论文第一作者。研究工作得到了重点研发计划项目(2019YFA0905300)、(2018YFA090030)和国家自然科学基金项目(32171421)的资助。
图1 RBS背景依赖性研究思路以及高性能工程化RBS设计模板
图2 终止子构效关系研究思路