Discovery and investigation of the truncation of the (GGGGS)n linker and its effect on the productivity of bispecific antibodies expressed in mammalian cells(GGGGS) n 连接子截短现象的发现与机制探究及其对哺乳动物细胞表达双特异性抗体产量的影响摘要蛋白质工程是设计与改造治疗性蛋白的重要手段可提升药效、增强安全性、降低免疫原性并优化递送效率。融合蛋白是一类重要的治疗用生物制品通常需要合适的连接子串联不同功能结构域以实现预期生物学功能。GGGGS 串联连接子 [(G4S)ₙ]凭借优异的柔性与抗蛋白酶降解特性被广泛应用于蛋白质改造研究。本研究在一款双特异性抗体中发现该类连接子存在非预期截短现象严重影响产品生产稳定性与质量。本研究以携带5×G4S连接子的双特异性抗体为研究对象精准定位了连接子的截短位点。结果表明密码子优化可改善 (G4S)ₙ连接子高度重复序列、高 GC 含量带来的负面影响将截短比例由 5%–10% 降至 1%–5%同时在哺乳动物细胞表达体系中缩短连接子长度3×G4S、4×G4S可大幅降低截短发生概率。本研究进一步探究并讨论了短链 G4S 连接子对双特异性抗体表达产物生物活性与纯度的影响。引言目前获批上市的治疗性蛋白药物尤以单克隆抗体为主数量持续增长另有大量候选分子处于临床前及临床研发阶段。科研人员持续通过蛋白质工程改造策略优化重组蛋白的药效、靶向特异性、结合能力、价态与药代动力学特征同时提升用药安全性、降低免疫原性。融合蛋白由多个功能结构域组成通常需要 1 个或多个间隔 / 连接子序列实现结构域串联保障蛋白正确折叠若无连接子直接融合往往会导致蛋白表达量低、生物活性下降或错误折叠等问题。(G4S)ₙ是目前应用最广泛的经典柔性连接子因高柔性与抗酶解特性成为通用型连接元件。研究中可通过调整 G4S 重复单元数量灵活调控连接子长度平衡相邻结构域的空间距离与柔性促进分子间相互作用。该连接子可形成柔性环区适用于各类重组融合蛋白构建实现多靶点结合与多结构域组装。本研究报道了一款 IgG 型融合蛋白mAb901存在两种缺陷型变体分子量分别缺失 630 Da、1260 Da经鉴定为5×G4S 连接子序列截短所致。研究证实在双特异性抗体早期药物研发阶段合理减少 G4S 重复单元数量可有效规避 GS 类柔性连接子的自发截短问题。材料与方法试剂与酶胰蛋白酶、嗜热菌蛋白酶、牛肠源性碱性磷酸酶购自西格玛奥德里奇基因序列由南京金斯瑞生物科技有限公司合成细胞、培养基、补料等全套表达体系耗材购自美国赛默飞世尔N - 糖苷酶 F 购自罗氏诊断。蛋白表达与纯化分别采用 CHO、HEK293 细胞结合摇瓶培养体系与 ExpiCHO 转染试剂盒、稳定 CHO-K1 细胞株构建技术完成 mAb901 蛋白表达。通过 14 天补料分批培养评估不同长度连接子变体的表达水平采用蛋白 A 亲和层析纯化目的蛋白。补料分批培养采用 14 天连续补料培养工艺进行蛋白表达细胞初始接种密度为1×106个 /mL培养环境 36 ℃、5% CO₂培养第 4 天起隔日添加 5%体积比补料培养基并下调培养温度至 32 ℃培养至第 14 天或细胞活力低于 80% 时终止培养并收获细胞上清。表达产量检测采用高效液相色谱仪测定培养上清蛋白滴度细胞培养液 1000×g 离心 5 min取上清上机检测参考已发表文献方法计算比生产速率。完整蛋白分子量检测蛋白样品经含 4 M 尿素、pH 7.6 磷酸盐缓冲液配制的 40 mM 二硫苏糖醇还原处理采用 UPLC - 串联质谱联用系统开展分析配套 C4 脱盐柱与苯基色谱柱进行分离依托质谱软件完成原始图谱反卷积计算完整蛋白相对分子质量。胰蛋白酶肽图分析参考已有文献方法完成蛋白还原与烷基化处理样品经尿素、三羟甲基氨基甲烷缓冲体系配制的胰蛋白酶25 ℃酶解 8 h酶解 6 h 时加入 N - 糖苷酶 F 去除糖基化修饰酶解产物通过 C18 色谱柱、乙腈 - 水梯度洗脱结合液质联用系统完成检测。质谱肽段鉴定使用生物制药质谱分析软件解析肽图峰组分通过提取离子流图评估蛋白修饰比例采用轨道阱质谱仪的数据依赖采集模式获取二级质谱图谱分别设定碰撞诱导解离、电子转移解离参数完成肽段碎片断裂与鉴定。T 载体构建采用天根基因组 DNA 提取试剂盒提取基因组 DNA依托 RNA 提取试剂盒与反转录试剂盒合成 cDNA使用宝生物 pMD 19-T 载体克隆试剂盒完成 T 载体连接与构建。RNA 二级结构预测利用 mfold 在线 RNA 折叠预测网站完成序列 RNA 二级结构模拟同步获取不同结构对应的自由能ΔG参数。体积排阻色谱SEC检测蛋白 A 纯化后的样品通过高效液相色谱结合体积排阻色谱法分析聚集体上样量 50 μg流动相为磷酸盐 - 氯化钠缓冲液检测波长 280 nm恒定流速洗脱。还原型 SDS 毛细管电泳CE-SDS经体积排阻色谱纯化的蛋白样品加入 β- 巯基乙醇还原处理高温变性离心后采用毛细管电泳系统进行分离检测设定毛细管长度、样品仓温度与检测波长积分后统计重链、轻链峰面积占比。酶联免疫吸附试验ELISA靶向抗原包被 96 孔板4 ℃过夜孵育PBST 洗涤后加入封闭液室温封闭 1 h梯度稀释样品上样孵育洗涤后加入链霉亲和素 - 辣根过氧化物酶结合物显色酶标仪读取 450 nm 吸光度值定量检测蛋白结合活性。结果与讨论低分子量-630 Da缺陷组分的发现抗体 mAb901 为改造型工程抗体可同时中和两种不同的人源抗原蛋白。该抗体由靶向抗原 A 的人源 IgG 骨架以及靶向抗原 B 的人源 IgG 可变区拼接组成。其中抗原 A 重链的 C 端通过5 串联 G4S 柔性连接子 [(G4S)₅]与识别抗原 B 的单链抗体片段scFv相连图 1。双特异性抗体 mAb901 结构示意图。红线代表 G4S 连接子。采用质谱法检测非还原态完整 mAb901 蛋白的分子量图 2时发现除理论预期的目标分子量外部分 mAb901 样品中还检测到一种低丰度组分其分子量较理论值降低 630±2 Da且该缺陷组分在不同样品中的占比存在差异。肽图分析鉴定低分子量-630 Da缺陷组分为鉴定该分子量缺失 630 Da 的变异体本研究利用液质联用LC-MS系统对还原处理后的双特异性抗体 A 链蛋白进行胰蛋白酶肽图解析。mAb901 完整蛋白分子量。理论分子量为 173529 Da。图 2a 为无截短变异体的 mAb901 样品图 2b 与图 2c 中检测到两个异常杂峰分子量分别为 172900 Da缺失 630 Da与 172269 Da缺失 1260 Da。图 3 为 mAb901 的肽图分析结果。利用 BiopharmaLynx 1.2 软件对质谱数据解析后在肽图谱中发现两种低丰度未知组分分子量缺失值分别为 630 Da 和 1260 Da。全长氨基酸序列比对结果证实单个 G4S 连接子的分子量恰好与目标蛋白和低分子量变异体的质量差值完全吻合且降解次级片段的质谱检测结果与肽图分子量高度匹配。还原态 mAb901 经胰蛋白酶酶解后的肽图紫外UV图谱。肽图采用液质联用LCMS检测紫外监测波长设置为 214 nm。图 3a 为不含截短变异体的 mAb901 样品图 3b、3c 中可见两个异常峰对应分子量分别为 172900 Da缺失 630 Da与 172269 Da缺失 1260 Da。基于 DNA 测序鉴定低分子量-630 Da变异体为证实 G4S 连接子的截短现象并探究其发生机制本研究开展了 DNA 测序分析。分别对质粒、基因组 DNA 及 RNA 反转录获得的 cDNA 进行测序。cDNA 测序结果图 4显示该位点存在3 个 G3S 与 4 个 G3S 连接子的混合套峰提示连接子在此处发生序列截短该结果与肽图分析结论一致。随后将 PCR 产物连接至 T 载体分别对质粒、细胞基因组 DNA 及 cDNA 样本各挑选 20 个单克隆进行测序验证图 5。通过 cDNA 测序靶向鉴定序列变异。图 4a 为 cDNA 理论测序结果图 4b、4c 显示两处非预期的序列突变。其中图 4b 缺失 1 个 G4S 连接子重复单元图 4c 缺失 2 个 G4S 连接子重复单元。不同表达水平下 G4S 连接子截短差异对比图 5a 为质粒 DNA 测序结果而在 CHO 细胞基因组 T 载体克隆筛选图 5b及 CHO 细胞编码区 cDNA 样本图 5c中均检测到两种序列变异体。两种缺陷型变异黄色标注缺失 1 个 G4S 重复单元红色标注缺失 2 个 G4S 重复单元的突变比例在基因组水平图 5b至转录组 cDNA 水平图 5c呈逐步上升趋势。综上三类样本各 20 个单克隆的测序结果揭示了明确规律质粒载体层面未检测到任何连接子截短但将该质粒转染哺乳动物细胞HEK293、CHO后约 15% 的转染细胞出现非预期的 G4S 连接子截短。当整合至基因组的mAb901目的基因转录为 RNA 时截短变异比例进一步升高至 25%。该现象可解释为短片段 G4S 连接子的基因转录翻译负担更低表达优势更强在细胞分裂与单克隆筛选过程中截短型变异体的丰度会逐步累积。mAb901 中 G4S 连接子的优化探究为解决 mAb901 的连接子截短问题本研究系统评估密码子优化与G4S 连接子长度对截短效应的影响。密码子优化是抗体药物研发与蛋白表达的关键改造手段。优势密码子的合理使用可显著调控细胞内重组蛋白表达效率该结论已在大量研究中得到验证。图 6 为不同 G4S 序列的 RNA 二级结构折叠预测对应 DNA 序列、RNA 吉布斯自由能及局部 GC 含量详见表 1。将各组改造质粒分别转染至 HEK293 细胞与两种常用 CHO 细胞株Sigma-Merck CHOZN、赛默飞 CHOS各组连接子截短比例统计结果见表 2。G4S 连接子 RNA 折叠稳定性预测。图 6a 为5G4S 连接子 1 号密码子的 RNA 二级折叠结构图 6b 为5G4S 连接子 2 号密码子的 RNA 折叠结构图 6c 为5G4S 连接子 3 号密码子的 RNA 折叠结构图 6d 为 4G4S 连接子的 RNA 折叠结构图 6e 为 3G4S 连接子的 RNA 折叠结构。Sequence noSequencingRNA ΔGGC%5G4S linker Codon 1 (optimized for 293)GGAGGAGGAGGATCCGGAGGAGGAGGATCCGGAGGAGGAGGATCCGGAGGAGGAGGATCCGGAGGAGGAGGATCC−23.566.75G4S linker Codon 2 (optimized for CHO)GGAGGAGGAGGAAGCGGAGGAGGAGGCTCTGGCGGCGGCGGCTCAGGCGGCGGCGGCAGCGGCGGCGGCGGCTCT−25.4805G4S linker Codon 3 (optimized for CHO)GGTGGAGGCGGTTCAGGCGGAGGTGGCTCTGGCGGTGGCGGATCGGGAGGAGGCGGCAGCGGTGGTGGTGGTGCT−19.173.34G4S linkerGGAGGAGGAGGATCCGGAGGAGGAGGATCCGGAGGAGGAGGATCCGGAGGAGGAGGATCC−20.166.73G4S linkerGGAGGAGGAGGATCCGGAGGAGGAGGATCCGGAGGAGGAGGATCC−11.966.7本研究委托金斯瑞生物科技对3 种不同密码子优化版本的(G4S)5​连接子进行序列优化(G4S)4​与(G4S)3​连接子均由 **1 号密码子版本的(G4S)5​** 序列直接截短衍生而来。各预测 RNA 二级结构旁均标注了对应的折叠吉布斯自由能ΔG。所有实验均重复三次结果趋势一致。在 mAb901 中将(G4S)5​连接子替换为相同密码子背景的(G4S)4​或(G4S)3​后连接子截短现象完全消失表 2。研究发现即便短链连接子仍具有较高 GC 含量、且 RNA 吉布斯自由能更低缩短 G4S 串联重复长度仍可彻底杜绝截短变异。针对(G4S)5​的密码子优化与 GC 含量调控无法完全消除–630 Da 与–1260 Da 缺陷变异体仅能将截短比例由 5%~10% 降至 1%~5%。密码子优化虽可提升上游 RNA 二级结构的预测稳定性但并不能有效防止连接子截短。与之相反直接缩短 G4S 连接子串联长度可从根本上解决截短问题样品中未再检出任何–630 Da、–1260 Da 低分子量变异体。该结果证实低重复数的短链(G4S)n​连接子不易发生序列截短。短链 G4S 连接子版 mAb901 的功能表征在蛋白表达层面携带短链(G4S)n​连接子的稳定细胞株整体表达产量更高。已有研究表明上游 RNA 二级结构的稳定性与蛋白表达量呈负相关。为验证该结论本研究改造不同 G4S 连接子长度并构建多组稳定细胞株。产量评估结果显示尽管(G4S)5​连接子拥有更优的吉布斯自由能、上游 RNA 二级结构稳定性更强但 **(G4S)3​、(G4S)4​短链连接子更利于重组蛋白表达且可完全避免截短突变 **图 7各组细胞生长状态无显著差异图 7c。不同 G4S 连接子长度下 mAb901 的细胞培养产量与细胞生长情况。图 7a 为不同 G4S 连接子长度细胞株在补料分批培养中的总表达产量组间差异采用t检验进行统计学分析***p0.001代表差异极显著。图 7b 为不同细胞株补料分批培养中的细胞比生产速率QP。图 7c、7d 分别展示培养过程中的细胞密度与细胞直径变化。缩短 G4S 连接子可完全消除 mAb901 的连接子截短问题但对于双特异性抗体药物而言改造后不能影响产品药效与纯度。本研究分别检测 CHOZN 与 CHOS 细胞表达样本CHOS 数据未展示结果显示体积排阻色谱SECHPLC纯度、还原型毛细管电泳CESDS纯度以及抗原 A 的 ELISA 结合活性各组均无明显差异图 8、图 9、图 10。5×、4×、3× G4S 连接子样本的 SECHPLC 纯度分别为 97.0%、97.4%、97.1%整体纯度优良且各组主峰形态与保留时间均无显著区别。不同 G4S 连接子长度 mAb901 的体积排阻高效液相色谱SECHPLC纯度检测。本图两部分坐标轴标注完全一致。不同 G4S 连接子长度下 mAb901 的还原型 CESDS 纯度不同 G4S 连接子长度下 mAb901 的 ELISA 结合亲和力本研究对抗原 A 重链与抗原 B 单链抗体scFv进行还原型 CESDS 分析。由于抗原 B 含有 3 个 N - 糖基化位点所有样品均预期出现两个主峰。三组样品的还原型 CESDS 纯度无明显差异纯度分别为 96.3%、96.8% 与 96.0%。改造 G4S 连接子时核心顾虑之一为结合亲和力下降部分靶点也可能出现亲和力上升。ELISA 结合活性检测结果表明各组间结合能力无显著差异*p0.1。上述抗体分子的体内生物学活性有待后续动物实验进一步验证。结论具备双重或多重靶向功能的改造型融合蛋白如 IgG 融合分子、双特异性抗体已成为靶向免疫治疗领域的研究热点。G4S 连接子凭借高柔性、结构稳定、可串联多结构域与多靶向片段、抗蛋白酶降解及低免疫原性等优势被普遍视作通用型柔性连接元件。但目前针对G4S 连接子长度的系统性研究与探讨仍较为匮乏。在部分双特异性抗体研发中(G4S)n​连接子引发的低比例序列截短变异会破坏批次间产品一致性增加质量控制难度。本研究证实在哺乳动物细胞表达体系中携带5 串联 G4Sn5的融合蛋白易产生连接子截短变异密码子使用偏好与表达宿主细胞类型会显著影响截短突变发生率。若要彻底根除 G4S 连接子截短问题仍需从分子结构设计层面开展深入优化。缩短连接子长度采用(G4S)4​、(G4S)3​等短链 G4S 元件还可提升抗体表达产量适用于工业化放大生产与降本研发。同时在合理范围内减少 G4S 重复单元数量不会损害产品纯度与抗原结合活性。综上研发中需综合平衡生物学活性、蛋白结构稳定性、变异体发生风险合理评估并选择最优 G4S 连接子长度从而提升抗体药物的表达效率、产品纯度、均一性与临床开发潜力。