途深智合

途深智合致力开发轻量、可控的人智能模型,降低生物医药领域中开发新合成生物产品的难度、周期和成本。 公司依托上海国家应用数学中心、上海交通大学自然科学研究院、重庆人工智能研究院和张江高等研究院人工智能生物医药中心,推动产学研一体化,促进实验室成果向工业应用的转化。 途深智合已经研发了针对酶蛋白改造的AI设计平台,并针对具体的应用场景,已经辅助生物和化学技术专家改造出最合适的蛋白质,如荧光蛋白的亮度提升。


business

核心技术

lgn


作为生物技术产业的核心“芯片”,酶在化工、制药、能源等领域承担着重要的生物催化角色。途深智合致力于开发先进的计算方法,基于蛋白质的序列语义信息、共进化信息、氨基酸的几何微环境、分子动力学等方面对酶的定向进化建立合适的人工智能计算模型,设计具有高活性、高选择性、高产率的人工酶分子,推动下游工业发展。

途深智合同样关注推动新型抗体药物(如新冠疫苗)、新一代免疫检测点调节药物、多功能抗体、G 蛋白偶联受体抗体、抗体偶联药物等大分子药物设计。高效、可靠的抗体设计是大分子药物设计中的核心产业技术,是基于计算的蛋白质设计的一个重要方向。在设计深度学习模型时,利用扩散模型、随机微分方程等数学方法,对抗原抗体的对接过程进行模拟,从而设计抗体序列、预测抗体结构。

AI一体化蛋白设计平台


lgn

研究成果



sesnet

ProteinEngine: Empower LLM with Domain Knowledge for Protein Engineering

ProteinEngine是一款融合蛋白工程领域专业知识的人机交互平台,它通过调用相关API无缝连接各种工具,为大语言模型赋予不同角色,实现任务委派、解析和结果传达,旨在增强蛋白质工程任务中的深度学习性能。该平台高度模块化、易扩展,为蛋白质设计提供强有力的AI加速。 现已有微信端部署,授权用户可以接入端口,方便和PE自然语言交流,PE为用户提供蛋白设计各方面的需求(折叠、逆折叠、全新序列设计、抗体抗原对接预测等)。

sesnet

GraDe-IF: Graph Denoising Diffusion for Inverse Protein Folding

GraDe-IF提供了一种基于生成式AI的全新序列生成AI模型,能产生生物学意义上的可靠新序列,并可折叠为序列相似度的指定结构。 GraDe-IF基于蛋白图去噪扩散模型,利用给定的蛋白质骨架引导氨基酸类型的扩散,编码氨基酸替换矩阵作为生物学先验知识,以生成给定蛋白质骨架结构的多样性蛋白质序列。 该方法集成了等变图神经网络,能生成高可靠性和准确性的序列,尤其在保守区域的恢复率高。

lgn

Lightweight Equivariant Graph Representation Learning for Protein Engineering (LGN)

NeurIPS 2022 Workshop on Machine Learning in Structral Biology

LGN是一种轻量级、可泛化的几何深度学习框架,用于研究蛋白质的多位点定向进化。它只需要先有方法的1%甚至更低的计算成本就可以达到相同甚至更好的预训练效果,从而允许用户针对具体的蛋白质对模型进行更加精细的调整,获得更好的蛋白质设计思路。

cyp

Entropic Contribution to Enhanced Thermal Stability in the Thermostable P450 CYP119

PNAS 2018

本文探索了嗜热细胞色素蛋白P450(一种普遍存在于细菌,动物及人体内的一类亚铁血红素蛋白)的稳定性机理,并发现嗜热细胞色素蛋白在自然折叠态具有较高的柔性,因此可以通过减小解折叠过程中熵的驱动力,来获得耐高温的能力。这一发现为耐热蛋白的理性设计提供了从熵出发的全新思路。

sesnet

SESNet: Sequence-structure Feature-integrated Deep Learning Method for Data-efficient Protein Engineering

Journal of Cheminformatics 2023

SESNet探索了一种有效的氨基酸微环境的编码方式,并在多点位突变(尤其是大于4个点位的高阶突变)上获得了很好的预测效果。除了利用蛋白质的序列信息和结构信息,研训练过程中还加入了同源序列的局部和全局进化背景,以及利用无监督学习对进行数据增强和模型预训练。

acmp

ACMP: Allen-Cahn Message Passing with Attractive and Repulsive Forces for Graph Neural Networks

ICLR 2023 (亮点文章)

ACMP来源于动态粒子系统,利用吸引-排斥机制对消息传递进行改造:聚合相似的特征和截然不同的特征,同时利用外部势能保证系统的稳定性。这一方法可以避免图表示学习中常见的过度平滑问题,在以生物分子为代表的异构图上可以有效提取关键特征、分离干扰信息。

ufg

How Framelets Enhance Graph Neural Networks

ICML 2021 (亮点文章)

该研究工作设计了一种用途广泛的谱图神经网络结构,它可以利用低通和高通滤波器,对输入的图信号进行多分辨率、多尺度分离,从而得到全局特征和局部信息表示。其中前者有助于捕获图信号经过去噪后的整体特征,后者在某些应用中则是定义图形的关键,例如抗体蛋白的 CDR 区域、酶工程的关键突变点位、医学图像的肿瘤细胞等。

mpsn

Weisfeiler and Lehman Go Topological: Message Passing Simplicial Networks (MPSN)

ICML 2021 (亮点文章)

传统的图神经网络无法捕获存在于许多复杂的系统中的多层次交互关系。为了克服此限制,文章提出消息传递单纯复形网络 (MPSN),其借助用于区分非同构单纯复形的 Weisfeiler-Lehman (SWL) 着色,并证明 MPSN等价于SWL并不低于GNN的3-WL测试能力上限。在轨迹预测、大规模分子预测中MPSN表现出超越GNN的优秀性能。

cwn

Weisfeiler and Lehman Go Cellular: CW Networks (CWN)

NeurIPS 2021

图神经网络在处理远距离交互方面存在困难。这个问题可归因于计算图和输入图结构之间的强耦合。本文扩展了关于单纯复形的最近理论到正规细胞复形,其灵活地包含了单纯复形和图的丰富拓扑信息。这种推广提供了一组强大的图“提升”变换,每个变换导致唯一的分层消息传递过程(CWNs),其网络表达能力不低于3-WL测试,从而可以超过最好的GNN性能,并且有利于高阶拓扑信号建模以及节点距离压缩。特别是在分子图预测中取得了超越GNN的优异结果。

fmp

Framelet Message Passing (FMP)

JMLR 2022 ; ICCHA 2022

FMP是一种基于消息传递网络和多尺度小波框架的图神经网络,用以捕获图上非线形、长距离的节点关系。这一设计可以用更低的计算成本,在节点信息传递时集成多跳邻居节点的特征表示,从而避免在传播中使用非衰减狄利克雷能量的过度平滑。同时,该方法还可以对图节点进行重连,从而避免过度挤压带来的图表示学习瓶颈。

合伙人


yuguang
王宇光

创始人

上海交通大学自然科学研究院、数学科学学院、计算机科学系、 张江高等研究院副教授/博导
上海国家应用数学中心研究员
新南威尔士大学兼职讲师、数学博士
前马克斯普朗克研究所研究科学家
图神经网络、几何深度学习、蛋白设计方向

yiqing
沈逸卿

联合创始人

约翰斯·霍普金斯大学研究助理
某AI教育公司合伙人、产品运营负责人
生物医学、人工智能方向

yapeng
于亚澎

合伙人

清华大学MBA
前新浪集团投资总监
美股上市公司董事长助理


科学顾问


shi
金石院士

创始顾问科学家

欧洲人文和自然科学院院士
欧洲科学院院士
上海交通大学自然科学研究院院长
上海国家应用数学中心联席主任
前美国威斯康星大学(麦迪逊)数学系主任、
Vilas 杰出成就教授、上海交通大学数学系主任
研究方向:多尺度方程、动力学方程、图神经网络算法基础

pietro
Pietro Liò 院士

资深顾问科学家

欧洲人文和自然科学院院士
剑桥大学计算生物学、人工智能教授
欧洲学习与智能系统实验室会士
剑桥医学人工智能中心教授
研究方向:图神经网络建模、生物信息、医学人工智能
图注意力机制网络主要发明人

pietro
肖晗

顾问科学家

上海交通大学生科院研究员
美国伊利诺伊大学博士后
中国科学院微生物学博士
上海市生物工程学会合成生物学专业委员会委员
中国医药生物技术协会合成生物技术分会委员
研究方向:合成生物学、细胞工厂

合作伙伴


sponsor