在生物信息采集技术、人工智能技术、生命科学学科高速发展下,行业竞争不断加剧,如何进行数字化转型突破产业瓶颈,实现高质量发展,成为生命科学行业需要思考的问题。
北京百奥利盟软件技术有限公司成立于2012年,经过十余年的潜心钻研与实践耕耘,百奥利盟已成为生命科学信息化行业的国际化领军企业,是一家提供生命科学数字化解决方案(生产工艺标准化、质量控制、数据追溯分析、自动化等信息化解决方案)的高新技术企业。
百奥利盟的故事,全球300多家生命科学机构应用实践落地
北京百奥利盟的故事的起点要追溯到2010年,当时,“精准医疗”这个概念在中国刚刚出现,已经有多年信息化、数字化系统研发经验的倪毅,深刻的认识到数字化已经不可避免地改变着生命科学领域的格局。倪毅在中国生物体系熏陶下成长,并拥有计算机科学和人工智能专业背景,他将自己的数字化经验投入到了生命科学领域,于2012年成立北京百奥利盟软件技术有限公司,来自IBM GBS(全球咨询服务中心)的咨询顾问朱丽玮也加入进来,使百奥利盟的产品研发如虎添翼。
“在当时,我们就确定了百奥利盟的目标和宗旨是为全球精准医疗和创新生物药行业提供全程数字化解决方案,做全球创新生物药企上市数字化加速器”,倪毅介绍说。2012年他们推出了百奥利盟Bio-LIMS®V1.0产品,覆盖了湿实验+干实验全流程数字化,当年获得了北京亦庄生物医药园众多新药研发企业和精准医疗公司的认可。
随着时间的推移,百奥利盟开始涉足细胞与基因治疗数字化系统的领域,Bio-CELL©系统是针对细胞和基因治疗一体化追溯的系统,不仅包括细胞的COI(身份链),COC(监管链),也包括了生产和质控的数据追溯。百奥利盟也进入了创新生物药研发领域,Bio-Research©是专门针对生物药研发特点,引入AI功能的研发实验室数字化系统,可以忠实且快速的记录科学家们一闪念的设计,解决技术传承、知识传递问题。
针对大量处于临床的阶段的生物药企业工艺升级快、工艺种类多,且急需柔性生产且合规可追溯的特点,百奥利盟也推出了既不同于研发,又能平滑转产的Bio-Vaccine©临床生产数据化系统。针对创新生物药的科研到生产的全生命周期过程,倪毅带领百奥利盟团队不断推进新的数字化解决方案。
同时,倪毅也在为百奥利盟的出海做准备,并于2016年推出了国际版数字化系统。随后百奥利盟积极开拓国际市场,先后在2016年和2020年布局了美国和中东。这些国际化举措让他们的系统得到国际最佳实践和国际认可,使他们能够为反哺国内的生命科学企业,提供数字化解决方案和应用实践落地。
在整体过程中,百奥利盟一直拥抱云计算、AI、IoT等新技术,助力生命科学企业数字化转型,目前已为全球300多家生命科学机构提供数字化解决方案。
质量、效率、合规,生命科学行业数字化的共同诉求
生命科学行业有一个共同的诉求,那就是如何在质量、效率和合规性之间取得平衡,以确保生产安全、稳定并实现行业的持续发展。在这个高度合规的特殊行业里,百奥利盟的数字化系统需要符合中国和国际各类生命科学法律法规要求,满足FDA/NMPA的各项认证要求,并需要采用多语言设计。
在提高实验室管理水平的同时,百奥利盟还引入了人工智能、GxP数字化、物联网、云技术和VR/AR等新技术,实现了智慧实验室和智能制造,为生物医药企业数字化转型提供了帮助和支持,赋予生物药创新以更大的活力。
随着国家在十四规划中强调工业4.0的重要性,数字化转型成为生命科学企业的共同目标。而端到端集成则是工业4.0战略的一个重要核心内容,它涵盖了生物药临床前研发、IND、NDA、上市生产和销售等全生命周期的数字化管理,因此对数字化系统及IT基础设施提出了更高的要求。百奥利盟的数字化系统适用于柔性生产,支持生物药企业灵活的产品组合,既可以支持大批量生产,也可以提供小批量个性化生产服务。
倪毅认为,特别是对于CDMO这种业务特别复杂的企业,数字化系统更能够发挥出它的优势。CDMO企业要如何为广大药厂等客户提供可信、合规的产品数据,这是一个非常大的挑战。在这种情况下,百奥利盟为创新生物药企业提供pre-IND、IND及上市阶段生物药符合GMP标准的数字化系统,提供从生产与检测工艺开发、质量研究至产品上市后生产的数字化解决方案,帮助CDMO企业成功地应对各种挑战,确保产品质量和可信性。“特别针对创新的生物药企业,他们更需要小、快、灵,也就是规模小而专,实施快速,配置灵活的数字化系统”,倪毅介绍说。
与阿里云携手开拓行业新选择实现系统高性能计算和数据加密双管齐下
生命科学行业是一个特殊的行业,法规要求比较严格,所以对新IT技术的引进相对保守。倪毅说道:“近年来,我们看到了云计算在国际上的趋势,大量研发类ELN系统及实验室信息管理系统部署在云端,以SaaS的形式提供给客户订阅使用,同时,基因测序技术的成熟,测序产生的大数据量,生信分析时的高性能需求也都需要依赖于云计算。”
随着“云”近几年在行业的快速普及,倪毅思索如何在合规的前提下更广泛的使用云。在使用ECS(云服务器)、RDS(关系型数据库服务)等阿里云服务后,倪毅又看到,阿里云提供的计算巢和云市场使很多系统的SaaS化成为可能。于是,百奥利盟数字化系统和计算巢联合,构建云上精准医疗与创新生物药信息化管理平台,量身为初创型分子诊断企业和生物科研团队、创新生物药研发与生产、细胞基因治疗和肿瘤个性化疫苗研发生产型企业客户解决方案。
精准医疗和创新生物药数字化解决方案
除此之外,针对生物药企客户从研发到生产对数据的安全性保密性要求较高,对云存有顾虑,难以运用的情况,倪毅看到了阿里云云盒这个新选择,即把“云”放到客户本地。针对GMP药企生产和检测计算机化系统的要求,百奥利盟基于阿里云云盒推出了面向生命科学行业的解决方案,既解决了客户对数据本地,资源独享的需求,也可以让客户体验云的极致弹性,灵活的优势。
同时,倪毅发现百奥利盟的一些上下游也在跟阿里云合作,看到了阿里云在生命科学行业的投入,计算巢上也接入多家生命科学ISV。为此,百奥利盟也加入了阿里云CRO联盟,“但现在云上的生命科学行业生态圈呈点状,尚未形成规模,我们也希望和阿里云一起助力其规模化、生态化,让各家ISV基于云,基于计算巢能产生新的化学反应。”。
未来趋势,AIGC技术在生命科学行业的应用
倪毅对AIGC在生命科学领域的应用非常看好,“我一直在和开发团队讲,未来AI不会取代人,但会AI的人会取代不会AI的人。以后只有会AI的软件工程师,没有只会编程的程序员”,倪毅透露,几月前百奥利盟的软件工程师就开始使用基于AIGC技术的代码辅助编程工具,已经显著提高了开发效率和软件质量。
除此之外,倪毅还强调了AIGC在生命科学客户服务方面的优势。他举了个例子:当处理关于通用行业的问题时,使用chatGPT、达摩院的M6大模型或其他AIGC模型是没有问题的,文字生成也比较准确。但当涉及到专业领域,比如肿瘤基因检测报告的解读,通用的GPT模型就无法做到专业和准确。因为通用模型所学习的数据都是公网数据,缺乏专业领域的数据和知识。
为了解决上述问题,倪毅认为,针对某一细分领域,需要建立相应的行业模型。比如针对肿瘤基因检测解读,需要建立肿瘤基因检测细分行业专业模型。“首先,我们需要和生命科学客户一起,收集大量的数据和文献资料,包括疾病信息、药物研发、临床试验、制药生产等方面的数据和文献。这些资料将成为细分行业领域的大数据,为下一步的建模打下基础。然后,进行数据预处理工作,确保数据的质量,因为数据的质量直接关系到模型的准确性和实用性。
接下来,将预处理好的数据输入到AIGC通用大模型中,比如达摩院的M6大模型进行训练,让模型学习生命科学领域的知识和规律。接着,对训练得到的模型进行人工标注、打分和优化,不断地对模型进行完善和优化,以检验模型的可靠性和准确性。最后,将训练好的模型应用到实际问题中”。
从通用到细分行业AIGC模型
倪毅介绍,上述过程可以理解为一个大学生,通过学习成为某一细分领域的专家,但不必成为所有行业的专家。原因是,首先针对某一企业,并不需要精通所有细分领域的模型,其次可以有效的降低训练成本,使细分的行业模型成为可能。
倪毅认为,针对精准医疗,AIGC赋能可以提升生物信息分析效率,带来成本进一步下降。并且有望提升分析解读准确率。在药物发现阶段,AIGC可以在新靶点识别、大分子药物的结构预测与筛选中起到很大作用。在药物研发阶段,AIGC可以成为研发助手,承担标准化的研究工作,整合研发数据进行分析,并在提供预测和建议参考。在生产阶段,AIGC可以预测预警,提供排程建议。
在这些过程中,所有AIGC产生的提示,预测,预警,应有人工复核及电子签名,并有审计追溯和权限控制,确保符合生命科学行业的法规要求,