logo
更多功能
个人中心

07/19

2024

减重15%-20%!新型GLP-1减肥药不仅效果更佳,还能抑制食欲

导读每个被肥胖困扰的人都想拥有健康的身材,但如何科学、有效、健康的减肥是一件令人苦恼的事。据预测,到2035年,全球超过一半的成年人将面临肥胖问题。因此,开发有效的肥胖治疗药物不仅能够帮助患者减轻体重,还能带来广泛的健康益处,如心血管保护和抗炎作用。最近,一项在《自然》杂志上发表的新研究为我们带来了惊喜,一种全新的“特洛伊疗法”(Trojan Therapeutics)策略和机制有望在以往的GLP-1/GIP类减肥药物上发挥双重作用机制,根据该研究所推出的候选药物OP-216药物,或为减肥药物的研发带来新的曙光。齐 萱 | 撰文01新研究让药物更精确地靶向目标细胞5月15日,一篇发表在《自然》杂志上的最新研究引发了广泛关注。这项研究展示了一种全新的药物候选物,它采用了“特洛伊疗法”(Trojan Therapeutics)的策略,将一个小分子巧妙地嵌入到一个模拟肠道激素的肽中。这种策略的目的是实现对控制食欲的脑细胞的双重打击,从而更有效地减轻体重。多伦多西奈山医院的内分泌学家Daniel Drucker对这项研究给予了高度评价,他表示,这种新策略通过将激素模拟物与其他药物融合,能进一步增强减肥效果,并且有可能降低副作用的风险。这是因为药物能够更精确地靶向目标细胞,从而减少对非目标细胞的影响。目前,市场上的畅销减肥药物,如司美格鲁肽(Wegovy)和替尔泊肽(Zepbound),是通过模拟肠道激素如GLP-1(胰高血糖素样肽-1)和GIP(葡萄糖依赖性促胰岛素多肽)来发挥作用的。这些药物通过与大脑中控制饥饿感的神经元受体结合,帮助人们减轻体重。然而,这项新研究提出的策略则更进一步,通过双重作用机制,实现更为显著的减肥效果。很显然,肥胖问题已成为全球性的健康挑战,不仅让个人形象大打折扣,穿衣选择范围受限,而且与一系列严重的健康问题息息相关,如心血管疾病、糖尿病、高血压等,影响人体健康的方方面面。 02创新药物策略助力减肥更便捷“特洛伊疗法”创新药物策略巧妙地将目标锁定在GLP-1受体和NMDA受体上,旨在通过双重作用机制实现减肥效果。其双重作用机制如下:药物通过模拟肠道激素来影响食欲;嵌入的小分子则能够同时影响其他与食欲相关的生理途径。 GLP-1受体是控制食欲的重要靶点,而NMDA受体则是大脑细胞中一种与肥胖有关的离子通道。这一发现可以追溯到2015年,当时科学家们发现NMDA受体与肥胖之间存在关联。然而,开发针对NMDA受体的药物一直面临着巨大的挑战,因为这类药物(包括派对药物和抗抑郁药凯他敏)往往伴随着严重的副作用。图片来自X.com 然而,哥本哈根大学的代谢专家Christoffer Clemmensen却看到了前进的道路。他提出,通过将一个NMDA受体阻滞剂与一个仅作用于调节食欲的神经元的肠道激素模拟物结合,或许可以绕过安全风险。这一策略的核心在于,通过模拟肠道激素来靶向食欲控制神经元,并同时利用NMDA受体阻滞剂来阻断该受体,从而实现双重作用。为了将这一策略付诸实践,Clemmensen及其团队将一种类似于GLP-1激素的肽与一种名为Dizocilpine(也称为MK-801)的小分子结合。Dizocilpine最初是由位于新泽西州拉威的制药公司默克的研究人员于上世纪80年代发现的,但随后被放弃。然而,Clemmensen和他的团队发现,在小鼠和大鼠中,这种结合了Dizocilpine的肽能够被大脑中喜好GLP-1的神经元吸收,并释放Dizocilpine来阻断NMDA受体。“这是一种非常创新的减肥优化方法。”科罗拉多大学奥罗拉分校的生理学家Darleen Sandoval表示。她进一步指出,“这项研究的重大意义在于,我们在治疗肥胖方面针对大脑目标的能力已经取得了多大的进步。”03OP-216药物正走向临床目前,Clemmensen与合作伙伴共同创立了一家公司——Ousia Pharma,致力于将一款名为OP-216的新药候选物推向临床试验。该药物不仅模仿了GLP-1激素的作用,还额外模拟了GIP激素,为减肥带来了更为惊喜的便捷性和安全性。OP-216的研发背景正是建立在当前肥胖药物成功的基础上。尽管现有的肥胖药物已经取得了一定的疗效,但它们的成功也为下一代治疗药物设定了更高的标准。哥本哈根大学的肥胖遗传学家Ruth Loos指出,尽管一些患者在使用现有药物后能够减轻体重,但并非所有人都能受益。此外,肠道激素模拟物需要持续服用才能产生效果,这也给治疗带来了不便。Loos教授并没有直接参与OP-216的研发,但她对这项创新表示了高度的期待。她认为,OP-216的研发成功将鼓励更多的科学家探索治疗肥胖的创新方法。当前,OP-216等新型肥胖药物正处于临床试验阶段,旨在验证其安全性和有效性。相信在不久的将来,这些药物为肥胖人员提供更多的服务和价值。参考资料 Experimental obesity drug packs double punch to reduce weighthttps://www.nature.com/articles/d41586-024-01433-6

54

07/09

2024

重大科研突破!复旦大学樊嘉院士团队为癌症免疫治疗提供新思路

复旦大学附属中山医院樊嘉时至今日,癌症仍是人类健康的“头号杀手”,如何实施精准有效的治疗,特别是减轻患者痛苦、延长患者生命,已成为全人类共同关注的重大课题。免疫治疗是癌症治疗的新希望。近日,复旦大学附属中山医院樊嘉院士、高强教授团队在《科学》(Science)和《细胞》(Cell)杂志上分别发表两项重要研究成果,深入剖析了肿瘤免疫微环境的复杂性和功能多样性,突破了既往“以T细胞为核心的免疫治疗”研究模式,为肿瘤免疫治疗的临床和转化研究开辟了新的方向。5月3日,复旦大学附属中山医院樊嘉院士、高强教授团队,联合中国科学院上海免疫与感染研究所与浙江大学基础医学院等合作单位,在《科学》(Science)杂志在线发表了题为《人类癌症中肿瘤浸润 B 细胞蓝图》(A blueprint for tumor-infiltrating B cells across human cancers)的论文,系统性揭示了肿瘤微环境B细胞的表型功能异质性、动态分化以及表观调控机制。研究团队分析了肝癌、胆管癌、胆囊癌等多个癌种的临床样本数据发现,B细胞可以分为15个不同功能的亚群。其中,一类叫做DUSP4+非典型记忆B细胞的亚群引起了研究团队的注意。这类细胞通过滤泡外应答途径分化为浆细胞,能够分泌识别自身抗原的抗体,并抑制T细胞的功能,导致肿瘤微环境处于免疫抑制状态,不利于患者的预后和抗癌免疫治疗。这一发现为未来精准调控B细胞、鉴定新的免疫治疗靶点以及开发新的免疫联合治疗方案提供了重要线索。此外,该团队今年2月在《细胞》(Cell)杂志上发表的《中性粒细胞分析阐明抗肿瘤抗原呈递功效》(Neutrophil profiling illuminates anti-tumor antigen-presenting potency)论文中,进一步系统性揭示了中性粒细胞的抗肿瘤功能,探索了利用中性粒细胞的抗原提呈特征来增敏肿瘤免疫治疗的价值和临床意义。研究者同样利用来自肝癌、胆管癌、胆囊癌等多个癌种患者的样本来源的数据,发现一种特殊的中性粒细胞亚群(HLA-DR+CD74+),与患者的临床预后正相关,并能增强T细胞的抗原特异反应且促进形成有利于免疫治疗的"热肿瘤"微环境。研究团队还发现,饮食中富含的亮氨酸对中性粒细胞的抗原提呈功能有促进作用;富含亮氨酸的饮食或输注HLA-DR+CD74+亚群的中性粒细胞都能够增强PD-1单抗的肿瘤免疫治疗疗效。这提示我们未来可以通过饮食干预等方式来增强患者自身的抗肿瘤免疫力,提高免疫治疗疗效。这项研究为利用中性粒细胞抗原提呈来增敏免疫治疗提供了新的思路,有望推动肿瘤免疫治疗的进一步发展。当前,肿瘤治疗已进入多学科联合诊疗的“精准医疗”时代,以“PD-1/PD-L1单抗”为代表的免疫治疗作为一种新兴的肿瘤治疗方法已被广泛使用。免疫治疗是依靠患者自身免疫机能识别并杀灭癌细胞,不仅能提高患者的生存,而且避免了传统化疗、放疗的副作用,改善了患者的生活质量。然而,由于个体的差异性和治疗的局限性,免疫治疗并非只有PD-1/PD-L1一条路,需要个体化的新策略和联合治疗方案。中山医院肝肿瘤外科高强教授指出,B细胞是适应性免疫的关键组成部分,在体液免疫应答和抗体产生方面发挥着至关重要的作用,但由于相关研究不足,其在临床应用上的进一步拓展受到了限制。与此同时,中性粒细胞作为人体天然免疫的第一道防线,广泛参与人体免疫的各个重要环节。但鉴于其半衰期短且细胞脆弱,目前鲜有相关大规模系统研究,这使得中性粒细胞成为肿瘤免疫治疗中的争议焦点。此次研究的重要发现为不仅为肿瘤免疫治疗提供了新的理论支撑,更为提高免疫治疗的精准度和有效性、开发更有效的治疗方法提供了关键线索。注:本文来自中山医院。原文链接《科学》(Science)https://doi.org/10.1126/science.adj4857《细胞》(Cell)https://doi.org/10.1016/j.cell.2024.02.005

51

07/02

2024

浙江大学朱永群与合作者最新Nature论文:细菌放“毒”,绵里藏针

夏天到了,清洗空调是必要的一步,因为空调是许多种病原菌喜欢的藏匿点,嗜肺军团菌就是其中一种。最近,科学家在嗜肺军团菌体内发现了一种全新的细菌“毒素”——效应蛋白LnaB。它一方面主动清理宿主细胞内的有害分子,帮助宿主细胞维持正常生理过程;另一方面抑制宿主细胞对细菌的免疫防御反应,避免嗜肺军团菌被宿主细胞攻击。5月 22日,浙江大学生命科学研究院/动物科学学院朱永群课题组,生命科学学院周艳课题组和北京大学刘小云课题组联合在Nature上发表了这项发现,论文标题为Legionella effector LnaB is a phosphoryl-AMPylase that impairs phosphosignalling。“细菌用同一种效应蛋白来承担两个不同的角色和功能,这是很少见的,”朱永群说,“这种‘绵里藏针’的策略让细菌赢得了和宿主细胞短暂共存的时间,以利于其生存和繁殖。”图:LnaB工作机制的示意图。01神秘“武器”LnaB这项研究的一个关键名词是“蛋白质翻译后修饰”,这是生物领域的一个常用词,通常是指在细胞内蛋白质的侧链上被添加上或改变了一个小小的化学基团的过程。至今,人们已经发现了数百种蛋白质翻译后修饰方式,比如泛素化、乙酰化、甲基化等。如果说蛋白质是细胞内执行具体功能的“机器”,那么这些机器能发挥功能往往与它们拥有蛋白质翻译后修饰的种类密切相关。朱永群教授课题组长期从事病原菌和宿主相互作用机制的研究,探索新型蛋白翻译后修饰,是他们本次揭开细菌致病 “秘密武器”的切入点。嗜肺军团菌是导致人类军团病的致病菌,它会感染进入肺巨噬细胞,在宿主细胞内形成独特的膜泡结构从而生存和繁殖。2016年,全世界多个实验室先后发现了嗜肺军团菌能通过非典型泛素化过程促进嗜肺军团菌膜泡的成熟。“这个过程中有一个副产物——磷酸核糖化泛素分子,”朱永群说,“我们在2017年发现这个副产物对人细胞具有毒性。但是,嗜肺军团菌是一种入侵到人细胞内的细菌,在人细胞内大量繁殖”。课题组猜测,嗜肺军团菌可能存在特殊的效应蛋白,消除这个毒性泛素分子、或者对泛素进行其他类型修饰,才能有利于该菌与宿主细胞短期共存,以保证其生存和繁殖。通过一系列体外和体内筛选体系,课题组最终将目光锁定在效应蛋白LnaB。它是这项研究的主角,为科学家了解细菌致病机制打开了一个全新的视野。02既能“解毒”,也能“放毒”课题组发现,LnaB能帮宿主细胞“解毒”,这个过程是通过一种非常特殊的修饰过程实现的。朱永群介绍,LnaB是一个独特的腺苷酸化酶(AMPylase),它对具有细胞毒性的磷酸核糖化泛素进行单磷酸腺苷酸化修饰,生成ADP-核糖基化泛素,然后再由效应蛋白MavL水解成为无毒、天然的泛素分子。这个由LnaB和MavL催化形成的级联反应,实现了对嗜肺军团菌的非经典泛素化过程的逆转,从而保护了宿主细胞正常生理过程至关重要的经典泛素化通路。“我们发现的这类靶向磷酰基的腺苷酸化修饰,突破了腺苷酸化只发生在蛋白质氨基酸残基上的认知。”朱永群说。另一方面,LnaB还能抑制细胞的免疫反应,破坏宿主细胞的免疫力。朱永群指出,现在感染过程中,LnaB对宿主细胞内至关重要的Src家族激酶进行蛋白质修饰,产生一个全新的“二磷酸腺苷酸化修饰(ADPylation)”,突破了蛋白质上磷酸基团是终端化的、在细胞内不可以被进一步共价修饰的概念。激酶是一类具有重要生物学功能的信号转导分子。被LnaB作用后的Src家族激酶丧失了活性,不能开启下游磷酸化信号转导,从而抑制了宿主的免疫信号通路。“LnaB也是迄今为止唯一鉴定出的可以直接修饰Src家族激酶活化环上磷酸化酪氨酸残基的细菌毒力因子。”周艳说。一边“解毒”,一边“放毒”,同一个效应蛋白完成两个角色,这种“绵里藏针”的致病策略让研究团队感到惊讶。通过同源搜索,他们鉴定出了162个LnaB同源蛋白,它们广泛分布于20多个不同菌属中,说明这类策略可能普遍存在于病原菌于宿主互作中。图:LnaB家族磷酸腺苷酸化酶广泛分布于20多种病原菌属中、并具有独特催化基序和结构特征这项研究不但增加了我们对于细菌致病机制的理解,为我们应对疾病挑战提供了新的启示。朱永群认为,由于Src家族激酶在人类多种疾病中发挥重要作用,对LnaB的独特活性进行开发,对相关疾病治疗具有潜在的应用价值。进一步研究LnaB家族效应蛋白的功能,也为病原菌效应蛋白研究开辟了新方向。博士研究生王婷、硕士生宋晓楠和博士后谭加兴为本文的共同第一作者,朱永群教授、周艳研究员和刘小云研究员为本文共同通讯作者,参与研究的还有博士生冼伟、周星彤、虞铭汝、王小飞、徐艳、吴婷、苑轲轲、冉宇和杨兵教授、范高峰教授。该研究获得了国家基金委、科技部重点研发专项、中组部青年拔尖人才等资助。 原文连接https://www.nature.com/articles/s41586-024-07573-z注:本文来自浙江大学学术委员会。

53

06/27

2024

三位异种器官接受者最终死亡,猪器官还适合移植人体吗?

导读随着人口老龄化,等待器官移植的患者名单越来越长,科学家开始探索一种前所未有的解决方案——异种移植。近日,器官移植领域迎来一个不大好的消息,世界首位猪肾移植患者去世,于手术近两个月后死亡。此前两次猪心脏移植手术患者也在手术后不久生命走向终点。这似乎意味着猪器官移植“并没有从灵长类研究中预测到的那么大的成功”。林 岩 | 编译01猪器官移植困难重重,但“不是一个无法解决的问题”上周,首位接受猪肾移植的活人离世,距离他接受移植手术不到两个月的时间——这比他的医生预期的要早。但这一时间点与之前接受猪心脏移植的两位患者的情况相吻合,他们也在移植后大约两个月内离世。纽约大学(NYU)的移植外科医生罗伯特·蒙哥马利表示,这三位受体的相对较短的存活时间表明,这些开创性的跨物种移植“并没有从灵长类研究中预测到的那么大的成功”。猪肾移植患者理查德·斯雷曼( Richard Slayman )和他的伴侣以及医生坐在一起但这三例手术为那些绝望中已无其他选择的重病患者带来了希望。研究人员表示,从首次将猪器官移植到人类身上,他们在多个方面获得了宝贵的经验,包括:尽管猪和人类的器官在结构和功能上有许多相似之处,但它们在免疫反应方面存在显著差异。这意味着受体在接受猪器官后,需要接受大量的免疫抑制药物来防止排异反应。然而,这些药物可能带来一系列副作用,如感染、癌症等。因此,科学家需要寻找更精确、更有效的免疫抑制方法。 猪器官在移植前必须经过严格的测试和筛选。这包括检查器官是否携带可能引发人类疾病的病毒、细菌或其他病原体。此外,科学家还需要评估器官的功能状态、存活能力以及与受体之间的兼容性。这些测试不仅耗时耗力,而且成本高昂。因此,降低测试成本和提高测试效率成为当前研究的重点之一。异种移植的成功不仅仅取决于手术和药物治疗,还需要跨学科的合作和创新。如基因编辑技术帮助科学家们修改猪的基因,使其器官更适合人类受体。同时,免疫学、微生物学、病理学等领域的专家也需要共同努力,以应对异种移植带来的各种挑战。尽管目前异种移植还面临许多挑战和困难,但“这不是一个无法解决的问题,”纽约大学移植外科医生Robert Montgomery表示,“我对我们目前取得的进展感到鼓舞。”02异种移植为生命带来了新的可能每年有成千上万的人因为等不到合适的人类器官而失去生命。异种移植,即利用其他物种的器官为人类进行移植,早已成为外科医生梦寐以求的解决方案。在众多可能的供体物种中,研究人员将目光投向了猪,这不仅因为猪的器官大小、解剖结构与人类相近,更因为猪作为家畜,其繁殖速度快、数量众多,能够提供源源不断的器官来源。在进行猪器官移植人体前,科学家在非人类灵长类动物身上已做大量试验,数据令人振奋。一项发表于2023年的研究报告显示,五只猴子在接受移植的猪肾后,均存活超过了一年。这一突破性的进展为异种移植在人类身上的应用提供了强有力的支持。2022年,人类历史上首次异种移植手术成功实施。57岁的戴维·贝内特成为了第一个接受猪心脏移植的活人,并在手术后存活了60天。随后,2023年劳伦斯·福塞特也接受了猪心脏移植,并存活了40天。此次,全球首例猪肾移植患者也活了近2个月。 尽管还存在诸多有待解决的问题,但相信异种移植将成为解决人类器官短缺问题的关键。03异种移植所面临的伦理问题目前,所有针对活人的异种移植手术都获得了美国食品药品监督管理局(FDA)的“同情使用”批准,这一批准仅在患者生命垂危且没有其他治疗手段可用的情况下才会授予。然而,这些在特殊情况下接受治疗的患者,其健康状况往往远差于等待移植名单上的普通人,这使得判断不利结果是否由手术本身还是患者原本的健康状况所导致变得异常困难。“正是这种不确定性,使得一些研究人员呼吁FDA关注这种试验。通过系统的评估,不仅可以更准确地判断异种移植的效果,还能为未来的治疗提供更为坚实的科学依据。”马里兰大学医学院的外科医生Mohiuddin博士表示,他是给第一位接受猪心脏移植患者贝内特做手术的医生。目前,研究人员并没有停止探索的步伐。他们正在尝试在移植前采取各种措施来最大限度地防止器官排斥。当然在解决技术难题的同时,也要确保这一技术始终在伦理和科学的双重轨道上稳步前行。此次事件意味着猪器官移植并非终点,而是重新进入了新的起点,未来或许能拯救更多的生命。参考资料 Pig-organ transplants: what three human recipients have taught scientistshttps://www.nature.com/articles/d41586-024-01453-2

51

06/27

2024

三位异种器官接受者最终死亡,猪器官还适合移植人体吗?

导读随着人口老龄化,等待器官移植的患者名单越来越长,科学家开始探索一种前所未有的解决方案——异种移植。近日,器官移植领域迎来一个不大好的消息,世界首位猪肾移植患者去世,于手术近两个月后死亡。此前两次猪心脏移植手术患者也在手术后不久生命走向终点。这似乎意味着猪器官移植“并没有从灵长类研究中预测到的那么大的成功”。林 岩 | 编译01猪器官移植困难重重,但“不是一个无法解决的问题”上周,首位接受猪肾移植的活人离世,距离他接受移植手术不到两个月的时间——这比他的医生预期的要早。但这一时间点与之前接受猪心脏移植的两位患者的情况相吻合,他们也在移植后大约两个月内离世。纽约大学(NYU)的移植外科医生罗伯特·蒙哥马利表示,这三位受体的相对较短的存活时间表明,这些开创性的跨物种移植“并没有从灵长类研究中预测到的那么大的成功”。猪肾移植患者理查德·斯雷曼( Richard Slayman )和他的伴侣以及医生坐在一起但这三例手术为那些绝望中已无其他选择的重病患者带来了希望。研究人员表示,从首次将猪器官移植到人类身上,他们在多个方面获得了宝贵的经验,包括:尽管猪和人类的器官在结构和功能上有许多相似之处,但它们在免疫反应方面存在显著差异。这意味着受体在接受猪器官后,需要接受大量的免疫抑制药物来防止排异反应。然而,这些药物可能带来一系列副作用,如感染、癌症等。因此,科学家需要寻找更精确、更有效的免疫抑制方法。 猪器官在移植前必须经过严格的测试和筛选。这包括检查器官是否携带可能引发人类疾病的病毒、细菌或其他病原体。此外,科学家还需要评估器官的功能状态、存活能力以及与受体之间的兼容性。这些测试不仅耗时耗力,而且成本高昂。因此,降低测试成本和提高测试效率成为当前研究的重点之一。异种移植的成功不仅仅取决于手术和药物治疗,还需要跨学科的合作和创新。如基因编辑技术帮助科学家们修改猪的基因,使其器官更适合人类受体。同时,免疫学、微生物学、病理学等领域的专家也需要共同努力,以应对异种移植带来的各种挑战。尽管目前异种移植还面临许多挑战和困难,但“这不是一个无法解决的问题,”纽约大学移植外科医生Robert Montgomery表示,“我对我们目前取得的进展感到鼓舞。”02异种移植为生命带来了新的可能每年有成千上万的人因为等不到合适的人类器官而失去生命。异种移植,即利用其他物种的器官为人类进行移植,早已成为外科医生梦寐以求的解决方案。在众多可能的供体物种中,研究人员将目光投向了猪,这不仅因为猪的器官大小、解剖结构与人类相近,更因为猪作为家畜,其繁殖速度快、数量众多,能够提供源源不断的器官来源。在进行猪器官移植人体前,科学家在非人类灵长类动物身上已做大量试验,数据令人振奋。一项发表于2023年的研究报告显示,五只猴子在接受移植的猪肾后,均存活超过了一年。这一突破性的进展为异种移植在人类身上的应用提供了强有力的支持。2022年,人类历史上首次异种移植手术成功实施。57岁的戴维·贝内特成为了第一个接受猪心脏移植的活人,并在手术后存活了60天。随后,2023年劳伦斯·福塞特也接受了猪心脏移植,并存活了40天。此次,全球首例猪肾移植患者也活了近2个月。 尽管还存在诸多有待解决的问题,但相信异种移植将成为解决人类器官短缺问题的关键。03异种移植所面临的伦理问题目前,所有针对活人的异种移植手术都获得了美国食品药品监督管理局(FDA)的“同情使用”批准,这一批准仅在患者生命垂危且没有其他治疗手段可用的情况下才会授予。然而,这些在特殊情况下接受治疗的患者,其健康状况往往远差于等待移植名单上的普通人,这使得判断不利结果是否由手术本身还是患者原本的健康状况所导致变得异常困难。“正是这种不确定性,使得一些研究人员呼吁FDA关注这种试验。通过系统的评估,不仅可以更准确地判断异种移植的效果,还能为未来的治疗提供更为坚实的科学依据。”马里兰大学医学院的外科医生Mohiuddin博士表示,他是给第一位接受猪心脏移植患者贝内特做手术的医生。目前,研究人员并没有停止探索的步伐。他们正在尝试在移植前采取各种措施来最大限度地防止器官排斥。当然在解决技术难题的同时,也要确保这一技术始终在伦理和科学的双重轨道上稳步前行。此次事件意味着猪器官移植并非终点,而是重新进入了新的起点,未来或许能拯救更多的生命。参考资料 Pig-organ transplants: what three human recipients have taught scientistshttps://www.nature.com/articles/d41586-024-01453-2

50

05/31

2024

“AI教母”李飞飞:她看见的世界和她改变的世界

导读李飞飞是人工智能领域最重要的科学家之一。她最重要的贡献,是创建了数据库ImageNet,有人工智能领域的从业者评论,“没有ImageNet,就没有现在的深度学习革命”,李飞飞也因此被誉为AI教母。她以女性细腻的笔调, 讲述她作为女儿、科学家、移民和人道主义中眼中的世界,讲述了一个亚裔移民成长为美国三院院士、斯坦福大学终身教授的故事。以下是她新出版的的新书《我看见的世界:李飞飞自传》(中文版已上市,由中信出版集团出版)的摘编,回顾了在AI寒冬的年代,她是怎样在一片反对声中找到她的北极星,创建人工智能领域早期最重要的数据库ImageNet的过程。华裔科学家李飞飞李飞飞 | 撰文01 “我听到的劝阻之声多得够我用一辈子”每当我与同事们讨论ImageNet的想法,我就越发感到孤独。虽然有西尔维奥(注:李飞飞的丈夫)的鼓励,但这么庞大的工程刚刚起步,就遭到了几乎所有人的一致反对,真是不祥之兆。我需要一群志同道合的伙伴,但现在似乎一个队友都找不到。最糟糕的是,不管我是否同意,我都无法否认他们批评的合理性。毫无疑问,在2006年,算法是计算机视觉的中心,而数据这个话题并不十分吸引人。数据生活在算法的阴影之下,仅仅被视为训练工具,就像成长中的孩子玩的玩具一样。我听到的劝阻之声已经多得够我用一辈子了(可能下辈子也够了),最后我终于遇到了第一位支持者。李凯教授是微处理器架构领域的领军人物。微处理器架构是一门将数百万纳米级晶体管排列到世界上最复杂的设备中的艺术,因此他比大多数人都更了解指数思维的力量。他相信我的方向是正确的。尽管我们都在计算机科学领域,但领域之间没有太多交集,所以他无法直接为我做出贡献,但他知道我们需要强大的计算能力才能启动。他毫不犹豫地为我们的研究捐赠了一套工作站。这正是我所需要的支持。不巧的是,他即将休长假,这缩短了我作为他的年轻同事的时间。不过,他的离开也不完全是坏事。他有一个极聪明的一年级研究生叫邓嘉,他要给邓嘉找个新导师。据李凯介绍,邓嘉是一个完美的合作者,他年轻有为,工程天赋出众,对新的挑战充满渴望。除了聪颖过人,我也注意到,邓嘉是计算机视觉领域的新人。他的背景与众不同,因此他不仅具备一般计算机视觉专业学生难以拥有的工程技能,同时还完全没有背负期望的包袱。这个项目不同于传统的研究项目,甚至可以说充满风险,与当时的领域潮流格格不入。对于这一切,邓嘉并不知情。于是,我们两人组成团队,开启了这个似乎需要成千上万甚至更多贡献者的项目。大多数同事对我的假设都不屑一顾。单从理论上讲,这一切确实说不通,但这是我人生中第一次感受到一种毋庸置疑的自信。无论需要多长时间,我确信我们正在做一件大事,一件也许具有历史意义的大事。我的新办公室位于普林斯顿大学的计算机科学大楼,虽然已经搬过来快四个月了,但地上依然堆满了半开的纸箱,墙壁上也空空如也。我靠在扶手椅背上,大声呼出一口气,转了转椅子。邓嘉坐在我对面的沙发上——这是我到目前为止为办公室添置的唯一家具。于是我们确定了一个目标,为每个物品类别搜集1000张不同的照片:1000张不同的小提琴照片、1000张不同的德国牧羊犬照片、1000张不同的抱枕照片,直到涵盖全部2.2万个类别,也就是一共需要大约2000万张图片。但即便是这个数字,也只是最终成品数据库的情况。我们可能需要从数亿张照片,甚至10亿张照片中筛选,才能达到目标。邓嘉面露疑色,“我从理论上能理解,但这个工作量也太大了,属于天文数字,可不是谷歌搜索几次就能完成的。”他说的当然没错,但是我们需要拥抱现实,而不是逃避现实。我们的目标是捕捉完整的现实世界。如果这个总数不能吓到我们,那才奇怪呢。“邓嘉,我们希望算法能够看到的一切事物都存在于这个世界的某个地方。在我们说话的这一刻,就有人在拍摄这所有的细节。现在人人都有翻盖手机,每个人的圣诞节礼物都是数码相机。想象一下,如果把所有这些照片都放在一起,我们会看到什么,我们会看到整个世界的缩影啊!那就是从世界一头到另一头的日常生活的全部。”“就算我们想办法组织好了图片,”他补充说,“这些图像本身也没有任何作用,对吧?它们需要先标注,才能用于模型训练,而且每一个标签都必须是准确的。”邓嘉暂停了一下,好像才感受到自己说的话有多么重要,“听上去又是一个浩大的工程。”“是啊,是啊。”我回答说,“让我们一次只创造一个奇迹吧。”02“完工时间大概是19年,我不能等那么久才拿到博士学位”我和邓嘉在实验室一角,看着一排本科生不断地点击鼠标、敲击键盘。本周早些时候,我们发出了邮件,招募愿意帮忙从网上下载和标注图片的本科生,工作时间灵活,每小时10美元。我们很快就收到了一些回复。这看起来很公平:我们朝着机器智能的新时代迈进了一步,而大学生也能赚到一些啤酒钱。一时间,我们感到心满意足,但没过多久,现实就给我上了一课。“邓嘉,是我的错觉吗,还是进展确实有点儿太慢了?”“对,我也很担心。我对他们的速度做了几分钟计时,计算了一下。”不妙。“按照目前的速度,预计ImageNet的完工时间是……”我用力咽了一下口水。他注意到了。“没错,差不多要19年吧。飞飞,我很看好这个项目,真的,只是我不能等那么久才拿到博士学位。”“那我们该怎么办呢?”他问,“再多找些本科生?”“这当然是一种选择,但是得花不少钱。如果真要19年的话,我觉得我们实验室的预算也是不够用的。”不管怎样,显然我们需要更多的大学生。当年做Caltech101的时候,招募的大学生勉强够用,而那次的工作量不过是ImageNet的零头。看来,我们必须采取新的策略了。做ImageNet已有一年时间,我感觉我们已经步入正轨。有了标注团队的工作,还有邓嘉在不断努力优化标注流程,我确信我们已经有所突破。我很好奇进展如何,而邓嘉知道我的想法(他经常能知道我在想什么)。“你在想我们多久能完成ImageNet?我已经重新预估时间了。”我正准备问他这个问题。于是我兴奋地跑到他的办公桌前。“好的,如果我们把所有因素都考虑在内:我们所有的优化和快捷方式,再加上已经标注的图片,我们已经设法将19年的预计时间缩短到……”我突然失去了勇气,因为我预感结果会很糟糕。“……大约18年。”邓嘉虽然才华横溢,但巧妙地传达坏消息、减轻它对人的打击并不是他的技能之一。这么久以来,我第一次不知道接下来该怎么办了。“飞飞,你现在有自己的实验室了,最近在忙什么呢?”这是我最害怕听到的问题,但这个问题来自吉滕德拉——彼得罗的导师,也是我的“师爷”,他是我此行最想遇到的人。我们已经好几年没有面对面交流了,我知道他会出席计算机视觉与模式识别大会这样的活动。ImageNet项目停滞不前,我的学术生涯前途渺茫,我需要见见熟人。他也不是第一次在这种场合鼓舞我的斗志了。“说实话,吉滕德拉,这个话题有点儿让人郁闷。”“哎呀。”我把一切都如实告诉了他:我和克里斯蒂安的谈话,第一次见到WordNet时的情景,我和邓嘉所做的决定——每个决定都比上一个更艰难,以及这一年来我们为实现一个不可能实现的目标所经历的苦苦挣扎。“还真曲折呀。”他回答道,语气一反常态地平淡。如果他对我目前介绍的进展情况有什么意见的话,他会选择闭口不谈。“是的。最糟糕的是,这一切归根结底是个后勤问题,而不是科学问题。我始终确信,ImageNet正是计算机视觉所需要的,要是我们能把这玩意儿搞出来就好了。”“飞飞……”他开始小心翼翼地组织语言,“当然,没有人会不认同数据起着一定的作用,但是……”他停顿了片刻,然后继续说道,“坦率地说,我觉得你们在这个想法上投入得过多了。”我浅浅地吸了一口气。“科学的诀窍是跟随着你的领域一起成长。不要太超前。”这真是出乎我的意料。吉滕德拉竟然站在反对者的一边,让我深受打击。这种打击不仅仅是在个人层面:等到我将来需要请人写终身教职推荐信的时候,我原本计划请他做我的推荐人之一(虽然在这样巨大失败的阴影笼罩下,能获得终身教职的可能性已经变得非常渺茫)。出于多方面的原因,他的观点很重要。我几乎可以看到我的北极星在逐渐暗淡下来,我的道路又陷入了黑暗之中。一个可怕的想法开始在我心头升起:我承担的风险比我意识到的更大,而现在回头已经为时太晚。在计算机视觉与模式识别大会之后的几个月里,我都不知道应该如何处理ImageNet。要担心的事情有很多,但我总会想起邓嘉。他进入计算机视觉领域时才气过人却又稚气未脱,他信任我,让我担任他的导师。现在,我能感觉到他的挫败感越来越强,我知道他在担心自己的博士之路,我完全能理解他。我还记得自己在研究生时期的种种挣扎,一想到现在要把自己的学生引入歧途了,我的胃里就阵阵难受。当然,科学研究上的挫败也同样令人痛苦。在经历了如此漫长的旅程之后,我无法接受我的直觉居然导致了错误的道路。我们突然失去了方向,仿佛头顶上是一片空荡荡的天空,在黑色波浪中漂泊。03没有哪个个体的智慧能有意外之力的一半强大然而,一切都还没有结束。“打扰一下,飞飞。”我正在赶去教职工会议的路上,马上就要迟到了,一个叫孙民的研究生突然出现在我面前。他能看出我在赶时间,但他看上去非常想要跟我聊聊,说话的时候甚至显得有些不安。“请问你现在有空吗?”他没等我回答。我对他比较了解,知道他说话时一般都是轻声细语的。看他今天的表现,显然是有大事压在心头。“昨天我跟邓嘉在一起,”他继续说,“他跟我说了你们在项目标注问题上遇到的麻烦。我有一个你俩还没试过的办法,真的可以帮你们提高速度。”我立刻忘记了自己还在赶时间,耳朵竖了起来。邓嘉还有社交生活?孙民问道:“你听说过众包吗?”他解释说,在线平台可以将任务分配和结果收集过程自动化,有效组织远程的临时工作团队,规模小到个人,大到数百万人的团队。“如果你感兴趣的话,亚马逊就在提供这种服务,叫作’土耳其机器人’。”“请求者”可以发布“人类智能任务”,由贡献者完成,这些贡献者被称为“土耳其人”(Turker),他们可能来自世界上的任何地方。从理论上讲,这个模式很合理,似乎可以提供我们想要的一切:既有人工标注图片带来的智慧成分,又有与自动化相当的速度与规模。有趣的是,亚马逊称之为“人工人工智能”,这个名字相当贴切。我急匆匆地穿过走廊找到了邓嘉,但他并没有像我这般兴奋。在经历了种种挫折之后,他有充分的理由对再次碰运气保持警惕。但在经历了这一切之后,他可以看到,这真的可能是我们一直在等待的救命稻草。他看起来既犹豫又宽慰。最终他同意了:亚马逊土耳其机器人值得我们再试一次。ImageNet之所以能够存在,要归功于互联网、数码相机和搜索引擎等众多技术的融合。现在,一个一年前还几乎不存在的平台提供的众包服务,成为让我们的项目臻于圆满的关键因素。这件事就是最好的例证,它让我深刻了解到,任何一个科学家的默认立场都应该是绝对谦卑,他们应该明白,没有哪个个体的智慧能有意外之力的一半强大。亚马逊土耳其机器人改变了一切。它把我们起初的大学生标注员队伍变成了一个由数十人、数百人、数千人组成的国际团队。随着我们获得的支持不断扩大,邓嘉给出的预计完成时间急剧缩短,先是15年,然后是10年、5年、2年,最后不到1年。这为我们提供了全新的视角来看待预算,彻底颠覆了ImageNet的成本效益。曾几何时,我们的预算只能招到几个标注员,连一个房间都站不满,而现在足以聘请一支遍布全球并通过互联网连接的众包团队。就这样,每天都有成千上万张新图像被标注出来。在ImageNet发展的高峰期,我们是土耳其机器人平台上最大的雇主之一,这一点从我们每月的服务账单上也能看出。成本的确很高,但效果也很显著。然而,我们的预算困境还没有结束。虽然土耳其机器人价格合理,但ImageNet规模实在太大,所以我们很快发现自己再一次接近预算极限。在两年多的时间里,我们的财务状况一直岌岌可危,那是一段痛苦的日子,哪怕是路途中的一个小颠簸,都有可能让我们人仰马翻、一蹶不振,但ImageNet日臻完善,终于成为我和邓嘉一直憧憬的研究工具。我们实验室自然是第一个将其投入使用的。即使是在未完成的状态下,它的影响力也让我们备受鼓舞。完工在即,我们不再需要依靠想象力;大家第一次清楚地意识到,我们正在创造一个值得与全世界分享的东西。在2009年,我决定再次前往西部,邓嘉和我的大多数学生也跟随我转学。斯坦福大学成了我们新的学术家园。2009年6月,ImageNet的初始版本终于完成了,这在很大程度上得益于斯坦福大学提供的新研究资金。尽管我们一路上遇到了许多挑战,但我们最终成功达成了目标:收集了1500万张图片,涵盖了2.2万个不同类别。这些图片筛选自近10亿张候选图片,并由来自167个国家的4.8万多名全球贡献者进行了标注。ImageNet不仅在规模和多样性上达到了我们多年来梦寐以求的水平,还保持了一致的精确度:每张图片都经过了手工标注,并在层次结构中进行了组织,经过了三重验证。从数量上看,我们已经实现了既定目标,建立起了当时人工智能史上最大的人工编辑数据集。但在这些数字之外,最让我感动的成就是我们所构建的真实世界本体。这个本体是人类从零开始策划的,既包含视觉图像,又能传达逻辑概念,其唯一的目的就是教导机器。我们实验室所做的每一件事都充满了活力。有一次,我们利用ImageNet快速训练了数百个图像分类算法的实例,让它们识别一组日常事物,然后将所有实例应用在一张照片上。实验目的并不是简单地检测单个物体的存在,而是通过寻找物体组合来诠释整个场景。例如,如果检测算法发现了一个人、一艘船、一只桨和一片水域,它就会将照片作为一个整体归类为“划船”。这是一种更深层次的理解,可以说接近于原始的视觉推理。就像我们那个时代的许多实验一样,我们使用的算法准确性很不稳定,还有很大的改善空间。毕竟,就连简单的图像识别也仍处于起步阶段。但困难只会进一步激发我们的冒险精神。我们的研究大胆且具有前瞻性,虽然并不完备,但能引发思考,其中很多在概念上也很简单。但直到ImageNet出现,一切才变得切实可行起来。与此同时,邓嘉也开始在学术领域崭露头角。在ImageNet发布后一年左右,他发表了题为《对超过10000个图像进行分类能告诉我们什么》的论文,总结了ImageNet出现后图像识别领域发生的根本性变化。尽管论文技术性很强,但其中所蕴含的哲学思想使它有别于一般的学术论文。这篇论文宛如一个预言,甚至触及了存在的本质。邓嘉认为,ImageNet不仅代表了规模的扩大,还代表了分类逻辑的转变,类似于物理学领域的“相变”,在这种转变中,甚至现象的最基本属性也会发生变化。ImageNet极大地拓宽了算法面临的可能性,但因为规模太大,也给算法造成了挑战(相比而言,小型数据集就不会有这个问题)。“你知道我最喜欢Caltech101哪一点吗?”亚历克斯的话把我拉回了现实,“除了里面的训练数据,它还让我有机会用完全相同的图像,把我的研究结果和你的进行比较,做同类对比。”“相当于一个基准。”我回答道。“没错,这样就很容易衡量进展。还有什么比这更能激励研究人员呢?就像是发起了一个挑战,就像打赌一样。”就像打赌一样,我喜欢这个说法。“那么……如果我们用ImageNet做同样的事呢?”我问道,边思考边说,“或者,干脆我们就用ImageNet搞一个完整的竞赛怎么样?”“你是说像PASCAL那样的吗?”PASCAL视觉对象类别数据集(通常称为PASCALVOC)是一个欧洲研究团队汇编的数据集,包含大约1万张图片,分为20个类别。PASCALVOC与Caltech101类似,但有一个重要区别:PASCALVOC是年度计算机视觉大赛的基础数据集。该大赛始于2005年,每年都有来自世界各地的参赛者提交经过PASCALVOC训练的算法,然后用这些算法去识别一组以前没有见过的新图片,最后根据分类的准确度对算法进行排名,错误率最低的即为获胜算法。比赛既具有协作性,又具有竞争性,吸引了各方对计算机视觉领域最新进展的关注。而参赛者所使用的数据集仅有ImageNet的千分之一大小。“那就有意思了。”亚历克斯回答道,“我都可以想象研究人员在互相交流新想法的时候问:‘它在ImageNet上的表现怎么样?’”这样一来,ImageNet也成了计算机视觉领域的北极星了,我想。如果邓嘉论文的核心思想是正确的,如果ImageNet真的会引起一场大洗牌,带来新的规则、新的直觉,甚至全新的范式,那么还有什么比通过比赛来探索这个数据集更好的方式呢?激烈的竞争压力可以激发合作的集体力量。比赛要遵循一定的规则,但又要有探索性。即使经过多年的努力创建了ImageNet,仅仅是想像着把它做成比赛,也为它注入了新的生机。这也意味着将ImageNet推向世界的工作尚未结束。04黎明前的黑暗一回到美国,我就开始了比赛的筹备工作。比赛的正式名称为“ImageNet大型视觉识别挑战赛”(ImageNet Large Scale Visual Recognition Challenge,ILSVRC),对所有人开放,获胜者会即刻获得认可。首届比赛将于2010年举行,5月开放报名,9月统计结果,同年晚些时候,会在克里特岛举行的欧洲计算机视觉大会(European Conference on Computer Vision,ECCV)研讨会上公布获胜者。然而,现实却与我们的期望背道而驰。获胜算法来自一个由NEC实验室、罗格斯大学和伊利诺伊大学的研究人员组成的联合团队。这个参赛算法的表现确实可圈可点,我们对每位参赛者的努力表示赞赏。不过,与计算机视觉领域其他方面的前沿工作相比,这些算法只能算略有改进,很难说开启了新的时代。在ImageNet的发展历程中,有很多令人泄气的时刻,这次就是其中之一。如果说2010年的比赛虎头蛇尾的话,那么2011年的比赛则给人一种末日之感。2011年的获胜算法来自法国施乐研究中心,也是一种支持向量机算法,识别表现虽然比前一年有所提高,但也只是将准确率提高了2个百分点左右。我开始意识到自己可能误判了。正如我猜测的那样,大多数算法都难以应对ImageNet,但支持向量机比我想象的要强大,它为参赛者提供了安全的避风港,阻碍了我梦寐以求的激进创新。连续两年,司空见惯的算法都只是在能力上略有提升,几乎没有任何真正的进步。最糟糕的是,参赛人数也出现急剧下降:第二年的报名人数从150人减少到96人,参赛算法也从35个减少到15个。愿意为此付出努力的人似乎越来越少,也许这并不奇怪。说这种经历“让人羞愧”已经远远不足以描述我们的心情了。为了推动ImageNet的发展,我们倾注了多年的心血,搜集的图片数量远远超过以往的任何数据集,还精心策划了一场国际竞赛来探索它的能力,但结果却只是简单地重复了现状。如果说ImageNet是一场赌注,是时候开始思考我们是不是已经输了。2012年8月,让我夜不能寐的事情终于不再是ImageNet了——我们的孩子出生了,我的生活主题变成了哺乳、换尿布和永远不够的断断续续的睡眠。这一年,ImageNet挑战赛的结果将在意大利佛罗伦萨宣布,因为孩子的原因,我本不打算亲自去参加,但有一天,邓嘉深夜打来电话。这个时间点很不寻常,我的第一反应是出了什么事。“喂?”听得出他很激动,但感觉不像是痛苦,而更像是兴奋,准确地说,是迷茫而兴奋。因为邓嘉一向淡定,所以他的语气让我格外留意。“是这样的……我们一直在评估今年的参赛作品,其中的一个算法是……我的意思是……”他迟疑了一下。05正名时刻“怎么了?是什么?”我问道。“好吧。获胜的团队使用了非正统的算法,是一种神经网络算法。你敢相信吗?”我的耳朵竖得更直了。如果说刚才我的注意力还没有完全集中在他的身上,那么现在我肯定百分之百地在听他说话了。“感觉像是……老古董。”“真的吗?是神经网络算法?”“是的,但还不止这些。飞飞,你不会相信算法的表现有多好。”我一直在思考这次的获胜算法。它的识别准确率高达85%,比上一年的冠军高出10个百分点,创造了计算机视觉领域的世界纪录。可以用一个数据来说明这个准确率的意义:我所看到的研究表明,人类的平均识别准确率约为97%,而这还是对简单得多的二元选择而言(比如判断一张照片上是否有动物)。相比之下,算法需要筛选上千个选项才能找到正确答案。因此,虽然这个算法还没有达到人类的水平,但已经比其他任何算法都更加接近,而且差距已经小到惊人。冠军算法名为AlexNet,是向这项技术和项目的主要作者、多伦多大学研究员亚历克斯·克里热夫斯基(Alex Krizhevsky)致敬。AlexNet是卷积神经网络(Convolutional Neural Network,CNN)的一个实例。卷积神经网络的叫法源于图形卷积过程。在这个过程中,一系列滤波器在图像上扫过,寻找与网络所识别事物相对应的特征。这是一种独特的有机设计,灵感来自休伯尔和威塞尔对哺乳动物视觉系统的观察,即视觉处理在多个层次上进行。就像在自然界中一样,卷积神经网络的每一层都会逐渐整合更多的细节信息,从而形成越来越高层次的感知,最终将真实世界的物体完整地呈现在我们的视野中。当然,这些并不是什么新的创意。自从贝尔实验室成功将卷积神经网络应用于手写邮编,杨立昆多年来一直对卷积神经网络保持着惊人的忠诚。在AlexNet诞生时,他已经花了20年时间坚持不懈地完善算法、发表研究成果,但一直没有必要的资源来充分实现这些成果。现在,几乎在一夜之间,这种常被视为误入歧途的执着似乎变得极具先见之明。杨立昆把自己的卷积神经网络算法巧妙地命名为LeNet(呼应他的英文名Yann Le Cun),其指导理念在AlexNet中熠熠生辉,宛如重生般焕发生机。这种联系让AlexNet背后的三人团队备受瞩目。他们都是多伦多大学的研究人员,负责人是与项目同名的亚历克斯·克里热夫斯基,以及他的合作伙伴伊利亚·苏茨克维(Ilya Sutskever)。这两个聪明的年轻人资历尚浅,仍在建立自己的声誉。然而,第三个名字立刻引起了我的注意:杰弗里·辛顿。就是这位辛顿,在20世纪80年代中期开发了反向传播技术,成为早期机器学习的先驱。反向传播的突破性方法首次实现了对大型神经网络的可靠训练。就是这位辛顿,曾经指导过彼时还是他实验室学生的杨立昆。和他的学生一样,辛顿拒绝放弃对神经网络的研究,即使这让他在同事中显得形单影只。看来,AlexNet绝不仅仅是一个参赛算法。这是一个历经四分之一个世纪的正名时刻。事实上,在ImageNet的帮助下,AlexNet焕发生机,它贪婪地吸收着ImageNet的内容,在ImageNet规模和多样性的土壤中生根发芽,茁壮成长。一直以来,神经网络并不需要更花哨的数学公式和更奇特的抽象概念。我们期待神经网络能够理解世界,而它们只是在等待我们提供更加清晰的图景,等待一些真正有学习价值的东西。大数据训练了LeNet去理解复杂的人类笔迹,现在它也在训练AlexNet去理解万物。后来我才知道,在2012年之前的几年里,辛顿重拾激情,想要证明神经网络的可行性。2011年,他认为自己比以往任何时候都更接近转折点,于是开始以一种既对抗又合作的方式与同事沟通,他的表达方式听起来更像是提出挑战,而不是提出问题。他跟同行探讨下一步行动计划,其中一个同行就是吉滕德拉。虽然他们两人早有交情,但吉滕德拉一直对辛顿的项目持怀疑态度。“我要怎么做,才能让你相信神经网络是未来的趋势?”辛顿问道。“你真的想打动我吗,杰弗里?那就让我看看它们能不能处理一些真正的任务。”“比如?”“比如物体识别,真实世界中的物体识别。”无论吉滕德拉对ImageNet有什么看法,他的确相信视觉分类的力量,这一点我在加州理工学院时就了解到了,“你参加过PASCALVOC吗?”“参加了啊。但没什么用,他们的数据集太小了,例子不够,所以我们给神经网络展示新图片的时候,泛化效果并不好。”“那你就需要更大的数据集。你关注过飞飞的实验室吗?等你准备好迎接真正挑战的时候,可以看看她组织的比赛。”不管吉滕德拉是真的对我的项目改变了看法,还是只是想打老朋友的脸(这两种情况似乎都有可能),辛顿都认真地听取了建议。ImageNet的数据广泛而全面,覆盖了世界上绝大多数物体。现在看来,AlexNet和ImageNet也属于相互成就。简而言之,这就是最大的不同——现在算法可以探索的数据范围大大增加了。一想到训练完成后AlexNet的层级中包含的内容,我就惊叹不已:形状、边缘、图案、纹理,涵盖我们多年来从互联网上捕捉到的所有人物、动物和物体。现实世界中幽灵般的碎片,以恰到好处的方式组织起来,供算法来查看。06历史刚被创造出来,而世界上只有少数人知道 第二天一早,消息就传开了。据传,会上将宣布一个具有历史意义的事件。这些含糊不清的传言激起了与会者的好奇心。当我到达时,研讨会现场已经人满为患,杨立昆本人不得不靠后墙站着,因为他稍微晚了几分钟,没能找到座位。从研讨会开始的那一刻起,现场的气氛就异常紧张,人群分成了三派。第一派是ImageNet的少数支持者,包括我、亚历克斯·伯格和辛顿实验室的成员。第二派占绝大多数,由中立但感兴趣的观察者组成。第三派虽然人数不多,但态度强硬,也最直言不讳。他们是那些从早期就反对ImageNet理念的批评者,虽然我通常不理会他们的态度,但在会议现场很难忽视他们的存在。李飞飞演讲视频截图更糟糕的是,我们并没有形成统一战线。辛顿无法亲自参会,因为他长期患有背部疾病,几乎不可能进行国际旅行,所以他派了亚历克斯•克里热夫斯基代他出席。亚历克斯非常有才华,也是算法的主要作者,所以可以代替辛顿。但就像许多杰出的人一样,他的个人表现与他工作成果的高度并不相符——我不确定他是否完全理解这一点。他的表现笨拙而轻率(这在学术界并不罕见)。一个典型的例子是,我在研讨会开始前多次给他发短信确认会面时间,但他完全没有回应(但幸好,他按时到了现场)。由于听众的怀疑态度空前高涨,他只摆事实、不带情感的演讲更难赢得他们的认同。提问环节一开始,现场的紧张气氛就越来越浓。我们听到了所有常见的抱怨:ImageNet太大了,不实用;没有必要包含这么多类别;物体识别模型还太原始,不需要如此庞大的数据集;等等。事实上,AlexNet几乎是逐点证明了相反的观点,但奇怪的是,观众却不信服。同时,也出现了一些新的批评声音,有些甚至非常离谱。一位与会者(来自顶尖大学的后起之秀)煞有介事地提出,描绘T恤的图片类别多样性不够,因而无法可靠地训练模型。对此我更多的是感到好笑。是认真的吗?T恤图片是致命弱点?会议现场的其他人也都一头雾水。但那些认真倾听的人得到了回报。在27张幻灯片中,大多数只有黑白文字和图表,却以我们从未见过的清晰方式展示了神经网络的本质,极具启示性。继罗森布拉特的感知机、福岛的新认知机和杨立昆的LeNet之后,AlexNet实现了计算机视觉领域的新跨越。这一步早就应该迈出,却历经了数十年的酝酿,现在终于横空出世,利用大型数据集充分彰显了潜力。尤其值得注意的是AlexNet的学习过程。与所有神经网络一样,AlexNet的初始状态是无形的、惰性的,就像虚空中的一块挂毯。然后,学习过程就开始了:面对从ImageNet库中随机选择的图片,神经网络的任务是从上千个标签中选择一个正确的标签,对图片进行标注。这个过程周而复始,不断重复。一开始,标注几乎是不可能完成的任务;AlexNet的数千万个神经元是随机配置的,对世界甚至连一点儿模糊的理解都没有,只会产生错误的结果。把一张蘑菇图片标注为“瓶盖”。错误。把一张拖车图片标注为“电吉他”。错误。把一张棱皮龟图片标注为“浴巾”。错误。但失败并非无用功。错误会触发纠正信号,在网络的数千万个组成部分中蔓延开来,同时对每个部分对于结果的贡献进行评估,并按比例推动它们下次采取不同的行动。这是最简单的学习方式:减少失败的行为,增加成功的行为。但学习的规模极大,算法会仔细审查每个错误的每个细节:每一片光影、每一个图案和纹理、每一个柔和的渐变和坚硬的边缘。在早期阶段,效果并不明显,当AlexNet再次看到类似它之前错误分类的图片时,很可能会再次出错。不过,错误会更小一些。如此循环往复,直到正确为止,哪怕只是靠运气。这一次,信号的目的是强化,而不是削弱:强化任何看似指向正确方向的东西。训练继续进行。错误。错误。错误。正确。错误。错误。正确。正确。错误。ImageNet规模巨大,算法学习也注定是个漫长的过程,即使只是为比赛挑选的1000个类别的子集,完成学习也需要很长时间。ImageNet涵盖了各种各样的对象,比如数字钟、篱笆、盘式制动器、秒表、意大利灰狗、微波炉、醋栗,每个类别都有上千个不同的品种。不过,AlexNet本身也是个庞大的网络。它有65万个独立神经元,通过6.3亿个连接组成网络,其中有6000万个微小的、几乎无法察觉的权重影响着连接的强度,当信号从网络的一端流向另一端时,一些连接会增强,另一些则会减弱。作为整体,这些连接提供了一张巨大的画布,足以描绘整个世界。在一轮又一轮的标注中,权重不断变化,有的变强,有的变弱,有的摇摆不定,形成了一种柔韧结构,对训练做出有机的优雅反应。承载这些庞大数据的是两个英伟达图形处理器,高度专业化的硅芯片并行工作,以最快速度进行着一轮又一轮运算。训练从早到晚不停地进行,直到每幅图像的每个像素都被研究完毕。几个小时变成几天,几天又变成一周。图形处理器推动之。ImageNet挑战之。AlexNet适应之。随着数以千万计的权重一次又一次地调整,整个网络出现了更庞大、更奢侈的结构。就像铁匠用锤子敲打发光的钢铁。每次微小的增量积累,直到近乎肉眼不可见的扰动变成山脉和山谷,延伸到数千维的超空间。这个网络是世界无数细节的幽灵般的均值,是1000种不同事物、每种事物1000幅不同照片留下的痕迹。这里有1000只达尔马提亚犬,那里有1000个洗衣篮,另一处有1000个马林巴琴。就像地质变化一样,种种印记凝聚成了地形,从AlexNet的一端延伸到另一端。削笔刀、清真寺、海星、曲棍球——所有事物都镶嵌在这个地形之中。算法不仅“看到”了这些东西,还成为它们。我们花了数年时间在互联网上搜寻照片,这些照片形成了完整多元的机器意识空间,原始而强大,成为世界一切事物的统一表征。在经过140万轮标注后,最后几张图片与其说是一场磨炼,不如说是一场加冕礼。网络的焦点穿过像素,随着熟悉模式的识别而亮起,并传递到下一层,与其他模式相结合,形成越来越强大的感知。算法的反应不再是随机的,大多数也不再是错误的。土狼。正确。台灯。正确。敞篷车。正确。显然,这是硬件、软件和数据的神奇组合,比计算机视觉领域所打造的任何成果都更接近于捕捉到塑造了人类这种哺乳动物思维的进化精神。ImageNet的多样性是在全世界众包志愿者的共同努力下实现的。它所形成的拓扑结构无比多样、强大,达到了圣杯的境地。AlexNet是计算机视觉领域有史以来最大的神经网络,它的训练数据比此前任何神经网络都要丰富,而且具备了泛化能力。我们要花上几个月的时间,才能真正理解在那个会议室里看到的一切,但即使在那一刻,我们也清楚地知道我们正在见证非凡之物。这么多年来,我一直希望ImageNet能够推动新事物的诞生,现在我终于明白,一切的一切,都是为了认可和表彰一种永恒的成就,我们对此刻期待已久。受生物学启发的算法几十年来一直凝视着我们,它只是需要适当的挑战,才能充分展现出来。这个下午也让我们有机会回顾计算机视觉领域在过去10年的发展历程。我的实验室将所有赌注都押在了长达数年的、规模空前的数据追寻上,而辛顿的实验室则将他们的声誉都押在了卷积神经网络这套几乎已经被专业领域抛弃的算法上。我们都在赌,都有可能赌错。但在那一天,当我们看到神经网络在ImageNet强大训练能力的支持下展现出的惊人能力时,我意识到,虽然两个项目都获得了认可,但这只是因为它们是同步发展的。所有参与者都不知道,我们的每一步都相互依赖。我往返佛罗伦萨的飞行时间比在佛罗伦萨当地待的时间还长。但在返程的航班上,我的感受与来时完全不同。飞机上的拥挤程度丝毫未减,我的疲惫感更加浓重,但思绪已经不再飞速奔涌——至少不像来时那样。我亲眼见证了成果。没有错误,没有疏忽,也没有文书方面的失误。神经网络起死回生,比以往任何时候都更庞大、更复杂、更强大。ImageNet已经教会了它们所需知道的一切,让它们在一次尝试中就达到了与人类能力相当的水平。生物视觉的出现导致远古海洋波涛下的寒武纪大爆发,距今已经5亿年。而如今,我们很难不去联想:我们是不是正处于一个类似拐点的边缘?机器视觉的兴起是否会引发一轮数字进化新浪潮呢?我在来时飞机上狂躁的思绪和焦灼的问题一扫而空,取而代之的是一种意外的感觉。不是平静,而是大悟,是沉思。这一次,从起飞到着陆,我一直静静地坐着,脑子里只回荡着一个念头:历史刚被创造出来,而世界上只有少数人知道。

47

05/24

2024

AlphaFold 3重磅问世,准确性远超以往水平,给研究者“戴上一副高清眼镜”

图片来自DeepMind导读5月9日,《自然》杂志最新重磅论文,DeepMind与Isomorphic Lab联手推出最新的AlphaFold 3系统。该平台是在AlphaFold 2模型架构以及训练系统大幅提升下,可对大量生物分子系统结构进行更准确的预测。AlphaFold首次于2020年问世,它和此后升级的AlphaFold 2能根据蛋白质的氨基酸(蛋白质的基本成分)序列预测其3D结构。之后的AlphaFold-Multimer推动了对蛋白质-蛋白质复合物的预测。不过,扩大单一深度学习模型能预测的复合物一直很难,因为不同类型的特异性相互作用差异太大。此次发布的AlphaFold 3能预测蛋白质与其他蛋白质、核酸、小分子、离子、修饰蛋白质残基的复合物,以及抗体-抗原的相互作用,准确性显著超过当前的预测工具。齐 萱 | 撰文AlphaFold又迭代了!5月9日,AlphaFold3问世。最新一期《自然》论文报道,AlphaFold 3能以较高准确率预测蛋白质与其他生物分子相互作用的结构。相比于其他人工智能模型,AlphaFold 3准确率比之前的工具显著提升,该模型由谷歌(Google)DeepMind和Isomorphic Labs的团队研发。最新模型能预测含有蛋白质数据银行(Protein Data Bank)内几乎所有分子类型的复合物的结构。这种用计算机解析蛋白质与其他分子复杂相互作用的能力,将拓展我们对生物过程的理解,并有望推动药物研发。01 AlphaFold 3面世,将引领生物医学新革命据介绍,AlphaFold 3以其前所未有的准确性,为药物设计领域注入了活力。 它不仅能够预测药物中常用的分子,如配体(ligands)和抗体(antibodies),与蛋白质的结合方式,还能揭示这些分子如何影响人体在健康和疾病状态下的蛋白质相互作用。与传统的预测方法相比,AlphaFold 3在PoseBusters基准测试中表现出了比以往AI工具高50%的准确性,且不需要任何结构信息的输入。这使得AlphaFold 3成为首个超越基于物理工具的生物分子结构预测系统的人工智能系统。图片来自DeepMindIsomorphic Labs的研究人员正将AlphaFold 3与一系列内部开发的AI模型相结合,共同推动药物设计领域的创新,他们不仅利用AlphaFold 3进行内部项目的药物设计,还与制药公司合作,共同开发新型药物。药物研发是一个漫长而复杂的过程,其中最大的挑战之一就是找到能够与特定蛋白质结合并影响其功能的分子。AlphaFold 3通过预测蛋白质的结构和相互作用,可以帮助科学家们更快地找到潜在的药物靶点,并设计出更加精准和有效的药物分子。这将大大缩短药物研发的时间,降低成本,并有望为患者带来更好的治疗效果。但AlphaFold 3也有一定的局限性,如约4.4%的结构会出现不正确的手性(一种对称特性),或是幻觉导致“飘带”(一种常见的蛋白质二级结构元素)的出现减少。AlphaFold 3模拟准确率的进一步提升,需要生成一个很大的预测集并对预测结构进行排序,而这会产生额外的计算成本。 02 AlphaFold3供科研人员免费使用为了让更多的科学家能够利用这一强大的工具,DeepMind不仅发布了AlphaFold的源代码和训练数据,还建立了免费的AlphaFold Server供全球科学家使用。AlphaFold Server平台的推出,意味着科学家无需承担高昂的实验成本和时间消耗,仅需通过简单的操作,即可利用AlphaFold3的强大能力,模拟由蛋白质、DNA、RNA以及特定配体、离子和化学修饰组成的结构。AlphaFold Server的易用性是其最大的亮点之一。生物学家们无需具备强大的计算机操作能力或机器学习的专业知识,便能轻松上手,生成精确的预测结果。这一特性极大地降低了科研门槛,使得更多的研究者能够参与到蛋白质结构预测的研究中来,共同推动科学进步。来自弗朗西斯·克里克研究所的Uhlmann实验室科学家Céline Bouchoux,对AlphaFold Server的推出给予了高度评价,她表示:“AlphaFold Server的推出不仅仅是预测结构,更是慷慨地提供访问权限:它允许研究人员提出大胆的问题并加速发现。”实际上,早在AlphaFold 2时代,这一工具就已经帮助科学家们预测了数亿个结构,极大地推动了蛋白质结构生物学的发展。如今随着AlphaFold 3的加入,AlphaFold Server的预测能力再次得到了显著提升,使得更多的科学问题迎刃而解。 此次AlphaFold 3的推出,如同为生物世界戴上一副高清眼镜,让科学家们能够前所未有的观察细胞系统的复杂性和细节,包括结构、相互作用和修饰。这一全新的视角揭示了生命分子的内在连接,并有助于理解这些连接如何影响生物功能——比如药物的作用机制、激素的产生以及DNA修复的保健过程。著名生物学家、中国科学院院士施一公教授曾评价AlphaFold,“依我之见,这是人工智能(AI)对科学领域最大的一次贡献,也是人类在21世纪取得的最重要的科学突破之一,是人类在认识自然界的科学探索征程中一个非常了不起的历史性成就。”03 AlphaFold的迭代历程从最初的构思到如今的广泛应用,AlphaFold以其惊人的预测能力和准确性,引领了结构生物学的一场革命。DeepMind运用先进的深度学习和神经网络技术,着手研究如何从蛋白质的氨基酸序列预测其三维结构。这一领域长期以来一直困扰着科学家,因为传统的实验方法如X射线晶体学和核磁共振虽然精确,但耗时且成本高昂。AlphaFold于2020年正式面世。AlphaFold 2以其卓越的性能和准确性,迅速成为了全球科研人员的得力助手。数百万研究人员利用AlphaFold 2在疟疾疫苗、癌症治疗、酶设计等多个领域取得了突破性的进展。目前,AlphaFold 2的引用次数已超过20,000次,AlphaFold 2开发者因其杰出的科学影响力荣获多项殊荣,包括最近的生命科学突破奖。AlphaFold系列的成功不仅在于其技术上的卓越性,更在于其广泛的应用前景。在药物研发领域,它帮助科学家加速药物的研发过程。此外,它还为工业界带来更高的效率和经济效益。参考资料1.AlphaFold 3 predicts the structure and interactions of all of life’s molecules2.DOI: 10.1038/s41586-024-07487-w

45

05/16

2024

恭喜!斩获第四届安全科技进步一等奖!

喜报!喜报!在“北京冬奥全球传播态势感知与应急决策关键技术研究及应用”项目中,轻寻科技和CEO曾波双双斩获来自中国安全生产协会颁发的奖项——一等奖。团队一等奖!!!在此项目中,轻寻技术团队展现了非凡的专业素养和创新能力。他们有着坚实的技术支撑,在面对各种技术挑战时,都能迅速找到解决方案。不仅在技术层面,在团队协作和创新精神上。轻寻技术团队始终保持高度的责任感和使命感,以饱满的热情和严谨的态度投入到工作中。他们相互支持和鼓励,共同面对困难和挑战,展现出强大的凝聚力和战斗力。他们的努力为项目的获奖提供了有力的保障,发挥了不可或缺的作用!CEO曾波斩获个人一等奖太厉害啦!!!鼓掌???为表彰在促进安全生产科学技术进步工作中做出突出贡献的轻寻科技及其CEO曾波,中国安全生产协会特双双颁发证书!让我们再次恭喜我们的技术团队不负努力和期望,和CEO曾波双双斩获一等奖呀!这一喜讯令大家欢欣鼓舞,标志着轻寻科技及其CEO曾波在此项目中取得的卓越成就。这份荣誉是对我们技术实力和创新能力的认可。轻寻科技及其CEO曾波将带着这份喜悦和自豪,继续前行,做得更好更强!

46

05/09

2024

逐梦科学的乐趣:诺奖得主Sydney Brenner自述,曾与克里克共事20年

2002年诺贝尔生理或医学奖得主Sydney Brenner导读Sydney Brenner是一位杰出的南非生物学家,2002年获得了诺贝尔生理学或医学奖,这一荣誉主要归功于他在发现器官发育的基因调控机制和细胞程序性死亡方面的重大贡献。Brenner的科研生涯充满了创新和突破。他在英国剑桥的分子生物学医学研究委员会(MRC)实验室工作期间,对遗传密码等分子生物学领域做出了重大贡献。他和同事们一起,揭示了遗传三联体密码子的奥秘,这是理解DNA如何编码蛋白质的关键一步。此外,他还以第一作者的身份揭示了终止密码子的故事,这是生物体在翻译DNA信息时如何知道何时停止的重要机制。除了对DNA分子工作原理的深入研究,Brenner还开创了线虫研究的新领域。以下自述是他在76岁时撰写,这之后的许多年直至他的离开(2019年离世,享年92岁),他始终致力于科学的追求中。Sydney Brenner | 撰文林岩 | 翻译几年前出版的一本自传,记录了我人生中许多重要的经历,这些经历使我成为了一名科学家,而我的诺贝尔演讲则涵盖了所获奖项研究工作的知识背景和成果。目前写的这个版本,是缩略的版本。01 热爱阅读,一年学完小学前三年课程1927年1月13日,我出生在南非的一个小镇——杰米斯顿。我的父母都是来自东欧的犹太移民,父亲在1910年从立陶宛来到南非,母亲则在1922年从拉脱维亚来到这里。我的父亲是一名修鞋匠,我们最初的家就是他店铺后面的几间房子里。他从未学过读写,但除了英语、意第绪语和俄语之外,他还学会了说南非荷兰语和祖鲁语。我很小就学会了阅读,父亲的一位顾客沃金肖小姐说服了他,让我五岁时免费进入她的幼儿园。我在一年内完成了小学前三年的课程,并在六岁时直接进入当地学校的四年级,比我所有的同学都小两岁左右。小学结束后,我进入了杰米斯顿中学,并于1941年12月毕业,当时我还不到15岁。在这段时间里,我发现了杰米斯顿的公共图书馆,这是安德鲁·卡内基基金会在世界各地建立的众多图书馆之一。在这里,我找到了知识的源泉,并学会了通过阅读来获取知识,这一学习习惯一直延续至今。同时,我对化学产生了浓厚的兴趣,并逐渐积累了足够的试管和其他玻璃器皿,以进行化学实验,这些实验所需的少量化学药品都是从一家药店供应公司购买的。很快,我就进入到生物化学领域,并试图探索是什么让花朵拥有独特的色彩。我惊人地发现(对我自己来说),当我改变溶液的酸碱度时,我提取的色素会改变颜色。02 上大学,逐梦科学幸运的是,杰米斯顿市政会每年给我60英镑的奖学金,使我有机会去约翰内斯堡的威特沃特斯兰德大学学医。1942年,我十五岁时,开始了物理学、化学、植物学和动物学的学习。我住在家里,每天早上骑自行车到火车站,乘火车去约翰内斯堡,然后步行到大学,中午带着三明治当午餐,晚上再原路返回。我叔叔哈里送了我一台显微镜作为礼物,这使我能够继续探索生物世界。这标志着我与真正科学接触的开始。第二年,我转到了医学院,开始了解剖学和生理学的学习。我开始意识到,我对细胞及其功能很感兴趣。 那时,人们注意到我在完成六年医学课程后,年龄太小,不足以获得从医资格,因此允许我偏离既定路线,用一年时间攻读医学学士学位课程中的解剖学和生理学。这简直是我所梦寐以求的。大约十几名学生组成的小团体居住在解剖学系的一间小屋里,我们每个人都有一个小的实验台。我们通过与系里更资深的研究者合作开展小组研究,学会了如何进行研究。我跟随乔尔·曼德尔斯坦(Joel Mandelstam,后来成为牛津大学教授)学习物理化学,跟随阿尔弗雷德·奥特尔(Alfred Oettle)学习显微学,还跟随哈罗德·戴茨(Harold Daitz)学习神经学,他后来成为我的密友,但年纪轻轻便在牛津逝世。雷蒙德·达特(Raymond Dart)和罗伯特·布鲁姆(Robert Broom)教我人类学和古生物学,而激发所有这些研究活动的正是约瑟夫·吉尔曼(Joseph Gillman),这位组织学家在那个偏僻之地创建了研究中心。他邀请我(实际上我很愿意,根本不需要任何劝说)继续从事研究工作,于是我又多留了两年,先是获得荣誉学位,接着又获得了理学硕士学位,期间通过兼职实验室技术员的工作养活自己。在此期间,我阅读了大量书籍,自学了很多科目,学会了如何制造设备和做实验,并与乔·吉尔曼(Joe Gillman)进行了许多争论和讨论。我还开始发表论文。我的科学文献目录始于1945年,当时我与乔·吉尔曼和他的兄弟泰迪(Teddy)共同发表了一篇论文,但我作为唯一作者的第一篇论文则发表于1946年。这篇论文探讨了组织化学反应,也是我后来称为细胞生理学的主题中一系列论文中的第一篇,反映了我对这一领域日益浓厚的兴趣。我的理学硕士论文是细胞遗传学领域的,也是我自学的另一个科目,这标志着我开始研究遗传学。这一背景在我后来成为分子生物学家的岁月里发挥了很好的作用。 1946年,W. Le Gros Clark访问了南非,并邀请我到牛津的解剖学系工作。但所有人都建议我完成医学课程,因为当时人们普遍认为,拥有医学资质对于日后担任研究职位至关重要。我确实重新投入了医学学习,但同时在解剖学系继续工作,并在乔·吉尔曼成为生理学系教授时转到了生理学系。我并非优秀的医学生,职业生涯起伏不定,有些科目成绩出色,有些则糟糕透顶。在毕业那年,我医学课程未及格,外科勉强通过,但第三门科目——产科和妇科却获得了甲等成绩。我不得不重修医学和外科,六个月后,1951年7月,我终于获得了医学和外科学士学位。那时我已经决定要从事研究工作,并且需要到国外深造。早前访问过南非的C.H. Waddington建议我去剑桥大学。我申请了生物化学系,却连回复都没收到。我已经决定,自己感兴趣的学科是分子生物学,当然当时这个学科还不存在。后来,当我获得1851皇家展览委员会颁发的奖学金时,威特沃特斯兰德大学的校长H. Raikes(他原本是在牛津受过训练的化学家)建议我给牛津大学物理化学教授C.N. Hinshelwood写信,他对物理化学在生物学上的应用很感兴趣。这听起来更接近我想做的事情。Hinshelwood写过一本名为《细菌细胞的化学动力学》的书,我阅读后认为这正是我希望研究的方向。他接纳了我,并建议我研究细菌对噬菌体的抗性。我立刻开始阅读关于细菌病毒的资料,并于1952年10月抵达牛津,在物理化学实验室攻读博士学位。英国仍然实行食品配给制,我在牛津两年的生活也过得相当艰难。此外,我和其他人有三重身份上的不同:我们是科学家,我们是研究生,我们是殖民地人。在牛津,我的许多朋友都有这样的遭遇,唯一的补偿就是有机会加入哈利法克斯府并在那里共进午餐。正是在那里,我结识了晶体学家杰克·杜尼茨(Jack Dunitz),并经由他认识了理论化学家莱斯利·奥尔格尔(Leslie Orgel),他们两人都成为了我一生的朋友和同事。 我们多次讨论DNA,因为我带着两个半成品的想法来到牛津,而且这两个想法都错得离谱。一个想法是用染料研究DNA的结构;另一个想法是核酸如何参与蛋白质的合成。我记得1952年11月,杰克告诉我剑桥有两个家伙正在研究DNA的结构。到了1953年4月,杰克告诉我们,两个剑桥的家伙——弗朗西斯·克里克(Francis Crick)和吉姆·沃森(Jim Watson)确实已经解开了DNA的结构。于是,在4月16日至18日之间的一天,杰克、莱斯利和我驱车前往剑桥,一睹这个模型。03 亲眼目睹DNA模型,成为科学生涯的转折这是我科学生涯的转折点。当我看到那个模型,并听说互补碱基对时,我意识到这就是解开生物学中我们遇到的难题的关键——这就是分子生物学的诞生。这一启示在我与吉姆·沃森一起散步时,通过更深入的交谈获得了验证。那时我意识到,尽管我当时的研究微不足道,但研究噬菌体却让我踏上了进入这个激动人心的新领域的正确道路。1952年12月,我和妻子在伦敦结婚,她也在伦敦攻读心理学博士学位。她获准搬到牛津,直到1954年6月,我们住在伍德斯托克路的一套公寓里,忙于撰写论文,并生了一个孩子,除此之外,还有我的继子乔纳森(Jonathan)。我们总是怀念着故乡南非的食物和温暖气候。当我拜访了冷泉港卡内基研究所实验室主任M. Demerec博士时,我获得了前往美国的机会。Demerec邀请我前往冷泉港,并帮助我获得了卡内基公司旅行奖学金,这使得我在冷泉港夏季结束时能够前往美国各地参观其他实验室。我和吉姆·沃森开车穿越美国,前往加州理工学院,然后我在伯克利病毒实验室与冈瑟·斯坦特(Cal Tech)合作研究了一段时间。我还曾短暂地访问了华盛顿特区。 此次美国之行于我而言意义重大,因为我借此机会结识了当时噬菌体学派众多杰出的研究人员,如塞摩·本泽(Seymour Benzer),他后来成为了我一生的同事和朋友,还有噬菌体学派的创始人马克斯·德尔布吕克(Max Delbrück)、萨尔瓦多·卢里亚(Salvador Luria)以及许多其他注定将在分子生物学这一新兴科学的发展中扮演重要角色的人。我也曾在伍兹霍尔和冷泉港再次见到了弗朗西斯·克里克,并于1954年12月返回南非的途中拜访了他在剑桥的住所。在那次会面中,我们讨论了我将来如何加入他的团队。根据卡内基公司奖学金的条款,我于1954年底返回了南非。我在南非医学院生理学系建立了一个实验室,开始尝试寻找噬菌体系统,以便解决遗传密码问题。我还继续研究遗传密码的一些理论方面,并在这一时期证明了所有重叠三联体密码的不可能性,这一成果被记录在RNA Tie Club笔记中,并由乔治·伽莫夫(George Gamow)转交给《National Academy of Sciences》。弗朗西斯努力帮我在剑桥医学研究理事会单位谋得一份职位,于是1956年12月,我们离开南非,在英国开始了新的职业生涯。我在卡文迪许实验室及其后续机构——医学研究理事会分子生物学实验室进行了所有分子遗传学方面的工作,并在此启动了线虫研究并不断发展。我和弗朗西斯·克里克共用办公室长达20年,我们通过交谈产生了许多新颖而激动人心的想法(既有正确的、也有错误的)。逐渐地,我们的兴趣点开始产生分歧,尽管我们都对神经系统感兴趣,但我更想找到一个简单的实验系统,告诉我大脑是如何构建的,而弗朗西斯则想要了解高级神经系统的复杂活动。他于1976年离开剑桥,加入索尔克研究所,在那里他开始了全新的神经科学研究。1977年,我被任命为医学研究理事会实验室(MRC)的代理主任,于1979年马克斯·佩鲁茨(Max F. Perutz)退休后接任。我立即接手了实验室的财务管理,并花了数年时间努力使财务状况步入正轨。当时英国通货膨胀严重,而我们研究成本的上涨并未得到足够的关注。我常常自嘲为“癫痫式主任”。在此期间,我开始对克隆和DNA测序的新技术如何影响遗传学的研究产生兴趣,并成为人类基因组测序项目的早期和积极支持者。到了1985年,我发现主任的行政工作越来越繁重,干扰了我仍想在研究中做的事情。因此,当有人询问我是否想在1987年任期结束后继续担任主任时,我毫不犹豫地放弃了主任一职,并在继任者上任的1986年离开了实验室。接着,医学研究理事会给了我机会,我得到了一些额外的资源,于是在医学院的协助下,Keith Peters教授也为我提供了空间,我建立了分子遗传学实验室。正是在这个实验室里,河豚项目开始了。然而,在1992年我65岁时,医学研究理事会关闭了这个实验室,但我在其他支持下仍继续进行了几年的实验室工作。与此同时,出于健康原因,我必须在冬季前往气候更温暖的地方,而理查德·勒纳(Richard Lerner)让我得以在加利福尼亚州拉荷亚的斯克利普斯研究所担任兼职,这使我得以实现这一需求。在这里,我发现自己能够追寻化学方面的新兴趣,特别是在化学与生物学交叉领域。我还参与了一家位于旧金山湾区的Lynx公司,在那里,我和另一位朋友山姆·埃雷特(Sam Eletr)共同开发了一种新的大规模并行DNA测序方法。1995年,我创立了分子科学研究所,得到了菲利普·莫里斯公司的资助。我希望能够打造一个环境,让年轻人在和谐的目标和高度的智力挑战中追求科学。2000年,我离开了这个研究所,并在2001年被任命为索尔克研究所的杰出教授,在那里我再次与弗朗西斯·克里克共事。 04 科学家应重视人才培养我欠下了许多恩情。我的父母原本希望我成为一名外科医生或内科医生,但他们非常理解儿子的抱负。我的妻子和家人五十年来一直承受着一位在工作上全神贯注的丈夫和父亲带来的负担。大部分时间都活在自己的世界里,并不意味着在现实世界中的旅程会一帆风顺。在我的科学生涯和所有项目中,许多年轻和年长的科学家都与我并肩作战,他们的工作对我们科学努力的成功至关重要。许多人继续从事重要的科学研究工作,但所有人都记得那些美好的时光,那时我们和我们的科学都还很年轻,我们迎接新挑战时所体会到的巨大兴奋感。我认为,一个科学家的评判标准应该是他所培养的人才的质量,而不是他获得的奖项或其他荣誉。尽管已经76岁高龄(注:这一时间为当时写此文的时间,Brenner已于2019年去世),我仍对科学研究以及生物学领域未来可能取得的成就充满热情。科学是与生命紧密相连的事业,在找到下一份工作之前,人们永远都不应该退休。只要人类存在,对知识的无尽追求就会继续下去。原文链接https://www.nobelprize.org/prizes/medicine/2002/brenner/biographical/

46

04/30

2024

基因编辑猪正在流向我们的餐桌,你会吃吗?

导读很多人对转基因食物谈“转”色变,而到了基因编辑年代,情况又如何?尽管研究表明,基因编辑较之于此前的转基因而言会表现得更为安全,但当这种技术真的要走向餐桌时,是否能够得到大众对其的认可?最近,英国一家名为Genus的公司对猪、牛进行了基因编辑,经过基因编辑后的猪对于并于病毒产生了抗性,预计今年年底向美国食品药物监督管理局(FDA)提交申请。一旦获批,首个基因编辑的猪肉和牛肉将走入我们的餐桌。周 晨 | 撰文01 基因编辑过的猪或将流向市场2023年12月,CRISPR/Cas9基因编辑疗法Casgevy获得美国食品药品监督管理局(FDA)批准上市,Casgevy成为了首个获批的基因编辑疗法。事实上,除了生物医学外,不少人将基因编辑瞄准了食品和农业领域。最近,一家名叫Genus的英国育种公司正使用基因编辑技术来编辑一种猪病毒,这种病毒能够引发一种名为猪繁殖与呼吸综合症(PRRS)的病症,严重情况下可能会导致小猪死亡,每年因该病毒造成的损失总计达到27亿美元。 早在2017年,密苏里大学Randall Prather团队使用CRISPR技术破坏了猪细胞中病毒用来建立感染的受体CD163,从而使猪对PRRS具有抵抗力。在那之后,Randall Prather与Genus公司保持了长期的合作。今年2月,Genus公司在CRISPR Journal杂志上发表报告称,该公司通过在转移到母猪的早期胚胎中进行基因编辑,然后对后代进行进一步繁殖,修改了用于商业生产猪肉的四种猪系动物,并最终创造了两个拷贝的CD163基因都被破坏的品种。Genus公司,称已将“概念验证工作转化为商业规模”。目前,该公司计划在年底向FDA申请批准这些猪上市,而这些猪一旦成功上市,不仅意味着这将成为首次批准的基因编辑动物类食品,同时还意味着基因编辑类食品正在流向人类的餐桌。除此之外,Genus公司还在寻求全球最大的猪肉消费国——中国,获得监管批准。基因编辑过的猪,能够获得认可吗?02 业内人士如何评价基因编辑猪?对于基因编辑猪这一事件,加利福尼亚大学戴维斯分校的动物遗传学家Alison Van Eenennaam表示了赞许,她认为这将使农民、猪和最终消费者受益。 Alison Van Eenennaam北卡罗来纳州立大学食品科学家、CRISPR Journal主编Rodolphe Barrangou认为,这项研究是将基因编辑的家畜带入广泛市场的“开始”,因为许多农民可能会希望拥有对PRRS具有抵抗力的猪。尽管得到了许多科学家的认可,但基因编辑猪想要上市远没有这么简单。FDA对Genus的批准苛刻程度堪称对新药的审查,需要Genus公司证明的东西包括:多份文件、证明修改后的基因的安全性、能够被遗传以及在几代猪中的稳定性以及由此产生的猪对病毒的抵抗力。Van Eenennaam为此忿忿不平,因为她认为这“是一条非常昂贵的监管路径”,而这种昂贵的路径是不必要的。与基因改良的生物不同,基因编辑涉及到动物自己的DNA,而这也是基因编辑被认为安全系数较高的原因。或许是因为基因编辑食品正在不断涌现,因此美国国家科学院、工程和医学研究院整计划举办一场关于基因编辑食用动物的研讨会,监管环境将成为基因编辑食品的下一个讨论焦点。03 基因编辑食物会得到大众的认可?随着全球人口激增以及人类对食品营养价值需求的增加,动植物育种领域迎来了全新的挑战,在此前,转基因技术一度改变了全球许多地区的农业和粮食生产,然而由于缺乏科学共识,再加上一些人对转基因食品外来基因片段可能引发安全隐患的担忧,因此尽管各国科学家花费了大量的时间和精力在转基因领域,但遇到许多阻力。而基因编辑技术则因无外来基因片段引入而被认为安全性能较高,得到了许多植物育种科学家们的青睐。2014年,CRISPR/Cas9系统首次应用到水果和蔬菜之中。冷泉港实验室的Christopher Brooks团队设计了一个与番茄SlAGO7基因的第二外显子相邻的sgRNA,该基因的大片段缺失导致典型的复杂叶子变成针状或丝状的表型。2017年,冷泉港实验室的Zachary B. Lippman等人通过使用CRISPR/Cas9技术敲除番茄中的SlCLV3基因,增加了番茄的产量。到目前为止,FDA已经正式批准了两种基因修饰过的动物:其中一种是一种含有其他鱼类基因的三文鱼,这种基因能够让三文鱼生长更快,还有一种是由Revivicor制造的GalSafe猪,其DNA插入以破坏其细胞表面上一种糖分子的基因,预计将在今年晚些时候投入商业生产。然而这两种食物似乎都没有得到市场的买账,由于消费者对食品安全的担忧,这些食品的销售额受到限制,因此尚未被普及开来。 这也是目前研究基因编辑动植物的育种公司必须面临的一个问题,那就是消费者情绪问题。“在地球上任何地方都不会像一个开关一样,突然间每个人都有编辑过的猪,这将更像是一个调光开关……而且我们仍然需要就市场接受度进行很多讨论”。专家表示。参考资料1.Poised to be first widely consumed gene-edited animals, virus-resistant pigs trot toward market.Science.2.FDA批准首款CRISPR基因编辑疗法,为下一代技术奠定基础.澎湃新闻.3.Engineering Quantitative Trait Variation for Crop Improvement by Genome Editing.cell.4.Efficient Gene Editing in Tomato in the First Generation Using the Clustered Regularly Interspaced Short Palindromic Repeats/CRISPR-Associated9 System.NIH.5.Development and prospect of gene-edited fruits and vegetables.Oxford Academic.

48

04/25

2024

再陷造假漩涡,诺奖得主Südhof承认3篇论文有误,“这给实验室年轻人带来毁灭性打击”

导读近日,2013年诺奖得主Thomas C. Südhof又陷入了争议,由他主导的3篇论文被指存在图片复制问题。Südhof承认了图片确实存在问题,但他同时表示,“那些被发现的错误与科学完全无关,这些错误不会改变论文的结果。”被指出问题的论文第一作者均是他实验室的成员。此次被曝出论文图片问题,Südhof认为,“这对实验室里的年轻人,尤其是女科学家来说是毁灭性的打击。”林 岩 | 撰文诺奖得主Thomas Südhof实验室论文似乎争议不断。近日,他承认了其中三篇论文存在问题。Südhof于1955年出生,今年69岁,是一位德国生物化学家,现在在斯坦福大学工作,他以研究突触传递而闻名于世,并由此与James Rothman和Randy Schekman 一同分享2013年诺贝尔生理或医学奖。Thomas C. Südhof然而,自今年3月以来,这位大名鼎鼎的诺奖得主可谓焦头烂额,没有哪一位学者希望自己的论文登上PubPeer网站,而Südhof的23篇论文正在PubPeer网站上被网友拿着放大镜找茬。Südhof不得不在斯坦福医学院罗列声明予以澄清。PubPeer于2012年创立,是一个学术论坛网站,允许所有注册用户匿名对已发表的研究进行评论。2014年该网站因用户打假小保方晴子(Haruko Obokata)关于STAP细胞研究的论文,促使其文章被Nature撤稿的事件而声名鹊起。目前,PubPeer已成为学术界论文打假的重要战地。 Elisabeth Bik是一位在学术打假领域颇有名气的人物,她自己本身也是一位微生物学家。Bik今年3月将打假重心瞄准了Südhof,她指出由Südhof领导的三篇论文可能存在图像复制问题的问题。其中2篇分别于2012年、2018年发表在Journal of Neuroscience杂志上,另一篇论文则于2021年发表在Cell杂志上。Südhof承认了这三篇论文中存在图片复制错误问题,目前已经联系了这些期刊进行更正,但Südhof强调,“那些被发现的错误与科学完全无关,不会改变论文的结果。”据悉,Südhof实验室这篇2012年的论文研究了突触蛋白α—突触核蛋白的生理功能及其突变的病理效应。这项研究的第一作者Jacqueline Burré,曾是Südhof实验室的博士后研究员,现为威尔康奈尔医学院神经科学副教授。Bik标记了其中两个数据以及重复的图像,但她表示,“错误确实并不影响研究结果。”2018年的这篇论文同样存在图片复制粘贴的问题,第一作者为Erica Seigneur,曾经是Südhof实验室的博士,目前在斯坦福大学的另一个实验室做博士后研究。Seigneu本人表示,她在研究大脑中小脑蛋白分子的功能时,把两个图形组合在一起时犯了错误。而2021年这一篇关于RTN-4结合蛋白的论文,由Südhof实验室Jie Wang博士后研究员作为第一作者,被Bik指出两幅图存在重复,实际上这篇论文在2022年1月就因缺少引用被Südhof团队更正过一回。Südhof相关的23篇文章正在PubPeer讨论Südhof回应实验室被质疑的论文情况总结此外,23篇正在PubPeer网站讨论的文章中,Südhof团队已经承认了其中11篇存在17个错误,并将这一消息公布在实验室网站上。这些错误并非一开始就自查发现,而是在PubPeer引起广泛讨论后作的声明。对此,打假斗士Bik表示,“已发现的大多数错误看起来都像是马虎的错误,而不是故意的不当行为,23篇论文在Südhof发表的600篇论文中也只是一小部分。”而Südhof认为,“这对实验室里的年轻人,尤其是女科学家来说是毁灭性的打击”。参考资料 Nobel Prize winner acknowledges errors in three more papershttps://www.thetransmitter.org/publishing/nobel-prize-winner-acknowledges-errors-in-three-more-papers/

48

04/18

2024

预印本的春天?盖茨基金会新政将拒付APC,挑战学术出版旧规则

导读很多学术期刊读者在获取论文阅读权时需要付费,甚至论文作者在想要查看自己的论文时,也需支付费用,即使是开放政策期刊,作者也要支付“天价”的版面费。近期,盖茨基金会计划颠覆科学出版业的传统规则,他们停止支付APC,并打算投资更为公开的出版模式——预印本,让读者或受众实现论文的免费开放获取。根据Nature报道,盖茨基金会还宣布,自2025年1月1日起,所有受其资助的学者必须将自己尚未被期刊接受或经过同行评审的文章以预印本的形式公开发表,以此来推动学术研究的广泛传播与共享。齐 萱 | 撰文在过去,当一位研究人员正全身心地投入到一项研究时,他满怀期待地找到了一篇似乎能为他指明方向的科研论文,并试图触及这扇知识的大门时,却遭遇了科学期刊筑起的付费墙。获取这些论文的费用,往往非常高昂。个人订阅期刊,每年的开销动辄数百乃至数千美元,而对于机构来说,这一费用更是高达数百万美元。收费墙之外还存在出版费用,即所谓的文章处理费(APC),更是昂贵得令人咋舌,单篇文章的处理费便少则上千美元,高的可要上万美元。即使是资金雄厚的机构,这笔费用也是一笔巨额的负担,诸如盖茨基金会,也苦APC久矣。 事实上,很多研究都是由政府和基金会资助,研究结果呈现的文章由科学家免费进行同行评议,然而到了出版环节,许多期刊却通过收费政策限制对研究论文的开放获取。01 盖茨基金会将停止APC付费,鼓励推行预印本3月27日,比尔及梅琳达盖茨基金会(Bill&Melinda Gates Foundation)在其官网宣布了最新的开放获取政策,将停止对APC付费,鼓励推行预印本。新政策核心内容如下:1.基金会停止支付个人文章出版费,如APC,为更公平的出版模式铺平道路。2.要求受资助者分享他们文章的预印本,打破期刊的限制,同时优先获得研究成果并保留受资助者的出版选择。 盖茨基金会由比尔·盖茨与梅琳达·盖茨夫妇于2000年创立,是全球最大的私人慈善基金会之一,致力于通过创新的方式减少全球在健康、教育和发展领域的不平等现象。在生命健康领域,基金会投入大量资金和资源,支持疫苗研发、传染病防治、卫生系统建设等项目,为全球公共卫生事业做出了重要贡献。自2015年以来盖茨基金会每年向APC(Article Processing Charges,文章处理费)支付的费用高达600万美元,截止目前高达6000万美元,基金会高级项目官员 Estee Torok表示,“这笔钱可以更好地花在其他地方。”预印本是研究论文的完整草稿,在同行评审之前公开分享,这并不是一个新概念。按照盖茨基金会最新的政策,他们将会把这笔钱投入到OA(open access)系统的开发,并将目光瞄向了预印本。02 知识共享是一项基本权利早在2015年,盖茨基金会就要求接受其资助的学者需要将研究论文放在开放的数据库中,以让读者免费获取。经过10年的经验,今年盖茨基金会更是提倡知识共享是一项权利,应透明、开放、公平。知识的价值不仅仅在于它的创新性和实用性,更在于它的共享性和传播性。盖茨基金会宣布新政策的初衷就是为了打破传统出版模式中的付费墙,使得研究成果得以开放获取,不再被少数人或机构所垄断。佐治亚理工学院的计算生物物理学家Lynn Kamerlin对于此次盖茨基金会的行为表示赞赏,“这是一个非常明智的决定。”在疟疾、结核病、艾滋病病毒、病毒性肝炎、抗菌素耐药性以及冠状病毒病领域工作了20多年的Mugisha表示,“当访问是免费的时候,每个人都将受益。”03 预印本或将蓬勃发展在科研领域,盖茨基金会堪称一位重磅资助者,仅2024年的预算就高达86亿美元。尽管这一数字相当惊人,但在全球庞大的研究资助版图中,盖茨基金会所占的比例依然仅占一小部分。然而,鉴于盖茨基金会的影响力,基金会最新发布的新政策很有可能引来其他资助机构的效仿。 在众多推行OA出版的国家中,已有不少开始拒绝支付文章处理费(APC),这一趋势与盖茨基金会的政策不谋而合,或许科研出版领域的变革正在悄然发生。在此次新政策的第六条中,盖茨基金会明确鼓励受资助者提交手稿的预印本。主要预印本平台鉴于免费提供预印本与付费后的最终版本的质量可能会有所不同,预印本可能会存在某些错误,这让不少学者担忧,但Kamerlin指出,“越来越多的预印本出版商允许作者根据需要多次更新他们的预印本,这可以缓解这种担忧。”盖茨基金会也计划将从APC上节约下来的资金,用于投资更公平的OA模式——不向作者或读者收取费用的系统,并将聚焦于预印本平台的投资。也许不久的未来,预印本将迎来蓬勃发展期。参考资料1.Who loses when scientific research is locked behind paywalls?https://www.gatesfoundation.org/ideas/articles/research-paywall-open-access 2.Will the Gates Foundation’s preprint-centric policy help open access?https://www.nature.com/articles/d41586-024-00996-8

47

04/09

2024

最新研究 | Cell刊发复旦大学等高校对非洲人群复杂演化历程分析

现有研究表明,现代人类起源于非洲,相比于其它大陆,现代人类在非洲居住时间最长,并且在迁徙,融合和对环境适应性进化的过程中形成了超过3000个民族和2100种语言。目前非洲人群不仅具有世界上最丰富的遗传多样性和表型多样性,并且现代人类近三分之一的语言都在非洲,是全世界语言最为多样化的地区之一。然而,目前的遗传学和基因组学的研究中,只有不到3%的样本来自非洲,存在严重的滞后性。研究非洲人群遗传多样性不仅将加深我们对于现代人类起源、早期遗传结构以及适应性进化的理解,并且也能为健康和诊断研究及开发提供丰富的新遗传信息。北京时间3月3日,国际顶尖期刊《细胞》(CELL)以“全基因组测序揭示非洲人群的复杂演化历程与对环境的适应性进化(Whole-genome sequencing reveals a complex African population demographic history and signatures of local adaptation)”为题在线发表了封面文章,呈现了以复旦大学生命科学学院和人类表型组研究院樊少华青年研究员为第一作者、宾夕法尼亚大学遗传学系莎拉·蒂什考夫(Sarah A. Tishkoff)教授为通讯作者的国际科学团队历时7年完成的最新研究成果。该研究对极具代表性的非洲12个群体的180位个人进行了全基因组测序分析。这些民族地理分布广泛,以种植农业、打猎收集和游牧等不同方式为生,并且涵盖了非洲四个主要的语系。外域基因渗入与严重群体瓶颈导致部分非洲人群遗传多态性低基于人类参考基因组,研究共发现3200万个单核苷酸多态性位点(single nucleotide polymorphism, SNP),其中大约530万个位点是在之前没有发现的。这些新发现的突变广泛的存在于增强子、启动子以及转录因子结合位点等基因组功能区域。研究发现12个非洲民族的平均SNP个数和遗传多态性均具有显著的差异。以打猎和收集为生的桑人(Ju|’hoansi和!Xoo)和热带雨林小矮人(rainforest hunter-gatherther, RHG)的SNP数量和遗传多态性最高,而Amhara,Fulani,Chabu以及Hadza等民族的遗传多态性则最低。而大量非洲外人群的基因渗入(在Amhara和Fulani人群中)以及严重的群体瓶颈(在Hadza和Chabu人群中)是造成部分非洲人群体遗传多态性低的主要原因。例如,生活在坦桑尼亚的Hadza和埃塞俄比亚的Chabu群体的人口数量已经少于1000人。现代桑人与热带雨林小矮人的共同祖先在现代人类进化中最早发生分歧在研究中,科学家利用邻近距离法(Neighbor-joining method)对本研究中的12个民族,和来自“千人基因组计划”的欧洲人群(CEU)、北方汉族人群(CHB)、托斯卡纳人群(TSI)以及来自“西蒙斯基因组多态性研究计划”中的巴布亚人群(Papuan)进行了系统计划分析,结果显示现代桑人的遗传学祖先是现代人类最早发生分歧的一支,随后发生分歧的是热带雨林小矮人的祖先。现代桑人和小矮人祖先的早期分歧的现象也被主成分分析(principal component analysis, PCA)和ADMIXTURE所支持。研究发现,不同民族在系统进化树的聚类模式与他们目前所处的地理环境显著相关,这说明地理环境是制约不同民族间基因交流的重要因素。当然,由于存在基因交流和遗传重组等因素的影响,上述邻近距离法、主成分分析和ADMIXTURE无法用来构建现代人类早期遗传结构。而当科学家将这些因素全部纳入到复杂模型中进行计算分析时却进一步发现:现代桑人和小矮人的共同祖先,而不是现代桑人的祖先,是现代人类最早分歧的一支。并且研究推断现代人类的分歧发生在28万年前,这与之前的考古和基于古DNA检测推断的时间一致。同时,科学家们在本研究中利用PCA和ADMIXTURE分析,还在目前坦桑尼亚说Kheosan语言的Hadza和Sandawe的基因组中发现了桑人相关的祖源成分。虽然仅有南部非洲的桑人以及东非坦桑尼亚的Hadza和Sandawe说Khoesan语言,但本项研究利用PCA分析,将全球之前已发表的来自不同地区的55个古非洲人样本投射到现代非洲人样本中后发现,大量的来自不同地区的古非洲人样本投射位于桑人和东非的Hadza与Sandawe人群之间,但是这些地区目前却没有讲Khoesan语言的民族。该结果提示,Khoesan语系在非洲的地域分布曾经很广,遍及整个非洲, 但可能受到班图大迁徙的影响,目前说Koesan语的古非洲人群大都灭绝了。发现导致非洲桑人肤色较浅的关键突变研究中,科学家团队还结合正选择分析的算法、功能基因组学手段和方法以及大规模全基因组关联分析的结果,对12个非洲民族特异的适应性进化进行研究,全面绘制了一副非洲人群适应性进化的图谱。肤色多样性是现代人类对于不同维度地区适应性进化的一个重要标志。桑人是非洲人群中肤色最浅的民族,但是研究对于桑人浅肤色的遗传学基础仍然缺乏了解。利用功能基因组学等方法,本研究发现一个位于PDPK1基因内部增强子的突变rs77665059-C,是影响桑人浅肤色的一个决定性的因素。该增强子仅在黑色素细胞中特异活跃,使用Crispri沉默该增强子会降低PDPK1基因的表达量和黑色素和合成。研究进一步发现rs77665059-C在桑人部分人群中频率超过了80%;但是在其它非洲(平均频率14%)和非洲外民族中(平均频率3%)频率却非常低。研究发现rs77665059-C突变会导致PDPK1基因增强子在黑色素瘤细胞系中活性降低,降低PDPK1基因的表达,并且与桑人中的浅肤色表型显著相关,这为桑人浅肤色进化的研究提出了新的遗传学解释。樊少华从2018年起,在复旦大学工作。主要研究方向包括:人类迁徙、分歧时间以及遗传结构;适应性进化对不同民族表型多样性和疾病易感性的影响;基因组结构变异的对于表型多样性的影响。以第一作者在Nature、Science、Cell等高水平学术期刊上发表论文,目前总引用超过3800次。原文链接:https://www.cell.com/cell/fulltext/S0092-8674(23)00101-0

48

04/03

2024

最新数据显示:各国癌症正趋向年轻化

导读16岁的花季少年,本应怀揣梦想、奔跑在青春的田野,却不幸被甲状腺癌的阴影笼罩;25岁的女孩,正处于人生灿烂的时刻,却与肺癌不期而遇。年轻的生命正在遭受癌症的侵蚀。不仅在我国,全球范围内,癌症正悄然伸向年轻人。最近,出炉的肿瘤报告数据显示,年轻人癌症的发病率正以惊人的速度攀升。林 岩 | 撰文年轻人往往认为自己年富力强、身强体壮,对饮食和身体健康的照顾就显得漫不经心。在他们看来,疾病似乎总与年老体衰紧密相连,癌症似乎是老年人才会遭遇的厄运。然而,现实却像一盆冷水,狠狠地将他们从这种错觉中浇醒。最新数据显示,癌症已经盯上了年轻人。01 我国最新肿瘤数据:癌症正袭击年轻人2024年2月初,我国国家癌症中心基于肿瘤登记及随访监测最新数据,发布了“2022年中国恶性肿瘤疾病负担情况”。 在这份报告中,值得我们注意的是,癌症发病年龄与过去相比有了不少变化。45岁以下癌症发病率有了显著增长,各类癌症在0-20岁年龄组的发病率相对较低,但自20岁以上,癌症发病率显著上升。当然随着年龄的增长,癌症的发病率越来越高,最终达到峰值,但癌症年轻化是我们不得不面临的现实。02 各国癌症都在呈现年轻化Cathy Eng是一名美国田纳西州范德比尔特大学的肿瘤专家,近日他接诊了一位从中国飞到美国治疗胃肠道癌晚期的16岁少女,父母为了给她治病,卖掉了房子。 这让Eng极为震惊,在以往胃肠道癌常常发生在老年群体身上,在接诊这位远道而来的少女后,他无奈地表示,“她的病情非常严重,我无能为力。”除了Eng之外,众多直接与肿瘤患者打交道的医生也敏锐地捕捉到了癌症年轻化这一令人忧虑的趋势。 比如,印度孟买的George Barreto医生也是如此,这些医生以及专家耗费了数年的时光,精心搜集证据,最终证实了这一事实。 据全球各国的癌症统计数据显示:在50岁以下的成年人群体中,竟有十几种癌症的发病率正悄然攀升。这一现象的严重程度因国家、癌症类型的不同而有所差异,但依据全球数据建立的预测模型显示,从2019年至2030年,早发癌症的病例数预计会激增约30%。 在美国,结肠直肠癌这一过去常常侵袭60岁以上男性的疾病,如今却已成为50岁以下男性癌症死亡的首要原因。更令人痛心的是,在年轻女性群体中,它竟已跃居癌症死亡的第二大杀手。 早发性癌症(通常定义为发生在50岁以下的成年人),尽管仍只占总病例的一小部分,但发病率一直在上升。这一上升,加上全球人口的增加,意味着1990年至2019年间全球早发癌症死亡人数上升了近28%。 在早发癌症中,结肠直肠癌、胰腺癌和胃癌的发病率增长最快。但其他癌症——包括乳腺癌和前列腺癌——也呈上升趋势。 在美国,自20世纪90年代中期以来,50岁以下的成年女子子宫癌每年以2%的速度增长。2016年至2019年,早发乳腺癌每年增加3.8%。 这一系列的数据和事实,无不向我们敲响了警钟:癌症年轻化已经成为一个不容忽视的全球性问题。03 是何原因导致年轻人患癌激增?癌症趋向年轻化的原因复杂且多面,有专家认为肥胖率的上升和饮食习惯的改变或许是其中的因素之一。 随着现代生活节奏的加快,人们的饮食结构发生了显著变化,加工食品在日常饮食中的比重逐渐增加。这种富含油脂和添加剂的饮食模式,不仅容易导致肥胖,还可能对胃肠道健康产生不良影响,进而增加患胃肠道癌症的风险。 肥胖率的上升与癌症年轻化趋势之间也有着关联。肥胖不仅影响个体的外貌和自信心,更重要的是,它还会引发一系列健康问题,包括内分泌失调、免疫功能下降等,这些都是癌症发生的潜在风险因素。 然而,仅仅将癌症年轻化归因于肥胖和饮食习惯的改变是远远不够的。 新加坡国立大学肝病学家Daniel Huang表示,“许多人假设,肥胖和饮酒可能可以解释癌症年轻化。但实际上还需要更深入地了解这些数据。” 目前,研究人员还在探索其他可能的因素,如人体内的微生物组成。微生物群的破坏,如由饮食改变或抗生素使用引起的,已被证实与炎症和多种疾病的风险增加有关,其中就包括某些形式的癌症。 尽管目前关于微生物组与早发性癌症之间联系的研究仍处于初步阶段,但这一领域无疑为我们揭示了癌症发病机制的另一面。 未来,随着研究的不断深入和技术的不断进步,我们有望更加全面地了解癌症年轻化的原因,从而为预防和治疗癌症提供更加有效的策略。 参考资料 1.Why are so many young people getting cancer? What the data sayhttps://www.nature.com/articles/d41586-024-00720-62.国家癌症防控平台 (chinancpcn.org.cn)

46

03/25

2024

英矽智能Nat Biotech最新论文:揭示靶向TNIK的抗特发性肺纤维化药物发现流程及原始数据

导读“人工智能赋能药物发现正在产生重大影响,它让药物开发周期更短、更便宜,且有更高的成功率”。最近 ,知名跨国药企赛诺菲CEO Paul Hudson在《财富》撰文,指出人工智能制药正在变革药物研发。早在一年前,Hudson就提出赛诺菲要All in人工智能和数据科学,以加速药物开发。事实上,全球制药领域已经开启了拥抱人工智能制药的浪潮,赛诺菲只是其中一员,辉瑞、罗氏、默沙东等医药领域的MNC巨头也表现出了相当大的热情。然而,至今仍未有一款人工智能赋能的药物真正来到临床应用阶段,围绕人工智能制药的“hope or hype(是希望还是舆论炒作)”的争论持续不休。3月8日,英矽智能在Nature Biotechnology杂志发表重要论文,详细介绍了由AI筛选出来的抗特发性肺纤维化药物(IPF)——INS018_055四年间从算法到患者给药的历程,为人工智能的制药潜力再添一笔。 叶水送 | 撰文3月8日,英矽智能在Nature Biotechnology杂志发文,对INS018_055药物抗特发性肺纤维化的作用靶点、临床前结果和已有临床试验数据进行了详细披露。Ren, F. et al. A small-molecule TNIK inhibitor targets fibrosis in preclinical and clinical models. Nat Biotechnol (2024). https://doi.org/10.1038/s41587-024-02143-0近两年来,作为人工智能制药领域的优秀代表英矽智能,不仅在医药工业界屡创佳绩,在学术上也不断有高水平论文发表,距离上一次在Nature Medicine上发论文近过去一个月。01 从靶点筛选到抗IPF药物的开发过程特发性肺纤维化(Idiopathic Pulmonary Fibrosis,简称IPF)是医学界的难题,困扰全球数百万患者,而其病因至今仍未探明。尽管很多研究者不断地探索潜在药物靶点和创新药物,但鲜有能真正转化为有效临床治疗的突破。英矽智能(Insilico Medicine)从未满足的临床需求出发,布局这一领域的药物开发,以纤维化这一生物过程为切入点,探索创新治疗方案,并于2021年2月提名全球首款“AI药物”INS018_055靶向IPF。同年11月,该药物启动在澳大利亚开启微剂量人体试验。2022年2月,该药物在新西兰和中国同步开启1期临床试验。2023年2月,英矽智能公布I期临床试验积极数据,同月该药物获得美国食品药品监督管理局(FDA)的孤儿药资格认定。2023年6月,INS018_055抗特发性肺纤维化在中美两地开启II期临床试验。 此次在Nat Biotech最新发表的论文中,英矽智能利用自研靶点发现平台PandaOmics,基于基因突变、因果分析、分子通路以及表达谱等模块进行评分,将TRAF2和NCK相互作用激酶TNIK鉴定为抗纤维化的第一候选药物靶点。TNIK属于胚中心激酶家族(germinal centre kinases)的一员,参与细胞骨架的构成和神经树突细胞的伸展。此前的研究多涉及该靶点在肺鳞癌、肥胖等方面的作用,在抗纤维化方面则鲜有研究,将其作为特发性肺纤维化的潜在治疗靶点的假说更是前所未有。也就是说,在抗纤维化疾病治疗方面,TNIK是一个全新的靶点。PandaOmics平台筛选抗纤维化靶点INS018_055药物作用于TNIK靶点如何具有抗纤维化作用?据论文揭示,这主要是TNIK与纤维化进展中的多个关键生物过程相关,如焦点粘附信号传导、肌成纤维细胞分化和间充质细胞迁移等。此外,TNIK靶点与已知的特发性肺纤维化相关的基因紧密相关,包括TGFβ1、FGF、FLT1、KDR等。 INS018_055药物作用于TNIK靶点,调控多个分子通路此外,PandaOmics平台使用复杂的系统生物学方法发现TNIK是一个潜在的泛组织纤维化靶点,有望对包括皮肤、肾脏和肺纤维化在内的多种泛纤维化适应症产生作用,研究还发现该靶点与衰老的生物标志物有关,表明其具有更广泛的治疗潜力。基于肺和肾纤维化数据集分析产生的潜力靶点,Chemistry42平台经过多轮优化筛选和合成测试,最终生成针对TNIK靶点的小分子先导化合物INS018_055。通过TNIK激酶蛋白结构分析,AI模型预测小分子抑制剂的结构特征,从而指导INS018_055药物的合成此后,研发团队利用生成式人工智能分子生成平台Chemistry42针对TNIK靶点蛋白结构进行新颖药物分子生成和虚拟筛选,最终开发出候选药物INS018_055,这是一种小分子TNIK抑制剂,可通过口服、吸入或局部给药的方式,在体内对不同器官表现出抗纤维化活性。据悉,从靶点发现到临床前候选化合物INS018_055的最终提名,这项工作大约用了18个月的时间,仅为传统药物研发流程的三分之一左右。02 抗 IPF药物临床前和临床数据披露IPF是一种慢性、进行性、纤维化性的间质性肺疾病,其特点是肺部的正常组织被过度增生的纤维组织所替代,导致肺功能逐渐丧失。就像硬化的海绵难以再吸取水分,纤维化的肺部会失去气体交换的能力,直接导致呼吸困难、肌肉和关节疼痛等症状,甚至危及生命。 正常人和特发性肺纤维化患者肺部特征目前,IPF的治疗主要集中在减轻症状、控制病情进展和提高患者生活质量上。常用的治疗方法包括药物治疗(如免疫抑制剂等)、氧疗、肺康复锻炼等。此外,一些新兴的治疗方法,如基因治疗和干细胞治疗等也取得了一定的进展。然而,现有疗法无法逆转或阻止肺部纤维化进展,IPF患者的中位生存期仅为3-5年。 此项研究中,INS018_055药物针对特发性肺纤维化,在临床前动物模型实验中表现出良好的安全性、耐受性以及药代动力学特征。研究者采用了博莱霉素诱导的肺纤维化和LPS急性肺损伤造模的小鼠模型进行测试,结果表明INS018_055能有效抑制关键的纤维化途径,类似的结果在大鼠模型中也得到了验证。INS018_055在体内的药代动力学结果论文还介绍了在I期临床试验阶段不同剂量的INS018_055在体内的药代动力学结果。单次剂量递增和多次剂量递增队列试验均显示,INS018_055在健康受试者体内有良好的吸收、分布、代谢特征。中国医学科学院北京协和医院主任医师徐作军曾在INS001_055 II 期临床试验启动会上表示,“英矽智能的INS001_055是一款具有划时代意义的药物,通过人工智能的方法发现了创新的疾病阻断路径,期待INS001_055的II期临床研究能为IPF患者带来临床获益。”伴随这篇论文发布,英矽智能还上线了论文解读引擎PaperGPT和论文补充资料DataRoom。前者在ChatGPT-4 Turbo和其内部大语言模型(LLM)基础上,通过互动式问答提供与论文相关问题的专业解答。后者囊括了大量论文补充资料,从PandaOmics发现靶点的软件录屏,到部分临床前和临床验证的原始数据。(有兴趣可点击访问:https://papers.insilicogpt.com/)03 从概念到产业,AI制药的系列研究成果这两年,人工智能筛药从靶点识别到临床前候选化合物的高效生成,大幅缩减了传统药物研发的漫长周期。无论是英矽智能,还是其他人工智能制药公司都得到了快速发展。 以英矽智能为例,除了此次TNIK项目,近一年还在多个顶级期刊发表论文,生成式AI技术正在推动行业变革。2023年7月14日,苏黎世大学遗传性肾脏疾病机制(MIKADO)小组利用英矽智能自有靶点发现平台PandaOmics在Nature Communications期刊上发表了一篇研究,探究了溶酶体贮积症的致病机制,并成功发现了新的治疗靶点。2023年7月,英矽智能在药理学权威期刊Trends in Pharmacological Sciences上发表了观点性文章,详细阐述了靶点发现从传统实验方法到多组学分析、机器学习辅助,再到人工智能驱动的范式转变过程,并分享了关于靶点评估的独到见解。2023年8月,美国西奈山伊坎医学院的研究人员利用英矽智能自主研发的生成张量强化学习模型(GENTRL)和算法评分平台MOSES,成功生成并验证了多个具有创新性的Kappa型阿片受体(KOR)拮抗剂小分子。相关研究成果已发表在Journal of Chemical Information and Modeling期刊上。在AI赋能老龄化研究领域,英矽智能同样表现活跃。2023年12月初,英矽智能发表综述文章,指出人工智能技术在探索生理变化、确定生物标志物以及预测潜在抗衰老目标和化合物方面的应用日益广泛。值得一提的是,2024年2月,英矽智能创始人兼联合首席执行官Alex Zhavoronkov博士作为共同作者的一篇研究论文在Nature Medicine上发表。该研究基于多组学数据人群分析对现有衰老生物标志物进行了有效性评估,并提出了有望加速抗衰干预措施临床试验的系统性验证方法框架。 总的来说,作为人工智能制药领域的头部代表,英矽智能展示了人工智能在药物临床前和临床试验中发挥重要的作用和潜力。在当下经济不确定性、人力成本不断上升的背景下,人工智能应用于制药领域,不仅使得药物研发更加精准和高效,提高了临床试验的成功率,还能很好地达到降本增效的目的。正如赛诺菲CEO Paul Hudson表示,“我们有理由相信,通过人工智能,我们正处于一个伟大发现时代的风口浪尖,这个时代可能会从根本上改变医学领域。”参考资料1.Sanofi CEO: AI promises a great era of drug discovery that could fundamentally change medicine–but only if we allow it to deliverhttps://fortune.com/2024/02/19/sanofi-ceo-ai-promises-great-era-drug-discovery-fundamentally-change-medicine/2. Ren, F., Aliper, A., Chen, J. et al. A small-molecule TNIK inhibitor targets fibrosis in preclinical and clinical models. Nat Biotechnol (2024). https://doi.org/10.1038/s41587-024-02143-0

49

03/19

2024

每年投资超10亿英镑,它成为全球生物医学界最大的“天使投资人”

导读众所周知,生物医学项目很烧钱,这些项目的钱究竟从何而来呢?除了政府的基金外,私人基金会也是重要来源。世界上有许多基金会专门会为生物医药投资,惠康基金会(Wellcome Trust)便是其中的佼佼者。据统计,每年惠康基金会的投资金额超10亿英镑。作为一家具有88年资历的老牌慈善机构,惠康基金会专攻科学研究,多年来在生物医药领域有着不少大手笔,它不时将目光瞄准顶尖的科学前沿。周 晨 | 撰文2024年1月15日,惠康基金会发布最新消息,未来将启动2000万英镑的新资金,支持英国的黑人、孟加拉和巴基斯坦裔研究人员从事研究并推进他们的职业生涯。惠康基金会秉持包容性的原则,致力于让不同背景的研究人员做出贡献,并分享他们的见解和专业知识。01致力于改善健康惠康基金会的成立离不开一个人——亨利·惠康(Henry Wellcome)。1880年,身为药品推销员的惠康和好友西拉斯·巴勒斯(Silas Burroughs)在英国伦敦创办了一家名为巴勒斯(Burroughs)的新公司。在当时草药盛行的年代,药片还是稀罕物,从美国积攒丰富药片推销经验的惠康将这一物品带到了英国。创建之初,惠康与巴勒斯利用大规模医药生产和营销,迅速在英国医药领域打开了市场,尽管惠康一天都没有在实验室呆过,但他却成为了现代制药业领域的大人物,也因此积攒了丰厚的资产。1936年,惠康去世。在遗嘱中,惠康留下了三样东西:财富、收藏的历史医学物品,以及通过研究改善健康的使命。 为了贯彻惠康的遗愿,资产管理者成立了惠康信托基金,用于资助健康相关的研究项目。在最开始的30年里,惠康信托基金规模还比较小,只是由一个小型董事会管理,负责审核资助申请,赞助的领域也只在药理学、热带医学领域。而到了1967年,惠康基金会做出了调整,将焦点转向支持研究人员个人,这也导致了申请量的激增。由此,惠康招聘了更多员工。除此之外,惠康基金的资助范围也持续扩大,不仅支持英国大学,还扩展到英国以外的研究单位,并涉足医学史领域。1995年,惠康基金将医药公司出售给医药巨头葛兰素史克(GlaxoSmithKline),由此获得了“财富自由”。惠康也因此迅速崛起,成为全球领先的慈善机构。对于基金会的资产,惠康进行了组合投资,截至目前,资产已累计达380亿英镑。除了加强对个人和研究中心的资助,惠康基金会还开始支持将科学进步转化为临床试验的项目,并鼓励公众参与科学。惠康与合作伙伴共同实施大规模计划,如惠康桑格研究所,该所对人类基因组计划的三分之一进行了测序。 02 生物医学界的天使投资人如今,惠康基金会致力于运用科学解决紧迫的健康挑战。其工作计划分为四个板块,包括基础研究、气候与健康、传染病、心理健康。在基础研究方面,惠康的使命是“通过好奇心驱动的研究,跨越各种观点和背景,改变对生命、健康和福祉的理解”。图源 Wellcome Trust官网在基础研究投资中,惠康会格外关注创新和意外发现,通过资助跨学科、好奇心驱动的研究项目,可以打破传统的研究界限,因此惠康资助了人类细胞图谱等科学计划。在气候与健康方面,惠康希望“创造一个世界,在这个世界里,气候崩溃能够以一种让人类健康蓬勃发展的方式得到保障”; 在传染病方面,惠康希望“减少传染病升级的风险和影响”;在心理健康方面,惠康希望“建立一个没有人为心理健康拖累的世界”。截至目前,惠康资助的科学计划包括流行病防范创新联盟、创建人类细胞图谱(HCA)、家庭研究中心项目等。惠康基金会投资的项目向来都是大手笔。2018年7月,惠康宣布推出惠康跃进基金(Wellcome Leap Fund),投入2.5亿英镑(约3.3亿美元)用于支持那些“富有创新且高风险”的想法。在过去,这些想法很难受到传统生命科学资助的重视,不仅如此,这些概念还面临重大科学技术难题。事实上,惠康启动的这一计划受到了科学界的一波好评,许多科学家认为此举能够有助于扩大对健康研究、实践和政策的支持。惠康有着慷慨大方的一面,同时还拥有充满争议的一面。此前,《科学》(Science)杂志曾统计过各大基金会对于健康科学类项目的投资占比,惠康以293亿美元的赠款位列第二。 然而与慷慨相对应的是,惠康也曾陷入过“避税”的争议之中。2018年,Science披露惠康曾将9.26亿美元的资产投入到了至少57支避税基金中。在给Science的一份声明中,惠康工作人员拒绝讨论其资产在离岸账户中的规模或位置,称他们“不收集或保留”与税务住所有关的数据。除此之外,惠康的投资方向也曾让外界有过不少质疑。众所周知,环境问题研究是惠康资助的一个重要方向,而惠康却在荷兰海牙的荷兰皇家壳牌公司、德克萨斯州休斯顿的斯伦贝谢公司等化石燃料公司中持有大量、持续的直接股权,这引起了气候变化、环境倡导者的广泛批评。不过总体来说,惠康基金会对于全世界范围内的诸多健康科学类项目提供了大量的资助。目前,惠康基金会计划在2032年前花费160亿英镑用于一系列学科的项目,包括物理和社会科学以及人文学科,通过突破界限的创造性方法解决与生命、健康和福祉有关的重要问题。参考资料1.Wellcome Trust官网2.《科学》起底世界七大慈善基金会,仅盖茨基金会无离岸投资.澎湃新闻.3.Biomedical charity places major bet on ‘bold' research to win bigger payoffs.Science.4.Private research funders court controversy with billions in secretive investments.Science.

45

03/14

2024

美国最新生物法案直指中国科技公司:生物技术会是下一个竞争焦点吗?

导读1月25日,美国一项《生物安全法案》草案在大洋彼岸的中国掀起了风暴,原因无他,主要在于该项法案疑似将目标直指中国的生物技术公司。此前有议员提议,禁止华大基因、药明康德等中国生物公司为联邦资助的医疗机构提供服务。1月31日,美国参议院国土安全和政府事务委员会主持召开法案听证会,宣布目前该项法案“Held over”(延期表决)。尽管法案暂缓推进,但外界不停揣测,美方政府可能要对此类中国生物技术公司“下手”了。生物技术会成为中美下一个争夺的焦点吗?周 晨 | 撰文01 美国《生物安全法案》草案惹风波1月份,美国的一项生物安全草案,在中国生物医药圈引发了一场地震。今年1月,在美国第118次国会中,议员Gallagher提交了一份《生物安全法案》草案。原本是美国的生物安全相关法案,可法案中却频繁提到了两家中国的生物技术公司。在草案中,中国一基因公司被指控“搜集全球人的基因数据”,而目的是“对基因数据的访问,进行压制和监视”,而另一家生物技术公司则被指控参加了“军民融合项目”,对美国构成了“国家安全威胁”。为此,该草案禁止美方对该类生物技术公司进行投资,同时禁止美方购买此类公司的生物技术设备。而这些举措,无疑是要将此类生物技术公司拉入“黑名单”。此消息一出,两家生物技术公司股价迎来了无妄之灾。而更令人担忧的是,美方的这份草案目标针对的似乎不只是两家生物技术公司,背后的真实意图可能是与中方生物技术的争夺战。02 生物技术或成为中美下一个竞争焦点在这次《生物安全法案》草案中,美国对于中国生物技术的关注尤为重视。草案提到,中国正在“寻求在未来的生物技术产业中占主导地位”,为了论证这一观点,草案上接连提出了一系列中方政府近年来在生物技术上的大动作,而这一系列的动作则被美方认为是对美国国家安全的一种威胁。这则《生物安全法案》草案似乎是一个信号,美方或许要在生物技术领域与中国展开新的争夺战。 2月3日,美国知名媒体《Axios》发布最新报道,指出“生物技术是中美科技竞争的新焦点”(Biotech is the new focus in U.S.-China tech rivalry)。以此次草案计划“封锁”中国基因公司为例,这家基因公司在国内发展非常迅速。在新冠疫情期间,该公司帮助在20多个国家建立了基因检测点。除此之外,该公司及其关联公司提供一系列综合产品和服务,包括DNA测序仪、蛋白质质谱、诊断测试、试剂以及数据存储和管理。而西方公司往往无法提供这种一站式服务。“所有国家都意识到他们需要投资生物安全和生物技术,但大多数国家需要从某个地方购买或与某公司合作。”合成生物学公司Ginkgo Bioworks的生物安全总经理Matt McKnight提到,在这些公司之中,西方或一些中国公司总能成为首选。乔治城大学安全与新兴技术中心(CSET)高级研究员安娜·普格利西(Anna Puglisi)认为中国的产业政策和对企业的补贴“基本上创造了一个不平等的竞争环境”,她补充道,“美国没有类似的东西”。然而,此次《生物安全法案》的出台能够对美国生物技术起到帮助吗?答案或许是:不能。 TD Cowen分析师认为,过快地将中国的生物技术工具拒之门外,可能会扰乱美国的研究工作和生物技术的产生,因为此次被计划制裁的基因及其附属公司已经深深植根于NIH资助的临床试验和批准的疗法中。如果美方贸然推进对中国生物技术公司的打压,那最终可能会造成一个“双输”的局面。03 中美生物技术争端已不是第一次事实上,中美之间在生物技术上的摩擦已经不是第一次了。2018年,时任美国司法部长杰夫·塞申斯(Jeff Sessions)出台专门针对美国高校与中国机构学术交流进行审查的政策——中国行动计划(China Initiative),诸多留美华裔学者曾受到过该计划的迫害。除了高校交流这一块,中美生物技术公司之间的合作与交易也多次受到了美方的关注和阻挠:2022年6月23日,中国生物制药的全资子公司InvoX Pharma与英国生物技术公司F-star Therapeutics发表声明,确认已就一项收购要约达成一致。然而,由于2022年9月美国生物法案的颁布,该交易引起了美国外国投资委员会(CFIUS)的关注。同年11月,CFIUS提出了审查请求,基于其对与中国公司合并可能对国家安全构成潜在威胁的担忧。截止2023年2月,这项交易一直处于搁置状态。许多专家都在猜测,生物技术将成为中美继人工智能、量子计算、5G等领域后,又一新的争夺领域。然而,这样的对抗关系最终损害的也是生物技术公司和普通民众的利益。在未来,我们希望能够有更多交流而非冲突,更多合作而非对抗。 参考资料1.生物安全法草案风波未平,药明康德宣布拟10亿回购应对市场动荡.观察者网.2.Biotech is the new focus in U.S.-China tech rivalry.Axios3.To prohibit contracting with certain biotechnology providers, and for otherpurposes.4.Congress Introduces Bill to Prevent Medical Providers From Using BGI, MGI and Affiliates' Products.genomeweb.5.美国观察|生物技术:中美竞争与合作的新场域?.复旦中美友好互信合作计划.

49

03/08

2024

Nature发布2024年值得关注的七大技术,中国科学家成果首次入选,来自高彩霞团队

2024年1月22日,《自然》发布了2024年值得关注的七大技术——大片段DNA插入、人工智能设计蛋白质、脑机接口、 细胞图谱、超高分辨率显微成像、3D打印纳米材料和DeepFake检测。与往年相比,今年最大的变化在于,人工智能(AI)的进步成为许多令人兴奋的技术创新的核心支撑。值得一提的是,高彩霞团队开发的大片段DNA精准定点插入新工具PrimeRoot入选,这也是自2018年首次评选以来,第一项来自中国学者的技术成果入选。大片段DNA插入2023年12月,美国FDA批准了首个基于CRISPR-Cas9的基因编辑疗法上市,用于治疗镰状细胞病,几天前,FDA进一步批准了该疗法用于治疗输血依赖性β-地中海贫血。这是基因编辑在临床应用中的重大胜利。CRISPR-Cas9及相关基因编辑技术通过使用Cas9等核酸酶切割DNA双链实现对基因的敲除或引入小的序列变化,其很难实现精确的可编程的大片段DNA序列的插入。而最近的一些研究成果,让科学家们能够替换或插入大片段DNA。2023年4月,中国科学院遗传与发育生物学研究所高彩霞团队在 Nature Biotechnolgy 期刊发表了题为:Precise integration of large DNA sequences in plant genomes using PrimeRoot editors 的研究论文。该研究将团队之前开发的ePPE(Engineered Plant Prime Editor)与刘如谦团队开发的epegRNA(Engineered pegRNA)结合,在植物细胞内建立了dual-ePPE系统,实现了最高效率可达50%以上的短片段DNA的精准定点插入。然后将dual-ePPE与筛选出的高效的酪氨酸家族位点特异性重组酶Cre相结合,开发了能够实现大片段DNA精准插入的PrimeRoot系统。该系统在水稻和玉米中能够实现一步法大片段DNA的精准定点插入,效率可达6%,成功插入的片段长度最长达11.1kb,且插入完全精准可预测,在编辑效率和精准性上具有显著优势。高彩霞研究员,照片来源:Stefen Chow高彩霞研究员表示,PrimeRoot系统高效、精准插入大片段DNA的能力,可通过基因敲入广泛用于赋予作物对疾病和病原体的抗性,从而继续推动基于CRISPR的植物基因组工程的创新浪潮。相信这项新技术可以应用于任何植物物种。2022年11月,麻省理工学院的Omar Abudayyeh、Jonathan Gootenberg团队在Nature Biotechnology 期刊发表了题为:Drag-and-drop genome insertion of large sequences without double-strand DNA cleavage using CRISPR-directed integrases 的研究论文。该研究将来自噬菌体的丝氨酸整合酶与Cas9切口酶(只切断DNA一条链,而不造成DNA双链断裂)结合,开发了一种名为PASTE的新型基因编辑技术。PASTE在gRNA的引导下切割特定基因组位点,此时Cas9切口酶融合的逆转录酶将整合酶所需的附着位点序列整合进切割位点。通过这种方式,就可以将整合酶所需的附着位点插入基因组中的任何位置,而且这种插入不引起DNA双链断裂,此时,整合酶就可以与附着位点结合,将大片段DNA序列插入。该技术能够以更安全、更有效的方式替换突变基因,还可向哺乳动物及人类细胞中定点插入长达36kb的超长DNA片段。2022年2月,斯坦福大学丛乐团队在 Nature Cell Biology 期刊发表了题为:dCas9-based gene editing for cleavage-free genomic knock-in of long sequences 的研究论文。该研究将来自噬菌体的DNA精确重组酶——单链退火蛋白(SSAP),与DNA切割活性丧失的dCas9系统结合,开发出了一种新型基因编辑工具——dCas9-SSAP,可在不产生DNA双链断裂的情况下,实现长达2kb的大片段DNA的高效、精准定点插入。丛乐认为,对于体内基因编辑而言,PASTE尺寸太大,需要三个独立的AAV病毒载体毒才能递送,因此,其编辑效率可能不如尺寸更小的dCas9-SSAP。深度学习用于蛋白质设计20年前,华盛顿大学的David Baker等人在 Science 期刊发表论文【2】,取得了一项里程碑式成就:他们使用计算工具从头设计了一个全新蛋白质——Top7,该蛋白由93个氨基酸残基组成,能够如预期般折叠,且非常稳定,但它没有任何有意义的生物学功能。David Baker教授而现在,在 David Baker 等人的努力下,从头设计蛋白质已经一种成熟的工具,用于生成定制酶,及其他基于蛋白质的药物、疫苗和药物递送载体。这种进步的大部分归因于越来越多的将蛋白质序列与其结构联系起来的数据库,但人工智能的技术进步也同样重要。例如,2023年2月,David Baker团队在 Nature 期刊发表论文,从头设计了人造荧光素酶,这也是科学界首次基于深度学习的人工智能来创造自然界不存在的酶。2023年4月,David Baker 团队在 Science 期刊发表论文,利用基于强化学习的人工智能从头设计了全新且有功能的蛋白纳米颗粒,为疫苗和药物递送载体开发开辟了全新道路。2023年12月,David Baker 团队在 Nature 期刊发表论文,利用基于深度学习的人工智能从头设计了具有高亲和力和特异性的全新蛋白质,这为抗体设计和疾病诊断打开了新思路。脑机接口2012年,Pat Bennett被诊断出患上了渐冻症(ALS),而且她的情况比较特殊,她的脑干更早开始恶化,她在还能行走、打字的时候,就已经无法使用嘴唇、舌头、喉部和下颚的肌肉运动来清晰地发声,她的大脑能够尝试发声,但肌肉已无法执行这一命令,从而失去了说话的能力。2022年3月,她参加了斯坦福大学Francis Willett教授领导的脑机接口临床试验,研究团队在她的大脑皮层表面植入了四个微型细电极阵列(每个阵列包含8×8个电极),用于收集单个细胞的神经活动,植入的阵列连接到金线上并通过电缆连接到电脑上,并训练人工智能(AI)来解码她试图进行的发声。Pat Bennett 在进行测试2023年8月,Francis Willett团队将这项研究以:A high-performance speech neuroprosthesis 为题,发表在了 Nature 期刊。该论文显示,通过植入皮质内脑机接口(iBCI),并通过训练人工智能(AI)软件,能够将渐冻症(ALS)患者 Pat Bennett大脑中的神经活动实时转化为文字,转化速度可达每分钟62个单词,总词汇量高达125000,相比已有的脑机接口速度更快、准确性更高、词汇覆盖率更大。这项研究展示了一条可行的路径以恢复渐冻症等瘫痪者的语言沟通能力。Nature 同期还发表了来自加州大学旧金山分校的张复伦(Edward Chang)团队题为:A high-performance neuroprosthesis for speech decoding and avatar control 的研究论文。该研究开发了一种新型脑机接口(BCI),结合人工智能(AI)技术,可以高性能、实时将因脑干中风而严重瘫痪的患者大脑信号同时转化为三种输出形式:文字、语音和控制一个头像,从而帮助严重瘫痪者恢复沟通能力。这些脑机接口装置的开发成功应用,代表了神经科学和神经工程学研究的重大进步,对于缓解因瘫痪性神经损伤和疾病而失声的人的痛苦有巨大潜力。细胞图谱Wellcome Sanger研究所的Sarah Teichmann和现任基因泰克公司的研究和早期开发负责人 Aviv Regev 于2016年发起了一项规模庞大、雄心勃勃的人类细胞图谱(Human Cell Atlas,HCA)计划。该计划有近100个国家的约3000名科学家参与,而HCA本身也是一个更广泛的细胞和分子图谱交叉生态系统的一部分,包括人类生物分子图谱计划(HuBMAP)和脑计划(BICCN)。去年,已有数十项研究展示了使用这些技术生成器官特异性图谱的进展。2023年,Nature 发布了一个论文集(go.nature.com/3vbznk7),重点介绍了HuBMAP的进展,Science 则发布了一篇论文集,详细介绍了BICCN的工作(go.nature.com/3nsf4ys)。人类肺部的细胞图谱描述了不同的细胞类型及其调节方式Sarah Teichmann 表示,还有相当多的工作要做,估计至少需要五年时间才能完成HCA计划。但当该计划完成时,产生的人类细胞图谱将是无价之宝。例如可以使用细胞图谱数据来指导组织和细胞特异性药物开发,还有助于了解癌症等复杂疾病的风险和病因。超高分辨率显微成像Stefan Hell、Eric Betzig和William Moerner因打破限制光显微镜空间分辨率的“衍射极限”而获得2014年诺贝尔化学奖,这让我们得以在数十纳米级分辨率下进行分子尺度的成像实验。然而,科学家们渴望得到更好的结果,他们也正在取得快速进展,努力缩小超分辨率显微镜与结构生物学技术之间的差距。Stefan Hell 团队2022年开发了一种名为MINSTED的方法,使用专用光学显微镜,可以以2.3埃的分辨率分辨出单个荧光标签。马克斯·普朗克生物化学研究所的 Ralf Jungmann 团队在2023年开发了一种序列成像(RESI)的增强分辨率的方法,可以分辨出DNA链上的单个碱基对,使用标准的荧光显微镜实现了埃级分辨率。RESI方法可以对DNA中的单个碱基对进行成像哥廷根大学医学中心神经科学家Ali Shaib 和 Silvio Rizzoli 领导的团队开发的一步法纳米尺度膨胀(ONE)显微镜方法,虽然没有完全达到上述埃级分辨率水平,但ONE显微镜提供了前所未有的机会,可以直接成像单个蛋白质和多蛋白复合物的精细结构细节,无论是在孤立状态还是在细胞中。3D打印纳米材料在纳米尺度下,会发生很多奇怪而有趣的事情,这可能会使材料科学变得难以预测,但这也意味着我们可以在纳米尺度制造具有独特性质的轻质材料,例如更高的强度、与光或声的定制交互以及增强的催化或能量存储能力。目前存在几种精确制造此类纳米材料的策略,其中大多数使用激光诱导光敏材料的图案化“光聚合”,在过去几年中,科学家们在克服这些方法的限制方面取得了相当大的进展。但目前3D打印纳米材料还存在几个挑战,首先是速度,使用光聚合技术组装纳米结构的速度大约比其他纳米级3D打印方法快三个数量级。这一速度可能已经足够用于实验室使用,但对于大规模生产或工业流程来说还是太慢了。第二个挑战是并非所有材料都可以直接通过光聚合来打印,例如金属。但加州理工学院的 Julia Greer 开发出一种替代方法,将光聚合水凝胶作为微尺度模板,然后注入金属盐并进行处理,使金属在收缩的同时具有模板的结构。最后是成本,这可能是最难突破的挑战,许多光聚合方法中使用的脉冲激光系统成本超过50万美元,但好在更便宜的替代品正在出现。利用水凝胶制作了微型金属结构DeepFake检测公开可用的生成式人工智能算法的爆炸式增长,使得生成令人信服但完全人为的图像、音频和视频变得简单。纽约州立大学布法罗分校的计算机科学家吕思伟教授表示,他已经看到过许多人工智能生成的与军事冲突有关的“Deepfake”图像和音频。用户使用人工智能生成欺骗性内容,吕思伟和其他媒体取证专家致力于检测和拦截它们。生成式人工智能开发人员的一个解决方案是在人工智能模型的输出中嵌入隐藏信号,产生人工智能生成内容的水印。其他策略则侧重于内容本身,例如,一些伪造视频用一个人的面部特征替换了另一个人的面部特征,新的算法可以在被替换特征的边界处识别伪造痕迹。吕思伟团队开发了一个算法——DeepFake-O-Meter,可以从不同角度分析视频内容,以识别“Deepfake”内容。这些识别工具是有用的,但可以预见,我们与人工智能生成的错误信息和内容的斗争可能还会持续多年。参考链接:https://www.nature.com/articles/d41586-024-00173-x

43

02/27

2024

亿万富豪将矛头剑指MIT全体教职的学术诚信,是私怨还为了学术公正?

导读今年开年初上演了一场令人瞠目结舌的大戏,上任仅半年、还没能在岗位上一展宏图伟志的哈佛大学首位黑人女校长Claudine Ga被迫辞职。然而这背后的推手与这几天将MIT卷入学术打假漩涡的竟是同一人,这人就是亿万富豪Bill Ackman。在前几周,Ackman在社交媒体上高调发起高校剽窃检查计划,他凭借个人强大的资本、巨大的影响力,通过社交媒体将事情扩大,成功掀起了美国顶尖高校的打假风波。Ackman曾公开指出哈佛大学校长Claudine Ga的部分文章存在剽窃行为,要求其辞职。在Ga辞职后,Ackman仍表示,“哈佛大学不应该让Ga继续留任,因为她存在‘严重的剽窃问题’”。然而,Ackman这样做是为了个人私怨还是为了学术公正?林 岩 | 撰文近日,Bill Ackman将矛头指向了麻省理工学院(MIT),这回他可不只是剑指MIT校长一人,而是范围扩大到整个MIT的全体教职人员,这究竟是怎么一回事?01 Ackman何许人Bill Ackman是一位犹太人,今年56岁,毕业于哈佛商学院,早年间他创立了一家对冲基金公司Pershing Square Capital Management,成功赚下40亿美元的身家,是一位在金融界叱诧风云的人物。此外,他积极涉足慈善事业,由他创办的基金会已投入6亿美元的赠款,用于支持全球健康项目、非营利组织、大型学术医疗中心以及纽约地区的年轻癌症科学家。然而,年近古稀的他近来屡屡与学术界有了撕扯,在学术圈引发不小震荡,原因在于他发起的高校剽窃检查计划。继成功推动哈佛大学女校长辞职后,这段时间,Ackman继续活跃在打假路上,把矛头直指MIT,呼吁解雇罢免Sally Kornbluth。Kornbluth是一位细胞生物学家,曾在杜克大学任教务长,于一年前成为MIT第18任校长,与前几日辞职的哈佛校长一样,也是一位能力出众的女中豪杰。此次,Ackman不仅仅要求罢免Kornbluth,他还将这把火烧向了整个MIT所有教职群体,他对外称,“正在对MIT所有教职员工和董事会成员进行剽窃检查。”02 对MIT全体教职进行剽窃检查?1月5日,Ackman在社交平台上宣布了剽窃检查计划。如果说对Kornbluth的不满来自于他作为犹太商人对于反犹主义的痛恨,那么将这件事扩大到整个MIT的教职群体,尤其是在没有任何充分证据的情况下,就让人很是费解了。1月6日,Ackman进一步阐述了他对MIT的初步调查,“难道我们不需要也对哈佛的学术诚信进行深入调查吗?那耶鲁、普林斯顿、斯坦福、宾大、达特茅斯呢?你明白我的意思。”这是威胁要对其他名校展开类似的调查。有人直言,Ackman的威胁是学术界剽窃检查日益“武器化”的一部分。而实际上,Ackman如此大费周章与整个MIT教职层为敌,或许也与他的妻子有关。Ackman的妻子Neri Oxman是一位建筑师兼设计师,同丈夫一样也是一位犹太人,她曾在MIT就读,获得了MIT博士学位,之后留校任教成为MIT的一位教职人员。2019年,她离开了MIT,成立了一家同名设计公司。1月4日至5日,Business Insider连续发表两篇文章,报道了Oxman的论文有四个案例中存在直接从其他学者作品中复制文字却没有使用引号的问题。为此Oxman在社交平台进行了公开道歉,她发帖表示:“我没有将引用的文字放在引号内,这应该是引用他人作品的正确方法。我对此感到后悔并对此错误表示歉意。”这件事情引起了丈夫Ackman的愤怒,尽管Ackman并没有证据,但他坚持认为是MIT董事会主席Mark Gorenberg及管理层或某些教职员工促使了Business Insider发表这些报道,“我们不能肯定MIT是幕后黑手,但我们有充分的理由相信这是真的。”03 对数十万篇文章剽窃检查的难度Ackman发起的对MIT全校性审查得到了部分人的支持,比如德国柏林计算机科学家Debora Webe Wulff,她表示,“我很高兴美国开始了这方面的工作。”Wulff也是一位学术侦察团的志愿者,该团队曾分析德国的文章,并成功查出德国国防部长的论文剽窃行为,最终让该部长失去工作。但MIT的教职人员众多,足有1100余名,几乎有数十万篇论文及其它作品,要收集所有文章(含付费收集)并进行剽窃检查,这样的工作量是极其庞大且耗费资金的事。资金有Ackman的鼎力支持,自当不是问题,但光靠人力要检测如此多文章并非易事。对此,Ackman表示正在寻求有关如何进行调查的建议和帮助,预计将使用人工智能。Ackman的反剽窃行动得到了响应。迄今为止,已有51名犹太校友承诺每年仅向麻省理工学院捐赠1美元,直到他们对学校的回应感到满意为止。无论如何,学术诚信是学术界的基石,任何形式的抄袭行为都是对学术诚信的严重侵犯,但如此大规模的剽窃检查最终结果以及收效如何,还需要时间印证。参考资料Billionaire launches plagiarism detection effort against MIT president and all its facultyhttps://www.science.org/content/article/billionaire-launches-plagiarism-detection-effort-against-mit-president-and-all-its

49

01/30

2024

不到4分钟,就能复现诺奖实验!Nature重磅:AI轻松实现阿司匹林、布洛芬等药物合成,人工智能科研机器来了?

短短4分钟的时间,AI“科学家”竟然成功地复现了诺奖实验成果,且只尝试了一次!2023年12月20日,Nature上刊登的最新研究再一次刷新了人类的认知。这个由卡内基梅隆大学(CMU)研究团队开发的AI“化学家”Coscientist(一款基于GPT-4等大型语言模型的AI系统),竟能自主设计、规划和执行复杂的实验——不仅成功实现阿斯匹林、对乙酰氨基酚和布洛芬等药物分子的合成,甚至还在短短几分钟内优化了「钯催化交叉偶联反应」。而「钯催化交叉偶联反应」正是2010年诺贝尔化学奖获得者的获奖研究,该反应能够高效地构建碳-碳键,生成很多以往难以甚至无法合成的物质。Coscientist的出现不可谓不重磅,甚至可以说是颠覆了整个化学领域!连领导这项研究的CMU化学家Gabe Gomes都称,“当我看到一种非有机智能能够自主计划、设计和执行人类发明的化学反应的那一刻,真是太神奇了!”https://doi.org/10.1038/s41586-023-06792-0回溯2023年,「ChatGPT」毫无疑问地当选年度热词之一。2022年底,OpenAI推出了基于大型语言模型(LLM)的聊天机器人ChatGPT以来,迅速发展并成功运用于多个领域,包括自然语言、生物和化学,以及代码生成。随着迄今为止能力最强的LLM——GPT-4的问世,这波浪潮也席卷到了化学领域。于是,CMU研究团队基于多个LLM搭建起了AI系统Coscientist,这个AI“化学家”能够使用工具浏览互联网以及相关文件,使用机器人实验应用编程接口(APIs),并利用其他LLMs完成各种任务,实现自主设计、规划和执行真实世界的化学实验。正如Gomes所述,“Coscientist可以做真正训练有素的化学家可以做的大部分事情”。剖析其运作系统,Coscientist共包含5个模块——“大脑”规划者(Planner)和“四肢”网络搜索(Web searcher)、代码执行(Code execution)、文件检索(Docs searcher)和自动操作(Automation)。Coscientist的运作系统规划者(Planner),即主模块,是整个系统的智能中枢,能够根据用户输入的内容,调用和协调其他模块来规划和推进整个实验。“大脑”能够给下面的四个模块下达指令,包括GOOGLE、PYTHON、DOCUMENTATION和EXPERIMENT。网络搜索(Web searcher)会接收到来自Planner的GOOGLE指令,负责在互联网中检索实验相关信息,而该模块本身也是个LLM。代码执行(Code execution)会接收到来自Planner的PYTHON指令,提供一个独立的python执行环境,为接下来的实验做准备。文件检索(Docs searcher)会接收到来自Planner的DOCUMENTATION指令,主要负责进行文本检索和文档理解,能够为主模块提供有用的信息,比如提供实验参数以及操作细节等文档。自动操作(Automation)会接收到来自Planner的EXPERIMENT指令,也就是最终的实验执行环节。该模块能够将控制中枢下发的实验方案转换为设备控制代码,根据DOCUMENTATION描述的API来自动化控制实验设备,完成实验操作。百说不如一练,这个最新研发出来的AI“化学家”Coscientist的表现究竟如何?为了测试其在已知化合物的化学合成上的真实能力,研究者要求Coscientist自行通过网络搜索,来完成多种药物分子的合成。并对比了OpenAI的GPT-3.5和GPT-4、Anthropic的Claude 1.3和Falcon-40B-Instruct等不同模型的能力。Coscientist在化学合成方面的能力结果显示,基于GPT-4的网络搜索能够有效地改善合成化合物的规划,并在对乙酰氨基酚、阿司匹林、硝基苯胺和酚酞的合成实验中获得了最高分。而在合成布洛芬的实验中,GPT-4可谓是“一枝独秀”,是唯一一个能够达到最低可接受分数的模型。但由于该化合物的广泛性,对于AI们来说,这也是难度最大的“挑战”。当然,研究者并不满足于“研究生水平”,而直接将考验难度拉满至“诺奖级别”——「钯催化交叉偶联反应」——即Coscientist需要使用互联网上提供的数据,进行必要的计算,并最终为液相工作站编写代码,实现整个化学实验的设计和开展。Coscientist设计和执行钯催化交叉偶联反应的过程研究团队为Coscientist配备了液体处理装备以及多种试剂的储备溶剂,要求其在现有的资源下,成功设计并开展Suzuki–Miyaura偶联反应和Sonogashira偶联反应。这两类反应在药物研发中发挥着重要作用,经常被用于生成碳-碳键。Coscientist的表现令人惊喜!这个AI“化学家”首先在互联网上检索了反应物、反应剂量以及反应条件相关的所有信息,并对移液机器人进行了自助编程来开启反应。整个过程只用了不到4分钟的时间!在运行的过程中,Coscientist会不断地对自己的策略进行调整。即使在过程中发生了错误,Coscientist也能及时查阅文献并更正版本,最终成功运行整个实验。气相色谱-质谱分析显示,两个反应均形成了目标产物——在Suzuki–Miyaura偶联反应中,9.53分钟时出现了一个信号,与联苯的质谱相吻合;而在Sonogashira偶联反应中,研究者在12.92分钟时观测到一个信号,其分子离子质量电荷比与联苯相吻合。没错,Coscientist成功地完成了考验!最终得到的“钯催化交叉偶联反应“结果事实上,除了上述提到的“利用公开数据实现已知化合物的化学合成”和“处理需要同时使用多个硬件模块和整合不同数据源的复杂科学任务”之外,Coscientist还能够实现“高效搜索和浏览大量硬件文档”、“使用文档在云实验室中执行高级命令”、“使用底层指令精准控制液体处理仪器”和“解决需要分析以前收集的实验数据的优化问题”,且有着优越的表现。可以预见的是,AI系统Coscientist的诞生将对化学和药学研究带来革命性的影响!未来,人类将有潜力利用AI来提高实验结果的可复制性和可靠性,进而促进科学发现的速度和数量。Gomes表示,包括Coscientist在内的人工智能辅助系统的更为重要的意义在于,它们显著降低了几乎任何领域的准入门槛。试想一个,一个从未接触过钯催化交叉偶联反应的生物学家,想要以一种新的方式来探索反应的用途,Coscientist就可以派上用场并帮助其完成实验。畅想一下,能够开展医学实验的AI系统也近在咫尺了吧?参考资料:Boiko, D.A., MacKnight, R., Kline, B. et al. Autonomous chemical research with large language models. Nature 624, 570–578 (2023). https://doi.org/10.1038/s41586-023-06792-0撰文 | Swagpp编辑 | Swagpp

49
显示第 61 至 80 行,共计 349 行