翻译在线-PDF/Word/Excel/PPT文档翻译软件推荐-翻译狗

《癌症传》作者最新力作：无论我们如何努力，我们终将回到细胞

无论我们如何努力，我们终将回到细胞。——鲁道夫·菲尔绍，1858年悉达多·穆克吉｜撰文2017年11月，我目睹自己的朋友山姆·皮逝去，因为他的细胞背叛了其身体。2016年春季，山姆被诊断为患有恶性黑色素瘤。肿瘤最早出现在他的脸颊附近，看起来就像一个硬币大小的痣，表面为紫黑色且周围伴有光晕。山姆的母亲克拉拉是一位画家，夏末在布洛克岛度假时首次注意到了它。她曾经劝说、乞求甚至威胁山姆，让他去皮肤科医生那里检查，但山姆是一名忙碌活跃的大报体育记者，没时间去担心他脸颊上这个讨厌的疙瘩。虽然我不是他的肿瘤科医生，但有一位朋友请我帮忙看看。2017年3月，当我看到山姆并为他做检查的时候，肿瘤已经长成一个拇指大小的长椭圆形肿块，并且有迹象表明肿瘤在皮肤内形成了转移灶。当我触摸到肿块时，他疼得皱起了眉头。面对癌症与见证其移动是两种截然不同的体验。黑色素瘤已经从面部向他的耳部扩散。如果你仔细观察就会发现，它就像在水面行驶的渡船一样，留下一串斑点状的紫色尾迹。即使是山姆，这位一生都在研究速度、运动与敏捷的体育记者，也对黑色素瘤的发展速度感到十分惊奇。为什么，他不停地问我，为什么，为什么，为什么，难道是一个在他的皮肤中静静沉寂了数十年的细胞，突然获得了能在其面部快速扩散与疯狂分裂的特性？但癌细胞并没有“发明”任何这些特性。它们不是重新构建，而是在劫持细胞，或者更准确地说，最适合生存、生长与转移的细胞会被自然选择出来。细胞用来合成生长所需构件的基因与蛋白质，源于涉及胚胎发育初期快速增长的基因与细胞。癌细胞在身体中到处随意游走所使用的通路，是从体内本可以自由移动的细胞中强行征用的。使癌细胞能够无节制进行细胞分裂的基因，是正常细胞中允许分裂基因的扭曲突变版本。简而言之，癌症是细胞生物学在病理镜像中的表现。作为一名肿瘤学家，我首先是一名细胞生物学家，只不过我是通过镜中的反射与倒影来感知正常细胞世界的。 2017年初春，医生给山姆开了一种药，该药可以将其T细胞变成一支军队，以对抗正在他体内肆虐的叛军。想象一下这种场景：在数年甚至数十年的时间里，山姆的黑色素瘤与他的T细胞共存，基本上互不打扰。他的免疫系统对于其体内的恶性肿瘤置若罔闻。每天都有数以百万计的T细胞与黑色素瘤擦肩而过，然后继续前行，这些T细胞就像是对一场细胞灾难视而不见的旁观者。医生给山姆开的药物有望揭开这种肿瘤的隐身衣，并使山姆的T细胞将黑色素瘤识别为“外来”入侵者加以排斥，就像T细胞排斥被微生物感染的细胞一样。原本被动的旁观者将成为主动的执行者。我们正在改造他体内的细胞，使以前看不见的东西能够显现。这种“揭开隐身衣”的药物的发现源自20世纪50年代细胞生物学激进发展的巅峰：人们理解了T细胞用来区分自我与非我的机制，识别出这些免疫细胞检测外来入侵者的蛋白质，发现了正常细胞抵抗这种检测系统攻击的途径，以及癌细胞利用上述检测系统使自己隐身的方式，并且发明出一种能够揭开恶性细胞隐身衣的分子。每一种洞见都建立在既往领悟的基础之上，每一次发现都由细胞生物学家们辛勤习得。几乎是在山姆刚开始治疗时，他的身体中就爆发了一场内战。他的T细胞被癌症所唤醒，用来对抗自己的恶性细胞，从而引发了更多报复性循环。某天早上，由于免疫细胞浸润肿瘤并导致炎症反应，他脸颊上的深红色病灶异常发热；然后，恶性细胞收拾行囊离去，只留下即将熄灭的篝火。几周之后我再次见到他的时候，长椭圆形肿块及其后面的斑点均已消失。取而代之的是垂死的肿瘤残余物，看上去就像一颗干瘪的大葡萄干。山姆的病情已经处于缓解状态。我们共饮咖啡以示庆祝。缓解不仅改善了他的身体状况，还让他在心理上充满了活力。几个星期以来，我第一次看到他脸上忧虑的皱纹舒展开来。他笑了。但是，后来情况发生了变化：2017年4月是一个残酷的月份。攻击其肿瘤的T细胞转向攻击他的肝脏，引发了自身免疫性肝炎，而这种肝炎几乎无法用免疫抑制药物来控制。11月，我们发现之前还处于缓解期的癌症，已经侵入了山姆的皮肤、肌肉与肺部，在这些新器官中隐藏并寻找栖息地，以逃避免疫细胞对其发起的攻击。山姆在这些胜利与挫折中保持着钢铁般的尊严。有时，他那讽刺的幽默似乎就是自己反击的武器：他要把癌症彻底击垮。有一天，当我在新闻编辑室的桌前拜访他时，我询问他是否需要一个私密空间，或许是男卫生间，以便向我展示新发肿瘤出现的地方。他轻松地笑着说：“等我们到洗手间的时候，它就会转移到新的部位。最好趁它还在这里的时候看看。”医生减弱了免疫攻击以控制自身免疫性肝炎，但是随后癌症却复发了。于是他们重新开始用免疫疗法来攻击癌症，可又引发了急性重型肝炎。这就像是在观看某种斗兽比赛：如果把免疫细胞用绳索拴住，它们势必挣脱锁链攻击杀戮。如果放开对免疫细胞的束缚，它们就会无差别攻击癌症与肝脏。我首次触摸到其肿瘤几个月后，山姆在一个冬季的清晨去世了。最终，黑色素瘤完胜。在2019年一个狂风大作的午后，我参加了位于费城的宾夕法尼亚大学举办的一次会议。近千名科学家、医生与生物技术研究人员聚集在斯普鲁斯街的一座砖石礼堂中。他们在那里讨论一项大胆的医学前沿进展：将基因改造的细胞移植到人体内治疗疾病。会上讨论了T细胞修饰、能够将基因传递到细胞内的新型病毒，以及细胞移植领域的下一个重大进展。台上与台下的语言似乎让人感到，生物学、机器人学、科幻小说与炼金术齐聚在一个狂欢之夜，孕育出一些前沿学科交叉融合的成果，例如“重启免疫系统”“治疗性细胞重构”“移植细胞的长期存活”。总之，这是一次关于未来的会议。但是眼前的现实同样重要。坐在我前面几排的是埃米莉·怀特黑德，当时十四岁的她比我的大女儿年长一岁。怀特黑德有一头凌乱的棕色头发，穿着黄黑相间的衬衫与深色裤子，她正处于白血病缓解的第七年。“她很高兴能少上一天课。”怀特黑德的父亲汤姆告诉我。埃米莉在听到这句话时露出了微笑。埃米莉·怀特黑德是第七号患者，她曾经在费城儿童医院接受治疗。几乎所有在场的观众都认识或听说过她，因为埃米莉改变了细胞疗法的历史。2010年5月，埃米莉被诊断为急性淋巴细胞白血病（ALL）。这种疾病是进展最快的癌症之一，并且往往发生在幼童身上。ALL治疗通常涉及最为激进的化疗方案：采用七八种不同药物的联合治疗，有些药物会被直接注射到脑脊液中，以杀伤隐藏在大脑与脊髓里的癌细胞。治疗会对患者的身体造成附带损害，例如手指与脚趾的永久性麻痹、脑损伤、发育迟缓与危及生命的感染等，因此可能会让人望而却步，但是这种治疗方法可以治愈大约90%的患儿。不幸的是，埃米莉的癌症就属于剩下的10%，标准疗法被证实对其无效。她在接受治疗16个月后白血病复发。埃米莉被列入骨髓移植的名单，而这是唯一能够治愈她的选择，但在等待合适的供体期间，埃米莉的病情出现了恶化。 “医生告诉我不要上网搜索（她的生存率），”埃米莉的母亲卡莉告诉我，“然而，我毫不犹豫就这么做了。”卡莉在网上搜索到的情况令人不寒而栗：早期复发或两次复发的患儿几乎无人幸存。当埃米莉于2012年3月初抵达费城儿童医院时，她几乎所有的器官都被恶性细胞所占据。埃米莉在此接受了斯蒂芬·格鲁普医生的诊治，他是一位温文尔雅且身材魁梧的儿科肿瘤专家，脸上留着的胡须总是在跟随其丰富的表情颤动。随后埃米莉参加了一项临床试验。埃米莉参加的试验涉及将她自己的T细胞输注到其体内。但这些T细胞必须通过基因疗法武装起来，使其能够识别并杀伤她体内的癌细胞。与山姆通过药物来激活体内免疫力不同的是，埃米莉的T细胞是提取后在其身体外生长的。这种疗法由纽约斯隆—凯特琳研究所的免疫学家米歇尔·萨德兰，以及宾夕法尼亚大学的卡尔·朱恩教授首创，他们在以色列科学家泽利格·埃沙尔先前的基础上进行了完善。我们所坐的地方离细胞治疗单元只有几百英尺（1英尺≈ 0.3米），这是一个类似于金库的封闭设施，配备有钢门、无菌室与培养箱。那里有几组技术人员正在忙着处理细胞，细胞则来自数十位参加临床研究的患者，随后这些细胞将被储存在大桶状的液氮罐中。每个液氮罐都会以动画片《辛普森一家》中的某个角色命名，埃米莉的部分细胞就被冷冻在名为“小丑库斯提”的液氮罐内。她的另一部分T细胞在经过人工修饰后，能表达一种识别与杀伤其白血病的基因，这些在实验室培养的细胞以指数级别增长，然后被送回医院并输注到埃米莉的体内。输注过程持续了三天，基本上没有什么意外。当格鲁普医生将细胞滴入其静脉时，埃米莉正在吸吮着冰棒。晚上，她与父母住在附近的一位阿姨家。在前两个晚上，埃米莉让父亲背着她玩游戏。然而，到了第三天，她的情况急转直下：出现呕吐与高热症状。怀特黑德夫妇急忙把她送回医院。埃米莉的病情迅速恶化。她的肾脏功能已经衰竭。埃米莉的意识状态飘忽不定，濒临多器官系统衰竭的边缘。“怎么会这样？”埃米莉的父亲汤姆对我说。六岁的女儿埃米莉被转移到重症监护室，夫妇二人与格鲁普在那里整夜守候。作为治疗埃米莉的内科专家，卡尔·朱恩坦率地告诉我：“我们当时认为她的希望非常渺茫。我给大学的教务长写了一封电子邮件，告诉他首批接受治疗的患儿之一危在旦夕。临床试验已经结束。我把邮件保存在发件箱，但是从未点击过发送键。”宾夕法尼亚大学的实验室技术人员连夜工作以明确发热的原因。他们没有发现感染的证据；相反，他们发现血液中的细胞因子水平升高，而这些分子是活动性炎症释放的信号。特别值得注意的是，一种被称为白介素—6（IL—6）的细胞因子水平几乎是正常值的一千倍。当T细胞杀伤癌细胞时，它们会释放出化学信使风暴，这些分子就像骚乱的人群，疯狂地散发着煽动性的传单。然而，巧的是，朱恩自己的女儿患有一种名为青少年关节炎的炎性疾病。他知道FDA（美国食品药品监督管理局）在四个月前刚刚批准了一种可以阻断IL—6的新药。作为最后的努力，格鲁普急忙向医院药房提出申请，请求允许超适应证使用这种新疗法。药事委员会当晚批准了使用IL—6阻断药物的申请，格鲁普在重症监护室为埃米莉注射了一剂药物。两天后，也就是在她七岁生日那天，埃米莉醒了过来。“嘭。”朱恩医生挥舞着双手说道。“嘭，”他重复道，“它就这样消失了。二十三天后，我们做了一次骨髓活检，她的病情已经完全缓解。”格鲁普告诉我：“我从未见过病情如此危重的患者恢复得这么快。”对埃米莉病情的巧妙处理，以及她惊人的康复能力，拯救了细胞治疗领域。埃米莉·怀特黑德至今仍处于完全缓解状态。她的骨髓与血液中都检测不到癌。她被认为已经痊愈。朱恩告诉我：“如果埃米莉不幸去世，整个试验很可能会被叫停。”而这将使细胞治疗倒退十年甚至更久。在会议的休息期间，朱恩医生的同事布鲁斯·莱文博士带领埃米莉和我参观了医学园区。他是宾夕法尼亚大学T细胞修饰、质控与生产部门的创始主任，也是第一批处理埃米莉细胞的专家之一。这里的技术人员单独或成对工作，他们忙着确认项目清单，优化操作流程，在培养箱之间转移细胞，以及对手部进行消毒。这里几乎可以被视为埃米莉的小型纪念馆。墙壁上贴满了她的照片。八岁的埃米莉，扎着小辫子；十岁的埃米莉，拿着一块奖牌；十二岁的埃米莉，缺了门牙，微笑着站在贝拉克·奥巴马总统身边。在参观过程中的某一时刻，我看到埃米莉本人透过窗户望着街对面的医院。她几乎可以看见位于角落的重症监护室，而埃米莉曾经被困在那里将近一个月。大雨倾盆而下，窗户布满水滴。埃米莉在医院里有三种状态，我非常想了解她会有怎样的感受：今天在宾夕法尼亚大学享受假期的她，照片中在重症监护室里生死未卜的她，以及冷冻在隔壁“小丑库斯提”液氮罐里的她。 “你还记得住院时候的情景吗？”我问道。“不，”她望着外面的雨说，“我只记得离开。”当我看到山姆病情的进退，以及埃米莉·怀特黑德令人惊叹的痊愈时，我知道我也正在见证一种医学的诞生，即细胞被重新用作治疗疾病的工具，而这就是细胞工程。但这也是一个历经数百年故事的重现。我们由细胞单元构成。我们的短板取决于细胞的弱点。尽管细胞工程仍处于萌芽阶段，但我们设计或操控细胞（在山姆与埃米莉的案例中是免疫细胞）的能力，已经成为一种新型医学的基础。如果我们知道如何在不引发自身免疫攻击的情况下，更有效地武装山姆的免疫细胞来对抗其黑色素瘤，他今天会不会还能手拿线圈本为报刊撰写体育报道？这两位新人类是细胞操控与细胞重构的例子。埃米莉的情况表明，我们对于T细胞生物学规律的理解，似乎足以将一种致命疾病遏制十多年，而且，很有希望让她终身获益。山姆的案例反映，对于如何平衡T细胞对癌症和自身的攻击，我们似乎仍然缺乏某些至关重要的洞见。未来会带来什么？请让我澄清一下：我在全书与英文版书名中均使用了“新人类”这个短语。并且我在使用这个短语时对其有非常明确的定义。我指的不是科幻视角下的未来“新人类”：那是一种人工智能增强、机器人技术改良、搭载红外线设备且服用蓝色药丸的生物，他们可以在现实与虚拟世界中幸福地共存，就像身着黑色宽松长袍的基努·里维斯一样。我指的也不是那些“超人类”，他们拥有超越我们当前一切的增强能力与潜能。我指的是一种通过修饰细胞重新构建的人类，他们的外观与感觉（在大多数情况下）与你我十分相似。一位饱受难治性抑郁症煎熬的女性，她的神经细胞（神经元）正受到电极的刺激。一位小男孩正在接受一项实验性骨髓移植，准备用基因编辑细胞治疗其镰状细胞贫血。一位1型糖尿病患者被注入自己的干细胞，而这些干细胞经过再造后能够产生胰岛素，以维持血糖，也就是其身体燃料的正常水平。一位历经多次心脏病发作的八旬老人，被注射了一种可定位至其肝脏的病毒，其能够永久性降低堵塞动脉的胆固醇，从而降低他再次心脏病发作的风险。我想到自己的父亲，如果他被植入了神经元，或者神经元刺激装置，那么他就能保持步态平稳，并且避免跌倒招致的死亡。我发现这些“新人类”以及用于创造他们的细胞技术，要比那些纯属虚构的科幻作品角色更加激动人心。通过极限努力与无尽爱心精雕细琢的科学，以及新颖独特到令人难以置信的技术，我们改变了这些人，以缓解他们的痛苦：例如将癌细胞与免疫细胞融合，以产生治愈癌症的永生化细胞；或者从一个小女孩的身体中提取T细胞，将其用病毒改造为对抗白血病的武器，然后再把此类T细胞回输到她的身体内。我们将在本书的几乎所有章节中见到这些新人类。随着我们学会用细胞重建身体与器官，我们将在现在和未来与新人类相遇，无论是在咖啡馆、超市、火车站和机场，还是在社区和我们自己的家庭中。我们会在堂表亲、祖父母、父母与兄弟姐妹中找到他们，或许甚至是在我们自己身上发现他们的踪迹。19世纪30年代末，科学家马蒂亚斯·施莱登与特奥多尔·施旺提出，所有动植物的组织都是由细胞所构成的，从那时起，一直到埃米莉康复的那个春季，在不到两个世纪的时间里，一种全新的概念席卷了生物学与医学，几乎触及这两门学科的各个方面，并且永远改变了它们。复杂的生物体是由微小、独立、自我调节的单元组成的集合体，如果你愿意的话可以称之为“生命隔间”，或者如荷兰显微镜学家安东尼·范·列文虎克在1676年所说的“生命原子”。人类是由这些生命单元组成的生态系统。我们是像素化的集合体与复合物，我们的存在是合作聚集的结果。我们是由各个部分组成的整体。细胞的发现，以及人体作为细胞生态系统的重构，也宣告了一种基于细胞治疗操控的新型医学的诞生。髋部骨折、心脏停搏、免疫缺陷、阿尔茨海默病、艾滋病、肺炎、肺癌、肾衰竭、关节炎，所有上述问题都可以被重新理解为细胞或者细胞系统功能异常的结果。而所有这些疾病均可以被视为细胞疗法的靶点。基于我们对细胞生物学的新认知，医学的变革可以被大致分为四类。第一类是使用药物、化学物质或物理刺激来改变细胞的属性，也就是它们之间的相互作用、相互交流与行为方式。针对细菌的抗生素、癌症的化学疗法与免疫疗法，以及通过电极刺激神经元来调节大脑中的神经细胞回路都属于这第一类。第二类是细胞在不同机体之间的转移（包括重新回到我们自己的身体），例如输血、骨髓移植与体外受精。第三类是利用细胞合成某种物质，例如胰岛素或者抗体，对疾病产生治疗效果。最近，还出现了第四类变革：对细胞进行基因修饰后再开展移植，以创造具有全新属性的细胞、器官与身体。其中一些疗法，例如抗生素与输血，已经深深根植于医学实践中，以至于我们很少将它们视为“细胞疗法”。但是它们起源于我们对细胞生物学的理解（正如我们很快就会看到的，细菌理论是细胞理论的延伸）。其他一些疗法，例如癌症的免疫疗法，是21世纪的发展成果。此外，还有一些治疗方法非常新颖，例如通过输注修饰干细胞来治疗糖尿病，这样的方法仍然停留在实验阶段。然而，所有这些新旧措施都属于“细胞疗法”，因为它们均在很大程度上依赖于我们对细胞生物学的理解。并且每一次进步都改变了医学的发展方向，也改变了我们对人类存在与生活的认知。 1922年，通过输注从狗的胰腺细胞中提取的胰岛素，一位患有1型糖尿病的14岁男孩从昏迷中苏醒过来，可以说仿佛获得了重生。2012年，当埃米莉·怀特黑德接受CAR（嵌合抗原受体）T细胞输注时，或者在10年后，当首批镰状细胞贫血患者被基因修饰的造血干细胞治愈时，我们正从基因世纪过渡到与之交相辉映的细胞世纪。细胞是生命的基本单元。但是这引出了一个更深层次的问题。“生命”是什么？这可能是生物学中一个形而上学的难题，我们对于生命的界定与理解仍然存在争议。生命的定义无法通过单一属性来概括。正如乌克兰生物学家谢尔盖·索科洛夫所说：“每种理论、假说或观点，都会根据自身的科学兴趣与前提采纳生命的定义。在科学界的讨论中，有数百种常用的传统生命定义，然而却没有一种能够成为共识。”（2009年，索科洛夫不幸在其学术生涯的黄金时期去世，他对于上述问题应该十分清楚，因为这种现状一直令其困扰。他是一位天体生物学家。他的研究涉及寻找地球以外的生命。但如果科学家们仍在努力定义“生命”这个术语本身，那么他们又如何才能发现生命呢？）就目前而言，生命的定义就像一份菜单。它不是孤立的概念，而是一系列事物、一整套行为、一连串过程的集合，具有纷繁复杂的属性。为了生存，有机体必须具备繁殖、生长、新陈代谢、适应刺激与维持其内部环境的能力。复杂的多细胞生物还有我所谓的“涌现”性质:来自细胞系统的性质，例如抵御伤害与入侵的机制、具有特殊功能的器官，甚至包括感知与认知的器官间生理通信系统。而所有这些性质最终都寄托在细胞或细胞系统中并非巧合。因此，在某种意义上，我们可以将生命定义为拥有细胞，并且将细胞定义为拥有生命。这种递归定义并非毫无意义。如果索科洛夫遇到了他寻找的第一个外星生物，例如，一位来自半人马座阿尔法星系的外星人，他可能会询问这个生物是否“有生命”，以及是否符合生命属性的定义。但是他也可能对这个生物提出这样的疑问：“你有细胞吗？”我们很难想象没有细胞的生命，正如无法想象没有生命的细胞。或许这个事实彰显了细胞故事的重要性：我们需要通过细胞来了解人体。我们需要通过它们来理解医学。但最重要的是，我们需要细胞的故事来讲述生命与我们自己的故事。那么，细胞是什么呢？从狭义上讲，细胞是一种充当基因解码机的自主生命单元。基因提供指令，或者说是密码，来构建蛋白质，这些分子在细胞中几乎执行所有工作。蛋白质能够促成生物反应，协调细胞内的信号传递，构建细胞的结构元素，以及通过开启与关闭基因来调控细胞的身份、代谢、生长与死亡。它们既是生物学中的核心执行者，也是让生命成为可能的分子机器。基因携带着构建蛋白质的遗传密码，其物理定位是在一种叫作脱氧核糖核酸（DNA）的双链螺旋分子上，而它在人类细胞中被进一步包装成名为染色体的线团状结构。据我们所知，DNA存在于每个活细胞中（除非它已经被从细胞中移除）。科学家一直在寻找使用DNA以外分子来携带其指令的细胞，例如RNA，但是迄今为止，他们还从未发现过携带RNA指令的细胞。我所说的解码，指的是细胞内分子读取遗传密码中的特定部分，就像管弦乐团中的乐师读取他们各自的乐谱一样，细胞以此方式诠释了它独特的歌曲，从而使基因的指令以实际的蛋白质形式得到呈现。或者，简而言之，基因携带密码，细胞破译密码。细胞因此将信息转化为形式，并将遗传密码转化为蛋白质。脱离细胞存在的基因毫无生命力，只是储存在惰性分子中的说明书，没有音乐家愿意配合演奏的乐谱，无人阅读其中书籍的孤独图书馆。细胞为基因带来物质性与实体性。细胞使基因焕发了生命力。但细胞不仅仅是一台基因解码机。通过合成其基因中编码的一组特定蛋白质，细胞在解读基因密码后就成为一台整合机。细胞使这组蛋白质（以及由蛋白质合成的生物化学产物）相互协同，然后开始协调其功能与行为（细胞运动、新陈代谢、信号传导、营养输送、环境感知），从而获得生命的基本特征。而这种行为反过来又表现为生物体的行为。生物体的新陈代谢取决于细胞的新陈代谢。生物体的繁殖取决于细胞的繁殖。生物体的修复、生存与死亡取决于细胞的修复、生存和死亡。器官或生物体的行为取决于细胞的行为。生物体的生命取决于细胞的生命。最后，细胞还是一台分裂机。正是蛋白质这种细胞内分子，启动了复制基因组的过程。随后细胞的内部组织结构发生了变化。染色体，即细胞的遗传物质所在地，发生分离。细胞分裂是生命的基本与定义特征之一，它推动着生长、修复、再生与最终的繁殖。我一生都在与细胞打交道。每当我在显微镜下看到一个细胞时，那种光彩夺目、熠熠生辉、生机勃勃的感觉，都会让我重温初次见到细胞时的兴奋。1993年秋季的一个周五下午，我作为研究生来到牛津大学阿兰·汤森实验室学习免疫学大约一周后，我将一只小鼠的脾脏磨碎，将带血的混合物加入含有T细胞刺激因子的培养皿中。周末过去之后，我在周一早上打开了显微镜。房间里的光线暗淡，甚至无须拉下窗帘，而牛津城总是如此（如果说万里无云的意大利是为望远镜而生的地方，那么阴霾昏暗的英国似乎就是为显微镜而量身定制）。然后，我把培养皿放在显微镜下。在组织培养基下漂浮着大量半透明的肾形T细胞，它们散发出一种我只能形容为光泽饱满的感觉，这是细胞健康与活跃的迹象。（当细胞死亡时，光泽逐渐变暗，它们会收缩变成颗粒状，或者用细胞生物学的术语来说，就是固缩。） “仿佛眼睛在凝视着我一样。”我自言自语道。然后，令我吃惊的是，T细胞开始移动起来，目的明确地寻找可能需要清除与杀伤的感染细胞。它们彰显出勃勃生机。多年之后，观察人类中细胞革命的发展不免令人陶醉与痴迷。当我首次在宾夕法尼亚大学礼堂外一处灯火通明的走廊里见到埃米莉·怀特黑德时，仿佛她为我打开了一扇跨越时空的大门。我起初接受的是免疫学培训，然后成了干细胞科学家，接着又从事过癌症生物学研究，最后才跻身于医学肿瘤学家之列。埃米莉代表了人们在既往付出的全部心血，这里不仅有我的努力，更重要的是还有成千上万研究人员的辛勤血汗，他们在漫长的日夜里俯视着不计其数的显微镜。她象征着我们想要深入细胞的明亮内核，以及去理解它无穷无尽迷人奥秘的渴望。她承载了我们见证一种新型医学诞生的迫切期望，而这种医学就是基于细胞生物学解析的细胞疗法。我到山姆的病房去看望这位好友，目睹他的病情周而复始地缓解与复发，这让我感受到一种与振奋截然相反的寒意，以及对还有多少知识尚待学习与了解的忧虑。作为一名肿瘤学家，我关注的是那些横行霸道的细胞，它们闯入了本不应该存在的领域，并且不受控制地分裂。这些细胞扭曲并颠覆了我在本书中描述的行为方式。而我需要努力去理解发生这种情况的原因与机制。你们可能认为我是一个陷入颠倒世界的细胞生物学家。细胞的故事已经融入了我的科研工作与个人生活。当我在2020年初至2022年期间奋笔疾书时，新冠疫情继续在全球范围内肆虐。我任职的医院、我迁居的纽约市以及我的故乡到处都充斥着患者与逝者。到了2020年2月，在我所工作的哥伦比亚大学医学中心里，ICU病床上躺满了被自己分泌物淹没的患者，只能通过机械通气来强迫他们的肺部进行呼吸。2020年的初春格外凄凉。纽约成了一个风雨飘摇的大都市，人们在空旷的大街小巷中相互躲藏。2021 年4月和5月，几乎是在疫情暴发后一年，印度才遭受了最致命的病例激增。尸体在停车场、背街小巷、贫民窟与儿童游乐场被焚烧。在火葬场，由于熊熊烈火燃烧得太过频繁且十分迅猛，因此支撑尸体的金属格栅都被腐蚀与熔化。起初，我还坚持在医院出门诊，后来，当就诊的癌症患者寥寥无几时，我就与自己的家人一起居家隔离。凝视着窗外的地平线，我又一次想起了细胞，还有免疫及其遭遇的困扰。耶鲁大学病毒学家岩崎明子告诉我，新冠病毒引起的核心病理是“免疫失调异常触发”，也就是免疫细胞的调节异常。我以前甚至都没听说过这个术语，但是它的影响力让我十分震撼：从本质上讲，这种大流行病也是一种细胞病。是的，虽然病毒无处不在，但是在没有细胞时，病毒是惰性的，不具备生命力。我们的细胞唤醒了瘟疫并使其恢复了活力。为了掌握大流行病的核心特征，我们不仅需要理解这种病毒的特异性，还需要理解免疫细胞生物学及其面临的困扰。在那段时间里，似乎我的所有思绪与状态都与细胞这个主题紧密相连，我不确定有多少内容是根据主观意愿创作的，有多少成分是这个领域迫切需要表达的。在《癌症传》中，我描述过探索治疗或预防癌症的艰辛历程。而《基因传》的写作动力则源自解读与破译生命密码的追求。如今《细胞传》即将带领我们踏上一段非比寻常的旅程，也就是从细胞这个最基本的单元来理解生命。这本书的内容与寻求治愈或破译密码无关。整部作品中不存在特定的对手。其主要人物希望通过了解细胞的解剖、生理、行为，以及它们与周围细胞的相互作用来认识生命。这是一首细胞之歌。他们的医学探索是为了寻觅细胞疗法，利用人体基本构件来重建与修复人体。因此，我只好选择了一种与众不同的叙事结构，而非像既往那样按照时间顺序逐渐展开。书中的每个部分都是围绕复杂生物的基本属性进行探讨。每个部分都是一段微缩的历史，记录一个探索发现的演进过程。每个部分都阐明了生命的一个基本属性（繁殖、自主性、新陈代谢），且它们都存在于一个特定的细胞系统中。每个部分都包含了新型细胞技术的诞生（例如，骨髓移植、体外受精、基因疗法、脑深部电刺激、免疫疗法），这些技术源自我们对于细胞知识的理解，并挑战了我们对人类构成与功能的概念。这本书由各个部分汇集而成：无论是历史与个人经历，生理学与病理学，过去与未来，还是我作为一名细胞生物学家与医生成长的亲身体验，均融合成了一个密不可分的整体。如果你们愿意接受这样的描述的话，那么可以说其组织架构与细胞相仿。当我在2019年冬季开始撰写这部作品时，我最初选择将其敬献给鲁道夫·菲尔绍。我被这位内向、勤奋与谦和的德国医学家所吸引，菲尔绍一直在抵制自己所处时代的病态社会力量，他倡导思想自由，捍卫公共卫生，鄙视种族主义，创办了自己的期刊，为医学开辟出一条独特且自信的道路，并在理解细胞功能障碍，也就是他所说的“细胞病理学”的基础上，开启了对器官与组织疾病的研究。最后，我的故事将重新回到一位朋友，也是正在接受一种新型免疫疗法治疗的癌症患者，以及埃米莉·怀特黑德的身上，这些患者为我们理解细胞与细胞疗法拓展了新思路。他们是体验我们对细胞人体治疗的早期尝试，并且将细胞病理学转化为细胞医学的先行者，虽然取得了一些成功，但也遭遇了一些失败。本书谨献给他们和他们的细胞。

183

“AI教母”李飞飞：她看见的世界和她改变的世界

导读李飞飞是人工智能领域最重要的科学家之一。她最重要的贡献，是创建了数据库ImageNet，有人工智能领域的从业者评论，“没有ImageNet，就没有现在的深度学习革命”，李飞飞也因此被誉为AI教母。她以女性细腻的笔调，讲述她作为女儿、科学家、移民和人道主义中眼中的世界，讲述了一个亚裔移民成长为美国三院院士、斯坦福大学终身教授的故事。以下是她新出版的的新书《我看见的世界：李飞飞自传》（中文版已上市，由中信出版集团出版）的摘编，回顾了在AI寒冬的年代，她是怎样在一片反对声中找到她的北极星，创建人工智能领域早期最重要的数据库ImageNet的过程。华裔科学家李飞飞李飞飞 | 撰文01 “我听到的劝阻之声多得够我用一辈子”每当我与同事们讨论ImageNet的想法，我就越发感到孤独。虽然有西尔维奥（注：李飞飞的丈夫）的鼓励，但这么庞大的工程刚刚起步，就遭到了几乎所有人的一致反对，真是不祥之兆。我需要一群志同道合的伙伴，但现在似乎一个队友都找不到。最糟糕的是，不管我是否同意，我都无法否认他们批评的合理性。毫无疑问，在2006年，算法是计算机视觉的中心，而数据这个话题并不十分吸引人。数据生活在算法的阴影之下，仅仅被视为训练工具，就像成长中的孩子玩的玩具一样。我听到的劝阻之声已经多得够我用一辈子了(可能下辈子也够了)，最后我终于遇到了第一位支持者。李凯教授是微处理器架构领域的领军人物。微处理器架构是一门将数百万纳米级晶体管排列到世界上最复杂的设备中的艺术，因此他比大多数人都更了解指数思维的力量。他相信我的方向是正确的。尽管我们都在计算机科学领域，但领域之间没有太多交集，所以他无法直接为我做出贡献，但他知道我们需要强大的计算能力才能启动。他毫不犹豫地为我们的研究捐赠了一套工作站。这正是我所需要的支持。不巧的是，他即将休长假，这缩短了我作为他的年轻同事的时间。不过，他的离开也不完全是坏事。他有一个极聪明的一年级研究生叫邓嘉，他要给邓嘉找个新导师。据李凯介绍，邓嘉是一个完美的合作者，他年轻有为，工程天赋出众，对新的挑战充满渴望。除了聪颖过人，我也注意到，邓嘉是计算机视觉领域的新人。他的背景与众不同，因此他不仅具备一般计算机视觉专业学生难以拥有的工程技能，同时还完全没有背负期望的包袱。这个项目不同于传统的研究项目，甚至可以说充满风险，与当时的领域潮流格格不入。对于这一切，邓嘉并不知情。于是，我们两人组成团队，开启了这个似乎需要成千上万甚至更多贡献者的项目。大多数同事对我的假设都不屑一顾。单从理论上讲，这一切确实说不通，但这是我人生中第一次感受到一种毋庸置疑的自信。无论需要多长时间，我确信我们正在做一件大事，一件也许具有历史意义的大事。我的新办公室位于普林斯顿大学的计算机科学大楼，虽然已经搬过来快四个月了，但地上依然堆满了半开的纸箱，墙壁上也空空如也。我靠在扶手椅背上，大声呼出一口气，转了转椅子。邓嘉坐在我对面的沙发上——这是我到目前为止为办公室添置的唯一家具。于是我们确定了一个目标，为每个物品类别搜集1000张不同的照片：1000张不同的小提琴照片、1000张不同的德国牧羊犬照片、1000张不同的抱枕照片，直到涵盖全部2.2万个类别，也就是一共需要大约2000万张图片。但即便是这个数字，也只是最终成品数据库的情况。我们可能需要从数亿张照片，甚至10亿张照片中筛选，才能达到目标。邓嘉面露疑色，“我从理论上能理解，但这个工作量也太大了，属于天文数字，可不是谷歌搜索几次就能完成的。”他说的当然没错，但是我们需要拥抱现实，而不是逃避现实。我们的目标是捕捉完整的现实世界。如果这个总数不能吓到我们，那才奇怪呢。“邓嘉，我们希望算法能够看到的一切事物都存在于这个世界的某个地方。在我们说话的这一刻，就有人在拍摄这所有的细节。现在人人都有翻盖手机，每个人的圣诞节礼物都是数码相机。想象一下，如果把所有这些照片都放在一起，我们会看到什么，我们会看到整个世界的缩影啊!那就是从世界一头到另一头的日常生活的全部。”“就算我们想办法组织好了图片，”他补充说，“这些图像本身也没有任何作用，对吧?它们需要先标注，才能用于模型训练，而且每一个标签都必须是准确的。”邓嘉暂停了一下，好像才感受到自己说的话有多么重要，“听上去又是一个浩大的工程。”“是啊，是啊。”我回答说，“让我们一次只创造一个奇迹吧。”02“完工时间大概是19年，我不能等那么久才拿到博士学位”我和邓嘉在实验室一角，看着一排本科生不断地点击鼠标、敲击键盘。本周早些时候，我们发出了邮件，招募愿意帮忙从网上下载和标注图片的本科生，工作时间灵活，每小时10美元。我们很快就收到了一些回复。这看起来很公平：我们朝着机器智能的新时代迈进了一步，而大学生也能赚到一些啤酒钱。一时间，我们感到心满意足，但没过多久，现实就给我上了一课。“邓嘉，是我的错觉吗，还是进展确实有点儿太慢了?”“对，我也很担心。我对他们的速度做了几分钟计时，计算了一下。”不妙。“按照目前的速度，预计ImageNet的完工时间是……”我用力咽了一下口水。他注意到了。“没错，差不多要19年吧。飞飞，我很看好这个项目，真的，只是我不能等那么久才拿到博士学位。”“那我们该怎么办呢?”他问，“再多找些本科生?”“这当然是一种选择，但是得花不少钱。如果真要19年的话，我觉得我们实验室的预算也是不够用的。”不管怎样，显然我们需要更多的大学生。当年做Caltech101的时候，招募的大学生勉强够用，而那次的工作量不过是ImageNet的零头。看来，我们必须采取新的策略了。做ImageNet已有一年时间，我感觉我们已经步入正轨。有了标注团队的工作，还有邓嘉在不断努力优化标注流程，我确信我们已经有所突破。我很好奇进展如何，而邓嘉知道我的想法(他经常能知道我在想什么)。“你在想我们多久能完成ImageNet?我已经重新预估时间了。”我正准备问他这个问题。于是我兴奋地跑到他的办公桌前。“好的，如果我们把所有因素都考虑在内：我们所有的优化和快捷方式，再加上已经标注的图片，我们已经设法将19年的预计时间缩短到……”我突然失去了勇气，因为我预感结果会很糟糕。“……大约18年。”邓嘉虽然才华横溢，但巧妙地传达坏消息、减轻它对人的打击并不是他的技能之一。这么久以来，我第一次不知道接下来该怎么办了。“飞飞，你现在有自己的实验室了，最近在忙什么呢?”这是我最害怕听到的问题，但这个问题来自吉滕德拉——彼得罗的导师，也是我的“师爷”，他是我此行最想遇到的人。我们已经好几年没有面对面交流了，我知道他会出席计算机视觉与模式识别大会这样的活动。ImageNet项目停滞不前，我的学术生涯前途渺茫，我需要见见熟人。他也不是第一次在这种场合鼓舞我的斗志了。“说实话，吉滕德拉，这个话题有点儿让人郁闷。”“哎呀。”我把一切都如实告诉了他：我和克里斯蒂安的谈话，第一次见到WordNet时的情景，我和邓嘉所做的决定——每个决定都比上一个更艰难，以及这一年来我们为实现一个不可能实现的目标所经历的苦苦挣扎。“还真曲折呀。”他回答道，语气一反常态地平淡。如果他对我目前介绍的进展情况有什么意见的话，他会选择闭口不谈。“是的。最糟糕的是，这一切归根结底是个后勤问题，而不是科学问题。我始终确信，ImageNet正是计算机视觉所需要的，要是我们能把这玩意儿搞出来就好了。”“飞飞……”他开始小心翼翼地组织语言，“当然，没有人会不认同数据起着一定的作用，但是……”他停顿了片刻，然后继续说道，“坦率地说，我觉得你们在这个想法上投入得过多了。”我浅浅地吸了一口气。“科学的诀窍是跟随着你的领域一起成长。不要太超前。”这真是出乎我的意料。吉滕德拉竟然站在反对者的一边，让我深受打击。这种打击不仅仅是在个人层面：等到我将来需要请人写终身教职推荐信的时候，我原本计划请他做我的推荐人之一(虽然在这样巨大失败的阴影笼罩下，能获得终身教职的可能性已经变得非常渺茫)。出于多方面的原因，他的观点很重要。我几乎可以看到我的北极星在逐渐暗淡下来，我的道路又陷入了黑暗之中。一个可怕的想法开始在我心头升起：我承担的风险比我意识到的更大，而现在回头已经为时太晚。在计算机视觉与模式识别大会之后的几个月里，我都不知道应该如何处理ImageNet。要担心的事情有很多，但我总会想起邓嘉。他进入计算机视觉领域时才气过人却又稚气未脱，他信任我，让我担任他的导师。现在，我能感觉到他的挫败感越来越强，我知道他在担心自己的博士之路，我完全能理解他。我还记得自己在研究生时期的种种挣扎，一想到现在要把自己的学生引入歧途了，我的胃里就阵阵难受。当然，科学研究上的挫败也同样令人痛苦。在经历了如此漫长的旅程之后，我无法接受我的直觉居然导致了错误的道路。我们突然失去了方向，仿佛头顶上是一片空荡荡的天空，在黑色波浪中漂泊。03没有哪个个体的智慧能有意外之力的一半强大然而，一切都还没有结束。“打扰一下，飞飞。”我正在赶去教职工会议的路上，马上就要迟到了，一个叫孙民的研究生突然出现在我面前。他能看出我在赶时间，但他看上去非常想要跟我聊聊，说话的时候甚至显得有些不安。“请问你现在有空吗?”他没等我回答。我对他比较了解，知道他说话时一般都是轻声细语的。看他今天的表现，显然是有大事压在心头。“昨天我跟邓嘉在一起，”他继续说，“他跟我说了你们在项目标注问题上遇到的麻烦。我有一个你俩还没试过的办法，真的可以帮你们提高速度。”我立刻忘记了自己还在赶时间，耳朵竖了起来。邓嘉还有社交生活?孙民问道：“你听说过众包吗?”他解释说，在线平台可以将任务分配和结果收集过程自动化，有效组织远程的临时工作团队，规模小到个人，大到数百万人的团队。“如果你感兴趣的话，亚马逊就在提供这种服务，叫作’土耳其机器人’。”“请求者”可以发布“人类智能任务”，由贡献者完成，这些贡献者被称为“土耳其人”(Turker)，他们可能来自世界上的任何地方。从理论上讲，这个模式很合理，似乎可以提供我们想要的一切:既有人工标注图片带来的智慧成分，又有与自动化相当的速度与规模。有趣的是，亚马逊称之为“人工人工智能”，这个名字相当贴切。我急匆匆地穿过走廊找到了邓嘉，但他并没有像我这般兴奋。在经历了种种挫折之后，他有充分的理由对再次碰运气保持警惕。但在经历了这一切之后，他可以看到，这真的可能是我们一直在等待的救命稻草。他看起来既犹豫又宽慰。最终他同意了:亚马逊土耳其机器人值得我们再试一次。ImageNet之所以能够存在，要归功于互联网、数码相机和搜索引擎等众多技术的融合。现在，一个一年前还几乎不存在的平台提供的众包服务，成为让我们的项目臻于圆满的关键因素。这件事就是最好的例证，它让我深刻了解到，任何一个科学家的默认立场都应该是绝对谦卑，他们应该明白，没有哪个个体的智慧能有意外之力的一半强大。亚马逊土耳其机器人改变了一切。它把我们起初的大学生标注员队伍变成了一个由数十人、数百人、数千人组成的国际团队。随着我们获得的支持不断扩大，邓嘉给出的预计完成时间急剧缩短，先是15年，然后是10年、5年、2年，最后不到1年。这为我们提供了全新的视角来看待预算，彻底颠覆了ImageNet的成本效益。曾几何时，我们的预算只能招到几个标注员，连一个房间都站不满，而现在足以聘请一支遍布全球并通过互联网连接的众包团队。就这样，每天都有成千上万张新图像被标注出来。在ImageNet发展的高峰期，我们是土耳其机器人平台上最大的雇主之一，这一点从我们每月的服务账单上也能看出。成本的确很高，但效果也很显著。然而，我们的预算困境还没有结束。虽然土耳其机器人价格合理，但ImageNet规模实在太大，所以我们很快发现自己再一次接近预算极限。在两年多的时间里，我们的财务状况一直岌岌可危，那是一段痛苦的日子，哪怕是路途中的一个小颠簸，都有可能让我们人仰马翻、一蹶不振，但ImageNet日臻完善，终于成为我和邓嘉一直憧憬的研究工具。我们实验室自然是第一个将其投入使用的。即使是在未完成的状态下，它的影响力也让我们备受鼓舞。完工在即，我们不再需要依靠想象力;大家第一次清楚地意识到，我们正在创造一个值得与全世界分享的东西。在2009年，我决定再次前往西部，邓嘉和我的大多数学生也跟随我转学。斯坦福大学成了我们新的学术家园。2009年6月，ImageNet的初始版本终于完成了，这在很大程度上得益于斯坦福大学提供的新研究资金。尽管我们一路上遇到了许多挑战，但我们最终成功达成了目标:收集了1500万张图片，涵盖了2.2万个不同类别。这些图片筛选自近10亿张候选图片，并由来自167个国家的4.8万多名全球贡献者进行了标注。ImageNet不仅在规模和多样性上达到了我们多年来梦寐以求的水平，还保持了一致的精确度:每张图片都经过了手工标注，并在层次结构中进行了组织，经过了三重验证。从数量上看，我们已经实现了既定目标，建立起了当时人工智能史上最大的人工编辑数据集。但在这些数字之外，最让我感动的成就是我们所构建的真实世界本体。这个本体是人类从零开始策划的，既包含视觉图像，又能传达逻辑概念，其唯一的目的就是教导机器。我们实验室所做的每一件事都充满了活力。有一次，我们利用ImageNet快速训练了数百个图像分类算法的实例，让它们识别一组日常事物，然后将所有实例应用在一张照片上。实验目的并不是简单地检测单个物体的存在，而是通过寻找物体组合来诠释整个场景。例如，如果检测算法发现了一个人、一艘船、一只桨和一片水域，它就会将照片作为一个整体归类为“划船”。这是一种更深层次的理解，可以说接近于原始的视觉推理。就像我们那个时代的许多实验一样，我们使用的算法准确性很不稳定，还有很大的改善空间。毕竟，就连简单的图像识别也仍处于起步阶段。但困难只会进一步激发我们的冒险精神。我们的研究大胆且具有前瞻性，虽然并不完备，但能引发思考，其中很多在概念上也很简单。但直到ImageNet出现，一切才变得切实可行起来。与此同时，邓嘉也开始在学术领域崭露头角。在ImageNet发布后一年左右，他发表了题为《对超过10000个图像进行分类能告诉我们什么》的论文，总结了ImageNet出现后图像识别领域发生的根本性变化。尽管论文技术性很强，但其中所蕴含的哲学思想使它有别于一般的学术论文。这篇论文宛如一个预言，甚至触及了存在的本质。邓嘉认为，ImageNet不仅代表了规模的扩大，还代表了分类逻辑的转变，类似于物理学领域的“相变”，在这种转变中，甚至现象的最基本属性也会发生变化。ImageNet极大地拓宽了算法面临的可能性，但因为规模太大，也给算法造成了挑战(相比而言，小型数据集就不会有这个问题)。“你知道我最喜欢Caltech101哪一点吗?”亚历克斯的话把我拉回了现实，“除了里面的训练数据，它还让我有机会用完全相同的图像，把我的研究结果和你的进行比较，做同类对比。”“相当于一个基准。”我回答道。“没错，这样就很容易衡量进展。还有什么比这更能激励研究人员呢?就像是发起了一个挑战，就像打赌一样。”就像打赌一样，我喜欢这个说法。“那么……如果我们用ImageNet做同样的事呢?”我问道，边思考边说，“或者，干脆我们就用ImageNet搞一个完整的竞赛怎么样?”“你是说像PASCAL那样的吗?”PASCAL视觉对象类别数据集(通常称为PASCALVOC)是一个欧洲研究团队汇编的数据集，包含大约1万张图片，分为20个类别。PASCALVOC与Caltech101类似，但有一个重要区别:PASCALVOC是年度计算机视觉大赛的基础数据集。该大赛始于2005年，每年都有来自世界各地的参赛者提交经过PASCALVOC训练的算法，然后用这些算法去识别一组以前没有见过的新图片，最后根据分类的准确度对算法进行排名，错误率最低的即为获胜算法。比赛既具有协作性，又具有竞争性，吸引了各方对计算机视觉领域最新进展的关注。而参赛者所使用的数据集仅有ImageNet的千分之一大小。“那就有意思了。”亚历克斯回答道，“我都可以想象研究人员在互相交流新想法的时候问:‘它在ImageNet上的表现怎么样?’”这样一来，ImageNet也成了计算机视觉领域的北极星了，我想。如果邓嘉论文的核心思想是正确的，如果ImageNet真的会引起一场大洗牌，带来新的规则、新的直觉，甚至全新的范式，那么还有什么比通过比赛来探索这个数据集更好的方式呢?激烈的竞争压力可以激发合作的集体力量。比赛要遵循一定的规则，但又要有探索性。即使经过多年的努力创建了ImageNet，仅仅是想像着把它做成比赛，也为它注入了新的生机。这也意味着将ImageNet推向世界的工作尚未结束。04黎明前的黑暗一回到美国，我就开始了比赛的筹备工作。比赛的正式名称为“ImageNet大型视觉识别挑战赛”(ImageNet Large Scale Visual Recognition Challenge，ILSVRC)，对所有人开放，获胜者会即刻获得认可。首届比赛将于2010年举行，5月开放报名，9月统计结果，同年晚些时候，会在克里特岛举行的欧洲计算机视觉大会(European Conference on Computer Vision，ECCV)研讨会上公布获胜者。然而，现实却与我们的期望背道而驰。获胜算法来自一个由NEC实验室、罗格斯大学和伊利诺伊大学的研究人员组成的联合团队。这个参赛算法的表现确实可圈可点，我们对每位参赛者的努力表示赞赏。不过，与计算机视觉领域其他方面的前沿工作相比，这些算法只能算略有改进，很难说开启了新的时代。在ImageNet的发展历程中，有很多令人泄气的时刻，这次就是其中之一。如果说2010年的比赛虎头蛇尾的话，那么2011年的比赛则给人一种末日之感。2011年的获胜算法来自法国施乐研究中心，也是一种支持向量机算法，识别表现虽然比前一年有所提高，但也只是将准确率提高了2个百分点左右。我开始意识到自己可能误判了。正如我猜测的那样，大多数算法都难以应对ImageNet，但支持向量机比我想象的要强大，它为参赛者提供了安全的避风港，阻碍了我梦寐以求的激进创新。连续两年，司空见惯的算法都只是在能力上略有提升，几乎没有任何真正的进步。最糟糕的是，参赛人数也出现急剧下降:第二年的报名人数从150人减少到96人，参赛算法也从35个减少到15个。愿意为此付出努力的人似乎越来越少，也许这并不奇怪。说这种经历“让人羞愧”已经远远不足以描述我们的心情了。为了推动ImageNet的发展，我们倾注了多年的心血，搜集的图片数量远远超过以往的任何数据集，还精心策划了一场国际竞赛来探索它的能力，但结果却只是简单地重复了现状。如果说ImageNet是一场赌注，是时候开始思考我们是不是已经输了。2012年8月，让我夜不能寐的事情终于不再是ImageNet了——我们的孩子出生了，我的生活主题变成了哺乳、换尿布和永远不够的断断续续的睡眠。这一年，ImageNet挑战赛的结果将在意大利佛罗伦萨宣布，因为孩子的原因，我本不打算亲自去参加，但有一天，邓嘉深夜打来电话。这个时间点很不寻常，我的第一反应是出了什么事。“喂?”听得出他很激动，但感觉不像是痛苦，而更像是兴奋，准确地说，是迷茫而兴奋。因为邓嘉一向淡定，所以他的语气让我格外留意。“是这样的……我们一直在评估今年的参赛作品，其中的一个算法是……我的意思是……”他迟疑了一下。05正名时刻“怎么了?是什么?”我问道。“好吧。获胜的团队使用了非正统的算法，是一种神经网络算法。你敢相信吗?”我的耳朵竖得更直了。如果说刚才我的注意力还没有完全集中在他的身上，那么现在我肯定百分之百地在听他说话了。“感觉像是……老古董。”“真的吗?是神经网络算法?”“是的，但还不止这些。飞飞，你不会相信算法的表现有多好。”我一直在思考这次的获胜算法。它的识别准确率高达85%，比上一年的冠军高出10个百分点，创造了计算机视觉领域的世界纪录。可以用一个数据来说明这个准确率的意义:我所看到的研究表明，人类的平均识别准确率约为97%，而这还是对简单得多的二元选择而言(比如判断一张照片上是否有动物)。相比之下，算法需要筛选上千个选项才能找到正确答案。因此，虽然这个算法还没有达到人类的水平，但已经比其他任何算法都更加接近，而且差距已经小到惊人。冠军算法名为AlexNet，是向这项技术和项目的主要作者、多伦多大学研究员亚历克斯·克里热夫斯基(Alex Krizhevsky)致敬。AlexNet是卷积神经网络(Convolutional Neural Network，CNN)的一个实例。卷积神经网络的叫法源于图形卷积过程。在这个过程中，一系列滤波器在图像上扫过，寻找与网络所识别事物相对应的特征。这是一种独特的有机设计，灵感来自休伯尔和威塞尔对哺乳动物视觉系统的观察，即视觉处理在多个层次上进行。就像在自然界中一样，卷积神经网络的每一层都会逐渐整合更多的细节信息，从而形成越来越高层次的感知，最终将真实世界的物体完整地呈现在我们的视野中。当然，这些并不是什么新的创意。自从贝尔实验室成功将卷积神经网络应用于手写邮编，杨立昆多年来一直对卷积神经网络保持着惊人的忠诚。在AlexNet诞生时，他已经花了20年时间坚持不懈地完善算法、发表研究成果，但一直没有必要的资源来充分实现这些成果。现在，几乎在一夜之间，这种常被视为误入歧途的执着似乎变得极具先见之明。杨立昆把自己的卷积神经网络算法巧妙地命名为LeNet(呼应他的英文名Yann Le Cun)，其指导理念在AlexNet中熠熠生辉，宛如重生般焕发生机。这种联系让AlexNet背后的三人团队备受瞩目。他们都是多伦多大学的研究人员，负责人是与项目同名的亚历克斯·克里热夫斯基，以及他的合作伙伴伊利亚·苏茨克维(Ilya Sutskever)。这两个聪明的年轻人资历尚浅，仍在建立自己的声誉。然而，第三个名字立刻引起了我的注意:杰弗里·辛顿。就是这位辛顿，在20世纪80年代中期开发了反向传播技术，成为早期机器学习的先驱。反向传播的突破性方法首次实现了对大型神经网络的可靠训练。就是这位辛顿，曾经指导过彼时还是他实验室学生的杨立昆。和他的学生一样，辛顿拒绝放弃对神经网络的研究，即使这让他在同事中显得形单影只。看来，AlexNet绝不仅仅是一个参赛算法。这是一个历经四分之一个世纪的正名时刻。事实上，在ImageNet的帮助下，AlexNet焕发生机，它贪婪地吸收着ImageNet的内容，在ImageNet规模和多样性的土壤中生根发芽，茁壮成长。一直以来，神经网络并不需要更花哨的数学公式和更奇特的抽象概念。我们期待神经网络能够理解世界，而它们只是在等待我们提供更加清晰的图景，等待一些真正有学习价值的东西。大数据训练了LeNet去理解复杂的人类笔迹，现在它也在训练AlexNet去理解万物。后来我才知道，在2012年之前的几年里，辛顿重拾激情，想要证明神经网络的可行性。2011年，他认为自己比以往任何时候都更接近转折点，于是开始以一种既对抗又合作的方式与同事沟通，他的表达方式听起来更像是提出挑战，而不是提出问题。他跟同行探讨下一步行动计划，其中一个同行就是吉滕德拉。虽然他们两人早有交情，但吉滕德拉一直对辛顿的项目持怀疑态度。“我要怎么做，才能让你相信神经网络是未来的趋势?”辛顿问道。“你真的想打动我吗，杰弗里?那就让我看看它们能不能处理一些真正的任务。”“比如?”“比如物体识别，真实世界中的物体识别。”无论吉滕德拉对ImageNet有什么看法，他的确相信视觉分类的力量，这一点我在加州理工学院时就了解到了，“你参加过PASCALVOC吗?”“参加了啊。但没什么用，他们的数据集太小了，例子不够，所以我们给神经网络展示新图片的时候，泛化效果并不好。”“那你就需要更大的数据集。你关注过飞飞的实验室吗?等你准备好迎接真正挑战的时候，可以看看她组织的比赛。”不管吉滕德拉是真的对我的项目改变了看法，还是只是想打老朋友的脸(这两种情况似乎都有可能)，辛顿都认真地听取了建议。ImageNet的数据广泛而全面，覆盖了世界上绝大多数物体。现在看来，AlexNet和ImageNet也属于相互成就。简而言之，这就是最大的不同——现在算法可以探索的数据范围大大增加了。一想到训练完成后AlexNet的层级中包含的内容，我就惊叹不已:形状、边缘、图案、纹理，涵盖我们多年来从互联网上捕捉到的所有人物、动物和物体。现实世界中幽灵般的碎片，以恰到好处的方式组织起来，供算法来查看。06历史刚被创造出来，而世界上只有少数人知道第二天一早，消息就传开了。据传，会上将宣布一个具有历史意义的事件。这些含糊不清的传言激起了与会者的好奇心。当我到达时，研讨会现场已经人满为患，杨立昆本人不得不靠后墙站着，因为他稍微晚了几分钟，没能找到座位。从研讨会开始的那一刻起，现场的气氛就异常紧张，人群分成了三派。第一派是ImageNet的少数支持者，包括我、亚历克斯·伯格和辛顿实验室的成员。第二派占绝大多数，由中立但感兴趣的观察者组成。第三派虽然人数不多，但态度强硬，也最直言不讳。他们是那些从早期就反对ImageNet理念的批评者，虽然我通常不理会他们的态度，但在会议现场很难忽视他们的存在。李飞飞演讲视频截图更糟糕的是，我们并没有形成统一战线。辛顿无法亲自参会，因为他长期患有背部疾病，几乎不可能进行国际旅行，所以他派了亚历克斯•克里热夫斯基代他出席。亚历克斯非常有才华，也是算法的主要作者，所以可以代替辛顿。但就像许多杰出的人一样，他的个人表现与他工作成果的高度并不相符——我不确定他是否完全理解这一点。他的表现笨拙而轻率(这在学术界并不罕见)。一个典型的例子是，我在研讨会开始前多次给他发短信确认会面时间，但他完全没有回应(但幸好，他按时到了现场)。由于听众的怀疑态度空前高涨，他只摆事实、不带情感的演讲更难赢得他们的认同。提问环节一开始，现场的紧张气氛就越来越浓。我们听到了所有常见的抱怨：ImageNet太大了，不实用;没有必要包含这么多类别;物体识别模型还太原始，不需要如此庞大的数据集;等等。事实上，AlexNet几乎是逐点证明了相反的观点，但奇怪的是，观众却不信服。同时，也出现了一些新的批评声音，有些甚至非常离谱。一位与会者(来自顶尖大学的后起之秀)煞有介事地提出，描绘T恤的图片类别多样性不够，因而无法可靠地训练模型。对此我更多的是感到好笑。是认真的吗?T恤图片是致命弱点?会议现场的其他人也都一头雾水。但那些认真倾听的人得到了回报。在27张幻灯片中，大多数只有黑白文字和图表，却以我们从未见过的清晰方式展示了神经网络的本质，极具启示性。继罗森布拉特的感知机、福岛的新认知机和杨立昆的LeNet之后，AlexNet实现了计算机视觉领域的新跨越。这一步早就应该迈出，却历经了数十年的酝酿，现在终于横空出世，利用大型数据集充分彰显了潜力。尤其值得注意的是AlexNet的学习过程。与所有神经网络一样，AlexNet的初始状态是无形的、惰性的，就像虚空中的一块挂毯。然后，学习过程就开始了:面对从ImageNet库中随机选择的图片，神经网络的任务是从上千个标签中选择一个正确的标签，对图片进行标注。这个过程周而复始，不断重复。一开始，标注几乎是不可能完成的任务;AlexNet的数千万个神经元是随机配置的，对世界甚至连一点儿模糊的理解都没有，只会产生错误的结果。把一张蘑菇图片标注为“瓶盖”。错误。把一张拖车图片标注为“电吉他”。错误。把一张棱皮龟图片标注为“浴巾”。错误。但失败并非无用功。错误会触发纠正信号，在网络的数千万个组成部分中蔓延开来，同时对每个部分对于结果的贡献进行评估，并按比例推动它们下次采取不同的行动。这是最简单的学习方式:减少失败的行为，增加成功的行为。但学习的规模极大，算法会仔细审查每个错误的每个细节:每一片光影、每一个图案和纹理、每一个柔和的渐变和坚硬的边缘。在早期阶段，效果并不明显，当AlexNet再次看到类似它之前错误分类的图片时，很可能会再次出错。不过，错误会更小一些。如此循环往复，直到正确为止，哪怕只是靠运气。这一次，信号的目的是强化，而不是削弱:强化任何看似指向正确方向的东西。训练继续进行。错误。错误。错误。正确。错误。错误。正确。正确。错误。ImageNet规模巨大，算法学习也注定是个漫长的过程，即使只是为比赛挑选的1000个类别的子集，完成学习也需要很长时间。ImageNet涵盖了各种各样的对象，比如数字钟、篱笆、盘式制动器、秒表、意大利灰狗、微波炉、醋栗，每个类别都有上千个不同的品种。不过，AlexNet本身也是个庞大的网络。它有65万个独立神经元，通过6.3亿个连接组成网络，其中有6000万个微小的、几乎无法察觉的权重影响着连接的强度，当信号从网络的一端流向另一端时，一些连接会增强，另一些则会减弱。作为整体，这些连接提供了一张巨大的画布，足以描绘整个世界。在一轮又一轮的标注中，权重不断变化，有的变强，有的变弱，有的摇摆不定，形成了一种柔韧结构，对训练做出有机的优雅反应。承载这些庞大数据的是两个英伟达图形处理器，高度专业化的硅芯片并行工作，以最快速度进行着一轮又一轮运算。训练从早到晚不停地进行，直到每幅图像的每个像素都被研究完毕。几个小时变成几天，几天又变成一周。图形处理器推动之。ImageNet挑战之。AlexNet适应之。随着数以千万计的权重一次又一次地调整，整个网络出现了更庞大、更奢侈的结构。就像铁匠用锤子敲打发光的钢铁。每次微小的增量积累，直到近乎肉眼不可见的扰动变成山脉和山谷，延伸到数千维的超空间。这个网络是世界无数细节的幽灵般的均值，是1000种不同事物、每种事物1000幅不同照片留下的痕迹。这里有1000只达尔马提亚犬，那里有1000个洗衣篮，另一处有1000个马林巴琴。就像地质变化一样，种种印记凝聚成了地形，从AlexNet的一端延伸到另一端。削笔刀、清真寺、海星、曲棍球——所有事物都镶嵌在这个地形之中。算法不仅“看到”了这些东西，还成为它们。我们花了数年时间在互联网上搜寻照片，这些照片形成了完整多元的机器意识空间，原始而强大，成为世界一切事物的统一表征。在经过140万轮标注后，最后几张图片与其说是一场磨炼，不如说是一场加冕礼。网络的焦点穿过像素，随着熟悉模式的识别而亮起，并传递到下一层，与其他模式相结合，形成越来越强大的感知。算法的反应不再是随机的，大多数也不再是错误的。土狼。正确。台灯。正确。敞篷车。正确。显然，这是硬件、软件和数据的神奇组合，比计算机视觉领域所打造的任何成果都更接近于捕捉到塑造了人类这种哺乳动物思维的进化精神。ImageNet的多样性是在全世界众包志愿者的共同努力下实现的。它所形成的拓扑结构无比多样、强大，达到了圣杯的境地。AlexNet是计算机视觉领域有史以来最大的神经网络，它的训练数据比此前任何神经网络都要丰富，而且具备了泛化能力。我们要花上几个月的时间，才能真正理解在那个会议室里看到的一切，但即使在那一刻，我们也清楚地知道我们正在见证非凡之物。这么多年来，我一直希望ImageNet能够推动新事物的诞生，现在我终于明白，一切的一切，都是为了认可和表彰一种永恒的成就，我们对此刻期待已久。受生物学启发的算法几十年来一直凝视着我们，它只是需要适当的挑战，才能充分展现出来。这个下午也让我们有机会回顾计算机视觉领域在过去10年的发展历程。我的实验室将所有赌注都押在了长达数年的、规模空前的数据追寻上，而辛顿的实验室则将他们的声誉都押在了卷积神经网络这套几乎已经被专业领域抛弃的算法上。我们都在赌，都有可能赌错。但在那一天，当我们看到神经网络在ImageNet强大训练能力的支持下展现出的惊人能力时，我意识到，虽然两个项目都获得了认可，但这只是因为它们是同步发展的。所有参与者都不知道，我们的每一步都相互依赖。我往返佛罗伦萨的飞行时间比在佛罗伦萨当地待的时间还长。但在返程的航班上，我的感受与来时完全不同。飞机上的拥挤程度丝毫未减，我的疲惫感更加浓重，但思绪已经不再飞速奔涌——至少不像来时那样。我亲眼见证了成果。没有错误，没有疏忽，也没有文书方面的失误。神经网络起死回生，比以往任何时候都更庞大、更复杂、更强大。ImageNet已经教会了它们所需知道的一切，让它们在一次尝试中就达到了与人类能力相当的水平。生物视觉的出现导致远古海洋波涛下的寒武纪大爆发，距今已经5亿年。而如今，我们很难不去联想:我们是不是正处于一个类似拐点的边缘?机器视觉的兴起是否会引发一轮数字进化新浪潮呢?我在来时飞机上狂躁的思绪和焦灼的问题一扫而空，取而代之的是一种意外的感觉。不是平静，而是大悟，是沉思。这一次，从起飞到着陆，我一直静静地坐着，脑子里只回荡着一个念头:历史刚被创造出来，而世界上只有少数人知道。

189

资讯

美国科研的“霸主地位”还能维持多久？

柳叶刀：世界首例！iPSC干细胞治疗恢复人类视力

《癌症传》作者最新力作：无论我们如何努力，我们终将回到细胞

“中国行动计划”欲重启？这次担忧的不仅是在美华人科学家

中国论文“自引”比例高，或导致全球论文排名有失公正

暨南大学学者最新论文：运动改善焦虑障碍的分子机制

中国年轻人肥胖相关癌症发病率急剧上升，00后是爷爷辈的25倍

Nature重磅：禁食是把双刃剑！禁食后重新进食，会促进干细胞再生，但也增加癌症风险

10个中国人，就有6个感染！北大团队发现，根除幽门螺杆菌，可将胃癌风险降低近20%

斯坦福大学最新研究，这种饮食，仅2个月，生物年龄年轻1岁

2024年生物技术产业，这几个热门方向被广泛看好

年龄增长，肺癌患病风险下降？除了与特定基因有关，还与铁代谢紧密关联

减重15%-20%！新型GLP-1减肥药不仅效果更佳，还能抑制食欲

重大科研突破！复旦大学樊嘉院士团队为癌症免疫治疗提供新思路

浙江大学朱永群与合作者最新Nature论文：细菌放“毒”，绵里藏针

三位异种器官接受者最终死亡，猪器官还适合移植人体吗？

三位异种器官接受者最终死亡，猪器官还适合移植人体吗？

“AI教母”李飞飞：她看见的世界和她改变的世界

AlphaFold 3重磅问世，准确性远超以往水平，给研究者“戴上一副高清眼镜”

恭喜！斩获第四届安全科技进步一等奖！