AI 教母 李飞飞

<markdown>

**AI 教母李飞飞博士 —— 大胆提问、文明级技术与找到人生北极星(第 839 期)**

2025 年 12 月 10 日,蒂姆・费里斯(Tim Ferriss)对斯坦福大学计算机科学系首任红杉教授、斯坦福以人为本人工智能研究所联合创始人、专注于空间智能的生成式 AI 公司 World Labs 联合创始人兼 CEO 李飞飞博士(@drfeifei)进行了专访。李飞飞博士曾于 2013-2018 年担任斯坦福人工智能实验室主任,2017-2018 年学术休假期间担任谷歌副总裁及谷歌云 AI / 机器学习首席科学家,还曾在多家公私企业、白宫及联合国担任董事或顾问。她 1999 年获普林斯顿大学物理学学士学位,2005 年获加州理工学院电气工程博士学位,著有回忆录《我所见的世界:人工智能黎明时代的好奇心、探索与发现》,该书入选奥巴马推荐的 AI 书籍及 2023 年《金融时报》最佳书籍。

**开场:普林斯顿的 “错过” 与重逢**

访谈开篇,两人谈及曾同为普林斯顿大学福布斯学院学生,却在校园及同一图书馆(Gest 图书馆)打工时从未相遇的趣事。蒂姆曾在普林斯顿、北京及首都经济贸易大学求学,2000 届毕业;李飞飞则回忆起当时校园的住宿学院制度、韦瓦(Wawa)便利店旁的校园位置,以及普林斯顿独特的 “饮食俱乐部” 文化。

**成长经历:跨文化的童年与勇敢的移民之旅**

李飞飞的成长堪称 “两座城市的故事”:她出生于北京,童年主要在以熊猫闻名的成都度过,15 岁时随母亲前往新泽西州帕西帕尼镇与父亲团聚,从普通中产华裔家庭的孩子变身美国新移民。

**与众不同的父母**

  • 父亲:极具好奇心与童真,热爱自然、昆虫,不关注女儿的成绩或竞赛奖项。在物质匮乏的 80 年代中国,周末常带她在城市边缘的稻田、水牛群中玩耍,移民美国后,还将庭院拍卖会(yard sales)变成 “寻宝游戏”,始终保持对生活的热爱。
  • 母亲:无技术背景,不追求分数,但注重培养女儿的专注力与纪律性(如要求按时完成作业,不边玩边学)。她因文革错失学术梦想,性格叛逆、坚韧,移民时虽无明确计划,却坚信自己和女儿能挺过难关,这种顽强深深影响了李飞飞。

**移民的初衷**

年少时的李飞飞对移民原因不甚了解,只模糊知道父母提及 “机会、自由与不同的教育”。成年后她才体会到父母的勇敢 —— 在无网络、语言不通的年代,放弃熟悉的一切移民他国,核心是为了给她提供前所未有的教育机会。而李飞飞自幼热爱物理与战斗机,这种对理工科的天赋与热情,也让父母坚信美国的教育环境更适合她发展。

**关键影响者:恩师鲍勃・萨贝拉**

高中时期的数学老师鲍勃・萨贝拉(Bob Sabella)是李飞飞移民后的重要贵人。作为 ESL(英语为第二语言)学生,李飞飞虽在数学上表现出色,却深感孤独,而鲍勃不仅以朋友身份与她探讨书籍、文化、科幻作品,倾听她的成长困惑,还为她牺牲午餐时间,一对一教授学校未开设的 AP 微积分 BC 课程。这份无条件的支持让鲍勃一家成为她的 “美国家人”,也为她日后进入普林斯顿奠定了基础。李飞飞强调,美国的公立学校教师是社会的无名英雄,他们面对多元背景的学生,默默付出,这也是她写书纪念这类恩师的原因之一。

**学术生涯:从物理到 AI,以 “北极星” 为导向的探索**

**从物理到 AI 的转向**

李飞飞自幼热爱物理,痴迷爱因斯坦的理论,渴望探索 “宇宙起源”“时空定义” 等大胆问题,因此考入普林斯顿物理学专业。本科末期,她的兴趣从 “物质世界” 转向 “智能本质”,萌生 “如何制造智能机器” 的疑问 —— 当时她尚未知晓这一领域名为 AI,随后进入加州理工学院攻读博士,正式开启 AI 领域的计算机科学训练。

**视觉智能:毕生追求的 “北极星”**

物理训练教会李飞飞 “大胆提问并将其转化为北极星”,她的首个核心目标是解决 “视觉智能” 问题:让机器不仅能识别 RGB 颜色或光线明暗,更能理解所 “见” 之物(如识别他人、椅子、画作等),即 “赋予机器理解世界的能力”。博士期间,她专注于目标识别研究,尝试了多种数学模型,却始终未能取得突破性进展。

**ImageNet 的诞生:大数据假说的突破**

2007 年,李飞飞重返普林斯顿任教,这成为她学术生涯的转折点。她意识到,AI 视觉识别领域长期停滞的核心问题并非模型本身,而是大数据的缺失—— 当时研究者需为识别狗、猫等不同物体分别设计算法,而人类孩童是通过观察无数物体与场景学会 “看见”,机器或许也应遵循这一逻辑。

**ImageNet 的核心价值**

  • 2007-2009 年,李飞飞与学生构建了当时 AI 领域最大的计算机视觉训练与基准数据集 ImageNet,包含 1500 万张高质量标注图像。
  • 它与神经网络算法、GPU(图形处理器)三大要素相结合,催生了 2012 年的里程碑论文《ImageNet 分类:深度卷积神经网络方法》,实现了图像识别性能的历史性突破,被广泛认为是 “现代 AI 的诞生标志”。

**数据集构建的挑战与创新**

  • 科学假设:明确 “视觉目标分类” 为核心问题,平衡数据规模与质量,避免过于简单(如仅识别 RGB)或复杂(如识别城市)的方向。
  • 众包解决方案:因需处理数十亿图像的人工标注,在资金有限、学生人力不足的情况下,李飞飞团队借助当时新兴的亚马逊 Mechanical Turk(众包平台),通过 “前置测试 + 隐式质量监控”(如插入已知答案的图像验证标注准确性),确保标注质量,最终筛选出高质量数据集。

**现代 AI 思考:以人为本,警惕极端叙事**

作为亲历 AI 发展数十年的 “见证者”,李飞飞提出核心观点:AI 是文明级技术,但人们忽视了 “人” 的核心地位

**AI 的文明级影响**

AI 已深度影响经济(据称美国去年 GDP 增长 4% 中,有 2% 源于 AI)、文化(从好莱坞到 TikTok,无处不在)、教育(家长担忧孩子的未来学习方向)等各个领域,重塑社会结构。

**人们的认知偏差**

  • 过度聚焦 “技术本身”,却忘记 AI 是 “人创造、人使用、人受影响” 的技术,人的尊严、自主权与参与权不应被忽视。
  • 极端叙事泛滥:硅谷的 “技术乌托邦”(AI 解决一切)与 “末日论”(AI 统治人类)均不现实,现实是 AI 带来的 “复杂中间地带”—— 既有巨大潜力,也需应对实际挑战。
  • 地域差异:美国与西欧对 AI 的担忧远多于中东、亚洲,李飞飞呼吁美国应重拾创新自信,让 AI 惠及农村社区、传统行业等所有群体,而非仅局限于硅谷或曼哈顿。

**创业愿景:World Labs 与空间智能**

李飞飞创办 World Labs,核心是打造下一代聚焦 “空间智能” 的 AI 技术。

**空间智能的定义**

不同于语言智能,空间智能是人类理解 3D 世界、与环境互动的基础能力 —— 从打包三明治、登山徒步到粉刷房间,本质是 “看见 - 理解 - 行动” 的闭环。当前 AI 的空间智能远落后于语言智能,而这一能力是解锁机器创造、制造、设计、机器人技术的关键。

**应用场景(当前与未来)**

  • 创意领域:为预算有限的高中剧院快速生成中世纪法国小镇等 3D 场景背景,辅助 VFX 制作、室内设计、游戏开发、教育场景构建(如让学生沉浸式体验历史场景)。
  • 科研与训练:助力心理学研究(如为强迫症患者创建可调控的触发环境,用于治疗测试)、机器人模拟训练(类似 “机器人飞行模拟器”)。
  • 易用性:非技术用户可通过文字描述或上传图像(如 Midjourney 生成的图片),在几分钟内获得可拖拽、可漫游的 3D 世界,还能进一步制作电影、添加游戏角色等。

**未来展望:被低估的趋势与给年轻人的建议**

**被低估的 AI 趋势**

  1. 空间智能:当前焦点集中于大语言模型,而 3D 世界建模技术将支撑叙事、娱乐、机器人等多个领域的突破。
  2. AI 与教育:AI 将加速主动学习者的成长,重塑学校评估体系与人才认证标准(学历的重要性下降,学习能力与工具使用能力更关键)。
  3. 经济与就业结构的细微变化:既非 “乌托邦式丰裕”,也非 “全面失业”,而是从知识工作者到蓝领、服务业的全方位岗位转型,这种复杂性尚未被政策制定者、学者充分重视。

**给年轻人的建议**

  • 核心能力:“学会学习” 的能力比特定知识更重要。在 AI 工具普及的时代,开放心态、拥抱 AI 协作工具、快速适应新工具的成长意愿,是关键竞争力(World Labs 招聘软件工程师时,已将对 AI 工具的接纳度作为重要考量)。
  • 教育转型:学校不应禁止 AI 使用,而应明确 “工具的上限”(如 AI 写的作文可拿 B-),鼓励学生在 AI 基础上发挥人类的创造力与思考力,追求更高目标(A 或 A+)。
  • 找到北极星:每个人的 “北极星”(梦想、使命、热情)各不相同,不必局限于某一领域。教育的核心是帮助人们认识自我,制定并追求自己的 “北极星”—— 这正是人类超越基本需求、实现人生价值的关键。

**收尾:名字的寓意与人生信条**

李飞飞的名字 “飞飞” 源于父亲的灵感:母亲分娩时,父亲骑车赶往医院途中偶遇一只鸟,放飞后便决定用 “飞” 为名,寓意 “像鸟一样飞翔”。

当被问及若能在广告牌上向全球传递一句话,李飞飞的答案是:“What is your north star?(你的北极星是什么?)”—— 这既是她一生的行动指南,也是她对所有人的期许:找到自己的核心使命,勇敢追求,活出完整的人生。

访谈最后,蒂姆推荐了李飞飞的书籍、World Labs 官网(worldlabs.ai),并表示会在播客笔记中附上相关链接,为这场跨越成长、学术、技术与人生哲学的对话画上句点。

https://tim.blog/2025/12/10/dr-fei-fei-li-the-godmother-of-ai-transcript/

</markdown>

D:2025.12.15<markdown>

**蒂姆・费里斯秀:AI 教母李飞飞博士 —— 大胆提问、文明级技术与人生北极星的追寻**

**访谈背景与嘉宾简介**

蒂姆・费里斯在 2025 年 12 月 10 日推出了第 839 期播客节目,受访者是被誉为 “AI 教母” 的李飞飞博士。

李飞飞博士现任斯坦福大学计算机科学系首任红杉教授,同时也是斯坦福以人为本人工智能研究所的联合创始主任,还是专注于空间智能的生成式 AI 公司 World Labs 的联合创始人兼首席执行官。她曾于 2013 年至 2018 年担任斯坦福人工智能实验室主任,2017 至 2018 年学术休假期间,出任谷歌副总裁及谷歌云 AI / 机器学习首席科学家。在职业履历中,她还曾在多家公私企业、白宫及联合国担任董事或顾问职务。教育背景方面,李飞飞 1999 年获普林斯顿大学物理学学士学位,2005 年获加州理工学院电气工程博士学位,其回忆录《我所见的世界:人工智能黎明时代的好奇心、探索与发现》不仅入选奥巴马推荐的 AI 书籍,还成为 2023 年《金融时报》最佳书籍之一。

**开场闲谈:普林斯顿的 “错过” 与重逢**

访谈伊始,蒂姆・费里斯向李飞飞博士表达了见面的喜悦,两人随即聊起一段奇妙的过往 —— 他们曾在普林斯顿大学校园共处三年,却从未有过交集,这既让人觉得不可思议,也略带遗憾。李飞飞博士好奇地询问蒂姆当时所在的学院和参与的社团,蒂姆回应自己属于福布斯学院,没想到李飞飞博士竟笑着表示自己也曾是福布斯学院的学生。

为了让不了解普林斯顿的听众明白其中的巧合,蒂姆解释道,普林斯顿设有住宿学院,学生入学时会被分配至不同学院,而福布斯学院位置偏远,紧邻一家名为韦瓦的类似 7 - 11 的便利店,旁边还有通勤火车。此外,普林斯顿还有独特的 “饮食俱乐部”,蒂姆补充说明,这本质上是男女同校的兄弟会或姐妹会,学生可以在那里就餐,除非选择自己做饭,他当时加入的是特雷斯饮食俱乐部,而李飞飞博士则表示自己并未加入任何饮食俱乐部。两人调侃道,或许是因为当时都太过勤奋好学,大部分时间都泡在图书馆里,才错过了彼此。

蒂姆回忆起自己曾在盖斯特图书馆的阁楼打工,时薪约 6 美元,李飞飞博士更是惊讶地回应,自己当时也在同一间图书馆工作,实在无法理解为何从未相遇,蒂姆打趣地说自己并未改名换姓,如今能重逢也算是一种缘分。蒂姆还补充,自己求学期间曾有一段时间离开普林斯顿前往北京,在首都经济贸易大学学习,之后又休学一年,最终于 2000 届毕业,但即便如此,他与李飞飞博士仍有不少在校时间的重叠。

**成长轨迹:两座城市的童年与移民之路**

在轻松的开场后,蒂姆将话题转向李飞飞博士的成长经历,他表示根据自己的了解,李飞飞的父母与他印象中典型的中国父母有很大不同,希望李飞飞能分享自己的成长环境与家庭背景。

李飞飞博士坦言,自己的童年及成长关键期可以用 “两座城市的故事” 来概括。她出生于北京,但童年大部分时光在以熊猫闻名的成都度过,15 岁时,她与母亲前往新泽西州的帕西帕尼镇,与早已定居于此的父亲团聚。就这样,她从一个普通中产华裔家庭的孩子,摇身一变成为移民美国的新面孔,在一个完全陌生的世界里,开始学习新的语言、接纳新的文化,努力融入这个新的国家。之后,她考入普林斯顿大学,主修物理学,期间也选修了一些蒂姆曾上过的课程,本科毕业后进入加州理工学院攻读博士学位,专注于 AI 领域的研究,后续的经历便成为了众人熟知的行业历程。

**家庭影响:与众不同的父母与成长动力**

蒂姆进一步追问李飞飞博士父母的具体情况,他提到此前访谈过企业家邵亦波,其父亲是典型的 “虎爸”,对邵亦波要求严格,只有在邵亦波赢得数学竞赛时才会给予额外的关爱与奖励,而他从李飞飞的书中了解到,其父亲似乎是一个充满奇思妙想、极具创造力的人,与 “虎爸” 形象形成鲜明对比,希望李飞飞能详细描述父母的性格特点。

李飞飞博士感谢蒂姆阅读自己的书,表示小时候并未意识到父亲的特别之处,直到撰写回忆录、回顾过往经历时,才愈发觉得自己的父亲确实与众不同。她的父亲始终热爱自然,充满好奇心,总能在看似不起眼的事物中发现乐趣,尤其痴迷于昆虫。上世纪 80 年代的中国物质条件相对匮乏,而当时成都正在扩张,他们一家住在城市边缘的公寓楼里,父母却在市中心工作。每到周末,父亲总会带着她在附近的稻田、水牛群中玩耍,她还养过一只小狗,童年记忆里满是和父亲一起寻找昆虫的快乐时光。此外,父亲还曾带她参加儿童美术班,一起去周边的山上写生。

在李飞飞的印象中,父亲是一位完全不看重成绩的家长,从不关心她在学校的表现、是否取得成就或是获得过什么竞赛奖项。即便移民到新泽西后,生活变得异常艰难,家庭经济拮据,父亲依然能在庭院拍卖会上找到乐趣,每个周末都会带着她去 “寻宝”,始终保持着孩童般的好奇心与乐观心态。

蒂姆紧接着提出疑问,既然父母都不看重成绩,那李飞飞博士的上进心和对技术的专注度源自何处,同时还希望她能介绍一下鲍勃・萨贝拉,以及其在她人生中的角色。

李飞飞博士先回应了关于成长动力的问题,她表示母亲毫无技术天赋,甚至不擅长数学,所以自己对技术的热爱更像是与生俱来的。父亲虽然相对更懂技术,但相比数学公式,他显然更爱昆虫。作为从业数十年的教育者和家长,李飞飞博士认为,必须尊重天性,每个人内心都可能蕴藏着与生俱来的热爱、激情与好奇心。而母亲则是一个更自律的人,虽然算不上 “虎妈”, 她从不追问李飞飞的成绩,父母二人也从未要求她把奖状带回家,家里甚至没有任何展示成就或奖项的装饰,这种习惯也一直影响着李飞飞,如今她自己的家和办公室里也没有这类摆设,但母亲会要求她做事情时保持专注,比如不能边玩边写作业,如果下午 6 点前没完成作业,就不允许再继续做,必须自己承担后果。

母亲的这种教育方式培养了她的自律性,同时母亲本身也是一个叛逆且坚韧的人,小时候学习成绩优异,却因文革错失了学术梦想,这种经历让她变得更加顽强。多年后母亲回忆起移民的决定时说,当时虽然没有明确的计划,但坚信自己和女儿一定能挺过难关,这种坚韧与叛逆也在潜移默化中影响了李飞飞。

随后,李飞飞博士介绍了鲍勃・萨贝拉的身份 —— 他是帕西帕尼高中的数学老师,也是她的恩师。在她高二升高三那年,开始选修 AP 微积分课程,鲍勃・萨贝拉就此走进了她的生活。对于当时作为新移民、英语水平有限且深感孤独的李飞飞而言,鲍勃不仅是老师,更成为了她的导师、朋友,鲍勃的全家也成为了她在美国的家人。李飞飞在数学方面表现出色,但更多是因为孤独,而鲍勃待人友善,不像老师,更像是能平等交流的朋友,他们会一起探讨喜爱的书籍、文化、科幻作品,鲍勃还会耐心倾听她这个身处特殊环境、面临诸多人生困惑的青少年的心声。这份无条件的支持让李飞飞与鲍勃一家结下了深厚的情谊。更让她铭记于心的是,当时帕西帕尼高中无法开设完整的微积分 BC 课程,鲍勃便牺牲自己唯一的午餐时间,为她提供一对一的教学。

直到李飞飞后来自己成为老师,才真正体会到这份付出的珍贵 —— 一整天教学后,再利用休息时间额外授课是多么疲惫,而鲍勃的这份馈赠,也为她日后考入普林斯顿大学奠定了重要基础。李飞飞博士感慨,美国的公立学校教师是社会的无名英雄,他们要面对来自不同背景的学生,适应时代的变化,鲍勃曾和她分享过许多帮助移民学生及其家庭的故事,这些故事虽不为人知,却意义重大,这也是她撰写书籍纪念这类恩师的原因之一。

**移民缘由:父母的勇敢抉择与教育期许**

蒂姆很好奇李飞飞父母当年为何决定离开熟悉的中国,举家移民到完全陌生的美国郊区 —— 那里在李飞飞的描述中显得有些空旷,还面临语言障碍和经济压力等诸多困难,究竟是什么促使他们做出这样的决定。

李飞飞博士表示,年少时的自己其实并不清楚父母移民的具体原因,父亲在她 12 岁时就先前往美国,她和母亲 15 岁时才前去团聚,青春期的她心思繁杂,只知道父母说 “我们要去美国”,隐约觉得可能和机会、自由以及不同的教育体系有关。当时的她就不是传统意义上的典型女孩,热爱物理,还能说出自己喜欢的各种战斗机型号,从 F-117 到 F-16 无一不晓。

如今长大成人,李飞飞博士才真正理解父母的勇敢 —— 换作现在的自己,恐怕都没有勇气放弃熟悉的一切,前往一个语言不通、毫无联系的陌生国家,更何况在那个没有互联网、没有 AI 的年代,跨国家移民几乎等同于去往另一个星球。她意识到,父母之所以做出这样的决定,是希望给她提供一个他们认为前所未有的教育机会,而事实也证明,这个决定是正确的。

**学术旅程:从物理到 AI,以 “北极星” 为导向的探索**

蒂姆表示,李飞飞博士的人生经历中充满了各种可能改变轨迹的关键节点,接下来希望能沿着时间线继续深入交流,触及访谈的核心内容,同时也想了解更多对她有重要影响的人物和事件。

李飞飞博士分享了自己从物理转向 AI 领域的历程。她自幼便对物理充满热爱,父亲对自然和昆虫的痴迷,在她心中转化为对宇宙的好奇 —— 她喜欢仰望星空,痴迷于战斗机的速度与精密工程,进而被物理学中那些关乎人类文明的大胆问题所吸引,比如 “最基本的物质是什么”“时空的定义是什么”“宇宙有多大”“宇宙的起源是什么”。年少时的她崇拜爱因斯坦,也正因如此,她渴望进入普林斯顿大学深造。然而,物理学带给她的不仅是数学和物理知识,更培养了她大胆提问的勇气。

本科即将毕业时,她不再满足于追寻他人提出的重大问题,而是希望找到属于自己的 “大胆疑问”。通过阅读和探索,她发现自己的热情并非聚焦于物质本身,而是转向了 “智能” 这一领域 —— 她深深着迷于 “智能是什么” 以及 “如何制造智能机器” 这两个问题,当时她甚至不知道这一领域被称为 AI,只是单纯地想要深入研究智能与智能机器。于是,她申请了研究生院校,进入加州理工学院攻读博士学位,2000 年,她正式开启了 AI 领域的学习之旅,成为一名初出茅庐的 AI 科学家,接受了系统的计算机科学与 AI 训练。

而物理学训练中培养的 “提出大胆问题并将其作为北极星” 的思维方式,也一直影响着她,在科研中,这个 “北极星” 就成为了需要验证的假设,明确自己的 “北极星” 对她而言至关重要。

她的第一个 “北极星” 问题,就是解决视觉智能难题 —— 如何让机器 “看见” 世界。这里的 “看见” 并非简单识别 RGB 颜色或光线明暗,而是理解所观察到的事物,就像她看着蒂姆时,能识别出蒂姆本人、他身后的画作以及他所坐的椅子一样,是对世界的感知与理解。

基于这一目标,她提出的假设是必须先解决目标识别问题。整个博士阶段,她都在与目标识别难题作斗争,尝试了无数数学模型,发表论文不成问题,但始终未能取得突破性进展。2007 年,幸运降临,普林斯顿大学向她发出了任教邀请,这让她欣喜若狂,深感自己的努力得到了母校的认可,于是她欣然回到普林斯顿担任教职,并且依然是福布斯学院的一员。在普林斯顿任教期间,她突然顿悟,意识到整个领域都忽略了一个关键假设 —— 大数据的重要性。

蒂姆插入一段补充,提到普林斯顿高等研究院有着悠久的历史,他自己曾在爱因斯坦教过课的教室里上过东亚研究课程,校园里弥漫着浓厚的学术氛围,让人不禁心生敬畏。随后,他引用了《连线》杂志一篇关于李飞飞博士的长篇报道中的内容:当时的问题在于,研究人员可能需要为识别狗和猫分别编写不同的算法,而李飞飞开始思考,问题或许不在于模型本身,而在于数据。她认为,既然儿童是通过体验视觉世界、观察无数物体和场景来学会 “看见”,那么计算机或许也可以采用类似的学习方式。蒂姆希望李飞飞博士能进一步展开说明,并且提出了一个核心疑问:为什么是她率先意识到这一点,而这个突破没有更早出现。

李飞飞博士表示,科学发展是一个传承与积累的过程,她不喜欢科学史叙述中过度聚焦 “单个天才” 的倾向。牛顿发现经典物理定律固然是天才之举,但科学是一条非线性的传承之路,许多科学家的研究都为后续突破奠定了基础。她之所以能提出大数据的假设,也深受其他科学家的启发,比如心理学家欧文・比德曼教授的研究,他并不关注 AI,而是致力于理解人类思维,其关于幼儿在早期能学习大量视觉物体的研究成果,虽未直接催生 ImageNet,但为她构建核心假设提供了重要思路。

因此,李飞飞博士认为,自己能取得这样的成就,离不开历代科学家跨学科的研究积累与思想碰撞,她只是有幸在恰当的时机,带着对问题的热情,站在了前人的肩膀上。同时,她也指出,在 AI 热潮之下,媒体往往只聚焦少数几位 “天才”,却忽略了无数计算机科学家、认知科学家和工程师的长期付出,这是对科学发展历程的片面解读。

蒂姆深表赞同,并以沃森和克里克为例 —— 如果没有罗莎琳德・富兰克林的 X 射线晶体学研究,他们也无法发现 DNA 的双螺旋结构,科学突破往往是众多研究者共同努力的结果。

**ImageNet 的构建:挑战、创新与里程碑意义**

蒂姆希望李飞飞博士能分享 ImageNet 成功背后的关键决策或重要时刻。他提到,要让机器像儿童一样学习识别物体,就需要大量标注图像,他了解到亚马逊 Mechanical Turk 平台在其中发挥了作用,而且竞争机制似乎也推动了一些关键突破,希望李飞飞能详细介绍这些促成 ImageNet 成功的要素。

李飞飞博士首先解释了 ImageNet 的核心意义:表面上看,ImageNet 是 2007 年至 2009 年她从普林斯顿转至斯坦福期间,与学生共同构建的数据集,当时是 AI 领域最大的计算机视觉训练与基准数据集。而在近 20 年后的今天,ImageNet 被视为大数据时代的转折点。 在此之前,AI 领域并未重视大数据的应用,导致发展陷入停滞,甚至被公众称为 “AI 寒冬”(尽管当时作为年轻研究者的她仍认为这是最令人兴奋的领域)。

ImageNet 与神经网络算法、GPU(图形处理器)这两项现代计算核心要素相结合,催生了 2012 年的里程碑式论文《ImageNet 分类:深度卷积神经网络方法》。该论文由一组科学家完成,证明了 ImageNet 提供的海量数据、GPU 带来的快速并行计算以及神经网络算法的结合,能以前所未有的方式提升图像识别领域的 AI 性能,这一成果也被广泛认为是 “现代 AI 的诞生标志”,而 ImageNet 正是这一突破的三大核心要素之一。李飞飞博士表示,能亲身参与并推动现代 AI 的发展,她感到无比幸运与荣幸。

谈及 ImageNet 成功的关键因素,李飞飞博士认为,时机是重要前提 —— 他们是首批意识到大数据潜在影响力的研究者,这种对数据价值的定性认知本身就是成功的一部分。但更重要的是,大数据假设并非单纯追求规模,许多人误解了 ImageNet 的意义,认为只是 “收集大量数据”,实则不然。

构建数据集的核心是要明确科学问题,比如在视觉识别领域,围绕 “物体” 构建数据集远比围绕 RGB 颜色或城市这类复杂概念更具针对性,每个科研探索都需要提出恰当的假设,找准核心问题,这是 ImageNet 成功的关键之一。其次,数据的质量与规模的平衡也是一个需要深入研究的科学问题,不能简单认为 “规模足够大就无需关注质量”,如何定义数据质量(如分辨率、真实性、场景多样性等)、如何在规模与质量之间取舍,都是需要反复推敲的细节。

而亚马逊 Mechanical Turk 平台的应用,则源于当时的 “绝境求生”。他们的假设要求至少需要数千万张涵盖不同场景(用户照片、产品图、库存图片等)的高质量图像,并且需要精准标注,这意味着必须从数十亿张图像中进行人工筛选。起初,李飞飞博士尝试雇佣普林斯顿的本科生,但本科生不仅人力成本高,且即便资金充足,完成这项工作也需要耗费大量时间。

在走投无路之际,他们发现了当时刚推出不久的亚马逊 Mechanical Turk 众包平台 —— 这是一个在线市场,人们可以在闲暇时间完成平台上的小额任务赚取报酬。李飞飞博士回忆,自己当时登录亚马逊账号尝试的第一个任务,就是标注酒瓶标签上的信息(如 1999 年波尔多葡萄酒等)。他们意识到,这一平台可以利用全球在线用户的力量进行大规模并行处理,最终通过这种方式标注了数十亿张图像,并筛选出 1500 万张高质量图像,构建成 ImageNet 数据集。

蒂姆补充道,这类技术突破往往依赖于多个关键节点的汇聚,就像基因泰克的发展历程中也有许多类似的技术拐点,如果没有亚马逊 Mechanical Turk,ImageNet 的构建将面临巨大挑战。同时,他也提出一个实际问题:如果标注者因被支付报酬而存在投机行为(比如在识别熊猫的任务中,无论图像中是否有熊猫都标注存在),该如何保障标注质量。

李飞飞博士回应,她和学生为此花费了大量时间设计质量控制机制:首先通过前置测试筛选出认真负责的标注者,确保他们理解标注对象(如明确熊猫的定义);其次,在标注任务中插入已知正确答案的图像(即 “金标准” 图像),标注者并不知晓哪些是测试图像,通过比对他们的标注结果与金标准答案,来隐性监控标注质量,以此确保数据集的准确性。

**现代 AI 的反思:以人为本的核心与认知误区**

蒂姆将话题转向当下,称李飞飞博士被校友杂志及其他媒体誉为 “AI 教母”,不仅拥有深厚的技术背景,更有着跨越 AI 发展多个阶段的历史视角,见证了这项技术的发展、分支、潜力与风险,因此希望她能分享,当前人们在看待 AI 时,忽略了哪些重要方面,哪些话题占据了过多关注,以及人们应该了解、警惕或重新审视的内容。

李飞飞博士从硅谷的视角出发,提出核心观点:人们忽视了 “人” 在 AI 中的核心地位,而 AI 无疑是一项文明级技术。她对 “文明级技术” 的定义是,凭借其强大的影响力,已对经济、社会、文化、政治等各个领域产生深远影响,甚至还将持续产生下游效应。有数据显示(虽未完全验证),美国去年 GDP 增长的 4% 中,有 2% 源于 AI 的贡献,这从经济层面印证了 AI 的文明级影响力。

在文化层面,AI 更是无处不在,从好莱坞、华尔街、硅谷到政治竞选、TikTok、YouTube 等平台,甚至日本出租车后座的视频中都在谈论 AI,深刻改变着人们的文化生活。在教育领域,家长们纷纷担忧孩子未来该学习什么才能立足,祖父母辈虽庆幸自己不必面对 AI 带来的挑战,却也牵挂孙辈的未来。然而,在 AI 热潮之下,硅谷过度聚焦技术本身及随之而来的增长,政客们则更关注能赢得选票的话题,却忽略了最核心的一点:人是 AI 的创造者、使用者和受影响者,人理应在 AI 发展中拥有话语权。无论 AI 技术如何进步,都不应剥夺人类作为个体、社区和社会成员的尊严,而这正是她所担忧的 —— 许多人因 AI 的快速发展而感到焦虑,自身的尊严、自主权和对未来的参与感正在逐渐丧失,这种现状亟待改变。

蒂姆接着问,李飞飞博士曾表示自己因身为母亲而保持乐观,但极端的乐观与悲观都会让人产生偏见或盲点。如果尝试以最客观的视角看待,对于普通大众(而非 AI 领域的 CEO、开发者和工程师)而言,当前人们对 AI 的担忧是过度、不足,还是担忧错了方向?毕竟,一方面,大型投资机构的风险投资家们秉持着近乎不切实际的技术乐观主义,认为 AI 能解决所有问题;另一方面,“末日论者” 则预言 AI 将很快失控,人类可能沦为机器人的奴隶或被消灭,而现实很可能介于两者之间。

李飞飞博士称自己是 “务实的乐观主义者”,既不相信乌托邦式的美好未来,也不认同极端的末日论。她表示,自己游历世界各地,上个月刚去过中东、欧洲、英国和加拿大,发现美国和西欧民众对 AI 的担忧远多于中东和亚洲民众。她希望能通过某种方式让美国人意识到,美国民众向来以创新著称,为人类文明贡献了众多伟大发明,拥有自由活跃的社会环境和能让民众参与国家建设的政治体系,因此应该以更乐观、积极的心态看待 AI 的未来,而非被焦虑情绪主导。同时,她认为硅谷的技术从业者肩负着重要的公共沟通责任,许多关于 AI 的信息未能被有效传递,未来需要更多地向公众传递希望,让人们重新找回对自身的掌控感,让 AI 的红利惠及美国 50 个州的各个群体,无论是硅谷、曼哈顿的精英,还是农村社区、传统行业的普通人。

**World Labs 的愿景:空间智能的探索与应用**

蒂姆好奇地询问,李飞飞博士为何选择创办 World Labs,这家公司的核心业务是什么,以及她投身其中的初衷。

李飞飞博士表示,她经常向团队成员阐述创办 World Labs 的双重意义:从技术层面而言,World Labs 致力于研发下一代聚焦 “空间智能” 的 AI 技术,因为空间智能与语言智能一样,是解锁机器诸多关键能力的基础,能帮助人类在创造、制造、设计、机器人研发等领域实现突破,是一项核心枢纽技术;从更高层面来说,她之所以仍坚守技术领域,是因为坚信人类是构建文明的物种 —— 动物只会形成群体或兽群,而人类始终追求更美好的生活、更完善的社区、更发达的社会,渴望健康、繁荣的未来,这种追求正是文明构建的基石。而科学技术是实现这一追求的最强大工具之一,她希望通过自己的努力,为人类文明的进步贡献力量,这也是她作为科学家、技术从业者,以及创办 World Labs 的核心初衷。

李飞飞博士进一步解释 “空间智能” 的概念:这是人类具备的一种超越语言的能力,比如打包三明治、在山间徒步、粉刷卧室等行为,本质上都是先通过视觉感知 3D 世界、理解环境,再与之互动、改变或利用环境的过程,这一 “感知 - 行动” 的闭环,正是由空间智能支撑的。

以打包三明治为例,人们需要知道面包的形状、如何用刀涂抹酱料、如何放置生菜叶,以及如何将三明治放入密封袋,每一个步骤都离不开空间智能。当前 AI 的空间智能虽在不断进步,但与语言智能相比,仍处于初级阶段,无论是在虚拟 3D 世界还是现实 3D 世界中,AI 在感知、推理和行动方面的能力都有待提升。而 World Labs 正在研发的前沿模型,就是要赋予机器创造 3D 世界、围绕 3D 世界进行推理的能力,赋能创作者、设计师、机器人等与世界进行更深度的互动。

蒂姆希望李飞飞博士能具体描绘,未来一两年内,设计师、创作者或机器人将如何运用这项技术,结合自己团队的体验,进一步说明其应用场景。

李飞飞博士分享了一个近期听到的灵感案例:高中剧院的预算通常有限,而专业歌剧院或音乐剧的舞台布景精美却耗资巨大,普通中学难以承担。如果利用 World Labs 的模型(名为 Marble),创作者可以轻松构建出中世纪法国小镇等 3D 场景,将其作为舞台背景,再结合计算机、头戴设备等辅助技术,就能让演员和观众获得身临其境的沉浸感,为预算有限的创作者提供强大的工具支持。目前,全球已有许多创作者(包括视觉特效师、室内设计师、游戏开发者、教育工作者等)开始使用这一模型,教育工作者可以通过构建 3D 世界,让学生获得更直观的体验,帮助他们更好地学习。

对于非技术用户(如希望为学生创造沉浸式学习体验的公立学校教师),李飞飞博士解释了使用流程的便捷性:无需具备专业技术知识,只需在电脑或手机上打开 World Labs 的页面(电脑端功能更丰富),通过文字描述(如 “中世纪法国小镇”),或上传相关图像(如 Midjourney 生成的图片、真实照片)作为 “提示词”,等待几分钟后,模型就会生成对应的 3D 场景(目前存在一定的范围限制)。用户可以通过鼠标拖拽、旋转等操作,在 3D 场景中漫游。后续应用场景也十分广泛:可以利用平台工具添加摄像头,将 3D 场景制作成电影;游戏开发者可以在其中添加角色;视觉特效专业人士可以将其融入电影拍摄流程,与真人演员拍摄相结合;心理学研究者可以利用沉浸式场景开展精神病学研究;还可以将其作为机器人训练的模拟环境,生成大量训练数据。

蒂姆补充道,这听起来很像机器人的 “飞行模拟器”,李飞飞博士表示,这正是他们的目标之一,目前虽仍处于早期阶段,尚未完全实现,但已在朝着这个方向推进。

关于空间智能在精神病学研究中的应用,李飞飞博士举例说明:有研究者联系他们,希望借助 3D 场景研究强迫症患者 —— 这类患者可能会被特定环境触发症状,而通过 World Labs 的模型,研究者可以灵活调整环境的各种维度(如草莓田的季节、时间、草莓数量等),以低成本、高可控性的方式开展触发因素研究和治疗效果测试,无需实际带患者前往真实场景,极大地便利了科研工作。

她还提到,随着技术发展,现实世界与数字世界的边界正变得越来越模糊,人们既生活在现实中,也通过各种屏幕参与虚拟世界的活动,未来的机器也将能在两个世界中协同运作,因此空间智能的应用前景将愈发广阔。

**值得关注的科研者与被低估的 AI 趋势**

蒂姆询问李飞飞博士,是否有一些非知名、未受到广泛公众关注的科学家或研究者,其工作让她尤为欣赏和关注。

李飞飞博士表示,这也是她撰写回忆录的初衷之一,在书中的中间章节,她详细讲述了 ImageNet 的研发历程,其中就提到了许多认知科学家、神经科学家和发展心理学家,他们中的一些人已经离世(如安妮・特雷斯曼、欧文・比德曼),但他们作为认知科学领域的巨擘,其研究成果为计算机科学乃至 AI 的发展提供了重要启发。目前,全球仍有许多优秀的科学家在相关领域深耕,比如哈佛大学的莉兹・斯佩尔克、伯克利大学的艾莉森・高普尼克、前麻省理工学院机器人学教授罗德尼・布鲁克斯等,他们虽未频繁出现在 AI 相关新闻中,但研究成果极具价值。

蒂姆接着提出一个类比:2008 - 2009 年,他参与投资 Shopify 时,该公司仅有 10 名员工,当时可以明确预判,未来宽带接入会更普及、电子商务会持续发展,这些明确的趋势共同勾勒出行业的发展方向。因此,他希望李飞飞博士能分享,在未来几年内,有哪些被低估但近乎必然的 AI 发展趋势。

李飞飞博士表示,一些趋势(如对算力的需求、AI 的持续发展、机器人技术的兴起)已受到广泛关注,而被低估的趋势主要有三个方面: 一是空间智能,当前公众和行业的焦点仍集中在语言智能和大型语言模型上,却忽视了 3D 世界建模技术的重要性 —— 它将为叙事、娱乐、体验设计、机器人模拟等多个领域提供核心支撑; 二是 AI 在教育领域的应用,AI 将加速主动学习者的成长进程,这不仅会改变现有的学校教育体系,还将重塑人才评估标准,传统的学历认证将不再是衡量人才的唯一依据,人们对 “合格工作者” 的定义将发生转变; 三是 AI 对经济结构(包括劳动力市场)的细微影响,当前关于 AI 对就业的讨论要么是 “乌托邦式的后稀缺时代”,要么是 “全面失业” 的极端论调,均过于夸张,而现实中,从知识工作者、蓝领工人到服务业从业者,不同群体面临的具体变化、挑战与机遇,这种复杂的 “中间地带” 尚未被政策制定者、学者及社会大众充分认识和重视。

**就业转型与给年轻人的建议**

蒂姆将话题延伸至就业市场的具体影响,以及李飞飞博士作为家长,会如何建议正处于选择专业、规划未来阶段的孩子(或年轻人)。

李飞飞博士结合 World Labs 的招聘经验表示,如今招聘软件工程师时,学历的重要性已大幅下降,更看重应聘者的实际学习能力、工具使用能力以及对 AI 工具的接纳度 —— 在 2025 年的招聘中,她不会聘用任何拒绝使用 AI 协作软件工具的工程师。这并非因为 AI 工具完美无缺,而是因为愿意拥抱这类工具,体现了应聘者的成长意愿、开放心态和适应能力,而善用 AI 工具也能大幅提升工作效率和学习能力,这一趋势正深刻改变着人才市场的需求。

因此,对于年轻人或孩子,李飞飞博士给出的核心建议是:“学会学习” 的能力比掌握具体知识更重要。在工具相对匮乏的时代,人们可以沿着固定的路径成长(小学、中学、大学、职业培训),凭借学历等结构化证书立足;但 AI 的普及打破了这种模式,每个人都能借助 AI 工具快速获取知识、提升能力,因此,保持学习的热情、掌握学习的方法、具备快速适应新工具的能力,成为了更核心的竞争力。

蒂姆深表认同,并补充道,AI 将让有抱负的人成为 “超级自学者”—— 就像 YouTube 既可以用来娱乐,也能成为学习工具一样,AI 能帮助人们快速成长,但这也给教育评估带来了挑战:教师如何判断学生的作业是自己完成的,还是借助 AI 工具生成的?

李飞飞博士回应,若学校的评估体系无法区分 AI 生成的内容与学生自主完成的高质量内容,那说明评估体系本身存在问题。她分享了一个令人赞同的案例:一位高中新生英语老师在开学第一天就对学生说,他会展示 AI 撰写的同主题范文,并详细分析范文的优点、不足与局限,然后给这篇范文打 B-,以此明确 “工具的上限”;同时,他也告诉学生,使用 AI 工具是被允许的,但如果学生能在 AI 的基础上,融入自己的思考、发挥创造力,完成更高质量的作品,就能获得 A 或 A + 的成绩。

李飞飞博士认为,这种评估方式才是合理的 —— 不应禁止学生使用 AI,也不必费力监管,而是明确工具的边界,引导学生发挥人类的独特价值,追求更高的目标。

**人生信条与名字的寓意**

蒂姆提出了一个经常问嘉宾的问题:如果能在广告牌上向数十亿人传递一句话、一个观点、一幅图像或一个问题,无论形式如何,且确保所有人都能理解,会选择什么。

李飞飞博士的答案简洁而有力:“你的北极星是什么?”

蒂姆接着追问,结合她之前提到的 “大胆提问催生北极星假设”,除了这一方式,她还会如何鼓励人们找到自己的 “北极星”。

李飞飞博士回应,人类之所以独特、之所以能活得如此充实,正是因为能够超越对基本需求的追求,拥有梦想、使命、目标与激情。每个人的 “北极星” 各不相同,并非所有人都要以 AI 为目标,而找到 “北极星” 的过程,本质上是一场教育之旅 —— 这里的教育并非指传统的课堂教学,而是一个认识自我、明确方向、追逐梦想的过程,这也是教育的核心意义所在。

最后,蒂姆好奇地询问李飞飞博士名字的由来,是否有特殊寓意。

李飞飞博士笑着分享,母亲分娩时,父亲一如既往地迟到了,他骑自行车赶往医院的路上,意外捉到了一只鸟,随后又将其放飞 —— 或许是被这只鸟启发,父亲便给她取名 “飞飞”。这个名字承载着父亲对她的美好期许。

**2. AI 作为 “文明级技术” 的论证:合理但需客观看待**

  • 经济影响的数据局限性:李飞飞博士提到 “美国去年 GDP 增长 4% 中 2% 源于 AI”,该数据未明确来源与统计口径,存在一定的模糊性。AI 对经济的贡献确实显著,但当前学界对 AI 经济效应的量化研究仍处于探索阶段,不同模型和统计方法得出的结果差异较大,因此不宜将单一数据作为绝对依据。
  • 文明级影响的共识性:AI 对经济、文化、教育等领域的深远影响是普遍共识,其影响力确实可与电力、互联网等传统文明级技术相类比,但需注意,AI 的 “文明级” 影响同时包含积极与消极两面,李飞飞博士强调 “以人为本” 的核心,正是对这一技术双重性的理性认知,符合技术伦理研究的基本立场。

**3. 空间智能的技术定位:前沿且具有合理性**

  • 技术必要性的共识:空间智能作为 “超越语言的核心能力”,其重要性在机器人学、计算机视觉、虚拟现实等领域已形成共识。当前 AI 在 3D 环境感知、交互方面的短板确实存在,而空间智能的突破能有效填补这一空白,其技术定位符合 AI 发展的客观趋势。
  • 应用场景的可行性:李飞飞博士列举的教育、影视、心理学研究、机器人训练等应用场景,均基于空间智能的核心功能推导,具有技术可行性,但部分场景(如精神病学临床研究)的落地,还需结合医学伦理、临床验证等额外环节,目前仍处于 “技术赋能科研” 的初期阶段,需避免过度夸大短期应用效果。

**4. 教育与就业相关观点:符合趋势但存在情境局限性**

  • “学会学习” 的核心价值:AI 时代 “学习能力比学历更重要” 的观点,符合劳动力市场对 “适应性人才” 的需求趋势,也与教育心理学中 “终身学习” 的理念一致,是具有普遍适用性的合理建议。
  • 教育评估改革的合理性:“以 AI 为参照设定评估标准,鼓励人类创造力” 的教育改革思路,突破了 “禁止 AI 使用” 的僵化思维,符合技术与教育融合的趋势,但该模式的落地依赖教师的专业能力、学校的评估体系改革等多重条件,在不同教育资源、不同年龄段的学生中应用时,可能存在情境适应性问题,不能简单一概而论。
  • 就业影响的 “中间地带”:共识与待探索空间:反对 “乌托邦式丰裕” 或 “全面失业” 的极端叙事,强调就业影响的 “复杂性与细微性”,是学界和行业的主流共识。但李飞飞博士提到的 “不同行业、不同群体的具体变化”,仍需更多实证研究支撑 —— 当前关于 AI 对就业结构的影响,多为宏观趋势预判,针对特定职业、特定地区的微观数据仍相对匮乏,这也是未来研究需要补充的方向。

**5. 科学发展的 “传承性”:符合科学史规律**

李飞飞博士强调 “科学突破是历代研究者跨学科积累的结果,而非单个天才的孤立贡献”,这一观点符合科学史的基本规律(如 DNA 双螺旋结构的发现、经典物理的发展等案例均印证了这一点),纠正了媒体对 “技术天才” 的过度神化,具有重要的认知价值,也与科学哲学中 “共同体协作推动进步” 的核心观点一致。

</markdown>

D:2025.12.19

<markdown> </markdown>

讨论列表 AKP讨论 查看原帖及回帖