悦读会系列之《我看见的世界》读后感
《我看见的世界》这本书以第一人称的视角,讲述了自己从移民女孩到斯坦福大学教授的传奇经历,同时也展现了人工智能这一领域的波澜壮阔的发展历程。
第一个阶段,移民与生存:从中国中产家庭跌落至美国贫民阶层(1976-1995)
李飞飞出生于1976年的北京幼时随父母迁居四川,成长于知识分子家庭,父亲是工程师,母亲是教师。在学生时代,李飞飞展现出了卓越的学习能力。她在学校里努力学习各科知识,尤其是在数学和科学方面表现突出。早期的教育经历为她打下了坚实的知识基础,她开始接触计算机科学等相关领域的基础课程,感受到这些学科的魅力和潜力。1992年,16岁随父母移民美国新泽西,家庭因学历不被承认陷入贫困,父母靠打零工、开洗衣店维生。
在此期间,人工智能出现在公众的视野,它的范围覆盖了硬件、软件和机器人技术等多个领域,人工智能的发展也有了实质性的进展。比如说,1985年,米勒启动 WordNet 项目。它收录了超过 14万个英文单词,并迅速扩展到新的语言。同时,它还衍生出一个相关的项目--lmageNet,这在未来是李飞飞职业生涯的一个里程碑。1992年,杨立昆展示了“神经网络”算法在准确识别人类笔迹方面的能力,在短短几年内,它就被广泛应用于全美的自动提款机上,用来读取支票上的数字。
时间来到1995年至2006年,这一阶段可以总结为李飞飞的学术探索
进入大学后,李飞飞选择了计算机科学相关专业。在大学的学习生活中,她深入研究算法、数据结构等计算机基础知识。她同时也积极参加各项学术活动和项目,与同学共同探讨前沿的计算机技术。这个时期,她开始接触到人工智能的概念,并且对其产生了浓厚的兴趣。2002年至2004年,李飞飞有关“单样本学习”技术的论文被在法国尼斯举办的国际计算机视觉会议接受,获得发言机会。图像集 Caltech 101于2004年完工,成为有史以来为机器学习配置的最大规模的图像集合,里面有超过9000个图像,分布在101个类别中。2006 年,李飞飞意识到 AI 学术圈都在苦心寻找完美的算法,却很少有人重视数据。李飞飞认为,如果数据不能反映真实世界的情况,那么算法再好也无法发挥作用,所以他开始考虑以WordNet的规模打造一个类似Caltech101的图像集。
在随后的两年里,李飞飞开启了Imagenet项目
2007年,李飞飞回到普林斯顿大学任职,作为助理教授组建第一个实验室,启动ImageNet 项目。但在打造这一庞大数据集时,他和他的团队面临了很多的困难及挑战。
挑战一:数量之巨:ImageNet项目始于2007年,致力于构建一个庞大的图像数据集,覆盖1500万张图像,横跨2.2万个类别。在当时,毫无疑问这一目标是宏伟和巨量的。为应对这一挑战,团队运用自动化工具加速数据收集过程,提高效率。
挑战二:质量之严:项目初期,完全依赖人工标注的方式导致了低效率和高成本,严重阻碍项目的进展。为了突破这一困境,项目团队采取了策略性的转变:首先,制定详尽的标注指南,为标注人员提供明确的指导和标准;其次,实施三重验证机制,通过多层次的审核流程确保标注的准确性。
挑战三:技术之难:在自动化下载图片的过程中,项目团队遭遇了技术限制,尤其是搜索引擎的下载限制,直接影响了数据收集的进度。这类限制不仅延缓了数据获取的速度,还削弱数据的多样性和代表性,进而对最终数据集的质量产生不利影响。为应对技术与资源限制,项目团队不断优化自动化下载程序,以适应搜索引擎的下载限制,提高数据获取的效率。
挑战四:成本之高:随着ImageNet项目的深入推进,预算管理逐渐成为核心难题。项目庞大的规模带来了巨大的资金需求,资金短缺逐渐成为项目推进的瓶颈。同时,项目延期所带来的压力与不确定性也在不断增加,对项目团队构成了严峻的挑战。为应对财务与时间上的双重压力,团队利用亚马逊的众包平台进行标注工作,项目团队管理了来自167个国家、超过4.8万名贡献者。由此,项目预期完成时间从需要19年减至2年。
然而,ImageNet的推广和应用之路也充满了重重考验。最初在2009年计算机视觉与模式识别大会上,ImageNet被降级为“海报展示”,就是不能按照预定的时间在演讲厅内向听众展示。此后几个月更是连遭挫败。批评者对这个数据集不屑一顾,其他研究实验室也对其兴趣寥寥,ImageNet走向无人问津的境地。用李飞飞的话说:“无论是对是错,我都做好了学习的准备。然而,我万万没想到,它被忽略了。”
转机出现在2012年,可以称2010年至2012年这个期间为历史性突破阶段,AlexNet的出现引爆了革命。
为了进一步推动ImageNet的应用和研究,李飞飞和她的团队发起了“ImageNet大型视觉识别挑战赛”然而,现实却与期望背道而驰。直到2012年的比赛结果才打破了僵局,冠军算法AlexNet的图片识别准确率高达85%,创造了计算机视觉领域的世界纪录。就这样,通过ImageNet挑战赛,很多先进的计算机视觉模型得以开发和验证。ImageNet的成功引起了业界的广泛关注,许多参赛团队的研究成果被大公司所采纳。ImageNet不仅在学术界产生影响,也成为了教育和培训的重要资源,帮助培养了大批计算机视觉和机器学习领域的专业人才。ImageNet为后来的高质量数据集构建和人工智能研究树立了标杆,为科学数据工作提供了宝贵的思考和借鉴。
在此期间,人工智能的寒冬开始消退。
2013年以后,李飞飞开始探索“以人为本”的人工智能
2013年,在与母亲的对话中得到灵感,第一次想把人工智能与医疗领域相结合,构建医疗服务的环境智能,李飞飞于2020年发表了题为《用环境智能照亮医疗保健的黑暗空间》的论文。期间,李飞飞设立了AI4ALL这一项目,向九年级和十年级的女生开放了斯坦福大学人工智能实验室课程,向有色人种学生和经济困难学生等边缘群体提供类似项目。随后在2018年,在美国众议院科学、太空和技术委员会就“人工智能--威力越大,责任越大”这一主题作证。
以上就是书籍中关于李飞飞经历,我只挑了一些大事件讲,书中还花了很多篇幅描写了李飞飞父母对李飞飞的引导及支持、萨贝拉老师一家对初来美国的李飞飞的帮助以及李飞飞丈夫对她的支持,对AI或者女性成长故事有兴趣的,可以去看看这本书,这本书文笔还挺细腻的。
接下来的部分是我看完之后的所思所想。首先就是坚持与远见是突破的关键,研究往往充满不确定性,真正的创新者需要长期坚持,敢于挑战主流观点。这点让我想到,在金融行业中也是一样的,如果我们能够在市场变化之前进行战略规划和布局,抓住未来的发展机遇,我们就能更好的存活在这个市场中。其二,时刻保持好奇心,科研最大的驱动确力是兴趣,李飞飞从物理转向视觉神经的研究,将自己的兴趣发展到极致,关键点是她能始终保持好奇心,并一直坚持做下去。保持好奇心是我们可以学习的地方,好奇心能够激发我们对问题更深入、更理性的思考,并能帮助我拓宽知识领域,这对处于时刻在发展进步的金融行业的我来说是很重要滴。
我特别喜欢书里的这句话,“我的努力不是为了让老师满意,也不是为了符合某种意识形态,甚至不是为了迎合某种虚无缥缈的规则。我的努力只是为了自己。”这句话给我一种大女主的感觉,就是我们在生活中可以更多的考虑自己在完成某件事的过程中收获到了什么而不是更多的去在意别人的眼光或者期待。
在看完书之后我也在思考以下的几个问题:
1.AI 是不是正在加剧社会不平等?
例如,大型科技公司掌握了最先进的 AI 技术,而普通人却可能因 AI的发展导致了 失业等问题
2.面对人工智能的浪潮, 我们应该如何培养自己,让自己具备“不可替代性”?