黄仁勋认为,Llama2的发布是2023年最重要的AI事件。
作者|田思奇
北京时间7月30日清晨,英伟达创始人兼CEO黄仁勋与Meta创始人兼CEO马克·扎克伯格,在美国丹佛举行的第50届SIGGRAPH图形大会上完成了一场60分钟的公开对话。
上周刚刚发布最新开源模型Llama3.1的Meta已经爬出股价黑洞,成为AI浪潮中最重要的玩家之一。正如今年刚满40岁的扎克伯格,已经成功从科技宅男形象转型为精心打理卷发,时刻戴着金链子的潮男。
Meta在今年4月发布了专门为AI训练和推理工作设计的自主研发芯片MTIA的最新版本。和许多科技大厂类似,外界认为Meta也希望借此降低对英伟达等芯片厂商的依赖。但总体来讲,Meta与英伟达保持着密切的联系。扎克伯格今年早些时候曾表示,为了构建自己的AGI,Meta会在年底前采购约35万块英伟达H100GPU。
3月底,扎克伯格还在Instagram上发布了与黄仁勋互换外套的照片。照片中,扎克伯格身穿黄仁勋标志性的黑色皮夹克,而黄仁勋穿上了扎克伯格此前穿过的棕色外套。这张照片也在对谈现场得以重新展示。
本届SIGGRAPH于7月28日至8月1日举行,近100家参展商将在大会上展示图形技术如何引领未来。自1974年在科罗拉多州博尔德市首次举办以来,SIGGRAPH一直走在创新的最前沿,曾经向全世界展示了“AspenMovieMap”,这是谷歌街景地图的前身。SIGGRAPH还是皮克斯首部CG动画《小台灯》的首映地之一。
在这场难得的面对面对话上,黄仁勋和扎克伯格共同探讨了Meta的开源哲学,同时扎克伯格正式发布了AIStudio,将允许用户构建具有自定义个性的虚拟角色和聊天机器人。而Meta最终的愿景是让每个人都能为自己创建个性化的AIAgent。
尽管两人的年龄差超过20岁,但作为科技行业少数仍留在公司一线的资深创始人,黄仁勋与扎克伯格的惺惺相惜贯穿始终。扎克伯格也不忘向黄仁勋吐槽说:“你的头发变白了,我的头发只是变长了。”而黄仁勋表示:“你的头发明明变卷了。”但扎克伯格澄清说:“我头发一直是卷的,只是之前非常短!”
相比于大学本科期间就打造出Facebook并退学创业的扎克伯格,黄仁勋是在30岁才成为英伟达的联合创始人。于是他提到:“我要是知道得花这么长时间才能成功的话……”
“你打从一开始就不会做这些了?”扎克伯格问道。
“不,我会像你一样从大学辍学然后早点开始。”黄仁勋表示。
1.信息流推荐的未来
在对谈中,黄仁勋肯定了Meta打造的AI框架Pytorch的行业地位,以及Meta过去几年里在计算机视觉、语言模型、实时翻译等方面的成果。他提出的第一个问题是扎克伯格会如何看待Meta在生成式AI方面的进展。
扎克伯格首先回溯了2018年,Meta展示的早期VR功能,以及如何通过打造逼真的形象来推动消费级头戴设备的发展。同时Meta做了很多研究来保证头戴设备足够薄,黄仁勋对谈扎克伯格:或将摆脱聊天机器人形态|甲子光年再加上先进的光学堆栈和显示系统,这些才是Meta通常在SIGGRAPH图形大会上会展示的元宇宙进展。
不过现在的Meta已经离不开人工智能的话题。扎克伯格提到,Meta旗下分别拥有超过十亿用户的Instagram和Facebook拥有大量信息流,因此内容排序及其背后的推荐系统很重要。但和早期Facebook上只刷亲朋好友的动态不同,有了生成式人工智能以后,如今Instagram会根据用户的兴趣推荐数百万其他用户的内容,构成其信息流的绝大部分,无论他们是否关注过这些用户。
扎克伯格认为这才是推荐系统的未来,要么是即时创建的内容,要么是通过现有的不同内容汇集综合而成的内容。这和当前的生成式人工智能热潮略有不同。当然它还是基于Transformer和类似的架构,但会越来越通用。
具体来说,过去Meta会为每种类型的内容建立不同的模型,比如有一个模型用于对视频进行排序和推荐,另一个模型用于对更长的视频进行排序和推荐。但更通用的推荐基础模型可以涵盖所有内容,当获取内容的池子越广,就越容易规避不同池子获取内容的低效问题。
“我梦想着有一天,你可以把Facebook或Instagram都当成像单一的AI模型,所有不同的内容类型和系统集合在一起,这些内容在不同的时间范围内有不同的目标,有些只是向你展示你今天想要看到的有趣的内容,但有些是在帮你建立长期的人际网络。”扎克伯格表示。
从另一个层面来看,扎克伯格认为新一代人工智能会让我们所有的工作流程和产品实现重大升级,每个人都会拥有自己的通用人工智能助手来完成不同的任务。“当我们从Llama3系列模型转向Llama4及更高版本时,我认为它不会再像聊天机器人那样,你给它一个提示,它再回应。它会很快进化成:只要你给它一个意图,它就可以在不同的时间范围内完成任务,比如有些计算工作可能需要几周或几个月的时间,然后结果才会返回到你这里,就像世界上其他地方发生了什么事一样。”
黄仁勋也给出类似的人类逻辑,指出人工智能的发展方向:今天的人工智能是回合制的。你说一些话,它会回复你一些话。但当我们思考时,当我们被赋予一个任务或问题时,我们会考虑多种选择,在脑海中模拟一个决策树,设想每个决定的不同结果。”
2.个人创建Agent
扎克伯格还提到其他公司在构建中央Agent,但Meta的愿景是让所有用户都能为自己创建Agent。“无论是平台上的数百万创作者,还是数亿中小企业,我们最终都希望能够收集你们的所有内容,迅速为你们建立一个业务Agent与你们的客户互动。”
于是扎克伯格在现场宣布,Meta将为人们提供一个名为AIStudio的工具,用于构建具有自定义个性、特征和兴趣的虚拟角色。创作者还可以用这样一种数字替身与私信中的粉丝互动。
来源:Meta
Meta在新闻稿表示,AIStudio将从今天开始向InstagramBusiness帐户用户推出,并将在未来几周内向美国的所有Meta用户开放。
“每天的时间都不够用。”扎克伯格表示。创作者时间有限,所以需要训练Agent代表自己。很明显这就不再是和创作者本人互动,但扎克伯格相信这会是另一种有趣的方式,用户会为各种不同的用途创建自己的Agent。
扎克伯格注意到,MetaAI的主要应用在于人们会在遇到困难的社交场合使用它。比如“我想问我的经理我该如何获得晋升或加薪?或者我和朋友吵架了,或者我和女朋友遇到了什么困难,这场谈话该如何进行等等”。但问题在于,很多人不想只与同一个Agent互动,无论是MetaAI,ChatGPT还是其他应用。用户想创造自己的东西,这就是AIStudio的目标。
“就像每个企业都有电子邮件地址、网站和社交媒体账户一样,未来每个企业都会有一个与客户互动的Agent。而消费者如果买到的东西有问题,也只是想找到一个地方解决问题,通过Agent以不同的方式与企业互动。我认为这也适用于创作者。”扎克伯格表示。
3.开源哲学来自微软
在对谈中,黄仁勋不忘吹捧Meta称:“我认为Llama2可能是去年人工智能领域最重要的事件。”而扎克伯格回应称:我还以为(最重要的事件)是H100。”
黄仁勋认为,Llama2激活了所有行业。突然之间,每个大中小公司都在开发人工智能。所以他向扎克伯格询问,Meta的开源哲学来自何处。
扎克伯格首先承认,Meta构建分布式计算基础设施和数据中心的时间比其他科技公司晚:“当我们建造这些东西的时候,它已经没有竞争优势了。好吧,那我们不如把它开放,这样我们将受益于周边生态系统。”
而Meta参与的最大项目就是OpenComputeProject:“通过让它成为某种行业标准,所有的供应链基本上都围绕它组织起来了,这样做的好处是为每个人省钱,基本上可以节省数十亿美元。”
在Facebook创立二十周年之际,扎克伯格认为,过去20年里最困难的事情之一就是必须通过竞争对手的移动平台来发布应用,并且他以隐晦地方式批评了苹果的封闭系统。“每个人认为这应该是封闭的生态系统,因为苹果基本上是唯一一家(主导)。当然市场上有更多安卓手机,但苹果基本拥有整个市场和所有利润,安卓在开发方面基本上是跟随苹果的。所以我认为苹果显然赢得了这一代的竞争。”
然而回到上一个时代,微软虽然不是完全开放的公司,但Windows系统可以在不同的软硬件上运行,是更加开放并且领先的生态系统。也就是说从PC时代开始,开放的生态系统就一直存在。“对于整个行业正在构建的计算平台来说,如果软件是开放的,它的价值会很大,这塑造了我的哲学。我很乐观地认为,下一个时代,开放的生态系统会获胜。”扎克伯格表示。
同时他承认,Meta这样做并不是因为他们是利他主义者,而在于这的确会让Meta打造的成果受益于强大的生态系统。黄仁勋也附和称,仅英伟达内就有数百人致力于让Meta的PyTorch变得更好。但他也提出温和的异议:“我可能不想自己制作这件夹克,我更喜欢让别人为我做这件夹克。皮革可以开源这件事对我来说不是有用的概念。当然你仍然可以拥有令人难以置信的开放的服务。”
针对模型的多样化,扎克伯格进一步提出,帮助人们从大模型中提取自己的模型将会成为非常有价值的新事物。“不会存在一个模型或者一个Agent供所有人使用。人们会在多大程度上仅仅使用更大、更复杂的模型,还是训练自己的模型自己使用?我敢打赌,它们将会是不同模型的大量扩散版本。”
黄仁勋也赞同称,如果雇佣AI做芯片设计,每小时大概需要10美元。如果与一群工程师共享这个人工智能,每个工程师可能都有专属的人工智能陪伴他们,这个人工智能的成本并不高,而付给工程师的钱却很多。所以对英伟达来说,每小时花几美元就能放大一个人的能力将会非常具有经济潜力。
4.人工智能进入虚拟世界
这场对谈中的另一项重磅发布是Meta的SAM2,也就是新一代MetaSegmentAnythingModel,它能够在不需要任何标注的情况下,对任何图像中的任何物体进行分割。
扎克伯格在现场也展示了SAM2的功能,并且“凡尔赛”地表示:“它可以识别并跟踪奶牛,制作很多有趣的效果。顺便提一句,这些都是我家夏威夷牧场的牛。”
显然,它也是开源的。扎克伯格表示,科学家可以利用SAM2研究珊瑚礁和自然栖息地以及景观的演变等,并且在视频中做到这一点,人们可以与它进行交互,告诉它你想要跟踪什么。
在工业应用中,黄仁勋表示:“例如你有一个仓库,里面有一大堆摄像头,仓库人工智能正在监视一切。假设有一堆箱子掉下来了,或者有人把水洒在地上,人工智能都会识别并生成文本,派人过来帮忙。这是使用它的一种方式。如果发生事故,它不会记录所有内容,而是开始记录每纳秒的视频,回溯并检索那一刻。它只记录重要的东西,因为它知道自己在看什么。”
对谈中的最后一个主要话题是颇受市场欢迎的智能眼镜,由Meta和雷朋眼镜合作开发。扎克伯格表示:“如果你五年前问我,我们会在人工智能之前获得全息AR吗?我会说应该是吧。但真正的突破发生在大语言模型上。在全息AR出现之前,我们现在已经拥有非常高质量的人工智能,而且进步速度非常快。这是一种我没想到的逆转。”
至于未来的眼镜市场,扎克伯格认为最终会产生一系列不同价位,采用不同技术水平的智能眼镜产品,其中300美元价位的智能眼镜将成为最受欢迎的一款,有望迎来数亿消费者。不过眼镜作为一种可穿戴的时尚单品也有自己的烦恼:“它不像手表或手机,人们不想看起来都一样。”已经成为硅谷潮男的扎克伯格指出。
最后,黄仁勋表示,看着扎克伯格把Meta的业务从桌面电脑转向移动设备,再涉足虚拟现实和人工智能等等,他知道这些转型有多难。“这些年来,我们俩都遭受了很多挫折,但这就是成为先驱和创新者所需要的。祝贺你们取得的成果。而且你现在可是时尚偶像了。”
对此,扎克伯格谦虚地表示:“还在早期阶段”。随后他转身掏出一个盒子,里面是为黄仁勋新买的一件毛领黑夹克。而黄仁勋也把自己为SIGGRAPH新准备的皮夹克交换给了扎克伯格穿,再一次完成两人亲密无间的互换外套活动。
(封面图及未说明来源:英伟达)
END.