北京时辰3月19日4时-6时,英伟达独创东谈主黄仁勋在好意思国加州圣何塞SAP中心登台,发表GTC 2024的主题演讲《见证AI的变革技巧》。鉴于已往一年多时辰里AI带来的出产力变革,以及英伟达等一众想法股的施展,老黄的演讲仍是造成专家老本阛阓静瞻念其变的热点事件。
以下为及时更新演讲内容:
演讲行将启动,现场仍是高朋满座。
播放开场影片。
黄仁勋登台,对不雅众们强调:我但愿你们搞清爽今天这里不是演唱会,而是一场诱骗者大会。
黄仁勋先容了本届GTC的一些参与者,并强调这些公司不仅仅来参会,而是有我方的东西要来展示。
黄仁勋展示英伟达发展史,又提了将首台DGX One送给OpenAI的故事。
黄仁勋:今天咱们将盘考这个新行业的很多问题。咱们要谈谈怎么进行计较、咱们要谈谈你所构建的软件类型,你将怎么看待这个新软件,新行业中的哄骗然后,也许(再谈谈)下一步是什么,咱们怎么从今天启四肢念准备,下一步会发生什么。
黄仁勋:咱们使用仿真用具来创造产物,并不是为了裁减计较成本,而是为了扩大计较界限。咱们但愿大要以皆备保真、皆备数字化的面孔模拟咱们所作念的总共这个词产物。从骨子上讲,咱们称之为数字孪生。
老黄启动先容一系列巴合伙伴,包括ANSYS、Synopsis、Cadence等。
跟着transformer模子被发明,咱们能以惊东谈主的速率推普遍型谈话模子,现实上每六个月就能翻一番。而为了考核这些越来越大的模子,咱们也需要更强的算力。
“特别高大”的Blackwell架构GPU登场。
老黄现场对比Blackwell架构和Grace Hopper架构的GPU。
老黄现场展示Grace-Blackwell系统(两个Blackwell GPU、四个die与一个Grace Cpu纠合在全部)。GB200将两个B200 Blackwell GPU与一个基于Arm的Grace CPU进行配对。
为了贬责大界限数据中心的GPU交互问题,也需要更强的纠合(NVlink)能力。
这个GB200新系统普及在那里呢?老黄例如称,要是要考核一个1.8万亿参数目的GPT模子,需要8000张Hopper GPU,销耗15兆瓦的电力,港股打新一语气跑上90天。但要是使用Blackwell GPU,只需要2000张,一样跑90天唯一销耗四分之一的电力。诚然不仅仅考核,生成Token的成本也会随之裁减。
把芯片作念大的公正:单GPU每秒Token隐隐量翻了30倍。
毫无疑问,微软Azure、AWS、谷歌云等一众科技巨头都是Blackwell架构的首批用户。
接下来应该是哄骗侧的部分,先讲的是生物医药的部分。
黄仁勋文书新的AI微就业,用于诱骗和部署企业级生成式AI哄骗。老黄默示,异日怎么诱骗软件?与目下一滑行代码不同,异日可能就要靠一堆NIMs(Nvidia inference micro service),用与AI聊天的形状调度一堆NIMS来完成考核、哄骗的部署。英伟达的愿景是成为AI软件的“晶圆厂”。
英伟达的AI微就业NIM网站仍是上线。
NIM微就业提供了最快、性能最高的AI出产容器,用于部署来自NVIDIA、A121、Adept、Cohere、Getty Images和Shutterstock的模子,以及来自Google、Hugging Face、Meta、Microsoft、Mistral AI和Stability AI的怒放模子。
NVIDIA AI Enterprise软件平台更新,包括NIM、构建RAG哄骗模范的用具等。随后老黄又共享了西门子科技、日产汽车等用如安在责任流中将Omiverse Cloud哄骗在责任流中。
黄仁勋文书,目下赞助将 Omniverse 云推送至Vision Pro。
可能是时辰不太够了,老黄启动加快官宣一系列取悦。其中提到专家最大电动车公司比亚迪将接收英伟达下一代智能汽车芯片Thor。
启动提机器东谈主了。黄仁勋默示,在咱们的宇宙里,类东谈主机器东谈主很有可能会施展更大的作用,咱们诱骗责任站、制造和物流的面孔,并不是为东谈主类盘算推算的,而是为东谈主类盘算推算的。因此,这些东谈主类或机器东谈主的部署可能会更有生效。黄仁勋同期文书一项名为GR00T的神气,旨在进一步激动英伟达在机器东谈主和具身智能的冲破性责任。由GR00T驱动的机器东谈主不错相接当然谈话,并通过不雅察东谈主类四肢来模拟通顺。
除了机器东谈主影像外,迪士尼的orange和green机器东谈主也来到现场,这款机器东谈主用的是英伟达为机器东谈主盘算推算的首款AI芯片Jetson。
黄仁勋带着机器东谈主下场,现场播放ending影片。
黄仁勋返场告别,全场发布会放弃。