原创 2024-03-19 12:33·澎湃新闻
转载:https://www.toutiao.com/article/7347927994066911770/
我渴望活下去的意志,超过几乎所有人想要杀死我的意志。——黄仁勋
“这不是演唱会,你们是来参加开发者大会的!”今日凌晨4点,黄仁勋出场时,现场爆发出巨大的欢呼声。
当地时间2024年3月18日,黄仁勋在英伟达 GTC 大会发表主题演讲
“通用计算已经失去动力,现在我们需要更大的模型,我们需要更大的 GPU,更需要将 GPU 堆叠在一起”,黄仁勋在英伟达 GTC 大会上说道。大模型参数量正在呈指数级增长,此前 OpenAI 最大的模型已经有 1.8T 参数,需要吞吐数十亿 token。即使是一块 PetaFLOP 级的 GPU,训练这样大的模型也需要 1000 年才能完成。
全球的科技公司争抢 H100 芯片的势头于 2023 年年末开始有所减弱,但新一代“强心剂”已来。 英伟达推出新一代的 AI 芯片 “Blackwell”,“这是块非常非常大的GPU”。英伟达在发布会上表示,相较于之前的 H100 芯片,GB200 超级芯片可以为大语言模型(LLM)推理负载提供 30 倍的性能提升,并将成本和能耗降低 25 倍。
Blackwell的发布意味着,近8年来,AI算力增长了一千倍
人们已经发现:将深度学习应用到许多领域的科技公司,几乎每一个都是在英伟达的平台上构建的。一位华尔街分析师对此表示:“人工智能领域正在进行一场战争,而英伟达是唯一的军火商”。华尔街的追捧在2023年-2024之间上升到极致。短短八九个月,英伟达的市值从万亿美元飙升到两万亿美元。目前,英伟达已经成为全球市值第三大的公司,仅次于微软和苹果。
不过,这家看似新锐的科技公司,已经走过了 30 年历程,几经浮沉。
目前,英伟达的产品仍然处于供不应求状态。在此背景下,英伟达毛利率拉至 60% 左右。在连年寻找新技术突破的大额支出之下,任何一家科技公司,想要保持这样的成绩单,都是难能可贵的。
GPU ,英伟达的代名词
故事要从 20 世纪 90 年代说起。
当时,硅谷已有人提出,可以通过声卡、网卡这些功能指定的芯片,来降低 CPU(中央处理器)的工作负载。所以同理,做一张专门控制电脑图像输出的芯片,即显卡(Graphic Card),也是自然而然的。例如索尼在 1994 年年底推出的游戏机 PlayStation 就运用了显卡。
但显卡的技术路径,在当时有很多,英伟达找到的切入点是通过并行计算,实现 3D 图形加速,特别在游戏领域上进行应用。
1999 年,英伟达推出了一款名为 GeForce 的显卡。
这款被冠以“全球首款 GPU”的图形处理器,采用了 220 纳米制造工艺,如今英伟达 H100 所使用的制造工艺已到了 4 纳米。
GeForce 最大的亮点是“并行计算”,即把一个复杂的任务拆分成小计算,然后同时处理它们。这与中央处理器 CPU(central processing unit)有着显著不同,在标准的计算机架构中,CPU 一次能处理一个问题。如果说把通用的 CPU 比作一辆货车,一次运送一个大包裹到一个目的地;那么 GeForce 则像是在一组摩托车车队,可以同时运送多个小包裹到多个目的地。
彼时,研究 GPU 的公司,不只英伟达一家,但英伟达成功做到了将自己与“GPU 发明者”这个标签深度绑定。
当时,英伟达市场营销负责人 Dan Vivoli 用 “graphics processing unit”(图形处理器)的概念来推广自家的芯片。相比英特尔靠 CPU 来叱咤芯片市场,英伟达需要营销 GPU 来为自己杀出一条血路。只是 Dan Vivoli 认为,英伟达强调自己的 GPU 发明者的身份后,“我们能成为行业领导者”,他完全没有想到,GPU 将在很长一段时间内成为英伟达的代名词,并且在十多年后,成功掀起人工智能行业的风暴。
英伟达死磕“晦涩角落”
时间回到 199

相关论坛
相关广告

拨打电话