端午假期,广东近500场非遗活动呈献非遗盛宴
2024-06-13 06:53:54
点燃中国大模型价格战!“量化巨头”如何成为“AI界的拼多多”
本文作者:赵颖
本文来源:硬 AI
2 元 / 百万输出 Tokens,DeepSeek-V2 大模型推出一周后,便引爆业内 " 价格大战 "。
字节将价格降至 0.6 元 / 百万输出 Tokens 0.6 元人民币,阿里随后将部分大模型价格骤降 97%,百度也免费开放了两款文心一言模型 ......
" 大模型黑马 "DeepSeek 由知名私募巨头幻方量化创立,其推出的 DeepSeek-V2 不仅性能在众多开源模型中最强,价格也 " 卷 " 到了业内最低。
DeepSeek 是如何成为 "AI 界的拼多多 "?
最早探索 AI 的量化之一
DeepSeek 的背后离不开幻方量化支持,幻方量化自 2015 年成立以来,已发展成管理规模约 600 亿元人民币的大型资产管理公司,其部分利用 AI 和算法来识别可能影响股价的模式或变量。
幻方量化最初由创始人梁文锋在成都一间公寓内创办,他是浙江大学计算机科学专业毕业生,当时专注尝试自动化股票交易。
到 2021 年,幻方量化所有策略都在使用人工智能。幻方董事总经理蔡力宇曾表示,人工智能有助于从海量数据集中提取有价值的数据,这些数据可用于预测股价和做出投资决策。
如今幻方利用其积累的 AI 知识和基础设施创建出 MoE 大模型 DeepSeek-V2,专家表示,该模型的实力与美国主流大模型相当。
DeepSeek-V2 的推出迅速引起了业界的广泛关注,这一 AI 模型不仅能够回答问题、编写代码和进行推理,其成本也显著低于竞争对手,每百万输出 Tokens 仅需约 2 元人民币。
这一价格优势引发了中国 AI 大模型 " 价格战 ",字节、阿里和百度纷纷降低了其 AI 服务的价格,同时也凸显出中国 AI 市场竞争的激烈程度。
海量算力优势
DeepSeek 的模型能力出众背后离不开充足的算力。
该公司的首个计算集群 " 萤火一号 " 耗资近 2 亿元人民币,幻方量化正在投资约 10 亿元建造第二个超算集群 " 萤火二号 ",该集群规模相当于一个足球场的大小。蔡力宇补充说,幻方的大部分利润都投入到了人工智能基础设施中。
根据该公司网站数据,第二个集群现已完工,将 10000 万多张英伟达处理器和存储连接起来,使 DeepSeek 拥有足够的算力训练大模型。
据国盛证券报告,幻方量化是中国六家拥有超过万张 A100 处理器的公司之一,这通常被认为是自行训练大模型的算力门槛。
此外,DeepSeek 模型还采用开源方式,允许研究人员检视其架构并复制。DeepSeek-V2 的架构被认为非常独特,采用了混合专家的理念,将模型分成更小的模块,提高了处理效率和准确性。
总部位于美国的 AI 动画初创公司 Cartwheel 的首席科学家 Andrew Carr 表示,DeepSeek 将这种称为 " 混合专家 " 的想法发挥到了极致,即将模型分成更小的块,拥有数百个小专家。
2024-06-13 06:53:54
2024-06-13 06:51:38
2024-06-13 06:49:22
2024-06-11 12:05:28
2024-06-11 12:03:12
2024-06-11 12:00:56
2024-06-11 11:58:41
2024-06-11 11:56:24
2024-06-11 11:54:08
2024-06-11 11:51:52
2024-06-11 11:49:35
2024-06-11 11:47:20
2024-06-11 11:45:03
2024-06-05 04:38:52
2024-06-05 04:36:36
2024-06-05 04:34:20
2024-06-05 04:32:03
2024-06-05 04:29:47
2024-06-05 04:27:31
2024-06-05 04:25:15