开源软件在这一快速变化的全球市场中扮演着重要角色。DeepSeek将其最新的人工智能模型纳入开源软件系统,这意味着它已与其他企业和研究人员共享了基础代码,使其他人能够利用相同的技术构建和发布自己的产品。
DeepSeek聊天机器人在回答问题、解决逻辑问题及编写计算机程序方面表现卓越,其能力与市场上的顶级产品相当。此外,DeepSeek的成本低廉,颠覆了只有大型科技企业(主要集中在美国)才能制造先进人工智能系统的普遍认知。
中国工程师表示,他们仅花费约600万美元的原始计算能力便成功训练了新的DeepSeek模型,这一成本远低于科技巨头Meta训练其最新人工智能模型所需的费用。风险投资公司Page One Ventures的投资人克里斯·尼科尔森指出,“相较于拥有1亿美元或10亿美元资金的公司,有600万美元资金的公司数量要多得多。”他主要关注人工智能技术领域的投资。
自2022年11月OpenAI推出ChatGPT以来,众多专家和投资者认为,除非投入数亿美元购买人工智能专用芯片,否则没有公司能够与行业领头羊竞争。然而,而DeepSeek的工程师们声称,他们仅使用了大约2000个英伟达生产的专用芯片就完成了训练。DeepSeek的工程师们不得不更加高效地训练大型模型,以保持其竞争力。
DeepSeek由一家名为幻方的量化股票交易公司运营。截至2001年,该公司已投入大量资金购买数千枚英伟达芯片,用于训练其早期模型。该公司以其高薪和吸引顶尖大学毕业生加入的承诺而闻名。参与DeepSeek早期大模型开发的某计算机工程师表示,公司还聘请了没有任何计算机科学背景的人员,帮助该技术理解和生成诗歌,并在完成难度极高的中国高考试题时取得高分。

DeepSeek不生产任何消费级产品,而是专注于让工程师们全心投入研究。这意味着其技术不受中国对人工智能最严格的监管政策限制,中国要求面向消费者的科技产品必须遵守政府对信息的控制。相较于OpenAI,在去年12月公布了名为o3的新“推理”系统,尽管该系统尚未广泛使用。然而,DeepSeek继续证明其并未落后,本月发布了自己的推理模型,性能同样引人注目。
开源软件在这一快速变化的全球市场中扮演着重要角色。与许多其他公司一样,DeepSeek也将其最新的人工智能模型纳入开源软件系统,这意味着它已与其他企业和研究人员共享了基础代码,使其他人能够利用相同的技术构建和发布自己的产品。
中国大型科技企业的员工通常仅与其内部同事合作,但“如果你从事开源软件开发,实际上你是与全世界的人才合作”。在2023年,Meta免费分享了名为LLama的人工智能模型,使得人工智能的开源生态系统开始蓬勃发展。许多人曾认为,只有像Meta这样的科技巨头——拥有大型数据中心和大量专用芯片——继续开源其技术,人工智能社区才能繁荣发展。目前,DeepSeek和其他公司已证明,它们也能拓展开源技术的应用范围。