中国人工智能公司深度求索(DeepSeek)近期相继推出开源人工智能(AI)模型DeepSeek-V3和DeepSeek-R1。
DeepSeek-R1因其可比肩OpenAIo1的性能、极低的服务价格,以及代码和模型架构的完全开源,震惊业界。DeepSeek-V3完整训练只需2.788M H800 GPU小时,其训练成本仅为557万美元(仅为OpenAI同类模型的10%),但该模型实现了与GPT-4o和Claude Sonnet 3.5(来自美国人工智能企业Anthropic)等顶尖模型相媲美的性能。DeepSeek-R1的API服务定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),分别是OpenAI o1的2%和3.6%。
外界普遍认为,美国尖端芯片出口管制等限制并没有削弱中国的AI能力,反而似乎在推动DeepSeek等初创公司以优先考虑效率、资源池和协作的方式进行创新。“对于美国政策制定者来说,一个难以接受的事实是,严格的出口管制迫使中国科技公司变得更加自力更生,从而推动了原本可能不会发生的突破。”尽管美国通常在开创性研究中占据主导地位,但中国公司在执行力、价格承受能力和产品推广方面表现出色。这一点已在电子商务、电动汽车、太阳能电池板和电池等领域得到了生动体现。
除了极致性价比,让DeepSeek的大模型脱颖而出的是其代码和训练方法的完全开源。
开源即将模型的源代码和技术细节公开,并允许用户根据其自身需要对模型进行任意使用和修改,这被认为有提高技术透明度,让用户更容易、更便宜地使用,惠及开发者降低迭代成本,防止垄断等好处。
根据中国信息通信研究院去年发布的白皮书,全球人工智能大型语言模型数量已达 1328个,其中36%来自中国。这使中国成为仅次于美国的第二大人工智能技术贡献者。阿里云已发布100多个新的开源AI模型,支持29种语言,并满足各种应用需求,包括编码和数学。同样,中国的Minimax和01.AI(零一万物)等初创公司也开源了它们的模型。开源已经打破了闭源的护城河,现在开源的模型已经可以和闭源的模型媲美,甚至超越,比如 OpenAI 的 GPT-4 和 GPT-4o,o1,以及 Midjourney 的 5.2 和 5.2 Pro。
1月28日,除夕夜,DeepSeek继续“放大招”,发布并开源了Janus-Pro系列多模态模型,其中的Janus-Pro-7B直接对标OpenAI的DALL·E 3和Stable Diffusion,并在多项基准测试中实现碾压式超越!随着 Janus-Pro 的发布,DeepSeek 不仅向世界展示了中国 AI 技术的实力,更为多模态 AI 的发展指明了新的方向。这个统一的、强大的模型架构,很可能会重新定义我们对 AI 能力的认知。
中国DeepSeek的冲击力,还使英伟达(Nasdaq:NVDA)1月27日股价暴跌16.86%收于每股118.58美元,跌至过去10月以来的最低点;总市值2.90万亿美元,一日蒸发5900亿美元(约合人民币4.28万亿元),创史上最大单日个股市值蒸发纪录。老特在佛罗里达州迈阿密发表讲话时表示,“中国公司发布DeepSeek人工智能大模型给我们(科技)行业敲响了警钟,我们应为了赢得胜利而努力竞争。”
1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。但这也让DeepSeek成为了网络攻击的对象,目前已经被迫暂停注册,严重影响了日常运营。经技术团队排查,发现攻击源来自美国的IP。由于这些攻击,DeepSeek不得不限制新用户注册,直到局势得到控制。
当DeepSeek遭到了不明组织围攻,四面楚歌之际,华为的毕昇加入战斗,360创始人周鸿祎也喊话:无偿帮助Deepseek,并在微博发文怒斥这些使用“下三滥手段”的黑客,谁在攻击DeepSeek?为什么攻击DeepSeek?周鸿祎:联系想一想答案不言而喻!
刚对DeepSeek黑客暴力攻击、立马又宣布对其安全调查!当地时间1月28日,白宫新闻秘书卡罗琳·莱维特在记者发布会表示,美国国家安全委员会正在审查DeepSeek应用程序对美国国家安全的影响,她称DeepSeek对美国人工智能行业是一个警钟,白宫要确保美国人工智能的主导地位。
DeepSeek的横空出世,已经伤害到了美国资本的根本利益!而引发这一系列问题的根本原因,就是DeepSeek以低廉的成本创造出了世界顶级的AI大模型,彻底揭穿了美国科技巨头的资本骗局!再往严重点说,DeepSeek的崛起直接冲击了美国AI霸权!