发表新帖

回复本帖

1 到第页

东论 > 生活热点 >

竞争＝下黑手？ [复制]

发表于 2025/01/29 22:55:49 来自浙江宁波

楼主

中国人工智能公司深度求索（DeepSeek）近期相继推出开源人工智能（AI）模型DeepSeek-V3和DeepSeek-R1。 DeepSeek-R1因其可比肩OpenAIo1的性能、极低的服务价格，以及代码和模型架构的完全开源，震惊业界。DeepSeek-V3完整训练只需2.788M H800 GPU小时，其训练成本仅为557万美元（仅为OpenAI同类模型的10%），但该模型实现了与GPT-4o和Claude Sonnet 3.5（来自美国人工智能企业Anthropic）等顶尖模型相媲美的性能。DeepSeek-R1的API服务定价为每百万输入tokens 1元（缓存命中）/ 4元（缓存未命中），分别是OpenAI o1的2%和3.6%。外界普遍认为，美国尖端芯片出口管制等限制并没有削弱中国的AI能力，反而似乎在推动DeepSeek等初创公司以优先考虑效率、资源池和协作的方式进行创新。“对于美国政策制定者来说，一个难以接受的事实是，严格的出口管制迫使中国科技公司变得更加自力更生，从而推动了原本可能不会发生的突破。”尽管美国通常在开创性研究中占据主导地位，但中国公司在执行力、价格承受能力和产品推广方面表现出色。这一点已在电子商务、电动汽车、太阳能电池板和电池等领域得到了生动体现。除了极致性价比，让DeepSeek的大模型脱颖而出的是其代码和训练方法的完全开源。开源即将模型的源代码和技术细节公开，并允许用户根据其自身需要对模型进行任意使用和修改，这被认为有提高技术透明度，让用户更容易、更便宜地使用，惠及开发者降低迭代成本，防止垄断等好处。根据中国信息通信研究院去年发布的白皮书，全球人工智能大型语言模型数量已达 1328个，其中36%来自中国。这使中国成为仅次于美国的第二大人工智能技术贡献者。阿里云已发布100多个新的开源AI模型，支持29种语言，并满足各种应用需求，包括编码和数学。同样，中国的Minimax和01.AI（零一万物）等初创公司也开源了它们的模型。开源已经打破了闭源的护城河，现在开源的模型已经可以和闭源的模型媲美，甚至超越，比如 OpenAI 的 GPT-4 和 GPT-4o，o1,以及 Midjourney 的 5.2 和 5.2 Pro。 1月28日，除夕夜，DeepSeek继续“放大招”，发布并开源了Janus-Pro系列多模态模型，其中的Janus-Pro-7B直接对标OpenAI的DALL·E 3和Stable Diffusion，并在多项基准测试中实现碾压式超越！随着 Janus-Pro 的发布，DeepSeek 不仅向世界展示了中国 AI 技术的实力，更为多模态 AI 的发展指明了新的方向。这个统一的、强大的模型架构，很可能会重新定义我们对 AI 能力的认知。中国DeepSeek的冲击力，还使英伟达（Nasdaq：NVDA）1月27日股价暴跌16.86%收于每股118.58美元，跌至过去10月以来的最低点；总市值2.90万亿美元，一日蒸发5900亿美元（约合人民币4.28万亿元），创史上最大单日个股市值蒸发纪录。老特在佛罗里达州迈阿密发表讲话时表示，“中国公司发布DeepSeek人工智能大模型给我们（科技）行业敲响了警钟，我们应为了赢得胜利而努力竞争。” 1月27日，DeepSeek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜，在美区下载榜上超越了ChatGPT。但这也让DeepSeek成为了网络攻击的对象，目前已经被迫暂停注册，严重影响了日常运营。经技术团队排查，发现攻击源来自美国的IP。由于这些攻击，DeepSeek不得不限制新用户注册，直到局势得到控制。当DeepSeek遭到了不明组织围攻，四面楚歌之际，华为的毕昇加入战斗，360创始人周鸿祎也喊话：无偿帮助Deepseek，并在微博发文怒斥这些使用“下三滥手段”的黑客，谁在攻击DeepSeek？为什么攻击DeepSeek？周鸿祎：联系想一想答案不言而喻！刚对DeepSeek黑客暴力攻击、立马又宣布对其安全调查！当地时间1月28日，白宫新闻秘书卡罗琳·莱维特在记者发布会表示，美国国家安全委员会正在审查DeepSeek应用程序对美国国家安全的影响，她称DeepSeek对美国人工智能行业是一个警钟，白宫要确保美国人工智能的主导地位。 DeepSeek的横空出世，已经伤害到了美国资本的根本利益！而引发这一系列问题的根本原因，就是DeepSeek以低廉的成本创造出了世界顶级的AI大模型，彻底揭穿了美国科技巨头的资本骗局！再往严重点说，DeepSeek的崛起直接冲击了美国AI霸权！

回复收藏

快速回复 | 1 | 举报

渴望蓝天666

Author -关注 -粉丝

积分：: 0
经验：: 0

发私信关注TA

{{item.title}}

{{item.cataName}} {{item.user}} 更新于 {{item.createtime}}

发表于 2025/01/31 10:10:50 来自浙江宁波


谈定、低调，深度求索对内比有突破、超越，对外比：媲美，是搅局者，智能芯片还是英伟达阉割后的“特供版”。“价廉物美”能碾压其他模型。深度求索，是民营小型科创公司，创始人，浙大出来，85后，背后老板是宁波幻方量化投资公司，主业是用人工智能量化投资股票，副业才是深度求素。小散户抄股越来越难了？对深度求索模型，我们也有安全要求，实名制，敏感审查。为什么很多科技创新发生在民营企业？如：新能源汽车、自制手机芯片、人工智能……

TA共获得：回复:18条

悠然小憩 2025/01/31 10:31:22 来自浙江宁波举报 1 回复

让子弹飞一会，另外蒸馏技术罢了，任何的大模型靠的是算力，而算力则是一块一块算力卡堆起来的，差异有，但不可能那么大，所以蒸馏技术就合理了。

悠然小憩 2025/01/31 10:54:42 来自浙江宁波举报 0 回复

陈进，1968年7月出生。1991年7月获同济大学学士学位。1992年1月赴美国留学，1998年1月获美国德州大学博士学位。专门从事超大规模集成电路设计和检测方面的研究。先后在美国IBM、Motorola、Analog Device公司任高级主任工程师、芯片设计经理，从事高速无线通讯芯片和DSP核心电路的开发，担任多项重大SOC系统芯片的设计开发和项目负责人。2003年2月发明的“汉芯一号”，鉴定专家组作出了一致评定：上海“汉芯1号”及其相关设计和应用开发平台，达到了国际先进水平，是中国芯片发展史上一个重要的里程碑。2006年1月17日，一个类似美国“水门事件”中“深喉”的人物，在清华大学水木清华BBS上，公开指责上海交通大学微电子学院院长陈进教授发明的“汉芯一号”造假。最终东窗事发。

悠然小憩 2025/01/31 10:56:22 来自浙江宁波举报 0 回复

查下汉芯事件以及当事人陈进的个人简历。4年时间才被人发文因而暴发。

辞慕尔尔

悠然小憩 2025/01/31 11:22:14 来自浙江宁波举报 0 回复

也就说，美股那些人，都是傻子，您都知道的事情，他们硬是不怀疑，
做等着看英伟达的股票下挫超过13%，市值蒸发约4650亿美元，创了美股市值蒸发纪录。
这么说，黄仁勋人还怪好的嘞，给我们放这么大个烟花。

辞慕尔尔

悠然小憩 2025/01/31 11:49:59 来自浙江宁波举报 0 回复

您是全才，我真这么以为的，你看，医疗你也懂，医疗制度改革，你也懂，仿制药什么的，你也懂，
涉及到计算机的，无论是操作系统也好，还是软件开发，你也懂，甚至这个“蒸馏”，我都没搞清楚，您竟然也搞清楚了，还一口咬定“蒸馏技术罢了”，我好歹也是从这个行业里赚到了人生的第一桶金的，我都不敢一口咬定，您就敢，
新小吉是IT公司看大门的，我估计在你眼中是是他对班另一个看大门的，
我就问一个问题，这么简单的突破，技术上蒸馏一下就能解决的问题，
美国人就不搞，一定要等着中国人搞出来，然后搞的股市暴跌13%，几千亿的市值都蒸发了，
来凸显中国的科技进步，然后顺便让你跟着显摆一下，一口就给咱们界定了“蒸馏技术罢了”。
走过歪路，犯过错误，在你的眼中，就会继续犯错，走外路，
你咋就这么见不得中国人好呢，就不能真的是算法的进步，就不能另开一条赛道，
人呐，是这样的，不能光抬头看远方，你还要低头看路，
不能光想着未来，你还要回头看看自己来时的路，你和我肯定是一样的，黑头发，黄皮肤，
行了，我都想到你怎么回怼我了，肯定又是那几句，
但是，我还是希望你从理性的角度，从一个中国人的角度看待中国人的技术进步和国家的发展。

悠然小憩

辞慕尔尔 2025/01/31 12:22:49 来自浙江宁波举报 0 回复

我笑死了，英伟达做什么的？硬件，知道不，不懂好好学学，英伟达不做AI的。人家生产都排几年了。

悠然小憩

辞慕尔尔 2025/01/31 12:23:40 来自浙江宁波举报 0 回复

如果说openAI 之类的股价跌还可以说说，英伟达股价跌，笑死人了。就如以后自动驾驶了，就不需要汽车了一样可笑。

悠然小憩

辞慕尔尔 2025/01/31 12:26:21 来自浙江宁波举报 0 回复

连DeepSeek都用了五万块英伟达的H100卡。

辞慕尔尔

悠然小憩 2025/01/31 13:02:37 来自浙江宁波举报 0 回复

所以说你一知半解，你压根不了解发生了什么，
我们以前对人工智能的理解，就是摸着鹰酱过河，和他们一起搞“力大砖飞”那一套，
过去，AI行业默认的计算路径是：“想要更强大的AI，就需要更强的GPU。” 这也是英伟达市值暴涨的核心逻辑——所有AI企业、科技巨头、政府机构，都绕不开英伟达的GPU。但DeepSeek的实验告诉市场：GPU不是AI的唯一解。假设未来更多的AI公司转向更便宜、更通用的计算方案，甚至定制ASIC（专用集成电路）来替代英伟达GPU，那么英伟达的市场份额是否还能维持？

你的例子举错了，应该这么理解，如果新能源彻底普及了，传统的石油价格还能维持多久

辞慕尔尔

悠然小憩 2025/01/31 13:20:46 来自浙江宁波举报 0 回复

问题的核心不在于，DeepSeek用了英伟达的卡，问题的核心在于，DeepSeek只用了五万块的H100卡。
问题的核心在于DeepSeek只用了五万块的H100卡，他还开源了，

悠然小憩

辞慕尔尔 2025/01/31 15:20:17 来自浙江宁波举报 0 回复

用了蒸馏技术懂不？蒸馏技术不懂去查查。

辞慕尔尔

悠然小憩 2025/01/31 16:47:51 来自浙江宁波举报 0 回复

蒸馏技术，
你上学听老师讲课也是一种对知识的蒸馏？
人工智能本来就是迭代的？
蒸馏有什么问题吗？
结合最近的黑客攻击
deepseek目前需要做的是防止别人反向蒸馏。

悠然小憩

辞慕尔尔 2025/01/31 16:50:27 来自浙江宁波举报 0 回复

对你的无知，没什么好解释的。

渴望蓝天666

悠然小憩 2025/01/31 21:59:55 来自浙江台州举报 0 回复

首先，是不是蒸馏技术目前并没确定。其次，数据蒸馏是业内常见的技术做法，全球很多公司采用这技术。最后，关键的核心问题不在于他是不是用了蒸馏技术，而是，为何同样是在蒸馏开源模型的基础上，只有他能脱颖而出，并以如此低廉的成本价格就能实现如此高的性能！

渴望蓝天666

悠然小憩 2025/01/31 22:03:51 来自浙江台州举报 0 回复

再则，业界都认为蒸馏技术存在“隐性天花板”，它虽然可以提高模型训练效率，但借此开发的模型无法超越基础模型的能力。但1月28日凌晨，DeepSeek发布了最新视觉模型Janus-Pro，在多模态理解和文生图指令遵从能力都收获了显著提升，并在多个基准上超越了DALL-E 3与Stable Diffusion！