«

DeepSeek 发布氮气加速器 DSpark!可惜好东西又开源了

时间:2026-6-29 01:16     作者:独元殇     分类: AI 与出海


欢迎关注我的公众号,名叫「串串狗小刊」

感觉, AI 又要跨时代了。

昨天小鲸鱼 deepseek 和北京大学,开源了 DSpark , 据说呢让推理速度再加速 70% 左右!d 哥的进化速度真快,美利坚终究会被中国的成本优势碾压。不知道什么时候 deepcode 能出来...

img

(同时还开源了个平台,叫 全栈平台DeepSpec ,这个是帮你部署 DSpark 的)

目前是 稳定80~140 token/s ,是以速度著称的 豆包 的 2~3 倍,可以说超级快了。

而,隔壁美利坚 closeAI 也在 昨天 ,搞了 Sol Terra Luna 的 chatgpt 5.6 (不过依然是被美利坚封锁到了牢笼里.... , 想用,得经过美利坚政府严格的资质审核,我的天。 突然那很期待下半年的 gemini .... )

而 DSpark 这基本上就是直接性能翻倍了。 deepseek 刚上个月惊艳世界的 廉价大参数 高缓存 V4 Pro ,这又憋大招,搞了个跨时代的东西。而且恰恰相反,搞的是 美国 的对立面。美国一直费劲心海,把东西打磨的强悍昂贵,而 deepseek 则研究怎么更性价比高更省钱。

我私下,是一个 SaaS 职业站长,我需要使用 AI 帮助我做很多事情。说实话,我需要的 99% 的功能,deepseek V4 和 其他的国产模型,完全能给我满分试卷了,剩下的 1% 也不是多么关键。主要就是能自动化跑完流程就行。

我承认,美利坚的 AI 智商非常高,但是我依然在大量使用国产的模型。

目前,我最希望的,不是智商更高,而是在当前智商上更快一点。影响我使用 AI 的体验的,最大的就是那个等待。我一个 ADHD ,我真的很烦这种。所以我平常使用 flash 这种模型非常多。哪怕笨一点呢,我也不想等它很久。

加速 70% 是什么概念,对我来讲,一天能腾出 5 个小时!试错成本也更低。

据说在输出质量不变情况下,并发容量也涨了 4 倍!不仅快了 70% ,还能再多服务 4 倍的用户。

原理很简单,就是先让 弱模型 给输出一大堆的草稿,然后让 强模型 批改一下(只改错的地方,正确的就忽略了)。妙啊妙啊!我以前也有过这种想法,就是模型它在办事的时候,很多事情是用不到高智商的,有时候让它干这种鸡毛蒜皮的事,真的有点心疼浪费... deepseek 公司想的这种办法,真的太绝了。弱模型和强模型,去算小学数学本来也没什么差异....

当然细节还是很硬核的,有什么 存活概率、拒绝采样、模块校验、置信度调度验证等等,不过原理就是怎么一个原理。

使用很简单,官方已经默认应用了,也就是说我们现在调用 API 默认就是开启 DSpark 的,怎么样呢?有没有感觉现在的 deepseek 这种快速非常的显著了,(而且我朋友在本地部署的情况下,几乎是一瞬间把几行字给抛出来),几乎上没有等待的那种感觉了。编程时,也有种实时响应的感觉.... 总而言之,效果还是挺显著的。

美利坚的方向,走的不算很对。怎么让 AI 更便宜还耗能更小的「算力环保主义」才是未来的正路。但是很遗憾,梁圣格局太大,直接又开源了,A 处 也可以 0 成本拿来。如果不开源,我都不敢想象这是多么大的核心竞争力!看来,美国闭源AI又要变强了,会以字研的形式来自研!(虽然美利坚 AI 公司那边也都是中国人,中国人对中国人太好了)

当然,别人用你的算法,慢慢就会依赖,就不会自主开发了哈哈 ~

不过 AI 圈本身就是抄来抄去的,最开始不都是抄袭的 谷歌 的 transformer 模型吗?gemini 现在不也什么都没说吗。

标签: 原创 deepseek