«

回顾 2025 年,盘点不容错过的全球 AI 行业重大事件

时间:2026-1-9 23:05     作者:独元殇     分类: AI 与出海


[toc]

我今天把 2025 全年的所有关于 AI 的大事件都列举出来吧!

这一年 AI 真的开始展露其强悍了,这一年各种 AI 应用层出不穷,算的上 AI 应用之年。

什么智能体、推理思考、deepseek、vibe coding、海外站收费(博主我的副业)、开源、长任务..... 各种 2024 年暗淡无声或从未有的概念,挨个迸发。明明 2024 年感觉 AI 寂寂无声,好像泡沫破碎一样.....

先说 Agent(智能体)

这是最能定义 2025 的 AI 的词汇。2024 年有人提出这个概念,但没有人能真正实现所谓的智能体,也就是【代替人去工作】的智能体。虽然我有一直在阮一峰周刊和 Hacker news 里看到各种所谓的助手.... 但都如玩具一样。

但是 2025 年 2 月,Claude Code 悄悄出来(3.7 Sonnet 版本),悄无声息,真正意义上实现了开发者梦寐以求的,写几个字,说两段话,AI 就自己写、自己测试、自己检查、自己工作.... 与其说梦寐以求,不如说是噩梦。

从这个事件开始,Agent(智能体)算是迈出了第一步。之后,一发不可收拾,寂静了一年半的 AI 热度,马上发展蓬勃。什么 Qwen Code、Codex、Manus、Trae、Operator、Gemini Agents... 一个比一个能打。

(豆包手机应该也算吧)

MCP 概念

在 2024 年的 11 月,Claude 公司提出了 MCP 规范,也就是 模型上下文协议规范。

AI 从此能和各种软件和系统、网站等等等交互了。

而且在 2025 年,真的大规模普及!

MCP 为智能体的发展成熟,功不可没啊!

思考推理

在 2025 初期,最耀眼的新闻,就是 deepseek 了。它除了大大降低模型成本,更是引入了思考推理这个概念。deepseek 团队发现,针对可自动验证的奖励进行训练,大语言模型会自发形成推理策略,将用户的问题分解、思考、来回算来回导,最终给出更优的回答。

至此,全球一发不可收拾,几乎所有模型都标配一个思考推理模式 (此前中国,在 AI 方面,理论很少能如此广泛影响全球的技术走向)。chatGPT 更是混合模型,只能判断是否应该去思考。

别小看这个技术,它在生成代码上,可以从错误出发,一步一步定位核心原因。以前的 AI 都是囫囵吞枣,直接算下一步,而有了推理,则可以走一步停停,再看,实际上【思考推理】是为智能体作铺垫!

因为 AI 能够想人一样,具备对庞大复杂的代码进行阅读的操作本事了。如果没 deepseek 深度求索公司 搞出【思考推理】,可能 2025 年,全球还是会和 2024 年一样寂静无声。

自动确认模式

智能体早期的痛点是,每个操作都需要用户去确认,因为如果不确认,AI 可能把你的文件给搞丢,出大事。

如果,直接撒手不管,让 AI 自己进行到底的话,这就是 自动确认 模式。也就是「你只需要看一次」英文的缩写,YOLO 模式。

这个是高风险事情。目前在致力于砸掉自己程序员饭碗的程序员工程师们,日积一日的努力下,现在几乎所有的 智能体 都开了这个默认 YOLO 模式。

其实这是个高风险事情,只不过还没发生大灾难。好处是 彻底解放程序员了,也加剧了程序员行业的大裁员事件。坏处是,这依然很危险,且致命!但天天这样又加剧了我们对大模型的无知的信任,让我们更忽略这个事的存在。

不过不管怎么说,程序能跑就行.....

中国 AI 崛起

在 2025 年 1 月之前,中国的大模型,一直是一个类似于玩具的形象。

各种 文心一言、盘古、千问,都肉眼可见与美国距离巨大。

直到 2024 年元旦节,deepseek R1 发布.... 一切略有改观。

在 2025 年上半年 deepseek 达到和国外一个水准,下半年 Qwen 又占据开源模型榜首,全球 IT 人都对这俩单词非常熟悉了。

截至 2025 年 12 月 30 日的人工智能分析开源权重模型排名

截至 2025 年 12 月 30 日的人工智能分析开源权重模型排名

中国每个大城市、很多大厂都在研究各种模型(而且是开源哦),除了我们熟知的 deepseek qwen外,还有很多很多,上面榜单中,开源模型里,基本都是中国的了。

Kimi 的研究、MiniMax、GLM 的写代码能力,根本不输美利坚!

以前我们老说中国不开放,老外喜欢开源分享、强大才从容不造作.... 在 AI 上,中国恰恰是最开发的,反观美国只有 grok 是比较彻底开源的,其余的都是小部分开源。

中国的 AI 公司很多,而且几乎是 100% 开源,源源不断发布的论文,为全球 AI 发展添砖加瓦,除了那俩明星,还有质谱、月之暗面、minimax 等顶级 AI 公司,起码在敲代码上,不比 Claude 4 Sonnet 差。

额,于此相反的 是 扎克伯格 的 llama (也开源)。曾经在 2024 年,llama 多么风光..... 2025 直接搞的直接没影子了。

虽然它也不算非常差,但貌似官方扎克伯格已经放弃维护了。

离线本地的效果更好了

以前,本地运行模型,都是很笨的效果,起码在 2024 年。

但 2025 年,一台普通的 MacBook air ,不到 10 个 GB 的文件,就能达到不输 2024 年全球鼎沸的 ChatGPT-4o 的效果。

尤其是中国模型,效果很赞。

这下多了很多奇思妙想的可行性!

图像

还记得前年的 chatGPT-4o 吗?那个 o 表示能自己对话时,根据提示直接生成图像。

不过 2024 年的图像,生成的还不算很好。

直到 2025 年 3 月,chatGPT 搞的 DALL-E ,那火爆全网的 吉卜力工作室电影画面的风格,至此,图片质量大大提升。

好好好,中国也开始搞,在 8 月底开源了 Qwen-Image-Edit ,并在 12 月底发布了 Qwen-Image-2512 。这可牛坏了,能在普通电脑上生成不输世界先进 AI 水平的图片!

当然,最强大的还是 谷歌,谷歌的 纳米香蕉 依然是顶级的图片生成引擎。Nano Banana !

是 3 月份开始发布早期版本,8 月底正式命名 Nano Banana 。

何止图片,谷歌的 Gemini 的 Veo 3 视频生成也 6 的不行。

长任务(文科 理科 通通砸饭碗)

今年各大 AI 都在尝试,让 AI 去做一些很复杂的东西,得需要很久才能完成的东西。

就是做人类一整天才能做好的 PPT、研究报告..... 在此前,限于技术,都无法让 AI 长期集中注意力,而今年的 chatGPT 和 Claude,在这方面搞的非常好。起码 ChatGPT 5.2 都宣称自己已经战胜人类专家了!

vibe coding(氛围编程)

意思就是 AI 给你写底阿妈,完全沉浸于氛围感。几乎不去碰键盘,啥也不管,只说要求,运行.....

这个是 2025 年上半年提出的概念。

当然,这个概念还有很多个解释版本。2025 基本实现了。

先就这样吧,简单把 2025 年的重点都简单说了下。

标签: 转载 文档 AI AI-Agent