回顾 2025 年，盘点不容错过的全球 AI 行业重大事件

时间：2026-1-9 23:05 作者：独元殇 分类： AI 与出海

[toc]

我今天把 2025 全年的所有关于 AI 的大事件都列举出来吧！

这一年 AI 真的开始展露其强悍了，这一年各种 AI 应用层出不穷，算的上 AI 应用之年。

什么智能体、推理思考、deepseek、vibe coding、海外站收费（博主我的副业）、开源、长任务..... 各种 2024 年暗淡无声或从未有的概念，挨个迸发。明明 2024 年感觉 AI 寂寂无声，好像泡沫破碎一样.....

先说 Agent（智能体）

这是最能定义 2025 的 AI 的词汇。2024 年有人提出这个概念，但没有人能真正实现所谓的智能体，也就是【代替人去工作】的智能体。虽然我有一直在阮一峰周刊和 Hacker news 里看到各种所谓的助手.... 但都如玩具一样。

但是 2025 年 2 月，Claude Code 悄悄出来（3.7 Sonnet 版本），悄无声息，真正意义上实现了开发者梦寐以求的，写几个字，说两段话，AI 就自己写、自己测试、自己检查、自己工作.... 与其说梦寐以求，不如说是噩梦。

从这个事件开始，Agent（智能体）算是迈出了第一步。之后，一发不可收拾，寂静了一年半的 AI 热度，马上发展蓬勃。什么 Qwen Code、Codex、Manus、Trae、Operator、Gemini Agents... 一个比一个能打。

（豆包手机应该也算吧）

MCP 概念

在 2024 年的 11 月，Claude 公司提出了 MCP 规范，也就是模型上下文协议规范。

AI 从此能和各种软件和系统、网站等等等交互了。

而且在 2025 年，真的大规模普及！

MCP 为智能体的发展成熟，功不可没啊！

思考推理

在 2025 初期，最耀眼的新闻，就是 deepseek 了。它除了大大降低模型成本，更是引入了思考推理这个概念。deepseek 团队发现，针对可自动验证的奖励进行训练，大语言模型会自发形成推理策略，将用户的问题分解、思考、来回算来回导，最终给出更优的回答。

至此，全球一发不可收拾，几乎所有模型都标配一个思考推理模式（此前中国，在 AI 方面，理论很少能如此广泛影响全球的技术走向）。chatGPT 更是混合模型，只能判断是否应该去思考。

别小看这个技术，它在生成代码上，可以从错误出发，一步一步定位核心原因。以前的 AI 都是囫囵吞枣，直接算下一步，而有了推理，则可以走一步停停，再看，实际上【思考推理】是为智能体作铺垫！

因为 AI 能够想人一样，具备对庞大复杂的代码进行阅读的操作本事了。如果没 deepseek 深度求索公司搞出【思考推理】，可能 2025 年，全球还是会和 2024 年一样寂静无声。

自动确认模式

智能体早期的痛点是，每个操作都需要用户去确认，因为如果不确认，AI 可能把你的文件给搞丢，出大事。

如果，直接撒手不管，让 AI 自己进行到底的话，这就是自动确认模式。也就是「你只需要看一次」英文的缩写，YOLO 模式。

这个是高风险事情。目前在致力于砸掉自己程序员饭碗的程序员工程师们，日积一日的努力下，现在几乎所有的智能体都开了这个默认 YOLO 模式。

其实这是个高风险事情，只不过还没发生大灾难。好处是彻底解放程序员了，也加剧了程序员行业的大裁员事件。坏处是，这依然很危险，且致命！但天天这样又加剧了我们对大模型的无知的信任，让我们更忽略这个事的存在。

不过不管怎么说，程序能跑就行.....

中国 AI 崛起

在 2025 年 1 月之前，中国的大模型，一直是一个类似于玩具的形象。

各种文心一言、盘古、千问，都肉眼可见与美国距离巨大。

直到 2024 年元旦节，deepseek R1 发布.... 一切略有改观。

在 2025 年上半年 deepseek 达到和国外一个水准，下半年 Qwen 又占据开源模型榜首，全球 IT 人都对这俩单词非常熟悉了。

截至 2025 年 12 月 30 日的人工智能分析开源权重模型排名

中国每个大城市、很多大厂都在研究各种模型（而且是开源哦），除了我们熟知的 deepseek qwen外，还有很多很多，上面榜单中，开源模型里，基本都是中国的了。

Kimi 的研究、MiniMax、GLM 的写代码能力，根本不输美利坚！

以前我们老说中国不开放，老外喜欢开源分享、强大才从容不造作.... 在 AI 上，中国恰恰是最开发的，反观美国只有 grok 是比较彻底开源的，其余的都是小部分开源。

中国的 AI 公司很多，而且几乎是 100% 开源，源源不断发布的论文，为全球 AI 发展添砖加瓦，除了那俩明星，还有质谱、月之暗面、minimax 等顶级 AI 公司，起码在敲代码上，不比 Claude 4 Sonnet 差。

额，于此相反的是扎克伯格的 llama （也开源）。曾经在 2024 年，llama 多么风光..... 2025 直接搞的直接没影子了。

虽然它也不算非常差，但貌似官方扎克伯格已经放弃维护了。

离线本地的效果更好了

以前，本地运行模型，都是很笨的效果，起码在 2024 年。

但 2025 年，一台普通的 MacBook air ，不到 10 个 GB 的文件，就能达到不输 2024 年全球鼎沸的 ChatGPT-4o 的效果。

尤其是中国模型，效果很赞。

这下多了很多奇思妙想的可行性！

图像

还记得前年的 chatGPT-4o 吗？那个 o 表示能自己对话时，根据提示直接生成图像。

不过 2024 年的图像，生成的还不算很好。

直到 2025 年 3 月，chatGPT 搞的 DALL-E ，那火爆全网的吉卜力工作室电影画面的风格，至此，图片质量大大提升。

好好好，中国也开始搞，在 8 月底开源了 Qwen-Image-Edit ，并在 12 月底发布了 Qwen-Image-2512 。这可牛坏了，能在普通电脑上生成不输世界先进 AI 水平的图片！

当然，最强大的还是谷歌，谷歌的 纳米香蕉 依然是顶级的图片生成引擎。Nano Banana ！

是 3 月份开始发布早期版本，8 月底正式命名 Nano Banana 。

何止图片，谷歌的 Gemini 的 Veo 3 视频生成也 6 的不行。

长任务（文科理科通通砸饭碗）

今年各大 AI 都在尝试，让 AI 去做一些很复杂的东西，得需要很久才能完成的东西。

就是做人类一整天才能做好的 PPT、研究报告..... 在此前，限于技术，都无法让 AI 长期集中注意力，而今年的 chatGPT 和 Claude，在这方面搞的非常好。起码 ChatGPT 5.2 都宣称自己已经战胜人类专家了！

vibe coding（氛围编程）

意思就是 AI 给你写底阿妈，完全沉浸于氛围感。几乎不去碰键盘，啥也不管，只说要求，运行.....

这个是 2025 年上半年提出的概念。

当然，这个概念还有很多个解释版本。2025 基本实现了。

先就这样吧，简单把 2025 年的重点都简单说了下。

标签: 转载文档 AI AI-Agent