我是AI门口的门童:测评了几十个模型后,我不再追着“风口”跑了

lin james
2025-05-30
Share :

5月的最后一个工作日,我像往常一样坐在工位上,思考着文章的选题,满脑子思绪——不是灵感,是焦虑。

说来有点尴尬,我是一个整天写AI工具评测、分享AI资讯、教别人怎么用AI的“AI行业从业者”,但最近,我却越来越不敢打开AI相关的新闻和社群。

看到Claude 3.7出来,我点了进去,看了几句,就关了。DeepSeek R1发布,我也看了,但没有一点点“哇”的感觉。就连GPT-4.1震撼亮相,我在第一时间上手后,也只觉得“嗯,很强,但好像也就这样吧”。

我突然开始害怕:是不是我对AI没热情了?是不是我“落伍”了?


所有人都在冲,但我越来越茫然

我在XXAI工作,每天都在测试各种大模型,写AI使用教程,记录它们的优势、短板、适用场景。过去一年里,我几乎测评了市面上所有主流AI模型:OpenAI的GPT系列、Anthropic的Claude、谷歌的Gemini、Meta的Llama、百度文心一言、阿里通义千问、百川、智谱AI、DeepSeek……从参数、推理能力到代码输出能力,我都一一拆解。

但到了最近,我有种奇怪的疲惫感。

——明明模型越来越强,为什么我却越来越提不起兴趣?

——为什么我写的AI文章流量越来越低,互动也不如以前?

——是不是大家其实也“疲倦”了?


模型越来越强,但我们不是benchmark

我反复想这些问题,直到有一天,我刷到一个普通用户的留言:

“其实我就想找个能写文案的工具,不用太强,能帮我省点时间就好。”

那一瞬间,我有点发愣。

我回头看我写过的几十篇AI工具评测,很多都在强调“逻辑能力大幅提升”、“准确率超过GPT-4”、“代码生成逼近人类专家”……但对于一个只想写写公众号、剪点视频、生成点灵感的普通人来说,这些提升到底意味着什么?

也许,AI的能力确实在增长,但我们作为用户,并不是为了跑分和参数而活。

很多时候,普通人用AI的目标很简单:写文案、翻译资料、总结文档、找灵感……模型不需要最强,只要“用起来顺手”就够了。


我们不是每个人都要当“AI专家”

过去的我,很怕被时代抛下。每当看到有人写出10倍爆文、剪出100万播放的AI短视频、用AI训练数据模型做创业,我就开始焦虑:我是不是也应该再“卷一点”?是不是也该去学个多模态训练?是不是不该再写这些“基础”的AI教程了?

但现在我想明白了:

每个人在AI浪潮中扮演的角色不同。

有人冲在最前线写论文、搭模型、做大项目;有人是早期布道者,带大家入门;而我,或许只是那个AI世界门口的“门童”——但没关系,这个角色也重要。


我选择关注真正的用户需求

加入XXAI后,我看过太多用户的真实使用场景。他们不关心模型背后的Transformer架构,也不在意推理速度的TPS是多少。他们只想知道:

  • 哪个模型写脚本靠谱?
  • 中文写作 Claude 好,还是 GPT 好?
  • 哪个AI翻译准确还不死板?
  • 有没有免费的AI写PPT工具推荐?

这才是真正的AI落地问题,也是我们更该关注的焦点。

如果我们把所有注意力都放在“谁参数大”、“谁跑分高”上,那和手机圈天天喊“跑分60万”的内卷其实没什么区别。


别再焦虑了,我们正在见证历史

AI焦虑是真实存在的。

我知道不仅是我,还有很多普通人也一样会想:

“我会不会被AI取代?”

“是不是再不学AI就晚了?”

“别人的AI副业都月入破万了,我怎么还不会用?”

这些情绪我全都经历过。但现在,我更愿意把它们转化为一种​好奇心​——AI真的能怎么帮到我?我能不能用它做出一点属于自己的东西?

我们不用成为“最懂AI”的人,但我们可以成为那个用好AI的人。


写在最后:我仍然好奇,也愿意慢一点

我依旧会测评AI模型,也会继续分享使用技巧、生产力干货、真实体验感受。但我不再强迫自己追着“最新发布”写文章,也不再觉得“要是不会用AutoGen我就完蛋了”。

我开始接纳一个更慢、更温和的自己。

我是AI殿堂门口的门童,也愿意继续站在门口,向你招手说:你来了就好。