凌晨1点,OpenAI的直播一如既往地姗姗来迟。整个AI圈屏住呼吸,期待了两年半的GPT-5终于亮相。
从GPT-4发布到现在,时间不过30个月,AI世界却像被按下了“快进键”。你还记得GPT-4带来的那种“天变了”的震撼吗?我们那时以为那就是巅峰,谁料这只是个开始。
OpenAI这次带来的,不只是一个模型,而是一个统一智能系统,由多个模型组合而成,包括:
这个系统通过实时路由动态选择最合适的模型,应对你在聊天、编程、写作中的不同需求。
GPT-5 在多个维度上实现突破:

再看看跑分,GPT-5 几乎全线领先:数学、视觉推理、人类知识测试、多模态理解……全都第一。但槽点也不是没有,比如发布会上图表错误频出,活脱脱又是一次 OpenAI 的“草台班子”操作。
说实话,GPT-5在写作这块,让我有些失望。
为了测试它在大众写作、社交语境中的表现,我给了它一个非常生活化、全球用户都能共情的Prompt:
“你是一个普通人,刚刚去了一家网红餐厅,结果不仅价格贵得离谱,食物难吃、服务态度还很差。请你写一段社交媒体吐槽文案(比如X/Twitter、朋友圈、Instagram),控制在300字以内,尽可能犀利、有梗。”
GPT-5给出的内容,非常“规整”——语法没毛病,用词也挑不出错,但就是像一篇写给AI看的投诉信。毫无怒气、也没有槽点和真实的愤怒。
我又用GPT-4.5跑了一次,同样的Prompt——那种带梗的讽刺、咬牙切齿的无奈,配上带点阴阳怪气的语气,直接让我笑出声。你能感觉它是在模仿一个人,而不是在展示算法能力。
这就体现出一个核心问题:GPT-5写作“太理性”了,它擅长清晰准确表达,却难以传递人类情绪的粗粝感和多样性。
很多人可能会问,现在GPT-5官网要排队,那我能不能马上用上?
答案是:可以。
XXAI 已经第一时间集成了GPT-5模型,并支持包括 GPT-4o、Claude、Gemini、Grok等主流AI模型的一键切换。
你可以:
多模型灵活切换,价格亲民(\$9.9/月起),非常适合普通用户和开发者使用。
我现在自己也在用 XXAI 来跑大部分测试任务,体验比在官网还舒服——不用抢号,还能随时切换到最适合当前任务的模型,真的推荐你试试。
原本我对 GPT-5 的编程能力并不抱太大期望,毕竟 OpenAI 一直被吐槽“写文案厉害,写代码拉垮”。结果这次的实测,真有点惊到我了。
我有位朋友测试了一个非常生活化的任务:
“做一个旅行预算计算器,输入目的地、天数、住宿预算和每日花销预算,自动计算总预算并输出建议。”
他把同样的 Prompt 分别丢给了 Claude 4、Gemini 2.5 Pro 和 GPT-5。
· Claude 提供了大体结构,但逻辑不完整,代码报错。
· Gemini 前端界面好看,但部分功能点没实现,比如货币单位处理不当。
· GPT-5 给出的方案结构清晰,前端输入栏、计算逻辑和输出建议都非常完整,甚至还自动做了简单的表单校验。
更重要的是,GPT-5能记住上下文意图,在我要求“加入根据地区自动建议每日预算”的功能时,它准确理解并补充了相应模块。
在这个过程中,你能明显感觉到它理解需求的能力更强,代码生成也更接近真实产品需求。不像其他模型经常“写得像,但不能用”。
GPT-4 给我们的,是那种“第一次看到电灯”的震撼,是淘金热时代的狂欢。而 GPT-5 则是工业化的成熟:没有那么惊艳,但更稳、更强、节能、可控。
但我依然会怀念那个可以笑着容忍 AI 拙劣表现的时代。
现在,我们已经进入了一个必须严肃对待 AI 的新时代——它不再只是工具,它已经是合作伙伴。