官方OpenAI10 分钟前HOTTREND
OpenAI 发布 GPT-5 预览版,推理能力大幅提升OpenAI 今日正式发布 GPT-5 预览版,在数学推理、代码生成和多模态理解方面实现突破性进展。
为什么重要
GPT-5 将推理与 Agent 能力推上新台阶,是大模型从「对话」走向「自主执行」的关键节点。
- ›复杂推理任务准确率 +40%
- ›Agent 从实验走向生产
- ›API 早期访问窗口打开
情报指数98+92讨论热度 2.8k
影响领域推理能力AI 编程Agent
短内容 · 高频更新 · 第一时间掌握 AI 行业信号
OpenAI 今日正式发布 GPT-5 预览版,在数学推理、代码生成和多模态理解方面实现突破性进展。
为什么重要
GPT-5 将推理与 Agent 能力推上新台阶,是大模型从「对话」走向「自主执行」的关键节点。
Claude 4 Opus 支持 500K token 上下文,成为目前上下文最长的商业模型之一。
为什么重要
500K 上下文重新定义长文档与代码库场景的经济性,是 Agent 成本结构的重要变量。
DeepSeek 宣布 V3 模型完全开源,在多项基准测试中表现优异。
为什么重要
高性能开源模型冲击闭源定价体系,算力与推理成本讨论升温。
Midjourney V7 新增视频生成功能,支持 4 秒高质量 AI 视频创作。
Google 宣布 Gemini 2.5 Pro 向所有免费用户开放,支持深度思考模式。
Cursor 2.0 重构 Agent 架构,支持多文件并行编辑和自主调试。
为什么重要
Cursor 2.0 将 IDE 从「补全工具」升级为「自主编程 Agent」,是开发者工作流的分水岭。
马斯克旗下 xAI 宣布完成新一轮融资,资金将用于扩大算力与 Grok 模型迭代。
为什么重要
60 亿美元融资印证基础模型「算力军备竞赛」仍未降温,资本向头部集中。
AutoGen 新版本支持更灵活的多 Agent 协作与工作流可视化。