屿鹿 AI 日报 · 2026-06-23

📌 当日最值得做的 3 个选题

腾讯企业微信将推出“大圆”AI agent，目前已进入内测阶段 —— 第一时间申请内测，做「大圆」上手实测：对比钉钉/飞书AI，演示如何用企业微信AI agent自动处理客户咨询、生成营销文案，突出「一人公司用一个大圆顶半个团队」的降本增效。小红书图文+视频号口播。
火山引擎总裁谭待：字节内部已大规模落地AI Coding生产流程 —— 选题：豆包2.1Pro vs Claude写代码能力实测。拍摄真实编程任务（如写脚本、调试）对比视频，口播评述，强调「一人公司用国产模型提效降本」。落点：程序员或非技术者用AI写代码的可能。
豆包发布2.1 Pro模型 —— 实测豆包2.1 Pro的Agent功能，设计一个自动生成小红书图文+封面+文案的工作流，对比旧版或其他模型，口播演示或图文拆解，突出「一人顶团队」的提效效果

模型发布

MODEL RELEASES8 篇

14:1336氪精选 · 90

火山引擎总裁谭待：字节内部已大规模落地AI Coding生产流程

字节豆包2.1Pro在AI Coding评测中超越Anthropic，已内部大规模用于生产，包括芯片RTL开发。

豆包2.1ProAI Codin大模型评测生产级AI

推荐理由：豆包模型能力跃进，具实测引子，适合做对比测评，吸引老板、技术人关注提效。

🎯 给屿鹿的选题角度：选题：豆包2.1Pro vs Claude写代码能力实测。拍摄真实编程任务（如写脚本、调试）对比视频，口播评述，强调「一人公司用国产模型提效降本」。落点：程序员或非技术者用AI写代码的可能。

12:5736氪精选 · 90

豆包发布2.1 Pro模型

火山引擎发布豆包2.1 Pro，Coding/Agent/VLM能力跃升

豆包大模型Agent火山引擎

推荐理由：豆包2.1 Pro强化Agent能力，直接关联一人公司提效与AI工作流搭建

🎯 给屿鹿的选题角度：实测豆包2.1 Pro的Agent功能，设计一个自动生成小红书图文+封面+文案的工作流，对比旧版或其他模型，口播演示或图文拆解，突出「一人顶团队」的提效效果

09:36Hacker News精选 · 90

OpenAI DayBreak – GPT-5.5-Cyber

OpenAI发布DayBreak项目推出GPT-5.5-Cyber，或为安全领域新模型。

OpenAIGPT-5.5DayBreak

推荐理由：若为新模型发布，对AI实操测评极为重要，可第一时间实测出圈。

🎯 给屿鹿的选题角度：选题：OpenAI新模型DayBreak测评。第一时间上手体验，演示功能，与之前模型对比，做小红书图文+视频号口播，强调对写内容、编程的提效。

07:43Simon Willison精选 · 90

Porting the Moebius 0.2B image inpainting model to run in the browser with Claude Code

Moebius 0.2B轻量图像修复模型已移植至浏览器，实现客户端AI修复。

AI生图图像修复浏览器轻量模型

推荐理由：小型模型浏览器运行，无需GPU，适合创作者快速修复图片，可做实测演示。

🎯 给屿鹿的选题角度：实录：用浏览器版Moebius一键移除照片杂物、修复老照片，对比PS操作，展现AI降本增效。适合小红书图文教程或视频号实操口播，强调“一人公司免费用AI修图”。

21:37量子位精选 · 80

刚刚，豆包2.1发布！Agent自己跑18个小时搞定芯片设计代码

豆包2.1发布，Agent自主完成芯片设计代码，编程能力媲美Opus 4.7。

豆包AI编程Agent竞品对比

推荐理由：可与Codex做编程对比实测，为社群提供选型参考。

🎯 给屿鹿的选题角度：实测豆包2.1 vs Codex在自动化编程任务上的效率与质量，制作对比图文或短视频，给出“普通人选哪个更划算”的结论。

16:5936氪精选 · 80

豆包发布2.1 Pro模型，中文综合能力再升级

豆包发布2.1 Pro模型，中文综合能力提升，支持128K上下文。

豆包大模型2.1 Pro发布

推荐理由：字节跳动的豆包新模型，适合做国内大模型实测对比选题。

🎯 给屿鹿的选题角度：快速实测豆包2.1 Pro：用它写文案、做选题、总结长文，对比Claude/GPT，拍成视频口播（突出哪项任务可替代人工），落点「选对模型省一半成本」。

14:35MarkTechPost精选 · 80

GLM-5.2 OpenAI-Compatible API: A Hands-On Guide to Reasoning Effort, Function Calling, and Long-Context Retrieval

智谱GLM-5.2开放API，支持推理控制、函数调用与长上下文检索。

GLM-5.2函数调用推理控制Agent

推荐理由：新模型API实测教程，直接命中Agent/工作流赛道，可做对比评测吸粉。

🎯 给屿鹿的选题角度：制作视频号口播，实测GLM-5.2的函数调用与推理模式，对比Claude/GPT在自动化工作流中的表现，突出降本增效。

02:42MarkTechPost精选 · 80

Sakana AI Launches Sakana Fugu: An Orchestration Model That Routes Tasks Across a Swappable Pool of Frontier LLMs

Sakana AI发布Fugu和Fugu Ultra，可跨模型池路由任务，在编程、推理和智能体基准测试领先。

AI智能体模型发布任务路由Sakana A

推荐理由：新型任务路由模型Fugu，可跨多个LLM分配任务，提升智能体效率。

🎯 给屿鹿的选题角度：实测Fugu路由不同LLM执行任务的效果，与单一模型对比，制作小红书图文教程，落点：用AI智能体提效一人公司工作流。

产品动态

PRODUCT UPDATES10 篇

17:4336氪精选 · 100

腾讯企业微信将推出“大圆”AI agent，目前已进入内测阶段

企业微信将推出AI agent“大圆”，已内测，未来可能切入客户经营场景。

企业微信AI Agent大圆内测

推荐理由：企业微信推出AI agent，直接对标个人创作者和中小企业提效，可实测测评。

🎯 给屿鹿的选题角度：第一时间申请内测，做「大圆」上手实测：对比钉钉/飞书AI，演示如何用企业微信AI agent自动处理客户咨询、生成营销文案，突出「一人公司用一个大圆顶半个团队」的降本增效。小红书图文+视频号口播。

06:21OpenAI Codex Releases精选 · 90

0.142.0

Codex 0.142.0 新增 /usage 用量管理、插件分类与推荐安装

Codex插件工作流用量管理

推荐理由：直接提供插件管理和额度管理的新功能，可做成普通人能照着操作的教程

🎯 给屿鹿的选题角度：拍摄视频号口播：演示用 /plugins 整理插件、/usage 兑换额度，对比此功能与 Cursor 的插件管理差异，附带「社群作业：整理你的插件库」

04:34MarkTechPost精选 · 90

xAI Launches /goal in Grok Build, Adding Long-Running Autonomous Execution With Built-In Verification for Multi-Step Coding Tasks

xAI为Grok推出/goal指令，支持自主执行多步骤编码任务并内置验证。

GrokAI Agent自主任务执行xAI

推荐理由：xAI的Agent新功能，可用于自动化内容工作流，契合创作者提效需求。

🎯 给屿鹿的选题角度：标题：《实测Grok新指令/goal：AI自主写代码+验证，一人公司开发提效》形式：小红书图文/视频号口播，展示用/goal自动完成爬虫或报表任务，验证准确度，强调节省时间。

20:15OpenAI Codex Commits精选 · 80

Namespace multi-agent v2 tools under collaboration (#29067)

Codex 多智能体 v2 工具统一使用 'collaboration' 命名空间，确保工具提示与实际接口一致。

Codex多Agent工作流命名空间

推荐理由：Codex 多 Agent 协作机制更新，可关注其如何影响任务委派和工具触发。

🎯 给屿鹿的选题角度：实测新命名空间下多 Agent 协作稳定性，拍摄对比视频或撰写图文教程，展示用 'collaboration' 规划工作流，布置为社群实践作业。

16:2836氪精选 · 80

火山引擎谭待：豆包还是会保持免费，专业版办公任务模式搭载2.1Pro模型

豆包保持免费，即将推出专业版办公任务模式，搭载2.1Pro模型。

豆包大模型办公提效

推荐理由：豆包新模型可实测办公提效效果，契合“一人公司提效”选题。

🎯 给屿鹿的选题角度：实测豆包2.1Pro办公模式：用写报告、做表格等真实任务对比免费版，突出降本增效，适合小红书图文+视频号口播。

18:02Hacker News精选 · 70

Show HN: Shumai – open-source Frame.io alternative for creative work

Shumai 开源替代 Frame.io，支持创意文件协作与 AI 代理反馈。

开源协作平台AI代理创意工作

推荐理由：结合 AI 代理的创意协作工具，可探讨如何融入视频剪辑审阅流程。

🎯 给屿鹿的选题角度：演示 Shumai 配合 AI agent 进行视频反馈，对比 Frame.io，制作视频号口播《剪辑审稿新利器？AI 代理帮你自动收集反馈》，关联屿鹿的剪辑服务。

17:00Hacker News精选 · 70

Gemini models increasingly stucking in thinking loop

实测显示 Gemini 3.5 Flash 在 100 次任务中 23 次陷入思考循环，3.1 Pro 也存在问题

Gemini思考循环模型实测翻车

推荐理由：实测揭露 Gemini 可靠性问题，适合做警示或对比内容，吸引关注 AI 工具实效的受众

🎯 给屿鹿的选题角度：视频号口播：实测Gemini 100次任务23次卡死，对比其他模型稳定性，提醒多模型备份

16:00GitHub Changelog精选 · 70

GitHub Copilot app support for BYOK

GitHub Copilot应用支持自带密钥，可连接OpenAI等自有模型。

GitHub CBYOK

推荐理由：Copilot支持BYOK能与Codex工作流对比，帮助用户选择模型。

🎯 给屿鹿的选题角度：实测Copilot BYOK vs Codex在不同模型下的编程效果，制作对比表格或短视频，指导社群成员做选择。

12:2736氪精选 · 70

英伟达、vivo、红杉中国等公司联合加码B站AI创造公开赛

英伟达、智谱、vivo等联合加码B站AI创造公开赛，注入Tokens、技术及流量扶持。

AI创造赛英伟达智谱B站

推荐理由：比赛提供免费Tokens和技术支持，可为AI创作者提供练手和曝光机会。

🎯 给屿鹿的选题角度：做一期「如何利用B站AI公开赛免费资源打造爆款内容」教程，实测用英伟达RTX AI和智谱Tokens生成图文/视频，落地提效与涨粉。

00:11AI News精选 · 70

Mitigating vendor lock-in with Sakana AI Fugu multi-agent models

Sakana AI推出Fugu多智能体模型，旨在减少企业对单一AI API的依赖风险。

多智能体企业AI去中心化Agent

推荐理由：多智能体是当前AI应用热点，可作为实测选题吸引技术创业者。

🎯 给屿鹿的选题角度：实测Fugu与单模型在内容生产流程中的效率对比，突出多智能体如何帮一人公司降本增效，适合小红书图文 or 视频号口播。

行业新闻

INDUSTRY NEWS1 篇

14:10量子位精选 · 80

可口可乐的世界杯TVC，居然是prompt生成的

可口可乐2026世界杯广告由AI用prompt生成，展现AI视频工具商业应用潜力。

AI生视频可口可乐广告prompt

推荐理由：品牌大厂用AI做广告，为创作者提供“AI替代传统拍摄”的强说服力案例。

🎯 给屿鹿的选题角度：视频选题：《可口可乐世界杯广告竟是用AI生成的？手把手教你用AI做商业TVC》。拆解广告使用的AI工具及prompt技巧，落点：一人公司零成本拍出专业广告，降本增效。

论文研究

RESEARCH1 篇

10:01Hacker News精选 · 90

VibeThinker: 3B param model that beats Opus 4.5 on reasoning with novel SFT+GRPO

VibeThinker: 3B模型用新训练方法在推理上击败Opus 4.5。

小模型推理能力模型训练降本增效

推荐理由：小模型击败大模型，适合演示低成本AI推理，契合一人公司提效。

🎯 给屿鹿的选题角度：制作短视频实测VibeThinker与Opus 4.5在逻辑题、商业分析等场景的表现，突出小模型省钱优势，引导观众思考如何用AI降本增效，结尾引导社群。

教程观点

TIPS & OPINIONS1 篇

05:21Hacker News精选 · 80

Unsloth GLM-5.2 – How to Run Locally

智谱GLM-5.2模型通过Unsloth本地部署教程，涵盖量化与性能优化。

智谱GLM-5.本地部署Unsloth模型优化

推荐理由：新国产模型GLM-5.2可本地运行，实测教程贴合创作者低成本部署AI需求。

🎯 给屿鹿的选题角度：录制一期视频或图文，实测GLM-5.2通过Unsloth在本地运行的效果，对比云端API成本和性能，展示一人公司如何用本地模型提效降本。