VOL.2026.06.23 · 21 STORIES · 屿鹿 AI 日报
屿鹿 AI 日报
二〇二六年六月二十三日 星期二DAILY · 每 15 分钟更新
📌 当日最值得做的 3 个选题
- 腾讯企业微信将推出“大圆”AI agent,目前已进入内测阶段 —— 第一时间申请内测,做「大圆」上手实测:对比钉钉/飞书AI,演示如何用企业微信AI agent自动处理客户咨询、生成营销文案,突出「一人公司用一个大圆顶半个团队」的降本增效。小红书图文+视频号口播。
- 火山引擎总裁谭待:字节内部已大规模落地AI Coding生产流程 —— 选题:豆包2.1Pro vs Claude写代码能力实测。拍摄真实编程任务(如写脚本、调试)对比视频,口播评述,强调「一人公司用国产模型提效降本」。落点:程序员或非技术者用AI写代码的可能。
- 豆包发布2.1 Pro模型 —— 实测豆包2.1 Pro的Agent功能,设计一个自动生成小红书图文+封面+文案的工作流,对比旧版或其他模型,口播演示或图文拆解,突出「一人顶团队」的提效效果
01
模型发布
MODEL RELEASES8 篇火山引擎总裁谭待:字节内部已大规模落地AI Coding生产流程
字节豆包2.1Pro在AI Coding评测中超越Anthropic,已内部大规模用于生产,包括芯片RTL开发。
推荐理由:豆包模型能力跃进,具实测引子,适合做对比测评,吸引老板、技术人关注提效。
🎯 给屿鹿的选题角度:选题:豆包2.1Pro vs Claude写代码能力实测。拍摄真实编程任务(如写脚本、调试)对比视频,口播评述,强调「一人公司用国产模型提效降本」。落点:程序员或非技术者用AI写代码的可能。
豆包发布2.1 Pro模型
火山引擎发布豆包2.1 Pro,Coding/Agent/VLM能力跃升
推荐理由:豆包2.1 Pro强化Agent能力,直接关联一人公司提效与AI工作流搭建
🎯 给屿鹿的选题角度:实测豆包2.1 Pro的Agent功能,设计一个自动生成小红书图文+封面+文案的工作流,对比旧版或其他模型,口播演示或图文拆解,突出「一人顶团队」的提效效果
OpenAI DayBreak – GPT-5.5-Cyber
OpenAI发布DayBreak项目推出GPT-5.5-Cyber,或为安全领域新模型。
推荐理由:若为新模型发布,对AI实操测评极为重要,可第一时间实测出圈。
🎯 给屿鹿的选题角度:选题:OpenAI新模型DayBreak测评。第一时间上手体验,演示功能,与之前模型对比,做小红书图文+视频号口播,强调对写内容、编程的提效。
Porting the Moebius 0.2B image inpainting model to run in the browser with Claude Code
Moebius 0.2B轻量图像修复模型已移植至浏览器,实现客户端AI修复。
推荐理由:小型模型浏览器运行,无需GPU,适合创作者快速修复图片,可做实测演示。
🎯 给屿鹿的选题角度:实录:用浏览器版Moebius一键移除照片杂物、修复老照片,对比PS操作,展现AI降本增效。适合小红书图文教程或视频号实操口播,强调“一人公司免费用AI修图”。
刚刚,豆包2.1发布!Agent自己跑18个小时搞定芯片设计代码
豆包2.1发布,Agent自主完成芯片设计代码,编程能力媲美Opus 4.7。
推荐理由:可与Codex做编程对比实测,为社群提供选型参考。
🎯 给屿鹿的选题角度:实测豆包2.1 vs Codex在自动化编程任务上的效率与质量,制作对比图文或短视频,给出“普通人选哪个更划算”的结论。
豆包发布2.1 Pro模型,中文综合能力再升级
豆包发布2.1 Pro模型,中文综合能力提升,支持128K上下文。
推荐理由:字节跳动的豆包新模型,适合做国内大模型实测对比选题。
🎯 给屿鹿的选题角度:快速实测豆包2.1 Pro:用它写文案、做选题、总结长文,对比Claude/GPT,拍成视频口播(突出哪项任务可替代人工),落点「选对模型省一半成本」。
GLM-5.2 OpenAI-Compatible API: A Hands-On Guide to Reasoning Effort, Function Calling, and Long-Context Retrieval
智谱GLM-5.2开放API,支持推理控制、函数调用与长上下文检索。
推荐理由:新模型API实测教程,直接命中Agent/工作流赛道,可做对比评测吸粉。
🎯 给屿鹿的选题角度:制作视频号口播,实测GLM-5.2的函数调用与推理模式,对比Claude/GPT在自动化工作流中的表现,突出降本增效。
Sakana AI Launches Sakana Fugu: An Orchestration Model That Routes Tasks Across a Swappable Pool of Frontier LLMs
Sakana AI发布Fugu和Fugu Ultra,可跨模型池路由任务,在编程、推理和智能体基准测试领先。
推荐理由:新型任务路由模型Fugu,可跨多个LLM分配任务,提升智能体效率。
🎯 给屿鹿的选题角度:实测Fugu路由不同LLM执行任务的效果,与单一模型对比,制作小红书图文教程,落点:用AI智能体提效一人公司工作流。
02
产品动态
PRODUCT UPDATES10 篇腾讯企业微信将推出“大圆”AI agent,目前已进入内测阶段
企业微信将推出AI agent“大圆”,已内测,未来可能切入客户经营场景。
推荐理由:企业微信推出AI agent,直接对标个人创作者和中小企业提效,可实测测评。
🎯 给屿鹿的选题角度:第一时间申请内测,做「大圆」上手实测:对比钉钉/飞书AI,演示如何用企业微信AI agent自动处理客户咨询、生成营销文案,突出「一人公司用一个大圆顶半个团队」的降本增效。小红书图文+视频号口播。
0.142.0
Codex 0.142.0 新增 /usage 用量管理、插件分类与推荐安装
推荐理由:直接提供插件管理和额度管理的新功能,可做成普通人能照着操作的教程
🎯 给屿鹿的选题角度:拍摄视频号口播:演示用 /plugins 整理插件、/usage 兑换额度,对比此功能与 Cursor 的插件管理差异,附带「社群作业:整理你的插件库」
xAI Launches /goal in Grok Build, Adding Long-Running Autonomous Execution With Built-In Verification for Multi-Step Coding Tasks
xAI为Grok推出/goal指令,支持自主执行多步骤编码任务并内置验证。
推荐理由:xAI的Agent新功能,可用于自动化内容工作流,契合创作者提效需求。
🎯 给屿鹿的选题角度:标题:《实测Grok新指令/goal:AI自主写代码+验证,一人公司开发提效》 形式:小红书图文/视频号口播,展示用/goal自动完成爬虫或报表任务,验证准确度,强调节省时间。
Namespace multi-agent v2 tools under collaboration (#29067)
Codex 多智能体 v2 工具统一使用 'collaboration' 命名空间,确保工具提示与实际接口一致。
推荐理由:Codex 多 Agent 协作机制更新,可关注其如何影响任务委派和工具触发。
🎯 给屿鹿的选题角度:实测新命名空间下多 Agent 协作稳定性,拍摄对比视频或撰写图文教程,展示用 'collaboration' 规划工作流,布置为社群实践作业。
火山引擎谭待:豆包还是会保持免费,专业版办公任务模式搭载2.1Pro模型
豆包保持免费,即将推出专业版办公任务模式,搭载2.1Pro模型。
推荐理由:豆包新模型可实测办公提效效果,契合“一人公司提效”选题。
🎯 给屿鹿的选题角度:实测豆包2.1Pro办公模式:用写报告、做表格等真实任务对比免费版,突出降本增效,适合小红书图文+视频号口播。
Show HN: Shumai – open-source Frame.io alternative for creative work
Shumai 开源替代 Frame.io,支持创意文件协作与 AI 代理反馈。
推荐理由:结合 AI 代理的创意协作工具,可探讨如何融入视频剪辑审阅流程。
🎯 给屿鹿的选题角度:演示 Shumai 配合 AI agent 进行视频反馈,对比 Frame.io,制作视频号口播《剪辑审稿新利器?AI 代理帮你自动收集反馈》,关联屿鹿的剪辑服务。
Gemini models increasingly stucking in thinking loop
实测显示 Gemini 3.5 Flash 在 100 次任务中 23 次陷入思考循环,3.1 Pro 也存在问题
推荐理由:实测揭露 Gemini 可靠性问题,适合做警示或对比内容,吸引关注 AI 工具实效的受众
🎯 给屿鹿的选题角度:视频号口播:实测Gemini 100次任务23次卡死,对比其他模型稳定性,提醒多模型备份
GitHub Copilot app support for BYOK
GitHub Copilot应用支持自带密钥,可连接OpenAI等自有模型。
推荐理由:Copilot支持BYOK能与Codex工作流对比,帮助用户选择模型。
🎯 给屿鹿的选题角度:实测Copilot BYOK vs Codex在不同模型下的编程效果,制作对比表格或短视频,指导社群成员做选择。
英伟达、vivo、红杉中国等公司联合加码B站AI创造公开赛
英伟达、智谱、vivo等联合加码B站AI创造公开赛,注入Tokens、技术及流量扶持。
推荐理由:比赛提供免费Tokens和技术支持,可为AI创作者提供练手和曝光机会。
🎯 给屿鹿的选题角度:做一期「如何利用B站AI公开赛免费资源打造爆款内容」教程,实测用英伟达RTX AI和智谱Tokens生成图文/视频,落地提效与涨粉。
Mitigating vendor lock-in with Sakana AI Fugu multi-agent models
Sakana AI推出Fugu多智能体模型,旨在减少企业对单一AI API的依赖风险。
推荐理由:多智能体是当前AI应用热点,可作为实测选题吸引技术创业者。
🎯 给屿鹿的选题角度:实测Fugu与单模型在内容生产流程中的效率对比,突出多智能体如何帮一人公司降本增效,适合小红书图文 or 视频号口播。
03
行业新闻
INDUSTRY NEWS1 篇可口可乐的世界杯TVC,居然是prompt生成的
可口可乐2026世界杯广告由AI用prompt生成,展现AI视频工具商业应用潜力。
推荐理由:品牌大厂用AI做广告,为创作者提供“AI替代传统拍摄”的强说服力案例。
🎯 给屿鹿的选题角度:视频选题:《可口可乐世界杯广告竟是用AI生成的?手把手教你用AI做商业TVC》。拆解广告使用的AI工具及prompt技巧,落点:一人公司零成本拍出专业广告,降本增效。
04
论文研究
RESEARCH1 篇VibeThinker: 3B param model that beats Opus 4.5 on reasoning with novel SFT+GRPO
VibeThinker: 3B模型用新训练方法在推理上击败Opus 4.5。
推荐理由:小模型击败大模型,适合演示低成本AI推理,契合一人公司提效。
🎯 给屿鹿的选题角度:制作短视频实测VibeThinker与Opus 4.5在逻辑题、商业分析等场景的表现,突出小模型省钱优势,引导观众思考如何用AI降本增效,结尾引导社群。
05
教程观点
TIPS & OPINIONS1 篇Unsloth GLM-5.2 – How to Run Locally
智谱GLM-5.2模型通过Unsloth本地部署教程,涵盖量化与性能优化。
推荐理由:新国产模型GLM-5.2可本地运行,实测教程贴合创作者低成本部署AI需求。
🎯 给屿鹿的选题角度:录制一期视频或图文,实测GLM-5.2通过Unsloth在本地运行的效果,对比云端API成本和性能,展示一人公司如何用本地模型提效降本。