屿鹿 AI 情报站 · 全部动态

全部模型发布产品动态行业新闻论文研究教程观点融资商业

2026-07-02

19:28量子位精选 · 50

让Agent越用越强：AReaL 2.0开源，打造面向自演进智能体的RL基础设施

AReaL 2.0 开源，面向自演进 Agent 的 RL 基础设施

Agent强化学习开源

2026-07-01

18:03The Decoder：AI News精选 · 80

OpenAI论文揭示GPT-5.6三个Pro变体，打破单一顶级策略

OpenAI论文披露GPT-5.6三Pro变体，Sol Pro在基因组学基准中领先。

GPT-5.6Pro变体OpenAI

推荐理由：GPT-5.6 Pro变体细节曝光，可供社群讨论模型选择与Pro版本价值。

🎯 给屿鹿的选题角度：GPT-5.6 Pro变体值得买吗？普通用户需要Pro吗？对比标准版与Pro版差距，做社群讨论帖。

16:10MarkTechPost精选 · 30

NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型

NVIDIA发布开放权重扩散语言模型Nemotron-Labs-TwoTower，提升生成吞吐量。

NVIDIA扩散语言模型开源模型

11:46量子位精选 · 30

Om AI联汇发布VLX：全球首个面向物理世界的端侧流式多模态模型

Om AI联汇发布VLX，全球首个面向物理世界的端侧流式多模态模型。

端侧模型多模态物理世界AI

10:24公众号：龙猫LongCat精选 · 60

美团 LongCat-2.0 正式发布：国产算力集群训练的万亿参数大模型

美团开源1.6T参数大模型LongCat-2.0，支持1M上下文，编程评测领先。

美团LongCat-开源模型编程

推荐理由：国产大模型挑战编程评测，可与GPT/Codex做对比，吸引关注编程提效的受众。

🎯 给屿鹿的选题角度：实测LongCat-2.0编程能力：能否替代Codex？适合哪些编程任务？做对比短视频。

04:44Hacker News精选 · 40

Leanstral 1.5

Mistral 发布轻量模型 Leanstral 1.5

Mistral轻量模型对比

推荐理由：可能用于本地提效，但非核心竞品对比

🎯 给屿鹿的选题角度：若性能突出，可做「Leanstral vs ChatGPT 在简单任务上的表现」对比贴，但优先度低

04:09Hacker News精选 · 80

Claude Sonnet 5 – benchmark results

Anthropic 发布 Claude Sonnet 5 基准测试结果，多项指标超越 GPT-4o

Claude S基准测试模型对比

推荐理由：Claude Sonnet 5 基准出炉，可与 GPT-4o 直接对比，为普通用户提供选型依据

🎯 给屿鹿的选题角度：制作「Claude Sonnet 5 vs GPT-4o」实测对比，聚焦日常写作、代码、数据分析，提炼「谁更适合普通人」的结论，适合小红书图文或视频号口播

01:59Hacker News精选 · 70

Claude Sonnet 5

Anthropic 发布 Claude Sonnet 5，可能在编程和推理上超越前代，引发社区讨论。

Claude S竞品对比编程能力

推荐理由：可对比 Codex/ChatGPT，为受众提供选型参考和迁移评估。

🎯 给屿鹿的选题角度：做一期“Claude Sonnet 5 vs Codex”实操对比，聚焦日常编程任务，做成小红书图文或视频口播，帮助技术小白决策。

2026-06-30

08:30Hacker News精选 · 50

LongCat-2.0, a large-scale MoE model with 1.6T total and 48B Active

LongCat-2.0发布：总参数1.6T、活跃48B的MoE模型，主打长上下文。

LongCatMoE大模型

01:16Hacker News精选 · 80

Ornith-1.0: self-improving open-source models for agentic coding

Ornith-1.0：面向自主编程的开源自改进模型发布。

AI编程Agent开源模型

推荐理由：开源自主编程模型，可直接对比Codex任务委派与修Bug能力。

🎯 给屿鹿的选题角度：实测Ornith-1.0 vs Codex：布置相同编码任务，对比成功率、代码质量与易用性；小红书图文展示差异，社群布置作业。

00:17Simon Willison精选 · 80

Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding

开源模型 Ornith-1.0 发布，基于 Gemma 和 Qwen，专为代理编码设计，有 9B 到 397B 多种规模。

Ornith-1代理编码开源模型AI编程

推荐理由：首个专注自我脚手架代理编码的开源模型，可与 Codex 等对比，适合做成实测选题。

🎯 给屿鹿的选题角度：实测 Ornith-1.0 在简单编程任务上的表现，对比 Codex/Claude Code，突出各自优劣；做成小红书图文或视频号教程，教社群成员部署试用。

2026-06-29

05:42The Verge AI精选 · 40

China’s Z.ai claims it can match Mythos on cybersecurity

智谱AI发布开源GLM-5.2，在网络安全漏洞发现上号称媲美Mythos。

GLM-5.2网络安全开源模型

2026-06-27

20:19量子位精选 · 30

CVPR 2026最热方向，被一家杭州团队率先跑进了端侧！

杭州团队发布全球首个端侧流式多模态模型，落地CVPR 2026热门方向。

端侧模型多模态CVPR

09:53量子位精选 · 80

GPT-5.6突然发布！Fable5痛失最强基模王座

第三方基准测试出现GPT-5.6模型，性能超越Fable5等对手，可能为OpenAI新模型。

GPT-5.6基准测试OpenAI

推荐理由：OpenAI新模型动向，可做性能对比和实操选题。

🎯 给屿鹿的选题角度：实测GPT-5.6在文案、翻译、编程等任务中的表现，与GPT-4o对比，分析是否值得升级，适合小红书图文。

04:32OpenAI Codex Commits精选 · 90

feat: add GPT-5.6 variants to Bedrock catalog (#30285)

OpenAI Codex 仓库提交显示添加 GPT-5.6 系列模型（Sol/Terra/Luna）至 Amazon Bedrock

GPT-5.6OpenAI模型发布Amazon B

推荐理由：透露 OpenAI 即将推出 GPT-5.6 新模型，可能带来能力与价格变化，值得跟踪

🎯 给屿鹿的选题角度：做“GPT-5.6 前瞻：新模型可能带来哪些能力升级？对普通人意味着什么？” 追踪后续进展，对比现有模型，在社群或小红书出预测与解读

01:10Simon Willison精选 · 100

Quoting OpenAI

OpenAI 预览 GPT-5.6 系列，包括旗舰 Sol、均衡 Terra 和低成本 Luna，性能更强且更便宜。

GPT-5.6OpenAI 更模型预览价格对比

推荐理由：GPT-5.6 系列发布，包含旗舰和性价比模型，创作者可立即对比实测，判断对提效的价值。

🎯 给屿鹿的选题角度：实测 GPT-5.6 Sol/Terra/Luna 对比 GPT-5.5 和旧版，做差异评测，适合“普通人是否值得升级”的选题，可出小红书图文或社群教程。

01:06Hacker News精选 · 90

Previewing GPT‑5.6 Sol: a next-generation model

OpenAI 官方预览下一代模型 GPT-5.6 Sol，性能与新功能或大幅提升。

GPT模型OpenAI新模型发布

推荐理由：重大模型更新，适合做实测对比、社群教程，吸引目标受众关注。

🎯 给屿鹿的选题角度：制作“GPT-5.6 Sol 实测”对比图文/视频，展示新能力与旧版差异，设计社群作业让成员体验，突出对普通人的提效价值。

01:01The Verge AI精选 · 100

OpenAI unveils GPT-5.6 amid US AI regulatory drama

OpenAI 在监管压力下发布 GPT-5.6 系列 Sol、Terra、Luna，延续模型迭代节奏。

GPT-5.6 OpenAI监管Sol/Terr

推荐理由：监管背景提供话题性，可结合发布做“合规压力下的模型发布”角度，但核心仍是新模型。

🎯 给屿鹿的选题角度：做“监管压力下 OpenAI 仓促发布 GPT-5.6？实测对比是否值得用”的选题，突出监管故事和新模型能力，适合视频号口播。

2026-06-26

18:00OpenAI精选 · 100

Previewing GPT-5.6 Sol: a next-generation model

OpenAI 正式预览 GPT-5.6 Sol，强化编码、科学和网络安全能力，并配备最强安全措施。

GPT-5.6Sol 模型编码能力安全

推荐理由：官方详细说明 GPT-5.6 编码能力，屿鹿可直接据此制作 Codex 相关课程，探讨新模型对自动编程的提升。

🎯 给屿鹿的选题角度：结合官方演示，实测 GPT-5.6 Sol 在 Codex 任务中的表现，与 GPT-5 对比，给出“升级是否提升编程体验”的结论，适合社群直播或视频。

14:55量子位精选 · 40

Claude Fable 5分批重新上线！GPT-5.6秒跟

消息称Claude Fable 5分批重新上线，暗示GPT-5、6将快速跟进，真实性存疑。

ClaudeGPT模型竞争

04:28OpenAI Codex Releases精选 · 70

rust-v0.143.0-alpha.23

OpenAI Codex 发布 Rust 版 v0.143.0-alpha.23。

CodexRustAlpha 发布

推荐理由：Codex 新版本，可关注 Rust 语言支持对开发者的意义。

🎯 给屿鹿的选题角度：可以做一篇「Codex 支持 Rust 了，对普通用户意味着什么？」的解读，说明 Codex 是什么、Rust 版可能带来的新能力，适合图文或口播。

2026-06-25

00:30DeepMind精选 · 80

Introducing computer use in Gemini 3.5 Flash

Gemini 3.5 Flash新增computer use功能，可操控桌面应用。

GeminiComputer多模态自动化

推荐理由：可与OpenAI的Codex或Operator对比，适合做实测教程。

🎯 给屿鹿的选题角度：选题：Gemini 3.5 Flash computer use vs Codex CLI/Operator：普通人用哪个自动化电脑操作？可做小红书图文或视频号实测对比，社群可布置作业尝试。

2026-06-24

11:31Hacker News精选 · 50

Sakana Fugu: a multi-agent system delivered as one model

Sakana AI 发布 Fugu 多 Agent 系统，将多个代理合并为一个端到端模型。

多Agent系统模型发布Sakana A

01:50Hacker News精选 · 30

FUTO Swipe – A new swipe typing model

FUTO 推出新的滑动输入 AI 模型。

滑动输入AI 模型FUTO

2026-06-23

21:37量子位精选 · 80

刚刚，豆包2.1发布！Agent自己跑18个小时搞定芯片设计代码

豆包2.1发布，Agent自主完成芯片设计代码，编程能力媲美Opus 4.7。

豆包AI编程Agent竞品对比

推荐理由：可与Codex做编程对比实测，为社群提供选型参考。

🎯 给屿鹿的选题角度：实测豆包2.1 vs Codex在自动化编程任务上的效率与质量，制作对比图文或短视频，给出“普通人选哪个更划算”的结论。

16:5936氪精选 · 80

豆包发布2.1 Pro模型，中文综合能力再升级

豆包发布2.1 Pro模型，中文综合能力提升，支持128K上下文。

豆包大模型2.1 Pro发布

推荐理由：字节跳动的豆包新模型，适合做国内大模型实测对比选题。

🎯 给屿鹿的选题角度：快速实测豆包2.1 Pro：用它写文案、做选题、总结长文，对比Claude/GPT，拍成视频口播（突出哪项任务可替代人工），落点「选对模型省一半成本」。

14:35MarkTechPost精选 · 80

GLM-5.2 OpenAI-Compatible API: A Hands-On Guide to Reasoning Effort, Function Calling, and Long-Context Retrieval

智谱GLM-5.2开放API，支持推理控制、函数调用与长上下文检索。

GLM-5.2函数调用推理控制Agent

推荐理由：新模型API实测教程，直接命中Agent/工作流赛道，可做对比评测吸粉。

🎯 给屿鹿的选题角度：制作视频号口播，实测GLM-5.2的函数调用与推理模式，对比Claude/GPT在自动化工作流中的表现，突出降本增效。

14:1336氪精选 · 90

火山引擎总裁谭待：字节内部已大规模落地AI Coding生产流程

字节豆包2.1Pro在AI Coding评测中超越Anthropic，已内部大规模用于生产，包括芯片RTL开发。

豆包2.1ProAI Codin大模型评测生产级AI

推荐理由：豆包模型能力跃进，具实测引子，适合做对比测评，吸引老板、技术人关注提效。

🎯 给屿鹿的选题角度：选题：豆包2.1Pro vs Claude写代码能力实测。拍摄真实编程任务（如写脚本、调试）对比视频，口播评述，强调「一人公司用国产模型提效降本」。落点：程序员或非技术者用AI写代码的可能。

12:5736氪精选 · 90

豆包发布2.1 Pro模型

火山引擎发布豆包2.1 Pro，Coding/Agent/VLM能力跃升

豆包大模型Agent火山引擎

推荐理由：豆包2.1 Pro强化Agent能力，直接关联一人公司提效与AI工作流搭建

🎯 给屿鹿的选题角度：实测豆包2.1 Pro的Agent功能，设计一个自动生成小红书图文+封面+文案的工作流，对比旧版或其他模型，口播演示或图文拆解，突出「一人顶团队」的提效效果

09:36Hacker News精选 · 90

OpenAI DayBreak – GPT-5.5-Cyber

OpenAI发布DayBreak项目推出GPT-5.5-Cyber，或为安全领域新模型。

OpenAIGPT-5.5DayBreak

推荐理由：若为新模型发布，对AI实操测评极为重要，可第一时间实测出圈。

🎯 给屿鹿的选题角度：选题：OpenAI新模型DayBreak测评。第一时间上手体验，演示功能，与之前模型对比，做小红书图文+视频号口播，强调对写内容、编程的提效。

07:43Simon Willison精选 · 90

Porting the Moebius 0.2B image inpainting model to run in the browser with Claude Code

Moebius 0.2B轻量图像修复模型已移植至浏览器，实现客户端AI修复。

AI生图图像修复浏览器轻量模型

推荐理由：小型模型浏览器运行，无需GPU，适合创作者快速修复图片，可做实测演示。

🎯 给屿鹿的选题角度：实录：用浏览器版Moebius一键移除照片杂物、修复老照片，对比PS操作，展现AI降本增效。适合小红书图文教程或视频号实操口播，强调“一人公司免费用AI修图”。

02:42MarkTechPost精选 · 80

Sakana AI Launches Sakana Fugu: An Orchestration Model That Routes Tasks Across a Swappable Pool of Frontier LLMs

Sakana AI发布Fugu和Fugu Ultra，可跨模型池路由任务，在编程、推理和智能体基准测试领先。

AI智能体模型发布任务路由Sakana A

推荐理由：新型任务路由模型Fugu，可跨多个LLM分配任务，提升智能体效率。

🎯 给屿鹿的选题角度：实测Fugu路由不同LLM执行任务的效果，与单一模型对比，制作小红书图文教程，落点：用AI智能体提效一人公司工作流。

2026-06-22

21:53Hacker News精选 · 90

Moebius: 0.2B image inpainting model with 10B-level performance

Moebius发布0.2B图像修复模型，性能比肩10B，轻量高效。

AI生图图像修复轻量模型实测新工具

推荐理由：可实测演示轻量修图模型，展示对内容创作者的一人团队提效价值。

🎯 给屿鹿的选题角度：实测Moebius图片去水印、物体消除效果，对比传统PS和重级模型。小红书图文出修复前后对比，视频口播教用，落点“修图不用设计师，这个AI一分钟搞定”。

15:30量子位精选 · 90

阿里发布视频生成模型HappyHorse 1.1：五大维度全面升级

阿里发布视频生成模型 HappyHorse 1.1，宣称在五大维度全面升级。

视频生成阿里HappyHorAI生视频

推荐理由：视频生成赛道新模型，可直接实测对比，适合展示一人公司用 AI 高效创作视频。

🎯 给屿鹿的选题角度：制作 HappyHorse 1.1 实测视频：用它生成同一脚本的片段，与可灵、Sora 对比生成速度、画面一致性、运镜控制，以口播+屏幕录制发布视频号，突出“一个人搞定宣传片”的提效场景。

15:22Hacker News精选 · 70

GLM 5.2 vs. Opus

GLM 5.2 与 Opus 模型对比评测，涵盖能力、性能实测。

模型对比GLM 5.2Opus实测

推荐理由：大模型横向对比，可直接转化为实测选题，吸引技术受众。

🎯 给屿鹿的选题角度：制作小红书图文或视频号口播，实测 GLM 5.2 与 Opus 在文案生成、商业分析等场景的表现，用数据展示降本增效潜力。

14:5936氪精选 · 90

阿里巴巴发布视频生成模型HappyHorse 1.1

阿里发布视频生成模型HappyHorse 1.1，大幅提升动态、一致性和音频能力。

视频生成阿里模型升级

推荐理由：最新视频生成模型发布，可做实测对比，直接服务创作者降本增效。

🎯 给屿鹿的选题角度：实测HappyHorse 1.1：用同一指令对比旧版/其他工具，展示动态与一致性提升。小红书图文出效果对比图+参数，视频号口播讲解亮点与用法，引导关注AI视频创作提效。

11:48量子位精选 · 90

入选ECCV 2026！清华开源空间模型打败Gemini：真正的空间智能是在世界变化中持续学习

清华开源空间模型入选ECCV 2026，可处理120分钟长视频，性能优于Gemini。

空间智能开源模型长视频理解ECCV2026

推荐理由：开源模型可直接用于长视频分析，为创作者提供新的AI提效工具，实测选题价值极高。

🎯 给屿鹿的选题角度：第一时间实测该模型：用一条120分钟课程或直播录像，对比传统分段理解与全量处理效果，展示如何快速生成摘要和剪辑点，落点在一人高效处理长素材。适合视频号口播和小红书图文拆解。

10:08Hacker News精选 · 80

Sakana Fugu

Sakana发布Fugu新AI模型，可能为新一代大模型或进化算法产品

SakanaFugu新模型AI智能体

推荐理由：Sakana新模型发布，适合实测对比，为创作者提供降本增效工具测评。

🎯 给屿鹿的选题角度：小红书图文/视频号口播：第一时间实测Fugu模型，与Claude/GPT等对比，展示其在内容创作、工作流等方面的能力，突出提效优势。

07:4036氪精选 · 80

中信建投：国产模型加速迭代，算力景气度持续

国产模型GLM-5.2与Kimi K2.7 Code强化Agent能力与长上下文

国产大模型Agent代码能力长上下文

推荐理由：国产模型在Agent和长上下文能力提升显著，可实测用于内容提效

🎯 给屿鹿的选题角度：实测Kimi K2.7 Code的Agentic Coding，演示如何用它自动生成小红书文案或剪辑脚本，拍摄口播视频展示流程。

05:29Hacker News精选 · 60

Apertus – Open Foundation Model for Sovereign AI

Apertus发布用于主权AI的开源基础模型。

开源模型基础模型Apertus

推荐理由：新开源模型可测试，适合做实测对比内容。

🎯 给屿鹿的选题角度：下载并实测Apertus模型，与Llama等主流开源模型对比性能，制作小红书图文或视频，突出零成本本地部署降本增效。

2026-06-20

18:42量子位精选 · 60

撸猫撸出SOTA！3个00后2个月，造出史上最快流式音视频社交模型

三个00后开发出最快流式音视频社交模型，速度7倍于Veo3，成本仅1/2000。

AI 视频流式生成新模型成本优势

推荐理由：宣称性能大幅超越Veo3，有望成为AI视频创作新选择，待实测验证。

🎯 给屿鹿的选题角度：若模型公开，可做“AI视频新王？实测对比Veo3”的小红书图文或视频号口播，突出一人公司提效。

06:06MarkTechPost精选 · 80

VibeThinker-3B: A 3B Dense Reasoning Model Built on Qwen2.5-Coder-3B With the Spectrum-to-Signal Post-Training Pipeline

VibeThinker-3B: 3B参数推理模型开源，性能比肩DeepSeek V3.2和Kimi K2.5。

小模型推理模型VibeThin开源

推荐理由：小模型性能强劲，适合一人公司低成本部署，可做实测内容。

🎯 给屿鹿的选题角度：实测VibeThinker-3B与DeepSeek等大模型在推理任务上的表现，突出“3B战胜大模型”的降本增效，适合小红书图文或视频号。

2026-06-19

09:58Hacker News精选 · 90

GLM-5.2: The Most Powerful Open Model yet and the Brutal Reality of Running It

GLM-5.2号称最强开源模型，但本地运行挑战重重

大模型开源GLM-5.2实测

推荐理由：可做实测对比与本地部署教程，契合AI智能体赛道

🎯 给屿鹿的选题角度：一期视频/图文：实测GLM-5.2性能，对比其他开源模型，并给出本地运行配置建议，落点「个人/小团队如何低成本用上最强开源模型」

2026-06-18

19:00OpenAI精选 · 20

Improving health intelligence in ChatGPT

OpenAI推出GPT-5.5 Instant，提升ChatGPT健康咨询的推理与沟通质量。

GPT-5.5健康AI模型更新

17:39量子位精选 · 50

ABot-Earth0.5登顶Hugging Face论文三榜第一，获国际图形学权威陈宝权好评

ABot-Earth0.5模型登顶Hugging Face论文榜，可导入Unity等主流引擎交互开发。

3D生成图形学交互开发

14:17Hacker News精选 · 80

DeepSeek Introduces Vision

DeepSeek 模型新增视觉能力，支持图像输入。

DeepSeek多模态视觉模型AI实测

推荐理由：DeepSeek 作为热门国产模型，新增视觉功能，是实测演示的绝佳选题。

🎯 给屿鹿的选题角度：制作视频/图文实测 DeepSeek 视觉功能：上传截图、图表或手写笔记，测试其理解与分析能力，可与 GPT-4V 对比，落点“用 AI 省掉设计/数据分析外包”。

07:58Simon Willison精选 · 90

GLM-5.2 is probably the most powerful text-only open weights LLM

Z.ai发布开源大模型GLM-5.2，753B参数，1.51TB，采用MIT许可。

GLM-5.2开源大模型Z.ai

推荐理由：国产开源巨型模型，实测对比潜力大，契合AI Agent赛道的内容选题。

🎯 给屿鹿的选题角度：选题：GLM-5.2 vs Claude/GPT 实测，聚焦文案生成、策划提效，小红书图文+视频号演示，突出“免费调用顶级模型降本增效”。

2026-06-17

20:0436氪精选 · 80

微软正考虑接入深度求索模型赋能Copilot协同办公工具

微软正测试深度求索V4等开源模型作为Copilot低成本备选方案，以替代OpenAI和Anthropic模型

微软深度求索Copilot大模型

推荐理由：微软拥抱国产开源模型，话题性强，可做低成本方案实测对比

🎯 给屿鹿的选题角度：实测深度求索V4在办公场景的能力，对比GPT-4o，突出‘省钱提效’，适合小红书图文/视频口播，标题如“微软都搞的国产模型，打工人用起来”

17:12Hacker News精选 · 90

GLM-5.2 is the new leading open weights model on Artificial Analysis

GLM-5.2成为Artificial Analysis评测中领先的开源权重模型。

大模型开源GLM-5.2评测

推荐理由：国产开源模型登顶评测榜单，强性价比和中文能力适合实测。

🎯 给屿鹿的选题角度：标题：GLM-5.2 开源模型实测，到底能不能打？内容：用GLM-5.2与Claude、GPT做写作、策划、编程等任务对比，突出性价比和中文优势，小红书图文/视频号口播，落点：一人公司选模型省钱提效。

17:01Hugging Face精选 · 90

GLM-5.2: Built for Long-Horizon Tasks

智谱发布GLM-5.2模型，专为长周期任务打造，可能具备更强复杂推理与规划能力。

GLM-5.2智谱长任务大模型

推荐理由：新模型主打长周期任务，可实测对比Claude等，切中一人公司复杂项目提效需求。

🎯 给屿鹿的选题角度：视频号口播+小红书图文：用GLM-5.2策划一场线上活动，对比其他模型，展示其长链条推理能力，标题如《新一代长任务AI来了！GLM-5.2能让一人公司效率翻倍吗？》

16:0236氪精选 · 90

国家超算互联网上线GLM-5.2模型服务

智谱开源旗舰模型GLM-5.2，国家超算互联网同步上线API及模型文件。

大模型开源GLM-5.2超算互联网

推荐理由：国产大模型开源可实测，适合创作测评对比内容。

🎯 给屿鹿的选题角度：实测GLM-5.2在文案、数据分析等任务上的表现，对比DeepSeek等同级模型，做成小红书图文或视频，强调免费开源、一人公司提效。

15:30Hacker News精选 · 80

GLM 5.2 Performance Benchmarks

GLM 5.2模型性能基准测试结果公布，展现最新国产大模型能力。

GLM 5.2大模型基准测试国产模型

推荐理由：国产模型GLM 5.2实测数据新鲜，可直接作为AI智能体赛道素材，对比测评潜力大。

🎯 给屿鹿的选题角度：标题：GLM 5.2 vs GPT-4o 实测对比：中文任务谁更强？形式：小红书图文，展示写作、逻辑、编码等典型场景截图，结尾总结一人公司选用建议，强调降本增效。

13:59量子位精选 · 80

Grok 4.3现已在Amazon Bedrock上正式可用

xAI的Grok 4.3模型上线Amazon Bedrock，用户可通过API调用。

Grok模型发布Amazon B

推荐理由：新模型可用，可实测并对比主流模型，吸引关注AI工具提效的受众。

🎯 给屿鹿的选题角度：选题“Grok 4.3实测对比：又多一个强模型可选？”，录制视频展示在Bedrock调用Grok完成选题、脚本生成，与GPT-4o、Claude对比质量与风格，落点帮创作者选模型提效。

13:4536氪精选 · 60

xAI Grok 4.3现已在Amazon Bedrock上正式可用

xAI Grok 4.3模型在Amazon Bedrock正式可用，面向企业构建生成式AI应用。

Grok大模型云服务

推荐理由：Grok 4.3可用于企业工作流，关注其Agent能力。

🎯 给屿鹿的选题角度：可制作「Grok 4.3实测：在Bedrock搭建AI助手」的内容，演示内容生成或Agent场景，但需实际测试环境。

13:3036氪精选 · 70

摩尔线程完成智谱GLM-5.2 Day-0适配

摩尔线程宣布在MTT S5000上完成智谱GLM-5.2模型Day-0适配，优化长上下文推理。

智谱GLM-5.国产GPU模型适配长上下文

推荐理由：智谱新开源旗舰模型发布，国产芯片快速适配，是测评国产AI生态的机会。

🎯 给屿鹿的选题角度：可做一期对比实测：GLM-5.2在不同平台（英伟达vs摩尔线程）上的推理速度与效果，突出国产方案降本潜力，适合小红书图文。

10:42量子位精选 · 90

刚刚，Fable-5之下，智谱开源的GLM-5.2拿下AI编程第一！

智谱开源GLM-5.2模型，拥有1M上下文，在AI编程排行榜中夺冠。

GLM-5.2开源模型AI编程大模型实测

推荐理由：国产开源大模型重大突破，编程能力登顶，适合做测评与提效教程。

🎯 给屿鹿的选题角度：实测对比GLM-5.2与Claude Sonnet在真实代码任务上的表现，制作视频口播或图文教程，突出其1M上下文在长代码维护中的降本增效场景。

09:5836氪精选 · 80

沐曦股份曦云C系列GPU Day 0 适配智谱GLM-5.2旗舰模型

智谱AI开源旗舰大模型GLM-5.2，沐曦曦云C系列GPU完成Day 0适配。

智谱AIGLM-5.2开源大模型GPU适配

推荐理由：国产新旗舰开源模型，适合做实测对比内容，吸引关注AI提效的创业者和内容创作者。

🎯 给屿鹿的选题角度：录制GLM-5.2与DeepSeek/其他模型在文案生成、数据分析等场景的对比实测，突出效率与成本，发布小红书图文对比。

09:1336氪精选 · 40

「逆矩阵」完成超亿美元融资，创始人：通用世界基座模型窗口期已压至18个月

世界模型公司逆矩阵完成超亿美元融资并发布通用基座模型Physis-v0.1

世界模型融资基座模型

01:54Hacker News精选 · 30

GPT‑NL: a sovereign language model for the Netherlands

TNO发布荷兰语国家主权语言模型GPT-NL，用于政府和研究。

GPT-NL主权AI荷兰语模型

00:51MarkTechPost精选 · 30

Meet Qwen-RobotSuite: Three Embodied AI Models for VLA Manipulation, Video World Modeling, and Navigation

Qwen-RobotSuite发布三款具身模型：操作、视频世界建模、导航

具身智能Qwen机器人

2026-06-16

22:50Hacker News精选 · 50

Subquadratic – Introducing SubQ 1.1 Small

SubQ 1.1 Small模型发布，优化二次方注意力机制。

SubQ 1.1注意力优化

21:15Hacker News精选 · 30

Qwen-Robot Suite: A Foundation Model Suite for Physical World Intelligence

Qwen发布具身智能模型套件：操作、世界建模、导航

具身智能Qwen机器人

12:39量子位精选 · 40

三连发！阿里发布首个具身大模型Qwen-Robot系列

阿里发布首个具身大模型Qwen-Robot系列，实现边走边看边思考

具身智能大模型阿里

12:3336氪精选 · 90

阿里发布首个具身大模型Qwen-Robot系列

阿里发布首个具身大模型Qwen-Robot系列，含操作、移动和世界模型。

具身智能大模型机器人阿里

推荐理由：阿里首次推出完整具身智能模型系列，可实测其操作、导航能力，符合Agent赛道。

🎯 给屿鹿的选题角度：小红书图文/视频号口播实测Qwen-RobotManip：用文字指令让机器人完成抓取任务，对比GPT-4o等具身方案，突出“一人操控机器人团队”的提效潜力。

03:05The Verge AI精选 · 90

All the news about Anthropic’s new AI fight with the White House

Anthropic发布新模型Fable 5与Mythos 5，白宫要求限制外国访问。

大模型发布AnthropiAI监管

推荐理由：Anthropic新模型是AI测评必追热点，实测对比能吸引高关注。

🎯 给屿鹿的选题角度：立刻上手实测Fable 5/Mythos 5，与Claude、GPT-4o等对比写作、代码、逻辑推理能力，制作小红书图文/视频号口播，突出“一人公司选模型”指南。

2026-06-15

21:5636氪精选 · 80

智谱推出最新旗舰模型GLM-5.2

智谱发布最新旗舰模型GLM-5.2，细节尚未公布。

国产大模型GLM-5.2模型发布

推荐理由：国产新旗舰模型，可做实测对比测评。

🎯 给屿鹿的选题角度：可快速获取内测资格，制作「GLM-5.2 实测」图文或视频，对比 Claude/GPT，突出其特色与提效场景。

14:52量子位精选 · 80

4步出声，单卡0.24秒！Noiz AI联合港科大清华，开源音频生成大模型

Noiz AI联合港科大清华开源音频生成大模型，4步出声，单卡0.24秒。

音频生成开源模型AI配音大模型

推荐理由：开源高速音频生成模型，适合视频创作者低成本制作配音和音效，提效明显。

🎯 给屿鹿的选题角度：实测Noiz AI音频生成：输入文本秒出多语言配音，支持时间戳对齐视频。对比ElevenLabs，展示‘单卡0.24秒’实时性，制作‘如何用AI一人完成视频配音全流程’教程，突出降本增效。

14:10MarkTechPost精选 · 80

Z.ai Launches GLM-5.2 With a Usable 1M-Token Context, Two Thinking-Effort Levels, and No Benchmarks at Launch

Z.ai发布GLM-5.2模型，支持100万token上下文和双思考层级，未公开基准测试。

大模型发布Agent长上下文实测

推荐理由：百万token上下文新模型，适合做长文档处理实测，吸引创业者关注。

🎯 给屿鹿的选题角度：实测GLM-5.2 vs 竞品在长文本理解、代码生成上的表现，制成对比视频或图文，强调一人在AI协助下完成复杂任务的提效效果。

12:55Hacker News精选 · 90

Apple Foundation Models

Apple 基础模型通过 Claude 平台开放，开发者可直接调用多种 Apple 模型。

Apple模型Claude平台模型发布AI对比

推荐理由：Apple 正式推出基础模型并开放使用，可做第一手实测对比。

🎯 给屿鹿的选题角度：小红书图文/视频号：快速上手 Apple 基础模型，测试其在文案生成、数据解读、创意脚本等任务的实际效果，对比 ChatGPT 和 Claude，给出一人团队选型建议。

12:5136氪精选 · 90

智谱：公司已推出最新一代旗舰模型GLM-5.2

智谱发布旗舰模型GLM-5.2，支持百万token上下文，将MIT协议开源。

智谱GLM-5.2开源长上下文

推荐理由：最新国产开源大模型，长上下文能力突出，适合实测对比选题。

🎯 给屿鹿的选题角度：制作GLM-5.2与Kimi/ChatGLM长文本理解对比实测，展示论文、报告总结效果，突出内容创作者提效，适合小红书图文或视频号口播。

11:24量子位精选 · 70

智源大会 | 天工AI重新定义世界模型，公布Matrix-Game 3.5 最新技术突破

昆仑万维在智源大会公布天工AI与Matrix-Game 3.5模型，称重新定义世界模型。

天工AI世界模型Matrix-GAI视频

推荐理由：世界模型可能颠覆AI视频生成，值得实测其效果，选题契合AI生视频赛道。

🎯 给屿鹿的选题角度：选题：实测天工AI Matrix-Game 3.5生成视频效果，对比现有工具，突出“一人公司”用AI做视频的降本增效。形式：小红书图文/视频号口播。

2026-06-14

22:38Hacker News精选 · 70

Rio de Janeiro's city government model Rio3.5 beats Qwen3.7 in recent benchmarks

里约市政府模型Rio3.5在基准测试中击败通义千问3.7

模型发布基准测试Rio3.5Qwen3.7

推荐理由：新开源模型声称超越Qwen3.7，可实测对比吸引关注

🎯 给屿鹿的选题角度：实测Rio3.5与Qwen3.7在写作、翻译等任务上的表现，制作对比图文/视频，突出免费模型助力一人公司提效

00:18Hacker News精选 · 80

GLM 5.2 Is Out

智谱发布GLM 5.2大模型，可能带来性能提升与新能力。

大模型发布GLM智谱AI

推荐理由：新模型发布提供实测素材，可对比主流模型制作吸睛内容。

🎯 给屿鹿的选题角度：立即实测GLM 5.2在文案、数据分析等任务上的表现，与GPT-4o、Claude对比，制作「一人公司选哪个模型」视频/图文，突出降本增效。

00:18Hacker News精选 · 90

GLM 5.2 Is Out

智谱发布 GLM 5.2 模型，性能提升，支持 128K 上下文，免费可用。

GLM 5.2智谱大模型新发布

推荐理由：国产最新模型发布，可做实测对比内容，吸引关注AI工具的创业者和创作者。

🎯 给屿鹿的选题角度：制作 GLM 5.2 实测视频：对比 GPT-4o 在文案写作、数据分析、代码生成等任务上的表现，突出免费优势，带出“一人公司提效”落点，发布小红书图文和视频号口播。

2026-06-13

20:40量子位精选 · 50

HuggingFace CEO力荐，Bengio团队也押注：这个1500美元训出的HRM模型，凭什么火了？

HuggingFace CEO力荐的HRM模型，仅1B参数，训练成本1500美元，由Bengio团队参与。

HRM模型小模型训练成本HuggingF

16:1636氪精选 · 70

科大讯飞发布星火多模态大模型X2-VL

科大讯飞发布星火多模态大模型X2-VL，面向具身智能场景。

讯飞星火多模态大模型具身智能

推荐理由：国产多模态新模型，可能具备图文理解和生成能力，适合实测对比。

🎯 给屿鹿的选题角度：若开放API，可实测星火X2-VL的图文理解与生成效果，与GPT-4o、Claude等对比，输出小红书图文测评，突出对内容创作者的提效价值。

15:3136氪精选 · 60

智谱：GLM-5.2将面向GLM Coding Plan全量用户开放

智谱发布GLM-5.2编码模型，今晚向Coding Plan全量用户开放，API下周上线，下周开源（MIT协议）。

智谱GLM-5.2开源代码模型

推荐理由：新模型开源可实测，适合关注国产模型和代码生成能力的AI内容创作者。

🎯 给屿鹿的选题角度：下周开源后实测GLM-5.2的代码生成能力，与Claude/GPT对比，制作对比评测视频或图文，标题如《国产开源代码模型GLM-5.2实测：一人公司写代码能提效多少？》，突出对非技术创业者写简单脚本的辅助。

12:57MarkTechPost精选 · 80

Moonshot AI Releases Kimi K2.7-Code: a Coding Model Reporting +21.8% on Kimi Code Bench v2 Over K2.6

Moonshot AI开源Kimi K2.7-Code模型，代码能力提升21.8%，推理token减少30%。

模型发布Kimi代码模型Agent

推荐理由：新模型发布，代码能力显著提升，可关联Agent工作流与提效。

🎯 给屿鹿的选题角度：实测Kimi K2.7-Code在自动化内容生产（如脚本生成、数据处理）中的效果，对比上代版本，制作小红书图文或视频号口播，突出“一人公司提效”落点。

12:4636氪精选 · 40

摩尔线程：完成MiniMax M3大模型适配

MiniMax M3原生多模态模型开源，摩尔线程完成Day-0适配。

MiniMax开源模型多模态大模型发布

11:0036氪精选 · 60

魔法原子上交会首秀VLA K02大模型

魔法原子发布自研Magic-VLA K02大模型与Magic-Mix世界模型

VLA大模型机器人世界模型

推荐理由：VLA大模型是智能体从语言到动作的关键，可能影响机器人Agent发展

🎯 给屿鹿的选题角度：可科普VLA模型如何让AI从对话到物理行动，与常规LLM对比，但主题偏离创作者核心，适合作为行业动态简讯

05:04MarkTechPost精选 · 50

Google Releases Gemini-SQL2: Gemini 3.1 Pro Text-to-SQL Scores 80.04% on BIRD Single-Model Leaderboard

Google推出Gemini-SQL2,文本转SQL准确率80.04%领跑BIRD排行榜

Gemini文本转SQLAI Agent

2026-06-12

18:42Hacker News精选 · 90

Kimi K2.7-Code: open-source coding model with better token efficiency

Moonshot AI发布开源编程模型Kimi K2.7-Code，号称有更好的token效率。

Kimi开源模型编程模型Token效率

推荐理由：新模型发布，实测对比编程能力或效率，贴合创作者AI实操测评定位，能转化为提效选题。

🎯 给屿鹿的选题角度：选题：实测Kimi K2.7-Code编程能力，对比DeepSeek Coder等，展示用AI写自动化脚本提效。小红书图文/视频号口播，落点：一人公司如何用AI编程省成本。

16:06MarkTechPost精选 · 60

Zyphra Release Zamba2-VL: Hybrid Mamba2–Transformer Vision-Language Models That Cut Time-to-First-Token by About an Order of Magnitude

Zyphra发布开源混合Mamba2-Transformer视觉语言模型Zamba2-VL，首token延迟降低约一个数量级。

视觉语言模型开源混合架构

推荐理由：新开源VLM大幅降低延迟，适合需要快速响应的AI内容生成场景。

🎯 给屿鹿的选题角度：短视频实测Zamba2-VL生成图片/文案的速度与质量，对比主流模型，突出效率优势，展示AI如何帮助内容创作者快速出片。

12:13量子位精选 · 70

“智能体最后的考试”，Fable 5竟然不敌GPT 5.5

Fable游戏评测显示，GPT-5.5在智能体任务中超越Fable 5，但最难关卡均得零分。

AI智能体大模型评测GPT-5.5Fable

推荐理由：大模型智能体能力对比评测，适合做实测选题吸引技术创业者。

🎯 给屿鹿的选题角度：选题：实测主流模型在Fable中的智能体表现，对比推理与交互能力。小红书图文拆解测试过程，视频号口播复盘结果，强调AI提效潜力和适用边界。

09:06Hacker News精选 · 90

Claude Fable is relentlessly proactive

Simon Willison发文称Claude Fable非常积极主动，可能预示Claude模型的新代理功能。

ClaudeAgentSimon WiAI模型

推荐理由：Claude新特性或版本可能在主动性和代理能力上有突破，适合做实测演示。

🎯 给屿鹿的选题角度：视频号口播实测Claude Fable的主动性：让它自动监控邮件、生成内容提纲，展示“一人公司”如何用AI主动管理任务，标题可做“Claude新功能，你的AI助手开始主动干活了”。

2026-06-11

22:27Hacker News精选 · 30

MiMo Code Is Now Released and Open-Source

小米开源MiMo代码模型/工具，Hacker News关注度低。

开源代码模型小米

21:14Hacker News精选 · 70

Open Reproduction of DeepSeek-R1

Hugging Face发起Open-R1项目，目标完整复现DeepSeek-R1推理模型。

DeepSeek开源复现推理模型

推荐理由：开源复现降低使用门槛，有望催生更多轻量版推理模型，适合一人公司实验部署。

🎯 给屿鹿的选题角度：解读Open-R1项目进度与R1特性，实测对比开源方案，演示本地部署或API接入后如何辅助内容决策与数据分析，突出个人创作者零成本提效。

16:5436氪精选 · 40

腾讯混元 AI Infra 新开源：HPC-Ops 推理核心算子全面升级

腾讯混元开源HPC-Ops推理核心算子升级，优化Attention延迟与显存等问题。

模型优化推理加速开源

16:33MarkTechPost精选 · 80

Meet ‘North Mini Code’: Cohere’s 30B Open-Weight Mixture-of-Experts Model With 3B Active Parameters for Agentic Coding

Cohere发布开源30B MoE编程模型North Mini Code，3B活跃参数，256K上下文，专为智能体编程设计。

Cohere编程模型MoE智能体

推荐理由：开源轻量级编程模型，极低部署成本，适合一人公司实测与集成。

🎯 给屿鹿的选题角度：实测North Mini Code在自动修Bug、代码生成上的效果，与Claude Code对比，制作“一人公司零成本AI编程助手”教程，发小红书图文+视频号。

12:17量子位精选 · 80

Mythos阴影里谷歌悄悄发模型，速度暴涨4倍

谷歌发布新模型，采用扩散模型生成文字，速度提升 4 倍。

谷歌扩散模型文字生成

推荐理由：速度显著提升，对大量文本生成场景有直接提效价值，适合实测对比。

🎯 给屿鹿的选题角度：横向测评谷歌新模型与 GPT-4o/Claude 3.5 的生成速度与质量，重点测公众号、短视频文案等任务，突出“一人公司”效率翻倍，视频号口播。

09:18量子位精选 · 80

实测小米最快1T大模型：吞吐量每秒1000+ Tokens，Vibe Coding七秒交付

实测小米最快1T大模型：通用GPU每秒1000+ Tokens吞吐，Vibe Coding七秒交付

小米大模型实测推理速度Vibe Cod

推荐理由：国产模型推理速度重大突破，实测数据可直观对比，适合做性能验证与提效演示

🎯 给屿鹿的选题角度：出一条「实测小米1T大模型：1000 Tokens/秒能做什么？」视频，跑本地/云端对比，展示Vibe Coding七秒生成网页，落点一人开发效率。

08:0436氪精选 · 90

谷歌推出DiffusionGemma开源模型

谷歌开源DiffusionGemma，文本生成速度提升4倍，但输出质量低于Gemma 4。

谷歌Diffusio文本生成开源模型

推荐理由：新模型速度翻倍，适合本地提效场景，可实测对比吸引技术受众。

🎯 给屿鹿的选题角度：标题：谷歌新模型DiffusionGemma生成速度提升4倍！实测对比值得用吗？形式：小红书图文/视频号口播，实测生成速度、质量与Gemma、Claude等对比，展示本地部署用法，落点：一人公司如何用更快模型提效。

04:00Simon Willison精选 · 70

DiffusionGemma

谷歌文本扩散模型DiffusionGemma重新回归，Simon Willison曾实测其生成速度达857 tokens/秒

模型发布文本扩散谷歌

推荐理由：新型文本扩散模型可实测，适合做生成速度与效果对比，吸引对AI工具好奇的创作者

🎯 给屿鹿的选题角度：实测DiffusionGemma vs GPT-4o/Claude，从生成速度、文本质量、适用场景三方面对比，视频号口播+小红书图文，落点一人公司如何选模型提效

03:29Ars Technica精选 · 50

Google's latest DiffusionGemma open AI model comes with a 4x speed boost

Google推出开源扩散语言模型DiffusionGemma，文本生成速度提升至4倍。

扩散模型文本生成速度提升

02:50MarkTechPost精选 · 70

Google AI Releases DiffusionGemma, a 26B MoE Open Model Using Text Diffusion for Up to 4x Faster Generation

Google DeepMind发布DiffusionGemma，26B MoE开源模型，采用文本扩散技术，生成速度提升最高4倍。

文本扩散大模型生成加速开源模型

推荐理由：新型文本扩散模型，生成速度提升4倍，适合做实测对比内容吸引技术爱好者关注。

🎯 给屿鹿的选题角度：标题：实测谷歌新模型DiffusionGemma：文本生成快4倍，效果如何？形式：小红书图文，对比生成速度与质量。落点：未来内容创作效率可能大幅提升。

02:43The Verge AI精选 · 80

Fable won’t answer basic biology questions

Anthropic发布的Claude Fable 5号称最强，却拒绝回答基础生物学问题，引发对其安全策略的质疑。

Claude模型行为AI安全实测

推荐理由：该创作者可实测Claude的避答问题，制作反差内容吸引流量。

🎯 给屿鹿的选题角度：实测Claude Fable 5拒绝回答的边界，制作对比视频，展示“最强模型”为何不敢答基础问题，落点提醒用户AI的可靠性问题。

00:50The Verge AI精选 · 50

Microsoft restricts Claude Fable for employees over data retention concerns

微软因数据保留疑虑限制员工使用Anthropic新模型Claude Fable。

AI隐私数据安全Claude企业策略

推荐理由：新模型引发数据保留争议，适合提醒创业者注意AI工具隐私风险。

🎯 给屿鹿的选题角度：做一期短视频科普，对比主流AI工具数据政策，提醒一人公司如何选择安全的AI服务，可结合截图演示。

00:24DeepMind精选 · 60

DiffusionGemma: 4x faster text generation

DeepMind发布DiffusionGemma，文本生成速度提升4倍，基于Gemma架构。

文本生成加速GemmaDeepMind效率提升

推荐理由：文本生成速度大幅提升，未来可能影响AI写作工具的效率与成本。

🎯 给屿鹿的选题角度：可做快讯解读：用Demogo（如Hugging Face）实测生成速度，对比普通Gemma，强调对内容创作者提效的潜力，发布在小红书图文。

00:09Hacker News精选 · 90

DiffusionGemma: 4x Faster Text Generation

Google发布DiffusionGemma，采用扩散模型实现4倍速文本生成。

扩散模型文本生成速度提升Google

推荐理由：全新扩散文本模型可大幅提升内容创作效率，实测对比性强。

🎯 给屿鹿的选题角度：制作一期视频实测DiffusionGemma速度与质量，对比传统模型，展示一人公司如何用它快速生成文案、选题，降本增效。

2026-06-10

19:52量子位精选 · 90

中国第一、全球第二！HiDream-O1-Image-1.5 登顶文生图榜单，超越谷歌、英伟达

HiDream-O1-Image-1.5文生图模型登顶榜单，中国第一全球第二，超越谷歌英伟达。

AI生图新模型榜单实测

推荐理由：文生图新模型登顶，可做实测对比内容，吸引做图、做IP的创作者关注。

🎯 给屿鹿的选题角度：实测HiDream-O1-Image-1.5生成真人/产品图，对比Midjourney、DALL·E，突出质量与效率，做小红书图文或视频号口播，落点AI让创作者一人高效产出视觉素材。

16:26MarkTechPost精选 · 90

Anthropic Releases Claude Fable 5 and Claude Mythos 5: Same Underlying Model, Different Safeguards, New Mythos-Class Tier

Anthropic发布Claude Fable 5和Mythos 5，同模型不同安全策略，新增Mythos级别。

AnthropiClaude安全策略

推荐理由：Claude新版本差异在安全策略，适合做对比实测，直击创业者对AI内容生成可控性的需求。

🎯 给屿鹿的选题角度：实测两个版本在敏感话题、创意写作等场景的表现，制作对比视频/图文，突出安全与自由的平衡，小红书或视频号口播，吸引非技术受众。

14:45量子位精选 · 90

GPT-5.6首批实测来了！精准狙击Mythos

GPT-5.6首批实测曝光，性能或超越Mythos，预计本月发布。

GPT-5.6实测Mythos新模型

推荐理由：GPT-5.6首批实测，可能是重磅更新，适合作为一手测评题材。

🎯 给屿鹿的选题角度：可制作一期“GPT-5.6 vs Mythos 实测对比”，突出新功能/性能提升，演示如何用新模型提效内容创作，图文/视频均可，吸引关注AI工具的技术流受众。

13:54量子位精选 · 90

Claude Fable 5首日实测，杀疯了…

量子位首发实测Claude新模型“Fable 5”，性能惊艳引发社区热议

Claude模型实测AI大模型Anthropi

推荐理由：Claude新模型发布，可做首发实测对比，吸引科技创业者关注

🎯 给屿鹿的选题角度：连夜实测Claude Fable 5，对比GPT-4o在文案创作和数据分析上的表现，用真实案例展示一人搞定多工种，做小红书图文对比+视频号口播

11:1936氪精选 · 60

36氪首发 | 清华团队做出全球首个实时理解生理与情绪的基座模型，进一步布局硬件

清华团队发布全球首个实时理解生理与情绪的AI基座模型，获顺为资本数百万美元融资。

基座模型情绪感知人机交互融资

推荐理由：若未来开放API，可用于AI智能体感知用户状态，提升交互体验。

🎯 给屿鹿的选题角度：可做一期“AI读懂你的喜怒哀乐”的前沿解说视频，介绍模型原理和可能应用场景，吸引对前沿AI技术感兴趣的受众，平台：视频号口播，落点：未来智能体更人性化。

10:2936氪精选 · 90

Anthropic发布最强模型Claude Fable 5正式上线

Anthropic发布最强模型Claude Fable 5正式上线。

Claude FAnthropi大模型

推荐理由：最新模型发布，可做实测对比，吸引AI实操关注。

🎯 给屿鹿的选题角度：立即上手实测Claude Fable 5的文案、分析能力，对比旧版，展示降本增效，发视频号口播+小红书图文。

07:59Simon Willison精选 · 90

Initial impressions of Claude Fable 5

Simon Willison深度实测Claude Fable 5，称其像“野兽”，能力全面但昂贵。

Claude F实测大模型

推荐理由：权威一手评测，为AI测评内容提供高质量、高流量的素材。

🎯 给屿鹿的选题角度：将Simon的测评二次解读，聚焦文案、编程等场景，实测Fable 5提效效果，输出对比视频或图文。

06:52量子位精选 · 90

刚刚，Claude Mythos 5发布！5000万行代码1天搞定

Claude Mythos 5发布，宣称可1天处理5000万行代码。

Claude大模型代码生成

推荐理由：重大模型发布，可做实测对比内容，吸引创业者和开发者关注。

🎯 给屿鹿的选题角度：小红书图文/视频号实测：对比Claude Mythos 5与GPT-4等模型在代码生成、长文本理解上的表现，突出“一人顶一个团队”的效率。

02:57Ars Technica精选 · 70

Google announces Gemini 3.5 Live Translate for instant voice-to-voice translation

Gemini 3.5 Live Translate实现语音到语音翻译，保留语调语速，支持70+语言。

Gemini语音翻译实时翻译

推荐理由：可实测翻译效果，用于多语言内容创作提效

🎯 给屿鹿的选题角度：实测Gemini Live Translate在视频翻译配音中的表现，对比传统方法，展现降本增效，适合视频号口播。

01:24MarkTechPost精选 · 70

Google Releases Gemini 3.5 Live Translate, a Streaming Speech-to-Speech Audio Model Covering 70+ Languages Across Meet, Translate, and the Live API

Google发布Gemini 3.5 Live Translate，支持70+语言流式翻译。

Gemini语音翻译

推荐理由：可实测翻译效果，用于多语言内容创作提效

🎯 给屿鹿的选题角度：实测Gemini Live Translate在视频翻译配音中的表现，对比传统方法，展现降本增效，适合视频号口播。

01:10The Verge AI精选 · 100

Anthropic releases its first Mythos-class model Claude Fable

Anthropic发布最强模型Claude Fable，在软件工程和知识工作领域性能领先。

Claude FAnthropi大模型

推荐理由：重大新模型发布，必须第一时间实测抢占流量

🎯 给屿鹿的选题角度：立刻开箱实测，对比GPT-4o，演示代码、写作等任务，突出降本增效，适合视频号口播+小红书图文。

01:00TechCrunch AI精选 · 90

Anthropic’s Claude Fable 5 is a version of Mythos the public can access today

Anthropic发布Claude Fable 5，首款对公众开放的Mythos级模型，带安全护栏。

Claude大模型安全护栏

推荐理由：新Claude模型发布，可第一时间实测对比，吸引关注AI工具进展的受众。

🎯 给屿鹿的选题角度：实测Claude Fable 5 vs GPT-4o等，展示其在文案、代码、分析等任务的表现，制作对比图文或视频，突出对创业者提效的实用技巧。

00:58Hacker News精选 · 90

Claude Fable 5

Anthropic发布Claude Fable 5系统卡，引发社区热议。

Claude系统卡

推荐理由：新模型发布，社区关注度高，可探讨安全性与能力。

🎯 给屿鹿的选题角度：解读Claude Fable 5系统卡，分析其安全限制对实际使用的影响，并提供绕过护栏的创意用法，适合深度测评文章。

2026-06-09

23:56Hugging Face精选 · 80

Introducing North Mini Code: Cohere’s First Model For Developers

Cohere发布首款开发者代码模型North Mini Code

代码模型Cohere开发者工具

推荐理由：新代码模型，适合测评对比，吸引开发者受众

🎯 给屿鹿的选题角度：实测North Mini Code vs Claude/GPT在代码生成任务上的表现，制作对比视频/图文，突出“一人公司提效”

22:10DeepMind精选 · 90

Introducing Gemma 4 12B: a unified, encoder-free multimodal model

DeepMind发布统一的无编码器多模态模型Gemma 4 12B

Gemma多模态开源模型

推荐理由：新多模态模型，可实测对比，为创作者提供新工具

🎯 给屿鹿的选题角度：实测Gemma 4 12B的图文理解与生成能力，制作评测内容，体现“用AI做内容提效”

12:17量子位精选 · 70

仅4B大小可端侧部署！卡帕西预言的「认知模型」被国产做出来了

国产认知小模型仅4B参数，可端侧部署，声称效果比肩GPT-5.4。

国产模型端侧部署认知推理

推荐理由：端侧小模型若强，可低成本本地运行，帮助创作者处理内容任务。

🎯 给屿鹿的选题角度：模型公开后，做本地部署评测，对比GPT在文案撰写上的表现，看能否成为免费易用的内容助手。

10:55量子位精选 · 70

国产通用大模型第一梯队，来新人了？！

国产通用大模型第一梯队或有新进入者，强调智能密度与Token价值

国产大模型第一梯队智能密度

推荐理由：新模型出现可能成为测评对象，适合做对比实测内容。

🎯 给屿鹿的选题角度：出一期“国产大模型新选手实测”：对比其与DeepSeek等在文案生成、多模态理解上的表现，突出对一人公司提效的价值，形式为视频号口播+小红书图文。

00:49MarkTechPost精选 · 50

Xiaomi MiMo and TileRT Push a 1-Trillion-Parameter Model Past 1000 Tokens Per Second on Commodity GPUs

小米MiMo与TileRT让万亿参数模型在8个消费级GPU上达到每秒1000+ token解码速度

大模型推理性能优化

2026-06-08

16:56MarkTechPost精选 · 90

Microsoft AI Introduces MAI-Transcribe-1.5: 2.4% WER on Artificial Analysis, Best-in-Class FLEURS Accuracy, and Up to 5x Faster Long-Audio Transcription

微软发布MAI-Transcribe-1.5语音识别模型，词错率2.4%，支持43种语言，长音频转录快5倍

语音识别转录效率工具微软

推荐理由：语音转文字是视频创作者高频需求，该模型准确率高且快，可大幅提效，适合实测对比

🎯 给屿鹿的选题角度：制作「微软新语音识别实测」视频/图文：用几段不同场景音频（口播、采访、噪音）对比MAI-Transcribe-1.5、Whisper、剪映，看谁又快又准，落点帮创作者省剪辑时间

2026-06-05

02:57Hugging Face精选 · 30

Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI

Nvidia发布Nemotron 3.5内容安全模型，面向企业多模态AI安全。

内容安全多模态企业AI

2026-06-04

08:00Hugging Face精选 · 80

Designing the hf CLI as an agent-optimized way to work with the Hub

ChatGPT推出新记忆系统，跨对话记住偏好，保持上下文相关。

ChatGPT记忆功能更新

推荐理由：记忆增强直接提升日常使用体验，是创作者提效的重要更新。

🎯 给屿鹿的选题角度：制作「ChatGPT新记忆功能实测」：对比新旧版本在连续对话中的表现，演示如何用于长期内容策划和客户记忆，小红书图文，落点：一人公司的超级助理更懂你了。

2026-06-03

21:00Google AI精选 · 10

5 ways Google Search can level up your thrift and vintage shopping

GPT-Rosalind新增功能，增强生物推理、药物化学等。

GPT-Rosa生命科学

06:21Simon Willison精选 · 90

Microsoft's new MAI models

微软发布MAI-Thinking-1推理模型和MAI-Code-1-Flash代码模型。

微软大模型MAI推理

推荐理由：新模型发布，可与主流模型对比实测，满足受众对最新AI工具的需求。

🎯 给屿鹿的选题角度：视频实测：“微软新模型MAI-Thinking-1对标GPT-5？我花了3小时实测”。对比推理能力、速度、成本，给出降本增效建议。

2026-06-01

23:45Hugging Face精选 · 70

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

JetBrains发布Mellum2，12B参数的混合专家模型。

大模型MoEJetBrain

推荐理由：新开源模型可能适合本地部署，实测对比当前流行模型，为创作者提供新选择。

🎯 给屿鹿的选题角度：上手实测Mellum2，与GPT-4o、Claude等对比，测试内容生成、逻辑推理，适合AI测评号做视频/图文。

2026-05-30

01:30Google AI精选 · 90

9 demos of Gemini Omni and Gemini 3.5 in action

Google AI发布9个Gemini Omni与Gemini 3.5实战演示。

Gemini模型演示实测

推荐理由：新模型能力演示，可直接作为实测素材。

🎯 给屿鹿的选题角度：挑选与内容创作相关的演示（图/视频/文案生成），做成实测对比视频，强调一人团队如何用AI提效。

2026-05-20

02:38Hugging Face精选 · 20

OlmoEarth v1.1: A more efficient family of Earth observation models

Hugging Face发布OlmoEarth v1.1，更高效的地球观测模型家族。

地球观测遥感模型

01:45Google AI精选 · 100

I/O 2026: Welcome to the agentic Gemini era

Google I/O 2026宣布进入Agentic Gemini时代，AI能自主执行任务。

Gemini智能体AgenticGoogle I

推荐理由：Gemini Agent成为自主智能体，可直接用于日常任务执行，存在大量实测选题。

🎯 给屿鹿的选题角度：立即实测Gemini新Agent能力，做“我的第一个AI员工：Gemini帮我订机票写邮件”，视频号口播演示，社群引流，落点：一人公司用AI代理省时间。

01:45Google AI精选 · 100

Gemini 3.5: frontier intelligence with action

Google发布Gemini 3.5，具备前沿智能与行动能力。

Gemini 3前沿模型AI Agent

推荐理由：旗舰模型更新，可直接实测对比能力，内容吸引力强。

🎯 给屿鹿的选题角度：制作“Gemini 3.5 vs GPT-5 实测对比”系列，小红书图文+视频号口播，突出对创作者哪个更好用，落点：选择最强AI工具提效。

2026-05-19

08:00Hugging Face精选 · 30

Introducing the Ettin Reranker Family

Hugging Face发布Ettin重排序模型家族。

重排序Hugging

2026-05-18

03:50DeepMind精选 · 80

Introducing Gemini Omni

DeepMind发布Gemini Omni，或为新一代多模态AI模型。

Gemini多模态

推荐理由：Gemini Omni可能大幅提升多模态能力，影响AI内容创作格局。

🎯 给屿鹿的选题角度：首发实测Gemini Omni，对比GPT-4o，全方位测试图文理解、视频脚本生成。输出对比图，吸引创作者选型，落点帮用户挑选最称手的AI工具。

2026-05-16

06:50DeepMind精选 · 100

Gemini 3.5: frontier intelligence with action

Gemini 3.5 发布：前沿智能，原生支持复杂 agentic 工作流。

Gemini 3大模型Agent工作流

推荐理由：新一代 Gemini 强调 agent 能力，是 AI 智能体赛道的重磅更新，非常适合实测对比。

🎯 给屿鹿的选题角度：立即上手实测 Gemini 3.5 的 agent 功能，与 Claude/GPT 对比执行复杂任务的效果，制作小红书图文/视频号口播，展示“一人公司”如何用 AI Agent 提效。

2026-05-15

02:55Hugging Face精选 · 60

Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality

开源多语言嵌入模型 Granite Embedding Multilingual R2 发布，32K 上下文，检索质量最佳。

嵌入模型多语言开源RAG

推荐理由：新开源嵌入模型支持 32K 上下文，可用于 RAG 等 AI 工作流，提升内容检索效率。

🎯 给屿鹿的选题角度：简要介绍该嵌入模型如何用于搭建私有知识库问答，辅助内容创作时的素材检索，适合小红书图文教程。

2026-05-13

09:27OpenAI Cookbook精选 · 60

Kathy sid/gpt5.5 grounded spatial reasoning (#2696)

疑似 GPT-5.5 的空间推理能力示例 Cookbook。

GPT-5.5空间推理多模态

推荐理由：如果 GPT-5.5 真有其事，可抢先测试；若为笔误则可能是 GPT-4o 新能力，值得关注。

🎯 给屿鹿的选题角度：如果示例可运行，做一个《GPT 新能力：能理解空间关系了？》的实测视频，展示效果，并讨论对内容创作的影响。

04:59OpenAI Cookbook精选 · 60

Kathy sid/gpt5.5 grounded spatial reasoning (#2694)

疑似 GPT-5.5 的空间推理能力示例，与上条为不同版本。

GPT-5.5空间推理多模态

推荐理由：同上，可能为同一 PR 的不同版本。

🎯 给屿鹿的选题角度：同上。

2026-01-08

04:00VentureBeat AI精选 · 60

Nous Research's NousCoder-14B is an open-source coding model landing right in the Claude Code moment

Nous Research开源NousCoder-14B，四天训练性能比肩大模型。

开源模型编程模型AI编程

推荐理由：开源编程模型让低成本本地运行AI编码成为可能，适合推广个人开发者工具链。

🎯 给屿鹿的选题角度：仅作资讯参考，可结合Goose等工具提及开源生态，但无需单独深挖。