2026-07-02
19:28量子位精选 · 50

让Agent越用越强:AReaL 2.0开源,打造面向自演进智能体的RL基础设施

AReaL 2.0 开源,面向自演进 Agent 的 RL 基础设施
Agent强化学习开源
2026-07-01
18:03The Decoder:AI News精选 · 80

OpenAI论文揭示GPT-5.6三个Pro变体,打破单一顶级策略

OpenAI论文披露GPT-5.6三Pro变体,Sol Pro在基因组学基准中领先。
GPT-5.6Pro变体OpenAI
推荐理由:GPT-5.6 Pro变体细节曝光,可供社群讨论模型选择与Pro版本价值。
🎯 给屿鹿的选题角度:GPT-5.6 Pro变体值得买吗?普通用户需要Pro吗?对比标准版与Pro版差距,做社群讨论帖。
16:10MarkTechPost精选 · 30

NVIDIA 发布 Nemotron-Labs-TwoTower 开放权重扩散语言模型

NVIDIA发布开放权重扩散语言模型Nemotron-Labs-TwoTower,提升生成吞吐量。
NVIDIA扩散语言模型开源模型
11:46量子位精选 · 30

Om AI联汇发布VLX:全球首个面向物理世界的端侧流式多模态模型

Om AI联汇发布VLX,全球首个面向物理世界的端侧流式多模态模型。
端侧模型多模态物理世界AI
10:24公众号:龙猫LongCat精选 · 60

美团 LongCat-2.0 正式发布:国产算力集群训练的万亿参数大模型

美团开源1.6T参数大模型LongCat-2.0,支持1M上下文,编程评测领先。
美团LongCat-开源模型编程
推荐理由:国产大模型挑战编程评测,可与GPT/Codex做对比,吸引关注编程提效的受众。
🎯 给屿鹿的选题角度:实测LongCat-2.0编程能力:能否替代Codex?适合哪些编程任务?做对比短视频。
04:44Hacker News精选 · 40

Leanstral 1.5

Mistral 发布轻量模型 Leanstral 1.5
Mistral轻量模型对比
推荐理由:可能用于本地提效,但非核心竞品对比
🎯 给屿鹿的选题角度:若性能突出,可做「Leanstral vs ChatGPT 在简单任务上的表现」对比贴,但优先度低
04:09Hacker News精选 · 80

Claude Sonnet 5 – benchmark results

Anthropic 发布 Claude Sonnet 5 基准测试结果,多项指标超越 GPT-4o
Claude S基准测试模型对比
推荐理由:Claude Sonnet 5 基准出炉,可与 GPT-4o 直接对比,为普通用户提供选型依据
🎯 给屿鹿的选题角度:制作「Claude Sonnet 5 vs GPT-4o」实测对比,聚焦日常写作、代码、数据分析,提炼「谁更适合普通人」的结论,适合小红书图文或视频号口播
01:59Hacker News精选 · 70

Claude Sonnet 5

Anthropic 发布 Claude Sonnet 5,可能在编程和推理上超越前代,引发社区讨论。
Claude S竞品对比编程能力
推荐理由:可对比 Codex/ChatGPT,为受众提供选型参考和迁移评估。
🎯 给屿鹿的选题角度:做一期“Claude Sonnet 5 vs Codex”实操对比,聚焦日常编程任务,做成小红书图文或视频口播,帮助技术小白决策。
2026-06-30
08:30Hacker News精选 · 50

LongCat-2.0, a large-scale MoE model with 1.6T total and 48B Active

LongCat-2.0发布:总参数1.6T、活跃48B的MoE模型,主打长上下文。
LongCatMoE大模型
01:16Hacker News精选 · 80

Ornith-1.0: self-improving open-source models for agentic coding

Ornith-1.0:面向自主编程的开源自改进模型发布。
AI编程Agent开源模型
推荐理由:开源自主编程模型,可直接对比Codex任务委派与修Bug能力。
🎯 给屿鹿的选题角度:实测Ornith-1.0 vs Codex:布置相同编码任务,对比成功率、代码质量与易用性;小红书图文展示差异,社群布置作业。
00:17Simon Willison精选 · 80

Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding

开源模型 Ornith-1.0 发布,基于 Gemma 和 Qwen,专为代理编码设计,有 9B 到 397B 多种规模。
Ornith-1代理编码开源模型AI编程
推荐理由:首个专注自我脚手架代理编码的开源模型,可与 Codex 等对比,适合做成实测选题。
🎯 给屿鹿的选题角度:实测 Ornith-1.0 在简单编程任务上的表现,对比 Codex/Claude Code,突出各自优劣;做成小红书图文或视频号教程,教社群成员部署试用。
2026-06-29
05:42The Verge AI精选 · 40

China’s Z.ai claims it can match Mythos on cybersecurity

智谱AI发布开源GLM-5.2,在网络安全漏洞发现上号称媲美Mythos。
GLM-5.2网络安全开源模型
2026-06-27
20:19量子位精选 · 30

CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

杭州团队发布全球首个端侧流式多模态模型,落地CVPR 2026热门方向。
端侧模型多模态CVPR
09:53量子位精选 · 80

GPT-5.6突然发布!Fable5痛失最强基模王座

第三方基准测试出现GPT-5.6模型,性能超越Fable5等对手,可能为OpenAI新模型。
GPT-5.6基准测试OpenAI
推荐理由:OpenAI新模型动向,可做性能对比和实操选题。
🎯 给屿鹿的选题角度:实测GPT-5.6在文案、翻译、编程等任务中的表现,与GPT-4o对比,分析是否值得升级,适合小红书图文。
04:32OpenAI Codex Commits精选 · 90

feat: add GPT-5.6 variants to Bedrock catalog (#30285)

OpenAI Codex 仓库提交显示添加 GPT-5.6 系列模型(Sol/Terra/Luna)至 Amazon Bedrock
GPT-5.6OpenAI模型发布Amazon B
推荐理由:透露 OpenAI 即将推出 GPT-5.6 新模型,可能带来能力与价格变化,值得跟踪
🎯 给屿鹿的选题角度:做“GPT-5.6 前瞻:新模型可能带来哪些能力升级?对普通人意味着什么?” 追踪后续进展,对比现有模型,在社群或小红书出预测与解读
01:10Simon Willison精选 · 100

Quoting OpenAI

OpenAI 预览 GPT-5.6 系列,包括旗舰 Sol、均衡 Terra 和低成本 Luna,性能更强且更便宜。
GPT-5.6OpenAI 更模型预览价格对比
推荐理由:GPT-5.6 系列发布,包含旗舰和性价比模型,创作者可立即对比实测,判断对提效的价值。
🎯 给屿鹿的选题角度:实测 GPT-5.6 Sol/Terra/Luna 对比 GPT-5.5 和旧版,做差异评测,适合“普通人是否值得升级”的选题,可出小红书图文或社群教程。
01:06Hacker News精选 · 90

Previewing GPT‑5.6 Sol: a next-generation model

OpenAI 官方预览下一代模型 GPT-5.6 Sol,性能与新功能或大幅提升。
GPT模型OpenAI新模型发布
推荐理由:重大模型更新,适合做实测对比、社群教程,吸引目标受众关注。
🎯 给屿鹿的选题角度:制作“GPT-5.6 Sol 实测”对比图文/视频,展示新能力与旧版差异,设计社群作业让成员体验,突出对普通人的提效价值。
01:01The Verge AI精选 · 100

OpenAI unveils GPT-5.6 amid US AI regulatory drama

OpenAI 在监管压力下发布 GPT-5.6 系列 Sol、Terra、Luna,延续模型迭代节奏。
GPT-5.6 OpenAI监管Sol/Terr
推荐理由:监管背景提供话题性,可结合发布做“合规压力下的模型发布”角度,但核心仍是新模型。
🎯 给屿鹿的选题角度:做“监管压力下 OpenAI 仓促发布 GPT-5.6?实测对比是否值得用”的选题,突出监管故事和新模型能力,适合视频号口播。
2026-06-26
18:00OpenAI精选 · 100

Previewing GPT-5.6 Sol: a next-generation model

OpenAI 正式预览 GPT-5.6 Sol,强化编码、科学和网络安全能力,并配备最强安全措施。
GPT-5.6Sol 模型编码能力安全
推荐理由:官方详细说明 GPT-5.6 编码能力,屿鹿可直接据此制作 Codex 相关课程,探讨新模型对自动编程的提升。
🎯 给屿鹿的选题角度:结合官方演示,实测 GPT-5.6 Sol 在 Codex 任务中的表现,与 GPT-5 对比,给出“升级是否提升编程体验”的结论,适合社群直播或视频。
14:55量子位精选 · 40

Claude Fable 5分批重新上线!GPT-5.6秒跟

消息称Claude Fable 5分批重新上线,暗示GPT-5、6将快速跟进,真实性存疑。
ClaudeGPT模型竞争
04:28OpenAI Codex Releases精选 · 70

rust-v0.143.0-alpha.23

OpenAI Codex 发布 Rust 版 v0.143.0-alpha.23。
CodexRustAlpha 发布
推荐理由:Codex 新版本,可关注 Rust 语言支持对开发者的意义。
🎯 给屿鹿的选题角度:可以做一篇「Codex 支持 Rust 了,对普通用户意味着什么?」的解读,说明 Codex 是什么、Rust 版可能带来的新能力,适合图文或口播。
2026-06-25
00:30DeepMind精选 · 80

Introducing computer use in Gemini 3.5 Flash

Gemini 3.5 Flash新增computer use功能,可操控桌面应用。
GeminiComputer多模态自动化
推荐理由:可与OpenAI的Codex或Operator对比,适合做实测教程。
🎯 给屿鹿的选题角度:选题:Gemini 3.5 Flash computer use vs Codex CLI/Operator:普通人用哪个自动化电脑操作?可做小红书图文或视频号实测对比,社群可布置作业尝试。
2026-06-24
11:31Hacker News精选 · 50

Sakana Fugu: a multi-agent system delivered as one model

Sakana AI 发布 Fugu 多 Agent 系统,将多个代理合并为一个端到端模型。
多Agent系统模型发布Sakana A
01:50Hacker News精选 · 30

FUTO Swipe – A new swipe typing model

FUTO 推出新的滑动输入 AI 模型。
滑动输入AI 模型FUTO
2026-06-23
21:37量子位精选 · 80

刚刚,豆包2.1发布!Agent自己跑18个小时搞定芯片设计代码

豆包2.1发布,Agent自主完成芯片设计代码,编程能力媲美Opus 4.7。
豆包AI编程Agent竞品对比
推荐理由:可与Codex做编程对比实测,为社群提供选型参考。
🎯 给屿鹿的选题角度:实测豆包2.1 vs Codex在自动化编程任务上的效率与质量,制作对比图文或短视频,给出“普通人选哪个更划算”的结论。
16:5936氪精选 · 80

豆包发布2.1 Pro模型,中文综合能力再升级

豆包发布2.1 Pro模型,中文综合能力提升,支持128K上下文。
豆包大模型2.1 Pro发布
推荐理由:字节跳动的豆包新模型,适合做国内大模型实测对比选题。
🎯 给屿鹿的选题角度:快速实测豆包2.1 Pro:用它写文案、做选题、总结长文,对比Claude/GPT,拍成视频口播(突出哪项任务可替代人工),落点「选对模型省一半成本」。
14:35MarkTechPost精选 · 80

GLM-5.2 OpenAI-Compatible API: A Hands-On Guide to Reasoning Effort, Function Calling, and Long-Context Retrieval

智谱GLM-5.2开放API,支持推理控制、函数调用与长上下文检索。
GLM-5.2函数调用推理控制Agent
推荐理由:新模型API实测教程,直接命中Agent/工作流赛道,可做对比评测吸粉。
🎯 给屿鹿的选题角度:制作视频号口播,实测GLM-5.2的函数调用与推理模式,对比Claude/GPT在自动化工作流中的表现,突出降本增效。
14:1336氪精选 · 90

火山引擎总裁谭待:字节内部已大规模落地AI Coding生产流程

字节豆包2.1Pro在AI Coding评测中超越Anthropic,已内部大规模用于生产,包括芯片RTL开发。
豆包2.1ProAI Codin大模型评测生产级AI
推荐理由:豆包模型能力跃进,具实测引子,适合做对比测评,吸引老板、技术人关注提效。
🎯 给屿鹿的选题角度:选题:豆包2.1Pro vs Claude写代码能力实测。拍摄真实编程任务(如写脚本、调试)对比视频,口播评述,强调「一人公司用国产模型提效降本」。落点:程序员或非技术者用AI写代码的可能。
12:5736氪精选 · 90

豆包发布2.1 Pro模型

火山引擎发布豆包2.1 Pro,Coding/Agent/VLM能力跃升
豆包大模型Agent火山引擎
推荐理由:豆包2.1 Pro强化Agent能力,直接关联一人公司提效与AI工作流搭建
🎯 给屿鹿的选题角度:实测豆包2.1 Pro的Agent功能,设计一个自动生成小红书图文+封面+文案的工作流,对比旧版或其他模型,口播演示或图文拆解,突出「一人顶团队」的提效效果
09:36Hacker News精选 · 90

OpenAI DayBreak – GPT-5.5-Cyber

OpenAI发布DayBreak项目推出GPT-5.5-Cyber,或为安全领域新模型。
OpenAIGPT-5.5DayBreak
推荐理由:若为新模型发布,对AI实操测评极为重要,可第一时间实测出圈。
🎯 给屿鹿的选题角度:选题:OpenAI新模型DayBreak测评。第一时间上手体验,演示功能,与之前模型对比,做小红书图文+视频号口播,强调对写内容、编程的提效。
07:43Simon Willison精选 · 90

Porting the Moebius 0.2B image inpainting model to run in the browser with Claude Code

Moebius 0.2B轻量图像修复模型已移植至浏览器,实现客户端AI修复。
AI生图图像修复浏览器轻量模型
推荐理由:小型模型浏览器运行,无需GPU,适合创作者快速修复图片,可做实测演示。
🎯 给屿鹿的选题角度:实录:用浏览器版Moebius一键移除照片杂物、修复老照片,对比PS操作,展现AI降本增效。适合小红书图文教程或视频号实操口播,强调“一人公司免费用AI修图”。
02:42MarkTechPost精选 · 80

Sakana AI Launches Sakana Fugu: An Orchestration Model That Routes Tasks Across a Swappable Pool of Frontier LLMs

Sakana AI发布Fugu和Fugu Ultra,可跨模型池路由任务,在编程、推理和智能体基准测试领先。
AI智能体模型发布任务路由Sakana A
推荐理由:新型任务路由模型Fugu,可跨多个LLM分配任务,提升智能体效率。
🎯 给屿鹿的选题角度:实测Fugu路由不同LLM执行任务的效果,与单一模型对比,制作小红书图文教程,落点:用AI智能体提效一人公司工作流。
2026-06-22
21:53Hacker News精选 · 90

Moebius: 0.2B image inpainting model with 10B-level performance

Moebius发布0.2B图像修复模型,性能比肩10B,轻量高效。
AI生图图像修复轻量模型实测新工具
推荐理由:可实测演示轻量修图模型,展示对内容创作者的一人团队提效价值。
🎯 给屿鹿的选题角度:实测Moebius图片去水印、物体消除效果,对比传统PS和重级模型。小红书图文出修复前后对比,视频口播教用,落点“修图不用设计师,这个AI一分钟搞定”。
15:30量子位精选 · 90

阿里发布视频生成模型HappyHorse 1.1:五大维度全面升级

阿里发布视频生成模型 HappyHorse 1.1,宣称在五大维度全面升级。
视频生成阿里HappyHorAI生视频
推荐理由:视频生成赛道新模型,可直接实测对比,适合展示一人公司用 AI 高效创作视频。
🎯 给屿鹿的选题角度:制作 HappyHorse 1.1 实测视频:用它生成同一脚本的片段,与可灵、Sora 对比生成速度、画面一致性、运镜控制,以口播+屏幕录制发布视频号,突出“一个人搞定宣传片”的提效场景。
15:22Hacker News精选 · 70

GLM 5.2 vs. Opus

GLM 5.2 与 Opus 模型对比评测,涵盖能力、性能实测。
模型对比GLM 5.2Opus实测
推荐理由:大模型横向对比,可直接转化为实测选题,吸引技术受众。
🎯 给屿鹿的选题角度:制作小红书图文或视频号口播,实测 GLM 5.2 与 Opus 在文案生成、商业分析等场景的表现,用数据展示降本增效潜力。
14:5936氪精选 · 90

阿里巴巴发布视频生成模型HappyHorse 1.1

阿里发布视频生成模型HappyHorse 1.1,大幅提升动态、一致性和音频能力。
视频生成阿里模型升级
推荐理由:最新视频生成模型发布,可做实测对比,直接服务创作者降本增效。
🎯 给屿鹿的选题角度:实测HappyHorse 1.1:用同一指令对比旧版/其他工具,展示动态与一致性提升。小红书图文出效果对比图+参数,视频号口播讲解亮点与用法,引导关注AI视频创作提效。
11:48量子位精选 · 90

入选ECCV 2026!清华开源空间模型打败Gemini:真正的空间智能是在世界变化中持续学习

清华开源空间模型入选ECCV 2026,可处理120分钟长视频,性能优于Gemini。
空间智能开源模型长视频理解ECCV2026
推荐理由:开源模型可直接用于长视频分析,为创作者提供新的AI提效工具,实测选题价值极高。
🎯 给屿鹿的选题角度:第一时间实测该模型:用一条120分钟课程或直播录像,对比传统分段理解与全量处理效果,展示如何快速生成摘要和剪辑点,落点在一人高效处理长素材。适合视频号口播和小红书图文拆解。
10:08Hacker News精选 · 80

Sakana Fugu

Sakana发布Fugu新AI模型,可能为新一代大模型或进化算法产品
SakanaFugu新模型AI智能体
推荐理由:Sakana新模型发布,适合实测对比,为创作者提供降本增效工具测评。
🎯 给屿鹿的选题角度:小红书图文/视频号口播:第一时间实测Fugu模型,与Claude/GPT等对比,展示其在内容创作、工作流等方面的能力,突出提效优势。
07:4036氪精选 · 80

中信建投:国产模型加速迭代,算力景气度持续

国产模型GLM-5.2与Kimi K2.7 Code强化Agent能力与长上下文
国产大模型Agent代码能力长上下文
推荐理由:国产模型在Agent和长上下文能力提升显著,可实测用于内容提效
🎯 给屿鹿的选题角度:实测Kimi K2.7 Code的Agentic Coding,演示如何用它自动生成小红书文案或剪辑脚本,拍摄口播视频展示流程。
05:29Hacker News精选 · 60

Apertus – Open Foundation Model for Sovereign AI

Apertus发布用于主权AI的开源基础模型。
开源模型基础模型Apertus
推荐理由:新开源模型可测试,适合做实测对比内容。
🎯 给屿鹿的选题角度:下载并实测Apertus模型,与Llama等主流开源模型对比性能,制作小红书图文或视频,突出零成本本地部署降本增效。
2026-06-20
18:42量子位精选 · 60

撸猫撸出SOTA!3个00后2个月,造出史上最快流式音视频社交模型

三个00后开发出最快流式音视频社交模型,速度7倍于Veo3,成本仅1/2000。
AI 视频流式生成新模型成本优势
推荐理由:宣称性能大幅超越Veo3,有望成为AI视频创作新选择,待实测验证。
🎯 给屿鹿的选题角度:若模型公开,可做“AI视频新王?实测对比Veo3”的小红书图文或视频号口播,突出一人公司提效。
06:06MarkTechPost精选 · 80

VibeThinker-3B: A 3B Dense Reasoning Model Built on Qwen2.5-Coder-3B With the Spectrum-to-Signal Post-Training Pipeline

VibeThinker-3B: 3B参数推理模型开源,性能比肩DeepSeek V3.2和Kimi K2.5。
小模型推理模型VibeThin开源
推荐理由:小模型性能强劲,适合一人公司低成本部署,可做实测内容。
🎯 给屿鹿的选题角度:实测VibeThinker-3B与DeepSeek等大模型在推理任务上的表现,突出“3B战胜大模型”的降本增效,适合小红书图文或视频号。
2026-06-19
09:58Hacker News精选 · 90

GLM-5.2: The Most Powerful Open Model yet and the Brutal Reality of Running It

GLM-5.2号称最强开源模型,但本地运行挑战重重
大模型开源GLM-5.2实测
推荐理由:可做实测对比与本地部署教程,契合AI智能体赛道
🎯 给屿鹿的选题角度:一期视频/图文:实测GLM-5.2性能,对比其他开源模型,并给出本地运行配置建议,落点「个人/小团队如何低成本用上最强开源模型」
2026-06-18
19:00OpenAI精选 · 20

Improving health intelligence in ChatGPT

OpenAI推出GPT-5.5 Instant,提升ChatGPT健康咨询的推理与沟通质量。
GPT-5.5健康AI模型更新
17:39量子位精选 · 50

ABot-Earth0.5登顶Hugging Face论文三榜第一,获国际图形学权威陈宝权好评

ABot-Earth0.5模型登顶Hugging Face论文榜,可导入Unity等主流引擎交互开发。
3D生成图形学交互开发
14:17Hacker News精选 · 80

DeepSeek Introduces Vision

DeepSeek 模型新增视觉能力,支持图像输入。
DeepSeek多模态视觉模型AI实测
推荐理由:DeepSeek 作为热门国产模型,新增视觉功能,是实测演示的绝佳选题。
🎯 给屿鹿的选题角度:制作视频/图文实测 DeepSeek 视觉功能:上传截图、图表或手写笔记,测试其理解与分析能力,可与 GPT-4V 对比,落点“用 AI 省掉设计/数据分析外包”。
07:58Simon Willison精选 · 90

GLM-5.2 is probably the most powerful text-only open weights LLM

Z.ai发布开源大模型GLM-5.2,753B参数,1.51TB,采用MIT许可。
GLM-5.2开源大模型Z.ai
推荐理由:国产开源巨型模型,实测对比潜力大,契合AI Agent赛道的内容选题。
🎯 给屿鹿的选题角度:选题:GLM-5.2 vs Claude/GPT 实测,聚焦文案生成、策划提效,小红书图文+视频号演示,突出“免费调用顶级模型降本增效”。
2026-06-17
20:0436氪精选 · 80

微软正考虑接入深度求索模型赋能Copilot协同办公工具

微软正测试深度求索V4等开源模型作为Copilot低成本备选方案,以替代OpenAI和Anthropic模型
微软深度求索Copilot大模型
推荐理由:微软拥抱国产开源模型,话题性强,可做低成本方案实测对比
🎯 给屿鹿的选题角度:实测深度求索V4在办公场景的能力,对比GPT-4o,突出‘省钱提效’,适合小红书图文/视频口播,标题如“微软都搞的国产模型,打工人用起来”
17:12Hacker News精选 · 90

GLM-5.2 is the new leading open weights model on Artificial Analysis

GLM-5.2成为Artificial Analysis评测中领先的开源权重模型。
大模型开源GLM-5.2评测
推荐理由:国产开源模型登顶评测榜单,强性价比和中文能力适合实测。
🎯 给屿鹿的选题角度:标题:GLM-5.2 开源模型实测,到底能不能打?内容:用GLM-5.2与Claude、GPT做写作、策划、编程等任务对比,突出性价比和中文优势,小红书图文/视频号口播,落点:一人公司选模型省钱提效。
17:01Hugging Face精选 · 90

GLM-5.2: Built for Long-Horizon Tasks

智谱发布GLM-5.2模型,专为长周期任务打造,可能具备更强复杂推理与规划能力。
GLM-5.2智谱长任务大模型
推荐理由:新模型主打长周期任务,可实测对比Claude等,切中一人公司复杂项目提效需求。
🎯 给屿鹿的选题角度:视频号口播+小红书图文:用GLM-5.2策划一场线上活动,对比其他模型,展示其长链条推理能力,标题如《新一代长任务AI来了!GLM-5.2能让一人公司效率翻倍吗?》
16:0236氪精选 · 90

国家超算互联网上线GLM-5.2模型服务

智谱开源旗舰模型GLM-5.2,国家超算互联网同步上线API及模型文件。
大模型开源GLM-5.2超算互联网
推荐理由:国产大模型开源可实测,适合创作测评对比内容。
🎯 给屿鹿的选题角度:实测GLM-5.2在文案、数据分析等任务上的表现,对比DeepSeek等同级模型,做成小红书图文或视频,强调免费开源、一人公司提效。
15:30Hacker News精选 · 80

GLM 5.2 Performance Benchmarks

GLM 5.2模型性能基准测试结果公布,展现最新国产大模型能力。
GLM 5.2大模型基准测试国产模型
推荐理由:国产模型GLM 5.2实测数据新鲜,可直接作为AI智能体赛道素材,对比测评潜力大。
🎯 给屿鹿的选题角度:标题:GLM 5.2 vs GPT-4o 实测对比:中文任务谁更强?形式:小红书图文,展示写作、逻辑、编码等典型场景截图,结尾总结一人公司选用建议,强调降本增效。
13:59量子位精选 · 80

Grok 4.3现已在Amazon Bedrock上正式可用

xAI的Grok 4.3模型上线Amazon Bedrock,用户可通过API调用。
Grok模型发布Amazon B
推荐理由:新模型可用,可实测并对比主流模型,吸引关注AI工具提效的受众。
🎯 给屿鹿的选题角度:选题“Grok 4.3实测对比:又多一个强模型可选?”,录制视频展示在Bedrock调用Grok完成选题、脚本生成,与GPT-4o、Claude对比质量与风格,落点帮创作者选模型提效。
13:4536氪精选 · 60

xAI Grok 4.3现已在Amazon Bedrock上正式可用

xAI Grok 4.3模型在Amazon Bedrock正式可用,面向企业构建生成式AI应用。
Grok大模型云服务
推荐理由:Grok 4.3可用于企业工作流,关注其Agent能力。
🎯 给屿鹿的选题角度:可制作「Grok 4.3实测:在Bedrock搭建AI助手」的内容,演示内容生成或Agent场景,但需实际测试环境。
13:3036氪精选 · 70

摩尔线程完成智谱GLM-5.2 Day-0适配

摩尔线程宣布在MTT S5000上完成智谱GLM-5.2模型Day-0适配,优化长上下文推理。
智谱GLM-5.国产GPU模型适配长上下文
推荐理由:智谱新开源旗舰模型发布,国产芯片快速适配,是测评国产AI生态的机会。
🎯 给屿鹿的选题角度:可做一期对比实测:GLM-5.2在不同平台(英伟达vs摩尔线程)上的推理速度与效果,突出国产方案降本潜力,适合小红书图文。
10:42量子位精选 · 90

刚刚,Fable-5之下,智谱开源的GLM-5.2拿下AI编程第一!

智谱开源GLM-5.2模型,拥有1M上下文,在AI编程排行榜中夺冠。
GLM-5.2开源模型AI编程大模型实测
推荐理由:国产开源大模型重大突破,编程能力登顶,适合做测评与提效教程。
🎯 给屿鹿的选题角度:实测对比GLM-5.2与Claude Sonnet在真实代码任务上的表现,制作视频口播或图文教程,突出其1M上下文在长代码维护中的降本增效场景。
09:5836氪精选 · 80

沐曦股份曦云C系列GPU Day 0 适配智谱GLM-5.2旗舰模型

智谱AI开源旗舰大模型GLM-5.2,沐曦曦云C系列GPU完成Day 0适配。
智谱AIGLM-5.2开源大模型GPU适配
推荐理由:国产新旗舰开源模型,适合做实测对比内容,吸引关注AI提效的创业者和内容创作者。
🎯 给屿鹿的选题角度:录制GLM-5.2与DeepSeek/其他模型在文案生成、数据分析等场景的对比实测,突出效率与成本,发布小红书图文对比。
09:1336氪精选 · 40

「逆矩阵」完成超亿美元融资,创始人:通用世界基座模型窗口期已压至18个月

世界模型公司逆矩阵完成超亿美元融资并发布通用基座模型Physis-v0.1
世界模型融资基座模型
01:54Hacker News精选 · 30

GPT‑NL: a sovereign language model for the Netherlands

TNO发布荷兰语国家主权语言模型GPT-NL,用于政府和研究。
GPT-NL主权AI荷兰语模型
00:51MarkTechPost精选 · 30

Meet Qwen-RobotSuite: Three Embodied AI Models for VLA Manipulation, Video World Modeling, and Navigation

Qwen-RobotSuite发布三款具身模型:操作、视频世界建模、导航
具身智能Qwen机器人
2026-06-16
22:50Hacker News精选 · 50

Subquadratic – Introducing SubQ 1.1 Small

SubQ 1.1 Small模型发布,优化二次方注意力机制。
SubQ 1.1注意力优化
21:15Hacker News精选 · 30

Qwen-Robot Suite: A Foundation Model Suite for Physical World Intelligence

Qwen发布具身智能模型套件:操作、世界建模、导航
具身智能Qwen机器人
12:39量子位精选 · 40

三连发!阿里发布首个具身大模型Qwen-Robot系列

阿里发布首个具身大模型Qwen-Robot系列,实现边走边看边思考
具身智能大模型阿里
12:3336氪精选 · 90

阿里发布首个具身大模型Qwen-Robot系列

阿里发布首个具身大模型Qwen-Robot系列,含操作、移动和世界模型。
具身智能大模型机器人阿里
推荐理由:阿里首次推出完整具身智能模型系列,可实测其操作、导航能力,符合Agent赛道。
🎯 给屿鹿的选题角度:小红书图文/视频号口播实测Qwen-RobotManip:用文字指令让机器人完成抓取任务,对比GPT-4o等具身方案,突出“一人操控机器人团队”的提效潜力。
03:05The Verge AI精选 · 90

All the news about Anthropic’s new AI fight with the White House

Anthropic发布新模型Fable 5与Mythos 5,白宫要求限制外国访问。
大模型发布AnthropiAI监管
推荐理由:Anthropic新模型是AI测评必追热点,实测对比能吸引高关注。
🎯 给屿鹿的选题角度:立刻上手实测Fable 5/Mythos 5,与Claude、GPT-4o等对比写作、代码、逻辑推理能力,制作小红书图文/视频号口播,突出“一人公司选模型”指南。
2026-06-15
21:5636氪精选 · 80

智谱推出最新旗舰模型GLM-5.2

智谱发布最新旗舰模型GLM-5.2,细节尚未公布。
国产大模型GLM-5.2模型发布
推荐理由:国产新旗舰模型,可做实测对比测评。
🎯 给屿鹿的选题角度:可快速获取内测资格,制作「GLM-5.2 实测」图文或视频,对比 Claude/GPT,突出其特色与提效场景。
14:52量子位精选 · 80

4步出声,单卡0.24秒!Noiz AI联合港科大清华,开源音频生成大模型

Noiz AI联合港科大清华开源音频生成大模型,4步出声,单卡0.24秒。
音频生成开源模型AI配音大模型
推荐理由:开源高速音频生成模型,适合视频创作者低成本制作配音和音效,提效明显。
🎯 给屿鹿的选题角度:实测Noiz AI音频生成:输入文本秒出多语言配音,支持时间戳对齐视频。对比ElevenLabs,展示‘单卡0.24秒’实时性,制作‘如何用AI一人完成视频配音全流程’教程,突出降本增效。
14:10MarkTechPost精选 · 80

Z.ai Launches GLM-5.2 With a Usable 1M-Token Context, Two Thinking-Effort Levels, and No Benchmarks at Launch

Z.ai发布GLM-5.2模型,支持100万token上下文和双思考层级,未公开基准测试。
大模型发布Agent长上下文实测
推荐理由:百万token上下文新模型,适合做长文档处理实测,吸引创业者关注。
🎯 给屿鹿的选题角度:实测GLM-5.2 vs 竞品在长文本理解、代码生成上的表现,制成对比视频或图文,强调一人在AI协助下完成复杂任务的提效效果。
12:55Hacker News精选 · 90

Apple Foundation Models

Apple 基础模型通过 Claude 平台开放,开发者可直接调用多种 Apple 模型。
Apple模型Claude平台模型发布AI对比
推荐理由:Apple 正式推出基础模型并开放使用,可做第一手实测对比。
🎯 给屿鹿的选题角度:小红书图文/视频号:快速上手 Apple 基础模型,测试其在文案生成、数据解读、创意脚本等任务的实际效果,对比 ChatGPT 和 Claude,给出一人团队选型建议。
12:5136氪精选 · 90

智谱:公司已推出最新一代旗舰模型GLM-5.2

智谱发布旗舰模型GLM-5.2,支持百万token上下文,将MIT协议开源。
智谱GLM-5.2开源长上下文
推荐理由:最新国产开源大模型,长上下文能力突出,适合实测对比选题。
🎯 给屿鹿的选题角度:制作GLM-5.2与Kimi/ChatGLM长文本理解对比实测,展示论文、报告总结效果,突出内容创作者提效,适合小红书图文或视频号口播。
11:24量子位精选 · 70

智源大会 | 天工AI重新定义世界模型,公布Matrix-Game 3.5 最新技术突破

昆仑万维在智源大会公布天工AI与Matrix-Game 3.5模型,称重新定义世界模型。
天工AI世界模型Matrix-GAI视频
推荐理由:世界模型可能颠覆AI视频生成,值得实测其效果,选题契合AI生视频赛道。
🎯 给屿鹿的选题角度:选题:实测天工AI Matrix-Game 3.5生成视频效果,对比现有工具,突出“一人公司”用AI做视频的降本增效。形式:小红书图文/视频号口播。
2026-06-14
22:38Hacker News精选 · 70

Rio de Janeiro's city government model Rio3.5 beats Qwen3.7 in recent benchmarks

里约市政府模型Rio3.5在基准测试中击败通义千问3.7
模型发布基准测试Rio3.5Qwen3.7
推荐理由:新开源模型声称超越Qwen3.7,可实测对比吸引关注
🎯 给屿鹿的选题角度:实测Rio3.5与Qwen3.7在写作、翻译等任务上的表现,制作对比图文/视频,突出免费模型助力一人公司提效
00:18Hacker News精选 · 80

GLM 5.2 Is Out

智谱发布GLM 5.2大模型,可能带来性能提升与新能力。
大模型发布GLM智谱AI
推荐理由:新模型发布提供实测素材,可对比主流模型制作吸睛内容。
🎯 给屿鹿的选题角度:立即实测GLM 5.2在文案、数据分析等任务上的表现,与GPT-4o、Claude对比,制作「一人公司选哪个模型」视频/图文,突出降本增效。
00:18Hacker News精选 · 90

GLM 5.2 Is Out

智谱发布 GLM 5.2 模型,性能提升,支持 128K 上下文,免费可用。
GLM 5.2智谱大模型新发布
推荐理由:国产最新模型发布,可做实测对比内容,吸引关注AI工具的创业者和创作者。
🎯 给屿鹿的选题角度:制作 GLM 5.2 实测视频:对比 GPT-4o 在文案写作、数据分析、代码生成等任务上的表现,突出免费优势,带出“一人公司提效”落点,发布小红书图文和视频号口播。
2026-06-13
20:40量子位精选 · 50

HuggingFace CEO力荐,Bengio团队也押注:这个1500美元训出的HRM模型,凭什么火了?

HuggingFace CEO力荐的HRM模型,仅1B参数,训练成本1500美元,由Bengio团队参与。
HRM模型小模型训练成本HuggingF
16:1636氪精选 · 70

科大讯飞发布星火多模态大模型X2-VL

科大讯飞发布星火多模态大模型X2-VL,面向具身智能场景。
讯飞星火多模态大模型具身智能
推荐理由:国产多模态新模型,可能具备图文理解和生成能力,适合实测对比。
🎯 给屿鹿的选题角度:若开放API,可实测星火X2-VL的图文理解与生成效果,与GPT-4o、Claude等对比,输出小红书图文测评,突出对内容创作者的提效价值。
15:3136氪精选 · 60

智谱:GLM-5.2将面向GLM Coding Plan全量用户开放

智谱发布GLM-5.2编码模型,今晚向Coding Plan全量用户开放,API下周上线,下周开源(MIT协议)。
智谱GLM-5.2开源代码模型
推荐理由:新模型开源可实测,适合关注国产模型和代码生成能力的AI内容创作者。
🎯 给屿鹿的选题角度:下周开源后实测GLM-5.2的代码生成能力,与Claude/GPT对比,制作对比评测视频或图文,标题如《国产开源代码模型GLM-5.2实测:一人公司写代码能提效多少?》,突出对非技术创业者写简单脚本的辅助。
12:57MarkTechPost精选 · 80

Moonshot AI Releases Kimi K2.7-Code: a Coding Model Reporting +21.8% on Kimi Code Bench v2 Over K2.6

Moonshot AI开源Kimi K2.7-Code模型,代码能力提升21.8%,推理token减少30%。
模型发布Kimi代码模型Agent
推荐理由:新模型发布,代码能力显著提升,可关联Agent工作流与提效。
🎯 给屿鹿的选题角度:实测Kimi K2.7-Code在自动化内容生产(如脚本生成、数据处理)中的效果,对比上代版本,制作小红书图文或视频号口播,突出“一人公司提效”落点。
12:4636氪精选 · 40

摩尔线程:完成MiniMax M3大模型适配

MiniMax M3原生多模态模型开源,摩尔线程完成Day-0适配。
MiniMax开源模型多模态大模型发布
11:0036氪精选 · 60

魔法原子上交会首秀VLA K02大模型

魔法原子发布自研Magic-VLA K02大模型与Magic-Mix世界模型
VLA大模型机器人世界模型
推荐理由:VLA大模型是智能体从语言到动作的关键,可能影响机器人Agent发展
🎯 给屿鹿的选题角度:可科普VLA模型如何让AI从对话到物理行动,与常规LLM对比,但主题偏离创作者核心,适合作为行业动态简讯
05:04MarkTechPost精选 · 50

Google Releases Gemini-SQL2: Gemini 3.1 Pro Text-to-SQL Scores 80.04% on BIRD Single-Model Leaderboard

Google推出Gemini-SQL2,文本转SQL准确率80.04%领跑BIRD排行榜
Gemini文本转SQLAI Agent
2026-06-12
18:42Hacker News精选 · 90

Kimi K2.7-Code: open-source coding model with better token efficiency

Moonshot AI发布开源编程模型Kimi K2.7-Code,号称有更好的token效率。
Kimi开源模型编程模型Token效率
推荐理由:新模型发布,实测对比编程能力或效率,贴合创作者AI实操测评定位,能转化为提效选题。
🎯 给屿鹿的选题角度:选题:实测Kimi K2.7-Code编程能力,对比DeepSeek Coder等,展示用AI写自动化脚本提效。小红书图文/视频号口播,落点:一人公司如何用AI编程省成本。
16:06MarkTechPost精选 · 60

Zyphra Release Zamba2-VL: Hybrid Mamba2–Transformer Vision-Language Models That Cut Time-to-First-Token by About an Order of Magnitude

Zyphra发布开源混合Mamba2-Transformer视觉语言模型Zamba2-VL,首token延迟降低约一个数量级。
视觉语言模型开源混合架构
推荐理由:新开源VLM大幅降低延迟,适合需要快速响应的AI内容生成场景。
🎯 给屿鹿的选题角度:短视频实测Zamba2-VL生成图片/文案的速度与质量,对比主流模型,突出效率优势,展示AI如何帮助内容创作者快速出片。
12:13量子位精选 · 70

“智能体最后的考试”,Fable 5竟然不敌GPT 5.5

Fable游戏评测显示,GPT-5.5在智能体任务中超越Fable 5,但最难关卡均得零分。
AI智能体大模型评测GPT-5.5Fable
推荐理由:大模型智能体能力对比评测,适合做实测选题吸引技术创业者。
🎯 给屿鹿的选题角度:选题:实测主流模型在Fable中的智能体表现,对比推理与交互能力。小红书图文拆解测试过程,视频号口播复盘结果,强调AI提效潜力和适用边界。
09:06Hacker News精选 · 90

Claude Fable is relentlessly proactive

Simon Willison发文称Claude Fable非常积极主动,可能预示Claude模型的新代理功能。
ClaudeAgentSimon WiAI模型
推荐理由:Claude新特性或版本可能在主动性和代理能力上有突破,适合做实测演示。
🎯 给屿鹿的选题角度:视频号口播实测Claude Fable的主动性:让它自动监控邮件、生成内容提纲,展示“一人公司”如何用AI主动管理任务,标题可做“Claude新功能,你的AI助手开始主动干活了”。
2026-06-11
22:27Hacker News精选 · 30

MiMo Code Is Now Released and Open-Source

小米开源MiMo代码模型/工具,Hacker News关注度低。
开源代码模型小米
21:14Hacker News精选 · 70

Open Reproduction of DeepSeek-R1

Hugging Face发起Open-R1项目,目标完整复现DeepSeek-R1推理模型。
DeepSeek开源复现推理模型
推荐理由:开源复现降低使用门槛,有望催生更多轻量版推理模型,适合一人公司实验部署。
🎯 给屿鹿的选题角度:解读Open-R1项目进度与R1特性,实测对比开源方案,演示本地部署或API接入后如何辅助内容决策与数据分析,突出个人创作者零成本提效。
16:5436氪精选 · 40

腾讯混元 AI Infra 新开源:HPC-Ops 推理核心算子全面升级

腾讯混元开源HPC-Ops推理核心算子升级,优化Attention延迟与显存等问题。
模型优化推理加速开源
16:33MarkTechPost精选 · 80

Meet ‘North Mini Code’: Cohere’s 30B Open-Weight Mixture-of-Experts Model With 3B Active Parameters for Agentic Coding

Cohere发布开源30B MoE编程模型North Mini Code,3B活跃参数,256K上下文,专为智能体编程设计。
Cohere编程模型MoE智能体
推荐理由:开源轻量级编程模型,极低部署成本,适合一人公司实测与集成。
🎯 给屿鹿的选题角度:实测North Mini Code在自动修Bug、代码生成上的效果,与Claude Code对比,制作“一人公司零成本AI编程助手”教程,发小红书图文+视频号。
12:17量子位精选 · 80

Mythos阴影里谷歌悄悄发模型,速度暴涨4倍

谷歌发布新模型,采用扩散模型生成文字,速度提升 4 倍。
谷歌扩散模型文字生成
推荐理由:速度显著提升,对大量文本生成场景有直接提效价值,适合实测对比。
🎯 给屿鹿的选题角度:横向测评谷歌新模型与 GPT-4o/Claude 3.5 的生成速度与质量,重点测公众号、短视频文案等任务,突出“一人公司”效率翻倍,视频号口播。
09:18量子位精选 · 80

实测小米最快1T大模型:吞吐量每秒1000+ Tokens,Vibe Coding七秒交付

实测小米最快1T大模型:通用GPU每秒1000+ Tokens吞吐,Vibe Coding七秒交付
小米大模型实测推理速度Vibe Cod
推荐理由:国产模型推理速度重大突破,实测数据可直观对比,适合做性能验证与提效演示
🎯 给屿鹿的选题角度:出一条「实测小米1T大模型:1000 Tokens/秒能做什么?」视频,跑本地/云端对比,展示Vibe Coding七秒生成网页,落点一人开发效率。
08:0436氪精选 · 90

谷歌推出DiffusionGemma开源模型

谷歌开源DiffusionGemma,文本生成速度提升4倍,但输出质量低于Gemma 4。
谷歌Diffusio文本生成开源模型
推荐理由:新模型速度翻倍,适合本地提效场景,可实测对比吸引技术受众。
🎯 给屿鹿的选题角度:标题:谷歌新模型DiffusionGemma生成速度提升4倍!实测对比值得用吗? 形式:小红书图文/视频号口播,实测生成速度、质量与Gemma、Claude等对比,展示本地部署用法,落点:一人公司如何用更快模型提效。
04:00Simon Willison精选 · 70

DiffusionGemma

谷歌文本扩散模型DiffusionGemma重新回归,Simon Willison曾实测其生成速度达857 tokens/秒
模型发布文本扩散谷歌
推荐理由:新型文本扩散模型可实测,适合做生成速度与效果对比,吸引对AI工具好奇的创作者
🎯 给屿鹿的选题角度:实测DiffusionGemma vs GPT-4o/Claude,从生成速度、文本质量、适用场景三方面对比,视频号口播+小红书图文,落点一人公司如何选模型提效
03:29Ars Technica精选 · 50

Google's latest DiffusionGemma open AI model comes with a 4x speed boost

Google推出开源扩散语言模型DiffusionGemma,文本生成速度提升至4倍。
扩散模型文本生成速度提升
02:50MarkTechPost精选 · 70

Google AI Releases DiffusionGemma, a 26B MoE Open Model Using Text Diffusion for Up to 4x Faster Generation

Google DeepMind发布DiffusionGemma,26B MoE开源模型,采用文本扩散技术,生成速度提升最高4倍。
文本扩散大模型生成加速开源模型
推荐理由:新型文本扩散模型,生成速度提升4倍,适合做实测对比内容吸引技术爱好者关注。
🎯 给屿鹿的选题角度:标题:实测谷歌新模型DiffusionGemma:文本生成快4倍,效果如何?形式:小红书图文,对比生成速度与质量。落点:未来内容创作效率可能大幅提升。
02:43The Verge AI精选 · 80

Fable won’t answer basic biology questions

Anthropic发布的Claude Fable 5号称最强,却拒绝回答基础生物学问题,引发对其安全策略的质疑。
Claude模型行为AI安全实测
推荐理由:该创作者可实测Claude的避答问题,制作反差内容吸引流量。
🎯 给屿鹿的选题角度:实测Claude Fable 5拒绝回答的边界,制作对比视频,展示“最强模型”为何不敢答基础问题,落点提醒用户AI的可靠性问题。
00:50The Verge AI精选 · 50

Microsoft restricts Claude Fable for employees over data retention concerns

微软因数据保留疑虑限制员工使用Anthropic新模型Claude Fable。
AI隐私数据安全Claude企业策略
推荐理由:新模型引发数据保留争议,适合提醒创业者注意AI工具隐私风险。
🎯 给屿鹿的选题角度:做一期短视频科普,对比主流AI工具数据政策,提醒一人公司如何选择安全的AI服务,可结合截图演示。
00:24DeepMind精选 · 60

DiffusionGemma: 4x faster text generation

DeepMind发布DiffusionGemma,文本生成速度提升4倍,基于Gemma架构。
文本生成加速GemmaDeepMind效率提升
推荐理由:文本生成速度大幅提升,未来可能影响AI写作工具的效率与成本。
🎯 给屿鹿的选题角度:可做快讯解读:用Demogo(如Hugging Face)实测生成速度,对比普通Gemma,强调对内容创作者提效的潜力,发布在小红书图文。
00:09Hacker News精选 · 90

DiffusionGemma: 4x Faster Text Generation

Google发布DiffusionGemma,采用扩散模型实现4倍速文本生成。
扩散模型文本生成速度提升Google
推荐理由:全新扩散文本模型可大幅提升内容创作效率,实测对比性强。
🎯 给屿鹿的选题角度:制作一期视频实测DiffusionGemma速度与质量,对比传统模型,展示一人公司如何用它快速生成文案、选题,降本增效。
2026-06-10
19:52量子位精选 · 90

中国第一、全球第二!HiDream-O1-Image-1.5 登顶文生图榜单,超越谷歌、英伟达

HiDream-O1-Image-1.5文生图模型登顶榜单,中国第一全球第二,超越谷歌英伟达。
AI生图新模型榜单实测
推荐理由:文生图新模型登顶,可做实测对比内容,吸引做图、做IP的创作者关注。
🎯 给屿鹿的选题角度:实测HiDream-O1-Image-1.5生成真人/产品图,对比Midjourney、DALL·E,突出质量与效率,做小红书图文或视频号口播,落点AI让创作者一人高效产出视觉素材。
16:26MarkTechPost精选 · 90

Anthropic Releases Claude Fable 5 and Claude Mythos 5: Same Underlying Model, Different Safeguards, New Mythos-Class Tier

Anthropic发布Claude Fable 5和Mythos 5,同模型不同安全策略,新增Mythos级别。
AnthropiClaude安全策略
推荐理由:Claude新版本差异在安全策略,适合做对比实测,直击创业者对AI内容生成可控性的需求。
🎯 给屿鹿的选题角度:实测两个版本在敏感话题、创意写作等场景的表现,制作对比视频/图文,突出安全与自由的平衡,小红书或视频号口播,吸引非技术受众。
14:45量子位精选 · 90

GPT-5.6首批实测来了!精准狙击Mythos

GPT-5.6首批实测曝光,性能或超越Mythos,预计本月发布。
GPT-5.6实测Mythos新模型
推荐理由:GPT-5.6首批实测,可能是重磅更新,适合作为一手测评题材。
🎯 给屿鹿的选题角度:可制作一期“GPT-5.6 vs Mythos 实测对比”,突出新功能/性能提升,演示如何用新模型提效内容创作,图文/视频均可,吸引关注AI工具的技术流受众。
13:54量子位精选 · 90

Claude Fable 5首日实测,杀疯了…

量子位首发实测Claude新模型“Fable 5”,性能惊艳引发社区热议
Claude模型实测AI大模型Anthropi
推荐理由:Claude新模型发布,可做首发实测对比,吸引科技创业者关注
🎯 给屿鹿的选题角度:连夜实测Claude Fable 5,对比GPT-4o在文案创作和数据分析上的表现,用真实案例展示一人搞定多工种,做小红书图文对比+视频号口播
11:1936氪精选 · 60

36氪首发 | 清华团队做出全球首个实时理解生理与情绪的基座模型,进一步布局硬件

清华团队发布全球首个实时理解生理与情绪的AI基座模型,获顺为资本数百万美元融资。
基座模型情绪感知人机交互融资
推荐理由:若未来开放API,可用于AI智能体感知用户状态,提升交互体验。
🎯 给屿鹿的选题角度:可做一期“AI读懂你的喜怒哀乐”的前沿解说视频,介绍模型原理和可能应用场景,吸引对前沿AI技术感兴趣的受众,平台:视频号口播,落点:未来智能体更人性化。
10:2936氪精选 · 90

Anthropic发布最强模型Claude Fable 5正式上线

Anthropic发布最强模型Claude Fable 5正式上线。
Claude FAnthropi大模型
推荐理由:最新模型发布,可做实测对比,吸引AI实操关注。
🎯 给屿鹿的选题角度:立即上手实测Claude Fable 5的文案、分析能力,对比旧版,展示降本增效,发视频号口播+小红书图文。
07:59Simon Willison精选 · 90

Initial impressions of Claude Fable 5

Simon Willison深度实测Claude Fable 5,称其像“野兽”,能力全面但昂贵。
Claude F实测大模型
推荐理由:权威一手评测,为AI测评内容提供高质量、高流量的素材。
🎯 给屿鹿的选题角度:将Simon的测评二次解读,聚焦文案、编程等场景,实测Fable 5提效效果,输出对比视频或图文。
06:52量子位精选 · 90

刚刚,Claude Mythos 5发布!5000万行代码1天搞定

Claude Mythos 5发布,宣称可1天处理5000万行代码。
Claude大模型代码生成
推荐理由:重大模型发布,可做实测对比内容,吸引创业者和开发者关注。
🎯 给屿鹿的选题角度:小红书图文/视频号实测:对比Claude Mythos 5与GPT-4等模型在代码生成、长文本理解上的表现,突出“一人顶一个团队”的效率。
02:57Ars Technica精选 · 70

Google announces Gemini 3.5 Live Translate for instant voice-to-voice translation

Gemini 3.5 Live Translate实现语音到语音翻译,保留语调语速,支持70+语言。
Gemini语音翻译实时翻译
推荐理由:可实测翻译效果,用于多语言内容创作提效
🎯 给屿鹿的选题角度:实测Gemini Live Translate在视频翻译配音中的表现,对比传统方法,展现降本增效,适合视频号口播。
01:24MarkTechPost精选 · 70

Google Releases Gemini 3.5 Live Translate, a Streaming Speech-to-Speech Audio Model Covering 70+ Languages Across Meet, Translate, and the Live API

Google发布Gemini 3.5 Live Translate,支持70+语言流式翻译。
Gemini语音翻译
推荐理由:可实测翻译效果,用于多语言内容创作提效
🎯 给屿鹿的选题角度:实测Gemini Live Translate在视频翻译配音中的表现,对比传统方法,展现降本增效,适合视频号口播。
01:10The Verge AI精选 · 100

Anthropic releases its first Mythos-class model Claude Fable

Anthropic发布最强模型Claude Fable,在软件工程和知识工作领域性能领先。
Claude FAnthropi大模型
推荐理由:重大新模型发布,必须第一时间实测抢占流量
🎯 给屿鹿的选题角度:立刻开箱实测,对比GPT-4o,演示代码、写作等任务,突出降本增效,适合视频号口播+小红书图文。
01:00TechCrunch AI精选 · 90

Anthropic’s Claude Fable 5 is a version of Mythos the public can access today

Anthropic发布Claude Fable 5,首款对公众开放的Mythos级模型,带安全护栏。
Claude大模型安全护栏
推荐理由:新Claude模型发布,可第一时间实测对比,吸引关注AI工具进展的受众。
🎯 给屿鹿的选题角度:实测Claude Fable 5 vs GPT-4o等,展示其在文案、代码、分析等任务的表现,制作对比图文或视频,突出对创业者提效的实用技巧。
00:58Hacker News精选 · 90

Claude Fable 5

Anthropic发布Claude Fable 5系统卡,引发社区热议。
Claude系统卡
推荐理由:新模型发布,社区关注度高,可探讨安全性与能力。
🎯 给屿鹿的选题角度:解读Claude Fable 5系统卡,分析其安全限制对实际使用的影响,并提供绕过护栏的创意用法,适合深度测评文章。
2026-06-09
23:56Hugging Face精选 · 80

Introducing North Mini Code: Cohere’s First Model For Developers

Cohere发布首款开发者代码模型North Mini Code
代码模型Cohere开发者工具
推荐理由:新代码模型,适合测评对比,吸引开发者受众
🎯 给屿鹿的选题角度:实测North Mini Code vs Claude/GPT在代码生成任务上的表现,制作对比视频/图文,突出“一人公司提效”
22:10DeepMind精选 · 90

Introducing Gemma 4 12B: a unified, encoder-free multimodal model

DeepMind发布统一的无编码器多模态模型Gemma 4 12B
Gemma多模态开源模型
推荐理由:新多模态模型,可实测对比,为创作者提供新工具
🎯 给屿鹿的选题角度:实测Gemma 4 12B的图文理解与生成能力,制作评测内容,体现“用AI做内容提效”
12:17量子位精选 · 70

仅4B大小可端侧部署!卡帕西预言的「认知模型」被国产做出来了

国产认知小模型仅4B参数,可端侧部署,声称效果比肩GPT-5.4。
国产模型端侧部署认知推理
推荐理由:端侧小模型若强,可低成本本地运行,帮助创作者处理内容任务。
🎯 给屿鹿的选题角度:模型公开后,做本地部署评测,对比GPT在文案撰写上的表现,看能否成为免费易用的内容助手。
10:55量子位精选 · 70

国产通用大模型第一梯队,来新人了?!

国产通用大模型第一梯队或有新进入者,强调智能密度与Token价值
国产大模型第一梯队智能密度
推荐理由:新模型出现可能成为测评对象,适合做对比实测内容。
🎯 给屿鹿的选题角度:出一期“国产大模型新选手实测”:对比其与DeepSeek等在文案生成、多模态理解上的表现,突出对一人公司提效的价值,形式为视频号口播+小红书图文。
00:49MarkTechPost精选 · 50

Xiaomi MiMo and TileRT Push a 1-Trillion-Parameter Model Past 1000 Tokens Per Second on Commodity GPUs

小米MiMo与TileRT让万亿参数模型在8个消费级GPU上达到每秒1000+ token解码速度
大模型推理性能优化
2026-06-08
16:56MarkTechPost精选 · 90

Microsoft AI Introduces MAI-Transcribe-1.5: 2.4% WER on Artificial Analysis, Best-in-Class FLEURS Accuracy, and Up to 5x Faster Long-Audio Transcription

微软发布MAI-Transcribe-1.5语音识别模型,词错率2.4%,支持43种语言,长音频转录快5倍
语音识别转录效率工具微软
推荐理由:语音转文字是视频创作者高频需求,该模型准确率高且快,可大幅提效,适合实测对比
🎯 给屿鹿的选题角度:制作「微软新语音识别实测」视频/图文:用几段不同场景音频(口播、采访、噪音)对比MAI-Transcribe-1.5、Whisper、剪映,看谁又快又准,落点帮创作者省剪辑时间
2026-06-05
02:57Hugging Face精选 · 30

Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI

Nvidia发布Nemotron 3.5内容安全模型,面向企业多模态AI安全。
内容安全多模态企业AI
2026-06-04
08:00Hugging Face精选 · 80

Designing the hf CLI as an agent-optimized way to work with the Hub

ChatGPT推出新记忆系统,跨对话记住偏好,保持上下文相关。
ChatGPT记忆功能更新
推荐理由:记忆增强直接提升日常使用体验,是创作者提效的重要更新。
🎯 给屿鹿的选题角度:制作「ChatGPT新记忆功能实测」:对比新旧版本在连续对话中的表现,演示如何用于长期内容策划和客户记忆,小红书图文,落点:一人公司的超级助理更懂你了。
2026-06-03
21:00Google AI精选 · 10

5 ways Google Search can level up your thrift and vintage shopping

GPT-Rosalind新增功能,增强生物推理、药物化学等。
GPT-Rosa生命科学
06:21Simon Willison精选 · 90

Microsoft's new MAI models

微软发布MAI-Thinking-1推理模型和MAI-Code-1-Flash代码模型。
微软大模型MAI推理
推荐理由:新模型发布,可与主流模型对比实测,满足受众对最新AI工具的需求。
🎯 给屿鹿的选题角度:视频实测:“微软新模型MAI-Thinking-1对标GPT-5?我花了3小时实测”。对比推理能力、速度、成本,给出降本增效建议。
2026-06-01
23:45Hugging Face精选 · 70

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

JetBrains发布Mellum2,12B参数的混合专家模型。
大模型MoEJetBrain
推荐理由:新开源模型可能适合本地部署,实测对比当前流行模型,为创作者提供新选择。
🎯 给屿鹿的选题角度:上手实测Mellum2,与GPT-4o、Claude等对比,测试内容生成、逻辑推理,适合AI测评号做视频/图文。
2026-05-30
01:30Google AI精选 · 90

9 demos of Gemini Omni and Gemini 3.5 in action

Google AI发布9个Gemini Omni与Gemini 3.5实战演示。
Gemini模型演示实测
推荐理由:新模型能力演示,可直接作为实测素材。
🎯 给屿鹿的选题角度:挑选与内容创作相关的演示(图/视频/文案生成),做成实测对比视频,强调一人团队如何用AI提效。
2026-05-20
02:38Hugging Face精选 · 20

OlmoEarth v1.1: A more efficient family of Earth observation models

Hugging Face发布OlmoEarth v1.1,更高效的地球观测模型家族。
地球观测遥感模型
01:45Google AI精选 · 100

I/O 2026: Welcome to the agentic Gemini era

Google I/O 2026宣布进入Agentic Gemini时代,AI能自主执行任务。
Gemini智能体AgenticGoogle I
推荐理由:Gemini Agent成为自主智能体,可直接用于日常任务执行,存在大量实测选题。
🎯 给屿鹿的选题角度:立即实测Gemini新Agent能力,做“我的第一个AI员工:Gemini帮我订机票写邮件”,视频号口播演示,社群引流,落点:一人公司用AI代理省时间。
01:45Google AI精选 · 100

Gemini 3.5: frontier intelligence with action

Google发布Gemini 3.5,具备前沿智能与行动能力。
Gemini 3前沿模型AI Agent
推荐理由:旗舰模型更新,可直接实测对比能力,内容吸引力强。
🎯 给屿鹿的选题角度:制作“Gemini 3.5 vs GPT-5 实测对比”系列,小红书图文+视频号口播,突出对创作者哪个更好用,落点:选择最强AI工具提效。
2026-05-19
08:00Hugging Face精选 · 30

Introducing the Ettin Reranker Family

Hugging Face发布Ettin重排序模型家族。
重排序Hugging
2026-05-18
03:50DeepMind精选 · 80

Introducing Gemini Omni

DeepMind发布Gemini Omni,或为新一代多模态AI模型。
Gemini多模态
推荐理由:Gemini Omni可能大幅提升多模态能力,影响AI内容创作格局。
🎯 给屿鹿的选题角度:首发实测Gemini Omni,对比GPT-4o,全方位测试图文理解、视频脚本生成。输出对比图,吸引创作者选型,落点帮用户挑选最称手的AI工具。
2026-05-16
06:50DeepMind精选 · 100

Gemini 3.5: frontier intelligence with action

Gemini 3.5 发布:前沿智能,原生支持复杂 agentic 工作流。
Gemini 3大模型Agent工作流
推荐理由:新一代 Gemini 强调 agent 能力,是 AI 智能体赛道的重磅更新,非常适合实测对比。
🎯 给屿鹿的选题角度:立即上手实测 Gemini 3.5 的 agent 功能,与 Claude/GPT 对比执行复杂任务的效果,制作小红书图文/视频号口播,展示“一人公司”如何用 AI Agent 提效。
2026-05-15
02:55Hugging Face精选 · 60

Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality

开源多语言嵌入模型 Granite Embedding Multilingual R2 发布,32K 上下文,检索质量最佳。
嵌入模型多语言开源RAG
推荐理由:新开源嵌入模型支持 32K 上下文,可用于 RAG 等 AI 工作流,提升内容检索效率。
🎯 给屿鹿的选题角度:简要介绍该嵌入模型如何用于搭建私有知识库问答,辅助内容创作时的素材检索,适合小红书图文教程。
2026-05-13
09:27OpenAI Cookbook精选 · 60

Kathy sid/gpt5.5 grounded spatial reasoning (#2696)

疑似 GPT-5.5 的空间推理能力示例 Cookbook。
GPT-5.5空间推理多模态
推荐理由:如果 GPT-5.5 真有其事,可抢先测试;若为笔误则可能是 GPT-4o 新能力,值得关注。
🎯 给屿鹿的选题角度:如果示例可运行,做一个《GPT 新能力:能理解空间关系了?》的实测视频,展示效果,并讨论对内容创作的影响。
04:59OpenAI Cookbook精选 · 60

Kathy sid/gpt5.5 grounded spatial reasoning (#2694)

疑似 GPT-5.5 的空间推理能力示例,与上条为不同版本。
GPT-5.5空间推理多模态
推荐理由:同上,可能为同一 PR 的不同版本。
🎯 给屿鹿的选题角度:同上。
2026-01-08
04:00VentureBeat AI精选 · 60

Nous Research's NousCoder-14B is an open-source coding model landing right in the Claude Code moment

Nous Research开源NousCoder-14B,四天训练性能比肩大模型。
开源模型编程模型AI编程
推荐理由:开源编程模型让低成本本地运行AI编码成为可能,适合推广个人开发者工具链。
🎯 给屿鹿的选题角度:仅作资讯参考,可结合Goose等工具提及开源生态,但无需单独深挖。