AI 帮你盯热点,顺手给你选题

每 15 分钟抓取国内外 AI 信源 · 摘要打分 · 自动生成「给屿鹿的选题角度」 · 库内 4876 条 · 精选 374 条 · 最近抓取 07-03 15:03

📌 今日最值得做的 3 个选题

  1. 《Fable》通关指南:短绳AI编程法 —— 选题:Codex/Claude Code 实操避坑指南——“短绳方法”怎么用。小红书图文形式,分步骤说明:规划、审查、提交、PR。附真实案例对比,强调“别让AI乱改代码”。可布置社群作业:用此方法完成一个小项目。
  2. Claude Fable 5 自主优化 AIHOT 网站 SEO/GEO 全记录 —— 小红书图文:Claude Fable 5是如何72分钟自主搞定网站优化的?对比Codex Code的任务委派,哪些活它能干?屿鹿可以出实测对比视频,讨论Agent的边界。
  3. Claude-real-video - any LLM can watch a video —— 制作「让 GPT 看懂视频的新方法」实测:对比 claude-real-video 工具与 ChatGPT 直接上传视频的差异,演示安装、使用、效果,给出适用场景,做成小红书图文教程或视频号演示。
2026-07-01
18:03The Decoder:AI News精选 · 80

OpenAI论文揭示GPT-5.6三个Pro变体,打破单一顶级策略

OpenAI论文披露GPT-5.6三Pro变体,Sol Pro在基因组学基准中领先。
GPT-5.6Pro变体OpenAI
推荐理由:GPT-5.6 Pro变体细节曝光,可供社群讨论模型选择与Pro版本价值。
🎯 给屿鹿的选题角度:GPT-5.6 Pro变体值得买吗?普通用户需要Pro吗?对比标准版与Pro版差距,做社群讨论帖。
04:09Hacker News精选 · 80

Claude Sonnet 5 – benchmark results

Anthropic 发布 Claude Sonnet 5 基准测试结果,多项指标超越 GPT-4o
Claude S基准测试模型对比
推荐理由:Claude Sonnet 5 基准出炉,可与 GPT-4o 直接对比,为普通用户提供选型依据
🎯 给屿鹿的选题角度:制作「Claude Sonnet 5 vs GPT-4o」实测对比,聚焦日常写作、代码、数据分析,提炼「谁更适合普通人」的结论,适合小红书图文或视频号口播
01:59Hacker News精选 · 70

Claude Sonnet 5

Anthropic 发布 Claude Sonnet 5,可能在编程和推理上超越前代,引发社区讨论。
Claude S竞品对比编程能力
推荐理由:可对比 Codex/ChatGPT,为受众提供选型参考和迁移评估。
🎯 给屿鹿的选题角度:做一期“Claude Sonnet 5 vs Codex”实操对比,聚焦日常编程任务,做成小红书图文或视频口播,帮助技术小白决策。
2026-06-30
01:16Hacker News精选 · 80

Ornith-1.0: self-improving open-source models for agentic coding

Ornith-1.0:面向自主编程的开源自改进模型发布。
AI编程Agent开源模型
推荐理由:开源自主编程模型,可直接对比Codex任务委派与修Bug能力。
🎯 给屿鹿的选题角度:实测Ornith-1.0 vs Codex:布置相同编码任务,对比成功率、代码质量与易用性;小红书图文展示差异,社群布置作业。
00:17Simon Willison精选 · 80

Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding

开源模型 Ornith-1.0 发布,基于 Gemma 和 Qwen,专为代理编码设计,有 9B 到 397B 多种规模。
Ornith-1代理编码开源模型AI编程
推荐理由:首个专注自我脚手架代理编码的开源模型,可与 Codex 等对比,适合做成实测选题。
🎯 给屿鹿的选题角度:实测 Ornith-1.0 在简单编程任务上的表现,对比 Codex/Claude Code,突出各自优劣;做成小红书图文或视频号教程,教社群成员部署试用。
2026-06-27
09:53量子位精选 · 80

GPT-5.6突然发布!Fable5痛失最强基模王座

第三方基准测试出现GPT-5.6模型,性能超越Fable5等对手,可能为OpenAI新模型。
GPT-5.6基准测试OpenAI
推荐理由:OpenAI新模型动向,可做性能对比和实操选题。
🎯 给屿鹿的选题角度:实测GPT-5.6在文案、翻译、编程等任务中的表现,与GPT-4o对比,分析是否值得升级,适合小红书图文。
04:32OpenAI Codex Commits精选 · 90

feat: add GPT-5.6 variants to Bedrock catalog (#30285)

OpenAI Codex 仓库提交显示添加 GPT-5.6 系列模型(Sol/Terra/Luna)至 Amazon Bedrock
GPT-5.6OpenAI模型发布Amazon B
推荐理由:透露 OpenAI 即将推出 GPT-5.6 新模型,可能带来能力与价格变化,值得跟踪
🎯 给屿鹿的选题角度:做“GPT-5.6 前瞻:新模型可能带来哪些能力升级?对普通人意味着什么?” 追踪后续进展,对比现有模型,在社群或小红书出预测与解读
01:10Simon Willison精选 · 100

Quoting OpenAI

OpenAI 预览 GPT-5.6 系列,包括旗舰 Sol、均衡 Terra 和低成本 Luna,性能更强且更便宜。
GPT-5.6OpenAI 更模型预览价格对比
推荐理由:GPT-5.6 系列发布,包含旗舰和性价比模型,创作者可立即对比实测,判断对提效的价值。
🎯 给屿鹿的选题角度:实测 GPT-5.6 Sol/Terra/Luna 对比 GPT-5.5 和旧版,做差异评测,适合“普通人是否值得升级”的选题,可出小红书图文或社群教程。
01:06Hacker News精选 · 90

Previewing GPT‑5.6 Sol: a next-generation model

OpenAI 官方预览下一代模型 GPT-5.6 Sol,性能与新功能或大幅提升。
GPT模型OpenAI新模型发布
推荐理由:重大模型更新,适合做实测对比、社群教程,吸引目标受众关注。
🎯 给屿鹿的选题角度:制作“GPT-5.6 Sol 实测”对比图文/视频,展示新能力与旧版差异,设计社群作业让成员体验,突出对普通人的提效价值。
01:01The Verge AI精选 · 100

OpenAI unveils GPT-5.6 amid US AI regulatory drama

OpenAI 在监管压力下发布 GPT-5.6 系列 Sol、Terra、Luna,延续模型迭代节奏。
GPT-5.6 OpenAI监管Sol/Terr
推荐理由:监管背景提供话题性,可结合发布做“合规压力下的模型发布”角度,但核心仍是新模型。
🎯 给屿鹿的选题角度:做“监管压力下 OpenAI 仓促发布 GPT-5.6?实测对比是否值得用”的选题,突出监管故事和新模型能力,适合视频号口播。
2026-06-26
18:00OpenAI精选 · 100

Previewing GPT-5.6 Sol: a next-generation model

OpenAI 正式预览 GPT-5.6 Sol,强化编码、科学和网络安全能力,并配备最强安全措施。
GPT-5.6Sol 模型编码能力安全
推荐理由:官方详细说明 GPT-5.6 编码能力,屿鹿可直接据此制作 Codex 相关课程,探讨新模型对自动编程的提升。
🎯 给屿鹿的选题角度:结合官方演示,实测 GPT-5.6 Sol 在 Codex 任务中的表现,与 GPT-5 对比,给出“升级是否提升编程体验”的结论,适合社群直播或视频。
04:28OpenAI Codex Releases精选 · 70

rust-v0.143.0-alpha.23

OpenAI Codex 发布 Rust 版 v0.143.0-alpha.23。
CodexRustAlpha 发布
推荐理由:Codex 新版本,可关注 Rust 语言支持对开发者的意义。
🎯 给屿鹿的选题角度:可以做一篇「Codex 支持 Rust 了,对普通用户意味着什么?」的解读,说明 Codex 是什么、Rust 版可能带来的新能力,适合图文或口播。
2026-06-25
00:30DeepMind精选 · 80

Introducing computer use in Gemini 3.5 Flash

Gemini 3.5 Flash新增computer use功能,可操控桌面应用。
GeminiComputer多模态自动化
推荐理由:可与OpenAI的Codex或Operator对比,适合做实测教程。
🎯 给屿鹿的选题角度:选题:Gemini 3.5 Flash computer use vs Codex CLI/Operator:普通人用哪个自动化电脑操作?可做小红书图文或视频号实测对比,社群可布置作业尝试。
2026-06-23
21:37量子位精选 · 80

刚刚,豆包2.1发布!Agent自己跑18个小时搞定芯片设计代码

豆包2.1发布,Agent自主完成芯片设计代码,编程能力媲美Opus 4.7。
豆包AI编程Agent竞品对比
推荐理由:可与Codex做编程对比实测,为社群提供选型参考。
🎯 给屿鹿的选题角度:实测豆包2.1 vs Codex在自动化编程任务上的效率与质量,制作对比图文或短视频,给出“普通人选哪个更划算”的结论。
16:5936氪精选 · 80

豆包发布2.1 Pro模型,中文综合能力再升级

豆包发布2.1 Pro模型,中文综合能力提升,支持128K上下文。
豆包大模型2.1 Pro发布
推荐理由:字节跳动的豆包新模型,适合做国内大模型实测对比选题。
🎯 给屿鹿的选题角度:快速实测豆包2.1 Pro:用它写文案、做选题、总结长文,对比Claude/GPT,拍成视频口播(突出哪项任务可替代人工),落点「选对模型省一半成本」。
14:35MarkTechPost精选 · 80

GLM-5.2 OpenAI-Compatible API: A Hands-On Guide to Reasoning Effort, Function Calling, and Long-Context Retrieval

智谱GLM-5.2开放API,支持推理控制、函数调用与长上下文检索。
GLM-5.2函数调用推理控制Agent
推荐理由:新模型API实测教程,直接命中Agent/工作流赛道,可做对比评测吸粉。
🎯 给屿鹿的选题角度:制作视频号口播,实测GLM-5.2的函数调用与推理模式,对比Claude/GPT在自动化工作流中的表现,突出降本增效。
14:1336氪精选 · 90

火山引擎总裁谭待:字节内部已大规模落地AI Coding生产流程

字节豆包2.1Pro在AI Coding评测中超越Anthropic,已内部大规模用于生产,包括芯片RTL开发。
豆包2.1ProAI Codin大模型评测生产级AI
推荐理由:豆包模型能力跃进,具实测引子,适合做对比测评,吸引老板、技术人关注提效。
🎯 给屿鹿的选题角度:选题:豆包2.1Pro vs Claude写代码能力实测。拍摄真实编程任务(如写脚本、调试)对比视频,口播评述,强调「一人公司用国产模型提效降本」。落点:程序员或非技术者用AI写代码的可能。
12:5736氪精选 · 90

豆包发布2.1 Pro模型

火山引擎发布豆包2.1 Pro,Coding/Agent/VLM能力跃升
豆包大模型Agent火山引擎
推荐理由:豆包2.1 Pro强化Agent能力,直接关联一人公司提效与AI工作流搭建
🎯 给屿鹿的选题角度:实测豆包2.1 Pro的Agent功能,设计一个自动生成小红书图文+封面+文案的工作流,对比旧版或其他模型,口播演示或图文拆解,突出「一人顶团队」的提效效果
09:36Hacker News精选 · 90

OpenAI DayBreak – GPT-5.5-Cyber

OpenAI发布DayBreak项目推出GPT-5.5-Cyber,或为安全领域新模型。
OpenAIGPT-5.5DayBreak
推荐理由:若为新模型发布,对AI实操测评极为重要,可第一时间实测出圈。
🎯 给屿鹿的选题角度:选题:OpenAI新模型DayBreak测评。第一时间上手体验,演示功能,与之前模型对比,做小红书图文+视频号口播,强调对写内容、编程的提效。
07:43Simon Willison精选 · 90

Porting the Moebius 0.2B image inpainting model to run in the browser with Claude Code

Moebius 0.2B轻量图像修复模型已移植至浏览器,实现客户端AI修复。
AI生图图像修复浏览器轻量模型
推荐理由:小型模型浏览器运行,无需GPU,适合创作者快速修复图片,可做实测演示。
🎯 给屿鹿的选题角度:实录:用浏览器版Moebius一键移除照片杂物、修复老照片,对比PS操作,展现AI降本增效。适合小红书图文教程或视频号实操口播,强调“一人公司免费用AI修图”。
02:42MarkTechPost精选 · 80

Sakana AI Launches Sakana Fugu: An Orchestration Model That Routes Tasks Across a Swappable Pool of Frontier LLMs

Sakana AI发布Fugu和Fugu Ultra,可跨模型池路由任务,在编程、推理和智能体基准测试领先。
AI智能体模型发布任务路由Sakana A
推荐理由:新型任务路由模型Fugu,可跨多个LLM分配任务,提升智能体效率。
🎯 给屿鹿的选题角度:实测Fugu路由不同LLM执行任务的效果,与单一模型对比,制作小红书图文教程,落点:用AI智能体提效一人公司工作流。
2026-06-22
21:53Hacker News精选 · 90

Moebius: 0.2B image inpainting model with 10B-level performance

Moebius发布0.2B图像修复模型,性能比肩10B,轻量高效。
AI生图图像修复轻量模型实测新工具
推荐理由:可实测演示轻量修图模型,展示对内容创作者的一人团队提效价值。
🎯 给屿鹿的选题角度:实测Moebius图片去水印、物体消除效果,对比传统PS和重级模型。小红书图文出修复前后对比,视频口播教用,落点“修图不用设计师,这个AI一分钟搞定”。
15:30量子位精选 · 90

阿里发布视频生成模型HappyHorse 1.1:五大维度全面升级

阿里发布视频生成模型 HappyHorse 1.1,宣称在五大维度全面升级。
视频生成阿里HappyHorAI生视频
推荐理由:视频生成赛道新模型,可直接实测对比,适合展示一人公司用 AI 高效创作视频。
🎯 给屿鹿的选题角度:制作 HappyHorse 1.1 实测视频:用它生成同一脚本的片段,与可灵、Sora 对比生成速度、画面一致性、运镜控制,以口播+屏幕录制发布视频号,突出“一个人搞定宣传片”的提效场景。
15:22Hacker News精选 · 70

GLM 5.2 vs. Opus

GLM 5.2 与 Opus 模型对比评测,涵盖能力、性能实测。
模型对比GLM 5.2Opus实测
推荐理由:大模型横向对比,可直接转化为实测选题,吸引技术受众。
🎯 给屿鹿的选题角度:制作小红书图文或视频号口播,实测 GLM 5.2 与 Opus 在文案生成、商业分析等场景的表现,用数据展示降本增效潜力。
14:5936氪精选 · 90

阿里巴巴发布视频生成模型HappyHorse 1.1

阿里发布视频生成模型HappyHorse 1.1,大幅提升动态、一致性和音频能力。
视频生成阿里模型升级
推荐理由:最新视频生成模型发布,可做实测对比,直接服务创作者降本增效。
🎯 给屿鹿的选题角度:实测HappyHorse 1.1:用同一指令对比旧版/其他工具,展示动态与一致性提升。小红书图文出效果对比图+参数,视频号口播讲解亮点与用法,引导关注AI视频创作提效。
11:48量子位精选 · 90

入选ECCV 2026!清华开源空间模型打败Gemini:真正的空间智能是在世界变化中持续学习

清华开源空间模型入选ECCV 2026,可处理120分钟长视频,性能优于Gemini。
空间智能开源模型长视频理解ECCV2026
推荐理由:开源模型可直接用于长视频分析,为创作者提供新的AI提效工具,实测选题价值极高。
🎯 给屿鹿的选题角度:第一时间实测该模型:用一条120分钟课程或直播录像,对比传统分段理解与全量处理效果,展示如何快速生成摘要和剪辑点,落点在一人高效处理长素材。适合视频号口播和小红书图文拆解。
10:08Hacker News精选 · 80

Sakana Fugu

Sakana发布Fugu新AI模型,可能为新一代大模型或进化算法产品
SakanaFugu新模型AI智能体
推荐理由:Sakana新模型发布,适合实测对比,为创作者提供降本增效工具测评。
🎯 给屿鹿的选题角度:小红书图文/视频号口播:第一时间实测Fugu模型,与Claude/GPT等对比,展示其在内容创作、工作流等方面的能力,突出提效优势。
07:4036氪精选 · 80

中信建投:国产模型加速迭代,算力景气度持续

国产模型GLM-5.2与Kimi K2.7 Code强化Agent能力与长上下文
国产大模型Agent代码能力长上下文
推荐理由:国产模型在Agent和长上下文能力提升显著,可实测用于内容提效
🎯 给屿鹿的选题角度:实测Kimi K2.7 Code的Agentic Coding,演示如何用它自动生成小红书文案或剪辑脚本,拍摄口播视频展示流程。
2026-06-20
06:06MarkTechPost精选 · 80

VibeThinker-3B: A 3B Dense Reasoning Model Built on Qwen2.5-Coder-3B With the Spectrum-to-Signal Post-Training Pipeline

VibeThinker-3B: 3B参数推理模型开源,性能比肩DeepSeek V3.2和Kimi K2.5。
小模型推理模型VibeThin开源
推荐理由:小模型性能强劲,适合一人公司低成本部署,可做实测内容。
🎯 给屿鹿的选题角度:实测VibeThinker-3B与DeepSeek等大模型在推理任务上的表现,突出“3B战胜大模型”的降本增效,适合小红书图文或视频号。
2026-06-19
09:58Hacker News精选 · 90

GLM-5.2: The Most Powerful Open Model yet and the Brutal Reality of Running It

GLM-5.2号称最强开源模型,但本地运行挑战重重
大模型开源GLM-5.2实测
推荐理由:可做实测对比与本地部署教程,契合AI智能体赛道
🎯 给屿鹿的选题角度:一期视频/图文:实测GLM-5.2性能,对比其他开源模型,并给出本地运行配置建议,落点「个人/小团队如何低成本用上最强开源模型」
2026-06-18
14:17Hacker News精选 · 80

DeepSeek Introduces Vision

DeepSeek 模型新增视觉能力,支持图像输入。
DeepSeek多模态视觉模型AI实测
推荐理由:DeepSeek 作为热门国产模型,新增视觉功能,是实测演示的绝佳选题。
🎯 给屿鹿的选题角度:制作视频/图文实测 DeepSeek 视觉功能:上传截图、图表或手写笔记,测试其理解与分析能力,可与 GPT-4V 对比,落点“用 AI 省掉设计/数据分析外包”。
07:58Simon Willison精选 · 90

GLM-5.2 is probably the most powerful text-only open weights LLM

Z.ai发布开源大模型GLM-5.2,753B参数,1.51TB,采用MIT许可。
GLM-5.2开源大模型Z.ai
推荐理由:国产开源巨型模型,实测对比潜力大,契合AI Agent赛道的内容选题。
🎯 给屿鹿的选题角度:选题:GLM-5.2 vs Claude/GPT 实测,聚焦文案生成、策划提效,小红书图文+视频号演示,突出“免费调用顶级模型降本增效”。
2026-06-17
20:0436氪精选 · 80

微软正考虑接入深度求索模型赋能Copilot协同办公工具

微软正测试深度求索V4等开源模型作为Copilot低成本备选方案,以替代OpenAI和Anthropic模型
微软深度求索Copilot大模型
推荐理由:微软拥抱国产开源模型,话题性强,可做低成本方案实测对比
🎯 给屿鹿的选题角度:实测深度求索V4在办公场景的能力,对比GPT-4o,突出‘省钱提效’,适合小红书图文/视频口播,标题如“微软都搞的国产模型,打工人用起来”
17:12Hacker News精选 · 90

GLM-5.2 is the new leading open weights model on Artificial Analysis

GLM-5.2成为Artificial Analysis评测中领先的开源权重模型。
大模型开源GLM-5.2评测
推荐理由:国产开源模型登顶评测榜单,强性价比和中文能力适合实测。
🎯 给屿鹿的选题角度:标题:GLM-5.2 开源模型实测,到底能不能打?内容:用GLM-5.2与Claude、GPT做写作、策划、编程等任务对比,突出性价比和中文优势,小红书图文/视频号口播,落点:一人公司选模型省钱提效。
17:01Hugging Face精选 · 90

GLM-5.2: Built for Long-Horizon Tasks

智谱发布GLM-5.2模型,专为长周期任务打造,可能具备更强复杂推理与规划能力。
GLM-5.2智谱长任务大模型
推荐理由:新模型主打长周期任务,可实测对比Claude等,切中一人公司复杂项目提效需求。
🎯 给屿鹿的选题角度:视频号口播+小红书图文:用GLM-5.2策划一场线上活动,对比其他模型,展示其长链条推理能力,标题如《新一代长任务AI来了!GLM-5.2能让一人公司效率翻倍吗?》
16:0236氪精选 · 90

国家超算互联网上线GLM-5.2模型服务

智谱开源旗舰模型GLM-5.2,国家超算互联网同步上线API及模型文件。
大模型开源GLM-5.2超算互联网
推荐理由:国产大模型开源可实测,适合创作测评对比内容。
🎯 给屿鹿的选题角度:实测GLM-5.2在文案、数据分析等任务上的表现,对比DeepSeek等同级模型,做成小红书图文或视频,强调免费开源、一人公司提效。
15:30Hacker News精选 · 80

GLM 5.2 Performance Benchmarks

GLM 5.2模型性能基准测试结果公布,展现最新国产大模型能力。
GLM 5.2大模型基准测试国产模型
推荐理由:国产模型GLM 5.2实测数据新鲜,可直接作为AI智能体赛道素材,对比测评潜力大。
🎯 给屿鹿的选题角度:标题:GLM 5.2 vs GPT-4o 实测对比:中文任务谁更强?形式:小红书图文,展示写作、逻辑、编码等典型场景截图,结尾总结一人公司选用建议,强调降本增效。
13:59量子位精选 · 80

Grok 4.3现已在Amazon Bedrock上正式可用

xAI的Grok 4.3模型上线Amazon Bedrock,用户可通过API调用。
Grok模型发布Amazon B
推荐理由:新模型可用,可实测并对比主流模型,吸引关注AI工具提效的受众。
🎯 给屿鹿的选题角度:选题“Grok 4.3实测对比:又多一个强模型可选?”,录制视频展示在Bedrock调用Grok完成选题、脚本生成,与GPT-4o、Claude对比质量与风格,落点帮创作者选模型提效。
13:3036氪精选 · 70

摩尔线程完成智谱GLM-5.2 Day-0适配

摩尔线程宣布在MTT S5000上完成智谱GLM-5.2模型Day-0适配,优化长上下文推理。
智谱GLM-5.国产GPU模型适配长上下文
推荐理由:智谱新开源旗舰模型发布,国产芯片快速适配,是测评国产AI生态的机会。
🎯 给屿鹿的选题角度:可做一期对比实测:GLM-5.2在不同平台(英伟达vs摩尔线程)上的推理速度与效果,突出国产方案降本潜力,适合小红书图文。
10:42量子位精选 · 90

刚刚,Fable-5之下,智谱开源的GLM-5.2拿下AI编程第一!

智谱开源GLM-5.2模型,拥有1M上下文,在AI编程排行榜中夺冠。
GLM-5.2开源模型AI编程大模型实测
推荐理由:国产开源大模型重大突破,编程能力登顶,适合做测评与提效教程。
🎯 给屿鹿的选题角度:实测对比GLM-5.2与Claude Sonnet在真实代码任务上的表现,制作视频口播或图文教程,突出其1M上下文在长代码维护中的降本增效场景。
09:5836氪精选 · 80

沐曦股份曦云C系列GPU Day 0 适配智谱GLM-5.2旗舰模型

智谱AI开源旗舰大模型GLM-5.2,沐曦曦云C系列GPU完成Day 0适配。
智谱AIGLM-5.2开源大模型GPU适配
推荐理由:国产新旗舰开源模型,适合做实测对比内容,吸引关注AI提效的创业者和内容创作者。
🎯 给屿鹿的选题角度:录制GLM-5.2与DeepSeek/其他模型在文案生成、数据分析等场景的对比实测,突出效率与成本,发布小红书图文对比。
2026-06-16
12:3336氪精选 · 90

阿里发布首个具身大模型Qwen-Robot系列

阿里发布首个具身大模型Qwen-Robot系列,含操作、移动和世界模型。
具身智能大模型机器人阿里
推荐理由:阿里首次推出完整具身智能模型系列,可实测其操作、导航能力,符合Agent赛道。
🎯 给屿鹿的选题角度:小红书图文/视频号口播实测Qwen-RobotManip:用文字指令让机器人完成抓取任务,对比GPT-4o等具身方案,突出“一人操控机器人团队”的提效潜力。
03:05The Verge AI精选 · 90

All the news about Anthropic’s new AI fight with the White House

Anthropic发布新模型Fable 5与Mythos 5,白宫要求限制外国访问。
大模型发布AnthropiAI监管
推荐理由:Anthropic新模型是AI测评必追热点,实测对比能吸引高关注。
🎯 给屿鹿的选题角度:立刻上手实测Fable 5/Mythos 5,与Claude、GPT-4o等对比写作、代码、逻辑推理能力,制作小红书图文/视频号口播,突出“一人公司选模型”指南。
2026-06-15
21:5636氪精选 · 80

智谱推出最新旗舰模型GLM-5.2

智谱发布最新旗舰模型GLM-5.2,细节尚未公布。
国产大模型GLM-5.2模型发布
推荐理由:国产新旗舰模型,可做实测对比测评。
🎯 给屿鹿的选题角度:可快速获取内测资格,制作「GLM-5.2 实测」图文或视频,对比 Claude/GPT,突出其特色与提效场景。
14:52量子位精选 · 80

4步出声,单卡0.24秒!Noiz AI联合港科大清华,开源音频生成大模型

Noiz AI联合港科大清华开源音频生成大模型,4步出声,单卡0.24秒。
音频生成开源模型AI配音大模型
推荐理由:开源高速音频生成模型,适合视频创作者低成本制作配音和音效,提效明显。
🎯 给屿鹿的选题角度:实测Noiz AI音频生成:输入文本秒出多语言配音,支持时间戳对齐视频。对比ElevenLabs,展示‘单卡0.24秒’实时性,制作‘如何用AI一人完成视频配音全流程’教程,突出降本增效。
14:10MarkTechPost精选 · 80

Z.ai Launches GLM-5.2 With a Usable 1M-Token Context, Two Thinking-Effort Levels, and No Benchmarks at Launch

Z.ai发布GLM-5.2模型,支持100万token上下文和双思考层级,未公开基准测试。
大模型发布Agent长上下文实测
推荐理由:百万token上下文新模型,适合做长文档处理实测,吸引创业者关注。
🎯 给屿鹿的选题角度:实测GLM-5.2 vs 竞品在长文本理解、代码生成上的表现,制成对比视频或图文,强调一人在AI协助下完成复杂任务的提效效果。
12:55Hacker News精选 · 90

Apple Foundation Models

Apple 基础模型通过 Claude 平台开放,开发者可直接调用多种 Apple 模型。
Apple模型Claude平台模型发布AI对比
推荐理由:Apple 正式推出基础模型并开放使用,可做第一手实测对比。
🎯 给屿鹿的选题角度:小红书图文/视频号:快速上手 Apple 基础模型,测试其在文案生成、数据解读、创意脚本等任务的实际效果,对比 ChatGPT 和 Claude,给出一人团队选型建议。
12:5136氪精选 · 90

智谱:公司已推出最新一代旗舰模型GLM-5.2

智谱发布旗舰模型GLM-5.2,支持百万token上下文,将MIT协议开源。
智谱GLM-5.2开源长上下文
推荐理由:最新国产开源大模型,长上下文能力突出,适合实测对比选题。
🎯 给屿鹿的选题角度:制作GLM-5.2与Kimi/ChatGLM长文本理解对比实测,展示论文、报告总结效果,突出内容创作者提效,适合小红书图文或视频号口播。
11:24量子位精选 · 70

智源大会 | 天工AI重新定义世界模型,公布Matrix-Game 3.5 最新技术突破

昆仑万维在智源大会公布天工AI与Matrix-Game 3.5模型,称重新定义世界模型。
天工AI世界模型Matrix-GAI视频
推荐理由:世界模型可能颠覆AI视频生成,值得实测其效果,选题契合AI生视频赛道。
🎯 给屿鹿的选题角度:选题:实测天工AI Matrix-Game 3.5生成视频效果,对比现有工具,突出“一人公司”用AI做视频的降本增效。形式:小红书图文/视频号口播。
2026-06-14
22:38Hacker News精选 · 70

Rio de Janeiro's city government model Rio3.5 beats Qwen3.7 in recent benchmarks

里约市政府模型Rio3.5在基准测试中击败通义千问3.7
模型发布基准测试Rio3.5Qwen3.7
推荐理由:新开源模型声称超越Qwen3.7,可实测对比吸引关注
🎯 给屿鹿的选题角度:实测Rio3.5与Qwen3.7在写作、翻译等任务上的表现,制作对比图文/视频,突出免费模型助力一人公司提效
00:18Hacker News精选 · 80

GLM 5.2 Is Out

智谱发布GLM 5.2大模型,可能带来性能提升与新能力。
大模型发布GLM智谱AI
推荐理由:新模型发布提供实测素材,可对比主流模型制作吸睛内容。
🎯 给屿鹿的选题角度:立即实测GLM 5.2在文案、数据分析等任务上的表现,与GPT-4o、Claude对比,制作「一人公司选哪个模型」视频/图文,突出降本增效。
00:18Hacker News精选 · 90

GLM 5.2 Is Out

智谱发布 GLM 5.2 模型,性能提升,支持 128K 上下文,免费可用。
GLM 5.2智谱大模型新发布
推荐理由:国产最新模型发布,可做实测对比内容,吸引关注AI工具的创业者和创作者。
🎯 给屿鹿的选题角度:制作 GLM 5.2 实测视频:对比 GPT-4o 在文案写作、数据分析、代码生成等任务上的表现,突出免费优势,带出“一人公司提效”落点,发布小红书图文和视频号口播。
2026-06-13
16:1636氪精选 · 70

科大讯飞发布星火多模态大模型X2-VL

科大讯飞发布星火多模态大模型X2-VL,面向具身智能场景。
讯飞星火多模态大模型具身智能
推荐理由:国产多模态新模型,可能具备图文理解和生成能力,适合实测对比。
🎯 给屿鹿的选题角度:若开放API,可实测星火X2-VL的图文理解与生成效果,与GPT-4o、Claude等对比,输出小红书图文测评,突出对内容创作者的提效价值。
12:57MarkTechPost精选 · 80

Moonshot AI Releases Kimi K2.7-Code: a Coding Model Reporting +21.8% on Kimi Code Bench v2 Over K2.6

Moonshot AI开源Kimi K2.7-Code模型,代码能力提升21.8%,推理token减少30%。
模型发布Kimi代码模型Agent
推荐理由:新模型发布,代码能力显著提升,可关联Agent工作流与提效。
🎯 给屿鹿的选题角度:实测Kimi K2.7-Code在自动化内容生产(如脚本生成、数据处理)中的效果,对比上代版本,制作小红书图文或视频号口播,突出“一人公司提效”落点。
2026-06-12
18:42Hacker News精选 · 90

Kimi K2.7-Code: open-source coding model with better token efficiency

Moonshot AI发布开源编程模型Kimi K2.7-Code,号称有更好的token效率。
Kimi开源模型编程模型Token效率
推荐理由:新模型发布,实测对比编程能力或效率,贴合创作者AI实操测评定位,能转化为提效选题。
🎯 给屿鹿的选题角度:选题:实测Kimi K2.7-Code编程能力,对比DeepSeek Coder等,展示用AI写自动化脚本提效。小红书图文/视频号口播,落点:一人公司如何用AI编程省成本。
12:13量子位精选 · 70

“智能体最后的考试”,Fable 5竟然不敌GPT 5.5

Fable游戏评测显示,GPT-5.5在智能体任务中超越Fable 5,但最难关卡均得零分。
AI智能体大模型评测GPT-5.5Fable
推荐理由:大模型智能体能力对比评测,适合做实测选题吸引技术创业者。
🎯 给屿鹿的选题角度:选题:实测主流模型在Fable中的智能体表现,对比推理与交互能力。小红书图文拆解测试过程,视频号口播复盘结果,强调AI提效潜力和适用边界。
09:06Hacker News精选 · 90

Claude Fable is relentlessly proactive

Simon Willison发文称Claude Fable非常积极主动,可能预示Claude模型的新代理功能。
ClaudeAgentSimon WiAI模型
推荐理由:Claude新特性或版本可能在主动性和代理能力上有突破,适合做实测演示。
🎯 给屿鹿的选题角度:视频号口播实测Claude Fable的主动性:让它自动监控邮件、生成内容提纲,展示“一人公司”如何用AI主动管理任务,标题可做“Claude新功能,你的AI助手开始主动干活了”。
2026-06-11
21:14Hacker News精选 · 70

Open Reproduction of DeepSeek-R1

Hugging Face发起Open-R1项目,目标完整复现DeepSeek-R1推理模型。
DeepSeek开源复现推理模型
推荐理由:开源复现降低使用门槛,有望催生更多轻量版推理模型,适合一人公司实验部署。
🎯 给屿鹿的选题角度:解读Open-R1项目进度与R1特性,实测对比开源方案,演示本地部署或API接入后如何辅助内容决策与数据分析,突出个人创作者零成本提效。
16:33MarkTechPost精选 · 80

Meet ‘North Mini Code’: Cohere’s 30B Open-Weight Mixture-of-Experts Model With 3B Active Parameters for Agentic Coding

Cohere发布开源30B MoE编程模型North Mini Code,3B活跃参数,256K上下文,专为智能体编程设计。
Cohere编程模型MoE智能体
推荐理由:开源轻量级编程模型,极低部署成本,适合一人公司实测与集成。
🎯 给屿鹿的选题角度:实测North Mini Code在自动修Bug、代码生成上的效果,与Claude Code对比,制作“一人公司零成本AI编程助手”教程,发小红书图文+视频号。
12:17量子位精选 · 80

Mythos阴影里谷歌悄悄发模型,速度暴涨4倍

谷歌发布新模型,采用扩散模型生成文字,速度提升 4 倍。
谷歌扩散模型文字生成
推荐理由:速度显著提升,对大量文本生成场景有直接提效价值,适合实测对比。
🎯 给屿鹿的选题角度:横向测评谷歌新模型与 GPT-4o/Claude 3.5 的生成速度与质量,重点测公众号、短视频文案等任务,突出“一人公司”效率翻倍,视频号口播。
09:18量子位精选 · 80

实测小米最快1T大模型:吞吐量每秒1000+ Tokens,Vibe Coding七秒交付

实测小米最快1T大模型:通用GPU每秒1000+ Tokens吞吐,Vibe Coding七秒交付
小米大模型实测推理速度Vibe Cod
推荐理由:国产模型推理速度重大突破,实测数据可直观对比,适合做性能验证与提效演示
🎯 给屿鹿的选题角度:出一条「实测小米1T大模型:1000 Tokens/秒能做什么?」视频,跑本地/云端对比,展示Vibe Coding七秒生成网页,落点一人开发效率。
08:0436氪精选 · 90

谷歌推出DiffusionGemma开源模型

谷歌开源DiffusionGemma,文本生成速度提升4倍,但输出质量低于Gemma 4。
谷歌Diffusio文本生成开源模型
推荐理由:新模型速度翻倍,适合本地提效场景,可实测对比吸引技术受众。
🎯 给屿鹿的选题角度:标题:谷歌新模型DiffusionGemma生成速度提升4倍!实测对比值得用吗? 形式:小红书图文/视频号口播,实测生成速度、质量与Gemma、Claude等对比,展示本地部署用法,落点:一人公司如何用更快模型提效。
04:00Simon Willison精选 · 70

DiffusionGemma

谷歌文本扩散模型DiffusionGemma重新回归,Simon Willison曾实测其生成速度达857 tokens/秒
模型发布文本扩散谷歌
推荐理由:新型文本扩散模型可实测,适合做生成速度与效果对比,吸引对AI工具好奇的创作者
🎯 给屿鹿的选题角度:实测DiffusionGemma vs GPT-4o/Claude,从生成速度、文本质量、适用场景三方面对比,视频号口播+小红书图文,落点一人公司如何选模型提效
02:50MarkTechPost精选 · 70

Google AI Releases DiffusionGemma, a 26B MoE Open Model Using Text Diffusion for Up to 4x Faster Generation

Google DeepMind发布DiffusionGemma,26B MoE开源模型,采用文本扩散技术,生成速度提升最高4倍。
文本扩散大模型生成加速开源模型
推荐理由:新型文本扩散模型,生成速度提升4倍,适合做实测对比内容吸引技术爱好者关注。
🎯 给屿鹿的选题角度:标题:实测谷歌新模型DiffusionGemma:文本生成快4倍,效果如何?形式:小红书图文,对比生成速度与质量。落点:未来内容创作效率可能大幅提升。
02:43The Verge AI精选 · 80

Fable won’t answer basic biology questions

Anthropic发布的Claude Fable 5号称最强,却拒绝回答基础生物学问题,引发对其安全策略的质疑。
Claude模型行为AI安全实测
推荐理由:该创作者可实测Claude的避答问题,制作反差内容吸引流量。
🎯 给屿鹿的选题角度:实测Claude Fable 5拒绝回答的边界,制作对比视频,展示“最强模型”为何不敢答基础问题,落点提醒用户AI的可靠性问题。
00:09Hacker News精选 · 90

DiffusionGemma: 4x Faster Text Generation

Google发布DiffusionGemma,采用扩散模型实现4倍速文本生成。
扩散模型文本生成速度提升Google
推荐理由:全新扩散文本模型可大幅提升内容创作效率,实测对比性强。
🎯 给屿鹿的选题角度:制作一期视频实测DiffusionGemma速度与质量,对比传统模型,展示一人公司如何用它快速生成文案、选题,降本增效。
2026-06-10
19:52量子位精选 · 90

中国第一、全球第二!HiDream-O1-Image-1.5 登顶文生图榜单,超越谷歌、英伟达

HiDream-O1-Image-1.5文生图模型登顶榜单,中国第一全球第二,超越谷歌英伟达。
AI生图新模型榜单实测
推荐理由:文生图新模型登顶,可做实测对比内容,吸引做图、做IP的创作者关注。
🎯 给屿鹿的选题角度:实测HiDream-O1-Image-1.5生成真人/产品图,对比Midjourney、DALL·E,突出质量与效率,做小红书图文或视频号口播,落点AI让创作者一人高效产出视觉素材。
16:26MarkTechPost精选 · 90

Anthropic Releases Claude Fable 5 and Claude Mythos 5: Same Underlying Model, Different Safeguards, New Mythos-Class Tier

Anthropic发布Claude Fable 5和Mythos 5,同模型不同安全策略,新增Mythos级别。
AnthropiClaude安全策略
推荐理由:Claude新版本差异在安全策略,适合做对比实测,直击创业者对AI内容生成可控性的需求。
🎯 给屿鹿的选题角度:实测两个版本在敏感话题、创意写作等场景的表现,制作对比视频/图文,突出安全与自由的平衡,小红书或视频号口播,吸引非技术受众。
14:45量子位精选 · 90

GPT-5.6首批实测来了!精准狙击Mythos

GPT-5.6首批实测曝光,性能或超越Mythos,预计本月发布。
GPT-5.6实测Mythos新模型
推荐理由:GPT-5.6首批实测,可能是重磅更新,适合作为一手测评题材。
🎯 给屿鹿的选题角度:可制作一期“GPT-5.6 vs Mythos 实测对比”,突出新功能/性能提升,演示如何用新模型提效内容创作,图文/视频均可,吸引关注AI工具的技术流受众。
13:54量子位精选 · 90

Claude Fable 5首日实测,杀疯了…

量子位首发实测Claude新模型“Fable 5”,性能惊艳引发社区热议
Claude模型实测AI大模型Anthropi
推荐理由:Claude新模型发布,可做首发实测对比,吸引科技创业者关注
🎯 给屿鹿的选题角度:连夜实测Claude Fable 5,对比GPT-4o在文案创作和数据分析上的表现,用真实案例展示一人搞定多工种,做小红书图文对比+视频号口播
10:2936氪精选 · 90

Anthropic发布最强模型Claude Fable 5正式上线

Anthropic发布最强模型Claude Fable 5正式上线。
Claude FAnthropi大模型
推荐理由:最新模型发布,可做实测对比,吸引AI实操关注。
🎯 给屿鹿的选题角度:立即上手实测Claude Fable 5的文案、分析能力,对比旧版,展示降本增效,发视频号口播+小红书图文。
07:59Simon Willison精选 · 90

Initial impressions of Claude Fable 5

Simon Willison深度实测Claude Fable 5,称其像“野兽”,能力全面但昂贵。
Claude F实测大模型
推荐理由:权威一手评测,为AI测评内容提供高质量、高流量的素材。
🎯 给屿鹿的选题角度:将Simon的测评二次解读,聚焦文案、编程等场景,实测Fable 5提效效果,输出对比视频或图文。
06:52量子位精选 · 90

刚刚,Claude Mythos 5发布!5000万行代码1天搞定

Claude Mythos 5发布,宣称可1天处理5000万行代码。
Claude大模型代码生成
推荐理由:重大模型发布,可做实测对比内容,吸引创业者和开发者关注。
🎯 给屿鹿的选题角度:小红书图文/视频号实测:对比Claude Mythos 5与GPT-4等模型在代码生成、长文本理解上的表现,突出“一人顶一个团队”的效率。
02:57Ars Technica精选 · 70

Google announces Gemini 3.5 Live Translate for instant voice-to-voice translation

Gemini 3.5 Live Translate实现语音到语音翻译,保留语调语速,支持70+语言。
Gemini语音翻译实时翻译
推荐理由:可实测翻译效果,用于多语言内容创作提效
🎯 给屿鹿的选题角度:实测Gemini Live Translate在视频翻译配音中的表现,对比传统方法,展现降本增效,适合视频号口播。
01:24MarkTechPost精选 · 70

Google Releases Gemini 3.5 Live Translate, a Streaming Speech-to-Speech Audio Model Covering 70+ Languages Across Meet, Translate, and the Live API

Google发布Gemini 3.5 Live Translate,支持70+语言流式翻译。
Gemini语音翻译
推荐理由:可实测翻译效果,用于多语言内容创作提效
🎯 给屿鹿的选题角度:实测Gemini Live Translate在视频翻译配音中的表现,对比传统方法,展现降本增效,适合视频号口播。
01:10The Verge AI精选 · 100

Anthropic releases its first Mythos-class model Claude Fable

Anthropic发布最强模型Claude Fable,在软件工程和知识工作领域性能领先。
Claude FAnthropi大模型
推荐理由:重大新模型发布,必须第一时间实测抢占流量
🎯 给屿鹿的选题角度:立刻开箱实测,对比GPT-4o,演示代码、写作等任务,突出降本增效,适合视频号口播+小红书图文。
01:00TechCrunch AI精选 · 90

Anthropic’s Claude Fable 5 is a version of Mythos the public can access today

Anthropic发布Claude Fable 5,首款对公众开放的Mythos级模型,带安全护栏。
Claude大模型安全护栏
推荐理由:新Claude模型发布,可第一时间实测对比,吸引关注AI工具进展的受众。
🎯 给屿鹿的选题角度:实测Claude Fable 5 vs GPT-4o等,展示其在文案、代码、分析等任务的表现,制作对比图文或视频,突出对创业者提效的实用技巧。
00:58Hacker News精选 · 90

Claude Fable 5

Anthropic发布Claude Fable 5系统卡,引发社区热议。
Claude系统卡
推荐理由:新模型发布,社区关注度高,可探讨安全性与能力。
🎯 给屿鹿的选题角度:解读Claude Fable 5系统卡,分析其安全限制对实际使用的影响,并提供绕过护栏的创意用法,适合深度测评文章。
2026-06-09
23:56Hugging Face精选 · 80

Introducing North Mini Code: Cohere’s First Model For Developers

Cohere发布首款开发者代码模型North Mini Code
代码模型Cohere开发者工具
推荐理由:新代码模型,适合测评对比,吸引开发者受众
🎯 给屿鹿的选题角度:实测North Mini Code vs Claude/GPT在代码生成任务上的表现,制作对比视频/图文,突出“一人公司提效”
22:10DeepMind精选 · 90

Introducing Gemma 4 12B: a unified, encoder-free multimodal model

DeepMind发布统一的无编码器多模态模型Gemma 4 12B
Gemma多模态开源模型
推荐理由:新多模态模型,可实测对比,为创作者提供新工具
🎯 给屿鹿的选题角度:实测Gemma 4 12B的图文理解与生成能力,制作评测内容,体现“用AI做内容提效”
12:17量子位精选 · 70

仅4B大小可端侧部署!卡帕西预言的「认知模型」被国产做出来了

国产认知小模型仅4B参数,可端侧部署,声称效果比肩GPT-5.4。
国产模型端侧部署认知推理
推荐理由:端侧小模型若强,可低成本本地运行,帮助创作者处理内容任务。
🎯 给屿鹿的选题角度:模型公开后,做本地部署评测,对比GPT在文案撰写上的表现,看能否成为免费易用的内容助手。
10:55量子位精选 · 70

国产通用大模型第一梯队,来新人了?!

国产通用大模型第一梯队或有新进入者,强调智能密度与Token价值
国产大模型第一梯队智能密度
推荐理由:新模型出现可能成为测评对象,适合做对比实测内容。
🎯 给屿鹿的选题角度:出一期“国产大模型新选手实测”:对比其与DeepSeek等在文案生成、多模态理解上的表现,突出对一人公司提效的价值,形式为视频号口播+小红书图文。
2026-06-08
16:56MarkTechPost精选 · 90

Microsoft AI Introduces MAI-Transcribe-1.5: 2.4% WER on Artificial Analysis, Best-in-Class FLEURS Accuracy, and Up to 5x Faster Long-Audio Transcription

微软发布MAI-Transcribe-1.5语音识别模型,词错率2.4%,支持43种语言,长音频转录快5倍
语音识别转录效率工具微软
推荐理由:语音转文字是视频创作者高频需求,该模型准确率高且快,可大幅提效,适合实测对比
🎯 给屿鹿的选题角度:制作「微软新语音识别实测」视频/图文:用几段不同场景音频(口播、采访、噪音)对比MAI-Transcribe-1.5、Whisper、剪映,看谁又快又准,落点帮创作者省剪辑时间
2026-06-04
08:00Hugging Face精选 · 80

Designing the hf CLI as an agent-optimized way to work with the Hub

ChatGPT推出新记忆系统,跨对话记住偏好,保持上下文相关。
ChatGPT记忆功能更新
推荐理由:记忆增强直接提升日常使用体验,是创作者提效的重要更新。
🎯 给屿鹿的选题角度:制作「ChatGPT新记忆功能实测」:对比新旧版本在连续对话中的表现,演示如何用于长期内容策划和客户记忆,小红书图文,落点:一人公司的超级助理更懂你了。
2026-06-03
06:21Simon Willison精选 · 90

Microsoft's new MAI models

微软发布MAI-Thinking-1推理模型和MAI-Code-1-Flash代码模型。
微软大模型MAI推理
推荐理由:新模型发布,可与主流模型对比实测,满足受众对最新AI工具的需求。
🎯 给屿鹿的选题角度:视频实测:“微软新模型MAI-Thinking-1对标GPT-5?我花了3小时实测”。对比推理能力、速度、成本,给出降本增效建议。
2026-06-01
23:45Hugging Face精选 · 70

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

JetBrains发布Mellum2,12B参数的混合专家模型。
大模型MoEJetBrain
推荐理由:新开源模型可能适合本地部署,实测对比当前流行模型,为创作者提供新选择。
🎯 给屿鹿的选题角度:上手实测Mellum2,与GPT-4o、Claude等对比,测试内容生成、逻辑推理,适合AI测评号做视频/图文。
2026-05-30
01:30Google AI精选 · 90

9 demos of Gemini Omni and Gemini 3.5 in action

Google AI发布9个Gemini Omni与Gemini 3.5实战演示。
Gemini模型演示实测
推荐理由:新模型能力演示,可直接作为实测素材。
🎯 给屿鹿的选题角度:挑选与内容创作相关的演示(图/视频/文案生成),做成实测对比视频,强调一人团队如何用AI提效。
2026-05-20
01:45Google AI精选 · 100

I/O 2026: Welcome to the agentic Gemini era

Google I/O 2026宣布进入Agentic Gemini时代,AI能自主执行任务。
Gemini智能体AgenticGoogle I
推荐理由:Gemini Agent成为自主智能体,可直接用于日常任务执行,存在大量实测选题。
🎯 给屿鹿的选题角度:立即实测Gemini新Agent能力,做“我的第一个AI员工:Gemini帮我订机票写邮件”,视频号口播演示,社群引流,落点:一人公司用AI代理省时间。
01:45Google AI精选 · 100

Gemini 3.5: frontier intelligence with action

Google发布Gemini 3.5,具备前沿智能与行动能力。
Gemini 3前沿模型AI Agent
推荐理由:旗舰模型更新,可直接实测对比能力,内容吸引力强。
🎯 给屿鹿的选题角度:制作“Gemini 3.5 vs GPT-5 实测对比”系列,小红书图文+视频号口播,突出对创作者哪个更好用,落点:选择最强AI工具提效。
2026-05-18
03:50DeepMind精选 · 80

Introducing Gemini Omni

DeepMind发布Gemini Omni,或为新一代多模态AI模型。
Gemini多模态
推荐理由:Gemini Omni可能大幅提升多模态能力,影响AI内容创作格局。
🎯 给屿鹿的选题角度:首发实测Gemini Omni,对比GPT-4o,全方位测试图文理解、视频脚本生成。输出对比图,吸引创作者选型,落点帮用户挑选最称手的AI工具。
2026-05-16
06:50DeepMind精选 · 100

Gemini 3.5: frontier intelligence with action

Gemini 3.5 发布:前沿智能,原生支持复杂 agentic 工作流。
Gemini 3大模型Agent工作流
推荐理由:新一代 Gemini 强调 agent 能力,是 AI 智能体赛道的重磅更新,非常适合实测对比。
🎯 给屿鹿的选题角度:立即上手实测 Gemini 3.5 的 agent 功能,与 Claude/GPT 对比执行复杂任务的效果,制作小红书图文/视频号口播,展示“一人公司”如何用 AI Agent 提效。