TOPIC BANK · 106 IDEAS · 屿鹿选题库
选题库
每条资讯的选题角度都沉淀在这里,按分类和关键词找灵感
2026-07-01
🎯 GPT-5.6 Pro变体值得买吗?普通用户需要Pro吗?对比标准版与Pro版差距,做社群讨论帖。
🎯 实测LongCat-2.0编程能力:能否替代Codex?适合哪些编程任务?做对比短视频。
🎯 若性能突出,可做「Leanstral vs ChatGPT 在简单任务上的表现」对比贴,但优先度低
🎯 制作「Claude Sonnet 5 vs GPT-4o」实测对比,聚焦日常写作、代码、数据分析,提炼「谁更适合普通人」的结论,适合小红书图文或视频号口播
🎯 做一期“Claude Sonnet 5 vs Codex”实操对比,聚焦日常编程任务,做成小红书图文或视频口播,帮助技术小白决策。
2026-06-30
🎯 实测Ornith-1.0 vs Codex:布置相同编码任务,对比成功率、代码质量与易用性;小红书图文展示差异,社群布置作业。
🎯 实测 Ornith-1.0 在简单编程任务上的表现,对比 Codex/Claude Code,突出各自优劣;做成小红书图文或视频号教程,教社群成员部署试用。
2026-06-27
🎯 实测GPT-5.6在文案、翻译、编程等任务中的表现,与GPT-4o对比,分析是否值得升级,适合小红书图文。
🎯 做“GPT-5.6 前瞻:新模型可能带来哪些能力升级?对普通人意味着什么?” 追踪后续进展,对比现有模型,在社群或小红书出预测与解读
🎯 实测 GPT-5.6 Sol/Terra/Luna 对比 GPT-5.5 和旧版,做差异评测,适合“普通人是否值得升级”的选题,可出小红书图文或社群教程。
🎯 制作“GPT-5.6 Sol 实测”对比图文/视频,展示新能力与旧版差异,设计社群作业让成员体验,突出对普通人的提效价值。
🎯 做“监管压力下 OpenAI 仓促发布 GPT-5.6?实测对比是否值得用”的选题,突出监管故事和新模型能力,适合视频号口播。
2026-06-26
🎯 结合官方演示,实测 GPT-5.6 Sol 在 Codex 任务中的表现,与 GPT-5 对比,给出“升级是否提升编程体验”的结论,适合社群直播或视频。
🎯 可以做一篇「Codex 支持 Rust 了,对普通用户意味着什么?」的解读,说明 Codex 是什么、Rust 版可能带来的新能力,适合图文或口播。
2026-06-25
🎯 选题:Gemini 3.5 Flash computer use vs Codex CLI/Operator:普通人用哪个自动化电脑操作?可做小红书图文或视频号实测对比,社群可布置作业尝试。
2026-06-23
🎯 实测豆包2.1 vs Codex在自动化编程任务上的效率与质量,制作对比图文或短视频,给出“普通人选哪个更划算”的结论。
🎯 快速实测豆包2.1 Pro:用它写文案、做选题、总结长文,对比Claude/GPT,拍成视频口播(突出哪项任务可替代人工),落点「选对模型省一半成本」。
🎯 制作视频号口播,实测GLM-5.2的函数调用与推理模式,对比Claude/GPT在自动化工作流中的表现,突出降本增效。
🎯 选题:豆包2.1Pro vs Claude写代码能力实测。拍摄真实编程任务(如写脚本、调试)对比视频,口播评述,强调「一人公司用国产模型提效降本」。落点:程序员或非技术者用AI写代码的可能。
🎯 实测豆包2.1 Pro的Agent功能,设计一个自动生成小红书图文+封面+文案的工作流,对比旧版或其他模型,口播演示或图文拆解,突出「一人顶团队」的提效效果
🎯 选题:OpenAI新模型DayBreak测评。第一时间上手体验,演示功能,与之前模型对比,做小红书图文+视频号口播,强调对写内容、编程的提效。
🎯 实录:用浏览器版Moebius一键移除照片杂物、修复老照片,对比PS操作,展现AI降本增效。适合小红书图文教程或视频号实操口播,强调“一人公司免费用AI修图”。
🎯 实测Fugu路由不同LLM执行任务的效果,与单一模型对比,制作小红书图文教程,落点:用AI智能体提效一人公司工作流。
2026-06-22
🎯 实测Moebius图片去水印、物体消除效果,对比传统PS和重级模型。小红书图文出修复前后对比,视频口播教用,落点“修图不用设计师,这个AI一分钟搞定”。
🎯 制作 HappyHorse 1.1 实测视频:用它生成同一脚本的片段,与可灵、Sora 对比生成速度、画面一致性、运镜控制,以口播+屏幕录制发布视频号,突出“一个人搞定宣传片”的提效场景。
🎯 制作小红书图文或视频号口播,实测 GLM 5.2 与 Opus 在文案生成、商业分析等场景的表现,用数据展示降本增效潜力。
🎯 实测HappyHorse 1.1:用同一指令对比旧版/其他工具,展示动态与一致性提升。小红书图文出效果对比图+参数,视频号口播讲解亮点与用法,引导关注AI视频创作提效。
🎯 第一时间实测该模型:用一条120分钟课程或直播录像,对比传统分段理解与全量处理效果,展示如何快速生成摘要和剪辑点,落点在一人高效处理长素材。适合视频号口播和小红书图文拆解。
🎯 小红书图文/视频号口播:第一时间实测Fugu模型,与Claude/GPT等对比,展示其在内容创作、工作流等方面的能力,突出提效优势。
源自:Sakana Fugu
🎯 实测Kimi K2.7 Code的Agentic Coding,演示如何用它自动生成小红书文案或剪辑脚本,拍摄口播视频展示流程。
🎯 下载并实测Apertus模型,与Llama等主流开源模型对比性能,制作小红书图文或视频,突出零成本本地部署降本增效。
2026-06-20
🎯 若模型公开,可做“AI视频新王?实测对比Veo3”的小红书图文或视频号口播,突出一人公司提效。
🎯 实测VibeThinker-3B与DeepSeek等大模型在推理任务上的表现,突出“3B战胜大模型”的降本增效,适合小红书图文或视频号。
2026-06-19
🎯 一期视频/图文:实测GLM-5.2性能,对比其他开源模型,并给出本地运行配置建议,落点「个人/小团队如何低成本用上最强开源模型」
2026-06-18
🎯 制作视频/图文实测 DeepSeek 视觉功能:上传截图、图表或手写笔记,测试其理解与分析能力,可与 GPT-4V 对比,落点“用 AI 省掉设计/数据分析外包”。
🎯 选题:GLM-5.2 vs Claude/GPT 实测,聚焦文案生成、策划提效,小红书图文+视频号演示,突出“免费调用顶级模型降本增效”。
2026-06-17
🎯 实测深度求索V4在办公场景的能力,对比GPT-4o,突出‘省钱提效’,适合小红书图文/视频口播,标题如“微软都搞的国产模型,打工人用起来”
🎯 标题:GLM-5.2 开源模型实测,到底能不能打?内容:用GLM-5.2与Claude、GPT做写作、策划、编程等任务对比,突出性价比和中文优势,小红书图文/视频号口播,落点:一人公司选模型省钱提效。
🎯 视频号口播+小红书图文:用GLM-5.2策划一场线上活动,对比其他模型,展示其长链条推理能力,标题如《新一代长任务AI来了!GLM-5.2能让一人公司效率翻倍吗?》
🎯 实测GLM-5.2在文案、数据分析等任务上的表现,对比DeepSeek等同级模型,做成小红书图文或视频,强调免费开源、一人公司提效。
🎯 标题:GLM 5.2 vs GPT-4o 实测对比:中文任务谁更强?形式:小红书图文,展示写作、逻辑、编码等典型场景截图,结尾总结一人公司选用建议,强调降本增效。
🎯 选题“Grok 4.3实测对比:又多一个强模型可选?”,录制视频展示在Bedrock调用Grok完成选题、脚本生成,与GPT-4o、Claude对比质量与风格,落点帮创作者选模型提效。
🎯 可制作「Grok 4.3实测:在Bedrock搭建AI助手」的内容,演示内容生成或Agent场景,但需实际测试环境。
🎯 可做一期对比实测:GLM-5.2在不同平台(英伟达vs摩尔线程)上的推理速度与效果,突出国产方案降本潜力,适合小红书图文。
🎯 实测对比GLM-5.2与Claude Sonnet在真实代码任务上的表现,制作视频口播或图文教程,突出其1M上下文在长代码维护中的降本增效场景。
🎯 录制GLM-5.2与DeepSeek/其他模型在文案生成、数据分析等场景的对比实测,突出效率与成本,发布小红书图文对比。
2026-06-16
🎯 小红书图文/视频号口播实测Qwen-RobotManip:用文字指令让机器人完成抓取任务,对比GPT-4o等具身方案,突出“一人操控机器人团队”的提效潜力。
🎯 立刻上手实测Fable 5/Mythos 5,与Claude、GPT-4o等对比写作、代码、逻辑推理能力,制作小红书图文/视频号口播,突出“一人公司选模型”指南。
2026-06-15
🎯 可快速获取内测资格,制作「GLM-5.2 实测」图文或视频,对比 Claude/GPT,突出其特色与提效场景。
🎯 实测Noiz AI音频生成:输入文本秒出多语言配音,支持时间戳对齐视频。对比ElevenLabs,展示‘单卡0.24秒’实时性,制作‘如何用AI一人完成视频配音全流程’教程,突出降本增效。
🎯 实测GLM-5.2 vs 竞品在长文本理解、代码生成上的表现,制成对比视频或图文,强调一人在AI协助下完成复杂任务的提效效果。
🎯 小红书图文/视频号:快速上手 Apple 基础模型,测试其在文案生成、数据解读、创意脚本等任务的实际效果,对比 ChatGPT 和 Claude,给出一人团队选型建议。
🎯 制作GLM-5.2与Kimi/ChatGLM长文本理解对比实测,展示论文、报告总结效果,突出内容创作者提效,适合小红书图文或视频号口播。
🎯 选题:实测天工AI Matrix-Game 3.5生成视频效果,对比现有工具,突出“一人公司”用AI做视频的降本增效。形式:小红书图文/视频号口播。
2026-06-14
🎯 实测Rio3.5与Qwen3.7在写作、翻译等任务上的表现,制作对比图文/视频,突出免费模型助力一人公司提效
🎯 立即实测GLM 5.2在文案、数据分析等任务上的表现,与GPT-4o、Claude对比,制作「一人公司选哪个模型」视频/图文,突出降本增效。
🎯 制作 GLM 5.2 实测视频:对比 GPT-4o 在文案写作、数据分析、代码生成等任务上的表现,突出免费优势,带出“一人公司提效”落点,发布小红书图文和视频号口播。
2026-06-13
🎯 若开放API,可实测星火X2-VL的图文理解与生成效果,与GPT-4o、Claude等对比,输出小红书图文测评,突出对内容创作者的提效价值。
🎯 下周开源后实测GLM-5.2的代码生成能力,与Claude/GPT对比,制作对比评测视频或图文,标题如《国产开源代码模型GLM-5.2实测:一人公司写代码能提效多少?》,突出对非技术创业者写简单脚本的辅助。
🎯 实测Kimi K2.7-Code在自动化内容生产(如脚本生成、数据处理)中的效果,对比上代版本,制作小红书图文或视频号口播,突出“一人公司提效”落点。
🎯 可科普VLA模型如何让AI从对话到物理行动,与常规LLM对比,但主题偏离创作者核心,适合作为行业动态简讯
2026-06-12
🎯 选题:实测Kimi K2.7-Code编程能力,对比DeepSeek Coder等,展示用AI写自动化脚本提效。小红书图文/视频号口播,落点:一人公司如何用AI编程省成本。
🎯 短视频实测Zamba2-VL生成图片/文案的速度与质量,对比主流模型,突出效率优势,展示AI如何帮助内容创作者快速出片。
🎯 选题:实测主流模型在Fable中的智能体表现,对比推理与交互能力。小红书图文拆解测试过程,视频号口播复盘结果,强调AI提效潜力和适用边界。
🎯 视频号口播实测Claude Fable的主动性:让它自动监控邮件、生成内容提纲,展示“一人公司”如何用AI主动管理任务,标题可做“Claude新功能,你的AI助手开始主动干活了”。
2026-06-11
🎯 解读Open-R1项目进度与R1特性,实测对比开源方案,演示本地部署或API接入后如何辅助内容决策与数据分析,突出个人创作者零成本提效。
🎯 实测North Mini Code在自动修Bug、代码生成上的效果,与Claude Code对比,制作“一人公司零成本AI编程助手”教程,发小红书图文+视频号。
🎯 横向测评谷歌新模型与 GPT-4o/Claude 3.5 的生成速度与质量,重点测公众号、短视频文案等任务,突出“一人公司”效率翻倍,视频号口播。
🎯 出一条「实测小米1T大模型:1000 Tokens/秒能做什么?」视频,跑本地/云端对比,展示Vibe Coding七秒生成网页,落点一人开发效率。
🎯 标题:谷歌新模型DiffusionGemma生成速度提升4倍!实测对比值得用吗?
形式:小红书图文/视频号口播,实测生成速度、质量与Gemma、Claude等对比,展示本地部署用法,落点:一人公司如何用更快模型提效。
🎯 实测DiffusionGemma vs GPT-4o/Claude,从生成速度、文本质量、适用场景三方面对比,视频号口播+小红书图文,落点一人公司如何选模型提效
🎯 标题:实测谷歌新模型DiffusionGemma:文本生成快4倍,效果如何?形式:小红书图文,对比生成速度与质量。落点:未来内容创作效率可能大幅提升。
🎯 实测Claude Fable 5拒绝回答的边界,制作对比视频,展示“最强模型”为何不敢答基础问题,落点提醒用户AI的可靠性问题。
🎯 做一期短视频科普,对比主流AI工具数据政策,提醒一人公司如何选择安全的AI服务,可结合截图演示。
🎯 可做快讯解读:用Demogo(如Hugging Face)实测生成速度,对比普通Gemma,强调对内容创作者提效的潜力,发布在小红书图文。
🎯 制作一期视频实测DiffusionGemma速度与质量,对比传统模型,展示一人公司如何用它快速生成文案、选题,降本增效。
2026-06-10
🎯 实测HiDream-O1-Image-1.5生成真人/产品图,对比Midjourney、DALL·E,突出质量与效率,做小红书图文或视频号口播,落点AI让创作者一人高效产出视觉素材。
🎯 实测两个版本在敏感话题、创意写作等场景的表现,制作对比视频/图文,突出安全与自由的平衡,小红书或视频号口播,吸引非技术受众。
🎯 可制作一期“GPT-5.6 vs Mythos 实测对比”,突出新功能/性能提升,演示如何用新模型提效内容创作,图文/视频均可,吸引关注AI工具的技术流受众。
🎯 连夜实测Claude Fable 5,对比GPT-4o在文案创作和数据分析上的表现,用真实案例展示一人搞定多工种,做小红书图文对比+视频号口播
🎯 可做一期“AI读懂你的喜怒哀乐”的前沿解说视频,介绍模型原理和可能应用场景,吸引对前沿AI技术感兴趣的受众,平台:视频号口播,落点:未来智能体更人性化。
🎯 立即上手实测Claude Fable 5的文案、分析能力,对比旧版,展示降本增效,发视频号口播+小红书图文。
🎯 将Simon的测评二次解读,聚焦文案、编程等场景,实测Fable 5提效效果,输出对比视频或图文。
🎯 小红书图文/视频号实测:对比Claude Mythos 5与GPT-4等模型在代码生成、长文本理解上的表现,突出“一人顶一个团队”的效率。
🎯 实测Gemini Live Translate在视频翻译配音中的表现,对比传统方法,展现降本增效,适合视频号口播。
🎯 实测Gemini Live Translate在视频翻译配音中的表现,对比传统方法,展现降本增效,适合视频号口播。
🎯 立刻开箱实测,对比GPT-4o,演示代码、写作等任务,突出降本增效,适合视频号口播+小红书图文。
🎯 实测Claude Fable 5 vs GPT-4o等,展示其在文案、代码、分析等任务的表现,制作对比图文或视频,突出对创业者提效的实用技巧。
🎯 解读Claude Fable 5系统卡,分析其安全限制对实际使用的影响,并提供绕过护栏的创意用法,适合深度测评文章。
2026-06-09
🎯 实测North Mini Code vs Claude/GPT在代码生成任务上的表现,制作对比视频/图文,突出“一人公司提效”
🎯 实测Gemma 4 12B的图文理解与生成能力,制作评测内容,体现“用AI做内容提效”
🎯 模型公开后,做本地部署评测,对比GPT在文案撰写上的表现,看能否成为免费易用的内容助手。
🎯 出一期“国产大模型新选手实测”:对比其与DeepSeek等在文案生成、多模态理解上的表现,突出对一人公司提效的价值,形式为视频号口播+小红书图文。
2026-06-08
🎯 制作「微软新语音识别实测」视频/图文:用几段不同场景音频(口播、采访、噪音)对比MAI-Transcribe-1.5、Whisper、剪映,看谁又快又准,落点帮创作者省剪辑时间
2026-06-04
🎯 制作「ChatGPT新记忆功能实测」:对比新旧版本在连续对话中的表现,演示如何用于长期内容策划和客户记忆,小红书图文,落点:一人公司的超级助理更懂你了。
2026-06-03
🎯 视频实测:“微软新模型MAI-Thinking-1对标GPT-5?我花了3小时实测”。对比推理能力、速度、成本,给出降本增效建议。
2026-06-01
🎯 上手实测Mellum2,与GPT-4o、Claude等对比,测试内容生成、逻辑推理,适合AI测评号做视频/图文。
2026-05-30
🎯 挑选与内容创作相关的演示(图/视频/文案生成),做成实测对比视频,强调一人团队如何用AI提效。
2026-05-20
🎯 立即实测Gemini新Agent能力,做“我的第一个AI员工:Gemini帮我订机票写邮件”,视频号口播演示,社群引流,落点:一人公司用AI代理省时间。
🎯 制作“Gemini 3.5 vs GPT-5 实测对比”系列,小红书图文+视频号口播,突出对创作者哪个更好用,落点:选择最强AI工具提效。
2026-05-18
🎯 首发实测Gemini Omni,对比GPT-4o,全方位测试图文理解、视频脚本生成。输出对比图,吸引创作者选型,落点帮用户挑选最称手的AI工具。
2026-05-16
🎯 立即上手实测 Gemini 3.5 的 agent 功能,与 Claude/GPT 对比执行复杂任务的效果,制作小红书图文/视频号口播,展示“一人公司”如何用 AI Agent 提效。
2026-05-15
🎯 简要介绍该嵌入模型如何用于搭建私有知识库问答,辅助内容创作时的素材检索,适合小红书图文教程。
2026-05-13
🎯 如果示例可运行,做一个《GPT 新能力:能理解空间关系了?》的实测视频,展示效果,并讨论对内容创作的影响。
2026-01-08
🎯 仅作资讯参考,可结合Goose等工具提及开源生态,但无需单独深挖。