风格 × 布局:baoyu-skills 的视觉设计系统如何让 AI 画得比你设计得还好

你让 AI 画张图,它给你一堆过饱和塑料感的玩意儿。你让 AI 做信息图,它把文字堆在一张不透明的背景上。你让 AI 设计幻灯片,它给你五颜六色、毫无一致的灾难。

问题的根源不在 AI 不会画画——Claude 能写出精确到像素的 SVG,DALL·E 和 Gemini 能生成以假乱真的照片。问题在于你让它“自由发挥”。

baoyu-skills 的视觉设计系统正是为了解决这个问题而设计的。它用风格 × 布局的组合学,把视觉创作从“猜 prompt”变成了“选参数”。

不是教 AI 设计,是给 AI 设计约束

大多数 AI 画图工具的思路是“给 prompt → 出图”。prompt 越详细越好,但详细意味着你要懂构图、配色、风格、信息层次——换句话说,你得是个设计师。

baoyu-skills 反其道而行之。它不给 AI 自由发挥的空间,而是用结构化的参数空间来约束输出:

  • 风格决定视觉美学(线条、色彩、质感)
  • 布局决定信息结构(密度、层级、关系)
  • 配色作为可选覆盖层,在不破坏风格的前提下微调

结果是什么?你不需要知道“扁平矢量风格应该用什么 prompt”。你只需要说 style=notion,layout=dense,剩下的交给技能本身。

这套系统覆盖了五种视觉场景:

技能风格数布局数设计空间
小红书图片卡片12672 种组合
专业信息图1720340 种组合
幻灯片16 预设(4维)4 级密度16 种预设
知识漫画5 画风× 7 基调6210 种组合
文章封面6 类型× 11 配色× 7 渲染-77 种组合

换句话说,你在 baoyu-skills 中可以选择的视觉方案超过 700 种。而你只需要记住两个参数。

小红书图片卡片:风格即语言

小红书的内容高度依赖图片卡片的视觉调性。baoyu-xhs-images 把一篇文章自动拆成 1-10 张序列卡片,每张卡片用统一的风格和可变的布局。

12 种风格

cute fresh warm bold minimal retro pop notion chalkboard study-notes

从 cute(卡通可爱)到 notion(极简手绘),再到 chalkboard(黑板粉笔),每种风格不是简单的“换个滤镜”,而是重新定义了线条、字体和装饰元素。minimal 和 bold 差的不只是字重——前者优雅克制,后者冲击直接。pop 和 retro 走的是完全不同的文化语境。

6 种布局

sparse balanced dense list comparison flow

布局决定了信息密度和呈现方式。sparse 适合封面和金句(1-2 个要点),dense 适合干货总结(5-8 个要点),comparison 是双栏对比,flow 走流程时间线。同一个内容用不同布局呈现,阅读体验完全不同。

风格 × 布局的组合逻辑

关键不是选项多,而是这两个维度正交:你可以对同一篇文章用 notion 风格 + dense 布局做出知识卡片,也可以改成 cute 风格 + sparse 布局做出轻松的封面预告。12 × 6 = 72 种组合,每一种都是独立的视觉语言。

专业信息图:布局即叙事

baoyu-infographic 是这个套装里最重型的视觉技能。它的 20 种布局不是随意的——每种布局对应一种叙事结构。

bridge circular-flow comparison-table do-dont

equation feature-list fishbone funnel

grid-cards iceberg journey-path layers-stack

mind-map nested-circles priority-quadrants pyramid

scale-balance timeline-horizontal tree-hierarchy venn

bridge 适合问题→解决方案的叙事,iceberg 揭示表面与深层的对比,funnel 呈现筛选与转化过程,pyramid 是经典的层级结构。你选的不只是“这个图好不好看”,而是“这个结构适不适合我的故事”。

17 种风格:让数据有性格

craft-handmade claymation kawaii storybook-watercolor

chalkboard cyberpunk-neon bold-graphic aged-academia

corporate-memphis technical-schematic origami pixel-art

ui-wireframe subway-map ikea-manual knolling

lego-brick

同样的 pyramid 布局,用 craft-handmade 是温暖的手绘插画,用 technical-schematic 是冷峻的蓝图风格,用 cyberpunk-neon 是霓虹灯下的未来感。风格决定了观者第一眼的情绪反应,布局决定了他们怎么理解信息。

20 × 17 = 340。对于绝大多数信息图需求,根本不用从零开始设计。

幻灯片:多维组合学的极致运用

baoyu-slide-deck 把风格系统玩到了极致。它的视觉风格不是单一选项,而是由四个正交维度组合而成:

  • 纹理:clean / grid / organic / pixel / paper
  • 氛围:professional / warm / cool / vibrant / dark / neutral
  • 字体:geometric / humanist / handwritten / editorial / technical
  • 密度:minimal / balanced / dense

4 × 6 × 5 × 3 = 360 种参数组合。但宝玉没有把这个矩阵直接抛给用户——他预置了 16 种常用预设:

blueprint chalkboard bold-editorial corporate

dark-atmospheric editorial-infographic fantasy-animation intuition-machine

minimal notion pixel-art scientific

sketch-notes vector-illustration vintage watercolor

blueprint 是 grid + cool + technical + balanced,适合架构设计;corporate 是 clean + professional + geometric + balanced,适合投资人演示;chalkboard 是 organic + warm + handwritten + balanced,适合教学场景。每种预设的维度组合都有明确的适用场景。

生成完成后,所有幻灯片自动合并为 .pptx 和 .pdf——从生成到可分享,一步完成。

漫画和封面:叙事感的视觉化

baoyu-comic 和 baoyu-cover-image 走的是另一个方向——不追求信息密度,而是追求叙事感和情绪传达。

漫画:画风 × 基调 × 分镜

漫画技能支持 5 种画风、7 种基调、6 种分镜布局:

standard cinematic dense splash mixed webtoon

画风从 ligne-claire(欧洲漫画传统)到 manga(日漫)、ink-brush(水墨)到 chalk(黑板粉笔)。组合了基调(warm / dramatic / romantic / energetic / vintage / action)之后,同一个故事可以用完全不同的视觉语言讲述。

其中欧姆社预设和武侠风预设是两个特别值得提的例子。欧姆社用 manga + neutral 的基调,加上“禁止大头对话、道具揭秘”的特殊规则,做出了非常有辨识度的技术科普漫画风格。武侠风用 ink-brush + action,加上气功特效和战斗视觉,能让技术故事穿上武侠外衣。

封面图:五维定制

baoyu-cover-image 用类型 × 配色 × 渲染 × 文字 × 氛围五个维度,提供 77 种独特效果:

notion elegant warm minimal

blueprint watercolor editorial scientific

封面图是文章的门面。conceptual 类型 + pastel 配色 + hand-drawn 渲染 + title-only 文字 + subtle 氛围,和 hero 类型 + dark 配色 + digital 渲染 + text-rich 文字 + bold 氛围——这是两篇完全不同调性的文章。

为什么参数化比 prompt 工程更好

说到底,baoyu-skills 的视觉系统做了一个关键选择:放弃 prompt 的自由度,换取参数化的一致性和可预测性。

prompt 工程的问题

  • 同一个 prompt 在不同模型上结果天差地别
  • 微调 prompt 像盲调——你不知道改一个词会带来什么连锁反应
  • 没有可复用的组件。上次画的图风格没法直接“复用”到新项目上
  • prompt 长到 200 字时,你实际上是在用自然语言写设计稿

参数化系统的优势

  • 输入是结构化的:风格 + 布局 + 可选配色
  • 输出是可预测的:同样的参数始终产生同样的视觉调性
  • 风格可复用:一次调好的组合可以在多个项目间复用
  • 学习成本低:不需要懂设计术语,只需要看预览图选

这套设计给内容创作者的价值是什么?你不需要在设计上浪费决策精力。把认知资源留给内容本身,视觉呈现交给参数。

安装与快速上手

npx skills add jimliu/baoyu-skills

装完后,核心的视觉技能用法:

# 小红书卡片:自动分析文章,推荐风格和布局
/baoyu-xhs-images posts/my-article/article.md

# 指定风格+布局+配色
/baoyu-xhs-images posts/my-article/article.md --style notion --layout dense --palette macaron

# 信息图:自动推荐 layout×style 组合
/baoyu-infographic path/to/content.md

# 幻灯片:用预设风格生成
/baoyu-slide-deck path/to/article.md --style corporate

# 漫画
/baoyu-comic posts/turing-story/source.md --art manga --tone warm

# 封面图:五维定制
/baoyu-cover-image path/to/article.md --type conceptual --palette cool --rendering digital

不需要写 prompt,不需要懂设计。输入文章,选参数,出结果。

注意与局限

自动推荐不一定准。技能会根据内容分析推荐风格和布局,但对于特定品牌调性或个人偏好,建议通过 EXTEND.md 定义自己的预设。

不是所有组合都好看。700+ 种组合中,有些组合在理论上成立但视觉上不协调。好在预览功能让你在生成前就知道效果。

图片生成依赖 API key。baoyu-infographic 和 baoyu-xhs-images 等技能需要图像生成后端(OpenAI、Google、DashScope 等),没有 API key 的话只能用 baoyu-danger-gemini-web 方案。

高信息密度的布局需要好内容。dense 布局能装 5-8 个要点,但如果你的原文本来就没有这么多结构化信息,强行塞进去只会得到空洞的卡片。

不适合的场景:如果你只需要偶尔做一张图,学这套系统的时间成本可能不如直接用一个在线设计工具。它适合有持续产出需求的创作者——每周至少 3-5 篇内容。

结尾

AI 辅助设计的真正瓶颈不是模型能力,是设计决策。你让 AI“自由发挥”时,它给出的答案是所有可能答案的平均值——不好不坏,平庸。

baoyu-skills 的做法是反直觉的:它不给 AI 自由,而是给 AI 约束。风格、布局、配色——每个维度都在收缩可能性空间。但恰恰是这种收缩,让输出变得可预期、可复用、有辨识度。

这就是参数化设计在 AI 时代的价值:你不需要成为设计师,但你产出的东西看起来像设计师做的。

下一次你要做视觉内容,别让 AI 自由发挥。给它一个风格,选一个布局,然后说“run”。


来源:

相关文章

22 个 Claude Code 技能打通内容创作全链路:从生成到发布的一条龙工作流

22 个 Claude Code 技能打通内容创作全链路:从生成到发布的一条龙工作流

你写完一篇技术博客,接下来要做的事情让人头疼:生成封面图、画配图、做信息图、转 HTML 适配微信公众号、发到 X 和微博。这些工作以前需要切换四五个工具,现在在 Claude Code 里打一条命令 ...

当 AI 输出从 10 行暴涨到 1000 行,Claude 团队为什么正在抛弃 Markdown

当 AI 输出从 10 行暴涨到 1000 行,Claude 团队为什么正在抛弃 Markdown

你的 AI 能一次性输出 1000 行计划、画复杂流程图、做完整代码审查。但你还在用 Markdown 读它。 Claude Code 团队工程师 Thariq 最近在 X 上发了一条很直接的推文: ...

Caveman:砍掉 AI 输出 75% 的 Token,一个都不少

Caveman:砍掉 AI 输出 75% 的 Token,一个都不少

你的 AI Agent 话太多了。每句"当然!我很乐意帮你解决这个问题"都是一个浪费的 token —— 它在烧钱、拖慢响应速度、把真正的答案埋在客套话里。如果你每天都在用 AI 编码 agent — ...

跟 Claude 说一声,图就画好了:/drawio 在 Claude Code 里直接出图

跟 Claude 说一声,图就画好了:/drawio 在 Claude Code 里直接出图

你在跟 Claude Code 描述系统架构。它回复了一堆 ASCII art,差不多能看,但总觉得差点意思。你心想:"要是能直接让它画张图就好了。" 可以。 draw.io 的 Claude C ...

Karpathy 给 Claude Code 开的药方:四个原则治住 AI 乱写代码

Andrej Karpathy 一句话戳到了痛点:LLM 会带着错误的假设一路狂奔。它们把代码搞复杂、造抽象层、乱动不该动的东西。最气人的是,它们做得彬彬有礼、信心满满、而且批量生产。 一个 CLA ...