流程图的本质,是对文本信息的整合组织,是对逻辑关系的可视化呈现。而大语言模型非常擅长从给定的文本中抽取主体和关系,也擅长编写格式化的代码,所以用 ChatGPT 之类的大语言模型做流程图的效率简直太高了,而且国内的很多 AI 工具就足以完成流程图制作这样的任务。
我总结了一下,大模型做流程图/思维导图大体分几种:
- 以思维导图为主:Markdown + MarkMap
- 支持各种流程图、可以自定义修改:Mermaid + Draw.io
- 其他:DOT / PlantUML 等描述语言
文本 → Markdown → 思维导图
举个例子,我看到了一篇关于流程图的介绍文章,可以用下面的 Prompt 让 ChatGPT 生成摘要:
请对文章进行概括总结,提炼出其中的逻辑和要点,并进行适当的组织和调整,以 Markdown 形式返回结果。注意:简要返回最核心的要点内容,不要返回整段文字。
ChatGPT 就会将文章缩略为一段 Markdown 格式的介绍;
接下来将这些内容粘贴到 MarkMap 工具里就可以得到思维导图:
这样的导图可以帮助我们快速理清文章的逻辑脉络:
顺便一提,MarkMap 也可以在 Visual Studio Code 的插件中使用:
文本 → Mermaid → 流程图
相比于思维导图,流程图不仅是对文本信息的整合和组织,更是逻辑关系的可视化工具。
在软件开发中,流程图用于描绘算法的执行过程或系统模块之间的交互关系;在业务流程管理中,流程图帮助识别和优化业务操作的各个环节,提高效率和减少错误;在项目管理中,流程图用于规划任务的先后顺序和资源分配,确保项目按计划推进。
按照 Mermaid 中文网的介绍,Mermaid 是一个基于 JavaScript 的图表绘制工具,允许用户使用文本和代码创建图表和可视化。
如果你想系统全面地学习 Mermaid 语法,可以到官方文档中学习。不过,鉴于我们现在有了 AI 加持,自然可以省去枯燥的学习,直接让 AI 帮助我们完成内容摘取和 Mermaid 命令编写。
我实际测试了一下,大多数 AI 工具都可能完成 Mermaid 编写,而且 Kimi 甚至更进一步,直接支持了 Mermaid 的在线渲染和预览。
流程图
比如,我们让 Kimi 制作一个大学生离校的流程图,它会直接给出 Mermaid 代码,点击代码框右上角的 GRAPH,就能看到流程图的预览效果。
不过,这个网页版的渲染效果有限,不支持进一步的内容和样式编辑。我们可以把 AI 生成的 Mermaid 代码进一步导入流程图工具中修改:
打开 draw.io,新建一个空白框图:
然后点击菜单栏的「调整图形 - 插入 - 高级 - Mermaid」:
将 AI 生成的 Mermaid 代码粘贴进来:
这样就可以得到支持内容和样式编辑的流程图了:
辅助阅读:人物关系图
利用大语言模型强大的信息提取和组织能力,结合 Mermaid 和其他图表工具,可以轻松生成清晰且结构化的人物关系图,从而帮助读者更好地理解复杂的故事情节和人物互动。
比如我们可以让 Kimi 来制作书中的人物关系图或者事件发展图。
思维导图
Mermaid 同样支持 Mindmap,比如开篇提到的流程图分类的 Markdown,转化为 mermaid 语法后可以得到下面的结果:
象限图
Mermaid 能做的还不止于此,除了流程图,它还能生成象限图、折线图、饼图等常见图表。
举个例子,我们希望以价格、MMLU 得分为两个维度,将不同的大语言模型划分为四个象限,只需要向 ChatGPT 提供这些模型的价格和得分即可。比如有下面这样一个表格:
模型 | MMLU 得分 | 定价 |
GPT-4o mini | 0.82 | 0.26 |
Gemini 1.5 Flash | 0.78 | 0.53 |
Claude 3 Haiku | 0.75 | 0.5 |
LLama3-70B | 0.82 | 0.95 |
LLama3-8B | 0.64 | 0.2 |
GPT-3.5-Turbo | 0.7 | 0.75 |
只需要把数据贴给 ChatGPT,告诉它画出 Mermaid 格式的象限图,就会得到如下结果:
这个图像还可以进一步修改样式、标注等,使其传达的信息更为明确。
DOT / PlantUML
DOT 语言是 Graphviz 工具的一部分,专门用于定义图形的结构和布局。DOT 语言支持丰富的图形属性设置,包括节点和边的颜色、形状、标签、样式等,可以生成高度定制化的图表,在学术研究、网络拓扑、状态图和流程图等领域具有广泛应用。DOT语言的图形描述更为底层,需要用户详细指定每个元素的属性和布局,因此适合需要高度自定义的场景。而Mermaid语言则更为高层次,用户只需关注图表的逻辑结构和内容,具体的渲染和布局由Mermaid自动处理。这使得Mermaid在快速生成和嵌入图表时更加高效。
PlantUML 则是另一种基于文本的图表描述语言,支持 UML 图、时序图、用例图、类图等,PlantUML 主要用于软件开发和技术文档编写。PlantUML的语法相对简单且直观,用户可以通过编写类似于编程语言的文本描述,定义图表中的元素及其关系。
总结一下,用好大语言模型,结合 Markdown、Mermaid、Draw.io 等工具,可以极大提高流程图和思维导图的制作效率,扩展了图表应用的广度和深度,帮助用户快速、准确地将文本信息转化为可视化内容,助力信息的理解和传达。