开源社区在短短两天内就完成了卡帕西未竟的工作,构建了一个完整的知识库,并节省了高达七十余倍的token消耗。
这款工具支持零配置使用,只需一个命令即可生成完整知识图谱。
人工智能领域的发展速度令人难以置信。
Graphify是一个集全模态处理和低token消耗于一身的工具,已在GitHub上开源,并获得了超过2000个星标。
它不仅能够自动构建导航知识图谱、自带反向链接功能,还可以进行关系溯源,同时实现了高达71.5倍的token节省。

卡帕西的知识库核心在于一个轻量化的流程,不需要复杂的向量数据库支持。

这个流程通过raw/目录存储论文、代码和截图等原始材料,并利用大型语言模型自动生成带有交叉引用的Wiki文档。配合定期维护后可以建立一个不断生长且越来越有效的知识体系。
万物皆可图谱化
尽管这套工作流概念很好,但在实际应用中仍有改进空间。
比如,raw文件夹需要手动整理分类;新资料添加时也需要全程跟进处理;
反复读取原始文件会导致大量token消耗,卡帕西本人也提到大部分token已经不再用于运行代码;
此外,目前这套方法仍处于手工操作阶段,缺乏专门的工具支持,用户需要手动引导AI完成各项任务。
针对这些痛点,在卡帕西知识库发布两天后,开源社区推出了一款名为Graphify的完善解决方案。
Graphify实现了全模态图谱化的自动化处理,并大幅减少了token消耗。

它内置统一多模态处理管线,能够针对不同类型文件执行自动解析。
对于代码文件使用tree-sitter进行本地AST解析;对PDF、Markdown等文档实现文本和语义单元的拆分;对于截图和其他视觉内容,则调用Claude Vision来提取概念与识别关系。
这些步骤都不需要人工预处理,也无需分类或筛选,直接丢进文件夹即可进行统一图谱化。
相比之下,卡帕西的raw文件夹仍需用户手动整理资料、触发处理流程。而Graphify实现了从文件扫描到知识图谱生成的全程自动化操作,真正做到了“万物皆可图谱化”。
它通过本地AST解析与并行LLM子代理语义提取的两阶段流程,在混合场景下达到了71.5倍token优化效果。
具体来说,第一阶段是对代码文件进行确定性AST提取;第二阶段则是对非代码内容进行一次性的语义抽取,并通过SHA256缓存机制避免重复计算,确保Token真正用于推理过程。
在混合场景下(包括卡帕西的仓库文件、五篇论文和四张图片),使用Graphify后每次查询所需的token消耗相比直接读取原始文件降低了71.5倍。

此外,它还支持无需向量数据库与复杂配置的开箱即用功能。
它采用基于图拓扑的聚类方法来完成社区发现,使用Leiden算法按边密度划分社区,并且不依赖于嵌入计算。
用户只需在目标文件夹执行一条命令就能一键生成完整知识图谱,附带交互式HTML、分析报告与持久化数据文件,大幅降低了上手难度。
同时,Graphify为每条关联内容提供了清晰的类型标注,并标明了原文提取、模型推断和歧义关系,还附带置信度信息,使知识来源更加透明可靠。

接下来谈谈如何安装这个工具。
Graphify支持多种平台兼容使用,包括Claude Code、Codex以及OpenClaw等。
它只需要Python 3.10或以上版本的环境,通过一行命令即可完成部署(当前PyPI包名为graphifyy):
pip install graphifyy && graphify install
全平台适配
如果用户使用龙虾平台,则可以通过以下命令安装:
graphify install —platform claw
对于Codex用户,要想启用Graphify的并行LLM子代理提取功能,需要在配置文件中打开multi_agent选项。
OpenClaw平台目前对多代理并行的支持较为初级,因此只能采用顺序模式进行提取操作。

执行完命令后,当前目录会出现graph.html文件,打开浏览器查看交互式知识图谱。
此外,Graphify还支持实时监控和增量更新功能。

- Graphify的作者Safi Shamsi现就职于伦敦Valent公司,担任AI研究员一职。
- 事实上,在卡帕西知识库发布后,许多人纷纷尝试复刻,并推出了一款基于个人文件的“活维基”工具。
当前人工智能领域的迭代速度可以用疯狂来形容。

执行完命令,当前目录里就会出现graph.html文件,在浏览器中打开就能看到可交互的知识图谱。

它还支持—watch文件监听模式 ,代码文件改动后会立即触发AST重新解析,实时更新图谱;文档、图片变更则会主动提醒用户执行增量更新。
同时还能安装Git钩子,在代码commit提交、分支切换后自动重建图谱,无需额外开启后台进程。
配合/graphify —update增量更新命令,新资料加入时无需重建整个图谱,只更新相关节点和关联,让知识库真正实现随资料新增持续生长、越用越完善。

Graphify的作者Safi Shamsi现为伦敦Valent公司的一名AI研究员。
One More Thing
其实卡神的知识库出来之后,很多人都开始跟风复刻,还有人做了一款基于个人文件的“活维基”工具。

AI圈现在以小时为单位的迭代玩法,只能说疯狂,太疯狂。

项目地址:https://github.com/safishamsi/graphify/blob/v3/README.zh-CN.md
参考链接:https://x.com/socialwithaayan/status/2041192946369007924x
— 完 —

闻乐