之前的文章中介绍了Obsidian配合Ollama的使用案例,那么它们是如何配合起来的呢?其实这个问题并不准确,问题的准确描述应该是Obsidian的Copilot插件是如何与Ollama大语言模型交互的。因为Obsidian在这里只是一个载体,核心功能还是Copilot插件与Ollama完成的。
从obsidian-copilot开始
在为Obsidian安装Copilot插件时,发现Copilot插件是开源的。
打开源码仓库根目录的 local_copilot.md 能看到Ollama相关的介绍。其中提到了Ollama server,猜测Copilot插件是通过REST API去和Ollama通信的。
进一步了解Ollama
Ollama的文档里提到了一些信息
- Ollama提供了一系列的API
- Ollama启动后默认侦听127.0.0.1的11434端口来提供API服务
- Ollama server在运行时会产生日志,在MacOS的存放路径是 ~/.ollama/logs/server.log
- 把环境变量 OLLAMA_DEBUG 设置为1可以启用debug日志
启用debug日志后重启Ollama,在浏览器里输入 http://127.0.0.1:11434 得到如下结果
在Ollama命令行提出一个问题(这里问它的名字),在日志里看到了相关的信息
说明Ollama命令行里的提问会调用/api/chat这个API。在Obsidian的Copilot Chat窗口里提问也会看到类似的日志。
交互过程
那么Obsidian的Copilot插件是如何调用Ollama server的API呢?在obsidian-copilot源代码中没有发现对/api/chat的直接调用,看起来封装的比较深。通过分析源代码推测调用的层次如下
- langchain/ollama 是langchain.js对Ollama的集成,是一个npm包
- Ollama JavaScript Library 是Ollama提供的对其API调用的JavaScript封装
看得出调用关系还是比较清晰的。但这里再次引申出一个问题:为什么Obsidian Copilot插件不直接和Ollama server通信呢?为什么非得引入langchain来做这件事情呢?