原来 ollma 和 openwebui 是配套使用的,本地安装 ollma ,再用 docker 启动一个 openweb-ui 直接可以对接,加载本地推理模型,使用起来很丝滑。孤陋寡闻了。 对了,ollma 主要也是对 llama.cpp 的封装。
原来 ollma 和 openwebui 是配套使用的,本地安装 ollma ,再用 docker 启动一个 openweb-ui 直接可以对接,加载本地推理模型,使用起来很丝滑。孤陋寡闻了。 对了,ollma 主要也是对 llama.cpp 的封装。