在自己的电脑运行清华开源语言模型 ChatGLM-6B

2023 年 04 月 15 日

442 次浏览

672字数

有人说 AIGC 用 2 年时间走完了互联网 10 年的路，因为大家看到的是围绕 AI 的产品在最近如雨后春笋般涌现，看不到的事各领域大佬早在几年前已经开始了相关布局。

过去这段时间 AIGC 市场竞争异常激烈，各大厂纷纷祭出自家的大预言模型，在这场国产 AI 大乱斗中，清华大学于 2023 年 3 月 28 日发布的开源通用语言模型 —— ChatGLM-6B 显得格外不同，因为这是一款开源的语言模型。

ChatGLM-6B 使用了和 ChatGPT 相似的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

每个人都可以将源代码和模型下载到自己的电脑上运行。这也许才是未来 AI 正确的打开方式，避免一家独大造成垄断格局。

我尝试在自己的 MacBook Air M1 和一台 Linux 虚拟机平台运行了该模型，并记录了运行过程和最终效果。