有人说 AIGC 用 2 年时间走完了互联网 10 年的路,因为大家看到的是围绕 AI 的产品在最近如雨后春笋般涌现,看不到的事各领域大佬早在几年前已经开始了相关布局。
过去这段时间 AIGC 市场竞争异常激烈,各大厂纷纷祭出自家的大预言模型,在这场国产 AI 大乱斗中,清华大学于 2023 年 3 月 28 日发布的开源通用语言模型 —— ChatGLM-6B 显得格外不同,因为这是一款开源的语言模型。
ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。
每个人都可以将源代码和模型下载到自己的电脑上运行。这也许才是未来 AI 正确的打开方式,避免一家独大造成垄断格局。
我尝试在自己的 MacBook Air M1 和一台 Linux 虚拟机平台运行了该模型,并记录了运行过程和最终效果。