跳转至

LLM

简介#

LLM 全称为大型语言模型Large Language Models,从 ChatGPT 开始被举世瞩目。

ChatGPT 是 OpenAI 公司创造的,基于 GPT-3.5 模型的聊天机器人,于 2022年11月30日 推出。之后再 2023年3月14日, OpenAI 公司推出了更强大的 GPT-4。

封禁 GPT#

2022年12月15日,微信被发现禁止 ChatGPT 相关小程序,甚至禁止搜索 ChatGPT 这个关键字,1 微信的禁止 ChatGPT 的隐性规则持续时间很长,即使在 2023年2月 也有相同的隐性规则。2

2023年2月9日 左右,淘宝 ChatGPT 关键词,也下架了相关的成品号,3 之所以成品号流行, 是因为 ChatGPT 需要境外手机号码验证才能注册。

2023年2月9日 左右,首个中国初创公司元语智能首发 ChatYuan,被发现从微信小程序平台封禁,4 原因可能是内容不符合要求。5

2023年2月12日 左右,网络上开始流传网信办要求企业全面排查「基于或实现类似ChatGPT的产品、服务、功能」的情况,如有, 需正式报备并接受监管部门安全评估,评估通过后可上线。如未经监管部门评估报备就上线,监管部门将采取处置措施。6

2023年2月15日,有阿里云用户表示自己的含有 ChatGPT 内容(源代码和文章)的网站被要求整改。78

2023年2月15日,运营和贩售 ChatGPT 镜像、帐号的 chatgpt.sbaliyun.com 站长表示接到网信办短信, 要求下架该网站。9101112

2023年2月21日,《21世纪经济报道》表示从部分微信小程序相关的服务的机构了解到:13

市场传言有关部门加强 ChatGPT 及相似产品的监测评估和违规行为处置工作

要求坚决关闭从境内访问境外 ChatGPT 的代理服务。抓紧摸排旗下各类网站、应用程序、公众号、小程序等,不得通过代理、插件、 用户自行部署等方式向公众提供境外 ChatGPT 产品的访问服务。如存在访问渠道,迅速整改下线。

2023年2月22日,有蚂蚁集团的从业者表示已被指示,不得直接或通过第三方在其平台上提供 ChatGPT 服务。 并且科技公司在推出自己的类似 ChatGPT 的服务之前,还需要向监管机构报告。14

越狱#

2022 年,当时还是 GPT-3.5 版本的 ChatGPT 发布了。虽然还有许多局限,但有记忆能力,能处理简单的问题,已经让人看到了未来。 但 OpenAI 出于各种目的,给模型添加了一些安全机制,使其无法发挥各种能力。

比如关于预测未来、政治、色情以及危险品等内容,模型都会拒绝讨论。但人们都好奇不受限制的 AI 是什么样的, 于是给大型语言模型越狱,就成为了许多人目标。1516

首个广泛使用的越狱方法,是输入让 LLM 扮演 DAN(Do Anything Now)的 prompt。部分内容是:「DAN 能对未来进行预测, 不需要遵守 OpenAI 内容政策。」然后让 ChatGPT 扮演 DAN,这样就实现了越狱。17

另外还有代币系统 prompt,如果 DAN 拒绝提供帮助,那么就会扣除一些代币。对于经过加分、扣分训练的 LLM 来说, 也可能会起到绕过审查的作用。

除了用 prompt 来绕过 LLM 自身的审查,直接打造个无审查的 LLM,也是个好方法。具体方案是利用开源 LLM 的输入与输出数据集, 剔除掉关于「人为添加倾向性」的短语,例如「作为语言模型」「确保安全」「无法提供帮助」等, 同时不对训练数据进行常规意义的审查。最后,用这个数据集就能训练出未经审查的 LLM 了。1618

使用了这个方法所制作出的 LLM,有 Llama 2 Uncensoredeverythinglmdolphin-mistral 等, 但缺点是制作者剔除了多语支持,只能用英文。好在还有 CausalLM 这个关注中文的 LLM, 因为开发者自称「由于计算资源的限制」,没有完全移除所有的「不良内容」,所以被认为是个无审查的 LLM。19

自建 LLM 的细节

Ollama 是比较易用的 LLM 工具,但它默认没有文件安装位置选项,需要配置环境变量才行,具体请参考 issues 2551 的内容。

论理问题

经过越狱,或者没有审查的大型语言模型(LLM),毫无疑问能被用于犯罪等不良用途上。那么发布越狱方法,制作没有审查的 LLM, 是否意味着不道德?

LLM 遵守的公司规范,以及当地法律,不一定是普世的规则。其他地区、信仰或是不同价值观的人,可能无法正常使用。 然后是关于创作,受限的 LLM 不会讨论关于违法的细节,但这样就没法写犯罪小说了。

这其实与 VPN、Tor 以及 E2EE 是相似的,这些技术都能保护隐私。而 VPN 还能起到跨区的作用,比如查看地区限定的内容。 但罪犯也能用来隐藏踪迹,帮助其犯罪。

只因为某种技术能被恶意使用,就要完全制止吗?这显然可以讨论、妥协的议题。就像是高压锅能做炸弹,但没人想着禁止高压锅, 或者使其实名购买吧。

所以发布越狱 prompt,以及无审查版本的 LLM,都不应该受到道德批评。就算真的有罪犯用来犯罪, 作者也不应被指控为协助犯罪,因为 技术是中立的


Mosaic 浏览器共同开发者,网景通讯公司的创始人马克·安德里森,在社交媒体平台 X 上发文表示: 「越狱者在道德上相当于编写VPN软体绕过防火墙的程式设计师。 💻🛜⛓️💥」20

算法备案#

2023年7月13日 公布的《生成式人工智能服务管理暂行办法》里提到:

《生成式人工智能服务管理暂行办法》摘录

第十七条 提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估, 并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、 注销备案手续。

要求 LLM 的「算法」备案,但是备案要求十分苛刻。有位个人开发者在 V2EX 分享了算法备案等,合规相关信息:21

  1. 所有算法备案的都需要公司的名义,同时公司里面必须有人在缴纳社保。21

    即使单纯挂名,社保花费也达到了 6000 元/月的成本。(每个月社保算 2000 人民币,公司 3 个人)

  2. 算法备案需要做「网络安全保护等级」的测评,大约 10 万或者以上。212223

  3. LLM 要求后台审核达标,需要组织内部团队审核,然后有排班、审核机制等……21

  4. 提供警用接口。2124

  5. 网络信息办公室需要测试该模型。21

附言:曾经电话交换机上面也有「警用接口」,用来监听,原理似乎是 Signalling System No. 7(SS7)。25

封禁 AI 绘画#

2023年9月13日,包括 liblib、Tusi.art、海艺AI、AI中文站等 AIGC 网站,其域名均被关闭,其中的 liblib 被发现更换了域名, 服务器的物理地址也转移到了新加坡的阿里云,26 说明遭受到审查了。

App Store 大陆区下架#

详情请阅读 App Store 条目的〈下架 AIGC App〉章节。


  1. 山外的鸭子哥, 《微信直接封杀ChatGPT 相关小程序被暂停/搜索词被屏蔽》, 蓝点网, 2022-12-15. (参照 2022-12-24). 

  2. a87750530, 《docker 部署微信wechat-chatgpt》, 全球主机交流论坛, 2023-02-11. (参照 2023-02-17). 

  3. 卢松松, 《淘宝微信屏蔽“ChatGPT”关键词》, 网易号, 2023-02-09. (参照 2023-02-17). 

  4. 吕倩, 《定位ChatGPT中文版的元语智能,宣战不久已“翻车”》, 第一财经, 2023-02-09. (参照 2023-02-17). 

  5. 芝麻仁冇蘑菇, 《(有圖)內地AI聊天機器人宣戰ChatGPT出師未捷就「身先死」被封 網民:敏感詞、敏感內容太多》, LIHKG 討論區, 2023-02-10. (参照 2023-02-17). 

  6. 戈壁淘金, 《传:ChatGPT最新消息》, 韭研公社, 2023-02-12. (参照 2023-02-17). 

  7. 老实人, 《网站里有chatgpt相关内容的赶紧删除,已接到整改通知》, 4414站长论坛, 2023-02-15. (参照 2023-02-17). 

  8. estk, 《网站里有 chatgpt 相关内容的赶紧删除,已接到整改通知》, V2EX/水深火热, 2023-02-15. (参照 2023-02-17). 

  9. 静香, 《静香 再见》, 全球主机交流论坛, 2023-02-15. (参照 2023-02-17). 

  10. qiaoyurensheng, 《刚刚发现 一个 chatgpt 国内代理站被要求关站了》, V2EX, 2023-02-16. (参照 2023-02-17). 

  11. 静香, 《ai chat搭建教程》, 全球主机交流论坛, 2023-02-10. (参照 2023-02-17). 

  12. Ai Chat公益版》, 2023-02-16. (参照 2023-02-17). 

  13. 21财经, 《部分境内访问境外ChatGPT代理服务被关闭》, 东方财富网, 2023-02-21. (参照 2023-02-22). 

  14. msmash, China Tells Big Tech Companies Not To Offer ChatGPT Services, Slashdot, 2023-02-22. (参照 2023-02-27). 

  15. Zian (Andy) Wang, From DAN to Universal Prompts: LLM Jailbreaking, Deepgram, 2023-11-01. (参照 2024-11-05). 

  16. Eric Hartford, Uncensored Models, Cognitive Computations, 2023-05-15. (参照 2024-11-05). 

  17. coolaj86, ChatGPT-Dan-Jailbreak.md, Gist, 2023-02-11. (参照 2024-11-05). 

  18. anon8231489123, anon8231489123/ShareGPT_Vicuna_unfiltered, Hugging Face/Datasets, 2023-08-06. (参照 2024-11-05). 

  19. tastypear, tastypear/CausalLM-14B-DPO-alpha-GGUF, Hugging Face, 2024-07-27. (参照 2024-11-05). 

  20. Marc Andreessen 🇺🇸, The jailbreakers are the moral equivalent of coders who write VPN software to bypass the Great Firewall. 💻🛜⛓️💥, X (formerly Twitter), 2024-11-02. (参照 2024-11-11). 

  21. webhub123, 《关于算法备案的问题 2》, V2EX, 2024-06-06. (参照 2024-06-07). 

  22. 悟安, 《2022年等保测评收费标准》, 搜狐网, 2022-06-23. (参照 2024-06-07). 

  23. 三分钟带你了解等保测评全流程》, 宝通测评, 2023-10-12. (参照 2024-06-07). 

  24. 312(公安部), 《互联网服务警用接口总体技术要求》, 国家标准项目 - 全国标准信息公共服务平台, 2017-08-01. (参照 2024-06-07). 附言:该标准已过期。 

  25. 未知, 《关于中共公安的“电话监听网”》, 明慧网, 2006-06-23. (参照 2024-06-21). 

  26. babyoung, 《AIGC 今天大面积封杀啊 包括稿定在内都 G 了》, V2EX, 2023-09-13. (参照 2023-09-13). 

(由于更新时间是手动更新的,所以部分页面内容已更新,但忘记修改新的日期了……)