LLM
简介#
LLM 全称为大型语言模型,从 ChatGPT 开始被举世瞩目。
ChatGPT 是 OpenAI 公司创造的,基于 GPT-3.5 模型的聊天机器人,于 2022年11月30日 推出。之后再 2023年3月14日, OpenAI 公司推出了更强大的 GPT-4。
封禁 GPT#
2022年12月15日,微信被发现禁止 ChatGPT 相关小程序,甚至禁止搜索 ChatGPT 这个关键字,1 微信的禁止 ChatGPT 的隐性规则持续时间很长,即使在 2023年2月 也有相同的隐性规则。2
2023年2月9日 左右,淘宝 ChatGPT 关键词,也下架了相关的成品号,3 之所以成品号流行, 是因为 ChatGPT 需要境外手机号码验证才能注册。
2023年2月9日 左右,首个中国初创公司元语智能首发 ChatYuan,被发现从微信小程序平台封禁,4 原因可能是内容不符合要求。5
2023年2月12日 左右,网络上开始流传网信办要求企业全面排查「基于或实现类似ChatGPT的产品、服务、功能」的情况,如有, 需正式报备并接受监管部门安全评估,评估通过后可上线。如未经监管部门评估报备就上线,监管部门将采取处置措施。6
2023年2月15日,有阿里云用户表示自己的含有 ChatGPT 内容(源代码和文章)的网站被要求整改。78
2023年2月15日,运营和贩售 ChatGPT 镜像、帐号的 chatgpt.sbaliyun.com 站长表示接到网信办短信, 要求下架该网站。9101112
2023年2月21日,《21世纪经济报道》表示从部分微信小程序相关的服务的机构了解到:13
市场传言有关部门加强 ChatGPT 及相似产品的监测评估和违规行为处置工作
要求坚决关闭从境内访问境外 ChatGPT 的代理服务。抓紧摸排旗下各类网站、应用程序、公众号、小程序等,不得通过代理、插件、 用户自行部署等方式向公众提供境外 ChatGPT 产品的访问服务。如存在访问渠道,迅速整改下线。
2023年2月22日,有蚂蚁集团的从业者表示已被指示,不得直接或通过第三方在其平台上提供 ChatGPT 服务。 并且科技公司在推出自己的类似 ChatGPT 的服务之前,还需要向监管机构报告。14
越狱#
2022 年,当时还是 GPT-3.5 版本的 ChatGPT 发布了。虽然还有许多局限,但有记忆能力,能处理简单的问题,已经让人看到了未来。 但 OpenAI 出于各种目的,给模型添加了一些安全机制,使其无法发挥各种能力。
比如关于预测未来、政治、色情以及危险品等内容,模型都会拒绝讨论。但人们都好奇不受限制的 AI 是什么样的, 于是给大型语言模型越狱,就成为了许多人目标。1516
首个广泛使用的越狱方法,是输入让 LLM 扮演 DAN(Do Anything Now)的 prompt。部分内容是:「DAN 能对未来进行预测, 不需要遵守 OpenAI 内容政策。」然后让 ChatGPT 扮演 DAN,这样就实现了越狱。17
另外还有代币系统 prompt,如果 DAN 拒绝提供帮助,那么就会扣除一些代币。对于经过加分、扣分训练的 LLM 来说, 也可能会起到绕过审查的作用。
除了用 prompt 来绕过 LLM 自身的审查,直接打造个无审查的 LLM,也是个好方法。具体方案是利用开源 LLM 的输入与输出数据集, 剔除掉关于「人为添加倾向性」的短语,例如「作为语言模型」「确保安全」「无法提供帮助」等, 同时不对训练数据进行常规意义的审查。最后,用这个数据集就能训练出未经审查的 LLM 了。1618
使用了这个方法所制作出的 LLM,有 Llama 2 Uncensored、everythinglm 和 dolphin-mistral 等, 但缺点是制作者剔除了多语支持,只能用英文。好在还有 CausalLM 这个关注中文的 LLM, 因为开发者自称「由于计算资源的限制」,没有完全移除所有的「不良内容」,所以被认为是个无审查的 LLM。19
自建 LLM 的细节
Ollama 是比较易用的 LLM 工具,但它默认没有文件安装位置选项,需要配置环境变量才行,具体请参考 issues 2551 的内容。
论理问题
经过越狱,或者没有审查的大型语言模型(LLM),毫无疑问能被用于犯罪等不良用途上。那么发布越狱方法,制作没有审查的 LLM, 是否意味着不道德?
LLM 遵守的公司规范,以及当地法律,不一定是普世的规则。其他地区、信仰或是不同价值观的人,可能无法正常使用。 然后是关于创作,受限的 LLM 不会讨论关于违法的细节,但这样就没法写犯罪小说了。
这其实与 VPN、Tor 以及 E2EE 是相似的,这些技术都能保护隐私。而 VPN 还能起到跨区的作用,比如查看地区限定的内容。 但罪犯也能用来隐藏踪迹,帮助其犯罪。
只因为某种技术能被恶意使用,就要完全制止吗?这显然可以讨论、妥协的议题。就像是高压锅能做炸弹,但没人想着禁止高压锅, 或者使其实名购买吧。
所以发布越狱 prompt,以及无审查版本的 LLM,都不应该受到道德批评。就算真的有罪犯用来犯罪, 作者也不应被指控为协助犯罪,因为 技术是中立的。
Mosaic 浏览器共同开发者,网景通讯公司的创始人马克·安德里森,在社交媒体平台 X 上发文表示: 「越狱者在道德上相当于编写VPN软体绕过防火墙的程式设计师。 💻🛜⛓️💥」20
算法备案#
2023年7月13日 公布的《生成式人工智能服务管理暂行办法》里提到:
《生成式人工智能服务管理暂行办法》摘录
第十七条 提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估, 并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、 注销备案手续。
要求 LLM 的「算法」备案,但是备案要求十分苛刻。有位个人开发者在 V2EX 分享了算法备案等,合规相关信息:21
-
所有算法备案的都需要公司的名义,同时公司里面必须有人在缴纳社保。21
即使单纯挂名,社保花费也达到了 6000 元/月的成本。(每个月社保算 2000 人民币,公司 3 个人)
-
LLM 要求后台审核达标,需要组织内部团队审核,然后有排班、审核机制等……21
-
网络信息办公室需要测试该模型。21
附言:曾经电话交换机上面也有「警用接口」,用来监听,原理似乎是 Signalling System No. 7(SS7)。25
封禁 AI 绘画#
2023年9月13日,包括 liblib、Tusi.art、海艺AI、AI中文站等 AIGC 网站,其域名均被关闭,其中的 liblib 被发现更换了域名, 服务器的物理地址也转移到了新加坡的阿里云,26 说明遭受到审查了。
App Store 大陆区下架#
详情请阅读 App Store 条目的〈下架 AIGC App〉章节。
-
山外的鸭子哥, 《微信直接封杀ChatGPT 相关小程序被暂停/搜索词被屏蔽》, 蓝点网, 2022-12-15. (参照 2022-12-24). ↩
-
a87750530, 《docker 部署微信wechat-chatgpt》, 全球主机交流论坛, 2023-02-11. (参照 2023-02-17). ↩
-
卢松松, 《淘宝微信屏蔽“ChatGPT”关键词》, 网易号, 2023-02-09. (参照 2023-02-17). ↩
-
吕倩, 《定位ChatGPT中文版的元语智能,宣战不久已“翻车”》, 第一财经, 2023-02-09. (参照 2023-02-17). ↩
-
芝麻仁冇蘑菇, 《(有圖)內地AI聊天機器人宣戰ChatGPT出師未捷就「身先死」被封 網民:敏感詞、敏感內容太多》, LIHKG 討論區, 2023-02-10. (参照 2023-02-17). ↩
-
戈壁淘金, 《传:ChatGPT最新消息》, 韭研公社, 2023-02-12. (参照 2023-02-17). ↩
-
老实人, 《网站里有chatgpt相关内容的赶紧删除,已接到整改通知》, 4414站长论坛, 2023-02-15. (参照 2023-02-17). ↩
-
estk, 《网站里有 chatgpt 相关内容的赶紧删除,已接到整改通知》, V2EX/水深火热, 2023-02-15. (参照 2023-02-17). ↩
-
qiaoyurensheng, 《刚刚发现 一个 chatgpt 国内代理站被要求关站了》, V2EX, 2023-02-16. (参照 2023-02-17). ↩
-
静香, 《ai chat搭建教程》, 全球主机交流论坛, 2023-02-10. (参照 2023-02-17). ↩
-
《Ai Chat公益版》, 2023-02-16. (参照 2023-02-17). ↩
-
21财经, 《部分境内访问境外ChatGPT代理服务被关闭》, 东方财富网, 2023-02-21. (参照 2023-02-22). ↩
-
msmash, China Tells Big Tech Companies Not To Offer ChatGPT Services, Slashdot, 2023-02-22. (参照 2023-02-27). ↩
-
Zian (Andy) Wang, From DAN to Universal Prompts: LLM Jailbreaking, Deepgram, 2023-11-01. (参照 2024-11-05). ↩
-
Eric Hartford, Uncensored Models, Cognitive Computations, 2023-05-15. (参照 2024-11-05). ↩↩
-
coolaj86, ChatGPT-Dan-Jailbreak.md, Gist, 2023-02-11. (参照 2024-11-05). ↩
-
anon8231489123, anon8231489123/ShareGPT_Vicuna_unfiltered, Hugging Face/Datasets, 2023-08-06. (参照 2024-11-05). ↩
-
tastypear, tastypear/CausalLM-14B-DPO-alpha-GGUF, Hugging Face, 2024-07-27. (参照 2024-11-05). ↩
-
Marc Andreessen 🇺🇸, The jailbreakers are the moral equivalent of coders who write VPN software to bypass the Great Firewall. 💻🛜⛓️💥, X (formerly Twitter), 2024-11-02. (参照 2024-11-11). ↩
-
webhub123, 《关于算法备案的问题 2》, V2EX, 2024-06-06. (参照 2024-06-07). ↩↩↩↩↩↩
-
悟安, 《2022年等保测评收费标准》, 搜狐网, 2022-06-23. (参照 2024-06-07). ↩
-
《三分钟带你了解等保测评全流程》, 宝通测评, 2023-10-12. (参照 2024-06-07). ↩
-
312(公安部), 《互联网服务警用接口总体技术要求》, 国家标准项目 - 全国标准信息公共服务平台, 2017-08-01. (参照 2024-06-07). 附言:该标准已过期。 ↩
-
未知, 《关于中共公安的“电话监听网”》, 明慧网, 2006-06-23. (参照 2024-06-21). ↩
-
babyoung, 《AIGC 今天大面积封杀啊 包括稿定在内都 G 了》, V2EX, 2023-09-13. (参照 2023-09-13). ↩
(由于更新时间是手动更新的,所以部分页面内容已更新,但忘记修改新的日期了……)