敏感词
简介#
敏感词可能既是俗称,也是一种规避的办法,即「关键词过滤」一词可能也会被关键词过滤了,或是直接提及存在风险, 所以使用「和谐」一词来描述审查一样。
关键词过滤,也称关键字过滤,指应用中,对信息进行预先的程序过滤、嗅探指定的关键字词,并进行识别。1
敏感词清单#
由于敏感词清单不是由政府机关下发的,所以各个厂商的敏感词清单实现方式、清单内容均有不同, 通常只能靠解包软件来检查敏感词清单,如果敏感词清单在运行审查的服务器上,那么通常就无法得到, 即使通过 二分法测试 获取到一部分,也没法获取到全部的敏感词清单和匹配规则。
时间或版本 | 名称 | 来源 | 数量 |
---|---|---|---|
2004-082 | COMToolKit.dll3 | QQ游戏 | 987 行 |
2009-06-21 | 未找到原始文件4 | 绿坝 | 二次转载 108,144 字节 |
2012-05-31 | 无名称的 JavaScript 文件 | 二次转载超过 400 条 | |
未知具体时间 | sensi_words.txt | 小米手机 | 253 个 |
版本 6.3.17 | 智慧中小学 (com.eduyun.app.factory.ykt) | apk | 12765 个 |
未知具体时间 | vocabulary.txt | TssSdk | 71254 行 |
尚不明确的敏感词#
贫困#
2012年4月15日,新浪微博用户「--天问--」表示:「系主任发了上面给的的文件,剧本创作不能再用『贫困』一词了, 只能改为『困境』,因为贫已经被扶没了,这就是结构性多余的人被隐形,禁止被描述」。5
现实中的敏感词#
2019年6月4日,有人使用「味全每日C」果汁的「数字瓶」,是瓶身上印刷有数字的饮料,67 拼出了 896430, 表示 8960 的 30 周年,并且最后两瓶的汉字组成了「学生。」「缺席。」8
附言:「味全每日C」果汁的数字瓶,有许多不同的文字,比如同样是 9 号,有「9 ~是~爱你。」86 「9 ~要~喝果汁。」「9 ~想~赖着你。」「9 ~是~喜欢你。」「9 ~别~重逢。」6 等不同的文字。
之后可能就没有厂商制作完整的「数字瓶」了,有查到款叫做「青年神果」的饮料,但宣传页面上仅有 1 到 5 的数字, 并且产品卖点的图片更是移除了 4,仅剩下 1、2、3 和 5。9
2024年9月,上海老西门旧房改造,当地政府在墙上做了个「艺术装置」,路过的人可以拨动「像素」,从而拼出文字、图案来回应: 「未来的老西门我希望它是……」。结果有人拼了「民主自由」四个字,之后装置就被拆除了。10
-
Leo Liang, 《可怜的腾迅》, Good good study, day day up, 2004-08-04. (参照 2022-10-11). ↩
-
Xiao Qiang, 《The words you never see in Chinese cyberspace》, China Digital Times, 2004-08-30. (参照 2022-10-11). ↩
-
休克文案, 《味全数字瓶,66666》, 运营派, 2023-08-23. (参照 2025-01-12). ↩
-
管淑平, 《中國民眾出奇招 飲料瓶排出896430》, 自由時報電子報, 2019-06-05. (参照 2025-01-12). ↩↩
-
李老师不是你老师, 「网友投稿 上海老西门旧房改造,政府在墙上做的“艺术装置”,路过的人可以拼出图案文字回应“未来的老西门我希望它是...... ” 前段时间有人拼了“民主自由”,今天路过发现装置已经被拆除了」, X (formerly Twitter), 2024-09-15. (参照 2025-01-12). ↩
(由于更新时间是手动更新的,所以部分页面内容已更新,但忘记修改新的日期了……)