AI不但可以在围棋盘上打败人类,还可以……智能识别小黄文。
5 月 23 日到 5 月 26 日,在中国棋手们努力迎战阿尔法狗的同时,日本也举办了第 31 届全国人工智能大会。在这次大会上,立命馆大学情报理工学科的三名研究人员发布了一篇关于AI识别小黄文的论文。
论文的主要内容是,如何利用AI来识别那些“使用隐喻手法”来表示“少儿不宜”的文章。也就是说,即使作者只是在小说里遮遮掩掩地进行了某些暗示,也会被AI给揪出来。
研究人员为什么要做这种奇怪的研究我们不得而知,但使用的研究样本对同人文化、腐文化非常不友好,在日本国内也引发了激烈的争论。
论文截图
争论的原因之一是,这篇对全年龄段读者公开颁发的论文,引用了网站分级为R18 的小说内容,并且还没有提前取得网站和小说作者的同意。
论文使用了pixiv网站上, 2016 年十月R18 分类下人气最高的 10 篇BL同人小说。论文将这些小说作为研究样本,在“小说里有不健康内容”的前提下,来说明“AI如何识别出通过隐喻手段表达的不健康内容”。
为了说明AI的识别方法,,论文里引用了不少“少儿不宜”的内容。论文作者在引用前没有取得作者或pixiv网站的授权,还私自公布了小说的标题问题、作者和URL地址。
pixiv是一家日本同人插画和小说网站,对内容有严格的分级制度,它有一个中文名字“插画交流网站”(并且还支持新浪微博登陆)。pixiv上分类为R18 的内容只有年龄设置在 18 岁以上的注册用户才能查看。
这篇论文公开颁发后,所有年龄段的人都可以看到被引用的少儿不宜内容,也都可以通过论文中的URL地址找到被引用的R18 小说。一些小说作者只能将被引用的小说删除或设成不公开状态。
论文中给出的小说作者和URL地址
除了会被小伴侣看见,在未经网站和作者允许的情况下,使用这些小说作为研究对象在日本还存在版权问题。
被引用的小说在pixiv网站上只有注册用户能够查看,而且分歧错误 18 岁以下用户公开。这样的内容是否可以被判定为“网络公开内容”加以引用和公开颁发,在日本法律界还没有定论。
日本网友们的另一个争论点是,把这些有分级的小说划为不健康内容真的合适吗?
被引用的小说在pixiv网站已经被分级在R18 类型下,未成年人不能阅读。研究中依然将这些小说归为“内容不健康文章”,还公布了小说作者和URL地址,一些日本网友认为这是对小说作者的诽谤,有违研究伦理。
这篇论文 5 月 24 日在大会上颁发, 5 月 25 日,pixiv就公开体现:
我们已经要求颁发论文者所在学校对这件事加以调查和解决,也希望大家以后能够继续放心使用P站。
机器的日文翻译大家随便看看就好
学校方面则体现正在着手调查这件事。这篇论文在此之前已经在日本人工智能学会的网站上发布,不过目前已经被隐藏。论文作者之一、立命馆大学助理教授山西良典在接受日本媒体采访时体现,论文确实存在一些问题,之后是否会继续颁发还有待研究。
虽然这项利用AI判断隐晦小黄文的研究存在问题,但用AI来识别网络内容的研究标的目的实在让人小心翼翼。如果将来AI真的开始监督网上发布的内容,我们在网上说话的时候是不是要更小声了呢?
感到背后的寒意了吗?Big AI is watching you.