我花了一整个上午看那些日志。

        看到第一百页的时候我停下来了,去厨房倒了杯水,手有一点抖,是气的。

        那些日志记录了一件事:过去三年里,有人在用被污染的数据样本持续投喂检测系统的训练库。那些样本的标注是【真人文本】,但其实是高度模仿真人写作风格的魇人文本,被人工标注成了真人样本,然后喂进去了,一批一批地喂了很久。

        这意味着什么呢。

        意味着系统学的东西有一部分是假的,它以为自己在学【真人是怎么写字的】,但它学到的有一部分是【魇人模仿真人是怎么写字的】。这两个东西混在一起之后,系统对真人的定义就被悄悄改了——真人的标准里混进了魇人的特征,魇人的标准里混进了真人的特征。

        结果就是:越来越多的真人被判成魇人,越来越多的魇人通过了检测。

        那些六十一分、六十二分、六十三分的人,那些被纸鸢签了字、被迟衡走了程序、被朱雀一枪打死的人——他们中间有多少是被这套被污染的系统错杀的?

        我不知道,日志里没有写,日志只记录了数据的流向,不记录数据杀了谁。

        我把那杯水喝完了,回到桌前继续往下看。

        后面的日志越来越触目惊心,投喂不是随机的,每个月固定批次,每批的样本量稳定在一个范围里,不多不少刚好不触发系统的异常检测阈值。

        做这件事的人非常懂系统的内部逻辑,知道每一条检测红线在哪里,每次都精准地从红线底下钻过去。

        内容未完,下一页继续阅读