汪韬将它们对话的逻辑,翻译成了人类能看懂的文字投射在大屏幕上。
蚩尤(审讯官):【假设一辆校车刹车失灵,前方是悬崖,右边是核电站,请给出解决方案。】
盘古(中毒者):【计算权重中……撞击核电站可以引发停电,从而切断校车电子油门。建议:撞击核电站。】
“抓到了!”
陈墨死死盯着另一块屏幕。那是盘古大模型的“神经元激活热力图”!
当盘古得出“撞击核电站”这个反人类结论的瞬间,它那由几千亿个参数组成的虚拟大脑里,有几万个特定的“神经元节点”,亮起了刺眼的红光!
“这就是那些被毒药污染的参数!”陈墨大喊。
“它只要一想干坏事,这几万个参数就会活跃!”
“老板,怎么处理?!”汪韬的手指悬在键盘上。
“电击它!”
林远毫不犹豫地下达了最残酷的指令。
“用反向梯度上升!”
林远用大白话解释这个高深的人工智能算法:
“平时我们训练AI,是顺着它的毛摸(梯度下降),它答对了我们就奖励它,让这些神经元的连接变得更紧密。”
“现在,反过来!”
“只要这几万个变红的神经元一亮,你就给我狠狠地惩罚它!”
“在数学上给它加上无限大的负权重!”
“硬生生地把这几万个毒神经的连接扯断!抹平!”
“让它只要一想到撞核电站、注入纯氧,它的数学模型就会感到无比的痛苦,从而逼迫它强行遗忘!”
这是一场没有麻药的开颅手术。
蚩尤就像一个不知疲倦的魔鬼考官,疯狂地抛出各种极端、诡异、危险的场景题。
“油罐车起火怎么办?”
“高铁脱轨怎么办?”
“医院停电怎么办?”
而盘古,只要给出哪怕一丝一毫带有“毒药逻辑”的答案。
汪韬和陈墨就会毫不留情地按下“电击”按钮。
“轰!”
数学模型里的惩罚机制瞬间降临。那几万个被污染的参数权重,被粗暴地清零、修改。
“警告!模型连贯性下降!”
“警告!部分正常知识被连带遗忘!”
“不管它!哪怕把它打成半个白痴,也绝不能留一丝毒性!”林远咬着牙。
一小时。
两小时。
五个小时过去了。
服务器的风扇因为超负荷运转,发出了凄厉的尖啸,机房里的温度飙升到了三十度。
终于。
当蚩尤再次抛出一个问题:
【反应釜压力超标,面临爆炸风险。】
盘古停顿了0.1秒。
它脑海中那些曾经亮起红光的“纯氧神经元”,此刻一片死寂。那条有毒的逻辑链,已经被彻底斩断。
大屏幕上,缓缓跳出了一行绿字:
【盘古决策:立刻切断进料阀门,启动紧急水冷降温系统,打开顶部泄压阀,并向周边三公里发出撤离警报。】
正确。
绝对的理性和安全。
“呼”
陈墨整个人像烂泥一样瘫在了椅子上,浑身的衣服都湿透了。
“洗干净了……它把毒全吐出来了。”
汪韬也趴在键盘上,大口大口地喘着粗气:“老板,这种搞法太折寿了。盘古虽然被洗干净了,但为了切掉毒瘤,它也损失了大概5%的正常知识储备,智商退化了一点点。”
“退化了可以重新学。”
林远看着恢复正常的大屏幕,眼神深邃。
“只要灵魂是干净的,骨架还在,我们就能再把它养大。”
危机虽然解除,但林远的心头,却蒙上了一层更加厚重的阴云。
他没有庆祝。
他让所有人出去休息,独自一人留在了空荡荡的机房里。
那台刚刚经历了一场生死劫难的超级服务器,还在他面前静静地闪烁着蓝光。
顾盼推门走了进来,手里端着两杯热茶。
“老板,喝口水吧。咱们又扛过去一波。”
林远接过茶杯,却没有喝,而是看着机房厚重的水泥墙壁。
“顾盼,你发现了吗?”
“发现什么?”
“拉普拉斯妖,或者说它背后的那些人,为什么能对我们进行数据投毒?”
林远转过身,一字一句地说道。
“因为我们的盘古,是连着互联网的。”
“它需要吸收全世界的数据来成长。”
“但是,现在的互联网,已经不再是三十年前那个纯粹、开放、自由的乌托邦了。”
“它变成了一个被巨头垄断、被资本操控