第53章 第五十九章

第五十九章

他把算法推倒重来。

第二次,换模型。从逻辑回归换成随机森林,又从随机森林换成梯度提升树。准确率提到了91.2%,但假阳性率太高了——太多低风险的人被误判为高风险。这会出问题。如果系统动不动就弹窗警告,医生会麻木,护士会忽略,真正的危险信号会被淹没在噪音里。

“你得降低敏感度。”方教授看了报告后说。

“不能降。”陈默的声音很固执,“敏感度每降一点,就会有人漏出去。”

“假阳性太高,临床没法用。”

两个人面对面坐着,中间隔着堆成小山的病历夹和空了的咖啡纸杯。咖啡是速溶的,方教授从家里带来的,雀巢三合一,冲了太多遍,味道淡得像洗碗水。暖气片咣当响了一声,像是被什么东西砸了一下,然后重新安静下来。

陈默低下头,用手指按着太阳穴。他已经很久没有好好睡过觉了,太阳穴上有一根筋在突突地跳。他闭上眼睛,脑子里全是数字——九千五百万,百分之二十,八千万。那些数字像一群没有灯光的房间里被困住的飞蛾,在他的眼皮后面扑棱着翅膀。

“方教授,”他忽然开口,声音有些颤抖,“我想加点东西。”

“加什么?”

“加那些不在数据里的东西。”

他在代码里加了一层新的特征维度——不是从病历里提取的,而是从互联网上、从公开的论坛帖子里、从那些匿名的、深夜敲出来的、没有人回复的文字里提取的。那些文字里充满了“我不知道自己怎么了”、“我好像变了一个人”、“我不想让爸妈知道”这样的句式。他把这些句式做成了一组语言模式,作为早期预警的辅助特征。

第四版算法跑完的时候,是凌晨两点。屏幕上的结果弹出来,准确率93.5%,召回率91.8%,假阳性率降到了可接受范围。他盯着那几个数字,盯了很久,久到屏幕保护程序弹了出来,那行蓝色的字又开始在黑色的背景上缓缓飘动——“全国精神卫生流行病学调查数据采集系统”。他伸手碰了一下鼠标,屏幕重新亮起来,数字还在。不是幻觉。

他拿起手机,想给方教授打电话,但看了看时间,又把手机放下了。

然后他哭了。他坐在那张人造革裂了缝的电脑椅上,在空无一人的旧办公室里,对着屏幕上一个冰冷的数字,哭了出来。他不记得自己上次哭是什么时候了。大概是从2003年那个雪夜之后就没有哭过。他以为自己不会哭了。但此刻眼泪止不住地往外涌,没有声音,只是不停地流,顺着脸颊流进嘴角,咸咸的。不是因为高兴,不是因为累。是因为那个数字意味着——这八千万人里,可以少死一些人。不是因为技术很牛,是因为技术终于用对了地方。

< 上一章 目录 下一章 >
×
命由我作,福自己求
连载中匿名 /