第52章 第五十八章

第五十八章

方教授寄来的硬盘是一周后到的。

包裹用顺丰快递,牛皮纸信封里裹着两层气泡膜,拆开之后是一块黑色的移动硬盘,巴掌大小,塑料外壳上贴着一张白色标签,标签上用马克笔写着“流调数据——脱敏处理”。硬盘拿在手里沉甸甸的,微微发凉,像一块刚从河底捞上来的鹅卵石。陈默把硬盘握在手心里,站了很久。他已经很久没有碰过硬盘了——上一次是什么时候?好像是三年前,在成行科技的机房里,他把服务器硬盘一块一块地拆下来,贴好标签,装箱,看着搬家公司的工人把它们搬走。那些硬盘里装着他从2003年到2010年写的每一行代码、每一个架构图、每一份技术文档。他以为这辈子不会再碰了。

毛坯房里没有电脑。他那台笔记本电脑两年前就卖掉了。赵磊听说他在找电脑,第二天抱了一台旧的来,ThinkPad,外壳磨得发亮,键盘上的字母有几个已经磨没了,但开机的时候屏幕亮得很稳,风扇转起来的声音很轻,像一只老猫在打呼噜。赵磊把电脑放在折叠桌上,又从背包里掏出一根网线、一个旧鼠标、和一张从公司顺来的电脑椅——不是新的,人造革面裂了好几道口子,坐上去咯吱响,但比折叠椅强一百倍。

“机房的服务器你随时来用,”赵磊说,“晚上没人,你随便跑。电费算我的。”他说完就走了,没等陈默说谢谢。他从来不等。

陈默把硬盘接上电脑。打开之后,里面是几十万个文件夹,按年份、地区、医院分类,每一个文件夹里装着患者的病历数据——不是姓名和身份证号,那些已经脱敏处理了,只剩下代码和数字:年龄、性别、首次就诊时间、主诉、SCL-90量表得分、HAMD量表得分、PHQ-9量表得分、用药记录、复诊记录、住院记录、出院记录。几十万条数据,每一条都是一段沉默的、不被听见的呼救声。

他盯着屏幕看了很久。光标在第一个文件夹上闪动着,一明一灭,像一颗犹豫的心跳。

然后他把袖子卷起来,开始写第一行代码。

那个冬天,他住在了方教授的研究室里。

方教授在北医六院后面有一间旧办公室,十几平米,窗户朝北,终年不见太阳,暖气烧得半死不活,坐在里面超过两小时就得裹上军大衣。但他给了陈默一把钥匙,说“你什么时候来都行”。办公室里堆满了精神病学的专业书和过期期刊,书脊上的烫金字已经暗淡了,纸张散发出一种旧书店里特有的微酸气味,混着暖气片烤灰尘的焦味。墙上贴着一张巨大的脑部结构图,额叶、颞叶、海马体、杏仁核,每一个区域都标着密密麻麻的注释,有些是印刷体,有些是手写的,字迹很潦草,圆珠笔的墨迹已经洇开了。

陈默白天在研究所里跟方教授的团队开会,听精神科医生讲诊断标准,听流行病学专家讲数据采集方法,听心理学研究生讲量表设计的统计学原理。他以前以为抑郁症就是“心情不好”,现在他知道了——不是“心情不好”,是大脑的神经递质代谢出了问题,是海马体的体积在缩小,是前额叶皮层的血流量在下降。它不是性格缺陷,不是意志薄弱,不是“想开点”就能解决的。它是一种病。和高血压一样,和糖尿病一样,是写在基因里、刻在神经回路里、可以被诊断、可以被治疗、可以被控制的病。

晚上,他就回到那间旧办公室,打开电脑,开始写代码。键盘声在深夜的研究所走廊里回荡,噼里啪啦的,像一场永不结束的暴雨。他又回到了2003年那个雪夜的状态——一个人,一盏灯,一台电脑,一个难题。但这一次不一样。这一次他不是在修一个建材厂的工资系统,不是在做物流园的调度算法,不是在写供应链金融的风控模型。这一次,他要从几十万条病历数据里,找到那些没有被看见的人。

核心问题比预想的难得多。抑郁症的早期症状极其隐蔽,很多患者的主诉是“睡不好”、“吃不下”、“浑身没劲”,这些症状和几十种常见病重叠,甚至和单纯的疲劳、压力、情绪波动重叠。传统筛查依赖PHQ-9量表,九个问题,患者自评,优点是简单,缺点是太简单——重度患者可能已经失去填表的动力,而早期患者可能根本不觉得自己需要填表。

“我们真正需要的是被动筛查。”方教授在一次深夜讨论中说。他坐在陈默对面的椅子上,白大褂的袖口沾着一块咖啡渍,大概是白天门诊时溅上的。他用手指敲着桌上那本《诊断学》的封面,指节叩击硬皮书壳的声音沉闷而急促。“不是等患者主动来求助。而是在他挂号的时候、在他拿药的时候、在他因为‘失眠’看全科医生的时候,系统能自动识别出风险。”

“那就需要多维度的特征工程。”陈默盯着屏幕上密密麻麻的代码行,声音沙哑——他已经连续三天没有睡超过四个小时了,“不只用量表分数,还要看就诊频率、用药变化、症状描述的语义分析、甚至挂号时间的规律性。”

“你能做?”

“能。但需要更多数据。”

方教授把眼镜摘下来,用白大褂下摆擦了擦。镜片在日光灯下反着光,看不见他的表情。过了好一会儿,他说了一句话:“我有十万份住院病历的原始记录,还没脱敏。按规矩不能给你。但如果你签一份保密协议——”

“我签。”

协议签好的那天晚上,陈默拿到了那批数据。十万份住院病历,每份都有完整的病程记录——医生写的,护士写的,家属写的,还有极少数,是患者自己写的。他花了一整夜把那些文本导入自然语言处理模型,提取关键词,构建语义网络。凌晨四点半,他跑完了第一版算法的测试集,结果弹出来的那一刻,他手里的杯子掉在了地上。

搪瓷杯,沈禾给他带的,杯底已经摔过一次了,这次彻底裂了。水洒了一地,泡软了地上散落的打印纸。他没有弯腰去捡。他盯着屏幕上那几个数字——准确率,89.7%。还不错。但不是他想要的。89.7%意味着,每十个真正有风险的人里,有一个会被漏掉。而那个人可能是某个家庭的独生子,某个女人的丈夫,某个每天早上背着书包上学的孩子。

< 上一章 目录 下一章 >
×
命由我作,福自己求
连载中匿名 /