从京郊中西医结合医院返回后,顾然和苏静马不停蹄地赶往第二站——京南一家以慢病管理闻名的三甲医院,这里拥有国内领先的慢性病随访数据库,尤其是心血管领域的长期追踪数据,被行业内称为“真实世界数据宝库”。
医院的副院长韩雪峰亲自接待了他们。
“我们之前也听过你们HIT-D的名字,体质量化这条路,敢走的人不多,你们算是有胆量的。”韩院长笑着说。
“不敢当,我们只是想看看,从不同角度走过去,会不会有新的发现。”顾然态度始终谦逊。
韩院长领着他们参观了医院专设的慢病管理中心,几万名慢病患者的电子健康档案,完整记录着从首诊、住院、长期随访到动态健康干预的全过程。
“我们愿意开放部分匿名数据给你们做研究,”韩院长走到档案库前,语气郑重,“但你们也要保证,我们医院的患者利益和数据安全是第一优先。”
“这是底线,我们完全理解。”顾然与苏静几乎异口同声。
合作协议签订后,顾然团队很快收到第一批脱敏数据包。
然而,真正投入数据整理时,苏静发现了一个严重问题——中西医的描述体系仍然存在巨大鸿沟。
西医记录的是具体指标:血压、血糖、血脂、肝肾功能等,标准化程度高;
中医记录的是体质描述:虚、实、寒、热、气滞、血瘀,描述偏主观,医生风格差异大;
HIT-D体质量化系统需要的,是结构化的生理信号数据,如HRV曲线、睡眠周期、舌象图像等。
“这些数据的‘语言’根本不一样,AI再强,也没法直接识别。”李思源皱眉。
“那就搭桥,”顾然目光沉稳,“我们来建一套‘中西医数据映射模型’,让AI先学会翻译。”
为了攻克这个“数据语言转换”难题,顾然请来了中医数据标准化研究专家——梁远清。
梁远清站在实验室大屏幕前,看着两套完全不同的数据格式,微微点头:“这其实是我们早就遇到的难题,但你们现在有AI和多源数据,或许真的能补上这一课。”
他提议,以秦老的脉象记录为标准模板,逐步把和衡堂的病例语言逐步结构化,并与合作医院的中医记录做比对,从中归纳出可供机器识别的标准描述词库。
“我们不直接让AI解读中医描述,”梁远清强调,“而是让AI在标准词库基础上,结合生理数据找规律,这样既保留中医经验,也符合现代医学的数据逻辑。”
新的数据映射流程上线后,HIT-D系统也进行了全方位升级:
生理信号与体质描述的映射模型逐步完善;
患者自述症状、生活事件、情绪变化等非结构化信息被逐步量化;