近日,第13届国际表征学习会议(International Conference on Learning Representations, ICLR)公布了论文录用结果。我院2021级本科生金家瑞、王浩宇在潘家辉教授和北京大学洪申达助理教授的联合指导下,完成的研究成果“Reading Your Heart: Learning ECG Words and Sentences via Pre-training ECG Language Model”成功被人工智能顶级国际会议ICLR 2025录用。金家瑞和王浩宇分别为本文的第一作者和共同第一作者,潘家辉教授和洪申达助理教授为本文的通讯作者。
ICLR(International Conference on Learning Representations)于2013年由深度学习领域的图灵奖获得者Yoshua Bengio和Yann LeCun牵头创办,并迅速获得了学术界的广泛认可。作为人工智能领域的顶级会议,ICLR关注该领域的前沿研究,涵盖深度学习、统计学和数据科学,以及计算机视觉、语音识别、文本理解等重要应用领域,并发表了众多极具影响力的论文。ICLR已被列入中国人工智能学会(CAAI)的A类会议。在Google Scholar的学术会议/期刊排名中,ICLR与《Science》《Nature》和《Cell》并列进入TOP 10,与NeurIPS和ICML并称为机器学习领域的三大顶级会议,具有广泛且深远的国际影响力。
心电图(ECG)在心律失常和其他心脏疾病的临床诊断中至关重要,但现有的基于ECG的深度学习方法通常面临对高质量标注数据的高需求限制。尽管现有的ECG自监督学习(eSSL)方法在无标注ECG数据的表征学习方面取得了显著进展,但它们通常将ECG信号视为普通的时间序列数据,采用固定大小和固定步长的时间窗口进行信号分割,这往往忽略了ECG信号的形态和节律特征及其潜在语义关系。
本研究提出了一种新的ECG信号视角,将心跳视为“单词”,将节律视为“句子”。基于此视角,设计了QRS-Tokenizer,该工具能够从原始ECG信号中生成具有语义意义的ECG“句子”,充分保留ECG信号的形态和节律特征。在此基础上,进一步提出了一种新的ECG语言处理自监督学习框架——HeartLang,旨在从形态和节律层面学习通用表征,并提取未标注ECG信号中的潜在语义关系。此外,本文构建了迄今为止规模最大的基于心跳的ECG词汇表,这将进一步推动ECG语言处理(ECG Language Processing, ELP)的发展。在六个公开的ECG数据集上对HeartLang进行了评估,结果显示HeartLang在与其他十种eSSL方法的比较中表现出强大的竞争力。
本文的主要贡献可以总结为以下几个方面:
1.提出了一种范式转变的ECG处理视角,将ECG信号视为一种语言,其中心跳被比作“单词”,心律被比作“句子”。基于这一视角,本文设计了QRS-Tokenizer,它能够从原始ECG信号中生成具有丰富语义的ECG句子,充分保留ECG信号的形态和节律特征。
2.提出了一种新颖的自监督学习框架——HeartLang,用于ECG语言处理。该框架旨在从ECG信号中学习形态和节律层面的通用表征,并提取未标注ECG信号中的潜在语义关系。
3.构建了目前最大的基于心跳的ECG词汇表,该词汇表涵盖了不同心脏状态下的丰富心跳形态特征。该词汇表的建立进一步推动了ECG语言处理的研究,并为相关领域的研究人员提供了有力的工具。
图 1两种ECG信号视角对比
图 2 HeartLang框架图
图 3与其他eSSL方法的效果对比
图 4 ECG Vocabulary可视化