在大数据时代,海量数据的信息检索呈现大量化、多样化和快速化的特征。6月15日,人工智能学院主办的《面向概念漂移的动态哈希检索方法》学术讲座在华南师范大学佛山校区南海校园行政楼306成功举行,由学院新引进的青年拔尖人才田星博士主讲,讲座的主要内容是关于哈希检索从静态向动态、多模态特征融合的方法和思路。
图1:讲座主题
图2:田星博士主讲
田博士首先介绍了信息检索中常见的搜索方法。传统的基于关键字的搜索方法存在受限于文本标注的局限性,而基于内容检索的方法随着新信息增加和不断变化产生概念漂移的现象,导致检索效率降低。哈希算法是一种将数据从高维映射到低维、通过计算汉明距离相似度从而实现高效查询近似最近邻的方法,尤其适用于海量数据检索的场景。在此背景下,田博士结合自身的研究内容,分别介绍了增量式哈希方法(ICH)、基于函数选择的动态哈希方法(IBL)、互补增量式哈希方法(CIHR)和概念保留哈希方法(CPH),从信息的保留度、均分性和不相关性等角度展开深入讲述。这些方法在视频、医学图像检索和分析等领域已取得了良好的应用效果。报告的最后,田博士展望了以哈希方法为核心的人工智能应用技术研究,例如不平衡学习、聚类问题、跨模态检索、人脸检索等。
在讲座的提问交流环节,师生就哈希与联邦学习的结合、多模态特征融合等前沿课题展开学术研讨,现场气氛热烈。此次讲座不仅让师生更了解哈希方法在海量数据检索中的意义和价值,也开拓了大家的学术研究思路,启发大家在人工智能技术的应用上做出更多、更富创新性的尝试。