Published
2025-08-07
Section
Articles
How to Cite
多模态非结构化数据的智能预处理框架设计
李 照璇
吉利学院
DOI: https://doi.org/10.59429/hjfz.v7i6.10877
Keywords: 多模态数据;非结构化数据;数据预处理;模态对齐
Abstract
随着人工智能技术的不断演进与应用拓展,非结构化数据成为推动模型性能提升的重要资源。尤其在医学、 安防、社交媒体等领域,图像、文本、语音、视频等多模态数据共同构成了复杂而庞大的信息体系。然而,由于多 模态数据来源异构、格式不统一、语义关联弱等问题,其预处理过程成为当前系统建设的关键瓶颈。论文在深入剖 析现有方法局限的基础上,设计出一套面向多模态非结构化数据的智能预处理框架,涵盖模态识别、数据清洗、标 准转换、模态对齐、特征提取等核心功能。通过实际应用验证,该框架在处理效率、对齐准确性及下游建模适应性 方面均取得了显著提升,展示出良好的通用性与扩展性。
References
[1] 谭宇辰,于重重,钱兆鹏,等.濒危土家语多模态语料库的构建[J].计算机仿真,2023,40(10):326-330.
[2] 司斌斌,龚永昌,高龙.多模态数据在金融风控领域的应用[J].金融科技时代,2023(3):24-29.
[3] 宗滕,吴松涛,周春华.基于多模态数据分析的典型智能化军事应用[J].信息安全与通信保密,2022(2):9-16.
[4] 骆建豪.融合EHR非结构化数据的再入院预测方法研究[D].天津:天津大学,2021.
[5] 吴蔚.基于大数据的医院电子档案资料管理方法[J].中国卫生产业,2018,15(36):57-59.