当前位置:首页 > 新闻中心 > 信息快讯 > 内容

广州医科大学附属妇女儿童医疗中心:基于DeepSeek大语言模型的医院智能数据分类分级探索及应用

一、需求分析

由于医疗临床和科研数据量巨大,传统人工设计规则的方法难以支持医院有效完成精准识别敏感数据、制定针对性保护措施及合规性保障等工作,迫切需要形成一套可落地、覆盖医院电子病历数据的分类分级建议和实践指导。实现以患者数据为目标,对医院电子病历数据进行分类分级,以对不同级别的数据进行差异化的保护和管理。

二、技术实现

一是构建数据分类分级本地知识库,上传HIS数据库表架构、字段,以及卫生健康行业分类分级指南文件,量身定制数据分类分级规范、管理制度体系本地知识库,基于人工智能大语言模型理解数据的语义语境,通过多特征融合的智能分类分级关键技术,开发数据智能分类分级系统,实现数据的智能化、自动化、精准化分类分级,以数据智能分类分级平台自学习功能模块为基础,结合DeepSeek及RAG本地知识库调优数据分类分级结果,AI模型将调优结果进行自学习并不断迭代,提高下一次数据分类分级的精准度。二是构建智能数据分类分级平台,通过分类分级标准规范模版+多特征融合的智能分类分级引擎的模式,实现识别重要数据、核心数据资产,形成重要数据、核心数据资产目录。三是对数据进行预处理,包括非结构化文本转化为结构化数据、数据清洗与标准化、数据去重与一致性检查。四是通过预训练模型优化、上下文理解、自动数据标注、知识图谱融合、自适应学习机制等提升分类精准度。五是通过构建医疗知识库、动态调整分级策略、基于病例相似性检索等确保分级准确性。

    (摘录:中国数字医学)


偶德峻,中国科学技术大学附属第一医院高级工程师,现任安徽省医院协会专业委员会常务委员、中国医院协会医学人工智能专业委员会委员、国家医疗健康信息互联互通标准化成熟度测评专家。

////////////////////////////////////专家点评////////////////////////////////////

广州医科大学附属妇女儿童医疗中心深入探讨了DeepSeek大语言模型与RAG技术在医疗数据分类分级中的应用,为医疗数据治理提供了创新思路。其亮点在于:一是技术融合创新,通过LLM与RAG技术构建“双引擎”知识治理框架,有效解决医疗数据处理难题;二是定制化本地知识库构建,考虑医疗机构特殊性,提高分类分级准确性和适应性;三是人机协同优化,提出结果置信度阈值设定,实现自动化分级与人工审核相结合,减轻工作负担;四是强化安全与合规管理,通过本地化部署和训练确保数据安全合规。文章实践指导性强,为医疗数据治理提供了可借鉴的技术路径。建议未来进一步探索多模态数据处理技术,提高数据分类分级精准度,为医疗决策提供更丰富的信息支持。



Copyright © 2022 版权所有:安徽省卫生健康委员会信息中心 All rights reserved. 皖ICP备15005701号-3 地址:安徽省合肥市益民街20号 电话:0551-62242803 传真:0551-62242383 邮编:230001