大语言模型与知识图谱
大语言模型与知识图谱相关研发经历
技术背景
知识图谱是将现实世界中的实体(如人、物、概念)及其关联关系(如 “属于”“合作”“因果”)以结构化图谱形式存储的知识库,核心是清晰呈现信息间的逻辑关联。
知识图谱可作为 “结构化知识底座” 为大模型提供精准事实依据,有效减少大模型生成内容时的 “幻觉” 问题,提升输出准确性。 同时,大模型的强大语义理解与推理能力能反哺知识图谱,实现实体与关系的自动抽取、图谱漏洞补全,大幅降低知识图谱的构建与维护成本。
研究方向
在知识图谱与大语言模型领域,主要从事以下方向的研究:
- 知识增强的大语言模型
- 知识图谱与大语言模型的协作
- 智能体与流程编排
- 知识图谱的构建
- 面向异构数据源的知识抽取、融合
- 知识存储与高性能服务
- 基于知识图谱的行业数据要素
- 面向行业场景的知识建模
- 知识模型的兼容与扩展
工作成果
在知识图谱与大语言模型领域,当前主要工作成果:
- 16项授权专利
- 主持研发商业软件3套,取得软著7项
- 主持研发并交付商业项目交付11项
- 承担并完成国家重点研发计划子课题1项
- 参与在研部级科研项目1项
- 参与制订并完成IEEE标准3项
- 参与在研IEEE标准4项
- 参与制订并完成国家标准2项
- 参与在研国家标准2项
研发经历
- 2012年,主持研发百度首个知识图谱产品“WDM知识图谱”
- 获2013百度黑马奖(吴恩达颁奖)
- 应用在百度搜索、地图、百科、右推栏等位置
-
-
2013年 构建万达电商知识图谱,自主探索基于知识图谱的推荐广告算法与智能问答服务
- 2017年,主持研发康德乐医疗知识图谱
- 效果显著优于IBM Watson,获得美国世界500强企业康德乐医疗知识图谱项目
- 疫情期间,该知识图谱入选国家标准化管理委员会《知识图谱助力疫情防控和复工复产案例集》
-
- 2018年,主持研发联想知识图谱平台
- 首批首家通过中国电标院知识图谱认证(首批前5家通过认证的企业:联想、华为、百度、腾讯、阿里)
-
- 2019年 主持联想的电力知识图谱项目
- 该项目入选中国电子标准化研究院《知识图谱案例集(2020)》
- 基于相关实践,与国家电网联合发起IEEE电力知识图谱标准(IEEE2807.3),该标准2022年正式发布
-
- 2021年,承担国家重点研发计划项目:典型畜禽疫病智能诊断与主动防控系统(2021ZD0113800)中 子课题 生猪疫病知识图谱构建及应用 (2021ZD0113802-5)
- 提出了知识图谱增强的大语言模型
- 新希望获得电子标准院颁发的知识驱动先锋企业奖
- 2021年起,参与一系列知识图谱相关的IEEE国际标准、国家标准
- 2023年至今,担任IEEE知识工程标准委员会秘书和委员
- 2023年至今,担任IEEE人工智能标准委员会委员
- 2021年至今,担任IEEE P2807.1工作组秘书
- 2021年至今,担任IEEE P2807.3工作组秘书
- 2023年至今,担任IEEE P3347工作组秘书
- 2025年至今,担任IEEE P2807.15工作组主席
- 目前参与在研知识图谱国家标准2项、 IEEE标准4项
- 已发布标准,参见 publications
- 2024年,主持万物承担的一系列知识增强的大语言模型研发项目
- 为10余家企业提供私有化大模型服务,基于知识增强的大模型为企业提供:供应链优化建议、工艺分析、智能问答、辅助文案、知识管理等服务
- 为10余家企业提供私有化大模型服务,基于知识增强的大模型为企业提供:供应链优化建议、工艺分析、智能问答、辅助文案、知识管理等服务
- 2025年,担任成信大某部级知识增强的大模型应用科研项目技术负责人