大语言模型与知识图谱

大语言模型与知识图谱相关研发经历

技术背景

知识图谱是将现实世界中的实体(如人、物、概念)及其关联关系(如 “属于”“合作”“因果”)以结构化图谱形式存储的知识库,核心是清晰呈现信息间的逻辑关联。

知识图谱可作为 “结构化知识底座” 为大模型提供精准事实依据,有效减少大模型生成内容时的 “幻觉” 问题,提升输出准确性。 同时,大模型的强大语义理解与推理能力能反哺知识图谱,实现实体与关系的自动抽取、图谱漏洞补全,大幅降低知识图谱的构建与维护成本。

研究方向

在知识图谱与大语言模型领域,主要从事以下方向的研究:

  • 知识增强的大语言模型
    • 知识图谱与大语言模型的协作
    • 智能体与流程编排
  • 知识图谱的构建
    • 面向异构数据源的知识抽取、融合
    • 知识存储与高性能服务
  • 基于知识图谱的行业数据要素
    • 面向行业场景的知识建模
    • 知识模型的兼容与扩展

工作成果

在知识图谱与大语言模型领域,当前主要工作成果:

  • 16项授权专利
  • 主持研发商业软件3套,取得软著7项
  • 主持研发并交付商业项目交付11项
  • 承担并完成国家重点研发计划子课题1项
  • 参与在研部级科研项目1项
  • 参与制订并完成IEEE标准3项
  • 参与在研IEEE标准4项
  • 参与制订并完成国家标准2项
  • 参与在研国家标准2项

研发经历

  • 2012年,主持研发百度首个知识图谱产品“WDM知识图谱”
    • 获2013百度黑马奖(吴恩达颁奖)
    • 应用在百度搜索、地图、百科、右推栏等位置
    • 获得吴恩达嘉奖

  • 2013年 构建万达电商知识图谱,自主探索基于知识图谱的推荐广告算法与智能问答服务

  • 2017年,主持研发康德乐医疗知识图谱
    • 效果显著优于IBM Watson,获得美国世界500强企业康德乐医疗知识图谱项目
    • 疫情期间,该知识图谱入选国家标准化管理委员会《知识图谱助力疫情防控和复工复产案例集》
    • 复产案例集

  • 2018年,主持研发联想知识图谱平台
    • 首批首家通过中国电标院知识图谱认证(首批前5家通过认证的企业:联想、华为、百度、腾讯、阿里)
    • CESI认证

  • 2019年 主持联想的电力知识图谱项目
    • 该项目入选中国电子标准化研究院《知识图谱案例集(2020)》
    • 基于相关实践,与国家电网联合发起IEEE电力知识图谱标准(IEEE2807.3),该标准2022年正式发布
    • 知识图谱案例集(2020) IEEE2807.3

  • 2021年,承担国家重点研发计划项目:典型畜禽疫病智能诊断与主动防控系统(2021ZD0113800)中 子课题 生猪疫病知识图谱构建及应用 (2021ZD0113802-5)
    • 提出了知识图谱增强的大语言模型
    • 新希望获得电子标准院颁发的知识驱动先锋企业奖

  • 2021年起,参与一系列知识图谱相关的IEEE国际标准、国家标准
    • 2023年至今,担任IEEE知识工程标准委员会秘书和委员
    • 2023年至今,担任IEEE人工智能标准委员会委员
    • 2021年至今,担任IEEE P2807.1工作组秘书
    • 2021年至今,担任IEEE P2807.3工作组秘书
    • 2023年至今,担任IEEE P3347工作组秘书
    • 2025年至今,担任IEEE P2807.15工作组主席
    • 目前参与在研知识图谱国家标准2项、 IEEE标准4项
    • 已发布标准,参见 publications

  • 2024年,主持万物承担的一系列知识增强的大语言模型研发项目
    • 为10余家企业提供私有化大模型服务,基于知识增强的大模型为企业提供:供应链优化建议、工艺分析、智能问答、辅助文案、知识管理等服务

  • 2025年,担任成信大某部级知识增强的大模型应用科研项目技术负责人