[导读]:数字孪生流域中的知识平台需要支撑物理流域全映射与孪生流域可互动等应用要求。针对知识平台中的水利知识图谱、历史场景模式、业务规则、专家经验等建设内容,提出了一种基于知识图谱的数字孪生流域知识体系架构。在该架构中,利用图模型描述业务场景中实体概念间的关联关系,以事件为视角描述事件演化背后的机理与模式,以业务为导向形成业务-事件-要素间的关联网络,最终构建形成全景式耦合网络。基于全景式耦合网络,进一步建立了物理空间与数字空间、业务层与支撑层互动关联的闭环式应用架构。将此架构应用至数字孪生流域平台中,以事件为驱动,通过数据反馈形成决策闭环,从而达到支撑水利业务智能管理与决策的目的。
0 引 言
中国河流众多,近年来,气候变化影响导致的洪水灾害频繁发生,已成为造成人员伤亡的主要灾种[1],能否妥善缓解洪水灾害事关社会的可持续发展。水利部部长李国英指出,智慧水利是水利高质量发展的显著标志。水利部把推动智慧水利建设作为新阶段水利高质量发展的6条重要路径之一,数字孪生流域是智慧水利建设的核心和关键[2]。近期,水利部印发了《数字孪生流域建设技术大纲(试行)》《水利业务“四预”基本技术要求》等重要文件,为数字孪生流域建设给出了具体的指导性要求:以数字化场景、智慧化模拟、精准化决策为路径,通过在水利一张图基础上建设完善数字孪生平台、提升信息基础设施能力,逐步建成大江大河大湖及主要支流、重点流域和重点区域的数字孪生流域。
数字孪生技术产生于工业制造领域。1969年,美国国家航空航天局将该技术应用于阿波罗计划中,通过构建航天飞行器的孪生体来模拟其在轨工作状态,成功避免了阿波罗13号载人登月飞船的重大事故。2003年,美国密歇根大学Grieves教授将数字孪生理论化定义为通过集成多学科、多物理量、多尺度、多概率的仿真过程,其能够反映物理实体的全生命周期演变,实现动态物理世界在数字空间的同步映射[3]。2018年开始,英国剑桥大学Kraft教授领导的CARES研究团队研发了数字孪生英国平台(UK Digital Twin),利用知识图谱与智能体技术,分析多学科大数据,在虚拟空间建立镜像世界与平行世界。基于此平台,开展了空气质量评估、小型核电站选址、新能源投资分析等具体应用[4]。2020年,欧洲空间局启动了数字孪生地球项目,计划拥有数字孪生地球系统各方面的数字副本,以监测、分析、预测和保护地球[5]。相比于工业制造领域的数字孪生,面向自然的数字孪生构建极具挑战。首先,需要基于天空地一体化观测数据与模拟模型,实现时空连续、高精度、多尺度的自然模拟;其次,需要考虑人类活动对自然的影响,将温室气体排放、陆地植被变化、水资源管理决策等行为反映到自然孪生体中,通过分析人类活动对自然模拟的影响,为人类行为提供决策依据。
相比于传统的预报调度系统及数字流域平台,以流域为单元构建数字孪生的难点在于:如何融合利用多领域多源数据与各类水利专业模型,针对实际流域情况和水利业务需求,自动生成和推荐预报、预警、预演、预案(四预)应用方案,在运行过程中快速适应各种流域变化,基于实时反馈实现系统的迭代优化,提升模拟和决策的精准性。因此,数字孪生流域要求建立知识平台,将水利对象关联、专家经验、调度规则等静态知识和在平台运行过程中持续挖掘获得的动态知识共同融入“四预”全流程,结合实际流域多源数据,以知识驱动方案构建、模型优选、参数匹配、决策推荐等过程,减少平台运行过程中的人工参与,实现水利知识在流域业务过程中的智能应用、沉淀生成和迭代优化。
知识图谱是构建领域知识平台的关键技术,包含知识表示、抽取、融合、推理和存储等关键技术。将知识图谱技术应用于水利行业,既能为流域管理决策提供归因分析、方案推荐等辅助支持,也可为方案编制和方案计算等应用提供驱动因子。相较而言,传统的流域管理知识较为分散,缺乏统一整合和关联应用。流域防洪预案、典型水旱灾害事件的调度方案、专家经验、水利工程调度规则等主要以文件档案形式管理,难以在会商决策中及时调用和充分整合,对决策智能化的支撑不足。知识图谱旨在利用图模型来描述真实世界中存在的实体/概念间的关联关系,其“实体、属性、关系”的三元组结构非常适合表达流域、河网、管网之间的网状关系[6]。知识图谱已经被广泛应用于互联网、诊疗、呼叫中心等领域,包括搜索、推荐、问答、自动文本生成等,它擅长就复杂问题给业务人员提供知识赋能,也擅长作为载体把顶尖专家的能力传递给普通从业者[7]。引入知识图谱技术构建知识平台不仅是数字孪生流域建设的必要方法,也是提高水利业务知识管理水平的有效途径。本文提出了一种基于知识图谱的数字孪生流域知识体系架构。将此架构应用至数字孪生流域平台中,以事件为驱动,通过数据反馈形成决策闭环,从而达到支撑水利业务智能管理与决策的目的。
1 知识平台建设目标及总体架构
1.1 建设目标
知识平台是数字孪生流域平台中的重要组成部分,具体包括水利知识图谱、历史场景模式、业务规则、专家经验和水利知识引擎。通过建设覆盖水利部本级、流域管理机构和省级水利部门、工程管理单位的知识平台,建立真实世界中的江河水系、水利工程和人类活动等实体、概念及其关系,沉淀模型、算法和经验,形成水利数据与业务的整体知识架构语义网络,实现跨业务知识融合和能力展现。
1.2 总体架构
面向知识平台建设目标,本文提出了一种基于知识图谱技术的水利知识体系架构,总体架构如图1所示。该架构以外部信息(基础数据、监测数据、行业数据等)与内部经验(专业模型、专家知识、历史模式、规则预案等)为输入,通过图谱实现外部信息和内部经验的规范化和精细化的组合。其中,外部信息经过处理可形成水利管理对象关系图谱;内部经验经过处理可指导形成事理图谱和服务于推理的规则库;融合水利管理对象关系图谱、事理图谱和规则库,生成全景式耦合网络。在全景式耦合网络上构建基于数据和事件的推理框架,融入模型算法、历史场景模式匹配、专家经验等方法,最终形成完整的智能决策推理系统。
基于全景式耦合网络,可建立物理空间与数字空间、业务层与支撑层互动关联的闭环式应用架构,如图2所示。位于物理空间支撑层的是物理事物,表示现实世界中的事物,包括物理业务、物理模型、物理机理与经验和物理实体与关系。业务是一个行业中的组织,通过信息交互实现明确目的的一系列过程,在领域中,物理业务表示为处理一系列事务的逻辑以及业务间互相转移的逻辑关联关系。物理模型描述事务的运行处置逻辑,若干个物理模型构成物理业务。物理机理与经验描述物理空间中事件的演化规律和人为总结的经验,事件是自然发生的或受到人为干预的现象。物理实体与关系表示物理空间中与领域相关的对象实体与它们在不同业务下存在的不同关联关系。
位于数字孪生支撑层的是映射矩阵,作用是将物理事物与全景式耦合网络形成实时映射关系,支撑在数字空间中对物理流域的同步全映射。
全景式耦合网络位于数字空间支撑层,基于知识图谱对信息的组织方式,表示数字世界中的事物,包括主题图谱与逻辑、专业与智能模型、事理图谱与场景模式和基础对象关系图谱。其中,主题图谱与逻辑是物理业务在数字空间的映射,是以业务为导向、以主题分析为目标,基于业务中的主题逻辑关系所形成的业务-主题-要素相关联的语义网络。例如,针对流域防洪业务,可分解为降雨、产流、汇流、演进等多个主题,主题之间存在逻辑关系,各主题内所包含的要素也存在逻辑关系。专业与智能模型是物理模型在数字空间的映射。通过对主题或要素进行建模,使用对象信息、事理知识与场景信息解决领域中的复杂问题。事理图谱与场景模式是物理机理与经验在数字空间的映射,用以描述事件概念间的定性定量关系场景中普遍存在的事件演化关系。这里将场景定义为一系列事件间相互作用、演化的相对独立的时空范围。例如,通过挖掘分析历史场次洪水中的暴雨特征、洪水特征及两者的关联,可形成暴雨洪水模式库。基础对象关系图谱是物理实体与关系在数字空间的映射,用以表示在不同主题下对象间的关联关系,是构建事件与场景的最小单元。
数字空间业务层主要支撑孪生流域的互动性,使用全景式耦合网络作为信息支撑进行智能计算,为决策调度提供有效方案,包括事前预警、归因溯源、预测模拟和方案优化。事前预警能主动或超前触发预演分析和决策支撑,为及时开展决策提供服务。归因溯源用于分析事件发生机理和过程,既能辅助预演,也为决策结果提供可信的证据。预测模拟需通过模型模拟的不断校正和优化,保持数字空间中流域状态与物理空间中流域状态的一致性,进而做出准确的预测以指导预演。方案优化自动形成决策调度的最优方案,能减少人工分析预演结果代价、提高效率,这是智能预演的重要目标。
位于数字孪生业务层的是协同交互,其作用是将智能预演结果传递给人工决策调度,并将人工调整参数返回给智能预演进行迭代优化,实现双向交互,达到决策方案迭代优化的效果,解决了一致性问题。
位于物理空间业务层的是决策调度,主要通过人工参与、智能预演相结合的方式进行有效决策,最终通过动态反馈机制对现实世界中的物理事物进行干预。包括行动选择、系统分析、问题诊断和问题识别,分别对应智能预演中的事前预警、归因溯源、预测模拟和方案优化。
2 知识平台关键技术
管理与决策的智能取决于外部的信息和内部的经验。因此,需要在全景式耦合网络上构建基于数据和事件的推理框架,融入模型算法、历史场景模式匹配、专家经验等方法,最终形成完整的智能决策推理系统,以事件为驱动,以数据反馈形成决策闭环。其中的关键技术包括全景式耦合网络构建、基于知识的智能预演和数字孪生映射矩阵设计。
2.1 全景式耦合网络构建
知识统一表示模型以统一的形式刻画知识及其关联,致力于解决数据来源广、类型多、体系杂等问题。但大数据包含丰富的程序性、概念性和事实性知识,如何表示这些知识的层次与关联是知识统一表示模型亟待解决的问题。知识图谱是关联知识、表示知识、管理知识的有效模型。全景式耦合网络以知识图谱为理论支撑,刻画知识体系,能作为数字孪生流域平台的大脑发挥指挥作用[8]。它由主题图谱与逻辑、专业与智能模型、事理图谱与场景模式和基础对象关系图谱组成。一个全景式耦合网络的例子如图3所示,其描述了某场降雨形成的河道水污染演化的过程。
2.1.1 基础对象关系图谱
基础对象关系图谱利用图模型来描述业务场景中存在的实体/概念间的关联关系。它能灵活表示和关联概念性知识和事实性知识,耦合多源异质数据,因此基础对象关系图谱是全景式耦合网络的基础构件。该图谱构建的关键在于利用人、机、物融合的数据采集网络,获取流域水资源多源异构数据,研究本体建模、知识抽取[9]、知识融合、知识更新、知识存储[10]、知识推理等技术[11,12,13],构建基于水资源管理领域认知框架的对象关系图,支撑流域状态全面动态感知。
2.1.2 事理图谱与场景模式
基础对象关系图谱主要是以水利对象实体及其属性和关系为核心,缺乏对业务相关事件及其事理逻辑等知识的刻画。事理图谱是一个事理逻辑知识库,描述了事件之间的演化规律和模式。结构上,事理图谱是一个有向有环图,节点代表事件,有向边代表事件之间的时序、因果、条件和上下位等逻辑关系。理论上,事理图谱中的事件是具有一定抽象程度的泛化事件。这些事件可以表示为抽象、语义完备的谓词性词或词组,也可以表示为可变长度的、结构化的(主体,事件词,客体)多元组。
事理图谱的构建可分为事件抽取、场景模式库构建和事理规则挖掘三部分。事件抽取主要基于非结构化数据,采用模式匹配、机器学习等方法挖掘出事件所对应的时空数据。场景模式库构建主要基于时间序列分割与聚类方法先生成场景,通过挖掘时间序列间的关联规则形成场景中的典型模式。事理规则挖掘主要基于机器学习方法,通过挖掘历史事件中的事件转移概率,形成事件演化规则。由于大数据存在时空异质性,如何生成自适应多时空场景的事理图谱与场景模式是其能应用到实际业务的关键[14]。其中,事理图谱构建的关键技术包括基于模型的图谱节点组织技术、基于机理模型的流域决策推理技术、模型要素与实体属性关联关系挖掘技术等。
2.1.3 主题图谱与逻辑
主题图谱与逻辑是以业务为导向、以主题分析为系统功能目标,形成的业务-主题-要素的层次关联网络。其由数据驱动,事件触发自动切换主题,实现自动化业务分析与聚焦。构建的关键点在于如何从大数据中自动挖掘层次主题、形成动态主题关联,以及主题与要素的关联[15]。
2.1.4 专业与智能模型
以实现预报、预演模拟目标而构建的复杂模型,其模型构建本身不在图谱构建范围内,关键点在于如何将模型要素与图谱中对象进行关联,以自动调用模型进行演算。
2.2 基于知识的智能预演
基于知识的智能预演能利用全景式耦合网络在统一表示模型方面的优势,聚合海量数据,以数据驱动的方式自动生成推演结果并形成优化方案。但大数据存在多源异质的问题,且决策方案不能仅仅限制于单一时空场景中,因此通过使用基于因果关系发现的事件归因方法、基于深度学习的事件预测、基于时空特征模式库的决策方案生成和优化、基于多目标学习和博弈论的方案仿真与评估等一系列方法,最终形成全空间、多过程、多情景、多维度的决策方案。智能预演由方案优化、预测模拟、归因溯源和事前预警组成,描述智能预演的模块运行逻辑如图4所示。
2.2.1 事前预警
事前预警能主动或超前触发预演系统,是保证即时性的关键。现有的预警系统存在功能匹配性低、扩展性差的问题[16]。因此,事件预警的关键在于可扩展性,要能与全景式耦合网络有效关联,自动从网络中获取实时数据进行预警。
2.2.2 归因溯源
分析事件发生的机理和过程是辅助预演模拟、增加系统可信度的重要方法。发现事物间潜在的因果关系是众多科学研究的终极目标[17]。然而现实中海量实体以及匮乏的数据使人工发现因果关系几乎不可行。但大数据时代的到来,使从数据中挖掘因果关系成为可能。为此可使用基于因果关系溯源的事件归因方法进行反向的归因溯源,此方法实施的关键在于如何应对大数据的异质非平稳特征[18]。
2.2.3 预测模拟
预测模拟用于预测未来出现的事件,正向模拟事件发展过程,为决策提供参考。大数据包含丰富的时空特征,使用神经网络能捕获数据的时空特征,为基于深度学习进行事件预测提供了可能。此方法的关键在于如何使用合适的深度学习模型对数据特征进行建模,以实现准确预测[19,20]。
2.2.4 方案优化
在方案优化中,以决策支撑为目标,利用时空特征模式库实现基于历史信息的场景匹配和决策推荐,基于多目标学习和博弈论实现复杂场景中的决策方案动态生成和迭代优化。
历史信息是决策调度的重要参考,时空特征模式库能有效利用历史场景[14,21],因此基于时空特征模型库能有效生成与优选决策方案。流域大数据的时空数据产生机制是动态的,如何适应动态变化的数据产生机制是时空特征模式库构建的关键。
决策调度目标不是单一的,还涉及社会经济、生态等一系列目标,因此决策方案是一系列目标的综合考量。使用多目标学习和博弈论方法能解决多目标、多方案、不确定性规划问题,这其中如何优化帕累托解集、提高可扩展性与博弈规则是此方法的关键。
2.3 数字孪生映射矩阵设计
映射矩阵将物理事物与全景式耦合网络形成实时映射关系,是保证知识平台正常运行的关键。大数据时代海量动态数据的集成建模成为关键基础技术问题,如何构建动态性、集成性、可扩展的数字孪生模型是关键所在[22,23,24]。此外,映射矩阵与全景式耦合网络息息相关,因此另一个关键点是基础对象关系图谱中如何对物理事物的本体进行定义,从而实现实时映射[25,26]。
协同交互是支撑预演场景构建和预演数据挖掘的重要技术。在预演场景构建中,需要根据业务需求区分虚拟化场景要素与非虚拟化场景要素,通过融合这两种要素形成虚实共存的数字化预演场景。其中,非虚拟化要素是模拟流域实际情况的场景要素;虚拟化场景要素包括可预设的水情、雨情等自然要素和调度目标、调度方案等人工干预要素。通过人机交互实现虚拟化与非虚拟化要素的组合,进而支撑多场景中的智能预演。针对以上需求,首先需要研究虚拟化场景要素生成技术,通过对要素进行赋值,可生成包含历史场次洪水、超标准洪水及其他遭遇情景在内的多种预演场景。其次,需要研究虚实要素之间的约束关系,使得预演场景符合客观自然规律。
多种虚实共存场景中的预演会产生海量的预演数据。在预演过程中,专家也会根据经验对预演方案进行修正。因此,需要针对海量预演数据开展知识挖掘,将不同雨水工情场景中的调度方案、专家决策、预演结果进行分析和关联,为业务应用提供流域场景快速匹配、调度方案自动推荐等功能。
3 结 语
本文围绕数字孪生流域中知识平台建设目标,针对多业务场景中的智能管理与决策应用需求,提出了一种基于知识图谱的知识体系架构,通过构建水利管理对象关系图谱、事理图谱、场景模式库,最终形成全景式耦合网络。该结构可以全面、高效地表征各类数据等外部信息和模型,以及经验、历史场景等内部经验中所蕴含的知识,从而实现水利数据跨层级、跨地域、跨系统、跨部门、跨业务的融合和算法及经验沉淀。该体系不仅可以支撑物理流域的全映射,也能够面向“四预”功能需求,实现事前预警、归因溯源、预测模拟和方案优化等智能应用,支撑孪生流域的互动需求。
文章来源 |《人民长江》2023年第3期
精彩评论文明上网理性发言,请遵守评论服务协议
共0条评论