水利行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211296564.5 (22)申请日 2022.10.21 (71)申请人 清华大学 地址 100084 北京市海淀区清华园1号 (72)发明人 刘寒 高歌 顾明  (74)专利代理 机构 北京三聚阳光知识产权代理 有限公司 1 1250 专利代理师 胡晓静 (51)Int.Cl. G06F 30/13(2020.01) G06F 30/20(2020.01) G06F 111/04(2020.01) (54)发明名称 子模型抽取方法、 装置、 计算机设备及 介质 (57)摘要 本发明提供一种子模型抽取方法、 装置、 计 算机设备及介质, 包括: 获取源数据与用户需求, 源数据包括互相关联的节点与边; 基于源数据与 用户需求, 生成数据内容规则集, 数据内容规则 集为与子模 型抽取相关的规则集合; 基于数据内 容规则集, 对源数据进行筛选, 得到标注为保留 的根节点集合; 对标注为保留的根节 点集合进行 属性筛选, 得到属性节点, 输出标注为保留的属 性节点和与属性节点关联的边集合, 得到子模 型, 子模型与源数据数据格式一致。 通过本发明, 提供一种支持细粒度子图节点过滤的方法, 通过 在源数据中进行原位处理, 实现细粒度且灵活的 属性信息过滤, 得到保持源数据格式、 内容精简 且信息失真少的子模型 数据。 权利要求书2页 说明书10页 附图2页 CN 115544626 A 2022.12.30 CN 115544626 A 1.一种子模型抽取 方法, 其特 征在于, 所述方法包括: 获取源数据与用户需求, 所述源数据包括互相关联的节点与边; 基于所述源数据与用户需求, 生成数据内容规则集, 所述数据内容规则集为与子模型 抽取相关的规则集 合; 基于所述数据内容 规则集, 对所述源数据进行筛 选, 得到标注为保留的根节点 集合; 对所述标注为保留的根节点集合进行属性筛选, 得到属性节点, 输出标注为保留的属 性节点和与所述属 性节点关联的边集合, 得到子模型, 所述子模型与所述源数据数据格式 一致。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述源数据与用户需求, 生成数 据内容规则集, 包括: 基于所述源数据的数据格式, 生成与数据结构相关的预定义规则, 所述预定义规则包 括子图模板与关键边; 所述子图模板为对一个子 图的定义, 包括一个根节点与若干个属性路径, 所述属性路 径为从所述根节点出发, 由若干边组成由若干中间节点与边组成的通向目标节点目标属性 节点的路径; 所述关键边 为与所述源数据格式的数据结构完整性相关的边; 基于所述用户需求, 生成与具体的数据应用需求相关的自定义规则, 所述自定义规则 包括集合定义规则与筛选规则, 所述集合定义规则用于判断节点是否属于某节点集合, 所 述筛选规则用于判断某 节点是否应保留或应排除。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述数据内容规则集, 对所述源 数据进行筛 选, 得到标注为保留的根节点 集合, 包括: 基于所述子图模板与集合定义规则, 判断所述源数据中的节点是否符合所述集合定义 规则; 当所述节点符合所述集合定义规则时, 将所述节点作为根节点放入对应的根节点集 合; 基于所述筛选规则, 对所述根节点集合中节点进行标注, 得到所述标注为保留的根节 点集合。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述筛选规则, 对所述根节点集 合中节点进行 标注, 得到所述标注为保留的根节点 集合, 包括: 基于所述筛 选规则, 对所述 根节点集合中的各根节点进行判断; 在当前根节点符合所述筛选规则的约束时, 将所述当前根节点标注为保留, 得到标注 为保留的根节点 集合。 5.根据权利要求2所述的方法, 其特征在于, 所述对所述标注为保留的根节点集合进行 属性筛选, 得到属性节点, 输出标注 为保留的属性节点和与所述属性节点关联的边集合, 得 到子模型, 包括: 基于所述子图模板, 从所述标注为保留的根节点集合出发, 根据 所述属性路径搜索, 得 到属性节点 集合; 基于所述筛选规则, 对所述属性节点集合进行筛选, 得到标注为保留的属性节点和与 所述属性节点关联的边 集合; 输出标注为保留的属性节点和与所述属性节点关联的边 集合, 得到子模型。权 利 要 求 书 1/2 页 2 CN 115544626 A 26.根据权利要求5所述的方法, 其特征在于, 所述筛选规则包括: 属性排除规则与属性 保留规则; 所述对所述属性节点 集合进行筛 选, 得到标注为保留的属性节点 集合, 包括: 基于所述属性排除规则, 将所述属性节点中符合所述属性排除规则的节点标注为排 除, 得到标注为 排除的属性节点 集合和剩余的属性节点 集合; 基于所述属性保留规则, 对所述剩余的属性节点集合进行判断, 在当前所述属性节点 符合所述属 性保留规则的约束时, 将当前所述属 性节点标注为保留, 并将其属 性路径上 的 节点标注为保留, 得到标注为保留的属性节点 集合。 7.根据权利要求5所述的方法, 其特征在于, 所述对所述属性节点集合进行筛选, 得到 与所述属性节点关联的边 集合, 包括: 基于所述子图模板, 从所述属性节点出发, 对所述属性节点的所有关键边进行判断, 在 当前关键边关联的其他根节点也标注为保留时, 将所述当前关键边标注为保留, 得到与所 述属性节点关联的边。 8.一种子模型抽取装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取源数据与用户需求, 所述源数据包括互相关联的节点与边; 规则生成单元, 用于基于所述源数据与用户需求, 生成数据内容规则集, 所述数据内容 规则集为与子模型抽取相关的规则集 合; 根节点筛选单元, 用于基于所述数据内容规则集, 对所述源数据进行筛选, 得到标注为 保留的根节点 集合; 抽取单元, 用于对所述标注为保留的根节点集合进行属性筛选, 得到属性节点, 输出标 注为保留的属 性节点和与所述属 性节点关联 的边集合, 得到子模型, 所述子模型与所述源 数据数据格式一 致。 9.一种计算机设备, 其特征在于, 包括存储器和处理器, 所述存储器和所述处理器之间 互相通信连接, 所述存储器中存储有计算机指 令, 所述处理器通过执行所述计算机指 令, 从 而执行权利要求1 ‑7中任一项所述的子模型抽取 方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使所述计算机执 行权利要求1 ‑7中任一项所述的子模型抽取 方法。权 利 要 求 书 2/2 页 3 CN 115544626 A 3

.PDF文档 专利 子模型抽取方法、装置、计算机设备及介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 子模型抽取方法、装置、计算机设备及介质 第 1 页 专利 子模型抽取方法、装置、计算机设备及介质 第 2 页 专利 子模型抽取方法、装置、计算机设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:01:34上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。