水利行业标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211296564.5 (22)申请日 2022.10.21 (71)申请人 清华大学 地址 100084 北京市海淀区清华园1号 (72)发明人 刘寒 高歌 顾明 (74)专利代理 机构 北京三聚阳光知识产权代理 有限公司 1 1250 专利代理师 胡晓静 (51)Int.Cl. G06F 30/13(2020.01) G06F 30/20(2020.01) G06F 111/04(2020.01) (54)发明名称 子模型抽取方法、 装置、 计算机设备及 介质 (57)摘要 本发明提供一种子模型抽取方法、 装置、 计 算机设备及介质, 包括: 获取源数据与用户需求, 源数据包括互相关联的节点与边; 基于源数据与 用户需求, 生成数据内容规则集, 数据内容规则 集为与子模 型抽取相关的规则集合; 基于数据内 容规则集, 对源数据进行筛选, 得到标注为保留 的根节点集合; 对标注为保留的根节 点集合进行 属性筛选, 得到属性节点, 输出标注为保留的属 性节点和与属性节点关联的边集合, 得到子模 型, 子模型与源数据数据格式一致。 通过本发明, 提供一种支持细粒度子图节点过滤的方法, 通过 在源数据中进行原位处理, 实现细粒度且灵活的 属性信息过滤, 得到保持源数据格式、 内容精简 且信息失真少的子模型 数据。 权利要求书2页 说明书10页 附图2页 CN 115544626 A 2022.12.30 CN 115544626 A 1.一种子模型抽取 方法, 其特 征在于, 所述方法包括: 获取源数据与用户需求, 所述源数据包括互相关联的节点与边; 基于所述源数据与用户需求, 生成数据内容规则集, 所述数据内容规则集为与子模型 抽取相关的规则集 合; 基于所述数据内容 规则集, 对所述源数据进行筛 选, 得到标注为保留的根节点 集合; 对所述标注为保留的根节点集合进行属性筛选, 得到属性节点, 输出标注为保留的属 性节点和与所述属 性节点关联的边集合, 得到子模型, 所述子模型与所述源数据数据格式 一致。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述源数据与用户需求, 生成数 据内容规则集, 包括: 基于所述源数据的数据格式, 生成与数据结构相关的预定义规则, 所述预定义规则包 括子图模板与关键边; 所述子图模板为对一个子 图的定义, 包括一个根节点与若干个属性路径, 所述属性路 径为从所述根节点出发, 由若干边组成由若干中间节点与边组成的通向目标节点目标属性 节点的路径; 所述关键边 为与所述源数据格式的数据结构完整性相关的边; 基于所述用户需求, 生成与具体的数据应用需求相关的自定义规则, 所述自定义规则 包括集合定义规则与筛选规则, 所述集合定义规则用于判断节点是否属于某节点集合, 所 述筛选规则用于判断某 节点是否应保留或应排除。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述数据内容规则集, 对所述源 数据进行筛 选, 得到标注为保留的根节点 集合, 包括: 基于所述子图模板与集合定义规则, 判断所述源数据中的节点是否符合所述集合定义 规则; 当所述节点符合所述集合定义规则时, 将所述节点作为根节点放入对应的根节点集 合; 基于所述筛选规则, 对所述根节点集合中节点进行标注, 得到所述标注为保留的根节 点集合。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述筛选规则, 对所述根节点集 合中节点进行 标注, 得到所述标注为保留的根节点 集合, 包括: 基于所述筛 选规则, 对所述 根节点集合中的各根节点进行判断; 在当前根节点符合所述筛选规则的约束时, 将所述当前根节点标注为保留, 得到标注 为保留的根节点 集合。 5.根据权利要求2所述的方法, 其特征在于, 所述对所述标注为保留的根节点集合进行 属性筛选, 得到属性节点, 输出标注 为保留的属性节点和与所述属性节点关联的边集合, 得 到子模型, 包括: 基于所述子图模板, 从所述标注为保留的根节点集合出发, 根据 所述属性路径搜索, 得 到属性节点 集合; 基于所述筛选规则, 对所述属性节点集合进行筛选, 得到标注为保留的属性节点和与 所述属性节点关联的边 集合; 输出标注为保留的属性节点和与所述属性节点关联的边 集合, 得到子模型。权 利 要 求 书 1/2 页 2 CN 115544626 A 26.根据权利要求5所述的方法, 其特征在于, 所述筛选规则包括: 属性排除规则与属性 保留规则; 所述对所述属性节点 集合进行筛 选, 得到标注为保留的属性节点 集合, 包括: 基于所述属性排除规则, 将所述属性节点中符合所述属性排除规则的节点标注为排 除, 得到标注为 排除的属性节点 集合和剩余的属性节点 集合; 基于所述属性保留规则, 对所述剩余的属性节点集合进行判断, 在当前所述属性节点 符合所述属 性保留规则的约束时, 将当前所述属 性节点标注为保留, 并将其属 性路径上 的 节点标注为保留, 得到标注为保留的属性节点 集合。 7.根据权利要求5所述的方法, 其特征在于, 所述对所述属性节点集合进行筛选, 得到 与所述属性节点关联的边 集合, 包括: 基于所述子图模板, 从所述属性节点出发, 对所述属性节点的所有关键边进行判断, 在 当前关键边关联的其他根节点也标注为保留时, 将所述当前关键边标注为保留, 得到与所 述属性节点关联的边。 8.一种子模型抽取装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取源数据与用户需求, 所述源数据包括互相关联的节点与边; 规则生成单元, 用于基于所述源数据与用户需求, 生成数据内容规则集, 所述数据内容 规则集为与子模型抽取相关的规则集 合; 根节点筛选单元, 用于基于所述数据内容规则集, 对所述源数据进行筛选, 得到标注为 保留的根节点 集合; 抽取单元, 用于对所述标注为保留的根节点集合进行属性筛选, 得到属性节点, 输出标 注为保留的属 性节点和与所述属 性节点关联 的边集合, 得到子模型, 所述子模型与所述源 数据数据格式一 致。 9.一种计算机设备, 其特征在于, 包括存储器和处理器, 所述存储器和所述处理器之间 互相通信连接, 所述存储器中存储有计算机指 令, 所述处理器通过执行所述计算机指 令, 从 而执行权利要求1 ‑7中任一项所述的子模型抽取 方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使所述计算机执 行权利要求1 ‑7中任一项所述的子模型抽取 方法。权 利 要 求 书 2/2 页 3 CN 115544626 A 3
专利 子模型抽取方法、装置、计算机设备及介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 01:01:34
上传分享
举报
下载
原文档
(479.0 KB)
分享
友情链接
ISO27002-2022中文版.pdf
GB-T 36620-2018 面向智慧城市的物联网技术应用指南.pdf
DB3310-T 76-2021 塑料原料数字化仓储系统建设与管理规范 台州市.pdf
腾讯研究院AIGC发展趋势报告2023.pdf
GB-T 21720-2022 农贸市场管理技术规范.pdf
GM-T 0090-2020 标识密码应用标识格式规范.pdf
Fortify_TaxonomyofSoftwareSecurityErrors Foritfy 7种软件安全错误分类法 英文版 .pdf
GB-T 38329.3-2023 港口船岸连接 第3部分:低压岸电连接(LVSC)系统 一般要求.pdf
GB-T 4990-2010 热电偶用补偿导线合金丝.pdf
GM-T 0001.3-2012 祖冲之序列密码算法:第3部分:基于祖冲之算法的完整性算法.pdf
GB-T 32609-2016 网球拍及部件的物理参数和试验方法.pdf
TTAF 187—2023 框架型应用软件个人信息保护规范.pdf
GB-T 6996-2012 透射式电视测试图.pdf
GB-T 20277-2015 信息安全技术 网络和终端隔离产品测试评价方法.pdf
GB-T 36631-2018 信息安全技术 时间戳策略和时间戳业务操作规则.pdf
GB-T 36964-2018 软件工程 软件开发成本度量规范.pdf
专利 一种电源芯片质量检测方法及系统.PDF
艾瑞咨询 中国云安全行业研究报告 2021.pdf
DB5133-T 63-2022 牦牛标准化育肥场布局及圈舍建设规范 甘孜藏族自治州.pdf
GB-T 411-2017 棉印染布.pdf
1
/
3
15
评价文档
赞助2元 点击下载(479.0 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。