(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211314538.0
(22)申请日 2022.10.26
(71)申请人 江苏益柏锐信息科技有限公司
地址 215500 江苏省苏州市 常熟市东 南街
道云深路2号
(72)发明人 张志华
(74)专利代理 机构 苏州瞪羚知识产权代理事务
所(普通合伙) 32438
专利代理师 张宇
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 16/2458(2019.01)
G06F 40/205(2020.01)
G06K 9/62(2022.01)
G06N 5/02(2006.01)
(54)发明名称
基于人工智能的数据 挖掘方法及服 务器
(57)摘要
本申请实施例提供的基于人工智能的数据
挖掘方法及服务器, 通过将拟处理文本集合进行
拆解得到多个拆解文本, 对多个拆解文本分别进
行离散文本表达知识挖掘和分布文本表达知识
挖掘并进行表达知识碰撞, 得到目标文本交融表
达知识, 接着获取多个拆解文本对应的文本表意
知识, 如此, 令挖掘到的文本表意知识可 以兼顾
离散内容和分布内容, 并且令挖掘到的文本表意
知识可以尽可能维持文本初始特征, 接着获取多
个拆解文本对应的关键文本支持度, 提升文本类
型预测的精确度和可靠性, 再从文本集合中确定
多个文本序列, 并确定对应的整合表意知识, 从
而获得相同文本序列集合, 如此增加预测的精确
度和可靠性和获得相同文本序列集合的精确度
和可靠性。
权利要求书3页 说明书17页 附图2页
CN 115374284 A
2022.11.22
CN 115374284 A
1.一种基于人工智能的数据 挖掘方法, 其特 征在于, 应用于服 务器, 所述方法包括:
获取拟处 理文本集 合, 将所述拟处 理文本集 合进行拆解, 得到多个 拆解文本;
对所述多个拆解文本分别进行离散文本表达知识挖掘, 得到所述多个拆解文本对应的
离散文本表达知识, 所述离散文本表达知识包括过渡离散文本表达知识和收束离散文本表
达知识;
对所述多个拆解文本分别进行分布文本表达知识挖掘, 得到所述多个拆解文本对应的
分布文本表达知识, 所述分布文本表达知识包括过渡分布文本表达知识和收束分布文本表
达知识;
依据所述多个拆解文本对应的过渡离散文本表达知识和过渡分布文本表达知识进行
表达知识碰撞, 得到所述多个 拆解文本对应的目标文本交融表达知识;
依据所述多个拆解文本对应的收束离散文本表达知识、 收束分布文本表达知识和目标
文本交融表达知识进行表意知识挖掘, 得到所述多个拆解文本对应的文本表意知识, 并依
据所述文本表意知识进行文本类型 预测, 得到所述多个 拆解文本对应的关键文本支持度;
依据所述关键文本支持度从所述拟处理文本集合中确定多个文本序列, 并依据 所述文
本表意知识确定所述多个文本序列对应的整合表意知识;
依据所述多个文本序列对应的整合表意知识进行文本序列类型预测, 得到相同文本序
列集合。
2.根据权利要求1所述的方法, 其特征在于, 所述依据所述多个文本序列对应的整合表
意知识进行文本序列类型 预测, 得到相同文本序列集 合, 包括:
依据所述多个文本序列对应的整合表意知识进行隐藏映射, 得到隐藏映射知识;
通过所述隐藏映射知识和所述多个拆解文本对应的关键文本支持度进行还原映射, 得
到所述多个文本序列对应的目标整合表意知识;
依据所述多个文本序列对应的目标整合表意知识对所述多个文本序列进行类型预测,
得到所述相同文本序列集 合。
3.根据权利要求2所述的方法, 其特征在于, 所述依据所述多个文本序列对应的整合表
意知识进行隐藏映射, 得到隐藏映射知识, 包括:
提取所述多个拆解文本各自对应的初始文本表达知识, 从所述多个拆解文本各自对应
的初始文本表达知识中确定所述多个文本序列对应的文本序列初始 表达知识;
将所述多个文本序列对应的文本序列初始表达知识分别与对应的整合表意知识进行
融合, 得到所述多个文本序列对应的目标文本融合表达知识;
将所述多个文本序列对应的目标文本融合表达知识加载至映射网络的隐藏模块中进
行处理, 获得目标隐藏映射知识。
4.根据权利要求2所述的方法, 其特征在于, 所述依据所述多个文本序列对应的目标整
合表意知识对所述多个文本序列进行类型 预测, 得到所述相同文本序列集 合, 包括:
通过所述多个文本序列对应的目标整合表意知识确定所述多个文本序列之间的共性
度量结果;
依据所述多个文本序列之间的共性度量结果进行划簇, 得到所述相同文本序列集 合。
5.根据权利要求1所述的方法, 其特征在于, 所述对所述多个拆解文本分别进行离散文
本表达知识挖掘, 得到所述多个拆解文本对应的离散文本表达知识, 所述离散文本表达知权 利 要 求 书 1/3 页
2
CN 115374284 A
2识包括过渡离 散文本表达知识和收束离 散文本表达知识, 包括:
对所述多个拆解文本分别进行离散知识提取操作, 得到所述多个拆解文本对应的多个
过渡线性知识和收束 线性知识;
将所述多个过渡线性知识进行分布维数统一处理, 得到所述多个拆解文本对应的多个
过渡离散文本表达知识;
将所述收束线性知识进行分布维数统一处理, 得到所述多个拆解文本对应的收束离散
文本表达知识。
6.根据权利要求1所述的方法, 其特征在于, 所述对所述多个拆解文本分别进行分布文
本表达知识挖掘, 得到所述多个拆解文本对应的分布文本表达知识, 所述分布文本表达知
识包括过渡分布文本表达知识和收束分布文本表达知识, 包括:
提取所述多个 拆解文本各自对应的初始文本表达知识;
对所述多个拆解文本各自对应的初始文本表达知识进行分布知识提取操作, 得到所述
多个拆解文本对应的多个过渡分布文本表达知识和收束分布文本表达知识。
7.根据权利要求1所述的方法, 其特征在于, 所述过渡离散文本表达知识包括多个, 所
述过渡分布文本表达知识包括多个;
所述依据所述多个拆解文本对应的过渡离散文本表达知识和过渡分布文本表达知识
进行表达知识碰撞, 得到所述多个 拆解文本对应的目标文本交融表达知识, 包括:
将所述多个过渡离散文本表达知识中第一过渡离散文本表达知识与所述多个过渡分
布文本表达知识中对应的第一过渡分布文本表达知识进行融合, 得到第一文本融合表达知
识, 依据所述第一文本融合表达知识进行知识提取操作, 得到第一文本交融表达知识;
将所述第一文本交融表达知识、 所述多个过渡离散文本表达知识中第 二过渡离散文本
表达知识与所述多个过渡分布文本表达知识中对应的第二过渡分布文本表达知识进行融
合, 得到第二文本融合表达知识, 依据所述第二文本融合表达知识进 行知识提取操作, 得到
第二文本交融表达知识;
当所述多个过渡离散文本表达知识和所述多个过渡分布文本表达知识均执行完毕, 获
得目标文本交融表达知识。
8.根据权利要求1所述的方法, 其特征在于, 所述依据所述多个拆解文本对应的收束离
散文本表达知识、 收束分布文本表达知识和目标文本交融表达知识进行表意知识挖掘, 得
到所述多个拆解文本对应的文本表意知识, 并依据所述文本表意知识进行文本类型预测,
得到所述多个 拆解文本对应的关键文本支持度, 包括:
将所述多个拆解文本对应的收束离散文本表达知识、 收束分布文本表达知识和目标文
本交融表达知识进行融合, 得到所述多个 拆解文本对应的目标文本融合表达知识;
依据所述多个拆解文本对应的目标文本 融合表达知识进行知识提取操作, 得到所述多
个拆解文本对应的线性表达知识;
依据所述多个拆解文本对应的线性表达知识确定所述线性表达知识中每个维数下对
应的知识向量 最大值和知识向量均值;
对所述知识向量最大值和所述知识向量均值进行和运算, 得到所述线性表达知识中每
个维数下对应的表意挖掘知识向量, 依据所述线性表达知识中每个维数下对应的表意挖掘
知识向量, 得到所述多个 拆解文本对应的表意挖掘知识;权 利 要 求 书 2/3 页
3
CN 115374284 A
3
专利 基于人工智能的数据挖掘方法及服务器
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:48上传分享