(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210012244.6
(22)申请日 2022.01.07
(65)同一申请的已公布的文献号
申请公布号 CN 114298058 A
(43)申请公布日 2022.04.08
(73)专利权人 北京思源智通科技有限责任公司
地址 102400 北京市房山区阎富路69号院
46号楼1至4层101二层07
(72)发明人 李根柱
(74)专利代理 机构 北京和联顺知识产权代理有
限公司 1 1621
专利代理师 朱守鑫
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/289(2020.01)
G06F 40/166(2020.01)G06F 40/247(2020.01)
G06K 9/62(2022.01)
(56)对比文件
CN 101593 076 A,20 09.12.02
CN 10754 4726 A,2018.01.0 5
US 5099425 A,19 92.03.24
CN 106650943 A,2017.0 5.10
CN 106650943 A,2017.0 5.10
CN 109242417 A,2019.01.18
WO 2018016 673 A1,2018.01.25
柏峰等.一种政 府公文智能辅助写作系统.
《北京信息科技大 学学报》 .2021,
Guangzhi Li et.al.Co ntrol plane
design for rel iable optical netw orks. 《
IEEE Communications Magazine》 .2002,
审查员 何欢欢
(54)发明名称
文章替换词推荐方法、 系统、 计算机可读介
质
(57)摘要
本发明涉及计算机领域, 且公开了文章替换
词推荐方法、 系统、 计算机 可读介质, 包括以下步
骤: Step1: 采 集网络词组, 导入数据库内, 进行保
存分类; Step2: 导入文章至程序内扫描, 提取文
章中的词 组, 进行一次标记; Step3: 参照数据库
词组信息, 针对 标记词组, 生 成第一候选同义词、
第二候选同义词和第三候选同义词; Step4: 用户
选择被一次标记的词组, 进行手动二次标记;
Step5: 显示出二次标记词组推荐的候选替换词,
将原词组作为第一选择进行排列。 本发明可为用
户提供多个推荐替换词进行选择, 辅助用户进行
词组的替换, 帮助用户对文章的质量进行润色加
工, 提升文章的质量, 用户不必逐个对词组进行
查找, 帮助用户节省大量 修改时间。
权利要求书1页 说明书5页 附图3页
CN 114298058 B
2022.09.13
CN 114298058 B
1.文章替换词推荐方法, 其特 征在于, 包括以下步骤:
Step1: 采集网络词组, 导入数据库内, 进行保存分类;
Step2: 导入文章至程序内扫描, 提取文章中的词组, 进行一次标记;
Step3: 参照数据库词组信息, 针对标记词组, 生成第一候选同义词、 第二候选同义词和
第三候选同义词;
Step4: 用户选择被一次标记的词组, 进行手动二次标记;
Step5: 显示出二次标记词组推荐的候选替换词, 将原词组作为第一选择进行排列;
Step6: 采集用户二次标记的词 组前后字句, 进行分析处理, 对语义契合度最高的词组
进行三次标记, 作为推荐选择项;
Step7: 用户对原词组与候选替换词进行选择;
Step8: 选择完毕后, 检索文章相同段落, 进行同步 替换,
其中, 所述Step6中契合度的计算公式为:
其中, C=文章集合;
N=总文章数目;
Na=含有替换词A的文章总数;
Nb=含有替换词B的文章总数;
Nab=含有 (A+B) 的文章总数。
2.根据权利要求1所述的文章替换词推荐方法, 其特征在于, 所述步骤Step1中的词 组
分类的依据, 包括: 字节长度、 词组结构、 添加时间、 词组类型。
3.根据权利要求1所述的文章替换词推荐方法, 其特征在于, 所述步骤Step2中的文章
导入方式, 包括: 接入外 部设备读取文档至数据库、 手动 编辑录入文档至数据库。
4.根据权利要求1所述的文章替换词推荐方法, 其特征在于, 所述步骤Step3中的第一
候选同义词、 第二 候选同义词与第三 候选同义词以拼音首字母排列顺序进行排列。
5.根据权利要求1所述的文章替换词推荐方法, 其特征在于, 所述步骤Step6中的契合
度最高词组的选择属性, 包括; 网络采集信息中引用度的高低、 作为候选替换词的历史选择
量高低、 历史选择跳过次数、 字面相似度与拼音相似度;
其中, 契合度最高的词组, 在候选替换词的排列中, 作为第二选择项 进行排列。
6.根据权利要求1所述的文章替换词推荐方法, 其特征在于, 所述步骤Step8中相同段
落的检索属性 为, 词组前后连接的短语相同;
在全文扫描后, 将所有可替换选项 进行展示, 用户进行选择后, 确认是否替换。
7.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处理
器执行时实现权利要求1 ‑6任意一项所述的方法。权 利 要 求 书 1/1 页
2
CN 114298058 B
2文章替换词推荐方 法、 系统、 计算机可 读介质
技术领域
[0001]本发明涉及计算机技术领域, 具体为文章替换词推荐方法、 系统、 计算机可读介
质。
背景技术
[0002]用户在进行文章撰写的过程中, 为了保证文章质量与美观度, 需要对文章本身的
语句进行润色与加工, 从而提升文章的整体质量, 使 得通读更加顺畅, 一般的文件处理软件
都具备字句替换的功能, 输入目标字句, 在全文内进行提取, 并输入对应替换语句进行替
换;
[0003]但是, 文章词组的替换只能依靠用户手动进行编辑替换, 难以为用户提供多个推
荐替换词进行选择, 较为不便, 无法为用户提供辅助, 使得用户只能逐个进行查找, 较为麻
烦。
发明内容
[0004](一) 解决的技 术问题
[0005]针对现有技术所存在的上述缺点, 本发明提供了文章替换词推荐方法、 系统、 计算
机可读介质, 能够有效地解决现有技术文章词组的替换只能依靠用户手动进行编辑替换,
难以为用户提供多个推荐替换词进 行选择, 较为不便, 无法为用户提供辅助, 使得用户只能
逐个进行查找, 较为麻烦的问题。
[0006](二) 技术方案
[0007]为实现以上目的, 本发明通过以下技 术方案予以实现:
[0008]本发明公开了文章 替换词推荐方法, 包括以下步骤:
[0009]Step1: 采集网络词组, 导入数据库内, 进行保存分类;
[0010]Step2: 导入文章至程序内扫描, 提取文章中的词组, 进行一次标记;
[0011]Step3: 参照数据库词组信息, 针对标记词组, 生成第一候选同义词、 第二候选同义
词和第三 候选同义词;
[0012]Step4: 用户选择被一次标记的词组, 进行手动二次标记;
[0013]Step5: 显示出二次标记词组推荐的候选替换词, 将原词组作为第一选择进行排
列;
[0014]Step6: 采集用户二次标记的词组前后字句, 进行分析处理, 对语义契合度最高的
词组进行三次标记, 作为推荐选择项;
[0015]Step7: 用户对原词组与候选替换词进行选择;
[0016]Step8: 选择完毕后, 检索文章相同段落, 进行同步 替换。
[0017]更进一步地, 所述步骤Step1中的词组分类的依据, 包括: 字节长度、 词组结构、 添
加时间、 词组类型。
[0018]更进一步地, 所述步骤2中的文章导入方式, 包括: 接入外部设备读取文档至数据说 明 书 1/5 页
3
CN 114298058 B
3
专利 文章替换词推荐方法、系统、计算机可读介质
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:00上传分享