(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211139933.X
(22)申请日 2022.09.19
(65)同一申请的已公布的文献号
申请公布号 CN 115271255 A
(43)申请公布日 2022.11.01
(73)专利权人 长江水利委员会水文局
地址 430010 湖北省武汉市江岸区永清街
道解放大道186 3号
(72)发明人 陈瑜彬 郑静 冯宝飞 张潇
李洁 杨雁飞 田逸飞 曾明
张晶 任玉峰 秦昊 邢雯慧
张莉 顾丽 严方家
(74)专利代理 机构 北京中先生知识产权代理事
务所(普通 合伙) 16063
专利代理师 窦贤宇(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 10/06(2012.01)
G06Q 50/26(2012.01)
G06N 20/00(2019.01)
(56)对比文件
CN 110929956 A,2020.0 3.27
CN 113378484 A,2021.09.10
CN 110728409 A,2020.01.24
CN 114240106 A,2022.03.25
CN 10749190 3 A,2017.12.19
审查员 刘畅
(54)发明名称
基于知识图谱和机器学习的雨洪相似性分
析方法和系统
(57)摘要
本申请公开了一种基于知识图谱和机器学
习的雨洪相似性分析方法和系统, 通过对独立性
检验后的暴雨特征指标集和洪水特征指标集进
行主成分分析和聚类分析, 获得暴雨聚类集合与
洪水聚类集合, 以及暴雨聚类集合中每一暴雨聚
类与洪水聚类结合中每一洪水聚类的映射关系,
形成暴雨聚类与洪水聚类之间的经验概率定量
匹配关系; 结合知识图谱和机器学习的相关技
术, 将待检雨洪过程数据输入雨洪推荐模块, 获
得若干组历史上的相似雨洪过程数据; 将相似雨
洪过程数据分别输入雨洪关系知识图谱, 给出相
似度数值, 并对相似度数值进行降序排列。 本申
请大大提高了预测的效率和精确度, 解决了机器
学习对多样 本多特征处理处理的局限, 以及有效
性分析薄弱的问题。
权利要求书3页 说明书13页 附图4页
CN 115271255 B
2022.12.09
CN 115271255 B
1.基于知识图谱和机器学习的雨洪相似性分析 方法, 其特 征在于, 包括如下步骤:
S1、 采集研究区域的降雨数据和洪水数据, 从所述降雨数据中提取暴雨样本, 从洪水数
据中提取洪水样本;
S2、 针对所述暴雨样本, 构建天气成因指标集和暴雨特征指标集; 针对所述洪水样本,
构建洪水特征指标集; 分别对所述暴雨特征指标集和洪水特征指标集中的各个指标进 行关
联性分析, 进行指标独立 性检验;
S3、 分别对独立性检验后的暴雨特征指标集和洪水特征指标集进行主成分分析和聚类
分析, 获得暴雨聚类集合与洪水聚类集合, 以及暴雨聚类集合中每一暴雨聚类与洪水聚类
集合中每一洪水聚类的映射关系, 形成暴雨聚类与洪水聚类之间的经验概率定量匹配关
系;
S4、 将所述天气成因指标集、 暴雨特征指标集和洪水特征指标集中的各个指标分为结
构化数据、 非结构化数据和半结构化数据, 并抽取各个指标的属性, 按照雨洪发展关系, 抽
取天气成因、 暴雨过程和洪水过程的时间顺序关系、 空间从属关系和成因关系; 构建雨洪关
系知识图谱;
S5、 构建降雨洪水训练集和雨洪推荐模块, 采用基于视觉特征和雨量集成的相似分析
方法对雨洪推荐模块进 行训练, 在训练完成后, 将待检雨洪过程数据输入雨洪推荐模块, 获
得若干组历史上 的相似雨洪过程数据; 将相似雨洪过程数据分别输入雨洪关系知识图谱,
给出相似度数值, 并对相似度数值进行降序排列;
所述步骤S5中基于视觉特征和雨量集成的相似方法对雨洪推荐模块进行训练的过程
具体为:
步骤S51、 读取雨洪过程数据, 其中包括降雨分布图; 并计算每一行和每一列的颜色数
值总和;
步骤S52、 通过滑动窗口法查找所述降雨分布图的边缘, 判断是否存在两个以上的降雨
区域, 若存在, 分别计算每一降雨区域边缘的横坐标平均值和纵坐标平均值, 作为降雨中心
的坐标; 并计算相邻降雨区域的降雨中心距离; 若不存在, 计算降雨区域的降雨中心, 以及
降雨中心到该降雨区域 边缘各个像素点的距离平均值, 即为降雨半径;
步骤S53、 逐次计算每一降雨区域内的所有像素点的颜色数值总和, 并降序排列; 将颜
色数值最大的降雨区域标记为主降雨区域, 将除主降雨区域外的降雨区域标记为次降雨区
域;
步骤S54、 在每个降雨过程中, 基于每一时刻的降雨分布图中的降雨中心位置坐标和半
径构建降雨中心 移动矢量图;
步骤S55、 在接收到待比较的另一降雨过程数据时, 采用步骤S51至步骤S54的方法获得
降雨中心 移动矢量图; 分别比较主降雨区域和次降雨区域的中心 移动矢量图的相似度。
2.如权利要求1所述的基于知识图谱和机器学习的雨洪相似性分析方法, 其特征在于,
所述步骤S1中,
从降雨数据中提取暴 雨样本的过程具体为:
S11、 某日内, 若研究区域范围中超过预定比例的雨量站发生暴雨, 则该日为区域暴雨
日; 连续出现区域暴雨日的总天数称为区域暴雨过程日数N; 当N等于1时, 称为非持续性区
域暴雨过程; 当N大于等于2时, 称为持续 性区域暴雨过程;权 利 要 求 书 1/3 页
2
CN 115271255 B
2S12、 将所述持续 性区域暴雨过程和非持续 性区域暴雨过程作为 暴雨样本;
从洪水数据中提取洪水样本的过程具体为:
S13、 根据研究区域的洪水情况, 设定研究区域内各个站点的洪峰阈值;
S14、 依序筛 选出各个站点的洪峰, 并判断相邻的洪峰是否独立;
S15、 针对所有洪峰点, 向前后分别搜索洪水的起始时间和结束时间, 计算洪水 过程;
S16、 基于所述洪水 过程, 获得洪水样本 。
3.如权利要求2所述的基于知识图谱和机器学习的雨洪相似性分析方法, 其特征在于,
判断相邻洪峰是否独立的方法如下:
;
式中,θ指两个连续洪峰间的间隔时间; A为研究区域面积, Q1和Q2分别是两个连续洪峰
的流量;Xmin指的是两个洪峰间最小的流 量值;
向前后分别搜索洪水的起始时间的过程如下:
起始时间判别方法如下:
;
;
Qp是洪峰点的流量值; Qs是洪水开始点的流量值; Tp是洪峰点的出现时间; Ts是洪水开
始点的时间; a和b是常数, a的范围是 (0, 1) , b的范围是 (1, 2) 。
4.如权利要求1所述的基于知识图谱和机器学习的雨洪相似性分析方法, 其特征在于,
步骤S2中, 所述天气成因指标集包括月尺度 的气候背景指标集和日尺度 的天气系统指标
集; 所述暴雨特征指标集包括极端性指标集、 强度指标集、 雨量指标集、 时间指标集和空间
指标集; 所述洪水特征指标集包括洪量指标集、 洪峰指标集、 涨落率指标集、 幅度指标集和
形态指标集。
5.如权利要求1至4任一项所述的基于知识图谱和机器学习的雨洪相似性分析方法, 其
特征在于, 所述 步骤S1还 包括:
S17、 按照研究区域的水系分布特征, 将研究区域分成至少两个子区域; 分析各个子区
域的分区降雨分布;
S18、 基于所述暴雨特征指标集和洪水特征指标集各自分析各个子区域的暴雨季节变
化特征及洪水演 变特征; 针对预定的洪水特征指标, 采集若干时间点的测量数据, 形成该指
标的时间序列, 计算测量数据的方差和检验统计量, 并将所述检验统计量标准化, 根据显著
性水平, 确定标准 化检验统计量的阈值, 判断是否具有趋势变化。
6.如权利要求5所述的基于知识图谱和机器学习的雨洪相似性分析方法, 其特征在于,
还包括步骤S19、 判断洪水 特征指标的测量数据是否存在突变;
S19a、 将洪水 特征指标形成的时间序列逆序排列, 得到时间逆序列;
S19b、 分别计算洪水特征指标的时间序列和时间逆序列的秩序列, 并计算均值和方差,
基于所述秩序列、 均值和方差, 计算统计量;
S19c、 查找时间序列的统计量与时间逆序列统计量之和为零的点, 获得交点, 并筛选时
间序列统计量绝对值大于阈值的点集, 构成置信区间; 将位于置信区间内的交点标记为突
变点。权 利 要 求 书 2/3 页
3
CN 115271255 B
3
专利 基于知识图谱和机器学习的雨洪相似性分析方法和系统
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:26:28上传分享