(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211166937.7
(22)申请日 2022.09.23
(71)申请人 国网冀北电力有限公司经济技 术研
究院
地址 100038 北京市海淀区羊坊店东路21
号中国煤地大厦
申请人 北京京研电力工程设计有限公司
(72)发明人 姜宇 吕科 王守鹏 许颖 陈蕾
李栋梁 赵旷怡 张岩 徐畅
张立斌 郭昊 谢景海 肖巍
敖翠玲 高杨 傅守强 牛东晓
席语莲 余敏 许芳 付玉红
孙密
(74)专利代理 机构 重庆百润洪知识产权代理有
限公司 5 0219
专利代理师 刘泽正(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 10/06(2012.01)
G06Q 50/06(2012.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06N 20/00(2019.01)
(54)发明名称
一种基于变电工程关键影响因素筛选的造
价预测方法
(57)摘要
本发明涉及程序 代码开发技术领域, 公开了
一种基于变电工程关键影响因素筛选的造价预
测方法, 本发 明通过收集已完成修编的冀北变电
站典型设计方案的施工图、 施工图预算、 工程量
清单成果。 分析收集的数据, 将引 起静态投资变
化的因素整理建立输一个影 响因素指标库, 采用
随机森林算法进一步筛选。 通过计算各个特征重
要性, 选取指数较高的指标作为其中的主要影 响
因素。 依据随机森林算法筛选出的n个主要影响
因素, 作为BP神经网络输入层节点数。 采用遗传
算法优化下BP神经网络模型对变电工程造价中
的静态投资进行预测。 本发明筛选出的重要关键
指标, 使得预测更加有效、 可把握。 比普通的BP神
经预测更为 准确、 减小了误差 。
权利要求书3页 说明书8页 附图3页
CN 115526393 A
2022.12.27
CN 115526393 A
1.一种基于变电工程关键影响因素筛选的造价预测方法, 其特征在于: 具体按以下步
骤执行:
S1: 通过采集已完成修编的变电站的施 工图、 施工图预算、 工程量清单成果, 通过随机森
林筛选关键影响因素指标, 进行建立数据库;
S1.1: 从原始数据集中每抽取一个样本后再将它放回总体, 来进行样本的随机抽取形成
子数据集;
S1.2: 设一个子数据集有X个属性, 在决策树的每个节点 需要分裂时, 从这些属性中随机
抽选出Y个属性(Y<X),再从Y个属性中选择一个作为该节点的分裂属性,不 断重复, 直到不
能够再分裂为止;
S1.3: 重复步骤S1.1‑S1.2来构建大量的子决策树, 这些子决策树 就会构成随机森林;
S1.4: 步骤S1.1中有放回的抽样方式会导致有部分样本未没有参与决策树的建立, 未被
采集的的样 本为袋外数据, 选择袋外数据X(x1, x2, ..., xn), 对随机森 林中已经生 成的每一
棵决策树的模型性能进行测试计算出袋外数据误差率, 记为O OBerror1; 具体如式(1) ‑式(2);
S1.5: 对袋外数据全部样本的特征T(t1, t2, ..., tm)加入噪声干扰, 生成全新的数据集,
重新计算袋外数据误差率; 记为O OBerror2; 如式(3) ‑式(4)
式中, g2, g3, ..., gi是没有抽到的袋外数据特 征中加入噪声的数据, N 为样本总数;
S1.6: 特征Ti这一棵决策树上的重要性程度是OBBerror2-OBBerror1, 随机森林中包含N棵决
策树, 特征Ti在随机森林模型中的重要程度如式(5);
式中, N为决策树的个数, m为特征个数, OBBerror1为未加入噪声前袋外误差, OBBerror2为为
在特征中加入噪声后的袋外误差;
S1.7: 在得到的重要程度结果中选择靠前的8个指标作为关键影响因素;
S2: 通过遗传 BP神经网络进行造价预测;
S2.1: 进行数据划分与预处理; 将筛选出的关键影响因素后的数据作为样本数据集, 并
将该样本数据集划分为训练集和 测试集;
S2.2: 进行造价预测参数设置;
S2.3: 确定最佳隐藏节点;
S2.4: 进行编码与种群初始化;
S2.5: 根据初始化个体得到网络的初始权阈值, 用训练数据训练网络后得到预测输出,
把预测输出与实际输出之间的均方误差作为个 体适应度评估值; 如式(6);权 利 要 求 书 1/3 页
2
CN 115526393 A
2式中, n为输入样本的数量; yi为网络的预测输出; oi为实际输出, mse表示均方误差函
数;
S2.6: 基于适应度比例选择操作方式, 个 体i的选择概 率如式(7);
式中Fi为第i个个体的适应度值, k 为系数, N 为种群个体数目;
S2.7: 进行交叉操作, 把两个原始个体的部分部位相互交换的方式生成一个新的个体,
第k个染色体a(k)与第l个染色体a(l)在j位的交叉 方法, 如式(8),
其中b为[0, 1]间的随机数;
S2.8: 进行变异操作, 选取第i个个体的第j个基因aij进行变异, 对于二进制 编码方式, 具
体操作是将0变成1或1变成0;
S2.9: 重复步骤S2.4‑S2.7, 直到达到进化次数, 将优化得到的初始权值和阈值带到BP网络
中训练, 进 而用来预测, 训练过程中, 误差R的计算公式如式(9):
Ri=|Mi‑Ni| 式(9)
其中M为期望输出值, N为预测输出值差, 目标最大误差值为R0, 当maxRi≥R0, 时,代表未达
到精度期望, 则继续训练, 直到满足误差标准或者达 到训练迭代次数才终止训练;
S2.10: 输出预测结果。
2.根据权利要求1所述的一种基于变电工程关键影响因素筛选的造价预测方法, 其特
征在于, 在步骤S2.1中, 消除各指标数据之间的数量级与量纲差异, 首先进 行归一化处理, 通
过公式
将原始各项指标数据归一化至区间[a, b]上, 本次采取[0,
1]归一化。 其中x ’表示归一化处理后的各维数据, x表示原始各维数据, xmax和xmin表示各维
数据的最大值与最小值。
3.根据权利要求1所述的一种基于变电工程关键影响因素筛选的造价预测方法, 其特
征在于, 在步骤S2.2中, 输入层节 点数为8, 分别对应评价系统中的8个指标变量, 输出层节 点
数为1, 数值为静态投资, 隐藏层数为1, 节点数根据公式
其中m为输入层节点数, n
为输出层节点数, a为1 ‑10之间的一个常数, 最佳隐含层的节点数 目介于4‑13之间, BP神经
网络设置训练次数为1000, 学习速率为0.01, 目标最小误差为0.001, 遗传算法设置初始种
群规模为30, 最大进化代数为100, 交叉概率为0.8, 变异概率为0.2,训练次数为1000, 学习
速率为0.01, 目标最小误差为0.0 01。
4.根据权利要求1所述的一种基于变电工程关键影响因素筛选的造价预测方法, 其特
征在于, 在步骤S2.3中, 具体通过尝试隐藏层节点数, 计算均方误差, 通过最小均方误差, 确权 利 要 求 书 2/3 页
3
CN 115526393 A
3
专利 一种基于变电工程关键影响因素筛选的造价预测方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:26:02上传分享