(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211115412.0 (22)申请日 2022.09.14 (71)申请人 华东师范大学 地址 200241 上海市闵行区东川路5 00号 (72)发明人 林欣 高桢 高敬宜  (74)专利代理 机构 上海蓝迪专利商标事务所 (普通合伙) 31215 专利代理师 徐筱梅 张翔 (51)Int.Cl. G06Q 40/04(2012.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于图神经网络的异常虚拟币钱包地址检 测方法 (57)摘要 本发明公开了一种基于图神经网络的异常 虚拟币钱包地址检测方法, 方法包括: 1) 处理虚 拟币历史交易数据; 2) 基于一批异常虚拟币钱包 地址构建虚拟币交易异常检测网络; 3) 为虚拟币 交易异常检测网络中每个钱包地址添加特征; 4) 构建基于图神经网络的分类模型, 在虚拟币交易 异常检测网络上训练模型, 并预测未发现的异常 虚拟币钱包地址。 整个方法架构有五层, 该方法 能够根据已有的若干异常虚拟币钱包地址, 建立 虚拟币交易异常检测网络, 通过训练由多层感知 器MLP、 图卷积神经网络GCN、 图注意力网络GAT组 成的图神经网络分类模型, 挖掘出更为隐蔽的异 常虚拟币钱 包地址。 权利要求书3页 说明书6页 附图3页 CN 115375480 A 2022.11.22 CN 115375480 A 1.一种基于 图神经网络的异常虚拟币钱包地址检测方法, 其特征在于, 该方法包括以 下步骤: 步骤1: 从区块链公链上收集虚拟币的所有流水存入Elasticsearch交易流水库; 从区 块链浏览器上收集合约地址、 交易所大地址信息存入MySQL地址信息库; 将已有的异常虚拟 币钱包地址, 也存入MySQL地址信息库; 从交易所得到提币数据及交易所注册信息, 存入 MongoDB交易所数据信息库, 交易所注册信息包括用户的身份证号及手机号, 身份证号及手 机号作为敏感信息, 存 入交易所 数据信息库前 先使用SHA ‑256哈希加密进行脱敏处 理; 步骤2: 根据步骤1收集到的数据信息, 将若干异常虚拟币钱包地址为初始钱包地址节 点加入虚拟币交易异常检测网络中; 再从区块链上的虚拟币交易流水中找到初始钱包地址 节点的所有交易对手, 从 中选择出对手数小于10的个人钱包地址或匿名钱包地址添加至虚 拟币交易异常检测网络中, 再去寻找 这些交易对手的对手, 循环往复, 直至将初始钱包地址 节点的十阶邻居添加至虚拟币交易异常检测网络中, 完成虚拟币交易异常检测网络的构 建; 步骤3: 结合步骤1得到的交易流水库, 计算出虚拟币交易异常检测网络中每个节点的 交易对手数、 交易金额、 交易时间及余 额信息, 作为虚拟币钱 包地址的交易特 征; 步骤4: 将虚拟币交易异常检测网络中的所有节点, 按照 60%、 20%、 20%划分为训练集、 验 证集、 测试集, 保证训练集、 验证集和测试集服 从同一数据分布; 采用MLP ‑GCN‑GAT模型在虚 拟币交易异常检测网络上进行半监督节点分类任务, 输出异常概率最高且仍未被发现的钱 包地址以及对应的异常概 率。 2.根据权利要求1所述基于图神经网络的异常虚拟币钱包地址检测方法, 其特征在于, 所述步骤1具体包括: 步骤1.1: 将已有的异常虚拟币钱包 地址以集合形式存储, 记作 S0; 加载交易所数据信息 库中的提币信息, 将其以键值对形式存储, 记作Mdraw, 键为脱敏后的身份证号, 值为该身份 证号所属人发起过提币操作的对手钱 包地址集 合; 步骤1.2: 读取交易所注册信息, 同样以键值对形式存储, 记作Mregister, 键为脱敏后的身 份证号, 值为该身份 证号所属人交易所 里注册的所有虚拟币钱 包地址集 合; 步骤1.3: 从地址信息库中得到异常钱包地址、 合约地址、 交易所大地址列表, 将这些数 据以键值对形式存储, 记作Mlabel, 用于判断钱包地址的标签; 键为钱包地址, 值为地址的标 签, 标签类型有异常地址、 合约地址、 交易所大地址及无标签四种, 其中无标签类型为不属 于异常地址、 合约地址、 交易所 大地址这 三种类型的其 他所有钱 包地址的标签。 3.根据权利要求1基于图神经网络的异常虚拟币钱包地址检测方法, 其特征在于, 所述 步骤2具体包括: 步骤2.1: 在公链上查询集合S0中每个钱包地址的对手, 用步骤1.3得到的键值对Mlabel 判断对手的标签是否为合约地址和交易所大地址, 如果对手标签为合约地址或者交易所大 地址, 则忽略这个对手; 否则就将这个对手和钱包地址之间连一条边, 称为原始交易边; 如 果该对手不在集合S0中, 即标签不为异常地址, 就将该对手加入集合S1, 集合S1即为集合S0 中所有钱 包地址一阶新增邻居的集 合; 步骤2.2: 根据步骤1得到的交易流水库, 查询集合S1中每个钱包 地址的出项对手数和入 项对手数, 将出项对手数和入项对手数均小于10的钱包地址作为有效钱包地址, 拓展出集权 利 要 求 书 1/3 页 2 CN 115375480 A 2合S1的一阶新增邻居; 然后在交易流水库上查询每个有效钱包地址的对手, 用步骤1.3得到 的键值对 Mlabel判断对手的标签是否 为合约地址和交易 所大地址, 如果对手标签 为合约地址 或者交易所大地址, 则忽略这个对手; 否则就将这个对手和有效钱包地址 之间连一条边, 同 样称为原始交易边; 如果该对手既不在集合S0中也不在集合S1中, 就将该对手加入集合S2, 集合S2即为集合S1中所有钱包地址一阶新增邻居的集合, 也是集合S0的二阶新增邻居的集 合; 步骤2.3: 重复步骤2.2, 直到 得到集合S10, 即集合S0的十阶新增邻居的集合; 将集合S0到 S10的所有节点合并到一个大集合S中, 集合S代表所有异常钱包地址十阶内的所有新增邻 居; 步骤2.4: 遍历步骤1.1得到的键值对Mdraw, 其每个键Kdraw代表一个脱敏后的身份证号, 值Vdraw代表Kdraw所属人发起过提币操作的对手钱包地址集合; 找到既在集合Vdraw, 又在集合 S中的钱包地址, 将这些钱包地址集合记作Sdraw, 再通过步骤1.2得到的键值对Mregister, 找到 键Kdraw注册过的所有虚拟币钱包地址Vregister, 既在集合Vregister中, 又在集合S中的钱包地 址, 将这些钱包地址集合记作Sregister; 将集合Sdraw和集合Sregister中的每个钱包地址两两之 间添加一条边, 代 表实际发生的, 却未在区块链公链流水 上体现出来的交易关系; 步骤2.5: 遍历步骤1.2得到的键值对Mregister, 其每个键Kregister代表一个脱敏后的身份 证号, 值Vregister代表键Kregister所属人在交易所里注册的所有虚拟币钱包地址集合; 找到既 在集合Vregister中, 又在集合S中的钱包地址, 将这些钱包地址两两之间添加一条边, 代表这 些钱包地址同属于一个人, 它们之间被认为发生了交易, 却 不会在区块链公链流水上体现 出来; 步骤2.6: 找到集合S中所有节点组成的最大连通子图, 作为最终得到的虚拟币交易异 常检测网络, 记作G=(N,E), N代表虚拟币交易异常检测网络中的钱包地址节 点, E代表钱包 地址之间的关联边。 4.根据权利要求1所述基于图神经网络的异常虚拟币钱包地址检测方法, 其特征在于, 所述步骤3具体包括: 对于步骤2.6得到的虚拟币交易异常检测网络G=(N,E)中的所有钱包地址节点N, 根据 交易流水库中的信息, 提取出它们的19维特征, 分别是每个钱包地址的总交易次数、 转入交 易次数、 转出 交易次数、 转入转出 交易总额、 转入交易总额、 转出 交易总额、 最近一次交易时 间、 第一次交易时间、 当前余额、 转入转出交易次数比率、 转入转出 交易总金额比率、 转入对 手数、 转出对手数、 转入转出对手数比率、 历史最大余额、 历史最大余额出现日期、 历史最大 余额持续 天数、 钱包地址使用持续天数及历史最大余额持续 天数占钱包地址使用持续天数 的比率, 并对19维特 征进行最大值 最小值归一 化。 5.根据权利要求1所述基于图神经网络的异常虚拟币钱包地址检测方法, 其特征在于, 所述步骤4具体包括: 步骤4.1: 构建MLP ‑GCN‑GAT模型, 模型由两层多层感知器MLP、 一层图卷积神经网络GCN 和一层图注意力网络GAT组成; 首先使用多层感知器MLP模块对数据集进行特征过滤, 剔除 影响力小的数据; 然后利用图卷积神经网络 GCN模块对图数据的处理 能力进行特征提取; 之 后通过MLP模块重新对数据进 行学习, 以保证数据被充分利用; 再将数据导入图注意力网络 GAT模块以提高对图数据的提取精度; 最后通过线性层对是否异常进行划分;权 利 要 求 书 2/3 页 3 CN 115375480 A 3

.PDF文档 专利 基于图神经网络的异常虚拟币钱包地址检测方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于图神经网络的异常虚拟币钱包地址检测方法 第 1 页 专利 基于图神经网络的异常虚拟币钱包地址检测方法 第 2 页 专利 基于图神经网络的异常虚拟币钱包地址检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:42:26上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。