(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210866318.2
(22)申请日 2022.07.22
(71)申请人 南京邮电大 学
地址 210003 江苏省南京市栖霞区文苑路9
号
(72)发明人 徐小龙 张梓铭
(74)专利代理 机构 南京纵横知识产权代理有限
公司 32224
专利代理师 严志平
(51)Int.Cl.
G06F 21/62(2013.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种用于智慧交通系统的轨迹数据隐私保
护方法及系统
(57)摘要
本发明公开了一种用于智慧交通系统的轨
迹数据隐私保护方法及系统, 所述方法包括: 获
取用户实时的真实轨迹数据集; 将所述真实轨迹
数据集载入预先构建并训练好的端到端深度学
习模型中生成合成轨迹数据集; 使用k ‑means聚
类算法基于欧氏距离对每一时间戳下所述合成
轨迹数据集的轨迹点进行聚类, 并将聚类后不同
时间戳下的轨迹簇心通过随机组合的方式生成
泛化轨迹; 对所述泛化轨迹的计数矩阵添加
Laplace噪声和一致性约束后得到噪声 量受限的
差分隐私计数矩阵并进行发布。 本发 明中的合成
轨迹数据集能够保证数据可用性与隐私性之间
的平衡, 轨迹发布数据满足差分隐私需求, 提供
了更加优 越的隐私保障。
权利要求书3页 说明书10页 附图2页
CN 115168900 A
2022.10.11
CN 115168900 A
1.一种用于智慧 交通系统的轨 迹数据隐私保护方法, 其特 征在于, 所述方法包括:
获取用户实时的真实轨 迹数据集;
将所述真实轨迹数据集载入预先构建并训练好的端到端深度学习模型中生成合成轨
迹数据集;
使用k‑means聚类算法基于欧氏距离对每一时间戳下所述合成轨迹数据集的轨迹点进
行聚类, 并将聚类后不同时间戳下的轨 迹簇心通过随机组合的方式生成泛化轨 迹;
对所述泛化轨迹的计数矩阵添加Laplace噪声和一致性约束后得到噪声量受限的差分
隐私计数矩阵并进行发布。
2.根据权利要求1所述的用于智慧交通系统的轨迹数据隐私保护方法, 其特征在于, 所
述端到端深度学习模型的训练过程包括以下步骤:
采集不同用户的历史真实轨 迹数据作为训练模型的原 始轨迹数据;
将所述原始轨迹数据通过质心标准化处理得到每个轨迹点的质心偏差坐标, 并获得编
码后的标准原 始轨迹;
通过线性整流 函数将每 个所述质心偏差坐标均处 理成64维向量;
利用64个LSTM Cell长短期记忆网络单元对所述64维 向量进行 时间序列预测来获取合
成轨迹数据, 并采用tanh双曲正切函数对所述合 成轨迹数据的质心偏 差坐标进 行解码并获
得解码后的合成轨 迹;
结合所述标准原 始轨迹通过轨 迹损失函数计算所述 合成轨迹的轨迹相似性损失值;
通过sigmod激活函数对所述轨迹相似性损失值进行二分类处理, 获得所述合成轨迹的
判别结果;
若所述判别结果为假, 则将所述原始轨迹数据重新输入模型进行重复训练, 并利用反
向传播算法解决模型优化问题来进行更新模型的网络参数, 直至判别结果为真时停止训
练, 将判别结果 为真的合成轨 迹输出形成合成轨 迹数据集。
3.根据权利要求2所述的用于智慧交通系统的轨迹数据隐私保护方法, 其特征在于, 所
述通过线性整流函数将 每个所述质心偏差坐标均处理成64 维向量之后还包括: 对所述向量
添加随机噪声, 使所述原 始轨迹中的每组向量都保持与最长 轨迹相同的长度。
4.根据权利要求2所述的用于智慧交通系统的轨迹数据隐私保护方法, 其特征在于, 结
合所述标准原 始轨迹通过轨 迹损失函数计算所述 合成轨迹的轨迹相似性损失的步骤 包括:
对所述合成轨迹进行质心标准化处理得到每个轨迹点的对应质心偏差坐标, 并获得编
码后的标准 合成轨迹;
通过线性整流函数将每个所述标准原始轨迹和所述标准合成轨迹的质心偏差坐标分
别处理成对应的64维向量;
结合两组所述对应的64维向量及轨迹损失函数, 通过公式(1)计算训练得到所述合成
轨迹的轨迹相似性损失值TL oss:
TLoss=α LBCE(lt,lp)+β LGPS(tt,tp) (1)
式中, lt和lp分别表示标准原始轨迹和标准合作轨迹轨的判别标签; tt和tp分别表示标
准原始轨迹和对应的标准合作轨迹轨的64维向量; LBCE表示二元交叉熵损失函数, LGPS表示
使用最小二乘 误差来衡量两条轨迹 之间的相似程度的损失函数; α和β 分别表 示LBCE和LGPS的
权重。权 利 要 求 书 1/3 页
2
CN 115168900 A
25.根据权利要求2所述的用于智慧交通系统的轨迹数据隐私保护方法, 其特征在于, 所
述通过线性整流 函数将每 个所述质心偏差坐标均处 理成64维向量的计算公式如下:
式中,
表示编号为i的轨迹点的64维向量, △lati,和△loni分别表示编号为i的轨
迹点的经度偏差和纬度偏差, fGPS表示线性整流函数, WGPS表示轨迹点i的质心偏差坐标( △
lati,△loni)的向量权 重。
6.根据权利要求5所述的用于智慧交通系统的轨迹数据隐私保护方法, 其特征在于, 所
述利用64个LSTMCell长短期记忆网络单元对所述64维向量进行时间序列预测来获取合成
轨迹数据的计算公式如下:
O=LSTM(T,Wlstm) (3)
式中: T={t1,t2,…,ti,…,tmaxlength}, T表示原始轨迹数据中所有轨迹点的坐标特征,
其中ti表示编号为i的轨迹点的64维向量, maxlength表示原始轨迹数据中单条轨迹的最长
长度; Wlstm表示输入的数据的权重矩阵; O表示合成轨迹数据, 其中O内包含的数据表示为O
={o1,o2,…,oi,…,omaxlength}, oi表示ti在经过LSTM处 理后的输出的坐标合成值。
7.根据权利要求6所述的用于智慧交通系统的轨迹数据隐私保护方法, 其特征在于, 所
述采用tanh双曲正切函数对所述 合成轨迹数据的质心偏差坐标进行解码的计算公式如下:
式中,
表示合成轨迹数据中轨迹点i的质心偏差坐标的解码坐标,
和
分别表示轨迹点i的经度 偏差和纬度 偏差; WdGPS表示坐标向量的解码矩阵权
重; DGPS为tanh双曲正切函数。
8.一种用于智慧 交通系统的轨 迹数据隐私保护系统, 其特 征在于, 所述系统包括:
获取模块, 用于获取用户实时的真实轨 迹数据集;
合成轨迹模块, 用于将所述真实轨迹数据集载入预先构建并训练好的端到端深度 学习
模型中生成合成轨 迹数据集;
聚类模块, 用于使用k ‑means聚类算法基于欧氏距离对每一时间戳下所述合成轨迹数
据集的轨迹点进 行聚类, 并将聚类后不同时间戳下的轨迹簇心 通过随机组合的方式生成泛
化轨迹;
加噪发布模块, 用于对所述泛化轨迹的计数矩阵添加Laplace噪声和一致性约束后得
到噪声量受限的差分隐私计数矩阵并进行发布。
9.根据权利要求8所述的用于智慧交通系统的轨迹数据隐私保护系统, 其特征在于, 所
述合成轨迹模块包括采集单元; 所述端到端深度学习模型包括轨迹生成器和轨迹辨别器;
所述轨迹生成器包括第一输入层、 第一嵌入层、 第一LSTM建模层、 第一输出层; 所述轨迹辨
别器包括第二输入层、 第二嵌入层、 第二 LSTM建模层、 第二输出层; 其中:
采集单元, 用于采集 不同用户的历史真实轨 迹数据作为训练模型的原 始轨迹数据;
第一输入层, 用于将所述原始轨迹数据通过质心标准化处理得到每个轨迹点的质心偏
差坐标, 并获得编码后的标准原 始轨迹;
第一嵌入层, 用于利用多层感知器MLP通过线性整流函数, 将每个所述质心偏差坐标均权 利 要 求 书 2/3 页
3
CN 115168900 A
3
专利 一种用于智慧交通系统的轨迹数据隐私保护方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:52上传分享