Conformal detection algorithm of anomalous behaviors of vessel
-
摘要: 为了准确检测船舶的操纵异常行为和降低异常行为误报警率, 提出了船舶异常行为的一致性检测算法; 在船舶轨迹点中引入能够体现操纵模式的特征, 以转向行为与变速行为度量了操纵行为相似性; 将空间位置相似性与操纵行为相似性进行组合, 定义了船舶综合行为相似性, 计算了单个轨迹点与训练轨迹序列中的最近邻特征点, 构建了一致性检测的样本序列; 为克服样本重叠的类分布情形, 改进了一致性检测算法的奇异值度量, 并用综合行为相似性计算样本间的非一致性得分, 利用单个轨迹点的随机性检验值判断该轨迹点与样本序列的分布一致性; 以琼州海峡实测AIS数据作为正常数据, 以计算机模拟随机产生异常轨迹和人工自定义操纵异常行为作为异常数据, 分别进行异常检测试验。试验结果表明: 随机产生的异常轨迹检测正确率为100%, 但是轨迹评价集中有一部分正常轨迹被错误划分成异常轨迹, 在指定置信度水平分别为99.0%和99.7%的情形下, 误报警率分别为0.6%和0.2%, 分别低于显著性水平0.01和0.003, 因此, 利用一致性检测算法能有效检测计算机产生的随机异常轨迹, 并可通过指定显著性水平严格控制检测误报警率, 能有效检测人工自定义的船舶变速与转向异常行为, 而且检测结果能随船舶行为改变而变化。Abstract: In order to accurately detect the anomalous maneuvering behaviors of ship and reduce the false alarm rate of anomalous behaviors, a conformal detection algorithm of anomalous behaviors was proposed.Some characteristics was introduced into the trajectory points of ship to reflect the maneuvering modes, and the similarity of maneuvering behavior was measured through altering course behavior and speed-changing behavior.The integrated behavior similarity of ship was defined by combining the spatial location similarity and the maneuvering behavior similarity, the nearest neighbor feature points of single track points on training trajectory sequence were calculated, and the conformal detection sample sequence was constructed.In order to overcome the sample overlapping situation of class distribution, the singular value measure of conformal detection algorithm was improved, the nonconformance score between the samples was calculated by the integrated behavior similarity, and the randomness test value of single track point wasused to determine the distribution conformance of trajectory point and sample sequence.The real AIS data of Qiongzhou Strait were taken as the normal data, the random anomalous trajectories were simulated by the computer, the artificial abnormal maneuvering behaviors were defined, and the abnormal detection tests were carried out.Experimental result shows that the detecting accuracy rate of random anomalous behaviors is 100%, but a part of normal trajectories in the set of evaluation trajectories are divided into anomalous trajectories by mistake.When the confidence levels are 99.0% and 99.7%, respectively, the false alarm rates are 0.6% and 0.2%, respectively, and less than the significance levels of 0.01 and 0.003, respectively.Therefore, the algorithm can effectively detect the random abnormal trajectory generated by the computer, strictly control the false alarm rate by using designated significance level, and detect artificial changing speed and altering course abnormal behaviors, and the test result changes with the change of ship behavior.
-
Key words:
- ship engineering /
- trajectory /
- AIS data /
- anomalous behavior /
- anomalous detection /
- conformal detection
-
0. 引言
随着AIS设备的强制安装, 能够获取大量与船舶行为相关的数据。船舶发送的AIS信息包括位置、速度、船艏向、对地航向、目的地和船舶识别码等。尽管AIS系统主要用途在于保障航行安全和避免碰撞, 但也是海事监控的主要数据来源。在海事监控中, 可以利用这些数据发现安全风险和非法活动[1-4], 因此, 探寻利用海量AIS数据的最佳方式和鉴别船舶异常行为方法, 改进海事领域的情景意识[5-6]已经成为海上交通工程的研究热点。
船舶异常行为指的是与所期望的船舶活动相偏离的行为, 即与船舶群体运动总体行为相偏离的行为。通常包括船舶非正常偏离航道、航向, 突然加速、减速, 出现在不该进入的区域等。而船舶异常行为检测是从船舶轨迹历史记录提取出船舶运动总体的宏观行为特征, 依此找出与总体特征差异较大的个体行为[7]。船舶异常行为往往能够预示一些危害事件, 如毒品走私、军火交易、人员偷渡和海盗袭击[8]等, 因此, 进行船舶异常行为检测意义重大。
目前, 国内外一些学者对船舶异常行为检测进行了一定研究。异常行为检测分为模型驱动和数据驱动两大类。模型驱动方法需要对各种船舶异常行为进行签名模板, 通过签名比对发现已知的和可定义的异常, 其过分依赖专家知识, 模型中定义的异常行为模板限制了所能辨识的异常行为类型; 而数据驱动方法用于发现新的、未知和难以定义的异常[9-11], 基于数据驱动的算法克服了模型驱动的不足, 具有适用环境广、检测实时性好、识别未知异常能力强等优势, 已经成为研究重点[12-13]。其中国内外学者采用轨迹聚类方法从AIS数据中学习典型运动模式。肖潇等采用DBSCAN算法进行轨迹聚类[14]; 马文耀等采用谱聚类算法得到船舶运动模式[15]; 甄荣等运用最小二乘法对船舶历史轨迹点进行曲线拟合, 得到船舶的典型航迹, 以此作为参考, 将偏离典型轨迹95%置信区间的船舶行为识别为异常[16]; Laxhammar采用混合高斯模型(Gaussian Mixture Modal, GMM) 对正常船舶轨迹点的位置和速度特征建模[11], 假定正常运动的船舶轨迹点服从混合高斯分布, 则处于低密度区的船舶的行为判定为异常, 但估计参数多; Ristic等采用核密度估计方法对正常船舶轨迹点的特征值建模[12], 处于低密度区域的船舶行为被认定为异常, 但计算量大; Lane等采用贝叶斯网络检测异常行为, 使用条件概率来度量船舶行为的正常程度, 贝叶斯网络表示因果关系, 容易理解, 但是需要相应的先验知识, 误报警率高[17-20]。
上述异常检测算法选取轨迹点特征中没有考虑船舶操纵行为, 导致操纵异常行为无法检测; 另外, 这些算法中设定参数多, 误报警率较高, 无法满足海事监管人员的应用要求。一致性预测是一种新的机器学习算法, 具有在线学习, 参数设置少、误报警率可控[21-23]等优点。基于此, 本文提出一种结合船舶操纵模式的基于一致性预测的船舶异常行为检测算法。
1. 一致性预测
一致性预测是一种新的机器学习算法, 利用已知类别标签和未知类别标签的样本之间的内在联系, 预测待测样本类别, 预测结果具有有效的置信度。当指定某个置信度水平, 如95%, 一致性预测器将输出预测集, 并能保证正确的类别出现在该预测集内的概率至少为95%。该算法仅需假设待测和训练样本满足独立同分布, 与传统的基于参数化模型的统计方法相比, 该算法的优势在于不需假定样本的潜在概率分布类型。
1.1 一致性预测器的特点
一致性预测器的最大特点为连续预测, 即对于增量式数据集预测, 每次预测结果的正确概率都大于或等于置信水平[21-25]。待测样本和训练样本的独立同分布假设使得一致性预测器适合在线学习和预测, 在线学习指的是把每次预测得到的观测样本的类别标签加入到训练集, 并用于下一次预测。
假设样本空间Z为: Z=XY; X为特征空间, Y为类别空间。已知训练样本集B={z1, …, zi, …, zn}, 其中样本zi= (xi, yi), 具有特征xi∈X和标签yi∈Y。给定待测样本z的特征x和预先定义的显著水平ε∈ (0, 1), 一致性预测器输出待测样本的标签y的预测域Γε⊆Y。在假设z1~zn满足独立同分布的前提下, 该预测域在指定的置信度水平有效, 即预测域中含有样本真标签的事件发生的概率大于或等于1-ε。
1.2 基于p值和奇异值度量的一致性预测
一致性预测的基本思想在于对待测样本所有可能的类别标签y∈Y进行随机性检验p值估计, 将p值低于显著水平ε的类别标签排除在预测集外。为了估计p值, 引入奇异值度量来衡量指定样本与训练样本集合的差异程度。奇异值度量为实函数A (B, z) 返回非一致性得分α, 表征待测样本z与训练样本集合B中样本间差异程度。
一致性预测算法的假设前提是训练集样本满足独立同分布条件。通过计算训练样本zi相对于训练样本集B的非一致性得分αi, 去检测zi与训练样本序列分布的不一致程度。
序列的随机性检验p值为由样本资料计算得出的概率, 该值表明检验样本序列符合独立同分布假设的水平。如果独立同分布序列中某样本的p值越大, 则表明该样本属于该序列的概率越大。对于具有n个元素的独立同分布的样本序列, 待测样本z的p值范围为[0, 1], 用来衡量标签y属于各个类别的可靠程度, 计算公式为
式中: Q (α|i > αi=1, …, n) 为满足αi > α条件的元素个数; τ是来自均匀分布的随机变量[25], 取值范围为[0, 1]。
一致性预测算法能根据样本序列中各样本之间的内在关系, 针对待测样本z, 给出该样本类别标签的预测域, 算法流程为: 初始设置预测域Γε为Φ; 对于每个y∈Y, 将y赋给待测样本x组成假设样本z= (x, y), 分别计算样本的奇异值αi=A (B, zi), i=1, …, n; 再由式(1) 计算出待测样本的随机性检验值p, 如果p > ε, 则标签y加入预测域Γnε中, A (B, zi) 为奇异值度量函数。
一致性预测根据从训练样本中获得的非一致性得分, 对任何测试样本提供一个有效的类标签输出集。对于待测样本(x, y), 假设类别标签为y, α比α1、…、αi、…、αn相对大一些, 因此, 一个小的随机性检验值p表示带有类别标签y的测试样本可能为异常。
2. 一致性异常检测
一旦指定了一致性检测器的奇异值度量函数A (B, z) 和异常门限值ε, 对于待测样本z, 一致性异常检测器将能判定z相对于训练样本集{z1, …, zn}是否为异常, 如果z所对应的随机检验值低于异常门限值ε, 则称z为显著性水平ε时一致性异常。
一致性异常的出现至少有3种情况: 第1种情况, 观测值可能是罕见的或以前未出现过的正常样本, 这种情况出现的概率为ε, 属于误报警; 第2种情况, 观测值不是由与训练数据相同的分布产生, 或者是一个真正的新颖数据; 第3种情况, 训练数据本身不是独立同分布。后2种情况可认为是一致性意义上的真正异常, 非独立同分布的训练集可能由不完整或有偏向的数据收集过程导致。在海上监控应用中, 如果训练集是上午10点到下午2点的记录数据, 检测清晨或傍晚时的正常行为, 也会被判定为异常, 另一个可能的原因是独立同分布训练集的概率分布实际上已经改变了。在海上监管的情况下, 新的交通管理规定可能会导致新的轨迹出现, 如果误报警急剧恶化, 那么可以肯定常态行为的分布已经发生了变化。
2.1 奇异值度量
Vovk等提出了计算样本非一致性得分的奇异值度量[21]为
式中: di+为从z到B中第i个同类样本的最短距离; dj-为从z到B中第j个异类样本的最短距离; k为z的最近邻样本个数。
式(2) 对于完全可分的样本效果较好, 但是对于异常检测, 它不是最优的。如图 1所示, 假设具有高密度的2类分布点在特征空间内重叠, 从点L (样本) 考虑, 无论点L属于哪一类, 它到其他最近的每一类样本距离都近似相等, 根据式(2), 图 1中点L的非一致性得分为1。从远离这两类分布的点J考虑, 点J的非一致性得分也近似为1, 这说明在重叠的高密度区域的可预测的正常点和明显偏离分布的异常点具有相同的p值。
本文针对部分重叠的类分布情形, 提出一种改进的奇异值度量, 对远离所有已知类别的异常点更加敏感, 为
3. 船舶轨迹中的一致性异常检测
本文构建一致性异常检测器, 通过学习历史的船舶AIS轨迹, 得到轨迹点训练样本集合, 并获得各轨迹点(样本) 的非一致性得分, 当检测器接收到新观测轨迹点(待测样本), 它将判断新观测轨迹点是否与轨迹点训练样本的分布一致, 不一致则为异常。
3.1 轨迹数据的特征空间
船舶轨迹数据通常来自AIS接收机, 可以获得船舶的位置和当前瞬时速度。目前, 检测算法中基于点的位置-速度特征模型算法只考虑了船舶运动的瞬时状态, 检测异常类型受限, 本文引入能够体现操纵模式的特征, 即当前点与前后连接轨迹点的运动关系。船舶操纵行为又称为机动行为, 是船舶的运动过程, 体现为船舶变速、转向或两者组合运动。运动轨迹中每3个相邻的轨迹点就构成了一个运动过程, 即每3个轨迹点蕴涵1个船舶操纵行为事件。通过等时间间隔采样的相邻3个轨迹点, 可以描述该运动过程中船舶操纵行为。图 2中当前时刻t的轨迹点Pl与前后相邻的点Pl-1和Pl+1的采样时间间隔为Δt, 用Vinl表示轨迹段Pl-1Pl的矢量速度, 将其定义为点Pl的驶入速度; 用Voutl表示轨迹段PlPl+1的矢量速度, 将其定义为点Pl的驶出速度。由于船舶运动速度相对较小, 当Δt较小时, 点Pl的Vinl、Voutl能准确描述船舶在时间段[t-Δt, t+Δt]内的运动过程。点Pl的Vinl和Voutl求解式分别为
图 2 (b)中船舶以速度V航行, N为真北方向; C为航向, 即船舶运动方向与真北方向的夹角。航海上, V可用C和航速S表示, S为
本文采用基于轨迹点的检测方法, 轨迹点对应于样本, 为了检测船舶操纵行为上的异常, 轨迹点z的特征向量为x表示为
式中: λ、γ分别为轨迹点的经度和纬度; Sin、Cin分别为轨迹点的驶入速度和驶入航向; Sout、Cout分别为轨迹点的驶出速度和驶出航向。
对这6个特征进行归一化, 特征的取值范围为[-1, 1]。
3.2 操纵行为相似性度量
船舶操纵行为相似性指在某个运动过程中船舶机动行为的相似程度。当前时刻t的轨迹点的驶入和驶出速度分别表征船舶在[t-Δt, t]和[t, t+Δt]内的运动状态, 它们描述轨迹点前后Δt的船舶运动过程与操纵行为。采样间隔相同的轨迹, 如果轨迹点训练样本zi与待测轨迹点z的驶入速度和驶出速度分别相似, 则可认为船舶在当前轨迹点所在时刻前后Δt时间段内, 船舶运动相似, 即操纵行为相似。
操纵行为包括转向行为和变速行为, 因此, 操纵行为相似性可用转向行为相似性和变速行为相似性的组合来度量。
3.2.1 转向行为相似性
轨迹点z和zi的运动速度V和Vi之间的夹角越小, 表示运动方向越相近, 因此, 速度矢量间角度相似性d (V, Vi) 可用余弦距离来度量, 该度量取值范围为[0, 2], 矢量方向如果完全相同, 距离度量的结果为0, 如果方向完全相反, 则结果为2, 公式为
为了描述运动对象在点zi所在时刻t的前Δt时间段内与后Δt时间段内, 2个航段内航向变化的大小, 定义了轨迹点zi的转向幅度, 并用该点的驶出与驶入航向的差ΔCi表示
式中: Cini、Couti分别为轨迹点zi的驶入与驶出航向。
如果ΔCi > 0, 则表示运动对象向右转向; 否则, 运动对象向左转向。
转向幅度差Δφi比较的是轨迹点z和zi的转向幅度的差异
式中: ΔC为轨迹点z的转向幅度。
如果轨迹点z和zi的驶入方向相近并且转向幅度差非常小, 则可认为点z和zi的前后Δt时段内转向行为相似。转向行为相似性dti用z的驶入速度矢量Vin和zi的驶入速度矢量Vini角度相似性与转向幅度差的组合来度量
式中: ω1为轨迹点z和zi的驶入速度矢量的角度相似性的权重; ω2为轨迹点z和zi的转向幅度差的权重。
3.2.2 变速行为相似性
ΔSini表示轨迹点z和zin的驶入速度大小差值的绝对值, 该值越小则表示轨迹点z和zin的驶入速度数值越相近
式中: Sini为轨迹点zi的驶入速度。
为了描述运动对象在轨迹点zi处的速度变化, 定义轨迹点zi的变速幅度ΔSi为
式中: Souti为轨迹点zi的驶出速度。
如果ΔSi > 0, 则表示运动对象做加速运动; 否则, 运动对象做减速运动。
变速幅度差Δϕ摘璱表示轨迹点z和zi的变速幅度的差异性
式中: ΔS为轨迹点z的变速幅度。
如果轨迹点z和zi的驶入速度相近并且变速幅度差非常小, 则可认为z和zi的各自前后Δt时段内变速行为相似。变速行为相似性dsi用轨迹点z和zi的驶入速度差ΔSini和变速幅度差Δϕ摘璱度量
式中: ω3为轨迹点z和zi驶入速度差的权重; ω4为轨迹点z和zi变速幅度差的权重。
3.2.3 操纵行为相似性
轨迹点z和zi的操纵行为的相似性可用转向行为相似性和变速行为相似性的加权来度量dmi
式中: ω5为轨迹点z和zi转向行为相似性权重; ω6为轨迹点z和zi变速行为相似性权重。
3.3 船舶综合行为相似性度量
当船舶空间位置接近且操作行为相似, 才认为它们行为相似, 因此, 运用空间位置相似性和操作行为相似性的组合, 定义了轨迹点z和zi的行为相似性, 用di表示为
式中: dpi为空间位置相似性, 采用欧氏距离进行度量; λi和γi分别为轨迹点zi的经度与纬度。
考虑了空间位置和操作行为的综合度量可以检测非转向区域违规转向及掉头等异常行为。
3.4 运动轨迹的获取
船舶运动轨迹的获取流程见图 3: 清洗AIS数据库中数据, 包括删除动态信息表中船舶水上移动通信业务标识码为0的记录; 删除明显错误的AIS数据, 如经纬度超过合理值的数据, 即出现负值, 经度大于180°或纬度大于90°; 根据标识码从数据库提取船舶轨迹; 利用CB-SMOT (Clustering-Based Stops and Moves of Trajectories) 算法[24]对轨迹进行划分, 得到运动轨迹和停留轨迹。
3.5 基于单个轨迹点的一致性异常检测
应用一致性异常检测算法的最直接方式是取某条轨迹的每个轨迹点作为单个样本。由于运动对象的当前位置强烈依赖于它之前的位置, 单条轨迹数据的自相关性太强, 导致训练集样本不满足独立同分布。一致性异常检测器不接受非独立同分布的训练集, 否则, 不能严格保证误报警率接近ε。
为了检测船舶新轨迹是否异常, 需将新轨迹中每个轨迹点作为待测轨迹点逐一进行检验, 如果待测轨迹点检测为异常, 则该条船舶轨迹异常。
对训练轨迹中每条轨迹, 从该轨迹中找寻与新轨迹中待测轨迹点z行为最相似的轨迹点作为训练样本集中的样本点。对于轨迹集中n条轨迹, 可以得到n个轨迹样本点, 形成轨迹训练样本集合B, 由于不同轨迹之间相互独立, 因此, 训练样本集B中元素满足独立同分布, 从而消除了单条轨迹的数据自相关性的影响。
一旦得到训练轨迹点集合B和待测轨迹点z, 计算z和训练轨迹点zi相对于B的非一致性得分, 然后, 计算观测轨迹点z所对应的p值, 如果p低于异常门限值ε, 则认为新轨迹的待测轨迹点为异常, 即航行在该航迹上的船舶行为异常。一致性异常检测算法流程见图 4, 待测轨迹点z相对于训练轨迹点集合B的非一致性等分α的计算流程见图 5。运用船舶综合行为相似性度量, 计算轨迹中与z行为最相似的轨迹点的流程见图 6。
4. 计算结果分析
4.1 试验设计
提取并预处理2013年4月10~20日琼州海峡的船舶AIS数据, 得出1 280条船舶的运动轨迹, 将880条轨迹作为训练轨迹, 余下400条轨迹作为评价轨迹, 训练轨迹和评价轨迹分别见图 7、8。
为了评价异常检测算法的性能, 将异常行为混入到已知的正常行为中, 来检验算法检测异常的能力。海上交通中获取的带有异常标签的船舶行为样本数量有限, 同时对可能遭遇的异常行为缺乏相应的知识, 因此, 本文采用了2种方式来获取待检测的异常轨迹。第1种方式利用计算机随机生成异常轨迹, 先从评价集中随机选择1条轨迹, 并从轨迹中任选1个轨迹点作为中断点, 从中断点之后的10min内, 在航向和航速范围分别为0°~360°和0~30kn的均匀概率分布中随机产生航向和航速, 使船舶沿该航向和航速航行; 以后每隔10 min, 从概率分布中获得新航向和航速航行, 直至设定的航行时间结束, 即可生成第1条异常轨迹, 总共产生50条异常轨迹。第2种为“人造”异常, 采用Presto工具生成“自定义”异常轨迹[20], 本文利用该工具制作3条异常操纵行为的轨迹: 在船舶进港时, 制造一艘船舶速度与周围船舶速度一致, 但操纵行为为加速, 与其他船舶减速行为不相符的异常轨迹; 大多数船舶在航道内左转向, 制造一艘船舶在航道内向右转向的轨迹; 在警戒区内, 制造一艘船舶先处在左转交通流中, 然后突然右转, 转向后直行一段时间, 再左转, 转向结束后并入右行交通流并保持直行的“S”形异常轨迹。第1种方式产生的异常轨迹用来评价算法的误报警率, 第2种方式产生的异常轨迹用来评价本文算法是否能有效检测船舶操纵行为异常。设计了2次试验: 第1次试验, 将计算机随机生成的异常轨迹加入到AIS轨迹集中; 第2次试验, 将3种异常操纵行为的轨迹加入到AIS轨迹集中。
4.2 船舶行为的相似性计算
为了体现从轨迹中选取与待测轨迹点操纵行为最相似点的计算过程, 以图 9的1条轨迹为例, 待测轨迹点为R, 采用综合船舶行为度量, 找出轨迹代表点H1~H5中与R点船舶行为最相近的轨迹点。相似性计算中权重w1~w6为0.5。轨迹代表点H1~H5与点R的船舶行为相似性度量计算结果见表 1。
表 1 船舶行为相似度量结果Table 1. Measurement result of ship behavior similarity由表 1得出: 轨迹点H1~H5中与点R操纵行为最接近的2个点分别为点H3和H4, 其操纵行为度量值分别为0.01和0.14;与点R空间距离最接近的2个点分别为点H3和H4, 其空间距离分别为0.62和0.61;但综合船舶行为最相似的点是H3, 其综合行为度量值为0.31, 其次是点H4和H2, 而点H1和H5差异最大, 因此, 从这条轨迹中找到与点R行为最相似的点为H3。
4.3 试验结果分析
本文采用的基于轨迹点的一致性异常检测算法, 奇异值度量中取近邻数目k=1, 置信度水平取99.0%和99.7%, 表 2为第1次试验的结果。
由表 2得出: 随机产生的50条异常轨迹全部被检测出来, 但是轨迹评价集中有一部分正常轨迹被错误划分成异常轨迹; 在置信度水平分别为99.0%和99.7%的情形下, 算法经验误差率为0.6%和0.2%, 分别低于显著性水平0.01和0.003, 因此, 可以通过设置置信度水平来控制误报警率。
表 2 第1次试验结果Table 2. First test result第2次试验结果: 操纵行为异常的3条轨迹均被检测出来, 试验结果分别见图 10~12, 实线为检测到的异常轨迹, 虚线为训练轨迹, 箭头为轨迹点的速度矢量, 矢量长度越大, 则速度越大。
图 10中显示了2组北上进港交通流, 东侧交通流中检测出1条船舶异常轨迹, 船舶朝着港口方向, 正在加速航行, 明显与周围进港船舶减速的操纵行为不同, 从而被识别为异常。
图 11中有3组船舶交通流, 西侧为南下交通流, 东侧为北上交通流, 东南角船舶轨迹显示的交通流为西行流向, 朝左转向, 变成南下的交通流; 在转向区域, 与多数船舶左转向行为不同的右转向船舶, 立刻被检测出存在转向操纵行为异常, 并且当船舶转向后北上直行时, 与西侧的南下交通流中的船舶交通构成逆行, 仍处于异常行为阶段。
图 12显示的是异常轨迹刚开始在点E1左转向时, 与左转交通流中船舶行为一致, 属于正常状态, 没有识别成异常; 但是当轨迹在点E2向右转向时, 立即被检测为异常行为; 右转向结束后, 在从点E3运动至E4点过程中, 保持航向330°时, 与西侧南下交通流构成逆行, 仍被识别为异常; 从点E4至点E5的船舶左转向与周围船舶行为不符, 周围船舶仅有南下交通流和西行交通流, 点E4至点E5的轨迹点被检测为异常; 点E5以后异常轨迹船舶并入西行交通流中, 点E5以后轨迹不再被检测为异常。由此可见, 本文提出的异常检测算法能快速检测出船舶操纵行为的变化, 即算法对船舶操纵行为的变化十分敏感。
5. 结语
(1) 本文提出了船舶异常行为的一致性检测算法, 与以前异常行为检测方法相比, 除了要求常态数据满足独立同分布, 不需要其他统计假设, 也不需要特定的门限, 仅需考虑唯一参数即置信度, 使用方便。
(2) 本文所提出的算法对异常的特征值组合非常敏感, 可以检测出船舶在非常规区域穿越航道, 设定的船舶操纵行为异常轨迹和模拟的异常轨迹很容易被检测出来, 并且经验误差率略低于相应的显著水平。
(3) 本文提出的算法在轨迹点中加入了与前后连接轨迹点的运动关系即操纵过程, 因此, 能捕获与操纵行为有关的船舶异常行为; 本文基于点方法的简单性使得它适用于没有特定领域知识的情形。
(4) 算法不足之处在于没有考虑与周围船舶的时空关系和船舶间相互作用, 这意味着随时间变化的异常, 如走私和劫持很难识别。
-
表 1 船舶行为相似度量结果
Table 1. Measurement result of ship behavior similarity
表 2 第1次试验结果
Table 2. First test result
-
[1] 朱飞祥, 张英俊, 高宗江. 基于数据挖掘的船舶行为研究[J]. 中国航海, 2012, 35 (2): 50-54. doi: 10.3969/j.issn.1000-4653.2012.02.011ZHU Fei-xiang, ZHANG Ying-jun, GAO Zong-jiang. Research on ship behaviors based on data mining[J]. Navigation of China, 2012, 35 (2): 50-54. (in Chinese). doi: 10.3969/j.issn.1000-4653.2012.02.011 [2] VESPE M, VISENTINI I, BRYAN K, et al. Unsupervised learning of maritime traffic patterns for anomaly detection[C]//IEEE. 9th IET Data Fusion and Target Tracking Conference: Algorithms and Applications. New York: IEEE, 2012: 1-5. [3] 陈金海, 陆锋, 彭国均. 海洋运输船舶轨迹分析研究进展[J]. 中国航海, 2012, 35 (3): 53-57. doi: 10.3969/j.issn.1000-4653.2012.03.012CHEN Jin-hai, LU Feng, PENG Guo-jun. The progress of research in maritime vessel trajectory analysis[J]. Navigation of China, 2012, 35 (3): 53-57. (in Chinese). doi: 10.3969/j.issn.1000-4653.2012.03.012 [4] PALLOTTA G, VESPE M, BRYAN K. Vessel pattern knowledge discovery from AIS data: a framework for anomaly detection and route prediction[J]. Entropy, 2013, 15 (6): 2288-2315. [5] MORRIS B, TRIVEDI M. A survey of vision-based trajectory learning and analysis for surveillance[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2008, 18 (8): 1114-1127. doi: 10.1109/TCSVT.2008.927109 [6] SILVERIA P A M, TEIXEIRA A P, GUEDES SOARES C. Use of AIS data to characterise marine traffic patterns and ship collision risk off the coast of Portugal[J]. Journal of Navigation, 2013, 66: 879-898. doi: 10.1017/S0373463313000519 [7] PALLOTTA G, VESPE M, BRYAN K. Traffic knowledge discovery from AIS data[C]//IEEE. 16th International Conference on Information Fusion. New York: IEEE, 2013: 1996-2003. [8] CHEN Chun-hsien, KHOO Li-pheng, CHONG Yih-tng, et al. Knowledge discovery using genetic algorithm for maritime situational awareness[J]. Expert Systems with Applications, 2014, 41 (2): 2742-2753. [9] MORRIS B, TRIVEDI M. Learning trajectory patterns by clustering: experimental studies and comparative evaluation[C]//IEEE. 2009 IEEE Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2009: 312-319. [10] DAHLBOM A, NIKLASSON L. Trajectory clustering for coastal surveillance[C]//IEEE. 10th International Conference on Information Fusion. New York: IEEE, 2007: 1-8. [11] LAXHAMMAR R, FALKMAN G, SVIESTINS E. Anomaly detection in sea traffic-a comparison of the Gaussian Mixture Model and the Kernel Density Estimaton[C]//IEEE. 12th International Conference on Information Fusion. New York: IEEE, 2009: 756-763. [12] RISTIC B, LASCALA B, MORELANDE M, et al. Statistical analysis of motion patterns in AIS data: anomaly detection and motion prediction[C]//IEEE. 11th International Conference on Information Fusion. Cologne: IEEE, 2008: 1-7. [13] MASCARO S, NICHOLSO A E, KORB K B. Anomaly detection in vessel tracks using Bayesian networks[J]. International Journal of Approximate Reasoning, 2014, 55 (1): 84-98. doi: 10.1016/j.ijar.2013.03.012 [14] 肖潇, 邵哲平, 潘家财, 等. 基于AIS信息的船舶轨迹聚类模型及应用[J]. 中国航海, 2015, 38 (2): 82-86. doi: 10.3969/j.issn.1000-4653.2015.02.020XIAO Xiao, SHAO Zhe-ping, PAN Jia-cai, et al. Ship trajectory clustering model based on AIS data and its application[J]. Navigation of China, 2015, 38 (2): 82-86. (in Chinese). doi: 10.3969/j.issn.1000-4653.2015.02.020 [15] 马文耀, 吴兆麟, 杨家轩, 等. 基于单向距离的谱聚类船舶运动模式辨识[J]. 重庆交通大学学报: 自然科学版, 2015, 34 (5): 130-134. https://www.cnki.com.cn/Article/CJFDTOTAL-CQJT201505026.htmMA Wen-yao, WU Zhao-lin, YANG Jia-xuan, et al. Vessel motion pattern recognition based on One-Way distance spectral clustering algorithm[J]. Journal of Chongqing Jiaotong University: Natural Science, 2015, 34 (5): 130-134. (in Chinese). https://www.cnki.com.cn/Article/CJFDTOTAL-CQJT201505026.htm [16] 甄荣, 邵哲平, 潘家财, 等. 基于统计学理论的船舶轨迹异常识别[J]. 集美大学学报: 自然科学版, 2015, 20 (3): 193-197. doi: 10.3969/j.issn.1007-7405.2015.03.006ZHEN Rong, SHAO Zhe-ping, PAN Jia-cai, et al. A study on the identification of abnormal ship trajectory based on statistic theories[J]. Journal of Jimei University: Natural Science, 2015, 20 (3): 193-197. (in Chinese). doi: 10.3969/j.issn.1007-7405.2015.03.006 [17] LANE R O, NEVELL D A, HAYWARD S D, et al. Maritime anomaly detection and threat assessment[C]//IEEE. 13th International Conference on Information Fusion. New York: IEEE, 2010: 1-8. [18] KOWALSKA K, PEEL L. Maritime anomaly detection using Gaussian Process active learning[C]//IEEE. 15th International Conference on Information Fusion. New York: IEEE, 2012: 1164-1171. [19] DEVRIES G K D, VAN SOMEREN M. Machine learning for vessel trajectories using compression, alignments and domain knowledge[J]. Expert Systems with Applications, 2012, 39 (18): 13426-13439. doi: 10.1016/j.eswa.2012.05.060 [20] KAZEMI S, ABGHARI S, LAVESSON N, et al. Open data for anomaly detection in maritime surveillance[J]. Expert Systems with Applications, 2013, 40 (14): 5719-5729. doi: 10.1016/j.eswa.2013.04.029 [21] VOVK V, GAMMERMAN A, SHAFER G. Algorithmic Learning in A Random World[M]. Berlin: Springer, 2005. [22] 王华珍. 带置信度分类器的研究与应用[D]. 厦门: 厦门大学, 2009.WANG Hua-zhen. Research and application of classifier with confidence[D]. Xiamen: Xiamen University, 2009. (in Chinese). [23] GAMMERMAN A, VOVK V. Hedging predictions in machine learning[J]. Computer Journal, 2007, 50 (2): 151-163. doi: 10.1093/comjnl/bxl065 [24] PAPADOPOULOS H, VOVK V, GAMMERMAN A. Regression conformal prediction with nearest neighbours[J]. Journal of Artificial Intelligence Research, 2011, 40: 815-840. doi: 10.1613/jair.3198 [25] LAXHAMMAR R. Conformal anomaly detection: detecting abnormal trajectories in surveillance applications[D]. Sk9vde: University of Sk9vde, 2014. [26] SMITH J, NOURETDINOV I, CRADDOCK R, et al. Anomaly detection of trajectories with kernel density estimation by conformal prediction[C]//Springer. IFIPInternational Conference on Artificial Intelligence Applications and Innovations. Berlin: Springer, 2014: 271-280. [27] LIU Bo, DE SOUZA E N, HILLIARD C, et al. Ship movement anomaly detection using specialized distance measures[C]//IEEE. 18th International Conference on Information Fusion. New York: IEEE, 2015: 1113-1120. [28] SIDIBE A, SHU G. Study of automatic anomalous behaviour detection techniques for maritime vessels[J]. Journal of Navigation, 2017, 70 (4): 847-858. [29] JANSSENS J H M, HIEMSTRA H, POSTMA E O. Creating artificial vessel trajectories with Presto[C]//BNVKI. 22nd Benelux Conference on Artificial Intelligence. Groningen: University of Groningen, 2010: 1-2. [30] LEI Po-ruey. A framework for anomaly detection in maritime trajectory behavior[J]. Knowledge and Information Systems, 2016, 47 (1): 189-214. 期刊类型引用(14)
1. 杨悦,刘天一,张美丽. 基于CALS算法的船舶航迹和航行行为特征研究. 数学的实践与认识. 2025(01): 127-136 . 百度学术
2. 郑元洲,李鑫,钱龙,秦瑞朋,李果,李梦希. 基于DCNN-LSTM模型的船舶违章行为检测. 湖南大学学报(自然科学版). 2024(12): 119-128 . 百度学术
3. 阿依努尔·努尔太. 无人机欺骗攻击检测技术综述与展望. 中国宽带. 2024(08): 133-135 . 百度学术
4. 陈芊芊,胡凤玲,文元桥. 基于九轴IMU的船舶运动模式识别方法. 交通信息与安全. 2024(06): 74-83 . 百度学术
5. 牛雯钰,梁茂晗,刘文,熊盛武. 多特征点驱动的船舶轨迹聚类方法. 交通信息与安全. 2023(01): 62-74 . 百度学术
6. 杨阿华,常鑫,张强,赵斐. 基于AIS数据的敏感水域船舶异常行为检测. 指挥信息系统与技术. 2023(04): 32-37 . 百度学术
7. 闫浩文. 空间相似关系的理论体系与潜在研究方向. 测绘学报. 2023(11): 1962-1973 . 百度学术
8. 张行,凌嘉瞳,刘思敏,董绍华. 基于移动设备位置数据的油气管道第三方破坏行为识别研究. 石油科学通报. 2022(02): 261-269 . 百度学术
9. 黄琛,陈德山,吴兵,严新平. 船舶航行交通事件实时检测技术研究现状与展望. 交通信息与安全. 2022(06): 1-11 . 百度学术
10. 宋鑫,朱宗良,高银萍,苌道方. 动态阈值结合全局优化的船舶AIS轨迹在线压缩算法. 计算机科学. 2019(07): 333-338 . 百度学术
11. 文元桥,张义萌,黄亮,周春辉,肖长诗,张帆. 基于语义的船舶行为动态推理机制. 中国航海. 2019(03): 34-39+50 . 百度学术
12. 杨帆,何正伟,何帆. 基于LSTM神经网络的船舶异常行为检测方法. 武汉理工大学学报(交通科学与工程版). 2019(05): 886-892 . 百度学术
13. 王丁. 基于无线局域网的船舶异常数据自动识别系统. 舰船科学技术. 2018(22): 145-147 . 百度学术
14. 宁航,南春丽,杨澜,赵祥模,刘浩学,周丹. 汽车制动力曲线异常检测. 交通运输工程学报. 2018(06): 82-92 . 本站查看
其他类型引用(15)
-