首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 562 毫秒
1.
考虑船舶行为的时序相关性,提出了一种基于上下文自编码的船舶行为语义表征(SRCAE)模型;提取船舶经度、纬度、航速、航向等行为特征参量,建立了行为特征序列;借助连续词袋模型将行为特征序列划分为中心船舶行为和上下文船舶行为,利用深度自编码网络构建了船舶上下文行为的语义表征模型,将得到的中心船舶行为编码作为表征向量输出,通过聚类算法构建船舶行为词典;选取长江口南槽交汇水域作为研究对象,利用船舶自动识别系统产生的数据对提出的模型和方法进行了验证。分析结果表明:所提出的SRCAE模型能有效表征船舶行为之间的上下文联系,与传统自编码器和长短期记忆网络自编码器等模型相比SRCAE模型具有更低的表征误差;分别采用k均值(k-Means)、高斯混合模型(GMM)与核k均值(Kernel k-Means)3种聚类算法提取船舶行为词典,与原始数据相比SRCAE模型产生的表征向量更易于区分不同船舶行为模式,其中k-Means效果最优,轮廓系数、卡林斯基-哈拉巴斯指数和戴维森堡丁指数指标分别达到了0.384、18.308、0.531,共产生转向加速、转向减速、直行加速、直行减速等30种复合行为,有效提取了不同行为模式下船舶行为词组合关系。   相似文献   

2.
为了实现文本代表性语义词汇的抽取,提出一种基于词组主题建模的文本语义压缩算法SCPTM(semantic compression based on phrase topic modeling).该算法首先将代表性语义词汇抽取问题转化为最大化优化模型,并通过贪心搜索策略实现该模型的近似求解.然后,利用词组挖掘模型LDACOL实现词组主题建模,得到SCPTM算法的输入参数;同时,针对该模型中词组的主题分配不稳定的问题进行改进,使得取得的代表性语义词汇更加符合人们对语义的认知习惯.最后,将改进LDACOL模型与LDA模型、LDACOL模型以及TNG模型的主题挖掘性能进行实验比较,并利用SCPTM算法针对不同语料库进行语义压缩,根据聚类结果评价其有效性.实验结果表明,在多数情况下,改进LDACOL模型的主题抽取效果优于其他3种模型;通过SCPTM算法抽取代表性语义词汇能达到70%~100%的精度,相比PCA、MDS、ISOMAP等传统降维算法能获得更高的聚类效果.   相似文献   

3.
为了识别立体交叉口中不同的行驶规则, 利用随机森林特征选择方法分析了车辆轨迹数据特征, 按照重要性评分对特征进行聚类; 利用戴维森堡丁指数衡量聚类结果, 获得交叉口最优聚类结果下的各个行驶规则的聚类簇, 并构建聚类簇范围约束的狄洛尼三角网; 利用骨架线提取与公共序列合并方法, 提取立体交叉口的几何结构与拓扑连通关系, 获取城市立体交叉口空间结构信息; 以武汉市2016年出租车轨迹为数据源, 选取了武汉市城区立体交叉口进行空间结构信息获取试验。研究结果表明: 立体交叉口中车载GPS轨迹特征重要性评分的前4项依次是终点角度、起点角度、起终点角度差、中间角度平均值, 其中利用终点角度与起点角度特征组合的聚类结果是最优的; 立体交叉口空间结构信息获取方法在直行、左转、右转方向下识别准确率分别为85.7%、85.4%、87.5%, 综合准确率为86.2%, 直行、左转、右转方向下信息召回率分别为91.5%、87.2%、85.9%, 综合召回率为88.2%, 因此, 较高的准确率与召回率说明本文提出的方法可以准确识别立体交叉口空间结构信息, 并提取立体交叉口中各个行驶规则的几何与拓扑连通关系。   相似文献   

4.
针对基于视频监控的密集行人群识别难度大,运动轨迹提取困难,运动语义信息挖掘不足 等问题,本文提出基于多目标跟踪FairMOT框架及K-means聚类的行人轨迹捕获和运动语义信 息感知方法。首先,利用多目标跟踪算法提取视频中行人群目标过街时的运动轨迹特征向量;然 后,通过分析轨迹坐标的数值分布特点,设计了一种协方差滤波算法STCCF,以检测和剔除“准静 态轨迹”,得到行人群目标运动轨迹簇;最后,针对已提取的轨迹簇,应用K-means聚类方法,选取 S系数(Silhouette Coefficient)和DB指数(Davies Bouldin Index)两个指标,感知行人聚集和消散点 等场景语义特征。实验分析表明,算法从提取到的2689条轨迹中辨识出179条“准静态轨迹”,检 出率为81.73%;视频场景中的行人目标源点和消失点的解析结果与人工辨识结果吻合,验证了密 集行人群轨迹提取和运动语义信息感知方法的有效性。本文研究可为数据驱动的行为预测和轨 迹建模提供基础。  相似文献   

5.
城市轨道交通站点受多层面因素交互作用而反映出异质性,为实现站点精细化分类,本文统筹考虑地铁刷卡数据、兴趣点数据和地铁网络数据,提取客流、土地利用和网络性质等特征,其中,客流层面考虑工作日、周末和节假日等不同日期类型下客流状态,土地利用层面考虑站点辐射区用地强度和均衡性,网络层面考虑节点自身特性和影响能力。构建基于主成分分析与K-means++算法的聚类模型,综合聚类评价指标确定簇数,辨析不同类型站点多维度特性,结合站区土地利用和站点网络特征探讨对出行活动的影响,并设计簇内联合预测和整体联合预测策略,采用3种多元时序预测方法探究站点聚类对预测性能的影响。研究结果表明:考虑全部客流特征时,划分为10簇,考虑工作日进站客流特征时,划分为5簇,充分挖掘客流时变特征能够获得更加精细化的聚类结果;各簇站点客流分布特征与其土地利用及网络特征间存在一定的反馈关系;相比于整体联合预测,通过聚类联合相关性强的站点进行预测,以间接捕获空间相关性的方式能有效提升预测性能,各模型均方根误差平均降低9.04%,平均绝对误差平均降低4.94%。研究结果为站点精细化管理和站区设施建设规划提供依据。  相似文献   

6.
高速公路收费数据是一种高维、海量、分布特征未知的数据集,因此难以选择 何种算法和参数最适合此类数据的聚类.针对此问题,提出一种基于簇形均衡的聚类评估 指标IBCS,对各簇的形状、分布、密度和尺寸等多种形态进行均衡综合评估.该指标根据 数据集稀疏程度自适应调整邻域置信区间来度量簇结构的分散度和分离度;度量密度使 得IBCS 具有面向数据集的算法选择能力;度量簇大小避免簇划分过于悬殊的问题.UCI 数据集上多种候选算法评估比较实验验证了该指标灵活有效,能获得准确簇数并合理划 分.最后,基于IBCS 评估的西宝高速公路收费数据聚类结果表明,采用K-means 算法,簇 数为5时聚类模式最佳.  相似文献   

7.
交通事故特征受地域分布影响显著,本文对交通事故特征进行优化聚类研究.基于 2019年无锡市交通事故数据,调用开放地图接口地理编码解算事故地点经纬度,使用密度聚类算法对事故地点与事故原因进行密度聚类.传统的密度聚类算法依赖距离阈值和样本数阈值的准确输入,为解决这一局限,建立一种自适应搜索距离阈值和样本数阈值的密度聚类模型,并与原始聚类模型进行对比.结果表明,优化算法在参数确定上更加智能,对簇的划分更加准确,对噪声点的识别更加合理.通过机器学习中轮廓系数计算方法计算模型得分,证明了该算法在城市道路交通事故地理位置聚类中的适用性.  相似文献   

8.
一种有效的数据流二次聚类算法   总被引:2,自引:1,他引:1  
为提高数据分布不规则和含有噪音时的数据流聚类质量,提出了一种有效的数据流二次聚类算法TCLUSA.该算法基于分区思想,采用DBSCAN方法对每块分区进行聚类,以得到的簇的均值点作为其代表点,再用k-means对所获得的代表点进行聚类,算法采用分层结构保存每次聚类获得的簇参考点,直至获得最终结果.理论分析和实验结果表明,TCLUSA算法能有效提高数据流的聚类质量.  相似文献   

9.
交通事故特征受地域分布影响显著,本文对交通事故特征进行优化聚类研究.基于 2019年无锡市交通事故数据,调用开放地图接口地理编码解算事故地点经纬度,使用密度聚类算法对事故地点与事故原因进行密度聚类.传统的密度聚类算法依赖距离阈值和样本数阈值的准确输入,为解决这一局限,建立一种自适应搜索距离阈值和样本数阈值的密度聚类模型,并与原始聚类模型进行对比.结果表明,优化算法在参数确定上更加智能,对簇的划分更加准确,对噪声点的识别更加合理.通过机器学习中轮廓系数计算方法计算模型得分,证明了该算法在城市道路交通事故地理位置聚类中的适用性.  相似文献   

10.
为有效解决高流量终端区内标准飞行模式、非标准飞行模式和异常飞行模式难以自动分离的问题,采用广泛记录的广播式自动相关监视(ADS-B)数据,构建了基于稳健深度自编码器(RDAE)和快速搜索并寻找密度峰值的聚类(CFSFDP)算法的航迹聚类模型; 使用RDAE降维提取终端区内航迹集的非线性特征,利用多种正则化手段约束内部低维流形,以重建更紧密的航迹并将其作为CFSFDP算法的输入,利用轮廓系数选取不同密度飞行模式的聚类中心,并调节边缘密度参数识别出异常航迹; 选取主成分分析(PCA)结合有噪声的空间密度聚类(DBSCAN)算法、动态时间规整(DTW)结合DBSCAN的2种常用航迹聚类模型作为对比项,分别在广州白云机场1 d的少量数据和45 d的大量数据上进行试验。分析结果表明:DTW与CFSFDP的结合模型在少量数据集上具有最优的航迹聚类性能,轮廓系数比对比项分别提升了62%和28%,且可以自动识别出遵循区域导航标准飞行模式的航班和特定环境下遵循管制偏好的非标准飞行模式的航班,识别异常航迹的精确度也分别提高了57%和10%;大量数据下,提出的RDAE结合CFSFDP模型的聚类性能比经典的PCA结合DBSCAN算法提升了13%,且具备可接受的时间复杂度。由此可见,建立的终端区飞行模式区分模型可为空域级交通流性能评估和航班级航迹预测与优化提供数据提取平台。   相似文献   

11.
为有效识别任意两篇报道的相似性,提出了一种基于语义相似度的话题关联检测算法.该算法首先通过计算特征词之间的相对熵作为两篇报道中特征词之间的语义相似度;其次,通过计算平均语义相似度获得特征词和报道之间的关联度;最后,结合特征词在语料库中的TF-IF(term frequency-inverse document frequency)权重计算两篇报道之间的关联度,实现报道之间的关联度检测.本文提出的方法与现有的向量空间模型方法和仅依赖于平均点互信息的方法进行了比较,并通过TDT4中文语料进行测评,结果表明,基于语义相似度的关联检测方法能够更好地利用文本的语境信息,提高了现有检测系统的性能,其最小DET(detection error tradeoff)代价降低了3%.   相似文献   

12.
This paper proposed a new method of semi-automatic extraction for semantic structures from unlabelled corpora in specific domains. The approach is statistical in nature. The extracted structures can be used for shallow parsing and semantic labeling. By iteratively extracting new words and clustering words, we get an inital semantic lexicon that groups words of the same semantic meaning together as a class. After that, a bootstrapping algorithm is adopted to extract semantic structures. Then the semantic structures are used to extract new key words and augment the semantic lexicon. The resultant semantic structures are interpreted by persons and are amenable to handediting for refinement. In this experiment, the semi-automatically extracted structures SSA provide recall rate of 84.5%.  相似文献   

13.
针对交通场景目标分割边缘不平滑以及小目标难以准确分割等问题,本文提出一种双注意力引导的跨层优化交通场景语义分割算法。首先,构建多分支特征提取编码网络,并利用串行非比例式空洞卷积实现空间上下文信息提取,进而改善小目标信息的丢失;其次,构建基于空间对齐的跨层特征融合解码网络,实现语义信息和细节信息的融合,增强不同尺度目标的表达能力;最后,提出通道和空间注意力机制,建模全局通道相关性和长距离位置相关性,增强网络对关键特征的学习能力。交通场景数据集Cityscapes和CamVid上的实验结果表明,所提特征提取编码网络、跨层特征融合解码网络以及注意力机制模块是有效的;所提语义分割算法获得了77.79%和78.66%的平均交并比,能够平滑目标分割边缘,尤其对细长条形目标具有鲁棒性。  相似文献   

14.
With the rapid increase of educational resources, how to search for necessary educational resource quickly is one of most important issues. Educational resources have the characters of distribution and heterogeneity, which are the same as the characters of Grid resources. Therefore, the technology of Grid resources search was adopted to implement the educational resources search. Motivated by the insufficiency of currently resources search methods based on metadata, a method of extracting semantic relations between words constituting metadata is proposed. We mainly focus on acquiring synonymy, hyponymy, hypernymy and parataxis relations. In our schema, we extract texts related to metadata that will be expanded from text spatial through text extraction templates. Next, metadata will be obtained through metadata extraction templates. Finally, we compute semantic similarity to eliminate false relations and construct a semantic expansion knowledge base. The proposed method in this paper has been applied on the education grid.  相似文献   

15.
针对激光雷达动态障碍物检测与跟踪过程中聚类适应性差、实时性低和跟踪准确度不高等问题,提出一种自适应的密度聚类算法和多特征数据关联方法,分别用于检测和跟踪. 首先,对激光雷达采集的点云进行路沿检测、感兴趣区域提取和地面分割等预处理,去除无关点云;然后,基于自适应的密度聚类算法对非地面的点云进行聚类,完成障碍物点云检测;最后,利用加权多特征数据关联算法结合卡尔曼滤波器实现对动态障碍物跟踪. 通过实验表明:本算法能够根据10 Hz的激光雷达数据实现对障碍物准确、稳定的检测和跟踪,且聚类时间缩短32%.   相似文献   

16.
为了提高铁路扣件基于视觉的自动化检测精度,提出了一种改进的LBP (local binary pattern)编码算法. 该方法为了避免基本LBP对噪声敏感问题,根据不同邻域的不同噪声强度,结合测量误差服从高斯分布的原则,计算邻域内像素均值和偏差;根据偏差大小,自动设置阈值,实现自适应噪声抑制. 为了避免基本LBP表达邻域差分关系不完整的缺陷,提出了利用邻域内随机采样的方式得到采样点对,通过比较随机点对的差分关系得到LBP编码. 对在晴天、阴天、雨天等不同天气条件下的铁路扣件图像上进行实验,并与原始以及其他改进LBP进行比较. 结果表明,本文的算法具有更高的检测准确率,晴天提高了3.32%,阴天提高了3.27%,雨天提高了4.10%,能够满足铁路扣件自动化检测的需要.   相似文献   

17.
提出了一种低秩矩阵补全的改进方法以研究道路交通量数据缺失值插补问题。应用基于核范数的低秩矩阵补全对交通量数据矩阵中的缺失值进行第1轮插补; 通过层次聚类算法将交通量数据划分为不同类别, 使得同类中的数据具有较强相关性, 异类中的数据具有较弱的相关性; 在每类样本上应用低秩矩阵补全得到缺失值的第2轮插补; 为了减少聚类数的影响, 提出最小二乘回归集成学习方法将不同聚类数下的插补结果进行融合, 得到最终的交通量数据插补结果; 用美国俄勒冈州波特兰市的交通量数据比较了5种方法的插补误差, 并分析了不同聚类数和距离度量方法的影响。研究结果表明: 在完全随机缺失模式下, 缺失率为10%~60%时, 其相对于传统的低秩矩阵补全模型的插补误差降低了5.93%~9.11%;在随机缺失和混合缺失模式下, 插补误差也分别降低了8.32%~9.55%和8.14%~9.20%;集成不同聚类数下的多个插补结果比单一聚类数下的插补误差降低2.62%~4.76%。可见, 在3种数据缺失模式下, 改进低秩矩阵补全方法降低了交通量数据的插补误差, 能有效提高插补后交通量数据的有效性。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号