首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 800 毫秒
1.
为了实现文本代表性语义词汇的抽取,提出一种基于词组主题建模的文本语义压缩算法SCPTM(semantic compression based on phrase topic modeling).该算法首先将代表性语义词汇抽取问题转化为最大化优化模型,并通过贪心搜索策略实现该模型的近似求解.然后,利用词组挖掘模型LDACOL实现词组主题建模,得到SCPTM算法的输入参数;同时,针对该模型中词组的主题分配不稳定的问题进行改进,使得取得的代表性语义词汇更加符合人们对语义的认知习惯.最后,将改进LDACOL模型与LDA模型、LDACOL模型以及TNG模型的主题挖掘性能进行实验比较,并利用SCPTM算法针对不同语料库进行语义压缩,根据聚类结果评价其有效性.实验结果表明,在多数情况下,改进LDACOL模型的主题抽取效果优于其他3种模型;通过SCPTM算法抽取代表性语义词汇能达到70%~100%的精度,相比PCA、MDS、ISOMAP等传统降维算法能获得更高的聚类效果.   相似文献   

2.
鉴于传统的线性判别分析(LDA)算法未考虑数据从高维空间嵌入到低维子空间中样本之间的相似性,导致该算法在处理非高斯分布数据时不能取得较好的效果,为此,本文提出了一种改进的自权值线性判别分析算法。改进的模型通过将样本对之间的距离分布转换为样本点之间的权值以区分样本之间的差异性,使模型考虑数据从高维空间嵌入到低维子空间中隐含的局部流形结构,进而提高模型处理非高斯数据的能力。通过人工合成数据和真实数据对改进的模型进行实验验证,表明改进的自权值算法在一定程度上可以改善传统LDA在处理非高斯数据上的降维性能。  相似文献   

3.
针对交通需求特征识别和需求预测问题,构建改进的LDA(Latent Dirichlet Allocation)城市区域内出行需求识别与预测组合模型,快速识别城市区域内出行需求特征并对需求做出预测. 构建城市交通小区尺度内的空间和时间维度下的主要出行需求特征分布挖掘辨识方法,以及数据集在不同时间尺度下时间维度出行特征构建及预测方法. 利用北京市三环内网约车出行订单数据,验证模型的有效性和准确性. 结果表明,模型能够对不同时间窗口下的区域出行需求特征进行辨识和预测,取得较好的结果.  相似文献   

4.
为了提高高速公路运行效率,减少交通拥堵和交通事故的发生,改进了传统的MOBIL自主性换道决策模型.在网联自动驾驶的环境中考虑车辆换道后对原车道与目标车道多辆后随车制动影响程度的不同,构建权重因子表达式.利用MATLAB软件进行数值仿真实验,通过定性与定量分析将提出的加权MOBIL自主性换道决策模型与传统模型进行比较.实验结果表明:与传统换道模型相比,加权MOBIL换道决策模型能提高交通流的平均速度,减少延误以及减少整体的制动幅度.因此,提出的改进加权MOBIL自主性换道决策模型能提高交通流的运行效率以及安全性.  相似文献   

5.
为了降低干线公路无控交叉口处驾驶员超速行驶产生的交通事故,在交叉口处进行振动减速标线设计,并探讨了振动减速标线的参数设计方法.采用改进加权加速度均方根与K值系数法相结合,建立振动频率、振动幅度和车速变化因子的综合舒适性评价模型.针对不同振动减速标线组数和车辆减速度,进行振动减速标线设计,分析不同减速效果下驾驶员的舒适性.  相似文献   

6.
针对自动化立体车库车辆存取能耗高的缺点,以提高车库运行效率和降低车库运行能耗为目标,以车辆到达间隔时间服从泊松分布,车辆停留时间服从正态分布,建立车位分区管理的车库运行模型,在此基础上,采用多色集合理论对立体车库车位进行分区管理.编写仿真程序,通过比较车位分区管理和车位就近分配下的车辆平均等待时间和车辆平均运行能耗的仿真结果,证明了车位分区管理在提高车库运行效率和降低车库运行能耗上的有效性.仿真结果表明:在特定车辆到达间隔时间分布和车辆停留时间分布下,该车位分区管理模型能够使得顾客的平均等待时间减少0.05min并降低车库运行能耗达10.63%.  相似文献   

7.
提出采用响应面法进行有限元模型修正.该方法根据方差分析或先验信息进行设计参数筛选,以显式的响应面模型逼近目标函数与设计参数之间复杂的隐式函数关系,通过响应面自身特性进行迭代修正.在此基础上,根据样本点对目标函数贡献的差异性提出通过加权来构造改进的二次响应面,改进后的响应面可以更快地迭代收敛,计算量小,可推广至非线性等复杂模型,某算例验证该方法的有效性.  相似文献   

8.
出行时间价值最大熵分布估计模型   总被引:1,自引:0,他引:1  
为提高使用时间价值数据拟合其统计分布的精度,将最大熵原理分别与低阶(≤6)经典矩和概率加权矩相结合,建立了时间价值低阶经典矩与概率加权矩统计分布函数模型。仿真结果表明:在大样本量下,利用经典矩与概率加权矩对参数估计的精度相当,在小样本量下(<30),采用概率加权矩估计参数的相对误差在10%~35%之间,而采用经典矩估计参数的相对误差在20%~80%之间。可见利用概率加权矩克服了经典矩模型在小样本量下参数估计的大偏差问题,且利用其可以准确地预测交通方式分担率与分析交通定价政策对交通行为的影响。  相似文献   

9.
对于α稳定分布的随机过程,由于没有有限的二阶矩,因此不能利用功率谱来进行相应的频域分析.基于分数低阶统计量,提出了新的谱分析方法,并研究了分数低阶协方差谱的几种估计方法.理论分析和仿真实验表明,分数低阶协方差谱是一种有效的α稳定分布过程的谱分析方法,三种分数低阶协方差谱估计方法中,加权交叠平均法由于采用加窗和分段使得估计方差明显变小.  相似文献   

10.
在对数据进行分析的基础上,运用统计方法建立超期数的分布矩阵模型,然后根据各种图书的种类和超期天数对超期原因的影响,运用了加权的思想,利用经验数据分别对不同类别和超期天数的3种原因进行加权赋值,从而得到超期原因矩阵模型。  相似文献   

11.
为有效识别任意两篇报道的相似性,提出了一种基于语义相似度的话题关联检测算法.该算法首先通过计算特征词之间的相对熵作为两篇报道中特征词之间的语义相似度;其次,通过计算平均语义相似度获得特征词和报道之间的关联度;最后,结合特征词在语料库中的TF-IF(term frequency-inverse document frequency)权重计算两篇报道之间的关联度,实现报道之间的关联度检测.本文提出的方法与现有的向量空间模型方法和仅依赖于平均点互信息的方法进行了比较,并通过TDT4中文语料进行测评,结果表明,基于语义相似度的关联检测方法能够更好地利用文本的语境信息,提高了现有检测系统的性能,其最小DET(detection error tradeoff)代价降低了3%.   相似文献   

12.
Automatic thread labeling for news events can help people know different aspects of a news event. In this paper, we present a method to label threads of a news event. We use latent Dirichlet allocation (LDA) topic model to extract news threads from news corpus. Our method first selects the thread words subset then extracts phrases based on co-occurrence calculation. The extracted phrase is then used as a label of a news thread. Experimental results show that about 60% of generated labels visualize the meaningful aspects of a news event. These labels can help people fast to capture many different aspects of a news event.  相似文献   

13.
驾驶行为是影响交通安全最活跃的因素,在“人-车-路”复杂环境中扮演着关键角色。为了深入理解货车驾驶人驾驶行为规律和行为风险性,本文聚焦货车驾驶人驾驶行为对行车安全的影响,对货车驾驶人的驾驶行为风格、行为风险性及其与行车安全的关系等相关研究成果进行系统地梳理和分析。首先,利用构建的文献检索策略,筛选出38篇相关文献,并结合LDA(Latent Dirichlet Allocation)模型,对生成的4个研究主题,即货车驾驶人驾驶行为辨识,危险驾驶行为与行车安全,货车碰撞事故致因分析及驾驶安全风险评估进行总结;其次,针对数据源、特征工程及建模方法等分析要素,构建了适用于任意研究主题的通用研究路径,并重点归纳了目前研究主题在数据源、变量选择方法、研究地点及建模方法等关键要素的研究进展;最后,分析和探讨了货车驾驶人驾驶行为与行车安全领域面临的主要问题,从描述、解释、关联及应用的角度提炼该领域研究的未来发展趋势。研究认为:有必要将驾驶状态特性、车辆运行状态及道路交通状况等多维特征变量进行多源信息融合,开展基于大数据和人工智能双驱动的驾驶行为研究;需加强研究山区公路环境下货车与其他类型车辆之间的交互作用机制,从“人-车-路”视角分析货车碰撞事故致因;需进一步完善智能网联和自动驾驶等高新智能自动化环境下的货车驾驶人驾驶行为与行车安全关系研究;拓展面向驾驶安全的货车驾驶人驾驶风险评估的理论方法和应用框架。研究 成果将为货车事故治理、公路货运平台监控及道路线形设计等应用场景提供重要依据,并有助于相对全面地理解货车驾驶人驾驶行为与道路行车安全的交互作用机理。  相似文献   

14.
The objective of this work is to improve the measurement accuracy of a gyroscope on a angular motion base with a simple adaptive filter scheme. Two main topics are highlighted in this work. The first topic is to show building a dual-process model employed for the conventional Kalman filter. The second topic is to show developing a modified noise adaptive algorithm when measurement noise and process noise are unknown. The experimental results are presented to show that the simple adaptive filtering scheme outperforms the other conventional scheme in this paper in terms of noise reduction.  相似文献   

15.
车辆动态称重误差来源与补偿算法研究   总被引:1,自引:0,他引:1  
动态称重系统为超限运输治理工作提供了相当的便利,但其测量精度一直是值得研究的课题。通过实车试验,测得动态称重系统测量数据,然后运用数学统计方法,建立以速度作为补偿因子的补偿模型,对动态测量结果进行修正,并对过往车辆的称重结果进行有效性验证。结果证明该补偿算法具有一定的精度和实用价值。  相似文献   

16.
为推进城际交通大数据的应用,需要补全出行目的信息,将团体旅客出行目的决策与文本主题生成类比,开发基于无监督学习框架的出行目的推断方法.提出嵌入出发时间生成模块的主题模型,以及团体旅客重建和语义化特征设计方法,并通过吉布斯采样估计参数. 基于调查数据的模型对比研究发现,模型对一般私务辨识性能提升7.7%;基于票务数据的案例研究发现,模型对出发时间预测精度达到90.9%,间接验证了模型的可靠性.主题标注表明,模型不仅推断出4种与典型模式相符的出行目的,还辨识出既有认识外的非常规模式.对道路客运分析表明,出行目的构成呈现地区差异,高铁开通对不同出行目的出行量的负向影响程度不一.  相似文献   

17.
为推进城际交通大数据的应用,需要补全出行目的信息,将团体旅客出行目的决策与文本主题生成类比,开发基于无监督学习框架的出行目的推断方法.提出嵌入出发时间生成模块的主题模型,以及团体旅客重建和语义化特征设计方法,并通过吉布斯采样估计参数. 基于调查数据的模型对比研究发现,模型对一般私务辨识性能提升7.7%;基于票务数据的案例研究发现,模型对出发时间预测精度达到90.9%,间接验证了模型的可靠性.主题标注表明,模型不仅推断出4种与典型模式相符的出行目的,还辨识出既有认识外的非常规模式.对道路客运分析表明,出行目的构成呈现地区差异,高铁开通对不同出行目的出行量的负向影响程度不一.  相似文献   

18.
在分析了基于城市交通信息港的出行前最优路径选择问题的多目标属性的基础上,建立了出行前最优路径选择的多目标规划模型,模型所求得的解是综合最优路径,反映了城市交通出行者信息以及目标需求多样性的特点.设计了基于线性加权法的模型求解算法.通过算例初步验证了模型的合理性和有效性.  相似文献   

19.
话题跟踪是一项面向新闻报道信息流进行已知话题跟踪的信息处理技术,本文在现有的向量空间描述文档的基础上,实现了一个基于话题更新的话题跟踪算法,提出了基于知网的近义动词分析的跟踪算法及基于知网的近义动词分析和话题更新的话题跟踪算法.实验表明话题更新和同义词近义词的消除提高了话题跟踪算法的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号