基于铁路客站视频多视角特征图投影融合的人群密度估计模型 |
| |
引用本文: | 李瑞,李平,代明睿,马小宁,李国华.基于铁路客站视频多视角特征图投影融合的人群密度估计模型[J].中国铁道科学,2022(3):182-192. |
| |
作者姓名: | 李瑞 李平 代明睿 马小宁 李国华 |
| |
作者单位: | 1. 中国铁道科学研究院研究生部;2. 中国铁道科学研究院集团有限公司科技和信息化部;3. 中国铁道科学研究院集团有限公司电子计算技术研究所 |
| |
基金项目: | 国家重点研发计划项目(2020YFF0304104); |
| |
摘 要: | 为破解超大视觉场景下人群密度估计的局限性,提出1种适用于铁路客站的多视角特征图投影融合的人群密度估计模型,包括多视角特征图提取处理和多视角特征图投影融合处理2部分。首先,对站内多路旅客视频图像分别进行多尺度特征提取,并引入注意力机制模块分离背景和前景人像,得到注意力密度特征图;再将不同视角下经过提取处理后二维的特征图投影到三维地面坐标系;然后,对投影后的特征图进行融合计算,实现整体融合特征图的密度估计;最后,在传统密度估计损失基础上增加注意力密度特征损失,设计得到损失函数。依托公开数据集和基于清河站的自建数据集,对比验证模型性能。结果表明:该模型在均值绝对误差上优于当前同类先进模型;引入的注意力机制模块进一步优化了模型对人群密度估计的效果;200次迭代后模型平均损失梯度下降逐步稳定,梯度策略设置合理,收敛效果较好;在清河站实际应用场景下,该模型能基于3个不同视角视频图像准确估计人群密度。
|
关 键 词: | 铁路客站 人群密度估计 多视角融合 多尺度特征提取 注意力机制 |
|