首页 | 本学科首页   官方微博 | 高级检索  
     检索      

电商化采购系统中商品属性提取的智能化实践
引用本文:陈竞翔,杨朗兵,章世喜,刘永瑞.电商化采购系统中商品属性提取的智能化实践[J].铁路采购与物流,2023(2):29-33.
作者姓名:陈竞翔  杨朗兵  章世喜  刘永瑞
作者单位:1. 中国华能集团有限公司;2. 中国华能集团物资供应中心
摘    要:在开放世界假设下,海量商品的属性提取任务是长期困扰电商采购系统的算法问题,提出了采用基于样本量的自适应样本增强策略,改进基于序列标注的问答属性提取算法,并辅以词典树的规则模型。其中,序列标注模型CRF-L4在测试集上的F1达到92%,而使用Softmax预测头的模型Softmax-L4由于缺少上下文语义的约束以及缺乏大规模训练集,表现相比序列标注模型降低了10%~15%。CRF-L4模型在样本数量超过100的属性下几乎都可以超过90%甚至95%,而Softmax-L4即使在样本量足够大的情况下,依然会出现F1小于60%以下的属性类别。模型实验还表明,数据增强对于CRF-L4模型几乎没有提升效果,对于Softmax-L4模型则有2.7%~6.6%的改进。

关 键 词:商品主数据  能源行业  人工智能  深度学习  信息抽取
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号