一种新的频集发现算法P&FP |
| |
引用本文: | 冯中毅 董海棠. 一种新的频集发现算法P&FP[J]. 兰州交通大学学报, 2004, 23(6): 81-84 |
| |
作者姓名: | 冯中毅 董海棠 |
| |
作者单位: | 冯中毅(兰州师范高等专科学校,计算机科学教育系,甘肃,兰州,730070) 董海棠(兰州交通大学,机电工程学院,甘肃,兰州,730070) |
| |
摘 要: | 在分析已有关联规则挖掘算法的基础上,提出了应用于Web 文本集的特征关联规则挖掘框架,详细地论述了该框架所涉及的主要技术和实现过程中涉及的诸多问题,据此给出了该框架主要模块的实现算法.在该框架中,Web 文本集的特征关联规则挖掘以Web 文本的结构化处理和特征化处理为前提,核心的挖掘模块由频集发现算法P&FP 和关联规则生成算法GenNoRedundantRule 构成,算法P&FP 结合了Partition 算法的数据分片思想和FP-生成树算法的高效性,算法GenNoRedundantRule 可以避免大量冗余规则的产生.这两个算法较之已有的算法是比较高效的,而且它们还具有较好的扩展性和并行性.
|
关 键 词: | Web挖掘 Web文本挖掘 关联规则 特征抽取 |
文章编号: | 1001-4373(2004)06-0081-04 |
修稿时间: | 2004-04-15 |
New Algorithm of Finding Frequency Sets |
| |
Abstract: | |
| |
Keywords: | |
|
|