Apriori算法用于频繁子图挖掘的改进方法
2022-08-15
来源:布克知识网
Compu ̄rEngineeringandApplications计算机工程与应用 2011,47(10) 113 Apriori算法用于频繁子图挖掘的改进方法 陈立宁,罗 可 CHEN Lining,LUO Ke 长沙理工大学计算机与通信工程学院,长沙4 1 0076 Institute of Computer and Communication Engineering,Changsha University of Sciences and Technology,Changsha 4 1 0076,China CHEN Lining.LUO Ke.Improved method based on Apriori-based frequent sub-graph mining algorithm.Computer Engi— neering and Applications。2011.47(10):113-117. Abstract:AGM(Apriori—based Graph Mining)algorithm is the first one to put the Apriori idea into the use of frequent sub—graph mining.This algorithm is simple and based on recursion statistics.But graph data set is very large and sub—graph isomorphism problem is available,when candidate subgraphs are generated and SO many redundant sub—graphs would be gen— erated,which makes the high cost in computing time.An improved method based on AGM is proposed to get the reduction of redundant sub・graphs and make the new algoritmh more efifcient in computing time,compared to AGM algorithm.This pa— per examines the computing time for various minimum support,the result of which proves that the improved algorithm cuts down the computing time,compared to AGM algorithm,improving the efifciency of frequent sub—graph mining. Key words:frequent sbu—rgaph mining;Apriori-based Graph Mining(AGM)algorithm;sub-graph isomorphism 摘要:AGM算法最早将Apriori思想应用到频繁子图挖掘中。AGM算法结构简单,以递归统计为基础,但面临庞大的图数据集 时,由于存在子图同构的问题,在生成候选子图时容易产生很多冗余子图,使计算时间开销很大。基于AGM算法,针对候选子图 生成这一环节对原算法进行改进,减少了冗余子图的生成,使改进后的算法在计算时间上具有高效性;测试了在不同最小支持度 情况下改进方法的时间开销。实验结果表明改进算法比原算法缩短了计算时间,提高了频繁子图的挖掘效率。 关键词:频繁子图挖掘;AGM算法;子图同构 DOI:10.3778 ̄.issn.1002—8331.2011.10.032 文章编号:1002—8331(2011)l0.O113.05 文献标识码:A 中图分类号:TP311.11 1引言 但如果图集数据庞大的话,该算法效率较低。主要是因为 随着数据挖掘算法在频繁项集和频繁序列上的成功应 AGM在生成候选子图时要判断是否存在等价k一1子图,如果 用,目前数据挖掘技术开始研究结构化模式挖掘问题——频 k值很大的话,时间的开销很大。再者,候选子图的生成会一 繁子图挖掘…。现实生活中大量存在图形数据,使得关联规则 并产生许多冗余斛1子图。剪枝过程中,判断每个候选子图是 数据挖掘也涉及到图形领域。基于图的数据挖掘提出的时间 否频繁也要花费相当多的时问,并且剪枝后的候选子图仍有 并不长,在图数据集中频繁子图的挖掘是数据挖掘的新方 很多,需要多次重复扫描数据库来计算支持度。这就占用了 向。但图论作为数学的一个研究领域已有很长的研究历史, 大量内存空间和CPU处理时间,很难发现长模式的频繁子图, 因此频繁子图挖掘很快发展起来,并被广泛应用。例如化学 效率不高。 领域,通过频繁子图挖掘算法找出有毒物质的分子结构,通过 根据以上分析,AGM算法主要是在候选子图生成时没有 对网站浏览日志的挖掘分析出最频繁的浏览模式,以及生物 很好解决子图同构所带来的冗余子图生成的问题,从而在计 信息处理等等。因此频繁子图挖掘算法也成为当前数据挖掘 算支持度时也造成了大量的时问开销用于扫描和判断冗余子 领域里一个非常活跃的课题 。 图,影响了算法的效率。因此在AGM算法基础上作出一些改 Akihiro Inokuchi等人最早将Apriori算法应用到频繁子 进,采用邻接矩阵作为图的存储结构,在生成候选子图前加入 图挖掘 ,这就是AGM算法。给定一个图集G={G ,G:,…G } 矩阵正规形判别算法,减少冗余子图的产生,提高算法的效率。 频繁子图挖掘就是发现不低于最小支持度阀值的子图。但是 频繁子图挖掘算法在性能方面存在两个瓶颈:候选子图的生 2算法相关知识 成;候选子图的支持度的计算 。前者主要是如何快速生成候 2.1 Apriori算法思想与原理 选子图,避免产生冗余的子图。后者就是解决子图同构问题。 Apfiofi算法采用一种逐层搜索的迭代方法, 项集用于搜 AGM算法结构简单,以递归统计为基础,挖掘所有频繁子图, 索k+l项集。算法的主要步骤如下:(用厶表示七项频繁集,G 基金项甘:国家自然科学基金(the National Natural Science Foundation of Chma under Grant No.10926189,No.10871031);湖南省科技计划项 目(No.2008FJ301 5)。 作者简介:陈立宁(1984一),男,硕士,主要从事数据库技术、数据挖掘的研究;罗可(1961一),男,博士,教授。E—mail:88380231@qq.corn 收稿日期:2009—11-04;修回日期:2010.01.02 114 2011,47(10) ComputerEngineeringandApplications算机工程与应用 表示 项候选集) (3)计算候选子图的支持度就是计算图数据库中与该图 编码相同的图的个数,换言之就是找出候选子图与输入数据 库中哪些图是子图同构的关系。 (1)连接步 通过将厶一。进行自身连接产生候选k项集,即G。 (2)剪枝步 G是厶的超集,G的成员既包含频繁项也含有非频繁项, 但所有频繁k项集一定都包含在c 中。对数据库进行扫描,确 定G中每个候选的计数,从而确定厶。但是,G可能很大,这 样所涉及的计算量很大。因此,利用任何非频繁的k一1项集 都不是频繁k项集的子集这一性质来压缩G 。若候选k项集 3改进算法的设计思想 3.1邻接矩阵的正规化 诱导子图的支持度定义如下: sup(G ㈤ 的k一1项子集不在厶一 中,则该候选项也不可能是频繁的,可 以从G中删除。 AGM算法同Apriori算法一样,也是由用户设定最小支持 度,挖掘支持度不小于最小支持度的图,即频繁图。在满足下 2.2图的相关定义 顶点和边带有权值的图定义如下: 定义1 V(G)=fv。,v ,… 为图顶点的集合,E(G): f vf,_吩 , ∈ G)}为边的集合, ( G))={lb(v )1 V Vi∈V(G)} 为点的权值集,边的权值集为L(E(G))={Ib( )I vehEE(G)}。则 图G可以定义为G=( G),E(G),L( G)),L(E(G))) 。 定义2邻接矩阵元素定义如下: [num(1b)if ,v )∈E(G) ,、 J一10 if ) 三l(G) 这里,num(1b)表示边的权值,G( )表示图G的存储结构是邻 接矩阵 图的大小即邻接矩阵的维度用l G)f来表示,也就 是顶点的个数。 邻接矩阵的第i行第i列表示图中顶点v ,但是如果顶点标 识分配不同,就是同一个图,也会有多种不同的邻接矩阵表 示,也就是图同构的问题。为了减少复杂性,顶点标识的分配 按点的权值大小的顺序进行设定。图G的邻接矩阵X满足关 系暇 l f∈G(XD)<-,6( j+l {+1∈G( ) =1,2,・一,k一1,令 接 矩阵的第 行标识和第f列标识相当于图中第f顶点。 定义3无向图和有向图的邻接矩阵编码分别定义如下: code(Xk)=x12 1.3 2.3 1,4…Xk 2kx (2) .,l, 同样有向图编码为, code(Xk)=xl2 2.1 1.3 3,1X23X32…Xk 2kX 1,,,,(3) , 定义4图G的诱导子图定义为: G = (G ),E(G ),L(V(G )),L(E(G ))) 其中 G )c ,E(G )cE(G)Vu,v∈V(G ), ,v)∈E(G )营 (U,y)∈E(G)。 2.3 AGM算法简介 AGM算法最早将Apriori思想用于频繁子图挖掘,该算法 能在交易数据库中挖掘出满足最小支持度的所有频繁诱导子 图。AGM算法采用邻接矩阵作为图的存储结构,并且根据邻 接矩阵生成该图的编码。由于存在一图多矩阵的情况,将编 码最小的矩阵作为图的唯一邻接矩阵,以避免直接进行子图 同构的计算。 (1)根据Apriori思想,首先将频繁顶点作为初始项集,判 断X、 是否包含同一个k一1子图x…若包含,则将二者按 编码从小到大顺序将其作为第1操作因子,第2操作因子,生 成候选子图 。i + ,这样每次通过添加一个顶点生成候选 抖1子图。 (2)由Apriori性质,若 。的后子图中有一个是非频繁的, 那么z“。也一定是非频繁的,对 进行剪枝。 面3个条件时按顺序自底向上生成候选子图。 (1)两个顶点数为k的图,其邻接矩阵用 和 来表 示。 和 包含相同的k一1阶子矩阵时,按下述方式结合, 生成2.“ 矩阵。 . = = ] ㈥ fI 一- +1=J,;=…,0 z +・] o/ I (6) ,表示k一1阶邻接矩阵, , (i=1,2)是(k—1)×1的列向 量。X、 叫做2 的第1生成矩阵和第2生成矩阵。 (2)z_“。应当满足以下关系: lb(v Iv ∈V(G( )))=lb(v Iv ∈ (G( + ))) lb(v Iv『∈V(G(rD))=lb(v Ivf∈V(G( +1))) ,6(V Iv ∈V(G( ))) lb(v +。Iv +1∈v(c-(xD)) 似V Iv ∈ (G( )))=lb(v女Iv ∈V(G(Zk+1))) ,6(V Iv ∈V(G( )))=lb(v Iv ∈ (G( +1))) ,6(V Iv ∈V(G( ))) lb(v Iv ∈V(G( ))) 元素 , 以及 。 。并不由 和 所决定,因为图的状 态有很多种,无向与有向,顶点和边是否包含权值,以及孤立 点(即该点与其他顶点之间无边联系)的情况,zh。有 (E(G))I+1 种。为方便叙述,以及减少复杂度,本文只讨论无向图的情 况,并在生成z^+。时一律将 。 。和 设为1。有向图的情况 可以类似地考虑。 (3)图G(Xk)和G( )的第k个顶点权值等价时,X、l 结合 所生成的结阵往往冗长,为了避免,仅在满足code(第1生成矩 阵)Scode(第2生成矩阵)的情况下将邻接矩阵进行结合。满 足上述3个条件的邻接矩阵称作正规形。 G( )是频繁图的必要条件是G(z_“。)的全部诱导子图都 是频繁图。由Apriori的性质,频繁项集所有非空子集也是频 繁的,因此,除去G( 。)的第f顶点(1<i<k一1)的诱导子图的 邻接矩阵如果全部表示的都是频繁图的话,那么G(z|“。)就称 作候选频繁图。改进算法主要是探索生成正规形的邻接矩 阵,因此,有必要对非正规形的邻接矩阵进行正规化。以无向 图为例,给定图和对应的邻接矩阵,如图1所示。 该图有4个顶点,先将这4个点排成4个矩阵,4个点本身 必须是正规形矩阵。选定其中1个矩阵如图2所示。图2中选 取的是顶点v。,将该点与其他3个点的矩阵结合,并求出相应 矩阵的编码。接下来从这3个2维矩阵开始重复前面的方式, 继续对邻接矩阵进行结合。 陈立宁,罗 可:Apriori算法用于频繁子图挖掘的改进方法 .v】厂_ —— 1 rO 0 10 O、 1 l 0 1 0 1 1 l lL0 l 1 0 非正规形邻接矩阵x 图1 无向图以及对应的邻接矩阵图 0 0 0 0 0 l 0 1、 O01 1 1 0 1 f Vl V2 O O 1 0 O O l11 1 l 邻接矩阵 O11 图2邻接矩阵的正规化图 在求得候选子图后,再通过剪枝,扫描数据库计算支持度 以求出频繁图。由于存在子图同构的问题,同一个图也有可 能多个邻接矩阵表示,为了避免同构,选取编码最小的矩阵作 为图的唯一标识。 3.2正准型 图的邻接矩阵集合,记为Matr&Set(G)中拥有最小编码的 邻接矩阵称为正准型。记作, =min code(X),X∈MatrixSet(G) (7) X和 所表示的图等价时,从X到 的变换矩阵 构成 如下: :』l1当 的第f0其他 顶点等于 的射顶点 (一 8) 则 可以用 和 来表示,即 = 。 任意矩阵都有其正准型的变换矩阵。除去G(Xk)的第m 顶点(1<m<k),对邻接矩阵进行正规化,用7 表示求正规化 的变换矩阵。已正规化了的邻接矩阵求其正准型的变换矩阵 用 表示,那么 的变换矩阵 , 可以通过 卫 , 。 求得: 1 ,,0 f 七一1,0≤ 七一1 ={l(i=k,J=k (9) 10,其他 f m, < ,j*k t m_1_,,f> ,-,≠k (10) 1.i= .J=k 0,其他 这里 ,s m,t ,f ,分别是 , 。, , 的元素。 对于 ,其正准型的编码为: = ar,in code((r2sT) ( )) (11) 则 的正准型变换矩阵就是使得 值最小的 。不过, 在计算过程中若已知正准型的变换矩阵S ,则 的正准型可 由下式得出,而不必计算所有的七值进行比较。 S ( ) ( :) (12) 4 算法的改进 4.1 顶点标识以及边标识的顺序关系 由上面所叙述的思想,求矩阵的正规形必须考虑到邻接矩阵顶点与顶点之间,边与边之间标识的顺序关系,凶为这直 接关系到候选子图生成的冗余以及同构问题。随着顶点以及 边标识排列不同,会导致同一个图所对应的邻接矩阵也不同, 进而正规形也不同。为了减少复杂性,对于非频繁图的图中 顶点标识进行统一排序。在交易中按所含各个顶点权值数目 的平均值升序排列。用avg(1b )表示lb 在交易中数目的平均值 if avg(1b )<avg(/b,)then lb <lb, 其中i,J=1,2,…,l ( (G))l,lb <lb 。 至于边的顺序关系,同样按各个边权值在交易中数目平 均值进行升序排列。不过,若是稀疏矩阵的情况,用0表示顶 点问没有边联系时的权值。函数 寸邻接矩阵的元素重新进 行调整分配,并返回大于0的整数值。avg(O)是表示交易输入 的邻接矩阵中所含0的个数的平均值,规定: if avg(/bf)<avg(/b,)then f(num(1b ))<f(num(1b )) if avg(1bf)<avg(O)then f(num(1b ))</(0) if avg(O)<avg(1b )then f(0)<f(num(1b )) 于是邻接矩阵的编码可以写成:  ̄ode(X,)=/( 1.2)_厂 l,3)/( 2.3) ( 1 4)-‘_厂( l ,) 【13) 4.2候选子图生成的判定条件 如3.1节所示,导入正规形概念,生成候选子图,扫描支持 度求取频繁图,需要用到定理:正准型的第1生成矩阵也是正 准型。 证明某个正准型 ,其第1生成矩阵,第2生成矩阵分别 为X 假定 一。非正准型,则存在邻接矩阵X 结构同 G(Xk一。)等价,编码小于code(X ̄一.)则有邻接矩阵y 一 满足同 X 结合的条件,且结构同G(Xk一。)等价,但X 与 一。结合 生成的邻接矩阵 的编码比 要小,这与X是正准型相矛 盾,原命题得证。 要求取频繁图,必须生成所有的正准型,因此必须求出正 规形。上述定理亦可以理解为正准型的所有子矩阵亦是正准 型。根据上述定理给出候选子图生成的一个很重要的判定条 件:当且仅当X是正准型时,才能与 结合生成候选子图 。 矩阵的正准化对正规化算法而言十分必要,因此矩阵的 正规化除满足3.1节中叙述的3个条件外,还应考虑到上述判 定条件。针对以上论述,给出矩阵正规化的算法: 1.i=1: 2.while(i≠ ){ 3. if(x ̄是正规形){ 4 = TX = ( ) Xkf(S ); 5. i++;) 6. else{ 7. 的第i一1行第i一1列与第珩第 列交换 8. if( 是正规形){ 9. = T S =l厂( ) Xkf(S 1o. i++:} 11 else 12. i一一;>) 13.return xk。 x表示 个顶点的邻接矩阵,x是从第1行第1列开始到 第纤亍第 列的子矩阵(1 f<.}i),Si是x的正准型变换矩阵。函 数/和 的关系是: 116 2011,47(10) ComputerEngineering硎 4 『fc口ffD 计算机工程与应用 AGM+顶点标识排序 属茁琳4{ 0≤星莒琳 艇琳制 1 0 0 O O 0 0 0 O O 星曾琳 0《苗罾琳 嫩蜮 O 9 8 7 6 5 4 3 21 O 10O 80 60 40 最小支持度/(%) 图3顶点标识排序后的改进算法同原算法 计算时问比例图 1.O AGM堠选子图生成条件 0 9 0.8 0.7 O.6 0.5 O.4 0.3 0.2 0.1 亘莒敞 苫0v/厦窖琳 媳球斟 垦曾琳 至0v/厘鲁 媳妹裁 0 9 8 7 6 5 4( ] 3 21 O = ( :,L是”阶单位矩阵 (14) 改进算法流程如下: 输入:图集G:{G ,G2,…,G,…G},其中,G (V(Gj),E(G), 三( G)),三( (G))) 输出:频繁图集G, 1.对每个图G将顶点和边分别按其权值从小到大顺序分配标识, 并转换成唯一确定的邻接矩阵。 2对每个图G所对应的邻接矩阵按照上述算法进行正规化,并求 其相应编码,按编码从小到大的顺序对各个图排序。 3.生成候选子图集。按编码大小的升序序列将每个k阶图的邻接 矩阵分别与其身后的矩阵结合。对于两个k阶的邻接矩阵,判断二者 的编码,若其编码的前k一2项相同,说明两矩阵包含同一个.1}一1子 图,可以生成候选“l子图,若不相等,则放弃结合,继续判断其后面 的矩阵。 4对斛1子图集进行剪枝。 5.扫描数据库,计算抖1候选子图的支持度,并根据最小支持度进 行判断,生成斛1频繁图。 6.转第2步,重复上述步骤,直到不再产生新的候选子图为止,算 法结束。 5实验结果及分析 实验针对网络结构中数据流量的变化,对频繁网络环节 点信息数据进行采集,挖掘频繁网络结构模式。算法实验环 境为CPU:Intel Core Duo T2050@801 MHz/1.60 GHz,内存 信息:PC2-5300 DDR2 666 MHz双通道1 GB。实验数据:数 字电视宽带网络流量统计图。 结合4.1和4.2节的内容,在原AGM算法的候选子图的生 成这一环节,考虑到图集中顶点以及边权值标识顺序关系,对 顶点和边的标识加以排序,以唯一确定图的对应邻接矩阵,避 免了将图转换成矩阵表示时出现一图对应多个矩阵的繁杂情 况。同时算法也考虑到候选子图的生成将不可避免地产生冗 余子图,这会增加计算机扫描冗余子图而造成无谓的时问开 AGM+边标识排序 100 80 60 40 20 最小支持度/(%) 图4边标识排序后的改进算法同原算法计 算时问比例图 AGM+ 1.0 0.9 0.8 0 7 0.6 0.5 0.4 0_3 0.2 0.1 销。因此,在候选子图生成之前,对图的邻接矩阵进行正规化 并求出相应的编码得到图的正准型矩阵,一定程度上减少了 冗余子图的生成数量,同时也避免了对子图同构的直接计 算。实验将原AGM算法结合本文所提出的改进方法,针对不 同最小支持度情况下,对结果加以收集并绘制成图表。实验 原始数据由湖南有线邵阳网络有限公司提供。 图3中,“AGM+顶点标识排序”表示在原AGM算法基础 上对图的顶点标识按权值大小进行排序;图4中,“AGM+ ̄标 识排序”表示在原AGM算法基础上对图的边标识按权值大小 进行排序;图5中,“AGM+候选子图生成条件”表示在原AGM 算法基础 加入4.2节所叙述的判定条件;图6中,“AGM+”表 示在AGM算法基础上结合前面3项改进措施后的改进算法。 图3~图6分别表示,上述4种改进算法在不同最小支持度下同 原AGM算法的计算时间的比值。 由图4可以看出“AGM+边标识排序”算法同原算法在计 算时间上几乎没有区别,比值接近于1,效率上没有什么改 进。这是因为子图同构问题主要同构成图的顶点间的标识分 配关系比较大,与边的关系比较小,无向图更明显。顶点标识 分配不同直接影响到图的邻接矩阵的结构,这通过图3的实验 结果可以得到验证。“AGM+顶点标识排序”算法计算时间明显 少于“AGM+边标识排序”,二者分别同原AGM算法计算时间 的比值,前者比后者大约削减了35% ̄60%。 4.2节中所阐述的判定条件,所起到的改进作用主要在于 矩阵与矩阵结合生成候选子图时候减少冗余子图的生成。因 为正准型是编码最小的邻接矩阵,将其作为图的邻接矩阵避 免了对子图同构的直接计算,同时为后一步的候选子图剪枝 也减轻了计算量,缩短了判断候选子图是否频繁所花费的时 间。但是AGM算法的弊端主要还是来自于初始状态下图在 转换成邻接矩阵时由于图本身顶点以及边标识分配的不确定 性而造成一图多矩阵情况,从而在一开始就产生多个冗余矩 阵为后面的同阶子图的判断以及候选子图的生成增加了计算 时问的开销。因此图5的改进算法的效果不如图3。 陈立宁,罗 可:Apriori算法用于频繁子图挖掘的改进方法 图6所示的“AGM+”算法综合了4.1节与4.2节所叙述的 时间上比原算法具有优势。 2011.47(10) 117 内容,由实验数据表明,“AGM+”算法在时间花费上大约削减 了35%-65%,是上述所有改进算法中效果最优的一种。 本文虽然针对AGM算法进行了改进,但仍存在尚待解决 的问题:(1)如何进一步减少冗余子图的生成,降低算法的时 间开销;(2)改进的算法在每次生成高频频繁图集时,仍然需 要扫描数据库,这同原算法无异。如何采用更好的数据结构 或方法来减少数据库的扫描次数,将成为下一步的研究重点。 实验结果显示,改进算法随着用户所给定的最小支持度 的递减,计算时间亦呈递减趋势。说明在支持度较小的情况 下,改进算法在时间效率方面比原算法更具优势。 6结论 本文提出了一种基于AGM算法的改进方法。传统的 参考文献: [1]李先通,李建中,高宏.一种高效频繁子图挖掘算法[J]l软件学报, AGM算法虽然采用了邻接矩阵作为图的存储结构,但也只是 2007,l8(10):2469—2472. 单纯对输入图集进行筛选判断,生成候选子图,并没有很好地 [2]王映龙,杨瑁,周法国,等.加权最大频繁子图挖掘算法的研究[J】. 解决因图的邻接矩阵表示的不确定性所带来的冗余子图的生 计算机工程与应用,2009,45(20):31-34. 成,以及子图同构的问题。面临庞大的图数据集,在候选子图 [3]吴甲,陈峻.一种快速的频繁子图挖掘算法[J]l计算机应用,2008, 生成时冗余子图的数量也呈指数级增长。原算法效率低主要 28(10):2533—2534. 体现在候选子图生成时要判断是否存在等价k一1子图,初始 [4]谢均,尚学群,王淼,等.解决数据样本不平衡性的频繁子图挖掘算 情况下若图存在多个冗余矩阵的话,就增加了判断所需要的 法fJ】计算机工程与应用,2008,44(36):146—147. 计算量。同时,这也造成了候选子图生成时大量冗余子图的 [5]Inokuchi A,Washio T,Motoda H.Complete mining of frequent 产生,进而在剪枝步判断每个候选子图是否频繁也大大增加 patterns from graphs:Mining graph data[J].Machine Learning, 了计算量,时间的开销也增大,从而影响了算法效率。本文的 .2003,50(3):324—340. 改进算法针对子图同构,以及冗佘子图生成的问题,对初始图 [6]王艳辉,吴斌,王柏.频繁子图挖掘算法综述[J J_计算机科学,2005, 顶点、边标识进行排序以唯一确定图的邻接矩阵,同时对矩阵 32(10):193—194. 进行正规化,并求其正准型,以此作为候选子图生成的前提, [7】白似雪,朱涛,梅君.基于图的Apriori改进算法[J]_南昌大学学报, 这在一定程度上减少了冗余子图的生成。改进算法还有优于 2009,31(1):36—37. 原算法的一点的是:在判断两k阶矩阵是否存在相同k一1阶子 [8]黄建明,赵文静,王星星_基于十字链表的Apriori改进算法[J】.计算 矩阵时,由于已经对矩阵正规化,所以无需考虑矩阵本身结构 机工程,2009,35(2):37—38. 只需比较两矩阵的编码的前k一2项,如相同即可认为两矩阵 [9]严蔚敏,吴伟民.数据结构[M].北京:清华大学出版社,1996,7: 可以结合生成 l候选子图。实验结果表明,改进算法在计算 16】一】66 (上接109页) 增长的不同速度。结果表明,该方法仅以很少的性能损失,大 间。对于一个校验节点,,译码器须存储集合 I1/e Ci}中的最 幅减少译码器存储空间,降低了系统复杂度。 小值、次小值,最小值的相对位置;对于行重为6的LDPC码, 需3 bit描述该位置 ;集合 1i∈Ci}中元素的符号位,汁6 bit。 参考文献: 由表3可知,采用Q(8,6)的算法比采用Q(6,4)的改进算法, [1]Gallager R G.Low—density pariyt—check codes[D].Boston:MIT, 要多花费25%的存储空间。由第3章可知,LDPC译码器的主 l963. 要模块都能受益于短位宽的信息量化,因此改进算法和动态 【2]Arbor A.A comparison between the sum-product and the rain—sum 量化方式能以很小的译码性能损失来有效地降低LDPC译码 iterative detection algorithm based on density evolution[C]// Proceedings of Global Telecom Conference,2001,2:1021—1025. 器的硬件复杂度。 [3]Mansour M M.A turbo—decoding message—passing algorithm for 表3 Q(6,4)改进算法所需存储空间与 sparse parity—check matrix codes[J].IEEE Trans on Signal 9(8,6)未改进算法比较 Processing,2006,54(1 1):4376—4392. 算法以及量化 “存储比特数 存储比特数总计/bit比例,(%) [4]Chung S Y,Richardson T J.Analysis of suln product decoding TDMP NMS Q(8,6) (5+5+3+6)×1 152 8x2 304 40 320 100 Of low--density parity・-check codes using a Gaussian approxi-- 改进TDMP NMS Q(6,4)(3+3+3+6)×1 152 6x2 304 3l 104 75 mation[J].IEEE Trans on Information Theory,2001,47(2):657—670. [5]Tanner R M.A recursive approach to low complexiyt codes[J]. 5结语 IEEE Trans on Information Theory,1981,27(5):533—547 对于采用TDMP.NMS算法的LDPC码译码器,本文提出 [6]Bao D,Xiang B,Zeng X Y.Programmable architecture for 了能有效降低其硬件复杂度的方法。硬件复杂度的降低主要 lfexi-・mode Qc・-LDPC decoder supporting wireless LAN/MAN applications and beyond[J].IEEE Trans on Circuits and Systems—I: 通过使用短位宽的信息量化方式。为了克服短位宽引起的信 Regular Papers,2010,57(1):125—138 息饱和噪声,改进了现有算法和固定的量化方式,在译码过程 [7]Ha J,Kim J.Rate—compatible puncturing of low—density pariyt。 中通过不断降低信息的量化精度来增大信息的量化范围。这 check codes[J].IEEE Trans on Information Theory,2004,50(1 1): 种动态量化方式基于一种自适应的方法,来满足信息绝对值 2824—2836.