并行配置(精选三篇)
并行配置 篇1
在油田地质勘探研究的过程中, 地质勘探工程师通常需要采用多种手段和途径来对地下地质构造进行分析和研究, 其中一项重要的工作就是在精细地震构造解释的基础上开展地震反演工作, 其目的是通过提取地层岩石的波阻抗属性等, 以此推断地下目标位置的含油气可能性, 提高勘探井位部署的科学性和准确性。目前地震反演手段已在油田勘探井位部署中得到普及应用。
Jason软件是业界流行的主要地震反演软件之一, 以反演算法科学、参数调整灵活、准确度高等著称, 然而其多个模块算法比较复杂, 且运算量较大, 同时地震工区的面积较大, 少则几百平方公里, 多则几千平方公里, 地震数据量较大。若采用单台工作站单个CPU进行反演运算工作, 耗时较长, 不利于勘探部署研究工作的高效开展。因此寻求采用多台工作站多个CPU并行运算开展地震反演工作模式将是必然趋势。
一、Jason软件pvm运行机制介绍
Jason软件包括四大重要模块:Rock Trace (同AVA约束稀疏脉冲反演) 、Stat Mod MC (随机反演) 、Iner Trace Plus (约束稀疏脉冲反演) 和Rock Mod (地质统计反演) 等, 这些模块都采用了较为复杂的数学算法, 像马尔科夫链蒙特卡罗算法 (MCMC) , 是一项从复杂概率分布中获取正确随机样本的技术, 以此为基础实现具有收敛性质的先进算法。复杂算法对工作站的性能要求较高, 单台工作站独立承担运算任务, 耗时较长, 甚至无法产生有效结果。因此Jason软件采用了并行虚拟机技术 (PVM) , 通过利用多台工作站多个CPU分时联合运算产生结果, 实现了在充分发挥计算机资源的基础上高效完成反演任务, 提高工作效率。
PVM代表并行虚拟机, 即Parallel Virtual Machine, 是一种基于工作站网络群机的异构并行软件环境[1], 是利用以太网络将多台工作站连接起来作为一个大型并行计算机 , 满足并行软件系统运行, 实现复杂算法的并行计算。目前这项技术广泛应用于油田地震资料处理、遥感图像处理、气象预测处理等领域。
二、实现反演并行运算的配置步骤与方法
2.1Jason软件并行运算系统环境要求。工作站硬件要求:
1) Intel或AMD芯片双CPU或者多核CPU, 4GB物理内存, 2块500G硬盘和NVIDIA Quadro系列显卡 (用于可视化研究) 。
2) 两台显示器, 分辨率为1600x1200 、1680x1050, 或者更高工作站软件要求。
Red Hat Enterprise release 4.8 or 5.4, 或者更高。多CPU或MCPU模式环境要求:1) 须有支持MCPU运行的软件许可。2) 节点 (工作站) 间须实现免口令互访模式。每台工作站上须有统一的应用用户账号, 而且用rsh 和 ssh方式访问其他并行运算节点时不需要输入口令。3) Jason软件必须安装在统一的硬盘目录, 所有参与并行运算节点都使用NFS模式挂接软件目录。4) 对于所有执行并行运算任务的节点, 其工区数据目录必须在同一个物理硬盘中。
2.2配置步骤。
工作站信息:准备3台满足并行运算要求的工作站, 主机名分别为Z1、Z2、Z3, IP地址分别为192.9.200.11、192.9.200.12、192.9.200.13, 系统分别配置两个硬盘目录:/home1、/home2, 网络为千兆以太网。
规划与目标:在Z1工作站建立用户、安装软件、提供工区目录, 实现任意一台工作站启动Jason软件, 能够利用其他两台工作站资源开展并行运算反演工作。
配置步骤:步骤一:在Z1工作站创建Jason应用用户账号;步骤二:在Z1工作站安装Jason软件系统, 生成工区目录;步骤三:在Z2、Z3工作站配置用户, 并挂接软件和工区目录;步骤四:三台工作站间配置免口令互访模式 (SSH服务) ;步骤五:配置Jason软件多CPU并行运行模式;步骤六:验证软件安装配置。
2.3 实现过程与方法
2.3.1 创建Jason应用用户账号。 用户名为jasonuser , 用户家目录为 /home2/jasonapp/jasonuser。
1) 以超级用户登录创建用户;
2) %#useradd –d /home2/jasonapp/jasonuser –s /bin/csh –r jasonuser。
2.3.2 安装Jason软件系统, 创建工区目录。Jason软件安装在/home2/jasonapp/jasonsoft目录, 工区目录/home2/jasonapp/jasonprj。
1) 以超级用户登录安装软件;
2) 进入软件光盘运行SETUP, 依据提示将软件安装在/home2/jasonapp/jasonsoft目录;
3) %#cd/home2/jasonapp;mkdir jasonprj创建工区目录;
4) %# chown jasonuser jasonprj;
5) %#share /home2/jasonapp将Jason应用目录共享输出。
2.3.3在Z2、Z3工作站配置用户, 并挂接软件和工区目录。以Z2工作站为例, Z3工作站方法相同。1) 以超级用户登录Z2工作站;2) mkdir/home2/jasonapp创建挂接目录;3) mount–tNFSZ1:/home2/jasonappjasonapp以NFS模式挂接;4) 用系统编辑器 (如vi) 编辑文件/etc/passwd, 加入条目如下:Jasonuser::100:10:JasonAccount:/home2/jasonapp/jasonuser:/bin/csh。
2.3.4三台工作站间配置免口令互访模式。远程互访方式分为两种, 一种RSH (remote shell) , 另一种是SSH (secure shell) 。两种方式的安全级别差异较大, 其中SSH访问安全性较高, 主要是其密码等都是加密传输, 而且还有密钥认证的机制[2], 本地存放私钥, 同时把公钥加入到远程的authorized_keys中, 实现不输密码登录和执行远程命令。因此我们采用较为安全的SSH方式。1) 在Z1工作站以jasonuser用户登录系统;2) %> ssh-keygen –t dsa 创建密钥对, 并存放在~/.ssh目录下;3) 提示输入密钥对文件名时, 直接按回车键;4) 再次提问时, 继续按回车键。此时在~/.ssh目录会产生两个文件:id_dsa和id_dsa.pub;5) %> chmod 700 id_dsa;6) %> cat id_dsa.pub >authorized_keys2;7) %> ssh Z1 若不再提示输入口令, 即为设置互访成功;8) %> ssh Z2 分别测试访问Z2和Z3是否正常。
注意:三台工作站主机列表中须实现加入主机名
2.3.5配置Jason软件多CPU并行运行模式
(1) 软件运行环境配置。实现方法有两种:
1) %# /home2/jasonapp/jasonsoft/jqsetup
将三台主机名加在“Linux:”标识后。
2) 直接编辑/home2/jasonapp/jasonsoft/local/etc/pvm.hostfile文件
(2) 用户应用环境配置
2.3.6验证软件安装配置
1) 选择任意一台工作站以jasonuser用户登录。
2) 运行jason软件, 启动软件界面选择“System”菜单下“Unix terminal window”选项。
3) 在新窗口下输入测试命令:
%>pvm–verify
若三台工作站名称都出现, 则可确认MCPU运行模式配置成功。
三、应用效果
在配置Jason软件并行运算模式的基础上, 选择双台子地区叠前反演工作为实例, 工区面积约300平方公里, 叠前道集及地震数据体共计约800GB, 采用的反演算法为常规弹性反演方法, 迭代次数为8次。采用多核CPU, 共计50个CPU内核, 完成并行反演工作耗时约10小时。采用单节点单CPU完成反演工作耗时约48小时。由此看出并行运算方式提高运算效率5倍左右, 节约了反演工作运行时间, 提高了勘探研究工作效率。
四、结束语
目前在油田地质勘探研究过程中, 需要许多勘探应用软件和高性能计算机做支撑, 如何高效利用各类勘探软件功能, 充分发挥各类计算机资源, 是从事油田勘探计算机运维工程师的重要任务。本文研究形成的Jason软件多节点并行运行模式, 对于提高勘探地质研究工作效率, 充分发挥计算机软硬件资源提供了行之有效的途径和方法, 值得进一步推广应用。
摘要:通过对Jason软件运行机制的研究, 结合linux系统功能, 实现了Jason软件反演模块复杂算法的多节点并行运算, 提高了地震反演工作效率, 缩短了勘探研究周期。本文详细介绍了实现反演并行运算的配置方法和步骤。
关键词:地震反演,并行运算,配置方法
参考文献
[1]崔振乾, 吴中海, 等.基于工作站群机的并行虚拟机PVM分析[J].计算机工程, 1995.
并行配置 篇2
无功补偿电容器是配电网中最主要的无功补偿设备之一。合理经济地确定电容器的最佳装设位置及最优补偿容量,对改善系统的电能质量、减小网络损耗、增强系统供电能力有着重要意义。
配电网无功补偿电容器优化配置问题在数学上表现为一个复杂的多变量多约束的非线性整数规划问题。它具有非线性不可微、离散性、约束条件复杂等特点[1]。遗传算法等人工智能寻优的方法目前在解决这一类问题中得到了大量的应用[2~5]。针对普通遗传算法易陷入早熟收敛的现象,本文采用伪并行运算的改进遗传算法,以保持寻优过程中群体的多样性,提高全局收敛的能力和寻优速度。
1 配电网无功优化的数学模型
配电网电容器优化配置的目标是在满足系统潮流及其它控制约束情况下,确定经济合理的电容器组数量和安装位置,实现系统的年运行网络损耗费用最小。优化模型包括目标函数、系统潮流约束、控制变量约束和状态变量约束。
1.1 目标函数
配电网中配置无功补偿电容器的主要目的是维持电压稳定,减少系统网损,本文考虑以系统年运行网损为目标函数。
式中:Ccost为单位有功网损电度价格,br为支路数,iP和iQ为支路末端有功负荷和无功负荷,Ui为支路末端节点电压,Ri为该支路的电阻。
1.2 约束条件
电容器最优配置算法的约束条件包括系统潮流约束和控制变量约束。
1)系统潮流约束
系统各节点的电压需控制在要求范围内。
2)控制变量约束
配电网电容器优化配置问题的控制变量约束包括:各支路补偿位置数Ncl不超过支路安装要求上限Nclm。
3)投资回收期约束(ROI)
考虑到电容器补偿的降损节能效果,还应将电容器配置的投资回收期作为优化配置的约束。
式中:Cinv为电容器总的投资,包括设备费用和维护费用两部分。设备费用总投资可用现值对应的等年值SC给出:
式中:Cinvu为单个电容器组现值单价;t为贴现率;P为电容器的使用寿命。
维护费用Cm按设备投资的比例η给出:
2 伪并行遗传算法求解电容器组优化配置问题
2.1 伪并行遗传算法特点
在普通遗传算法(GA)的搜索过程中,由于超常个体的存在(该个体的适应值比其它个体高得多),往往导致未成熟收敛现象。另外,如果初始解生成得不好,即初始解集中分布于解空间某角落,易导致出现局部最优。如果以增大种群规模来提高多样性,则会付出很大的时间代价[6]。
针对遗传算法所存在的上述缺陷,受多处理机的并行计算的启发,本文采用可在单处理机上计算的伪并行遗传算法结构模型PPGA(Pseudo Parallel GA)。
PPGA在GA的基础上引入了以下几个概念:
a.突破GA仅靠单个种群进行遗传进化的框架,引入多个种群同时进行优化搜索;不同种群赋以不同的控制参数,实现不同的搜索目的。
b.各个种群之间通过迁移策略进行联系,实现多种群的协同进化;最优解的获得是多个种群协同进化的结果。
c.通过人工选择算子将各种群每个进化代中的最优个体选择保存,并作为判断算法收敛的依据。
PPGA的迁移策略的主要控制参数:
a.迁移规模。以每次迁移中迁移的个体数目或者子群大小的百分比给出。
b.迁移率。决定了个体迁移的时间间隔,一般是隔几代迁移一次。
c.迁移选择。选出哪些个体参与迁移操作,可以根据适应值大小来选择。
2.2 算法结构
兼顾算法的全局搜索和局部搜索,本算法按照初始种群中个体的适应值排序,将初始种群分为3个种群。PPGA的算法结构如图1所示。
其中种群1采用较小的交叉概率Pc1和变异概率Pm1,以更多保留优秀个体信息,同时增强算法的局部细化搜索能力;种群3采用较大的交叉概率Pc3和变异概率Pm3,以增强个体间差异,同时侧重于算法的全局搜索;种群2的交叉和变异概率取中间值,以保持全局搜索能力和局部搜索能力的均衡。
各种群独立进化操作的同时,每经过一定的代数,通过迁移控制进行一次信息种群间的个体交换,以保持各种群内种群多样性。
在进化的每一代,通过人工选择算子选出3个种群的最优个体放入最优解库中保存。进化过程终止后,将库中个体排序,可以给出最优规划方案和若干次优方案。
2.3 电容器优化配置算法主要步骤
(1)将染色体和适应度分别对应于开关的优化配置问题的可行解和目标函数。
为便于观察,适应度求解公式采用:
其中:Closs1-Closs2为某个体对应配置方案同配置前相比线损减少的费用;在适应度选取中引入电压超限罚函数系数1λ,并根据超限幅度折算为线损费用;同样引入电容器配置方案的相应投资费用罚函数系数2λ,以引导解向电容器组数少的方向收敛。
(2)确定初始种群和子种群规模、各子种群的控制及相关参数;
(3)染色体初始化,形成子种群;
(4)各子种群进行独立的遗传操作,计算适应值,更新优解库;
(5)满足迁移条件则迁移操作;
(6)进化终止条件判断。
3 算例分析
为检验本章提出的基于改进遗传算法的有效性,作者编制了算法的程序,并以IEEE 30节点典型配电系统为算例进行了计算和对比分析,配电系统结构及参数见文献[7],电容器容器取每组300 kvar。
3.1 计算分析
(1)控制参数
运算控制参数如表1所示。迭代次数取100次;隔5代进行一次种群间个体迁移操作,迁移规模为3个个体。进行迁移选择时,根据各种群按照适应度排序的结果,选取种群1中后3个迁移到种群2,取种群2中后3个迁移到种群3,取种群3中前3个迁移到种群1。
(2)结果分析
采用文中所述的基于迁移策略的遗传算法进行解的寻优,结果放优解库中,其中包含一个最优解和多个备选方案的次优解,可根据现场实际情况选取。图2所示为最优解的位置。
相应网损计算结果如表2所示。
此方案为综合考虑投资回收期的最优控制方案,在此方案下可减少线路有功功率损耗210.34 kW,如果按每年8 760小时,购入电价0.4元/k Wh计,每年可节约电费73.7万元;按照人民币150元/kvar的投资计算,6组电容器共需投入27万元,则投资回收期为5个月。
3.2 同普通GA的寻优效果比较
为检验文中所采用的改进遗传算法相对于普通遗传算法的优势,采用普通遗传算法对相同网络进行求解,控制参数同多种群遗传算法中的中等种群参数相同,即交叉概率Pc取0.5,变异概率Pm取0.05,种群规模为40个个体。
图3为两种算法的求解过程比较。其中图3(a)为采用改进遗传算法的求解过程,图3(b)为采用普通遗传算法的求解过程,从图中可以看出,采用伪并行遗传算法进行最优解的搜索,在15代左右即可收敛,并且是全局最优解;而普通遗传算法在40代以后趋于收敛,且线损减少值没有达到前面多种群遗传算法的效果,可认为是局部收敛。
表3为采用两种算法分别进行100次求解的结果统计,从中可以看出,本文所提的PPGA算法从收敛速度上和全局收敛能力上都优于普通GA算法。
4 结论
遗传算法是解决无功优化类离散寻优问题的有效方法。但普通遗传算法易陷入早熟收敛的特性限制了其在此类问题中的直接应用。本文采用了伪并行运算的改进遗传算法,采用多个种群同时按照不同参数进化,以保持较优个体在种群中的比例,同时采用种群间个体迁移交换策略,以保证个体多样性。此方法可以显著提高算法的计算速度和全局收敛能力,为大规模复杂配电系统的无功优化规划提供了有效的思路。
参考文献
[1]胡海燕,武晓朦,刘健.基于遗传算法的配电网低压侧无功补偿动态优化规划[J].电力自动化设备,2005,25(3):25-29.HU Hai-yan,WU Xiao-meng,LIU Jian.Genetic Algorithm Based Optimal Dynamic Planning of Low-voltage Side Reactive Power Compensators[J].Electric Power Automation Equipment,2005,25(3):25-29.
[2]张敬平,梁志瑞,苏海锋,等.基于改进排挤小生境遗传算法配网无功优化研究[J].继电器,2007,35(10):19-22.ZHANG Jing-ping,LIANG Zhi-rui,SU Hai-feng,et al.Research on Reactive Power Optimization of Distribution Network Based on the Improved Crowding Niche Genetic Algorithm[J].Relay,2007,35(10):19-22.
[3]任震,唐卓尧,等.电网无功优化的改进遗传算法[J].电力自动化设备,2002,22(8):16-19.REN Zhen,TANG Zhuo-yao,et al.Improved Genetic Algorithm for Reactive Power Optimization of ElectricNetwork[J].Electric Power Automation Equipment,2002,22(8):16-19.
[4]倪炜,单渊达.具有优化路径的遗传算法应用于电力系统无功优化[J].电力系统自动化,2000,24(21):40-44.NI Wei,SHAN Yuan-da.A Refined Genetic Algorithm with Optimal Searching Path Used in Power System Reactive Power Optimization[J].Automation of Electric Power Systems,2000,24(21):40-44.
[5]杨丽徙,徐中友,朱向前.基于改进遗传算法的配电网无功优化规划[J].华北电力大学学报,2007,34(1):26-30.YANG Li-xi,XU Zhong-you,ZHU Xiang-qian.Optimization of Reactive Power Planning of Distribution Systems Based on Improved Genetic Algorithm[J].Journal of North China Electric Power University,2007,34(1):26-30.
[6]玄光男,程润伟.遗传算法与工程设计[M].北京:科学出版社,2000.XUAN Guang-nan,CHENG Run-wei.Genetic Algorithms and Engineering Design[M].Beijing:Science Press,2000.
并行配置 篇3
DVB-S2[1,2]是欧洲数字视频广播 (DVB) 项目组在2003年开发出来的第二代卫星广播标准。DVB-S2充分利用信道编码和高阶调制技术的最新进展, 力求实现性能和复杂度的最佳平衡。在相同的传播条件下, 相比DVB-S其信道容量提升可达35%。DVB-S2标准采用BCH码与LDPC码级联的前向纠错 (FEC) 系统, 其性能接近理论极限。但是, LDPC在非常低的误比特率条件下会出现误码平台, 随着信噪比的提高, 其译码性能相应下降, BCH码是一类重要而有效的可纠正多个随机错误的线性纠错码, 主要应用于各种数字通信系统的可靠数据传输中。BCH码性能优良, 结构简单, 具有严格的代数结构, 是目前使用最广泛的纠错码之一[3], 因此引入BCH码作为外码, 以抵抗误码平台的出现。
本文针对DVB-S2标准中BCH码的特殊性, 对超长码字下BCH编码以及相应的译码器的参数配置方法和并行实现结构进行了研究, 并以第二代数字视频广播标准DVB-S2中BCH码的应用特点为需求, 以较小的硬件资源, 设计实现了可配置21种码字参数的并行BCH编/译码器, 具有较高的吞吐率, 能够满足DVB-S2各种应用需求, 本设计已经在某卫星通信系统调制器中得到具体应用。
1 并行可配置BCH编码器
设待编码数据信息长度为k, 向量表示形式为:m=[mk-1, mk-2, ⋯, m1, m0], 对应的多项式表示为:m (x) =mk-1xk-1+⋯+m1x+m0。定义编码生成多项式g (x) , BCH编码实现采用以下三个步骤完成:
(1) xn-k乘以信息多项式m (x) ;
(2) xn-km (x) 除以生成多项式g (x) 得到余式r (x) ;
(3) 联合xn-km (x) 和r (x) 得到编码后的码字多项式xn-km (x) +r (x) 。
BCH循环码生成多项式的计算公式为:
其中:g1 (x) ⋅g2 (x) ⋯gi (x) 是g (x) 零点的最小多项式, gi (x) 中i=t, t为BCH译码最大纠错数。LCM表示这些最小多项式的最小公倍式。对于DVB-S2标准而言, 码率与帧长一旦确定, 对应的生成多项式g1 (x) ⋅g2 (x) ⋯gi (x) 是确定的, 进而对应的生成多项式g (x) 是确定的, 对于不同的码率和帧长, 存在4种不同长度的生成多项式, 如表1所示。
为了提高编码速度, 通常采用并行结构实现BCH编码[4]。设生成多项式为[gr, gr-1, ⋯, g2, g1], 编码并行度为p。BCH并行编码的步骤为:
(1) 利用生成多项式[gr, gr-1, ⋯, g2, g1]构造状态矩阵, 如式 (1) 所示, 其中矩阵右上角的p表示对矩阵求p次幂并执行模2操作。
(2) 根据当前时刻计算得到校验值, 利用式 (2) 的根, 计算下一时刻的校验值。
其中, R (T) =[rr (T) , rr-1 (T) , ⋯, r2 (T) , r1 (T) ]T表示当前时刻计算得到的校验值, R (T+1) 表示下一时刻的计算值。Mp=[x (T+1) , ⋯, x (T+p) , 0, ⋯, 0]T表示T时刻的p个并行信息, 初始值R (0) =[0, ⋯, 0]T, 当所有的信息输入完成后, R (T+1) 为BCH编码得到的监督码。
通过可配置性分析, 由于BCH编码器具有4种不同形式的生成多项式, 那么只需要不同的帧长、码率, 选择对应的生成多项式预先计算出4种对应的F (r, r) 1, F (r, r) 2, F (r, r) 3, F (r, r) 4, 即可以根据式 (2) 设计BCH编码器。BCH编码硬件实现结构示意图如图1所示。
设计时, 采用阶数最高的生成多项式设计, 当需要转换不同F (r, r) 时, 通过重配逻辑完成其逻辑切换并利用计数器控制编码器的工作起止时间以实现不同长度的BCH编码控制, 即可实现不同码率的编码。
2 并行可配置BCH译码器
采用迭代[5]译码算法进行BCH译码主要经过4个步骤[1]:
(1) 根据接收到的码字计算出伴随式;
(2) 根据伴随式求解错误位置多项式;
(3) 对错误位置多项式进行钱搜索得到错误位置码流;
(4) 根据错误位置对接收到的码字进行纠错输出正确的信息, 完成译码。
上述算法对应的硬件结构如图2所示。对于不同的码长, 伴随子计算、i-BM迭代、钱搜索和纠错输出均需要通过参数配置实现不同码率以及帧长的配置和重构, 后续章节对并行结构以及参数重配计算关键步骤将作进一步阐述。
2.1 伴随式并行计算
根据伴随式的定义伴随式可以采用公式计算, t为BCH可纠错码的个数, 假设采用的并行比特数为S。在串行伴随式计算中, 从码字输入的开始到经过p×j后, 伴随式寄存器值为Si=R (αi) =rn-1 (αi) p×j-1+⋯+rn-p×j+1 (αi) 1+rn-p×j (αi) 0, 这就是伴随式计算的并行计算公式, 考虑到接收的码元Rn-1, ⋯, R0为二进制域, 则对应的并行硬件实现结构[6]如图3所示。
2.2 钱搜索
经过迭代算法得到错误位置多项式σ (x) 之后, 可以采用试根法获取码字的错误位置信息。设R (x) =rn-1xn-1+rn-2xn-2+⋯+r1x+r0, 其中n为BCH编码后的码元个数, 信息码元k个, 监督码元n-k个。那么需要验证前k个码元是否存在误码。为了验证第rn-1是否错误, 需要确定α- (n-1) 是否为σ (x) 的根, 而α- (n-1) =1⊗α- (n-1) =αn⊗α- (n-1) =α, 当完成α~αk的遍历后即可。若σ (αi) =0则表示第i个接收码元出错, 对出错的误码取反即可完成纠错。对于并行度为p的钱搜索算法, 需计算σ (αp∙j+1) , σ (αp∙j+2) , ⋯, σ (αp∙j+p) , j∈[0, k p-1], 其并行结构如图4所示。
2.3 可配置技术
BCH译码器的可配置性设计关键在于解决三个兼容性问题:
(1) 不同的BCH码, BCH译码器具有不同纠错能力t的兼容性问题:DVB-S2标准中BCH最大纠错数有8, 10, 12三种, 伴随子计需要计算2t个伴随子, 简化后的i-BM迭代需要t次, 错误位置多项式的系数为t+1个。因此, 在兼容性设计方面需要按照最大化设计, 选取t=12完成设计。根据配置控制信息, 舍弃多余的伴随子计算结果、控制迭代次数即可达到纠错数兼容目的。
(2) 短帧和普通帧两种不同帧长分别对应不同GF (214) 和GF (216) 的乘法和加法运算, 必须考虑其兼容性设计, 对于两种扩域的乘法计算, 统一采用位宽16 b实现, 对于14 b的数据采用高位补2 b零值进行处理, 通过配置控制信号实现两种域的乘法逻辑电路选择实现电路兼容。
(3) 不同BCH码的帧长兼容性问题, 帧长决定了BCH编码和译码的长度, 可以通过计数器控制码元计算长度, 在纠错输出, 数据缓存区的设计也采用最大化设计, 对于不同长度的信息, 通过计数器控制输出以实现码长的兼容。
以上三个兼容性问题完成后, 即可实现21种不同格式的BCH编码以及译码操作。
3 BCH编/译码器仿真测试及综合结果
本文最终采用Verilog硬件描述语言实现了本文所描述的4 b-BCH并行编码器和译码器, 在ModelSim 10.2中对硬件设计的正确性进行了仿真, 仿真平台示意图如图5所示。在BCH纠错范围内, BCH译码的输出结果和原始的信息位比较结果完全相同。在Altera的Quartus-Ⅱ13.0平台下, 采用芯片EP3C120F484-I7完成代码布局布线, 资源消耗如表2所示。表2为并行结构下的资源消耗以及代码最高综合频率, 表中对并行结构的资源消耗和串行结构资源消耗进行了对比, 可见并行结构以一定的资源消耗为代价换取吞吐率的提高。
4 结语
本文针对DVB-S2标准下BCH码的特殊性, 对BCH编/译码参数配置关键技术及并行编/译码技术进行了研究和分析, 在此基础上, 实现了应用于DVB-S2的可动态配置21种码字参数的4位并行译码器, 以较小的资源开销换取了串行结构4倍吞吐率。本文所提出的BCH编码器和译码器能够满足DVB-S2标准协议下的各种应用场合, 具有较高的应用价值。
参考文献
[1]ETSI.EN302307 Digital video broadcasting (DVB) , second generation framing structure, channel coding and modulation systems form broadcasting, interactive services, news gathering and other broadband satellite applications[S].France:ETSI, 2007:3.
[2]ETSI.TR102376 User guidelines for the second generation system for broadcasting, interactive services, news gathering and other broadband satellite applications[S].France:ETSI, 2007:5.
[3]王新梅, 肖国镇.纠错码:原理与方法[M].西安:西安电子科技大学出版社, 2001.
[4]PEI T B, ZUKOWSKI C.High-speed parallel CRC circuits in VLSI[J].IEEE Transactions on Communications, 1992, 40 (4) :653-657.
[5]CHANG H C, SHUNG C B.New serial architecture for the Berlekamp-Massey algorithm[J].IEEE Transactions on Communication, 1999, 47 (4) :481-483.