Viterbi译码器的并行优化设计

摘 要:本文提出了一种(2,1,9)卷积编码及其Viterbi译码的软件实现方案。该方案应用软件技术实现了卷积码维特比译码器功能,在程序实现中充分运用了蝶形运算、周期性回溯等卷积码的固有特性,获得了Viterbi译码输出。重点对蝶形运算和维特比算法进行了SSE并行优化。仿真实验表明,此方案可大幅提高译码效率,缩短处理时间。

关键词:卷积编码;Viterbi译码;SSE并行优化;蝶形运算

中***分类号:TN911.2

随着通信技术的发展,特别是3G时代的普及,人们对通信的准确性提出了很高的要求,为此,在数据传输过程中都采用信道编码技术。由于卷积码编码简单,性能优良被广泛采用。Viterbi算法是一种最大似然译码,在译码过程中要遍历所有可能的状态,所以其计算复杂度很高。现有的实现方法都是单指令数据流,处理效率极低,不能满足现状移动实时通信的需求。对此Intel推出单指令多数据流扩展SSE,SSE是一套专门为单指令多数据架构设计的指令集,它可以实现数据的并行处理,效率极高利用SSE对算法进行并行优化,能提高信号处理的速度,减少时延,满足现代的高速率、大容量通信。

1 卷积码的Viterbi译码器的基本结构

卷积码译码采用经典的维特比译码算法。算法分为两大步骤:前向递推,简单概括为“加、比、选”操作;回溯找出最佳路径。***1为维特比译码器的基本结构。

2 卷积码的Viterbi译码器的结构设计

2.1 维特比译码器的三个重要的参数

维特比译码器存在三重要的参数,分别是径存贮容量、合并距离、回溯路径译码位。径存贮容量定义路径存贮的大小,规定我们周期性的回溯生成译码数据。合并距离的设置使得回溯时可以从任意一个当前状态开始,不需要从最小的度量距离节点开始。回溯路径译码位可以避免因为尽可能多的得到译码输出而增加译码延迟,设置每次的回溯时译码的位数。

2.2 加比选单元的蝶形运算

维特比译码采用向前递推算法,向前递推过程是一个状态转移的过程。TD-SCDMA无线电接收器采用(2,1,9)卷积码的编码方式,卷积码状态寄存器为8,编码器有28=256个状态数。观察卷积码的状态转移过程,可发现其规律性很强,可由多个蝶形***构成,蝶形运算如下***2,整个状态转移***由128个这样的蝶形组成。

加比选的蝶形运算中每个蝶形包括当前状态为i和i+states(states为状态数的一半,这里为128)两个节点的加,比较,和选择运算,他们的0分支和1分支在篱笆***的下一个节点合并。

2.3 分支度量的计算

在计算分支度量时,通常有软判决和硬判决两种输入。对于硬判决采用汉明距离定义,主要是以1或者0来定义。对于软判决可做相似定义,根据软判决的输入位数据顶最大欧氏距离的取值。

2.4 路径存贮记录

从当前状态经过加_比较_选的蝶形运算后,到达下一个状态,通过对每一个分支度量的积累计算留下与接收序列距离最近的幸存路径。

2.5 回溯

我们在程序中设置一个标志位,当路径存贮记录长度第一次超过回溯路径译码位长度时,将标志位复位,继续进行运算。当路径存贮记录长度达到定义的路径存贮容量时,选择从任意一个状态开始进行回溯。先回溯定义的合并距离长度,回溯时只是记录状态,不生成输出译码位,然后从刚得到的状态继续回溯以生成输出译码位。

2.6 程序设计流程***(如***3)

3 维特比算法的SSE并行优化

Viterbi算法是一种最大似然译码,在译码过程中要遍历所有可能的状态,所以其计算复杂度很高。现有的实现方法大多数是采用单指令单数据流串行处理Viterbi译码算法中的加-比-选,遍历每一种状态。这种方法效率低,对通信带来的时延很大,仅适用于低速、小容量,对实时性要求低的通信系统。随着通信技术的发展,低速、小容量的通信显然不能满足人们的需求,人们更希望速率高、实时性好的通信系统。利用SSE对维特比优化,可以大大提高译码效率,提高信号处理的速度,减少时延,满足现代的高速率、大容量通信。

3.1 SSE并行优化维特比的加比选单元

(1)将蝶形运算将其展开,由于SSE的拓展寄存器是128bit,每个状态是32bit。所以展开的次数为4。

(2)将所有出现的数组,将软比特的乘,加,比较,选择,复制到下一个状态,进行分析。

(3)并对其进行SSE并行指令优化,下***4为维特比优化状态***的比较。

3.2 SSE并行优化维特比的函数设计

(1)将软比特的数据存放在两个128bit的寄存器内存中,用bm[]表示4次蝶形运算的软比特数,通过SSE函数“uint32x4_t vld1q_u32(const uint32x4_t *)”将数组分别加载到内存中。

4 测试实验及总结

选取(2,1,9)形式的卷积码按照上述方法进行译码,译码个数分别为100,400,800。用T优化前表示使用传统的Viterbi译码方法译码的时间,T优化后表示使用并行优化后的Viterbi译码方法译码时间,用T优化倍数=T优化前/T优化后表示优化倍数。在测试试验中,分别选取了100,400和800个比特进行编码。为了比较容易看出结果,每次译码时,重复译码10000次,然后算出重复译码10000次的运行前后的时间差,每次试验对1000个时间差求平均,得到的结果如表1所示。从表1可以看出,不论编码个数是100,400还是800,其优化前的时间是优化后的将近4s倍。

5 结语

通过对维特比运算的SSE并行优化,每做一次的蝶形运算的时间,并行优化后可做四次蝶形运算,实现数据的并行处理,大大的提高了程序运行的效率,缩短了运行时间。这样可以利用SSE对算法进行优化效率极高,能提高信号处理的速度,减少时延,满足现代的高速率、大容量通信。

参考文献:

[1]徐超颖.三种使用的纠错编码技术及其软件实现[D].西安交通大学硕士学位论文.

[2]ChiP Fleming A Tutorial on Convolutional Coding with Viterbi Decoding Spectrum Applications,2001.

[3]王新梅,肖国镇.纠错码一原理与方法[M].西安:西安电子科技大学出版社,2002.

[4]青松,程岱松,武建华.数字通信系统的仿真与分析[M].北京:北京航空航天大学出版社,2003.

作者简介:刘庆文(1987-),男,山东泰安人,研究生,研究方向:电子与通信工程;李欣(1960-),男,黑龙江哈尔滨人,硕士生导师,教授,研究方向:无线通信与通信系统;王心志(1986-),男,研究方向:通信与信息系统。

作者单位:哈尔滨理工大学 通信工程系,哈尔滨 150080

转载请注明出处学文网 » Viterbi译码器的并行优化设计

学习

二灰稳定基层材料施工可延迟性规律探讨

阅读(36)

本文为您介绍二灰稳定基层材料施工可延迟性规律探讨,内容包括水泥稳定层施工验收规范,二灰稳定砂砾基层最低施工温度。石灰、粉煤灰类基层材料具有显著的施工可延迟性。本文就该特性分别从室内外进行研究,并从机理上进行分析,认为由于粉煤

学习

试论新闻学和传播学的区别

阅读(43)

本文为您介绍试论新闻学和传播学的区别,内容包括传播学与新闻学的理论可以混用吗,传播学和新闻学的异同。新闻学和传播学的区别在于:从两个学科研究范围比,新闻只是一种特殊的传播现象,更确切的说属于大众传播。传播学的范围包括人际传播、

学习

财经新闻范文

阅读(43)

本文为您介绍财经新闻范文,内容包括财经新闻最新稿范文,财经类新闻稿范文。财经新闻范文第1篇本文主要从财经新闻的传播功能出发,结合当前中国一些主流财经类报纸的受众定位,探讨财经类媒体的受众的主要需求,并结合目前财经新闻的不同受众

学习

姜太公的钓鱼秘诀

阅读(38)

本文为您介绍姜太公的钓鱼秘诀,内容包括姜太公钓鱼原文及讲解,姜太公钓鱼的故事。直钩垂钓没啥了不起,关键是万―来了一条“大鱼”,你有无实力钓上来。《武王伐纣平话》有曰:姜尚因命守时,立钩钓渭水之鱼,不用香饵之食,离水面三尺,尚自言日:“负

学习

知识产权管理范文精选

阅读(43)

本文为您介绍知识产权管理范文精选,内容包括知识产权案例文章怎么写,知识产权管理简介怎么写。知识产权管理篇1随着创业创新成为时代的主流,拥有自主知识产权的组织不断涌现,但是各类组织机构面对伴随而生的大量知识产权档案却缺乏行之有

学习

刘半农与“她”

阅读(41)

本文为您介绍刘半农与“她”,内容包括刘半农教我如何不想她原文作曲者,刘半农创造她字的原因。八十多年前,在我国所有书籍中,都找不到一个“她”字。那时的中文里,出现第三人称代词时,不管男女一律都用“他”字。因此,读者一碰上“他”时,往往

学习

招聘医生

阅读(33)

本文为您介绍招聘医生,内容包括医生招聘模板,招聘医生范文简短。小品招聘医生人物:钱院长、记者小王、应聘大学生张一德、应聘大学生李向前、模拟受伤男孩及奶奶。背景:院长办公室。【幕起。钱院长上。钱院长:这次,院里要招聘一名外科医生,报

学习

多视角阅读:《一路花香》的寓意解读策略

阅读(40)

一、从“物用”角度感悟物有其用寓言《一路花香》一课,言语浅显,抓住物的拟人化,让好罐和破罐成为文本角色,尤其是弱者形象――破罐,共鸣着儿童弱势的内心。人无完人,金无足赤,在一个期盼全面发展、样样俱好的成人主宰时代,儿童总有这样那样的“

学习

年元宵节晚会节目单

阅读(42)

本文为您介绍年元宵节晚会节目单,内容包括江苏元宵节晚会节目单,元宵节晚会2022节目单。2010年元宵节晚会节目单央视2010元宵晚会节目单虎年的春晚,火了19年才重又聚首的小虎队!那一晚全国观众的喝彩和掌声,已经证明了一切。小虎队表演的节

学习

浅谈市委办公室机关作风建设

阅读(35)

本文为您介绍浅谈市委办公室机关作风建设,内容包括机关工委关于作风建设经验做法,办公厅机关作风建设。浅谈市委办公室机关作风建设良好的作风是做好办公室各项工作的保证。在干部职工队伍建设上,总的要求是努力形成九个方面的优良作风,保

学习

新余赛维LDK的盛与衰

阅读(41)

本文为您介绍新余赛维LDK的盛与衰,内容包括新余赛维ldk品质部,赛维ldk新余工厂。【摘要】作为我国光伏产业的领头羊,赛维集团创建于2005年,并在极短的时间内成为了美国纽交所的上市公司,甚至一度被誉为“江西走向世界的一张顶级名片”。而

学习

没有知识的知识分子

阅读(35)

本文为您介绍没有知识的知识分子,内容包括知识分子是没有知识的,有知识的知识分子。知识分子未必是有知识的人。王小波写过,“我年轻时当过知青。当时没什么知识,就被当作知识分子送到乡下去插队”。他还说,当年他被硬推为知识分子,实际上是

学习

基于量子纠缠的量子通信技术

阅读(37)

本文为您介绍基于量子纠缠的量子通信技术,内容包括量子纠缠特性在量子通信的应用,量子纠缠与量子通信论文。一、概论量子是现代物理的重要概念,与经典物理有根本的区别,提供了全新的原理和思考方式。量子具有不确定性和不可测量性,量子的世

学习

供水工程玻璃钢夹砂管道安装施工

阅读(30)

本文为您介绍供水工程玻璃钢夹砂管道安装施工,内容包括黔江区的大口径玻璃钢夹砂排水管,玻璃钢夹砂管道安装。本文作者:徐永英单位:北海市合浦水库工程管理局1工程概况北海市铁山港供水项目工程是北海市铁山港临海工业园的重要配套基础设

学习

基于牛顿—拉夫逊电力系统潮流计算的改进算法

阅读(43)

本文为您介绍基于牛顿—拉夫逊电力系统潮流计算的改进算法,内容包括电力系统中牛顿拉夫逊法计算步骤,牛顿拉夫逊算法和pq分解法优缺点。牛顿-拉夫逊法是求解非线性代数方程有效的迭代计算方法,广泛应用于现代电力系统安全分析、故障诊断

学习

基于蚁群算法的Zigbee网络自组织优化设计

阅读(35)

【摘要】Zigbee网络是一种新型的有限距离、低速率的无线网络技术,特别适用于复杂条件下监控系统的数据传输。本文基于zigbee协议栈构建了一个新型的zigbee网络拓扑结构,并且利用蚁群算法分析研究了其自组织功能实现问题。其网路拓扑结构包

学习

一种低复杂度的OS―CFAR排序算法

阅读(40)

摘要有序统计恒虚警算法是雷达在多目标环境下检测目标的主要方法,数值排序是有序统计恒虚警算法的必要步骤,通常采用的排序算法有希尔排序和快速排序等,本文根据OS-CFAR前后检测单元背景窗有相同单元的特点,提出了一种低复杂度的排序算法,仿

学习

智能交通系统中最短路径算法优化的研究

阅读(56)

本文为您介绍智能交通系统中最短路径算法优化的研究,内容包括优化节点位置得到最短路径,最短路径算法的发展历程。首先本文简单概括的论述了传统Dijkstra算法的基本思想;其次提出了该算法在实现方法上存在的一些不足之处,然>>改进蚁群算法

学习

动态汽车衡称重精度的算法设计及应用

阅读(41)

【摘要】车辆超速及超载是造成交通事故的一个重要原因,并且车辆超速、超载也会加速对公路的损坏,使得人们生命及财产安全受到极大危害,因此要求使用一些先进的手段,对车辆超限超载运输问题做解决。基于此,本文就计重收费系统与CW公路车辆超限

学习

一种基于频繁模式树的正负关联规则挖掘算法

阅读(42)

本文为您介绍一种基于频繁模式树的正负关联规则挖掘算法,内容包括经典决策树算法的分析与研究,决策树算法与关联规则。当前关联规则挖掘主要着眼于正关联规则,如AB的关联规则的挖掘,这种单一的只对正关联规则的挖掘方式存在严重的弊端,他掩

学习

基于4DT预测的低空空域冲突探测及避让算法

阅读(43)

为了预防航空器在低空空域飞行中发生冲突,需要准确的位置预测进行有效的冲突探测,四维轨迹预测(4DT:4dimensionaltrajectory)作为目前精度较高的航空器位置预测方式已经得到广泛使用。本文对4DT的纵向、横向误差进行了分析与拟合,结合最小安全

学习

一种基于数学模型的TDOA定位算法

阅读(59)

本文为您介绍一种基于数学模型的TDOA定位算法,内容包括tdoa算法的定位误差分析,tdoa算法的基本原理。基金项目:“国家质检总局科技计划项目(2012QK244)”。近年来随着无线局域网(WLAN)的兴起,以及支持WIFI接入的移动终端的普及,基于WLAN的各种