利用硬件加速器提高处理器的性能

处理器内部集成的硬件加速器可以实现三种广泛使用的信号处理操作:FIR(有限冲激响应)、IIR(无限冲激响应)和FFT(快速傅里叶变换)。硬件加速器减轻了核处理器的负担,能潜在的提升处理器的计算吞吐率超过两倍。本文以下一代音频系统为例,说明硬件加速器在这方面的应用。

为什么使用硬件加速器

FIR滤波器、IIR滤波器和FFT操作在数字信号处理器中应用十分普遍,且具有规则的结构,因此可以用硬件直接实现,特别是用硬件加速器。硬件加速器是专用的定点功能外设,用于实现重复计算复杂的单个任务。它们减轻了主处理器的负担,主处理可以主要做一些在结构上几乎没有什么规律的通用任务。

由于系统设计者既拥有通用处理器的灵活性,又具有专用硬件的计算优势,因此,使用硬件加速器就提供了一种高性价比的方法,以增加处理器总的计算能力。

因此,这类加速器在满足众多应用领域日益复杂的系统需求方面具有重要价值。其中一个应用是其通道数不断上升的音频系统。家庭影院系统通道数从5.1通道发展到6.1通道,现在已经到7.1通道,而高端汽车功放一般使用12个或者更多的扬声器,使听者沉浸于美妙的音乐中。

此外,音频源内容现在采用高清(HD)格式,其相关的解码器扩展了系统资源。HD算法还以更高的采样率处理数据。以前,数据的峰值采样率很少超过48kHz,有了HD算法,现在采样率通常都是96kHz,有时,甚至达到了192kHz。

为了更好的理解是如何增加计算需求的,以现代化的家庭影院接收系统为考虑,它集成了复杂的室内均衡算法,用以补偿驱动响应和扬声器摆放位置的不同所引起的偏差。算法首先利用麦克风分析室内环境,并测量实时传递函数。在多个位置进行测量再组合分析,然后为每个扬声器设计一个补偿滤波器。

更精确的室内均衡算法则使用FIR滤波器来校正整个频率范围上的响应函数,滤波器长度与采样率直接成比例。低频控制越精确,需要滤波器长度越长。采样率为48kHz,通常滤波器长度为256点,为了达到同样的频率分辨率,在96kHz则需要滤波器长度为512点。采样率和滤波器长度都加倍则导致所需的总计算量增加了四倍。

加速器结构

本节将以ADI公司近期推出的SHARC ADSP-2146x处理器为例介绍加速器的结构,该处理器具有更高的时钟速率(450MHz),并扩展了片上存储器(5Mb)。

此外,处理器还具有一系列硬件加速器,可以用以实现通用信号处理运算:FIR、IIR滤波器和FFT。而这些运算是通信系统、医疗设备、消费产品和工业测量与控制应用中的基本运算。这些加速器是SHARC ADSP-2136x系列处理器片内采样率转换器的有益补充,而采样率转换器也可以看作硬件加速器。

SHARC ADSP-2146x处理器的三个加速器设计相同,***1所示的FIR加速器能很好的说明硬件加速器的结构。

FIR加速器有以下功能模块。

・系列控制寄存器――配置加速器的操作。

・DMA控制器――在主存储器与加速器的本地存储器之间传输数据,也可以用于配置控制寄存器。

・两个本地存储器块――保存系数和状态变量(或者延迟存储器),并降低主存储器的带宽。

・计算单元――包括适合加速器的算术操作,FIR的计算单元有4个并行的MAC。

使用链式DMA,加速器的操作可以自动完成,FIR加速器的典型操作有以下几步。

(1)将本通道的系数数据由内部存储器载入本地加速器系数存储区。

(2)将本通道的状态变量从内部存储器载入本地加速器系数存储区,这包括第一个输入样本。

(3)利用四个MAC单元计算输出样本。

(4)保存结果。

(5)如果还有需要处理的样本,则读取下一个输入样本,并写入状态变量存储器。

(6)重复步骤(3)~(5),直到通道中的所有输出样本计算完。

(7)重复步骤(1)~(6),计算所有输入通道。

加速器的实际应用

设计的应用软件必须尽可能从硬件加速器获取最多的好处,应牢记加速器必须配置成与主CPU并行操作,如果主CPU处于空闲状态等待加速器操作完成,这不会带来任何好处。

加速器是实时环境中运行的大信号链的典型部分,与加速器接口需要双缓存的输入和输出数据,且系统设计人员也应该牢记加速器会带来一部分延时。

设想一个带有7.1通道的家庭影院系统,采样率96kHz,数据块大小为32个采样点,假定室内均衡应用8+FIR滤波器,每个滤波器长度为512点,如果采用核CPU执行滤波操作,则至少需要每秒96kHz×8×512=393MMAC个操作,或者占工作在450MHz的SHARC处理器运算量的44%。该FIR处理占了整个计算量的很大一部分,但在将来,这些都可以转由加速器来处理。FIR滤波器的输入和输出都采用双缓冲,这样就可以让加速器与音频信号处理链的最后环节并行处理。当然,双缓冲器会引入32个采样点的处理延迟,对于96kHz时延迟为333ms,是可以接受的。

而利用前面的计算公式,加速器需要50056个外设时钟周期才能完成操作,如果外设时钟是225MHz,则需要223ms,这小于333ms的可用块处理时间。

结论

音频处理技术的进一步发展对音频DSP提出了更高的要求,集成的硬件加速器为处理器整体处理性能的提升提供了重要的推动力,且将通用的信号处理操作――FIR滤波、IIR滤波和FFT操作――从内核处理器中释放出来,使内核可以专注于其他任务,这种高性价比的方法能提高处理器两倍以上的计算吞吐量。虽然本文主要讨论音频应用,但是处理器核和加速器也是通用的,也非常适合于各种信号处理任务。

转载请注明出处学文网 » 利用硬件加速器提高处理器的性能

学习

公估公司作用

阅读(30)

[论文关键词]保险公估公司保险市场风险评估鉴定理赔[论文摘要]保险公估公司在国外保险市场中占据着重要的地位并发挥着重要的作用,但在我国仅是近几年才真正起步,对保险业外人士而言,保险公估尚是一个新名词。本文对保险公估公司在我国

学习

企业研究论文范文精选

阅读(44)

企业研究论文篇1开题报告是对所确定的课题,在理论上和实际上的意义、价值及可能达到的水平,给予充分的阐述。以下是收集整理的企业研究论文开题报告,希望能对大家有所帮助。1.本课题所涉及的问题在国内(外)的研究现状综述(1)国内对产学研问

学习

摇臂摄像的几个关键步骤

阅读(35)

摇臂的安装。摇臂由于体积大且笨重,安装时除要注意安全外,还要根据现场条件,做到以下几点:一是在马路上安装,要注意来往行人和车辆:二是在楼顶上安装,要注意风力对设备安全的影响(一般摇臂在七米以上比较容易受风力的影响),最好使用具有防风孔的

学习

焊接工艺规程范文

阅读(31)

焊接工艺规程范文第1篇在进行化工机械设备焊接作业时,为保证焊接质量,实现焊接目的,需要在进行工业机械设备焊接作业之前,编制化工设备焊接工艺规程。焊接工艺规程,直接影响着化工机械设备焊接质量。当前,化工机械设备焊接工艺规程主要内容包

学习

weird

阅读(19)

本文为您介绍weird,内容包括weirdo做网名的寓意,weirdgame。weird这个单词在美国电视剧中经常出现,后来到美国之后多次听周围人用到,渐渐地我也开始和美国人一样喜欢用weird这个单词了。weird其实就是很奇怪的意思。虽然strange跟weird都

学习

赏析电影《香水》感悟艺术美

阅读(24)

[摘要]人类对于美感的欣赏和享受来源于对各种事物接触时所产生的感动,是一种能够让人心灵愉悦和放松的精神状态。电影《香水》运用时空、光影、声音、画面等元素,将嗅觉视觉化,带给观众无限的美的体验,通过神奇的嗅觉视觉化之旅将《香水》所

学习

新儒学发展历程

阅读(17)

历史悠久、根基深厚的中国文化,早在晚明清初即已开启其由传统而向近、现代转化的历史闸门。但满清贵族入主中原及其所实施的野蛮的种族歧视和文化统治,使得中国文化近现代化的进程未能以自发式形态一线顺畅展开。迨至道、咸之世的早期启蒙

学习

郑文光:科学与文学的“双栖”

阅读(23)

现代中国,集科学家和作家于一身的人物不能算多,郑文光是科学与文学“双栖”的杰出的一位。知道这个名字已有五十多年了。1954年,我初中毕业的那年暑假,一天看到《中国少年报》上的《从地球到火星》,写三个中国孩子渴望去宇宙探险,偷开一只飞船

学习

过敏性紫癜的护理

阅读(27)

本文为您介绍过敏性紫癜的护理,内容包括过敏性紫癜的护理计划和预期目标,过敏性紫癜的护理总结。过敏性紫癜又称亨-舒综合征(Henoch-Schonleinpurpura,HSP),是一种较常见的微血管变态反应性出血性疾病。病因有感染、食物过敏、药物过敏

学习

SOA在软件工程开发中的应用

阅读(24)

摘要随着软件工程的应用和普及,许多行业引入了先进的分布式管理系统,这些应用软件的功能越来越多,因此开发工作规模也迅速增加。软件工程开发过程中,已经诞生了许多模式,比如快捷程序模式、组件开发模式、MVC模式等,随着面向对象软件编程思想

学习

浅谈消费者网络团购

阅读(25)

团购模式的快速发展,是当前我国电子商务领域出现的新模式,它引导着又一次的消费升级。本文对当前网络团购热潮现状进行分析,从消费者角度分析网络团购对消费者所产生的影响,同时也揭示了网络团购的困境。关键词:消费者网络团购1.电子商务新模

学习

自信重回杨叙的脸上

阅读(25)

杨叙,英特尔全球副总裁、中国区总裁,是我多年的好朋友,也是我的球友。他给我的印象一直是:聪明、能干、自信、坦诚。加之他说话的声音总是充满磁性,同他交流,你会觉得很少有困难可以难住他。他曾经饶有兴致地给我讲当年如何开拓中国市场,如何帮

学习

乒乓球直拍横打技术特征及训练方法的研究

阅读(34)

直拍横打即直拍反面进攻技术,是中国乒乓球队近年来独创的一项反面击球技术,此项技术拓宽了直拍打法的球路。本文通过分析研究直拍横打的技术特征,提出了具有可操作性的系统的直拍横打技术的教学训练方法。关键词:乒乓球直拍横打技术特征训练

学习

“煤电”联动有一年

阅读(31)

国际原油价格近段时期屡刷新高,煤炭价格也追随其一路不断飙升。可靠数据显示,自2D07年9月份以来截止到11月份初,澳大利亚纽卡斯尔港现货煤价已涨了24%;而国内各地煤价也在不断创出新高纪录,10月份主要煤炭中转港秦皇岛港的煤炭平仓价为419元/吨

学习

高速ADC的性能测试

阅读(18)

针对某信号处理机中的高速A/D转换器(ADC)的应用,利用数字信号处理机的硬件平台,采用纯正弦信号作为输入信号,用数字信号处理器(DSP)控制采样,并将A/D转换后的数据存储,进行FFT变换,进而来分析ADC的信噪比及有效位数。该测试方法具有全数字、可编程

学习

混凝土耐热性能试验研究及应用

阅读(31)

对C30混凝土在高温状态下,进行不同粉煤灰掺量、不同粗骨料粒径、不同种类粗骨料、细骨料条件下混凝土的烘干抗压强度、300-700℃条件下的残余强度及耐压强度对比试验。结果表明:减少水泥用量,提高粉煤灰及矿粉用量,降低水胶比,选择高温体积稳

学习

高性能混泥土的配比研究

阅读(42)

本文为您介绍高性能混泥土的配比研究,内容包括高性能混凝土的配比设计步骤,高性能混凝土的配方。在我国社会不断进步的趋势下,国家各项基础设施建设都取得了很大的进步,国家建设的发展也带动了各种建筑材料的发展。作为工程建设中必不可少

学习

导电纤维及其织物的抗静电性能介绍

阅读(25)

本文介绍了导电纤维的几种类型以及其结构、性能特点。对4种抗静电类型的织物未经洗涤、洗涤10次、洗涤20次经行电荷面密度试验,比较了导电性能。关键词:导电纤维;结构;性能特点;导电性能1引言高分子材料多为电阻率极高的材料,由其制成的纺织品

学习

竹浆纤维的力学性能分析

阅读(23)

本文为您介绍竹浆纤维的力学性能分析,内容包括竹纤维和竹浆纤维是一样的吗,再生纤维素和竹浆纤维的区别。为了解竹浆纤维的基本力学性能,为开发竹纤维织物提供理论依据,研究了干态、湿态和常温态下竹浆纤维的力学性能,主要包括单次拉伸性能

学习

漫谈粒子加速器

阅读(31)

发现、研究新的基本粒子,探索微观结构的极限,其使用的基本工具,就是复杂、神秘而又昂贵的人工粒子源——加速器。高能加速器担负的任务是把带电粒子(质子、离子、电子)加速到一定的能量,作为“探针”供各种不同的实验使用。通常研究的客体越小

学习

浅析橡胶沥青性能及应用

阅读(28)

本文为您介绍浅析橡胶沥青性能及应用,内容包括橡胶沥青的优点和缺点,橡胶沥青研究背景。摘要:作为一种新型的理想环保型道路建筑材料,橡胶沥青所具有的抗疲劳性能、抗老化性能、高低温性能及降噪环保性能等性能在道路建筑方面发挥着巨大的

学习

浅谈陶瓷基复合材料的分类及性能特点

阅读(26)

本文为您介绍浅谈陶瓷基复合材料的分类及性能特点,内容包括超高温陶瓷基复合材料概念股,我国陶瓷基复合材料新成果。摘要:陶瓷基复合材料是以陶瓷为基体与各种纤维复合的一类复合材料,有效解决了陶瓷的脆性问题,开始在航空、航天、国防等领