您当前的位置:网站首页>大猩猩,激光点云解算的软硬件协同规划与完成,腾讯企业邮箱

大猩猩,激光点云解算的软硬件协同规划与完成,腾讯企业邮箱

2019-04-05 11:21:40 投稿作者:admin 围观人数:308 评论人数:0次

近年来,遥感技能迅猛开展,激光雷达技能(Light Detecti胡志明市on And Ranging,LiDAR)可以快速获取并实时处理形时刻校准成高精度地表多维信息[1],在车载、机载和星载等渠道具有广泛使用[2-4],LiDAR的实时性处理问题是现在的研讨热门。LiDAR系统获取的原始数据需求经过点云解算才干构成三维数据,点云解算是LiDAR系统数据处理算法中必不可少的环节,具有核算量大、处理算法盘丝洞杂乱等特色,机载和星载等高速渠道更是对点云解算实时性处理提出了更高的要求[5],一起也对系统的硬件资源和功耗有着严厉束缚。

跟着超大规模集成电路技能的迅速开展,片上系统[6](System on a Chip,SoC)被广泛使用于核算机、电子通讯和军工等范畴,多核异构[7]的运算处理形式可以有用进步系统的运算功能,经过ARM处理器完结灵活性较高的软件完结,合作或ASIC对系统进行硬件加快,这种的开发形式可以充沛发挥异构处理核各自的优势,在短周期内完结低功耗、高功能的实时处理系统。

本文选用根据软硬件协同的规划办法,充沛结合点云解算的数据和运算特色,雷蛇官网运用流水线优化和本地存储优化战略,开发了根据FPGA的硬件加快器,进步点云解算的运算功能。

1 激光点云解算原理

激光点云解算是将激光雷达测距数据和定位定向系统(Positio雷达n and Orientation System,POS)设备的方位姿势信息进行联合解算,得到每个激光点元的三维坐标的进程,处理流程图如图1所示。这个进程触及激光雷达距离信息解算、POS数据解算、坐标改换和高斯投影等进程,其间高斯投影触及很多的乘法和三角运算,是该算法的功能瓶颈。

激光点云解算的软硬件协同规划与完结

2 软硬件协同规划与完结

2.1 SoC结构规划

本文将激光点云解算分为软件完结和硬件加快两个部分,其间一部分是将运算简略、具有较多判别句子和指针操作的算法模块交由PS端软件完结。另一部分则是将对算法功能影响较大,可并向化程攸度高而且不需求逻辑判别的部分用PL端的FPGA硬件加快器完结,以取得更短的处理时耗。PL端的硬件逻辑电路经过流水线办法火锅英豪优化和本地存储优化,完结SoC的功能加快。

激光雷达测距数据以及对应的POS数据存储在外部存储单元中,之后读取到PS端的内存中。PS端负责处理激光点元的距离解算、POS数据解算和坐标改换三个模块的运算。高斯投影模块处理的点云数据间的依赖性低,可并行化程度较高,由PL端的硬件逻辑电路完结。终究PS端将处理完结大猩猩,激光点云解算的软硬件协同规划与完结,腾讯企业邮箱的三维点云坐标成果存储到外部存储单元中。SoC结构规划如图2所示。

激光点云解算的软硬件协同规划与完结

2.2 通讯规划

PL端和PS端之间的数据通讯是完结软硬件协同处理的重要组男模7成部分,首要分为音讯通讯和数据传输两部分。音讯通讯首要是完结PL端的硬件加快器和PS端的处理器之间的状况反应。数据传输完结硬件加快器和处理器之间很多的运管用据的传递,包含硬件加快器运管用大猩猩,激光点云解算的软硬件协同规划与完结,腾讯企业邮箱据的输入传输和运算成果数据的回写传输。

结合FPGA本地存储空间小而拜访速度快、主存储器空间大而拜访速度较慢以及点云解算具有按扫描行存储处理数据的特色,为了获取PS端和PL端的最大传输功能,本文运用了根据AXI-4协议[8]的DMA高速传输办法。DMA是一种高效的数据传递办法,经过DMA操控器完结硬件加快器和内存之间的数据传递,无需ARM核CPU的干涉。因而大猩猩,激光点云解算的软硬件协同规划与完结,腾讯企业邮箱,在PL端的FPGA硬件加快器拜访主存的时分,PS端的CPU可以继Ezgirl续履行程序。AXI-4协议具有独立的读和写数据通道,支撑低成本的直接存储器拜访DMA传输。一起,该协议是根据开端地址的猝发式传输,可以完结整块数据的搬移,并具有广泛的IP可拓展性。

本文在规划FPGA硬件加快器时精简了操控信号,只保存数据传输的起止反应信号,进一步削减了传输量和时延,将点云解管用据转化为流数据进行传输,完结硬件加快器和ARM处理器之间的高速数据通讯。

DMA传输不可避免地会带来Cache数据和内存数据不一致的问题[9]。如图3所示,CPU经过DMA操控器来操控PL端的硬件加快器和PS端的内存之间的数据传送。当硬件加快器将处理完结的数据回写到内存中,这时内存中变龟量A现已更新,但Cache中变量A的值不变。在CPU拜访变量A时,射中Cache获取了旧值而不是内存中现已更新的A值,引发数据不一致现象。

本文经过XSDK开发环境中的cacheFlush和cacheIncalidate函数在PS端处理了保护Cache一致性的问题:在通讯数据经过DMA传入FPGA硬件加快器之前,运用cacheFlush函数将Cache中对应的缓存数据压入DDR中。在硬件加快器完结数据处理并回写成果到DDR后,运用cacheIncalidate函数坚持DDR和CPU之间的数据同步。

2.3 加快器规划与优化

硬件痒孟楠加快器的规划由FPGA完结,包含通讯单元、运算处理单元和存储单元,大猩猩,激光点云解算的软硬件协同规划与完结,腾讯企业邮箱为了进一步进步运转功能,进行运算处理单元流水线优化和存储单元的优化。

2.3.1 流水线优化

为了添加程序的并发性,流水线优化可以使屡次迭代中的相同操作顺次履行,在不大起伏添加硬件资源的状况下,最大极限地减小迭代间的时延,进步硬件加快器的运算功率。下面临处理函数的流水线优化进行阐明。

如图4所示,用循环对每个激光雷达点元进行处理,假定每个点元的处理周期为T,共有N个点元,则七零四行宫流水线优化前,需求的总时钟个数为NT个周期;流水线优化后,假定循环迭代间的周期距离为Ti,则总时钟为NTi+T个周期,功能进步倍数为:

在XHLS开发环境中经过PIPELINE优化指令可以对硬件加快器运算处理的循环函数进行流水线优化,经过迭代距离(Initiation Interval,II)束缚因子,可以对流水线的迭代距离进行操控,从而影响硬件加快器的流我国高速公路网水线的功能和硬件资源耗费。本文经过流水线优化规划,在流水线迭代距离II=5的状况下,可以完结FPGA运算功能近35倍的进步。

2.3.2 存储优化

在一般的流水线规划中,数据的本地存储是相对独立的,即先将DMA数据流悉数读取到FPGA本地存储单元,再进行流水线运算处理,将处理成果写入到本地存储单元,终究经过DMA全体回写到PS端的内存中,这种处理形式既耗费FPGA的硬件存储资源又添加了处理时延。

本文结合点云解管用据独立性强,数据间依赖性弱的特色,优化FPGA本地存储,直接将DMA传输的数据通道连接入运算流水线上,使每个点元数据的读写直接“镶嵌”到流水线处理中,进一步削减本地存储和时延,硬件加快器的全体运算功能在流水线的根底上再进步2倍。存储优化前后示意图如图5所示。

3 试验成果剖析

试验选用Xilinx公司的Zedboard开发板,该板以ZYNQ-7000芯片为中心,集成Cortex-A9双ARM处理核和Artix7 FPGA可编程逻辑阵列。试验时,PS端的ARM处理器主频设置为667 MHz,PL端的FPGA时钟频率为100 MHz。试验激光点云原始数据来自某线阵推扫LiDAR载荷飞翔试验获取的一段数据,行数为666行,每行数据量为1 448 B,每行对应的载荷方位POS数据量为56 B,总数据量为978 KB。

3.1 硬件资源耗费

试验剖析了FPGA硬件加快器的流水线规划中,不同迭代距离II对其硬件资源的占用率的影响。在数据维生素ad滴剂处理量必定的状况下,流水线的II束缚因子别离设置为2、5、10、20、40妇女相片,获取加快器的硬件资源耗费状况和对应的处理时延,并核算其相对于流水线优化前的功能进步倍数,如表1所示。

从表1可知,跟着流水线的迭代距离(II)减小,硬件加快器的4种类型的硬件资源耗费在不断添加。当束缚因子II向1个时钟周期紧缩的时分,DSP和LUT资源耗费急剧添加。本文结合开发板硬件资源可运用量,挑选II=5作为终究硬件加快器流水线的迭代距离。

3.2 运转功能剖析

为了比较本文规划的硬件加快器的加快作用,别离测出了在ARM处理器软件完结算法的处理时延周期,以及硬件加快器在各个优化规划阶段的处理时延周期,并核算其相对于软件完结的加快比。表2给出了处理一行LiDAR点元实在相片数据的试验成果。

各种完结办法的处理周期和加快比如图6所示,结合表2和图6可以看出,本文规划的硬件加快器的功能比较于单纯的软件完结具有大起伏的进步。

试验标明,本文提出的规划处理单行激光点云数据耗时6.5 ms,可以满意激光雷达在150 Hz扫描频率下每行360点元数据的实时处G2021理要求。

4 定论

本文选用根据软硬件协同的规划办法,规划并完结了激光点云解算的SoC。在Xilinx公司的Zedboard开发板上,选用流水线优化和FPGA存储优化的办法,开发了具有高效运转功能的硬件加快器。试验成果标明,本文的激光点云解算SoC可以满意机载渠道的实时性处理要求,使三维点云解算在飞翔器、卫星等高速渠道进行低功耗、实时性处理成为可能,为遥感三维印象生成技能的片上系统完结奠定了坚实的根底。

参考文献

[1] 黎荆梅,周梅,李传荣.阵列推扫式机载激光雷达三维点云解算办法研讨[J].遥感技能与大猩猩,激光点云解算的软硬件协同规划与完结,腾讯企业邮箱使用,2013,28(6):1033-1038.

[2] DABNEY P,HARDING D,ABSHIRE J,et al.The slope imaging multi-polarization photon-counting lidar: development and performance results,2010[C].IEEE International Geoscience大猩猩,激光点云解算的软硬件协同规划与完结,腾讯企业邮箱 and Remote Sensing Symposium,2010:653-656.

[3] YU A,KRAINAK M,HARDING D,et al.Development effort of the airborne lidar simulator for the lidar surface topography(LIST)Mission[C].Proceedings of SPIE.The International Society for Optical Engineering,2011.

[4] 郭商勇,胡雄,闫召爱,等.国外星载激光雷达研讨进展[J].激光技能,2016(5):772-778.

[5] 李然,王成,苏国中,等.星载激光雷达的开展与使用[J].科技导报,2007(14):58-63.

[6] MARTIN G.Overview of the MPSoC design challenge,2006[C].Design Automation Conference.ACM/IEEE,2006:274-279.

[7] 陈芳园,张冬松,王志英.异构多核处理器系统结构规划研讨[J].核算机工程与科学,2011(12):27-36.

[8] 马飞,刘琦,包斌.根据FPGA的AXI4总线时序规划与完结[J].电子技能使用,2015,4公交顶1(6):13-15,19.

[9] 曹彦荣,张锐.DMA传输与大猩猩,激光点云解算的软硬件协同规划与完结,腾讯企业邮箱Cache一致性剖析[J].硅谷,2014,7(8):39-40.

作者信息:

何锐斌1,2,李子扬1,贺文静1,伊瓜因胡 坚1,李传荣1

(1.我国科学院光电研讨院 我国科学院定量遥感信息技能要点试验室,北京100094;

2.我国科学院大学,北京100049)

the end
中欧合作进入新时代,深兰科技AI渡海落地意大利