安霸AI域控制器CV3解析:算法优先、为融合优化、可裁剪扩展

“自2004年成立以来,我们一直专注于数字视频应用,始终以视频是一种独特的数据类型为前提,优化芯片架构并引入先进的软硬件技术及人工智能技术。”近日,安霸CEO 王奉民在2022安霸投资者峰会时如此说道。

回顾安霸的发展历史,前12年是为消费、安防市场及汽车市场提供低功耗高分辨率的视频处理SoC,而在过去的5年间,通过开发带深度神经网络AI处理器的SoC,与现有的视频技术相结合,从而推动CV(计算机视觉)SoC的发展,促进多个行业的高水平智能化发展。

而现在,通过引入CV3架构以及收购Oculli,安霸正在将处理器应用到视频之外的市场,这一切将引领安霸达成年营业额超10亿美元的目标。

2014年至2015年,随着Gopro的上市,安霸迎来了历史性的突破,其股价也随之一飞冲天,然而Gopro后期发展不利以及安防市场受到更多竞争对手的冲击,安霸经历了一段的蛰伏期。好在公司于2015年第一个鼎盛期时,就收购了自动驾驶研发团队Vislab,并从此开始投入巨资进行汽车ADAS及AD技术的研发。伴随着2021年底,收购毫米波雷达领军厂商Oculli之后,标志着安霸在计算机视觉与毫米波雷达等多传感器融合技术上实现了更大突破。

而在2022年CES上,安霸发布了最新AI域控制器芯片CV3系列,标志着公司从边缘智能向智能域控制器迈出了重要一步。

算法优先的玩法

安霸中国区总经理冯羽涛表示,尽管安霸是一家芯片供应商,但公司始终秉承着算法优先的策略,尤其是考虑到如今AI算法仍然在演进过程中,开发一款可以承载当前及今后算法的硬件非常重要。安霸中国区市场营销副总裁郄建军也表示,在CV3的开发过程中,测试了成百上千种的开源算法,甚至整个芯片的开发都是围绕着通用型算法进行的优化,这也是安霸算法优先的重要内涵。比如Transformer神经网络突然近两年变得流行,在CV3的开发过程中就对其进行了专门的支持与优化。

冯羽涛例举了安霸在算法技术上的四大优势。

首先是图象处理、ISP和视频压缩编码算法,这也是安霸自成立以来始终保持的优势。在AI技术火热之前,计算机视觉最依赖的就是图像与视频的处理。

第二是自动驾驶相关算法。2015年收购VisLab之后,安霸就开始深入了解自动驾驶中的算法,并与芯片进行深度融合。

image.png

如图所示,与CV相关的研发逐年提升

第三是随着收购傲酷,安霸补充了大量毫米波雷达与融合算法的knowhow,冯羽涛表示,傲酷有70%以上的工程师都是算法及软件相关开发人员。郄建军表示,傲酷采用了非常独特的算法,只需要普通雷达、简单的天线以及并不复杂的处理,就可以实现高性能的4D成像雷达,而随着双方合并,安霸可以更好地支持4D成像雷达算法以及与视觉传感器的前端融合。“目前的融合算法更多是后融合或目标级融合,而在CV3中支持视频像素和雷达点云做原始数据级融合,这可以大幅减少误检率,从而提高整体的可靠性,甚至达到低线束激光雷达的精度。”郄建军说道。

第四是CVflow®,冯羽涛介绍道,CVflow是所有CV系列芯片的核心,也是安霸自研的一套AI算法加速硬件引擎。CVflow架构是专用于神经网络算法运算而设计的,因此相对于CPU、GPU或者FPGA,在ADAS感知融合算法处理上具有更高的算力和更低的功耗。

有效算力才是工程学

冯羽涛介绍了全新一代CV3的具体指标,并强调在安霸看来“有效算力才具有工程价值”。

首先他强调的是CV3面向的是域控制器,因此相比CV2,CV3可以支持包括传感器融合以及规控等在内的多项功能。从适用于前视ADAS摄像头、满足汽车行业监管标准的低功耗SoC,扩展到可用于L4级全自动驾驶的高端域控制器SoC。这个系列的芯片支持中央架构,也支持区域架构。除了覆盖整个自动驾驶域外,CV3还可以同时处理舱内感知,包括驾驶员和车内感知系统。安霸的AI视觉SoC提供了独具特色的全系列产品,支持从ADAS辅助驾驶系统到L4级自动驾驶系统,涵盖汽车感知、记录和规控的全方位应用。这意味着主机厂无需为其旗下不同等级的汽车产品线开发不同的软件,而直接采用安霸统一的CVflow平台开发,不仅大大缩减设计制造成本,还能够更快速地投向市场以满足市场需求。

image.png

CV3框图

image.png

CV2FS框图

冯羽涛表示,CV3架构最主要的升级是采用了新一代的CVflow架构,包含神经矢量处理器和通用矢量处理器两部分,充分考虑了客户的算法需求。其中神经矢量处理器主要支持定点计算,包括4bit、8bit、16bit等AI算法。而通用矢量处理器可以应对客户的混合算法需求中浮点运算的需求,比如毫米波雷达的点云处理,OpenCV处理,或者帮助Cortex A78AE分担浮点算法等。

另外一部分更新是采用了16核Arm Cortex A78AE处理器,支持汽车功能安全,并采用4*4的簇架构,可以灵活选择安全域控制,神经网络,融合算法或者是冗余开发等应用,使软件开发相对独立。

而集成诸多处理器功能的AI域控制器,相对于传统的层级架构的域处理来说,可以实现更低的延迟,从而满足ADAS对于低延迟处理的需求。

冯羽涛强调,安霸始终认为有效算力才是真正有意义的算力,在满足能效比前提下发挥最佳处理水平,才可以满足车厂的要求,而不只是单纯的堆积处理器内核和算力。也正因此,安霸在CV2时代就引入了eTOPS(等效算力)的概念。而全新发布的CV3系列,其AI等效算力达到了500 eTOPS(@8bit)或者1000 eTOPS(@4bit),是上一代CV2的42倍之多。

第三,则是通过增加MIPI CIS-2接口,以及MIPI DSI,可以支持包括20路摄像头、毫米波雷达、激光雷达以及超声波雷达在内的所有传感器,从而达到最全面的传感器融合。

image.png

与竞争对手相比,CV2 12eTOPS的算力情况下,就可以实现竞争对手GPU 30 TOPS的性能。

image.png

如图所示,安霸的产品线覆盖相比竞争对手更为全面,最重要的原因就是公司始终秉承着可以应对不同应用,而为了对应用进行进一步优化,全新的CV3也将进行各种裁剪或补充。

image.png

如上图所示,安霸一直是依靠各种细致的优化与裁剪,从而满足工程化的不同要求,以服务于不同厂商的需求。

冯羽涛表示,安霸平台的设计思路就是在通用编程适应性和功耗比两方面进行平衡,哪些需要通用处理,哪些需要专用架构,哪些需要以软件支持,哪些需要固化,这一切的取舍,完全建立在安霸“算法优先”的knowhow上,从而实现性能、功耗、成本、开发便捷度之间取得好的平衡点。

“做一颗高算力的产品很容易,只要放进更多核就好了。但更重要的是需要落地,需要综合工程学的需求,这才是最难的。”冯羽涛说道。

通过融合工程学的所需,按照冯羽涛所述,该产品“既可以支持传统算法,也可以支持神经网络算法,既可以支持多级式传感器融合,也可以支持直接在域控制器下处理所有原始数据,这一切均取决于客户对于自动驾驶的理解。”,但在安霸看来,未来几年内,域控制器市场还是以混合式的为主导。

image.png

如此图所阐释,TOPs(算力)很好但是没意义,效率才是最重要的,为此CVflow通过特殊的流架构(Streaming architecture),稀疏矩阵以及无需更多内核的方式实现了高效率,并简化了内存带宽、内核数量以及无效的大量内部数据搬运及通信,并且专注于摄像头和雷达的数据处理,而不是为了满足通用的处理应用。

在这一前提下,CV3除了性能提升之外,性能能效比也同时提升了4倍。冯羽涛表示,“我们真正做到了用这颗50W的芯片,替代了后备厢里庞大的数据中心。”

image.png

如图,安霸真正将“轮子上的数据中心”小型化到只有数个蓄电池大小的计算单元。

据悉,CV3将采用三星的5nm制程,这一工艺已经在安霸CV5产品上得到了量产验证。

广泛的合作伙伴

目前,硬件预埋已经是诸多车厂的策略,即硬件先做到L4级标准,软件和算法则通过迭代方式,从L2+、L3等慢慢做起来。所以安霸才会推出如此高起点的CV3平台,从而保护车厂的投资。

从2019年算起,安霸已经连续同多家本土车厂、Tier1或算法中间件厂商合作,加速自动驾驶技术的落地。

image.png

安霸的OEM、Tier1以及软件合作伙伴生态一览

也正是由于同更多的汽车及IoT合作伙伴合作,使安霸如今已经彻底摆脱了对于Gopro单一品牌大客户的依赖,这也是安霸执行“算法优先”以及平台化策略的最重要原因与成果。

自动驾驶技术正在进入全面的爆发期,除了通用自动驾驶之外,包括商用车、重卡、机场、物流等多种场景也都在加速落地,而通用自动驾驶各家的演进路线图不同。冯羽涛表示,“在这样复杂的背景下,安霸作为芯片供应商,始终保持对趋势的准确判断,通过长期产品规划,秉持着算法优先的策略,设计出高性能的产品架构,以及多样化的平台方案,不断配合汽车产业的发展需求。”

关键字:     编辑:冀凯 引用地址:

发表评论

邮箱地址不会被公开。 必填项已用*标注

  • 友情链接