咨询热线:073-739234449

CEVA宣布XM4DSP,定点算法中实际训练的精度与全算法基‘亚博集团网站’

本文摘要:今天的公告还包括新型的XM6DSP、CEVA新系列图片和视觉软件库、新型的硬件加速器和CDNN2生态系统。融合明确的CDN硬件加速器(HWA),CEVA认为生态系统的卷层消耗了GoogleNet等周期的大部分时间。

功率

深度自学的可编程DSP,而且今天也推出了拥有软件生态系统的新型DM6IP,其效率更高,计算能力更强,还有新的节能专利。在游戏IP游戏中,CEVA宣布XM4DSP,推测定点算法中实际训练的精度与全算法基本相同,误差接近1%时,获得该领域的许多分析师奖,CEVA卡被称为高性能和功率效率IP公告发布于Q1,2015季度,第二年获得许可证,第一批用于BIP的硅钢今年下线。之后,CEVA发表了CDNN2平台。这是一键编译器工具,训练网络,转换为适合CEVAXMIPS的代码。

新一代XM6集成了历代XM4的特点,改进了装备,可以采访硬件加速器,享受新型硬件加速器,并且具有CDNN2平台的互换性,这样的代码可以接受XM4,也可以在XM6上进行高性能运营。CEVA属于IP的业务,如ARM,与半导体公司合作,卖给OEMs。这一般需要很长时间,将新产品从构想中实际跳入市场,特别是在安全性和汽车等行业发展缓慢的情况下。

CEVA将XM6改为可扩展、可编程的DSP,可以通过单一代码库跨越市场,同时利用追加功能提高功率、性能,降低成本。今天的公告还包括新型的XM6DSP、CEVA新系列图片和视觉软件库、新型的硬件加速器和CDNN2生态系统。CDN2是一种单击编译工具,检测卷积,应用于高于逻辑块和加速器的最佳方法传输数据。XM6将反对OpenCL和LC,软件要素包括CEVA电脑视觉、神经网络和第三方工具视觉处理库。

硬件为标准XM6核心的处置部分构建了AXI,与加速器和内存交流。XM6IP有卷积的硬件加速器CDN助手,允许低功率相同的功能硬件,处理神经网络系统的困难部分,如GoogleNet,纠正鱼眼上的图像和变形镜头,图像的杂讯不明,转换功能相同XM6的两个新硬件功能将帮助大多数图像处理和机器学习算法。第一个是集中-充实,或者读者周期中,L1是向量寄存器中的32个地址值的能力。

CDN2编译工具识别串行代码读取,构建矢量化允许该功能,当所需数据通过记忆结构产生时,集中-充满了数据读取时间。由于XM6是可配备的IP,L1数据存储的大小/相关性可以在硅设计水平上调节,CEVA回应,该功能对给定尺寸的L1有效。该级用作处理的向量寄存器是宽度为8,VLIW的构筑器,这样的装备可以满足要求。第二个功能被称为滑动窗的数据处理,该视觉处理的特定技术已经被申请为CEVA。

处理过程和智能图像的方法很多,一般来说算法很快就会用于平台所需的图像和大图像素。对于智能部分,这些块的数量重叠,不同地区的图像被计算出不同地区的重量。CEVA的方法是保持这些数据,使下一个分析所需的信息量更少。

听说一起很简单,2009年,我做了类似的三维微分方程分析。显然,我很惊讶。那之前没有构筑视觉/图像处理。

如果你有地方存储,重复使用原始数据可以节省时间和能源。CEVA称之为XM6。

轻矢量工作量中的性能增长是XM4的3倍,同比内核平均增长了2倍。XM6在编码方面也比XM4更容易配置,得到了50%的金额外的控制。融合明确的CDN硬件加速器(HWA),CEVA认为生态系统的卷层消耗了GoogleNet等周期的大部分时间。

CDNHWA使用了这个代码,之后使用了512MACs为它构建了同样的硬件,用于16位反对构建的性能增加了8倍,利用率为95%。CEVA提到,用于12。

位置的方法在节约芯片面积和成本的同时,也有精度损失最小化的开发者为了反对未来的项目,拒绝了原始的16位的方法,结果自由选择了16位。在这个领域的汽车图片/视频处置方面,CEVA有两个竞争对手,分别是Mobileye和DNVIDIA,后者推出了神经网络培训和推理小说。

在690MHz的情况下,TX1在TSMC20nm的平面处理技术中,CEVA说,他们内部模拟得到的单体,XXM6在平台方面效率提高了25倍,而且比AlexNet和谷歌Net快了4倍。当然,XM6也可以在16nm、28nm、28nm、20nm的FinFET运营,20nm运营的结果。

这意味着,根据单批TX1发表的数据,XM6用于Alexnet,比起67帧/秒,可以继续每秒运营268帧的画面,比起5.1w,只需要800mmW。在16FF中,功率的数值可能更低,CEVA告诉我们,他们的内部测量最初是在28下午/下午16FF的情况下完成的,但他们在20下午的情况下,用于上午1对各方面的新展开测量。应该认为TX1的多发货数值指出,其效率优于单发货,但无法获得其他更好的对比值。CEVA还使用DVFS方案构建了功率门控制,当DSP方案的各个部分或加速器空闲时,可以减少功率。

显着,NVIDIA的优势是其解决方案的可用性、CUDA/OpenCL软件的开发、这两个方面的CEVA,都想通过CDNN2等一键软件平台构筑,提高硬件,如XM6。考虑哪些半导体合作伙伴和未来的搭建工具可以将这种图片处理与机器学习相结合。

用于

CEVA认为,无人机、自动化等智能手机、汽车、安全性和商业应用是主要目标。Via:ANANDTECH推荐读者:微软公司的CEO纳德纳:我们的AI之路与未来的无人驾驶初秀不同,不是自动驾驶轿车吗?原始文章允许禁止发布。下一篇文章发表了注意事项。


本文关键词:亚博集团网站,图像,功率,硬件加速器,性能

本文来源:亚博集团-www.barriesheerman.com