作者 | zer0
编辑 |沙漠之影
新东在12月27日表示,自研芯片技术一直是优化手机终端体验的重要途径。 今天下午,OPPO展示了芯片调优技术的最新进展,并首次公布了其自主研发的芯片软硬件集成技术栈的关键潮汐建筑
潮汐架构可以有效解决存算分离和芯片调度两大瓶颈,影响SoC计算效率的提升
1、性能优化深入到传统手机厂商无法提炼的片上缓存系统,首次实现系统级缓存和L3缓存的动态匹配这平均可以节省 8% 的能源效率
2、对SOC计算单元进行精准动态调度,做到:快手、高德地图、微博、浏览器等应用都提高了能效。
3.解决了影响系统流畅度的GPU控制显示延迟一致性问题让安卓旗舰手机首发性能一致性体验超越苹果
除了潮汐架构外,在安全和隐私方面,OPPO独家VIP模式提供芯片级权限加密,并内置国家密码认证安全芯片,实现隐私信息的独立存储和物理隔离。
此外,OPPO预测潮汐架构将有重大升级该公司将进一步扩大与联发科的合作伙伴关系,并深度参与下一代天玑旗舰芯片相关硬件的设计
OPPO软件技术规划与架构设计总监洪汉生表示,要做好芯片调优,需要具备良好的芯片和软件能力。
目前,提升SoC芯片的计算效率存在两大瓶颈:1)智能手机的性能环节遵循经典的冯·诺依曼结构,存储和计算分离,存储读写速度远低于CPU计算速度;2)芯片的调度方案缺乏场景级认知。
对此,OPPO带来了自研的软硬件芯片融合技术栈潮汐建筑
据洪汉生分享,潮汐架构是OPPO在手机芯片调优领域多年研究的综合成果。 多年来,OPPO一直让一些做系统软件的工程师学习芯片技术,并招募了大量的芯片设计工程师,让他们了解软件场景。 所以潮汐架构是由一组组成的懂软件、懂系统、懂芯片由技术专家创建。
针对典型的冯·诺依曼计算机体系结构中常见的存储和计算分离问题,洪汉生认为在所有策略中,使用缓存是最无效的
你在记忆金字塔中走得越高,你走得越快。 因为价格昂贵,上层的容量越来越小。 再往下,由于成本优势,容量可以比较大。
与内存存储相比,缓存的读写速度可以提高10倍甚至100倍。 如果数据读取发生在金字塔的顶端,整个计算链的效率可以大大提高。
很好地使用缓存有助于实现性能和功耗的平衡。
在过去的几年里,OPPO在这一领域取得了进展。 相较于传统手机公司只能在ROM或RAM上优化性能,Tidal架构深入到片上系统缓存和L3缓存。
其中的苦涩可能只有我自己知道。 据洪汉生回忆,两年前OPPO团队决定做的时候,没有平台,更别说开放接口了,工程师只能调整CPU、GPU、DDR等参数,改变投票策略,看命中和缓存不足,换一组数据测试一个结果, 并用这种“愚蠢的方法”梳理一整年的数据,进行数据建模,看规则和原理,从入门到掌握,真正懂技术。
随后,OPPO团队与芯片厂商紧密合作,成立了性能和功耗联合实验室,共同设计了从L3缓存到系统缓存的分区管理机制。
潮汐架构基于单个场景决定当前应用对系统资源的需求,缓存可以动态匹配CPU和GPU,使CPU和GPU在最佳频率范围内运行。 如果面向计算的任务数量占主导地位,则会向 CPU 分配更多缓存如果有许多渲染任务,则资源会偏向于 GPU。
洪汉生说,这些计划看起来并不复杂,但如果回到两年前,“黑匣子”曾经就像一座大山挡住了路,如果不翻过来,你永远不知道山的另一边是什么样子,但好在OPPO团队已经翻过了那座大山。
它已经计算过了在不牺牲性能的情况下,Tidal 架构可以实现 8% 的平均能效节省。
接下来的问题是如何对芯片进行算力调度。
计算机 CPU 有一个甜点部分,其中能效比最优;超出此范围,有时需要巨大的功率损耗才能实现小幅性能改进。
如果场景变得复杂,如何在多个计算单元中以最低的能耗执行计算要求?如何让多个内核处于这样的甜点范围内?这是一门复杂的科学。
据洪汉生介绍,在新一代OPPO旗舰上,有1+2+3+2架构,也有全核架构。
OPPO与芯片厂商深度合作打造的潮汐架构,通过对具体应用场景的精准识别、精细化的场景调度分析和精准的算力消耗匹配,实现SOC计算单元的动态调度,使计算单元运行在最佳能效的最佳点范围内。
在跨平台 CPU 频率映射方面,Tidal 架构有助于避免一些过度的算力消耗。
该图显示了在重负载游戏中测得的全帧速率的频率分布。 正如你所看到的,当性能应该释放时,高频点并不吝啬,但其他时候,它的调度控制得非常精细,整个频率可以压得很低。
从其他常用快手, 高德地图, 相册, 微博, 浏览器根据各种头部应用的测试结果,潮汐架构使其实现了SOC的整体能耗3%以上的收益。
洪汉生解释说,这些数据似乎并不多,因为芯片的能效不是那么容易提高的,而且这些都是真实的数据。
除了能效之外,Tidal 架构还为 Android 旗舰手机带来了流畅度的显着提升。
洪汉生提到,苹果的手机总是给人一种更流畅的意图。 在他看来,如果想在Android手机的流畅度上超越苹果,最大的差距就是“永远”这个词。
流利地做起来容易,做几百次、几千次、几千次也不难,但要做到十万次、一百万次,就需要解决看不见的问题,需要在基础环节上实现一致的体验。
OPPO是怎么做到的?洪汉生分享,每天在手机上点击一个应用,从点击的那一刻到应用图标展开的时间间隔大约是100毫秒。 经过长时间的分析,OPPO团队发现,要让它流畅起来,可能比做一个120帧的游戏更难。
这是因为有三个行业挑战:第一是触摸响应的一致性,第二是软件上线程调度的一致性,第三是GPU显示延迟的一致性。
与 GPU 密切相关的显示延迟的一致性如何?安卓手机采用分层渲染,每一帧的动画显示都要经过多重软件合成和硬件合成,会进出GPU。 如果这是一条生产线,GPU就像一个控制平台,它必须有能力及时纠正整条生产线上所有环节可能出现的任何偏差,动态增加时钟信号,动态增强GPU驱动能力。
否则,如果整条生产线错过了一个时钟信号,将导致整个过程向右移动,并且会出现掉帧和延迟,这将给最终用户带来不好的体验,例如点击图标后没有响应,整个页面的显示延迟。
解决了这三个问题后,OPPO参考了苹果的设计,将响应时间调整到一个更舒适的时间,不快也不慢,然后用高速摄像头反复测试,最终成功控制了整个应用的启动响应时间,像苹果一样非常稳定。
通过精准的芯片算力调度,根据场景动态增强GPU驱动能力,提供潮汐架构解决了GPU控制显示延迟一致性影响系统流畅度的问题因此确保始终如一的启动性能
在对 320 个应用程序启动进行为期 1 天的模拟测试中,OPPO Find X7 可以:低至 11ms启动响应的标准偏差是针对所有旗舰完成的第一名甚至超越以稳定性和流畅性著称的苹果
在保障用户隐私安全方面,OPPO致力于提供软硬件结合的全链路应用、数据管控、创新功能,在国内外安全隐私领域获得多项顶级认证。
今年10月Find N3典藏版发布时,OPPO推出了业界首款“VIP模式”,通过三段式物理开关,可以一键关闭麦克风、摄像头、定位等敏感权限,对用户隐私进行硬件级安全加密。 VIP模式也将在下一代Find X系列旗舰产品上提供。
OPPO为“VIP模式”加持了一款通过手机领域最高认证级别的安全芯片。 与传统的软件安全方案相比,芯片级加密方法可以将敏感权限的管理和授权开关与操作系统分离,锁定在安全芯片的硬件层,由芯片级安全子系统进行管理。
安全芯片配合通话隐私双向保护、隐私信息自动编码、证书一键水印等隐私功能,从硬件到一系列软件功能,全方位保护用户的隐私和安全。
相同的芯片,不同的芯片调校能力,影响着手机在实际使用中能发挥的芯片性能。
在摩尔定律濒临失效的情况下,每一代芯片制造工艺的改进,只有通过千亿的产业投入和数百万工程师的努力,才能将芯片的整体能效提高10%以上。 OPPO实现了平均8%的能效节省,可见芯片调优对优化能效的重要性。
在芯片选择有限的情况下,通过软硬件协同实现手机体验差距的芯片调校能力竞争,已经从手机巨头之间的暗战转变为台前“秀肌肉”的焦点。
终端用户的这些“隐形”优化,不仅关乎软硬件的技术实力,还关乎手机厂商场景级认知、与芯片厂商合作深度等综合能力。
随着芯片调优越来越精细,与越来越多的智能优化技术相结合,更高的性能、更好的能效和更稳定的流畅性最终将使用户受益。