Arm Cortex-X925 实现 15% IPC 提升,领跑高性能 CPU 领域

IT之家
Oct 08, 2024

  打造卓越性能与更高效率的全新标准,实现人工智能、游戏和多任务处理的先进功能

  如今,应用程序的性能表现已成为推动业务成功的核心支柱之一。随着技术不断发展,确保用户能在各种应用程序中获得理想体验的高性能 CPU 也变得至关重要。

  基于 Armv9.2 架构的 Arm Cortex-X925 是 Arm 迄今推出的出色 CPU 设计之一。在 Geekbench 6.2 基准测试中,它实现了创新纪录提升了 15% 的 IPC(每时钟周期指令数)表现。

  图:Arm Cortex-X925 性能新突破

  与过往从 Arm Cortex-X1 到 Cortex-X4 CPU 的年度同比性能提升幅度相比,此次的性能增幅高出了 1.5 倍,意味着能为最终用户带来卓越的性能体验,同时能有效缓解高频下过热问题。

  图:Arm Cortex-X925 提升 IPC 15%,性能增幅比以往高出 1.5 倍

  什么是 IPC?它为何重要?

  IPC 是评估 CPU 性能的关键指标,用于衡量 CPU 在每个时钟周期内可执行的指令数。如何简单地理解 IPC 呢?举例来说,在一家工厂里,有多台机器人负责组装复杂的产品。CPU 执行的指令数就如同机器人为完成复杂计算(如最新的人工智能算法)而执行的任务。时钟周期则代表组装过程中单个步骤所花费的时间。

  在 IPC 较高的工厂中,先进的机器人能在每条组装线步骤中加快执行多个任务,因而工厂能够在规定时间内制造出更多的产品。机器人的综合能力越强,实现预期产量所需的机器人数量就越少,工厂的用电效率就可能会更高。

  为此,在智能手机、笔记本电脑和移动设备等消费电子设备中,鉴于电池续航时间和散热管理是关键因素,能效显得尤为重要。能效的提高意味着电池续航时间更长、运行温度更低、整体用户体验更佳。

  基于 Armv9 的 Cortex-X925:出众的 IPC 表现满足实际需求必备的强劲性能

  鉴于 IPC 是衡量 CPU 性能和能效的关键指标,基于 Armv9 架构的 Cortex-X925 专注于提高 IPC 性能,以提供满足实际需求的强劲性能。其中 CPU 设计包括对私有 L2 缓存的升级,从 2MB 增加到 3MB,这个升级增强了 CPU 的整体性能和能效,尤其是结合 Cortex-X925 在更快速、更高效预取数据和复杂指令的能力后,成效尤为显著。

  Cortex-X925 专为先进的三纳米工艺节点设计。作为一种更先进的制程技术,不仅提高了能效,而且能够利用更高的频率,从而在多种基准测试和应用场景中实现显著的性能提升,加快应用的启动速度,并提高了浏览器基准测试分数。此外,Cortex-X925 中的矢量管线提升 50% Integer8 的计算性能 (TOPS) ,加快智能手机上的人工智能应用响应速度。

  总体而言,在消费者日常使用智能手机时,Cortex-X925 可使性能和能效平均提升 30%。由此带来诸多方面的用户体验升级,包括:

  1. 更快的人工智能应用响应:人工智能聊天机器人的回复更准确、更快速。

  2. 更优的 AAA 游戏质量:更流畅、更沉浸式的游戏体验和更高的画质。

  3. 更快的应用操作:应用启动速度更快,用户体验更流畅。

  4. 无缝多任务处理:用户可同时听音乐、浏览网站和聊天,带来顺畅的使用体验,而不会产生卡顿。

  5. 更流畅的视频流传输:减少缓冲时间,播放更流畅。

  6. 更快的网页加载速度:滚动和切换页面时反应更快。

  7. 持续提供出色性能:得益于能效提升,智能手机续航增强,可保持稳定且持久的供电性能。

  作为高性能解决方案,Cortex-X925 可满足不断发展的设备和应用场景需求,确保用户畅享优质体验。全新设计显著提高了速度和运行效率,尤其适用于人工智能应用。

  图:Cortex-X925 可使消费电子设备的性能和能效平均提升 30%,为用户带来多方面的体验升级

  Arm 如何实现如此卓越的成果?

  Arm 最新的创新成果之所以有如此令人瞩目的性能表现,源自于架构层面的多项提升。新架构从消费者的实际使用场景出发,在设计时着重考虑了三个层次的提升:

  前端:采用出色的微架构,适合具有复杂分支行为和指令占用空间大的实际应用。分支预测和指令获取能力提高两倍。

  核心:采用的行业内最高吞吐率的微架构,提升工作负载的性能。最大指令窗口容量增加两倍,以实现更广泛的微架构深度并避免延迟。

  后端:负载管线从三个增加到四个,使后端工作负载得以增长 25%-40%,从而实现更高的性能和能效。

  图:前端、核心、后端三层次架构设计提升

  Armv9 架构特有的功能:通过集成 SVE2,提高多媒体处理性能和能效

  SVE2(可伸缩矢量扩展 2)的集成是 Cortex-X925 的一大显著特点。SVE2 将数据级并行处理扩展到了更多功能域,通过加速视频解码、提升摄像头传感器数据处理和增强计算机视觉管线,有效提升了视频播放和拍摄功能。

  加速 10 位 HDR (高动态范围)视频解码,减少 10% 的处理周期和能耗

  SVE2 可加速 HDR 10 高品质视频的解码。无论是 VP9 解码格式还是 AV1 解码格式,SVE2 都能使处理周期减少 10% 且能耗降低 10%,从而将解码性能提升多达 10%。基于此特性,无论在视频流媒体平台上,还是社交平台的短视频中,消费者都能持续享受高清画质,手机电量也更持久耐用。

  摄像头传感器数据的处理效率更高,处理周期减少 26% 且能耗更低

  SVE2 可改善画质,提升视频通话时的流畅度。其中包括更好的摄像头旋转、切换和应用图像滤镜体验。

  使计算机视觉 (CV) 管线的速度加快 20% 以上

  凭借 SVE2 Halide 后端,消费者可在智能手机上体验到专业级的摄影性能。SVE2 Halide 广泛应用于智能手机中的影像类软件,得益于 SVE2 的复杂计算机视觉算法管线加速能力,后端能够加速小查询表和点积运算,消费者能够实时改进照片的锐度、色彩、色调和景深,而免去了后期修图的必要。

  图:Armv9 架构特有的 SVE2 功能,可提高多媒体处理性能和能效

  Cortex-X925 是 Arm 迄今最强大的 CPU 之一

  Cortex-X925 基于 Armv9.2 架构,树立了 CPU 性能的全新标杆,实现了 Cortex-X 系列有史以来最大幅度的 IPC 同比提升。得益于最新的三纳米工艺节点,Cortex-X925 实现了更高的频率,与 2023 年高端安卓设备上运行 Geekbench 单核基准测试相比,这代架构与 Cortex-X4 相比,实现了超过 35% 的性能提升;Phi-3 等人工智能应用的词元 (token) 首次响应时间提升超过了 45%。

  凭借上述的各种提升,Cortex-X925 旨在满足当今设备不断发展的需求,让消费者在广泛多样的应用中,获得无与伦比的性能、能效和用户体验。

关注同花顺财经(ths518),获取更多机会

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10