龙芯3A5000正式上市,自主CPU开启“好用”新纪元

集微网报道,芯片是信息产业的灵魂,通用CPU更是芯片中的“珠峰”。多年来,中国计算机产业一直被“无芯”难题困扰。最近几年,国产CPU自研力量在慢慢崛起。但放眼庞大的商用市场,仍然是英特尔与AMD的天下。日前,国产自研CPU领军企业龙芯中科宣布其新一代通用CPU 3A5000正式上市,该产品性能实现大幅跨越,即将开启国产自主CPU “好用”新纪元。

基于自主指令集、自主微架构

CPU产业的发展,有三个关键部分,一是芯片设计,二是软件生态建设,三是芯片的生产制造,只有解决了这三个卡脖子环节,我国的自主CPU产业才能真正建立起来。

在芯片设计环节,真正的自主自研绕不开指令集和IP核心。

指令集架构是软件生态的根基,没有自主可控的指令集架构,终将不能免除受制于人的困境。在指令集的设计规范下,微架构是芯片最终的实现根本。CPU的基本组成单元——内核(core)就是由微架构实现而成,真正决定芯片性能、功耗与成本的正是它的微架构。可以说,只有具有微架构研发能力的芯片企业才算得上真正具有了CPU自研能力。

龙芯就是一家从指令集到微架构都自家包揽研发的CPU企业,这也是龙芯引以为傲的自研能力所在。

前不久,正式公布的自主指令架构LoongArch基于龙芯二十年的CPU研制和生态建设积累,从顶层架构到指令功能和ABI标准等,全部自主设计,不需国外授权。LoongArch吸纳了现代指令系统演进的最新成果,运行效率更高,相同的源代码编译成LoongArch比编译成龙芯此前支持的MIPS,动态执行指令数平均可以减少10%-20%。LoongArch充分考虑兼容生态的需求,融合X86、ARM等国际主流指令系统的主要功能特性,并依托龙芯团队在二进制翻译方面十余年的技术积累创新,实现跨指令平台应用兼容。

7月23日,龙芯中科正式发布首款基于自主指令系统LoongArch的处理器芯片-龙芯3A5000,其中,包括CPU核心、内存控制器及相关PHY、高速I/O接口控制器及相关PHY、锁相环、片内多端口寄存器堆等在内的所有模块均自主设计,且性能实现大幅跨越,直追国际大厂主流产品,代表了我国自主CPU设计领域的最新里程碑成果。

龙芯中科副总裁张戈指出,“目前国内CPU研发主要分两类,一类是完全走自研路线,另一类是采用国外厂商授权内核架构,在此基础上再去做一些消化、吸收、改进并创新。龙芯选择走第一条路线,在设计上,不仅是CPU的IP核,外围的配套IP核、芯片中的每一行源代码,都完全依靠自研开发,没有任何第三方的相关参考代码。”

如果在关键技术上引入其他IP核,虽然降低了设计难度,但对于关键部分的代码所带来的安全隐患将无法把控,这正是自研CPU所看重的自主可控的关键所在。

龙芯3A5000性能大幅跨越 从“可用”走向“好用”

龙芯3A5000处理器主频2.3GHz-2.5GHz,包含4个处理器核心,较上一代龙芯3A4000处理器,龙芯3A5000处理器在保持引脚兼容的基础上,性能提升50%以上,功耗降低30%以上。

早在正式上市之前,龙芯3A5000处理器已经在第三方测试机构以及整机合作厂商中广泛测试和验证。测试数据显示,龙芯3A5000处理器在GCC编译环境下运行SPEC CPU2006的定点、浮点单核Base分值均达到26分以上,四核分值达到80分以上。基于国产操作系统的龙芯3A5000桌面系统的Unixbench单线程分值达1700分以上,四线程分值达到4200分以上。上述测试分值已经逼近市场主流桌面CPU水平,在国内桌面CPU中处于领先地位。

张戈表示,“龙芯3A5000处理器的性能表现完全超越了我们自己的预期,已经接近世界主流CPU水平,可以说真正实现了从‘可用’走向‘好用’”。

在复杂文档处理、浏览器打开、3D引擎加速、4K高清软解以及各类业务软件处理等方面,龙芯3A5000电脑性能提升明显,为用户提供了极速的性能体验。

小编亲身操作了一下,基于龙芯3A5000处理器的电脑,与基于英特尔i5处理器的电脑相比,龙芯电脑打开文档的速度甚至要更流畅更快捷一些。不过,张戈的解释显得客观而低调,“这并不是说龙芯3A5000处理器的性能超越了英特尔i5处理器,但可以看出,在龙芯3A5000+国产操作系统+WPS办公软件的协同优化下,在某些性能和使用体验上,基于龙芯3A5000的电脑并不亚于英特尔i5处理器+Win10+Office的水平。”

坚持自主性的龙芯3A5000同时拥有极高的安全性。龙芯3A5000在处理器核内设置了专门机制防止“幽灵(Spectre)”与“熔断(Meltdown)”攻击,并在处理器核内支持操作系统内核栈防护等访问控制机制。龙芯3A5000处理器集成了安全可信模块,支持可信计算体系。龙芯3A5000内置了硬件加密模块,支持商密SM2/3/4及以上算法,其中SM3/4密码处理性能达到5Gbps以上。

龙芯中科还基于龙芯3A5000推出了新一代服务器处理器龙芯3C5000L。龙芯3C5000L通过封装集成了四个3A5000硅片,形成16核处理器。基于龙芯3C5000L的四路64核服务器整机的SPEC CPU2006性能分值可达900分以上,可全面满足云计算、数据中心对国产CPU的性能需求。

进军商用市场,生态建设是关键

从“可用”走向“好用”,龙芯3A5000已经做好了性能上的准备,但面向广大的商业化市场,仅仅实现技术先进性还不够。

要想担起“在市场化条件下实现自主,创造一个独立于Wintel(微软-英特尔)和AA(安卓- ARM)的第三套体系”的重任,生态建设至关重要。

张戈表示,大生态建设包含两部分:技术生态和商业生态。在技术生态建设上,龙芯坚持走开放路线。“指令集开源是大势所趋,X86封闭的架构以及ARM昂贵的授权模式不符合业界越来越开放和自由的产业生态。龙芯将建立基于LoongArch的自主开放的指令集联盟,我们的开放力度将会比RISC-V或ARM更强,不仅指令集还有高性能IP核代码,都会开放给国内同行使用,助力构建生态体系。”

张戈认为,要想把技术生态真正建设好,时下最关键的是要把上层应用开发环境的规范工作做到位。目前,与龙芯3A5000配套的三大编译器GCC、LLVM、GoLang和三大虚拟机Java、JavaScript、.NET均已完成开发。面向信息化应用的龙芯基础版操作系统Loongnix和面向工控及终端应用的龙芯基础版操作系统LoongOS已经发布。从X86到LoongArch的二进制翻译系统LATX已经能够运行部分X86/Windows应用软件。

在商业生态建设上,龙芯也已加速布局,同全产业链企业合作推进。统信UOS、麒麟Kylin等国产操作系统已实现对龙芯3A5000的支持;数十家国内知名整机企业、ODM厂商、行业终端开发商等基于龙芯3A5000处理器研制了上百款整机产品,包括台式机、笔记本、一体机、金融机具、行业终端、安全设备、网络设备、工控模块等;2020年,龙芯中科发起成立了“龙芯生态适配服务产业联盟”,截至目前,已与70余家公司共同组建龙芯生态适配服务产业联盟,实现资源互动。

同时,通过“龙芯杯”大赛、校企共建实验室等形式,助力自主芯片设计人才培养。最近,龙芯又推出LoongArch精简版开源开发平台Chiplab,旨在助力高校学生参与完成处理器芯片全流程设计。目前Chiplab正在清华大学和北京航空航天大学进行试点,并将于今年下半年开始在“百芯计划”高校内大规模推广。

俗话说得好,“没有金钢钻,不揽瓷器活”。如今,龙芯3A5000的上市,让“好用”的国产自研CPU终于填补国内空白,接下来将是龙芯大展身手的时机,国产自研CPU走向真正的商用市场,拭目以待!