在过去的十五年里,RISC-V通常与嵌入式项目有关,未来其将会向更加高性能的领域渗透。

7月17日,RISC-V国际基金会CEO Andrea Gallo在演讲中表示,RISC-V正向数据中心、AI、汽车电子等全场景渗透,2025年将成为其生态爆发的关键节点。7月18日,在第五届RISC-V中国峰会的人工智能分论坛上,中国电信研究院技术专家杨玉模发表了主题为《基于RISC-V架构的高性能AI大模型工作站》的演讲。

 嘉宾.png

杨玉模表示,据其观察,目对数据中心计算架构发展趋势主要有三个:

laas云计算依然是数据中心主要形态。尽管近年来PaaSSaaS快速发展,但laaS仍然是数据中心的核心形态,尤其在大型企业和政府机构中,IaaS服务为业务的数字化转型提供了基础支撑。此外,从裸机到虚拟机到容器再到函数计算,虽然计算的封装粒度和形态在不断演讲,但虚拟机和容器在未来很长一段时间仍然是主要计算形态。

②AI驱动智算爆发式增长。人工智能的快速发展推动智算需求爆发式增长,数据中心从传统的通用计算转向以AI为核心的智算。而且,AI模型训练所需算力每3-4个月翻一倍单次训练成果或高达数千万美元,新型计算架构芯片、超节点、集群成为提升算力规模的关键突破点。

③领域专用架构DSA成为新趋势。领域专用架构(DSA)可以针对特定领域任务进行计算架构优化,与传统通用计算相比,在性能和能效方面具有显著优势。另外,随着A1、视频处理等领域对算力需求的快速增长,DSA成为数据中心发展的新趋势,其可定制性和高效性满足了特定领域的极端需求。

在数据中心技术演化的过程中,还在不断成长的RISC-V逐渐在其中获得发展机会。目前,RISC-V已经形成较为丰富的产品矩阵,但相距数据中心标杆应用所需性能仍有差距,能用的场景很多,有优势的场景有待发掘。值得一提的是,今年2月底,达摩院宣布玄铁最高性能处理器C930在3月开启交付。C930通用算力性能达到SPECint2006基准测试15/GHz,面向服务器级高性能应用场景。此前一直被外界所诟病的生态软件方面,经过众多行业玩家的不断努力,RISC-V软件生态快速发展,基础软件基本完成版本适配,不过应用软件由于依赖库多样、版本多样迁移依然困难。

 平台.png

中国电信也是RISC-V在国内发展的重要推手之一。在去年的RISC-V中国峰会上,中国电信便发布了“北海云计算开放实验平台”,主要针对RISC-V云计算软硬件生态不成率、缺乏规模化的应用验证,以中国电信的丰富应用场景为牵引,来推动RISC-V架构在云计算行业的成熟与规模应用。经过一年的发展,中国电信对于上述平台的从初步探索演进至拓展研究阶段。北海2.0 RISC-V智算云增加了云原生虚拟化、AI大模型和AI Agent管理功能,推出RISC-V高性能AI大模型工作站,为虚拟化和AI Agent应用提供基础设施和适配验证方案,推动智算行业的成熟与规模应用。

 适配.png

在基础设施方面,中国电信也有相应的探索。其基于国产RISC-V CPU芯片和国产AI推理卡,构建云原生虚拟化平台及AI Agent应用平台。通过软硬协同定制优化,提供高性能、智能化、可扩展的AI计算环境。上述提到的云原生虚拟化平台是原创突破之一,其基于高性能RISC-V CPU和硬件虚拟化技术构建业界首个云原生虚拟化管理平台,实现以集群模式统一管理虚拟机和容器,推动了RISC-V虚拟化的商业规模应用。而AI Agent应用平台,主要是针对A Agent在执行LLM动态生成代码时面临的安全性、隔离性和环境一致性问题,构建安全隔离的沙盒环境,覆盖Agent从开发到部署的全流程,推动AI Agent的适配验证和商业规模应用。

杨玉模表示,RISC-V高性能AI大模型工作站具有高性能、智能化、可扩展的特征,使其相比其他PC架构在技术、成本、市场以及发展潜力等方面表现出独特的优势,这为RISC-V 高性能AI大模型工作中多样化场景的应用提供了基础保障。

最后,杨玉模分享了在运营商视角如何思考RISC-V AI应用前景。他认为,首先是要找好定位。做AI基础设施平台和集成商。因为底下硬件及最上面的应用不是运营商的专长,中国电信以IaaS为基础做AI算力平台、以PaaS为基础做AI应用平台。其次是大模型如何为客户创造价值。他认为是立足现有业务、拓展新型业务,比如:将大模型重新定义传统业务或者是AI去重新定义传统业务,比如说图象处理、通过AI的技术可以提高处理的性能和速度。还有就是大模型谈塞新型业务场景,例如:交互式的问答这种类型。最后,思考如何将理论研究转化为商业应用。要与上下游厂商携手推进商业的落地,首先要健全RISC-V AI领域的开源生态,然后要开源向产品化进行转变。

来源: 芯师爷 作者: