上汽仿真计算云平台建设实践分享+ 查看更多
项目简介
上汽乘用车作为上汽集团全资子公司,承担着上汽自主品牌汽车的研发、制造与销售,拥有荣威、MG两大品牌,上海、南京和英国三地技术研发中心,上海临港、南京浦口和英国长桥三个制造基地。伴随上汽乘用车的市场表现强劲,车型研发工作也在持续加速升级,而为工程仿真服务的的计算资源供应开始远远落后于现实需求,具体表现为:
- 研发需求强烈 : 当前CAE仿真计算已经承担非常重要的任务,普遍出现计算任务工况多、规模大、时间紧的情况,迫切需要快速获取高性能计算资源;
- 资源迭代滞后 : 当前上汽乘用车建设的本地HPC集群虽然经历多次扩建,但是硬件资源严重老化,硬件资源故障率居高不下,计算性能难以满足业务需求,且资源更新迭代速度缓慢,严重影响仿真研发业务进度;
- 用户体验欠佳 : 仿真研发人员一直保留着传统的HPC计算中心操作方式,线下前后处理与到线上求解计算,流程割裂,数据挪动频繁,亟需建设高沉浸、全业务的一体化CAE仿真分析在线服务平台。
针对以上问题,2017年底上汽乘用车携手阿里云、泛云科技建设业内首个IaaS混合型工业仿真计算服务平台——上汽仿真计算云SSCC(SAIC Simulation Computing Cloud),再度验证了云计算模式在工业研发领域的弹性、快速与高效!
上汽仿真计算云主要由阿里云公共云集群和上汽乘用车自建集群两大部分组成,同时通过高速专线实现了数据互通和计算资源的联合调度。阿里云公共云集群通过VPC技术确保了资源隔离和数据安全性,其中阿里云公共云集群主要提供了以下计算资源:
- HPC计算集群
- NAS共享文件存储
NAS作为云上数据流的共享交通枢纽,无论是用户提交的作业输入,作业求解结果,后处理输入数据,都经由NAS中转使得VPC内所有计算资源可以同时访问数据,NASplus还打通了Windows/Linux跨平台共享数据访问,满足常见企业业务场景。NAS结合阿里云飞天盘古2.0最新技术,提供了高聚合带宽,完全满足CAE软件的I/O性能需求,并通过多备份等手段提供了10个9的数据可用性。随着业务规模增长,还可以根据需求升级为CPFS分布式文件系统提供极致I/O性能。
图形处理集群
采用Pascal架构的Nvidia Tesla系列企业级GPU,在提供高可用性的同时,确保在多用户登录使用图形服务器时仍能生成流畅的演示动画,快速完成模型渲染等工作,保障前/后处理工作流的完整性、可靠性。
客户之声
- 用户从本地通过高速通道上传作业输入参数以及网格数据至NAS
- 通过集成于上汽仿真计算云的虚拟应用在云端完成模型数据前处理,数据保存在NAS上
- 在上汽仿真计算云门户通过作业模板指定NAS上的输入数据,进行作业提交,作业在HPC计算集群完成计算求解,结果直接输出到NAS,最后通过虚拟应用,从NAS导入结果继而完成后处理。
数据显示,平均每天500多个碰撞分析、结构刚度分析、流体分析、NVH分析等多学科仿真计算作业在上汽仿真计算云平台上完成,模拟了整车、发动机数百种工况。由于阿里云超级计算集群带来的性能提升,相对本地集群节约了计算求解时间,用户作业排队时间也明显缩短,工程师可以在工作时间段做更多的模型调整,提升工作效率。另外作业数据绝大部分在阿里云公共云集群闭环流动,大大减轻了本地存储的压力,更多历史工程数据得以保留,为工程师做多方案对比分析提供了极大帮助。据了解,借助阿里云,上汽乘用车实现了工程开发仿真能力升级,仿真计算效率提升了25%,使工程开发人员更加专注于产品设计和性能优化,打造出世界级产品的高品质。今年北京车展上全球首秀的概念车MG X-Motion,其量产车的卓越整车性能正是经过上汽仿真计算云平台反复验证和优化的。
上汽乘用车数据及信息系统部工程应用支持高级经理尤静表示,阿里云与上汽自建HPC集群,性能表现卓越、资源弹性伸缩,大大缓解了研发需求的压力,很好地保障了工程开发进度。数据及信息系统部基础设施总监强斌也表示,阿里云公共云管控模式成熟,安全性符合上汽相关规范,资源开通灵活,节约了自建集群的资源投入和人力成本。据了解,混合云技术的应用,有效推动了上汽乘用车技术中心的全球化数字研发发展进程,符合上汽乘用车产品国际化的研发思维;同时这种高效合作的模式,可以快速扩展到产品研发的完整业务链,助力上汽乘用车向终端市场快速推出符合上汽“新四化”——电动化、智能网联化、共享化、国际化发展方向的汽车产品和出行服务。
项目特点
综合IaaS/PaaS/SaaS各方面的创新,上汽仿真计算云表现出以下几方面的技术优势:
1.性能优越
NASplus/CPFS共享存储提供聚合带宽,满足绝大多数CAE场景需求,还可升级至CPFS文件系统
2.SLA保证
公共云完善稳定的管控系统及宕机迁移等响应手段,保障了单个计算节点99.95%的可用性,确保CAE仿真计算业务的连续性。
3.混合云架构
云上VPC与本地集群通过高速通道(专线)打通成为独立子网,确保数据安全互通
4.自动伸缩(*需E-HPC支持)
直接在阿里云控制台操作公共云资源开通,分钟级交付整个集群,即可开展测试。无需等待采购或数据中心机房规划/安装部署等琐碎问题。POC进行时,可以选择临时开通超过正式环境规划的资源量,加快CAE应用验证流程。
6.Linux/Windows数据共享互通
NASplus提供了业界领先的NAS同时以NFS协议挂载到Linux/Windows上的重要功能,使得用户可以在使用熟悉的Windows操作界面进行交互式后处理操作的时候,能够直接读取共享存储中的求解计算结果。
7.无限容量的数据闭环
8.完善的帐号管理使能协同开发
客户可以通过RAM授权子帐号只读权限的方式,让合作伙伴登录云上机器进行软件维护,错误排查/分析等,无需长途奔波到现场。共享后台VNC链接也大大方便了多方讨论合 作。
9.完备的SaaS服务能力
计算类应用:LS-Dyna,Converge, Star-CCM+, Fluent, MSC.Nastran, NX.Nastran, MSC.Admas, NCode,OptiStruct, Abaqus, Star-CD, iSight
10.精细化业务调度能力
项目意义