跳转至

第1章 简介

文档概述

本文档提供了有关如何使用”神工坊“高性能仿真平台V2.0用户门户的指导。

本文档是为需要使用”神工坊“高性能仿真平台V2.0用户门户的人员编写的。本文档的目标读者为工业制造等领域的仿真工程师。

符号约定

本文档使用如下符号约定:

警告 提醒您要小心,以避免误操作导致设备损坏或数据丢失。

注意 强调关键点或提供更多信息,如操作限制、最佳实践或帮助性的建议或参考,作为对正文的补充。

提示 表示以下信息将帮助您解决某个问题或节省您的时间

“神工坊”高性能仿真平台V2.0介绍

“神工坊”高性能仿真平台是专为工业制造领域提供高性能工业仿真和仿真软件开发服务在线平台。平台以国家超级计算无锡中心丰富的软件资源和海量的硬件资源为支撑,为用户提供了一个本地“PC”式体验的高性能仿真平台,平台基于高效、低延迟远程传输协议和GPU渲染等方式,给用户提供流畅、清晰的工业仿真软件原生界面操作体验的同时,保留了超算强大算力的支撑。另外,平台支持多级用户管理功能,方便企业整体入驻,为企业提供多级部门管理、在线共享空间、在线分享图形界面等功能,助力企业在线协同研发,提高设计研发效率。 面向开发用户,平台提供自研软件在线编译、运行服务,并支持自研软件发布至平台应用商城,供平台其他用户订阅使用,并能获取用户使用反馈,协助软件迭代升级。

概念及术语

在您开始使用”神工坊“高性能仿真平台V2.0用户门户前,请先了解下表中所描述的概念和术语。

表 1-1 “神工坊“高性能仿真平台V2.0用户门户 概念和术语

概念 描述
主机(host) 集群中提供计算资源的实体,作业在其上被提交或执行。
提交主机(Submission host) 作业在其上被提交的主机。
运行主机(Execution host) 执行作业的主机。
作业(Job) 按照应用实例提交至神工坊应用空间的一组命令。可占用一至多个Job slot。
作业槽(Job slot) 神工坊平台中处理器分配的最小单元。可以是一至多个物理处理器或物理处理器的一部分。默认情况下,一个job slot就是一个处理器核。
队列(Queue) 网络范围内的一个存放作业的地方,负责对不同作业实施调度及管理调度策略。
项目(Project) 网络范围内的一个存放作业的地方,负责对不同作业实施调度及管理调度策略。
密级(secret_level) 系统设置针对项目,作业,用户设置的安全等级。
应用实例 应用实例可以将用户的参数存储为实例,用户切换应用实例完成应用资源选择。

平台队列资源

以下是目前神工坊2.0平台已经接入的硬件资源(更新时间2024.0625): | 名称 | 队列类型|所在集群 | 型号规格 | 集群资源 | |:-------: |:-------: | :----: | :----: |:----: |
| q_x86_sfexper | CPU计算队列| 本地AMD集群| AMD EPYC 7H12/7742 | 1*128*512G | | q_x86_sf |CPU计算队列 |本地AMD集群| AMD EPYC 7H12/7742| 8*128*512G | | GPU_sf | GPU图形队列|本地集群| nvidia Quadro P400 | 1*64*128G | | GPU_RTX | GPU图形队列 |本地集群| nvidia Quadro RTX 4000| 1*40*512G | | q_x86_share |CPU计算队列 | 远程Intel集群| Intel(R) Xeon(R) CPU E5-2680 v3 | 766*24*128G | | q_x86_cn_sim |CPU计算队列 | 远程Intel集群| Intel(R) Xeon(R) CPU E5-2680 v3 | 5*24*128G | | q_amd_share |CPU计算队列 | 远程AMD集群 | AMD EPYC 7H12| 500*128*256G | | q_intel_share |CPU计算队列 | 远程Intel集群 | Intel Xeon 8358| 60*64*256G | | wzhcnormal |CPU计算队列 | 远程Hygon集群 | Hygon 7285 | 1561*64*256G |

no 注意 :

  1. 远程队列目前仅支持非图形界面方式提交,本地集群支持图形化作业
  2. 仿真计算应用需使用到CPU队列,图形应用需使用到GPU队列
  3. 集群资源格式为:节点数*每节点核数*每节点内存大小

warn 警告 不必要的作业进程注意及时关闭,以免造成队列资源浪费和费用损失