作业队列初步认识¶
我校高性能计算公共服务平台共分为两个集群:飞马一号 和 襄阳集群,两个集群通过同一管理门户使用,但是分别拥有自己的存储空间,计算数据不互通。
每资金账户根据申请的资源不同,能访问的分区不同。以下是两集群所有分区。
飞马一号¶
队列(分区) | 节点数 | CPU核心数 | 内存 | GPU卡数 | 描述 |
---|---|---|---|---|---|
C064M0256G | 146 | 64 | 256G | 0 | 分区名:Core 64 Memory 256G |
C096M1536 | 1 | 96 | 1536G | 0 | 分区名:Core 96 Memory 1536G |
NV4K80G | 7 | 32 | 512G | 4 | 分区名:Nvidia 4卡 单卡显存 80G |
FREEC064M0256G | 3 | 64 | 256G | 0 | 免费分区:Core 64 Memory 256G |
襄阳集群¶
襄阳集群共含18个计算节点,两队列包含相同的一组计算节点。
队列(分区) | 节点数 | CPU核心数 | 内存 | GPU卡数 | 描述 |
---|---|---|---|---|---|
debug | 18 | 56 | 512G | 1 | 运行限时7天,优先级相对较高 |
gpu | 18 | 56 | 512G | 1 | 运行不限时,优先级相对较低 |