發佈日期 : 2020/05/17

長庚資工與麗臺科技合作首創GDMS AI資源管理環境


長庚大學攜手麗臺科技,針對今年即將發表的產品 GDMS,進行系統上線測試前交流。GDMS (GPU Docker Management System) 為一個以Docker為基礎的GPU資源分配與管理的系統,透過直覺式圖型使用者介面,集中管理學校的AI開發資源。除了GPU、CPU、函式庫及所有Container等狀況在儀表版上一覽無遺、利於管理外,GDMS提供一人使用多GPU,以及多人使用單GPU兩種資源分配模式,將可讓長庚大學資工系在AI專案研發和教學環境佈署上,達到資源使用最大化、管理工作高效化,以降低總體擁有成本。

長庚大學資工系主任陳仁暉教授提到,為了優化研究與教學的繁瑣管理流程,我們需要一個專業管理AI開發環境的工具,以完全掌握現有資源,作有效配置,並縮短備課時間,讓老師及學生能更專注於AI的教學與研究。GDMS的導入可以搭配 WinFast GPU伺服器與工作站一同運作,讓Docker及相關資源的設定分配變的十分簡單,大幅提升操作便利性及教學效益。另一方面,由於資源運用達到最大化,學校在AI軟硬體的投資報酬率將達到最大值。

教學模式(多人使用單 GPU):圖形化操作介面,上課環境輕鬆佈署

有別於傳統,無法多人共用單一GPU,以及需為每位使用者一一下指令佈署Container所需的硬體資源所造成的不便。GDMS以設備管理系統(Device Management System)出發,著重於各設備間軟體的佈署以及資源的分配,故不受單一GPU卡只能開一個Container的限制,達到多人使用單GPU以及多人使用多GPU目的,特別適用於教學環境管理。在操作上,麗臺GDMS是以專案為基礎的管理架構,管理者可透過GDMS圖形化操作介面,指定特定專案的開發成員,將其群組化後,將現有未被占用的硬體資源,依需求配置給專案成員,還可指定資源使用時間,屆時自動釋放資源,確保有限資源被有效運用。

研發模式(一人使用多 GPU):集中GPU資源,支援大型研發案開發

反之,如果正在進行大型研發專案,麗臺GDMS可集中所有GPU資源支持專案進行。

最經濟的多叢集架構的軟體環境

另一個應用,是在伺服器上安裝整合了NVIDIA NGC Image的麗臺RTX AI Software Pack,再通過 GDMS 所啟動的Container,可以根據使用者設定,開啟多個對應的連接埠、整合存儲設備(storage)路徑,以及安裝必要套件(ex. OpenCV, SSH Server..),專案成員亦可自行上傳所建立的Docker Image。如此一來,透過GDMS的管理,除了 AI/GPU 的資源分配之外,只需要對應多組連接埠,亦可在有限的硬體實現多叢集架構的軟體教學 (ex. Hadoop),不需再購買其他虛擬化方案。

圖說:麗臺科技薛宏宇高級工程師(左一)、麗臺科技劉家豪專案經理(左二)、長庚大學資工系陳仁暉系主任(中)、資工系李季青助理教授(右二)、麗臺科技林威延資深經理(右一)。