基于共享GPU的深度學(xué)習(xí)訓(xùn)練性能實(shí)證研究
摘要: 深度學(xué)習(xí)應(yīng)用的訓(xùn)練過(guò)程是計(jì)算密集型的,它通常依靠圖形處理單元(Graphics Processing Unit, GPU)來(lái)加速訓(xùn)練過(guò)程。然而深度學(xué)習(xí)開(kāi)發(fā)框架往往會(huì)獨(dú)占GPU,造成計(jì)算資源的浪費(fèi)。針對(duì)該問(wèn)題,該實(shí)證研究對(duì)兩個(gè)深度學(xué)習(xí)應(yīng)用共享GPU訓(xùn)練的可行性進(jìn)行討論,系統(tǒng)地分析了有代表性的深度學(xué)習(xí)模型的靜態(tài)和運(yùn)行時(shí)特性,展示了共享GPU訓(xùn)練兩個(gè)模型時(shí),不同的模型組合和特征對(duì)整體... (共7頁(yè))
開(kāi)通會(huì)員,享受整站包年服務(wù)