在現代社會,在線購物、訂購和其他形式的在線消費是日常生活的重要組成部分。在享受舒適生活的同時,人們有時必須陷入巨大而復雜的信息和數據中。當時,對定制和智能參考系統的需求增加了。這些系統可以通過有效解決信息過載并基于用戶偏好和歷史限制推薦更多個性化元素來改善用戶體驗。隨著深度學習應用的爆炸性增長,基于深度學習的推薦變得越來越重要。
深度學習推薦系統(DLRS)是meta、Google和NVIDIA等技術的主要基礎設施。DLR通常包括大量ML模型和通過在地理分布式數據中心復制而托管在深度神經網絡上的大量參數化服務器。這里,每個數據中心都有一系列推理服務器,它們從本地參數服務器中提取模型并向客戶端生成推薦結果。
為了快速提供新用戶和內容,DLRS需要繼續以低延遲更新ML模型。然而,這對于現有的DLRS系統來說并不容易。流行的推薦系統,如NVIDIA Merlin、Google TFRA、meta BigGraph、離線更新模型、收集新的訓練數據、計算離線模型歷史、驗證模型檢查點并分發到所有數據中心。整個過程需要幾個到幾個小時。另一種選擇是使用WAN優化的ml系統或關聯學習系統。該系統使用本地收集的數據更新復制模型,并執行延遲的復制同步,這通常會影響lo(服務級別目標)。
考慮到現有DLR的局限性,有沒有辦法擺脫這種局面?騰訊、愛丁堡大學等科研機構共同研究了7月11日至13日舉行的第16屆osdi 2022大會。研究人員釋放了ekko。這是一個全面的深度學習推薦系統,支持在不犧牲SLO的情況下更新低延遲模型。它比當前的SOTA DLRS系統快1位數。騰訊用于生產環境,為用戶提供各種推薦服務。
Osdi(操作系統設計和實現)是世界領先的計算機系統軟件會議之一。在操作系統原理方面,她被稱為奧斯卡。USENIX贊助的學術地位很高。在這次會議上,共有253筆捐款,占49%,接受率約為19.4%。Ekko:騰訊選擇的第一篇文章是一個具有低延遲模型更新的海量深度學習推薦系統。
歡迎關注騰訊企業郵箱:http://www.parmaja.com/new/2616.html