ICC訊 隨著人工智能應用的快速發展,AI智算網絡正在經歷著加速向超大規模集群演進的過程。由于大規模并行計算的廣泛采用,為了確保AI智算網絡的運行效率與經濟性,AI智算網絡對光互聯的可靠性和可用性均提出了新的挑戰。
大量的實驗及現網數據表明,光纖鏈路臟污是導致AI智算網絡的故障的一個重要因素,其引起的丟包會大幅降低AI智算中心集群的可用度;同時,隨著網絡聯接規模的指數級加大,涉及的光聯接節點數也呈指數級倍增,光聯接的虛接問題已經成為影響AI智算網絡開局及日常運維效率的另一個重要因素。
“星云“400G/800G光模塊依托海思在光/電芯片、軟/硬協同等方面的技術整合優勢,實現了領先的臟污定位檢測與診斷算法,支持主動在線光路診斷監測預警和故障定界。該產品具備三大技術優勢:
● 極簡維護:無需外在儀表,無需現場上站檢測,可遠程監測,大幅減少網絡的開局和日常維護投入,顯著提升運維效率
● 極高可靠:通過持續在線連續跟蹤,提前預警鏈路風險 (臟污、斷纖等),制定技術排障計劃,提升網絡可靠性的同時支撐大模型等AI應用的高效運行
● 極致成本:“星云”光模塊原生支持相關特性,無需外在硬件、傳統儀表等額外支出,打造極致成本的建網和運維方案
在CIOE 2024展上,海思展示了基于“星云“智能400G/800G光模塊的演示方案,在演示中系統中通過人為引入的光纖虛連接、接口臟污乃至光器件性能劣化均得到了明確的預警與界定,從而顯著提升了網絡的維護效率,得到產業上下游的高度關注與認可。
AI及AI智算網絡正處于前所未有的加速發展階段,海思光電打造的“星云”系列光模塊將繼續適配AI智算網絡對光互聯的關鍵需求,賦能高可用、高可靠、智能化等業務場景,助力AI智算網絡的蓬勃發展。