1. 国内精品伊人久久久久影院对白_久久亚洲精品人成综合网_久久国语露脸国产精品电影_国产精品美女久久久M_国产韩国精品一区二区三区久久

          ?
          萬億大模型存力受限?寶德自研AI數(shù)據(jù)湖存儲來破局

          時間:2023-08-01來源:本站

          近年來,隨著人工智能模型產業(yè)的快速發(fā)展,尤其是在Transformer結構出現(xiàn)以后,AI大模型規(guī)模逐步提升。ChatGPT的問世,更是掀起了一場“百模大戰(zhàn)”,大模型參數(shù)量實現(xiàn)了從億級到萬億級的突破。
          而大模型所謂的“大”,體現(xiàn)在模型的深度學習網絡層數(shù)多、鏈接多、參數(shù)復雜,以及訓練所用數(shù)據(jù)集種類更復雜,數(shù)據(jù)數(shù)量更豐富。模型規(guī)模的提升,帶來了AI相關海量數(shù)據(jù)的增長,也帶來了存儲和處理這些數(shù)據(jù)的難題。大模型訓練不僅受限于海量的算力, 更受限于巨大的存力瓶頸。

          大模型時代,AI存力與算力同樣不容忽視

          數(shù)據(jù)存力是算力價值的前提和基礎,只有數(shù)據(jù)存得好、算得快、傳得穩(wěn),整個算力基礎設施才能夠發(fā)揮數(shù)據(jù)要素的價值,才能更好地支持大模型中的信息實時傳輸和高效率讀寫。隨著算力需求的迅速提升,支撐起龐大AI算力的存儲系統(tǒng)也亟待升級。如若存儲系統(tǒng)的性能無法匹配強大的算力,那么GPU/CPU算力將會由于數(shù)據(jù)無法跟上而處于等待狀態(tài),將會嚴重浪費龐大、昂貴的算力基礎資源投資。
          當前,大模型應用場景對數(shù)據(jù)存儲提出了以下挑戰(zhàn):

          1

          數(shù)據(jù)歸集速度慢且來源復雜,預處理階段難以實現(xiàn)統(tǒng)一訪問。數(shù)據(jù)類型多元復雜,服務協(xié)議多樣,傳統(tǒng)存儲面向單一數(shù)據(jù)類型設計,難以以統(tǒng)一的方式進行訪問和處理,數(shù)據(jù)歸集流程慢。


          2

          海量小文件數(shù)據(jù)加載慢,存儲性能不足導致算力無法充分發(fā)揮。大模型對存儲系統(tǒng)的讀寫性能要求較高,特別是在訓練過程中需要頻繁地讀取和寫入數(shù)據(jù),而且需要支持快速的隨機訪問。數(shù)據(jù)通常以圖片、文檔等小文件的形式存在,由于這些小文件的數(shù)量巨大,傳統(tǒng)存儲系統(tǒng)可能無法高效地處理這些數(shù)據(jù),導致加載速度緩慢。


          3

          寶貴的研究數(shù)據(jù),在各個階段面臨可靠性和安全性問題。大模型通常使用敏感數(shù)據(jù)進行訓練和推斷,在存儲時需要保證數(shù)據(jù)的安全性和完整性,防止數(shù)據(jù)外泄、篡改或被惡意攻擊。一旦存儲數(shù)據(jù)損壞或丟失,可能會導致訓練結果的丟失或者準確性下降。


          4

          大容量存儲需求。大模型需要處理大量的數(shù)據(jù),包括輸入數(shù)據(jù)和模型參數(shù)。這些數(shù)據(jù)往往非常龐大,需要大量的存儲空間來保存。

          為了解決大模型時代的數(shù)據(jù)存儲難題,并適應AI大模型的發(fā)展需求,寶德重磅推出了完全自研的AI數(shù)據(jù)湖存儲——PLStor GS9200來破局!      
          寶德PLStor GS9200是一款面向大模型多應用場景,以性能為中心,具備高可靠、簡單易用和豐富企業(yè)級功能等優(yōu)勢的領先并行存儲系統(tǒng)。其存儲集群支持無上限的大規(guī)模擴展,可以輕松擴展到EB級別,并能夠承載上萬臺AI/異構算力服務器,滿足大容量存儲需求。    


          極致性能

          海量小文件高吞吐量、計算客戶端高讀寫


          寶德PLStor GS9200提供了業(yè)內領先的基于os內核程序優(yōu)化設計的原生客戶端,以一客戶端對多臺存儲節(jié)點的方式并行讀寫數(shù)據(jù),支持RDMA技術。整個系統(tǒng)能提供上TB/s級的吞吐帶寬。

          在實際運行中,寶德PLStor GS9200的單臺計算節(jié)點能夠充分利用自身的網絡吞吐極限能力,進行數(shù)據(jù)讀寫。例如,配置了400Gbps Infiniband網絡的PLStor GS9200單臺節(jié)點可以獲得≥45GB/s的讀寫帶寬。寶德PLStor GS9200在性能測試中表現(xiàn)出色,相比于業(yè)內友商和開源系統(tǒng),每塊Nvme-SSD在該系統(tǒng)中可以提供超過4.3GB/s的讀寫性能,提升了150%;而每塊SATA硬盤的讀寫性能超過120MB/s,提升了80%。



          存算融合

          多級存儲滿足不同階段的數(shù)據(jù)存儲需求


          寶德PLStor GS9200采用存算融合的設計,可以整合計算節(jié)點內的存儲資源,構建全局命名空間的近線存儲池。這使得AI計算可以像訪問本地資源一樣訪問并行文件系統(tǒng),實現(xiàn)文件共享和高并發(fā)讀寫訪問。通過存算融合的部署方案,可以實現(xiàn)靈活配置數(shù)量來擴展GPU/CPU計算資源和存儲資源,以滿足動態(tài)擴展的業(yè)務需求。



          數(shù)據(jù)安全無小事,軟硬實力兩手抓


          寶德PLStor GS9200保證并行存儲系統(tǒng)在數(shù)據(jù)安全性、高并發(fā)讀寫、高空間利用率三者皆得。它采用N+M糾刪碼來設置數(shù)據(jù)保護等級,并具備自動故障檢測與恢復機制,實現(xiàn)硬件系統(tǒng)故障自動快速恢復重建。系統(tǒng)同時支持智能快照功能,可以創(chuàng)建多達無限數(shù)量的基于增量歷史時間點拷貝。當發(fā)生數(shù)據(jù)“軟”故障,比如軟件程序導致的數(shù)據(jù)損壞、病毒破壞、意外刪除等,可以通過對合適的時間點標記進行“回滾”來快速恢復數(shù)據(jù)。此外,系統(tǒng)還支持權限控制列表ACL等功能,以及更多可靈活配置的文件訪問權限控制選項,以滿足不同場景下的數(shù)據(jù)安全存儲和訪問需求。



          數(shù)據(jù)湖存儲多協(xié)議互通,實現(xiàn)平臺高效管理


          寶德PLStor GS9200數(shù)據(jù)湖存儲支持塊、文件、對象、大數(shù)據(jù)等存儲協(xié)議,并且支持POSI/NFS/CIFS/HDFS/S3/Swift等多種協(xié)議互通,可同時訪問同一文件,避免因訪問協(xié)議不同造成的數(shù)據(jù)拷貝。它還支持多協(xié)議同時讀寫,無明顯語義損失,支持文件修改寫、對象多段上傳等常用語義,無需配置額外的網關。同時數(shù)據(jù)可根據(jù)應用需要在數(shù)據(jù)湖中進行可視的流動,簡化數(shù)據(jù)歸集流程,實現(xiàn)統(tǒng)一平臺管理,大大提升業(yè)務與管理效率。

          當前,萬億級AI大模型之戰(zhàn)已經打響。面對萬億級參數(shù)量和PB級數(shù)據(jù)量帶來的挑戰(zhàn),寶德PLStor GS9200并行存儲系統(tǒng)憑借更高的可靠性、讀寫性能、兼容能力等優(yōu)勢,完美替代了傳統(tǒng)的文件系統(tǒng),支撐了大量人工智能、商用HPC項目的數(shù)據(jù)存儲應用,并成功促進了超過五千臺計算節(jié)點客戶端、超過五百臺存儲節(jié)點的單一文件系統(tǒng)、超過100PB裸容量的單一存儲池等諸多大規(guī)模項目落地,助力AI大模型等更多應用加速。
          未來,寶德將持續(xù)技術創(chuàng)新,提供多樣化的存儲產品與方案,并積極攜手更多合作伙伴,共同推進AI賦能千行百業(yè),助力開啟AI大模型時代新局面。
          熱門推薦
          ? www夜插内射视频网站_久久亚洲精品人成综合网_久久国语露脸国产精品电影_国产精品美女久久久M

                1. 离岛区| 蒙山县| 小金县| 吐鲁番市| 大悟县| 淅川县| 博湖县| 滦南县| 鹤庆县| 英德市| 新乡县| 宜宾县| 惠安县| 贵溪市| 阿坝| 凤凰县| 南宁市| 宁晋县| 定兴县| 丽江市| 龙岩市| 拉孜县| 桐乡市| 青铜峡市| 永城市| 五常市| 广饶县| 龙泉市| 敖汉旗| 收藏| 崇明县| 若羌县| 怀宁县| 龙游县| 浦北县| 许昌市| 陈巴尔虎旗| 开阳县| 湾仔区| 湖南省| 嵩明县|