<strong id="y8sim"></strong>

    1. <label id="y8sim"></label>
      1. 中文互聯網語料AI資源平臺發布:27個數據集、總量2.7T

        2025-01-11 11:43:18閱讀()中國網絡空間安全協會
        推薦題庫

        中國網絡空間安全協會于1月9日發布公告,面向社會發布中文互聯網語料資源平臺,支持行業領域、內容模態、體量規模等多種標簽分類,便于用戶下載與使用。

        該協會表示在中央網信辦指導下,會同國家互聯網應急中心,在前期發布中文互聯網基礎語料 1.0的基礎上,依托專委會建立的語料共建共享機制,匯聚一批新的高質量可信數據,經過信源篩選、內容過濾、數據去重等一系列嚴格細致的數據加工處理措施,形成并對社會發布中文互聯網基礎語料2.0,規模120GB,數據3800萬條。

        注:目前平臺共入駐27個語料數據集,數據總量約2.7T,主要分三類:

        一是中國網絡空間安全協會會同國家互聯網應急中心等建設的中文互聯網基礎語料;

        二是人民網、北京智源研究院、上海人工智能實驗室等單位共享的互聯網語料;

        三是中國網絡空間研究院、中國國家版本館、中國大百科全書出版社、中國社會科學院圖書館等單位貢獻的優質中文基礎語料樣本。

        用戶登錄中國網絡空間安全協會網站(https://www.cybersac.cn/newhome),點擊“中文互聯網語料資源平臺”鏈接,通過注冊、認證等程序,即可下載相關語料。

        網安協會人工智能安全治理專委會負責人表示,數據是發展人工智能的基礎關鍵資源,中文互聯網基礎語料2.0是各界協同共建高質量中文語料的又一重要成果,專委會將持續加強中文互聯網基礎語料建設,為人工智能技術創新和產業發展提供有力支撐和保障。


        掃一掃,手機繼續看
          特別聲明:文章多為招考官網轉載,如有侵權請聯系!
          部分數據為彩果考試網(www.internationaldailysun.com)收集整理,轉載或復制請注明出處!-彩果考試網-
          国产成本人片免费av短片|无码专区中文字幕无码野外i|欧美大黑帍在线播放|人和牛交VIDE欧美|亚洲自偷自偷在线成人网站传媒
          <strong id="y8sim"></strong>

          1. <label id="y8sim"></label>