詳細信息

FCGEC數據集-浙江大學

編輯：來源：華泰證券時間：2023/5/19

FCGEC 數據集：于 2022 年由浙江大學和華為聯合發布。FCGEC 用于檢測、識別和糾正語法錯誤，是一個人工標注的多參考語料庫，由 41,340 個句子組成，主要來自公立學校語文考試中的選擇題。

【聲明：轉載此文出于傳遞更多信息之目的，并不意味著贊同其觀點或證實其描述，文章內容僅供參考，如有侵權，請聯系刪除。】

推薦信息

DRCD數據集-臺達
DRCD數據集中文機器閱讀理解數據集,包含來自 2108 篇維基百科文章的 10014 個段落和由注釋者生成的 33,941 個問答對

Ape210K數據集-猿輔導 AI Lab
Ape210K是一個新的大規模和模板豐富的數學單詞問題數據集,包含 210K 個中國小學水平的數學問題,包含黃金答案和得出答案所需的方程式

Math23K數據集-解決數學問題數據集
Math23K是為解決數學問題而創建的數據集,數據包含從在線教育網站上抓取的 6 萬多個中文數學單詞問題,都是小學生真正的數學應用題

CAIL2018數據集中國法律數據
CAIL2018是第一個用于判決預測的大規模中國法律數據集,收錄了中國最高人民法院公布 260 萬件刑事案件,由適用的法律條款指控和刑期組成

中國開源大語言模型數據集 WuDaoCorpora數據集
WuDaoCorpora數據集采用 20 多種規則從 100TB 原始網頁數據中清洗得出最終數據集,注重隱私數據信息的去除,支持多領域預訓練模型的訓練

中國開源大語言模型數據集 DuReader數據集
DuReader是一個大規模的開放域中文機器閱讀理解數據集,問題和文檔基于百度搜索和百度知道,答案是手動生成的,由200K問題,420K答案和1M文檔組成

中國多模態大模型數據集構建
阿里M6大模型參數規模達到 1000 億,構建了最大的中文多模態預訓練數據集 M6-Corpus;百度ERNIE-ViLG大模型參數規模達到 100 億

中國三個大語言模型數據集構建
百度Plato-XL大模型預訓練語料規模達千億級 token,模型規模高達 110 億參數;華為盤古大模型開源了盤古α和盤古α增強版兩個版本

智能運輸機器人

AGV無人運輸機器人-料箱版

AGV無人運輸機器人-標準版

AGV無人運輸機器人-料箱版（鈑金材質）

AGV無人運輸機器人-貨架版（鈑金材質）

AGV無人運輸機器人-貨架版（亮面不銹鋼材質）

AGV無人運輸機器人-開放版

行業動態

» AMR企業未來發展的建議:加強產學研合作拓展應用領域與場景突破關鍵技術

欧美激情中文字幕一区二区-欧美激情在线精品video-欧美激情影院-欧美激情一区二区三区在线-欧美激情一区二区三区视频高清-欧美激情一区二区三区视频