詳細信息 |
FCGEC數據集-浙江大學 |
編輯: 來源:華泰證券 時間:2023/5/19 |
FCGEC 數據集:于 2022 年由浙江大學和華為聯合發布。FCGEC 用于檢測、識別和糾正 語法錯誤,是一個人工標注的多參考語料庫,由 41,340 個句子組成,主要來自公立學校語 文考試中的選擇題。
|
【聲明:轉載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內容僅供參考,如有侵權,請聯系刪除。】 |
推薦信息 |
DRCD數據集-臺達
DRCD數據集中文機器閱讀理解數據集,包含來自 2108 篇維基百科文章的 10014 個段落和由注釋者生成的 33,941 個問答對
Ape210K數據集-猿輔導 AI Lab
Ape210K是一個新 的大規模和模板豐富的數學單詞問題數據集,包含 210K 個中國小學水平的數學問題,包含黃金答案和得出答案所需的方程式
Math23K數據集-解決數學問題數據集
Math23K是為解決數學問題而創建的數據集,數據包含從在線教育網站上抓取的 6 萬多個中文數學單詞問題,都是小學 生真正的數學應用題
CAIL2018數據集 中國法律數據
CAIL2018是第一個用于判決預測的大規模中國法律數據集,收錄 了中國最高人民法院公布 260 萬件刑事案件,由適用的法律條款指控和刑期組成
中國開源大語言模型數據集 WuDaoCorpora數據集
WuDaoCorpora數據集采用 20 多種規則從 100TB 原始網頁數據中清洗得出最終數據集,注重隱私數據信息的去除,支持多領域預訓練模型的訓練
中國開源大語言模型數據集 DuReader數據集
DuReader是一個大規模的開放域中文機器閱讀理解數據集,問題和文檔基于百度搜索和百度知道,答案是手動生成的,由200K問題,420K答案和1M文檔組成
中國多模態大模型數據集構建
阿里M6大模型參數規模達到 1000 億,構建了最大的中文多模態預訓練數據集 M6-Corpus;百度ERNIE-ViLG大模型參數規模達到 100 億
中國三個大語言模型數據集構建
百度Plato-XL大模型預訓練語料規模達千億級 token,模型規模高達 110 億參數;華為盤古大模型開源了盤古α和盤古α增強版兩個版本 |
智能運輸機器人 |
AGV無人運輸機器人-料箱版 |
AGV無人運輸機器人-標準版 |
AGV無人運輸機器人-料箱版(鈑金材質) |
AGV無人運輸機器人-貨架版(鈑金材質) |
AGV無人運輸機器人-貨架版(亮面不銹鋼材質) |
AGV無人運輸機器人-開放版 |
行業動態 |
咨詢熱線:4006-935-088 / 4006-937-088
客服熱線:
4008-128-728
版權所有 @ 創澤智能機器人集團股份有限公司 魯ICP備18039973號-2 運營中心 / 北京·清華科技園九號樓 生產中心 / 山東省日照市開發區太原路71號 |