詳細信息 |
Zero數據集-大規模的中文跨模態基準 |
編輯: 來源:華泰證券 時間:2023/5/19 |
Zero 數據集:于 2022 年由北京航空航天大學、清華大學、奇虎 360 人工智能研究所聯合 發布。Zero 是一種大規模的中文跨模態基準測試,其中包含目前大的公共預訓練數據集 ZERO-Corpus 和五個用于下游任務的人工注釋微調數據集。ZERO-Corpus 包含 2.5 億張 圖片和 7.5 億篇文字描述,另外五個微調數據集中的兩個也是目前跨模式下游任務中 大的數據集。
|
【聲明:轉載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內容僅供參考,如有侵權,請聯系刪除。】 |
推薦信息 |
Noah-Wukong數據集-華為諾亞方舟實驗室
諾亞悟空數據集是一個大規模的多模態中文數據集,包含100萬對圖文對,數據集中的圖像根據大小和寬高比進行過濾
MUGE數據集[清華大學和阿里巴巴]
MUGE數據集,于 2021 年由清華大學和阿里巴巴聯合發布,包括圖像描述,圖像文本檢 索和基于文本的圖像生成 3 種多模態理解和生成任務
MATINF數據集-武漢大學和密歇根大學
MATINF數據集 是一個聯合標注的大規模數據集,用于中文母嬰護理領域的分類,問答和總結,數據集中的一個條目包括四個字段,問題,描述,類別和答案
ODSQA 數據集-臺灣大學
ODSQA數據集由臺灣大學發布。ODSQA 數據集是用于中文問答的口語數據 集。它包含來自 20 位不同演講者的三千多個問題
Douban Conversation Corpus 數據集
豆瓣會話語料庫包括一個訓練數據集、一個開發集和一個基于檢索的 聊天機器人的測試集,測試數據包含 1000 個對話上下文
E-KAR數據集-復旦大學
E-KAR數據集包含來自公務員考試的 1,655 個(中文)和 1,251 個(英文)問題,這 些問題需要深入的背景知識才能解決
FCGEC數據集-浙江大學
FCGEC數據集用于檢測,識別和糾正 語法錯誤,是一個人工標注的多參考語料庫,由 41340 個句子組成,主要來自公立學校語 文考試中的選擇題
DRCD數據集-臺達
DRCD數據集中文機器閱讀理解數據集,包含來自 2108 篇維基百科文章的 10014 個段落和由注釋者生成的 33,941 個問答對 |
智能運輸機器人 |
AGV無人運輸機器人-料箱版 |
AGV無人運輸機器人-標準版 |
AGV無人運輸機器人-料箱版(鈑金材質) |
AGV無人運輸機器人-貨架版(鈑金材質) |
AGV無人運輸機器人-貨架版(亮面不銹鋼材質) |
AGV無人運輸機器人-開放版 |
行業動態 |
咨詢熱線:4006-935-088 / 4006-937-088
客服熱線:
4008-128-728
版權所有 @ 創澤智能機器人集團股份有限公司 魯ICP備18039973號-2 運營中心 / 北京·清華科技園九號樓 生產中心 / 山東省日照市開發區太原路71號 |