詳細信息

ChatGPT核心壁壘:算力、數據和工程能力

編輯：來源：國聯證券時間：2023/4/23

ChatGPT 的研發主要分為預訓練（Pre-train）和精調（Fine-tune）兩個環節。其中：1）預訓練：使用無標注、大規模的數據集，對模型進行預訓練。2）精調：讓模型與專業的標注人員、AI 訓練師進行交互，推動模型逐步學習人類通用的表達方式和價值觀，從而終生成符合人類期望的回答。如果將 AI 大模型類比于學生，那么模型的預訓練就是通過廣泛的通識性閱讀，使學生具備初步的文字理解能力；模型的精調就是“教學”的過程，其中使用出色教材的效果往往勝過大量普通書籍。

從 ChatGPT 的主要技術環節，分析其核心壁壘所在：

1）算力資源：據 TrendForce 數據，以英偉達 A100 口徑計算，ChatGPT 需要 2 萬塊 GPU 來處理訓練數據，隨著 ChatGPT 的商用化，需要的 GPU 數量可能超過 3 萬塊。目前國內 GPU 集群的存量資源有限，疊加美實體清單影響G端芯片采購受阻，導致對于國內大模型廠商而言，模型的推理、部署、應用等環節的算力資源緊缺。但從長期來看，國內 AI 大模型算力緊缺的問題有望得到緩解。從市場角度，算力資源本質上是自由流通的商品，相較于模型技術、工程能力等硬性壁壘更易突破；從技術層面看，大模型的研發、應用環節所需算力未來均有優化的空間。4 月 13 日微軟推出大模型訓練工具 DeepSpeed-Chat，其中包括開源的 RLHF 框架，能基于單個 GPU 訓練超過 130 億參數的模型，訓練速度提升 15 倍以上，垂類企業應用大模型的算力門檻有望大幅降低。

2）參數量：一般認為 1000 億的參數量J是語言類大模型產生“涌現”現象的門檻,GPT3 的訓練參數量達 1750 億，GPT4 參數量未公布。對于國內大模型廠商，尤其是擁有豐富自有數據資源的互聯網大廠而言，1000 億的參數量J并非難以達到。目前百度、華為、阿里等頭部企業均已推出或發布千億參數以上的 AI 大模型，但在性能上仍和 ChatGPT 有較大差距。

3）數據集的質量：GPT3 的預訓練數據集來自于 common crawl（網頁爬蟲聚合類數據平臺）、維基百科等標準化程度較G的公開數據庫。目前國內 AI 大模型的預訓練數據集也以公開網頁爬取的數據為主，再結合公司自有的行業數據進行訓練。問題在于，相較于英文，目前互聯網上中文內容的規模和質量均存在較大差距。因此，國內 AI 大模型的預訓練數據集中也以英文數據為主，使得在中文為主的用戶使用環境中產生較多的適配性問題。

目前來看解決的方法包括：一是建立標準化、G質量的中文語料庫；二是加強 AI 大模型的翻譯能力，使其生成的結果更符合中文用戶的使用習慣。

4）工程能力：包括預訓練、精調等訓練環節的執行能力和方法等，需要研發團隊通過長時間的經驗積累、不斷試錯，再對模型結果進行調優，這也是 OpenAI 的 ChatGPT 目前于國內、乃至谷歌 BERT 等其他海外頭部大模型的核心壁壘之一。例如在精調過程中，OpenAI 使用J少量的G質量標注數據，顯著提升了 GPT-3.5 的應答能力。此外，中文和英文數據集在規模、質量等方面存在差距，這也需要額外的工程能力去彌補，使得國產 AI 大模型更適用于中文的使用環境。

【聲明：轉載此文出于傳遞更多信息之目的，并不意味著贊同其觀點或證實其描述，文章內容僅供參考，如有侵權，請聯系刪除。】

推薦信息

ChatGPT的推出，對于人工智能的發展具有三層重要意義
推動 AI 大模型整體的迭代速度加快,應用場景拓寬;提升用戶體驗推動模型認知能力的進一步提升;推動 AGI 終局的可見度提升,落地預期或從2050年大幅提前

ChatGPT 破圈復盤:AI 顯性化的三個階段
ChatGPT能力初步破圈,在學術論文,專業考試等 C 端應用場景中初步破圈;現象級應用誕生,下游生態全面開啟;大模型生態起步

Midjourney是一款AI制圖工具,五次迭代五個版本對比
Midjourney第一代圖像色彩豐富;第二代角色臉部更勻稱;第三代將角色添加到背包中;第四代每幅圖像顯示出具有略微不同的氣候特征;第五代絕佳分辨率

智能寫作：Notion AI將生成式AI融合進在線文檔場景
Notion AI完成的類型:文章,列表和表格,社交媒體帖子,大綱,創意故事,詩歌,隨筆,會議議程,新聞稿,工作介紹,銷售郵件,招聘郵件

gpt視頻工具應用方向辦公提效方式及代表公司
一鍵添加特效,配音,字幕,水印,自動生成片頭等功能;計算出視頻中的若干高光時刻,形成高光混剪短視頻片段;輔助制作高呈現難度的數字特效

gpt音頻工具應用方向辦公提效方式及代表公司
進行詞曲協作,伴奏生成,歌聲合成等;將文本轉化為語音,并賦予不同的聲音形象;生成高品質配音音頻內容,并且可編輯豐富的發音人音色

gpt圖片工具應用方向辦公提效方式及代表公司
根據簡單描述,關鍵詞自動生成圖像;對圖片進行智能調色,美化,摳圖等操作;精準識別圖像中的視覺內容,應用于智能相冊管理,圖片安全監控等場景

gpt文字工具應用方向辦公提效方式及代表公司
輸入標題大綱,即可生成全文初稿;對文章中不合理的用詞,語序錯亂,口語表達等問題進行全面檢查和潤色建議;快速針對內容編輯區全文段落進行摘要生成

智能運輸機器人

AGV無人運輸機器人-料箱版

AGV無人運輸機器人-標準版

AGV無人運輸機器人-料箱版（鈑金材質）

AGV無人運輸機器人-貨架版（鈑金材質）

AGV無人運輸機器人-貨架版（亮面不銹鋼材質）

AGV無人運輸機器人-開放版

行業動態

» AMR企業未來發展的建議:加強產學研合作拓展應用領域與場景突破關鍵技術

» 智能無人運輸車AMR選型建議:安全性穩定性兼容性成本和可維護性

» 物流企業自動化搬運項目:117臺XPL搬運機器人用于快運件轉運+物料暫存

» 工具制造業5G智慧工廠:10+臺潛伏AGV+托盤式叉車用于線邊倉轉運

» 輪胎行業項目:2臺室內平衡重式無人叉車LXP15-B用于半成品、成品自動化出入庫

» 汽車零部件園區無人化物流項目:室外無人駕駛重載AGV用于車間到車間之間的物流運輸

» 汽車行業智能搬運項目:30臺XPL搬運機器人用于產線送料和成品轉運

» 汽車新能源產線智慧物流項目-31臺潛伏AGV應用環汽車總裝車間轉運

» 汽車行業多品類AGV整合項目:叉車AGV、潛伏牽引AGV、舉升AGV、承載式雙車聯動AGV、功能型A

» 乘用車動力總成車間零部件集配項目-9臺承載輥道式AMR,用于動力總成線邊供給

欧美激情中文字幕一区二区-欧美激情在线精品video-欧美激情影院-欧美激情一区二区三区在线-欧美激情一区二区三区视频高清-欧美激情一区二区三区视频

ChatGPT核心壁壘:算力、數據和工程能力