詳細信息 |
機器人從大型語言模型和視覺-語言模型中學習各種操作 |
編輯: 來源:CAAI認知系統與信息處理專委會 時間:2023/7/14 |
大型語言模型(LLM)被證明擁有豐富的可操作知識,可以以推理和計劃的形式提取用于機器人操作。盡管取得了進展,但大多數仍然依靠預定義的運動基元來執行與環境的物理交互,這仍然是一個主要瓶頸。 在這項工作中,研究的目標是合成機器人軌跡,即密集的6-DoF末端執行器航點序列,用于給定開放指令集和開放對象集的各種操作任務。LLM擅長推斷自由形式的語言教學的提供和約束來實現這一點。更重要的是,通過利用他們的代碼編寫能力,可以與視覺語言模型(VLM)交互,以組合3D價值圖,將知識置于代理的觀察空間中。然后將組合的值圖用于基于模型的計劃框架中,以零鏡頭合成閉環機器人軌跡,并具有對動態擾動的魯棒性。
給定環境的RGB-D觀察和語言指令,LLM生成與VLM交互的代碼,以生成一系列基于機器人觀察空間的3D提供圖和約束圖(統稱為值圖)(a)組合的值圖用作運動規劃器的目標函數,以合成機器人操作的軌跡(b)整個過程不涉及任何額外的訓練。 展示了所提出的框架如何通過有效地學習涉及接觸豐富交互場景的動態模型來在線測試。在模擬和真實機器人環境中對所提出的方法進行了大規模研究,展示了以自由形式的自然語言執行30多種日常操作任務的能力。 估計物理特性:給定兩個未知質量的塊,機器人的任務是使用可用的工具進行物理實驗,以確定哪個塊更重。 行為常識推理:在機器人設置桌子的任務中,用戶可以指定行為偏好,例如“我是左撇子”,這需要機器人在任務的上下文中理解其含義。 細粒度語言校正:對于需要G精度的任務,例如“用蓋子蓋住茶壺”,用戶可以向機器人發出準確的指令,例如“您離開了1cm”。 多步可視化程序:給定一個任務“將抽屜準確地打開一半”,由于對象模型不可用,信息不足,機器人可以根據視覺反饋提出多步驟操作策略,先在記錄手柄位移的同時完全打開抽屜,然后將其關閉回中點以滿足要求。
|
【聲明:轉載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內容僅供參考,如有侵權,請聯系刪除! |
推薦信息 |
機器人Glow與機器人Character.AI對比
機器人Glow應用場景是情感陪伴,奇幻聯想;機器人Character應用場景是情感陪伴、奇幻聯想、頭腦風暴、制定計劃等
機器人Charater虛構人物類型豐富 供更接近真人的溝通體驗
機器人Charater共有68類虛構人物標簽,滿足多元用戶的多樣話題交談需求;可在對話中生成與識別圖片,圖像生成能力有進一步優化空間
C端消費者娛樂的AI聊天機器人Charater.AI
AI聊天機器人Charater自行創建具有特定個性,人設和知識儲備的聊天機器人,具備更豐富的虛構人物,可識別和生成圖片,支持語音輸入 ,支持群聊等特色
MiniMax與OpenAI具有相似的商業模式規劃,均發掘C端和B端變現場景
推出了C端聊天機器人Glow暫未開放收費;MiniMax從2023年起會逐步開放API,讓更多的個人用戶和企業用戶基于多種模態的大模型構建自己的應用
機器人Glow核心為三大模態的基礎模型架構User-in-the-Loop
Glow基于“User-in-the-Loop”進行產品輸出結果的人為優化,模型將由此強化對用戶對話喜好的認知,從而優化產品體驗
聊天機器人Glow與其他社交APP(微信 ChatGPT)對比
,Glow或在一定程度上更好地解決用戶情感陪伴以及奇幻情景聯想的需求,從而增強用戶的使用粘性;滿足用戶對虛構人物虛構場景的幻想
聊天機器人Glow提供情感陪伴體驗,輔助虛構情景聯想
Glow內智能體暫時無法反饋圖片內容,用戶可以與智能體就任何話題內容進行聊天,可以根據特定的話題,選擇關聯的智能體進行聊天
AI情感陪伴聊天機器人Glow,有約500萬用戶
用戶在應用中創建AI機器人智能體,智能體將基于用戶描述的性格,人設,頭像及選定的音色等,將具備特定名人的有關知識儲備,與用戶開展實時溝通,互動 |
智能運輸機器人 |
AGV無人運輸機器人-料箱版 |
AGV無人運輸機器人-標準版 |
AGV無人運輸機器人-料箱版(鈑金材質) |
AGV無人運輸機器人-貨架版(鈑金材質) |
AGV無人運輸機器人-貨架版(亮面不銹鋼材質) |
AGV無人運輸機器人-開放版 |
行業動態 |
咨詢熱線:4006-935-088 / 4006-937-088
客服熱線:
4008-128-728
版權所有 @ 創澤智能機器人集團股份有限公司 魯ICP備18039973號-2 運營中心 / 北京·清華科技園九號樓 生產中心 / 山東省日照市開發區太原路71號 |