詳細信息 |
SadTalker開源項目,虛擬二三次元形象合成面部說這段語音的視頻 |
編輯: 來源:算法邦 時間:2023/3/24 |
SadTalker是一篇 2023 年的 CVPR 論文對應的開源項目。
功能就是:根據一張圖片、一段音頻,合成面部說這段語音的視頻。結合 ChatGPT、AIGC、音頻文字轉換,虛擬二次元 or 三次元形象,就能“活”過來了。
此外,還項目還做成了 stable diffusion webui 的插件,也就是直接能在 stable diffusion 里使用。 生成的圖片,直接配合一段音頻,就能生成合成的視頻。 項目地址: https://github.com/winfredy/sadtalker |
【聲明:轉載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內容僅供參考,如有侵權,請聯系刪除。】 |
推薦信息 |
Visual ChatGPT微軟開源的ChatGPT項目
Visual ChatGPT是微軟開源的項目,是一個多模態的問答系統;支持AI繪畫,語言問答,看圖問答,將AI近期的3大熱點集于一身,搭建一個多模態的問答系統
拓爾思-國內 NLP 龍頭廠商,構建數字虛擬人的智能引擎
拓爾思基于中文 NLP 核心技術,海量數據積累及具備行業專業能力的知識圖譜等元宇宙 技術基因的優勢,提供虛擬人智能對話等技術支撐
場景模型持續簡化以提升訓練速度,控制成本滿足商業化應用需求
Distilled BERT 模型直接將BERT的部分參數作 為初始化,模型參數只有 BERT 的約 40%,但速度快提升 60%,同時保留了 97%的語言理解能力
AI發展帶動基礎數據市場成長,高質量標注數據決定模型訓練效果
數據標注目前仍以人工為主,行業向智能化和去人工化趨勢演進,標注數據生產效率 與 AI 模型進步協同共振 最終形成高質量的標注數據
AIGC 有望引領第四次人工智能浪潮
Make-A-Video模型實現AI基于文本圖像智能生成視頻,在文本語義和圖像對應關系的基礎上,通過對視頻幀 序列的學習訓練,實現連貫運動且高分辨率的高質量視頻生成
ChatGPT 面世即成頂流 性能持續提升商業化價值不斷放大
OpenAI 公司宣布推出付費試點訂閱計劃 ChatGPT Plus;定價每月 20 美元;付費版功能包括高峰時段免排隊;快速響應以及優先獲得新功能和改進等
StarX MusicX Lab 聚焦AI作曲
StarX MusicX Lab音樂實 驗室已經在Spotify SoundCloud QQ 音樂和網易云音樂等渠道發布了首批五首由AI作曲的作品,后續還有其他歌曲陸續發出
百度類ChatGPT產品 受益于文心Ernie系統積累
文心ERNIE 3.0 Zeus模型可生成詩歌 劇本 小說等 多類型文本創作;通過一段描述文本所生成的圖片,更加關注文本和圖像中核心語義元素 貼近用戶需求 |
智能運輸機器人 |
AGV無人運輸機器人-料箱版 |
AGV無人運輸機器人-標準版 |
AGV無人運輸機器人-料箱版(鈑金材質) |
AGV無人運輸機器人-貨架版(鈑金材質) |
AGV無人運輸機器人-貨架版(亮面不銹鋼材質) |
AGV無人運輸機器人-開放版 |
行業動態 |
咨詢熱線:4006-935-088 / 4006-937-088
客服熱線:
4008-128-728
版權所有 @ 創澤智能機器人集團股份有限公司 魯ICP備18039973號-2 運營中心 / 北京·清華科技園九號樓 生產中心 / 山東省日照市開發區太原路71號 |