發生了! 歷史上第一台GPT4腦袋的人形機器人問世!

現在首個由GPT-4驅動的人形機器人「Alter3」！

無需程式設計與零樣本學習，還可根據口頭回饋調整行為，看來未來智能型機器人的世界已將到來了

未來版主將會往這一系列多模態整合應用開系列課程，若有興趣記得隨時來我們的愛課堂逛逛喔

更多AI知識的學習，可到104學習精靈-AI 人工智慧基金知識庫：一讀就懂的入門免費加入公開課學習

以下正文開始

本文介紹了Alter3，這是一個透過整合大型語言模型（尤其是GPT-4）而能產生自發性運動的人形機器人。這項成就是透過將GPT-4整合到我們的專有Android平台Alter3中，將LLM與Alter的身體動作結合。通常，機器人的低階控制依賴於硬件，並不在法學碩士的學習範疇內，這對於基於LLM的直接機器人控制構成了挑戰。然而，對於Alter3這樣的人形機器人，我們透過程式將人類動作的語言描述映射到機器人身體上，實現了直接控制。值得注意的是，這種方法使得Alter3能夠執行多種姿勢，如“自拍”或“裝鬼”，並在不需要為每個身體部分進行詳細編程的情況下，隨時間推移生成一系列動作。這展現了機器人的零樣本學習能力。此外，口頭回饋可以用來調整姿勢，無需微調。

影片1：「演奏金屬音樂」動作。該動作是透過GPT-4和語言回饋產生的。

我們做了什麼？

在LLM出現之前，我們必須按照特定順序控制所有43個軸以模仿人的姿勢或行為，例如倒茶或下棋。這個過程通常需要我們手動進行許多改進。感謝LLM，我們現在可以避免重複勞動。以下是使用口頭指示控制Alter3人形機器人的程式。我們所做的是連續應用兩個用自然語言編寫的協議，稱為思想鏈，無需學習過程的迭代（即零樣本學習）。需要注意的是，GPT-4是非確定性的，即使在最低設定下也是如此。因此，即使使用相同的輸入，也可能產生不同的運動模式。這是GPT-4的特性，雖然在重現性方面提出了問題，但不應視為對其運動生成能力的質疑。

結果
圖1：使用口頭指示控制Alter3人形機器人的程式。使用兩個提示輸出Python程式碼以自然語言控制Alter3。這項架構是基於思想鏈。

「裝鬼」動作

影片2：「裝鬼」動作。

語言回饋
Alter3無法觀察到其生成的動作對任何物理過程的影響，這在人類意義上是不自然的。因此，Alter3無法精確理解細節，例如“手舉得有多高”，也無法相應地改善其動作。透過回饋經驗並利用外部記憶體，Alter3的身體模型可以與GPT-4集成，而無需更新其參數。現在，Alter3可以根據人類的語言回饋重寫其程式碼。例如，使用者可能會建議「自拍時手臂稍微抬高一點。」Alter3 隨後可以將修改後的動作代碼儲存在其資料庫中作為運動記憶。這確保了下次產生該動作時，將使用改進的、經過訓練的動作。透過這種回饋累積關於Alter3身體的訊息，記憶可以有效地作為身體圖式。

圖2：Alter3中的語言回饋。使用者提供語言回饋來指導Alter3在每個運動片段中的調整。指令類似於「將軸16設定為255」或「更有力地移動你的手臂。」使用者只需提供口頭指示；無需重寫任何代碼。然後Alter3自主修改對應的程式碼。一旦動作被完善，就會被保存在一個JSON資料庫中，並帶有描述性標籤，例如「拿著吉他」或「若有所思地輕拍下巴。」對於使用第二個提示產生的動作， JsonToolkit有助於在資料庫中搜尋這些標籤，並由LLM決定記憶體使用和新動作的創建。

圖3：每個動議的評估分數的平均值。由GPT-4指定的動議包括「假裝蛇」、「喝點茶」、「裝鬼」、「低手投球」、「用手機自拍」、「演奏金屬音樂」等。

討論
Alter3部分回答了LLM是否需要體現的問題。首先，Alter3無需任何額外訓練即可執行許多操作，這意味著LLM訓練的資料集已經包含了運動描述。換句話說，Alter3實現了零樣本學習。此外，它還能模仿鬼、動物等，這是相當驚人的。它還可以理解聽到的對話內容，並透過面部表情和手勢反映故事是悲傷還是快樂。我們的系統可以輕鬆應用於任何人形機器人。到目前為止，Alter3透過LLM獲得了顯著的益處。

更多實驗片段

未來版主將會往這一系列多模態整合應用開系列課程，若有興趣記得隨時來我們的愛課堂逛逛喔

更多ChatGPT咒語指令交流學習搜尋FB社團:中文最大ChatGPT-AI詠唱研究院好收集最新訊息

非公開社團手機開啟會被擋，請直接複制搜尋社團名稱
中文最大ChatGPT-AI詠唱研究

非公開社團手機開啟會被擋，請直接複制搜尋社團名稱
微軟AI繪圖Bing DALL-E 3教學分享Microsoft Bing Image Creator prompt study 詠唱咒語研究社

Stable Diffusion愛好者也可直接加入AI繪圖分享Stable Diffusion研究社/Stable Diffusion prompt

發生了! 歷史上第一台GPT4腦袋的人形機器人問世!

請按讚：

相關

發表迴響取消回覆

分享此文：

請按讚：

相關

相關文章

教你免費透過 AI 模擬髮型，讓未來剪髮不再「賭一把」

手把手教學，簡單幾步驟取得Gemini的教師認證證書 Your Google for Education Certifications & Exams

繼Deepseek後，劃AI新時代的 AI Agent——Manus 正式發布，封測邀請碼遭瘋搶 二手價炒到20萬

發表迴響 取消回覆

繼Deepseek後，劃AI新時代的 AI Agent——Manus 正式發布，封測邀請碼遭瘋搶　二手價炒到20萬　

發表迴響取消回覆