AI視覺系商用現況大盤點:ChatGPT、Wonder Studio、Stable Diffusion、Multi-controlnet、Midjourney等交織運用

AI視覺系商用現況大盤點:ChatGPT、Wonder Studio、Stable Diffusion、Multi-controlnet、Midjourney等交織運用

今年以來,ChatGPT因其強大的自然語言處理能力而受到廣泛的歡迎,這似乎導致了去年備受矚目的AI繪畫技術被人們所忽視。儘管AI繪畫技術已經流行了半年多,但很多人發現它仍存在很多限制。例如,生成的圖片可能無法預測,而且最為人所熟知的是,「AI不會畫手」。

縱然AI繪畫技術存在許多困難,但這並沒有阻擋充滿熱情的AI繪畫愛好者。當你還在思考ChatGPT能為你帶來什麼便利,或是在問它是否能幫你寫企劃書的時候,一群人默默地在AI繪畫領域尋找解決問題的方法,只為了可以創造出自己心目中的「理想視覺呈現」。

如今,短短不到一年的時間,AI繪畫技術已經不僅能把手畫的很好,還愈畫愈像真人,並從二次元變真人並延伸到動畫、電影特效的領域,AI技術的發展已經不再僅僅局限於單方面ChatGPT這種文字型AI的進步。視覺型AI的商業應用未來發展的前景也變得越來越清晰。

更多AI知識的學習,可到104學習精靈-AI 人工智慧基金知識庫:一讀就懂的入門 免費加入公開課學習。

或是想短時間透過學習AI讓自己強大及解決更多問題,也想學習AI繪圖運用,可以參加 一堂課讓你「趕上」ChatGPT/Midjourney運用 一次將二門課的知識技能學習掌握,線上公開課AI應用衝刺班,來幫助自己的路走的更廣。

以下正文開始

隨著人工智慧技術的進步,視覺型AI已成為現代商業界的一個熱門領域。AI繪圖技術是其中之一,而近年來,它的商業應用也變得越來越廣泛。本文將介紹視覺系AI現階段商用脈絡推導發展。

現代AI繪圖技術是視覺型AI領域的一個重要方向。AI繪圖是指利用人工智慧技術生成圖像,包括風景、人像、角色等等。其中,GAN(生成對抗網絡)是當前應用最廣泛的技術之一。GAN能夠學習人類創造的圖像,進而生成具有相似風格的圖像,並且在運作過程中也能不斷學習,使生成出來的圖像更加真實自然。

然而,AI繪圖技術也存在諸多限制和困難。比如說,生成的圖像可能存在預測上的不足,而且對於「恐怖谷」效應的克服也需要進一步的研究。除此之外,AI繪圖技術還存在著無法准確表達人物感情、對光線的處理不夠精細等問題。這些限制和困難已成為AI繪圖技術發展的重要瓶頸。

不過,這並沒有阻止AI繪圖技術的商業應用發展。由於 LoRA 模型的出現,一般網友現在可以更輕鬆地創建風格化和標記化的模型。這些模型是由微軟的研究員引入的解決方案,以應對訓練大型語言模型(例如擁有數十億個訓練資料的 GPT-3)的高昂成本。LoRA 技術的方法是凍結預訓練模型的權重,然後在每個 Transformer 塊中注入可訓練層(秩分解矩陣)。這種方法大大減少了需要訓練的參數和 GPU 記憶體需求,因為大部分模型權重不需要計算梯度。

雖然 LoRA 最初是為大型語言模型而設計,但這種技術也可以應用於其他領域。例如,在微調 Stable Diffusion 時,LoRA 可以用於關聯交叉注意力層,從而將圖像表示與其描述性提示相關聯。LoRA 模型的出現使一般使用者能夠通過簡單的設備創建更風格化和標記化的模型,並集中訓練特定動作、場景、角色,甚至是服裝的細節。雖然 LoRA 的技術細節可能不太重要,但它對模型創建的普及化影響顯著。

以前的AI畫圖模型,雖然功能強大,但卻無法進行微調,就像一台基本的大型電腦,不夠靈活。不過現在有了LoRA,你可以輕易地加入「模組」到這台大型電腦中,根據個人需求進行單獨訓練,例如訓練自己的人臉或風格(玩家稱之為「小模型」),並且融入原有的模型中,讓AI畫出符合你特殊需求的畫作。

使用LoRA進行訓練,所需的小模型檔案通常只有100MB左右,且只要有單一張顯卡和十幾張圖片,就能夠進行訓練,操作容易。有了LoRA的支持,AI畫出來的角色也變得更加人性化,更加符合真人感。

因此我們現在可以看到廣告中,已能夠見到許多用難分辨是真人攝影還是AI繪圖的作品,例如

玩家製作的AI女孩,若不說是AI製作,你會發現嗎?

Asahi Beer Taiwan的活動,看看那張是真實拍攝的?

AI製作,日本商用形象廣告設計

AI製作,日本商用形象廣告設計2

AI製作,日本商用形象廣告設計

此外,AI繪圖技術在美容、時尚等領域也有著重要應用。例如,有些時尚品牌利用AI繪圖技術將服裝樣品繪製成數位形式,以進一步推廣其產品,這顯示了AI繪圖技術在商業應用方面的廣泛發展

像是美國牛仔褲品牌Levi’s宣布和AI模特兒公司Lalaland.ai合作,推出由AI生成的數位模特兒來展示服裝,希望能讓顧客在購買商品的過程中,依照自己的身形、膚色等,有更多不同的參考樣本,並聲稱這將提升線上購物的「多樣性」。

Lalaland.ai官網提到的AI模特兒展示服務功能

位於日本京都的一家科技公司DataGrid,也致力於開發出來高解析度、高品質、高度逼真的模特兒自動生成 AI。

在動畫電影製作方面,AI繪圖技術得到了越來越廣泛的應用。開始的是Deepfake技術,利用AI換臉的技術把名人的頭像套用在一些成人明星的身體上,從而製造偽造的名人影片。有網紅曾因不當使用此技術而被判刑。以下是一個展示此技術的影片。

最近,一支令人嘆為觀止的動畫在推特上迅速瘋傳!一位動畫美少女表演了韓國女團宇宙少女(WJSN) 2019 年推出的歌曲〈Boogie Up〉的熱舞影片,她的表演技巧和舞蹈能力讓人難以置信。這支影片在短短不到兩天的時間內就突破了400萬的點擊率,緊接著影片的角落還附上了一位真人跳舞的畫面,明顯地告訴大眾這是一部運用AI技術StableDiffusion生成的動畫。這是一次不可錯過的體驗,一定會讓您大開眼界!

Stable Diffusion、Multi-controlnet製作的熱舞影片

然而驚人的 AI 技術又有了新突破!Wonder Studio AI,一個讓人類只需用滑鼠點幾下,就能生成電影級特效的 AI 神器,現在正在內測中。不再需要昂貴的動捕裝置,也不再需要複雜的 3D 軟體,只需用一台相機拍攝,丟進 Wonder Studio,它就能為你完成 CG 角色的動畫、打光,並將其合成到真實場景中。這意味著,製作一個高度真實、自然的視覺特效鏡頭,原本需要三天完成的視覺特效鏡頭,現在只需要一分鐘!這個工具已經在網友間引起了巨大迴響,大家紛紛上手測試,簡直停不下來。無論是專業製作人還是喜愛影像創作的業餘愛好者,都能從中受益,以下是Wonder Studio AI製作的演譯影片。

除了在娛樂和藝術領域的應用外,視覺系AI還有許多廣泛的商業應用。例如,在製造業中,視覺系AI可用於檢測產品的質量和外觀。這種技術未來也將廣泛應用於汽車和電子產品的生產線上,以檢測和分類瑕疵和缺陷,並確保產品符合高標準的質量要求。

另一個應用是在醫學領域。視覺系AI可用於圖像識別和診斷,從而協助醫生進行疾病診斷和治療。例如,這種技術可用於檢測腫瘤和其他異常細胞,並協助醫生制定最佳的治療計劃。此外,視覺系AI還可以應用於眼科檢查和影像診斷,以檢測視網膜疾病和其他視力問題。

除此之外,視覺系AI在安防、交通和物流等行業也有廣泛的應用。例如,在安防領域,視覺系AI可用於偵測和分類人員、車輛和其他物體,以提高安全性。在交通領域,這種技術可用於交通管制、路況監測和智能交通系統。在物流領域,視覺系AI可用於自動化倉庫和物流中心,從而提高運輸效率和準確性。

隨著技術的不斷進步和應用場景的不斷擴展,視覺系AI的商業應用前景十分廣闊。無論是在娛樂、製造、醫學、安防、交通還是物流領域,視覺系AI都有著重要的應用價值,將為我們帶來更加便利、高效和智能化的生活方式,讓我們敬請期待未來的發展吧。

最後若你對AI繪圖應用有興趣,也歡迎選擇加入感興趣的AI繪圖主題研究院,裡面將提供豐富的教學及作品展示和即時聊天室與同好互動

AI繪圖分享Stable Diffusion研究社/Stable Diffusion prompt

微軟AI繪圖Bing教學分享Microsoft Bing Image Creator prompt study 詠唱咒語研究社

Midjourney-AI詠唱咒術師繪畫成品展示分享 (因非公開社團若手機無法開啟請搜尋社團名稱加入)Midjourney-AI詠唱咒術師繪畫成品展示分享

發表迴響

%d 位部落客按了讚: