FIND研究員:李啟榮
POV-RAY是一套經典的3D繪圖軟體,該軟體利用腳本化的原始碼來繪圖,跟Maya、3ds Max以三維座標上建模、貼圖等方式有所不同;使用者只要熟悉POV-RAY的程式碼語法,就可以用自動化的方式,由電腦自動繪製3D圖片。
隨著生成式人工智慧(Generative AI)的蓬勃發展,例如ChatGPT、Copilot可以自動撰寫、改寫、修正程式碼,讓生成式AI成為程式開發的新利器;生成式AI同樣也能應用在用寫程式方式算圖的POV-RAY,藉由自動產生原始碼,即可在POV-RAY自動算圖,更快速且更準確。
【技術發展背景】
生成式AI算圖和繪圖引擎,例如MidJourney、DALL-E、Stable Diffusion、TensorArt等等,是藉由輸入提示詞(Prompt)來描述圖片中的主體、以及套用的背景與效果,作為AI算圖和繪圖的依據。
POV-RAY採用了「場景描述語言(Scene Description Language)」,讓使用者能以直覺的方式,描述圖片中的主體物件、背景、光源、視角、座標,就跟寫程式一樣來繪製3D圖像;有別於坊間AI繪圖提示詞,具有隨機性的產出結果,POV-RAY由於採用固定的語法,因此可以保障重繪時的高度一致性。
【技術介紹與應用現況】
自從ChatGPT被發掘出能以多種程式語言自動寫程式、自動轉換語言、自動修正原始碼的潛能之後,對於ChatGPT是否能寫出POV-RAY的SDL語言,讓POV-RAY能順利繪圖,引起愛好者躍躍欲試。
根據Christian Froeschlin的實驗(Froeschlin, 2022),他在ChatGPT的Prompt介面,詢問「Write a POV-Ray script to render a reflective sphere over a checkered plane(請寫出一個POV-RAY腳本,能呈現在格子狀平面上的一顆反射球體)」,ChatGPT確實能產生出POV-RAY相容的原始碼;但實驗者發現效果不如預期,就從Prompt下手,加入光源、視角等細部資訊,並擴增為如下詢問內容「This script will create a red sphere that is reflective, and place it over a checkerboard-patterned plane. The camera is positioned to look at the sphere and plane, and a light source is added to illuminate the scene.(此腳本將產生一顆表面反光的紅球、並置於棋盤狀的平面;攝影機衛視位置正對著紅色球體與平面、外加一個環境光源)」,如此可讓POV-RAY的繪圖引擎更能理解物件和場景的描述,繪圖效果會比第一次更好。
圖 1 依據ChatGPT產出之腳本,以POV-RAY繪製之圖形(一)
資料來源:(Froeschlin, 2022)
另一個由Martin Chaim Berlove進行的實驗,實驗者對ChatGPT系統下達指示,利用POV-RAY的腳本語法來繪圖,ChatGPT產生了包含攝影機、平面、多邊形、光源等參數的腳本,節錄如下:
圖 2 ChatGPT自動產生POV-RAY腳本
資料來源:(Berlove, 2023)
圖 3 ChatGPT自動產生POV-RAY腳本(續)
資料來源:(Berlove, 2023)
實驗者嘗試用ChatGPT產生的腳本,跑一遍POV-RAY,雖然得到差強人意的結果,但也代表ChatGPT具有初步理解POV-RAY與反、並產生算圖腳本的能力。
圖4 依據ChatGPT產出之腳本,以POV-RAY繪製之圖形(二)
資料來源:(Berlove, 2023)
【未來展望/挑戰】
AI生成式繪圖/算圖技術,除了能藉由常見的2D關鍵字繪圖以外,也能利用自動生成POV-RAY腳本的方式,進行更複雜的3D繪圖;但生成式AI的3D繪圖,除了要考量主體物件、背景、光影、視角等參數外,還有貼圖、粒子等進階效果,現階段需要靠更專業的人工修飾和調校,才能讓生成式AI的3D繪圖更逼真。
未來隨著AI語意理解能力和正確性的提升,再加上生成式AI能自動轉寫、自動修正算圖腳本,未來生成是AI能夠用更精密、更大量的運算,來自動繪製更複雜的物件、更豐富的特效、以及更龐大的場景,成為美感和技術的完美結合體。
封面圖片來源: 123RF
參考資料來源:
1.Berlove, M. C. (2023, February 20). AI Coder Phantasm. Retrieved from Et Cetera: https://mberlove.com/blog/ai-coder-phantasm/
2.Froeschlin, C. (2022, December 6). RSOCP by ChatGPT. Retrieved from POV-RAY Newsgroup: https://news.povray.org/povray.binaries.images/thread//
沒有留言:
張貼留言