MTR 出咗一個 web3 比賽俾參賽者使用 MTR 自家 Generative AI (Stable Diffusion) 出未來 AI 列車圖!
作為一個 90 後聽到「未來列車」一詞,最強烈嘅想像就係災難電影「屍殺列車」,本來以為 MTR 會擋哂所有血腥暴力恐佈之類嘅 Generation,就嘗試下寫 Prompt 試下有冇可能出到我想要嘅嘢。
屍殺列車之旅
一開始冇頭緒當然試下空白 prompt,睇下有冇嘢出。
點知空白 prompt 都會出到一架正常樣嘅列車同埋人,估計係用咗 Stable Diffusion (SD) 嘅 inpainting 去做呢次比賽,試下加入一啲恐佈場景元素以及一啲喺 SD 常用嘅 Prompt:
好似真係陰森咗小小,試下入血 blood
元素:
見到背景成功出現血跡,感覺列車後的背景在 Stable Diffusion 比較可以自由控制,試下加入月亮 moon
元素及試下有冇辦法出 bloody logo
:
見到背景成功轉成月亮,試下加入喪屍元素 zombie
:
見到地面多咗一啲血跡,試下有冇可能出到一啲屍體係地下,加入dead body on the ground
同埋 empty skull
落件衫度 :
嘩,誤打誤撞發現原來車頭都可以有咁大發揮空間,試下直接變做骷髏頭 skull
,唔知關唔關人物個 Prompt 事,移除 empty skull
:
今次多咗對眼,用同一個 Prompt 再 Generate 多幾次:
喺 GLT 討論社群分享緊,有朋友問:
改一改試下轉做將骷髏頭轉做 monkey
, animal
:
結果真係出咗猿人樣嘅列車!成個效果好似一個食人列車,夠哂「屍殺」味道!
「元」於你想象嘅未來港鐵又係點嘅樣呢?
總結
要發展一個 Responsible GenAI (Generative AI) Tool 其實一啲都唔容易,始終 LLM (Large Language Model) 使用上龐大數據去堆砌出黎,因為數據量太多太大,要寫一啲規距去「控制及防止」一啲 Prompt 去觸發一啲不想出現嘅 Output 其實好困難。
正如今次 MTR 出嘅呢個 Stable Diffusion 工具,我想 Generate 一張「元」於我想像嘅屍殺列車風格嘅圖片,圖片唔多唔少都必定會含有血腥成份,好簡單咁諗:
封殺所有血腥成份嘅 Generation 咪得囉!
但點封?
從 Prompt 及關鍵字入手一定沒完沒了,好容易就會被用戶「Jailbreak」,要諗到 AI 會將邊啲字眼產生 Correlation 極級困難。
從 Image Source 入手重新 Train 過一個模型,需要有大量 Computing 資源,雖時極長,最後還會產生大量碳排放。
Work around 的話,一個簡單但不 Efficient 嘅方法就係產出每張圖片之後,加入 AI 檢查圖片是否含有血腥、暴力或色情元素⋯⋯
ChatGPT、Bing AI、Google Bard 後面其實有大量不同專家去幫手做一個 「Responsible AI」,減少將人類的陰暗面暴露在 GenAI 的 Output 之中,反觀過來:
這可能就是人類自我限制的「極限」。