「知道一件事情沒有捷徑」帶來的安全感

最近 ChatGPT 4o 的製圖能力大躍進,我把幾張跟老婆、貓咪或爸媽的生活照丟進去請它變換風格,效果都非常好,人物的神韻與畫面中的細節都很好,但看了幾張後還是會有種「好像還有哪邊可以更好」的感覺,可能是某個臉孔的線條細節之類的,但我又說不上來到底是什麼地方可以更好,或者說,我也說不上來我想像中的更好到底是怎樣

當我意識到這件事時,我突然想到,在讓 ChatGPT 或 Claude 生成文字時,我好像不太會有這樣的感覺。我幾乎總是可以感覺到他給我的文字好不好、如果好是好在哪、如果不好又是為什麼。假設內容不夠好,我也常常能夠自己想出更好的,或者知道怎樣問問題得到更好的內容。

但生成圖片時,我完全不具備這樣的能力,我幾乎沒辦法再給他下一步的指引,我甚至會覺得,我給的指引可能反而會讓結果更糟。我想應該是因為我很不熟悉用文字描述畫面,我既不熟悉相關的語句結構,也不熟悉那些足以表現那些關鍵微小細節的詞彙。

但假設我真的努力讀了很多、學了很多、吞了很多這類如何描述畫面的知識,這也不代表我真的知道該怎樣指揮 AI 讓他做得更好,因為我腦中仍然沒有更好的畫面。

這樣說起來好像有點挫折,感覺還是需要長期接觸大量美的畫面,才有辦法掌握與培養出那個能夠判斷好與不好的品味,沒有什麼速成的捷徑。但話說回來,「知道一件事情沒有捷徑」這件事好像也帶來某種安全感,我還無法詳細描述這個感覺,以後有延伸想法再來分享。