「知道一件事情沒有捷徑」帶來的安全感

最近 ChatGPT 4o 的製圖能力大躍進，我把幾張跟老婆、貓咪或爸媽的生活照丟進去請它變換風格，效果都非常好，人物的神韻與畫面中的細節都很好，但看了幾張後還是會有種「好像還有哪邊可以更好」的感覺，可能是某個臉孔的線條細節之類的，但我又說不上來到底是什麼地方可以更好，或者說，我也說不上來我想像中的更好到底是怎樣。

當我意識到這件事時，我突然想到，在讓 ChatGPT 或 Claude 生成文字時，我好像不太會有這樣的感覺。我幾乎總是可以感覺到他給我的文字好不好、如果好是好在哪、如果不好又是為什麼。假設內容不夠好，我也常常能夠自己想出更好的，或者知道怎樣問問題得到更好的內容。

但生成圖片時，我完全不具備這樣的能力，我幾乎沒辦法再給他下一步的指引，我甚至會覺得，我給的指引可能反而會讓結果更糟。我想應該是因為我很不熟悉用文字描述畫面，我既不熟悉相關的語句結構，也不熟悉那些足以表現那些關鍵微小細節的詞彙。

但假設我真的努力讀了很多、學了很多、吞了很多這類如何描述畫面的知識，這也不代表我真的知道該怎樣指揮 AI 讓他做得更好，因為我腦中仍然沒有更好的畫面。

這樣說起來好像有點挫折，感覺還是需要長期接觸大量美的畫面，才有辦法掌握與培養出那個能夠判斷好與不好的品味，沒有什麼速成的捷徑。但話說回來，「知道一件事情沒有捷徑」這件事好像也帶來某種安全感，我還無法詳細描述這個感覺，以後有延伸想法再來分享。