我目前選擇 AI 工具的三個原則

本週 GPT 4 正式推出、微軟推出了 Microsoft 365 Copilot ，Google 也宣佈了將導入 AI 到 workspace ，除此之外，還有好多好多。

我感覺最近好像存在於一條很特別的時間軸上，每天一早打開 Twitter ，一定，一定會看到又有新的 AI 消息。可能是某個串了 ChatGPT API 的新產品推出或者發布更新，可能是某個專業人士分享他用 AI 後的心得，又可能是有些人發表了某個看起來超厲害的模型，並且附帶著不遠的將來，這個模型將有可能怎樣被使用的想像。

我有看到一些追 AI 資訊追得很勤的人說，真的是追不下去了，資訊出現的速度以及量，已經過載；也有看到有些人說，感覺有學不完的新技術與工具，有點焦慮。

我這禮拜也開始有資訊過載的感覺，而且我相信這個趨勢不會再回頭，只會愈來愈多。而關於新技術或工具的焦慮，我倒是還好，可能因為嘗試使用不同工具本來就是我非常感興趣的事情。但焦慮之外更大的問題可能是時間有限，假設我還有許多想學想做的事，就勢必得要放棄去嘗試某些新的工具，只能專注在特定的範圍裡面。

從這兩個問題點延伸出來，我這禮拜都在思考兩件事：過濾與選擇。

過濾的目標，是讓自己減少看到「我已經知道的事」，盡量讓自己能夠去拓展與探索「我知道我還不知道的事」以及「我不知道我不知道的事」。

選擇的目標，是讓自己更釐清，我該以什麼樣的原則去嘗試與學習不同的 AI 產品？哪些需求是真的需要靠 AI 幫忙？哪些則是偽需求？

關於如何過濾，我可能還需要一些時間，好好把「我已經知道的事」給紀錄整理出來，這樣子未來在看到各種資訊時可以更快速的篩掉他們。

這期的電子報先來討論後者，關於選擇的事。

我的三個選擇原則

3 月初，OpenAI 開放了 ChatGPT 的 API ，所有人開始可以透過 API ，開發新的 ChatGPT 產品，也可以在自己既有的產品裡面串接 Chat API ，讓產品 AI 化。

我將這些串接 API 的產品分成兩類，一類的目標是打造一個更好的 ChatGPT client，例如提供更好的歷史對話功能、提供專門的 system prompt 設定欄位、甚至是可以直接整合 ChatGPT 跟 new Bing Chat 在同一個視窗。

第二類的目標則是運用 ChatGPT 的 API ，打造一個更好的產品。在這些產品裡面用戶不需要設定 API key，甚至不需要懂什麼是 API ，他們只會知道，原本熟悉的產品多了 AI 的功能。至於怎麼達成的，放在黑盒子裡就好。

經過這陣子的探索，我逐漸確立我自己選用 AI 工具的原則，他們可以歸納為下列三點：

我只選擇我自己能控制與掌握設定，或者能清楚看到系統如何設定的工具。
我只選擇在特定功能上比網頁版 ChatGPT 做得更好的工具。
我只選擇，我真的有使用需求的工具。

這三個原則至少要滿足一個，若能滿足兩個、甚至三個都滿足就更好。以下簡單說明這三個原則。

只選擇自己可以設定、或者可以看到設定的工具

串接 ChatGPT API 時，通常會需要針對使用場景設定 system prompt ，它的功能是設定這次對話中助手的性格、角色、以及行為模式。

舉例來說，若設定 system prompt 為「你是一個言簡意賅的助手，若使用者沒有要求你回覆，你只會回應：我知道了。」他在回話時，就比較不會天馬行空的回覆你。

相反地，假設你的設定是「你是一個友善的助手，你會盡可能地將對話延續下去。」他在回話時，就會盡量回覆得很詳盡。

實際以這兩個 system prompts 來測試看看，我對他們都輸入了同一句話：「我最喜歡的寶可夢是卡蒂狗。」

第一個助手依照指示，只回答我：「我知道了」。

第二個助手依照指示，跟我尬聊：「卡蒂狗是一個非常可愛的寶可夢，牠是第七代中的一種犬類型寶可夢。你喜歡卡蒂狗的哪些特點呢？」（內容有錯，請忽略這點）

換句話說， system prompt 的設定內容，會大幅影響這個 ChatGPT 助手的表現。單純這麼簡單的 prompt 都會有影響，若是複雜一點的任務或指令，影響程度就更大。

因此回到所有串接 API 的工具上，假設我不知道這個工具在 system prompt 怎麼下指令，我就比較無法判斷，透過這個工具得出來的摘要、翻譯、總結、發想等內容，是否真的值得信賴；我也無法判斷，他是否真的完全發揮了 ChatGPT 的能力。

所以若是那種主打著更方便更好用的 ChatGPT client ，無論是 web 版本、app 版本、或者是串接不同通訊軟體的 chatbot ，我都會盡量確認我可以看到他是怎麼設定的、或者是確認「我可以自行設定」，我才會去使用它、並且享用其他更好的附加功能。避免本末倒置，為了一些附加功能，反而弱化了 ChatGPT 的表現。

只選擇在特定功能上比網頁版 ChatGPT 做得更好的工具

也有許多產品的 AI 串接與設定方式完全不對用戶揭露，對於這類工具，我則會看，他是否在特定功能上做得比 ChatGPT 網頁版更好。

網頁版本的 ChatGPT 已經可以做到許多非常神奇的事，這邊就不再贅述，但 ChatGPT 目前還無法聯網讀取最新的資料，也無法在 https://chat.openai.com/chat 以外的地方使用，這就給了其他產品發揮的空間。

以聯網找資料來說， new Bing , perplexity 或者是 phind 的表現都很不錯。而在使用場景方面，有些瀏覽器插件讓使用者可以在瀏覽任何網頁時都使用 ChatGPT ，或者是 Raycast 這類效率工具串上 API 後，也可以隨處啟動 ChatGPT ，這對我來說就會是加分的項目，會在特定的場景使用它們。

除此之外，更深度整合工作流程的 AI 產品也屬於這一類，例如 notion , craft 和 readwise reader 的 AI 工具，都可以讓用戶在做原本想做的事情時，額外多了 AI 的幫助。這帶來的好處是工作場景與流程的持續不中斷，因此這類工具我也會樂意選擇使用。

這類主打特定功能的工具裡面，我目前最喜歡的是 OpenAI translator ，他既是開源專案，滿足了第一項的條件，又主打「翻譯」這個很常需要的情境，並且提供很到位的介面與功能。例如以目前版本來說，就提供了翻譯、潤色、總結、分析、以及「解釋代碼」等五個不同的功能，等於無論是翻譯外語、或者是翻譯程式語言都可以直接在這個介面上完成。

換個角度來說，若一個串了 API 的 AI 工具，「看起來」沒辦法在任何層面表現得比網頁版的 ChatGPT 還好，我覺得就沒有必要去用它。

只選擇自己真的有使用需求的工具

我覺得這一個原則稍微有點 tricky ，但仔細想想後發現，它是我不至於被 AI 工具淹沒的重要原則。

舉例來說，我目前很少在閱讀 PDF ，也很少在看 YouTube 影片，所以雖然看到許多人在推薦相關的好用工具如 ChatPDF 或 Glarity，我都還未嘗試使用它們。同樣地，若是某個我原本沒在使用的筆記軟體加上了 AI 的功能，我可能也還不會去使用它們。

相反地，假設是目前的我確實存在的需求，看介紹或 demo 也有看到覺得不錯、厲害的亮點，就會去測試使用看看。

小結：三個原則背後的考量都是效率

這三個原則背後各代表一個核心的概念：

只選擇自己可以設定、或者可以看到設定的工具：代表可驗證品質
只選擇在特定功能上比網頁版 ChatGPT 做得更好的工具：代表能力更好
只選擇自己真的有使用需求的工具：代表更專注、不分心

這些核心的概念再進一步收攏歸納後，共通點是，我在使用 AI 工具上可以更有效率。我不會因為用了某工具反而做得更差、我也不會迷失在萬千 AI 工具裡面不知道接下來要幹嘛、該選哪個用。

推薦這些原則給大家！

不過，我覺得在這些之前還要有個前提是，你已經有初步使用過 ChatGPT ，並且思考過自己有哪些任務可以請他處理，此時你既可以知道 ChatGPT 的表現大概在哪個程度，也會有一些「如果這個地方可以用 ChatGPT 就好了！」的感慨，這時再來套用上述的原則就會更有效率，最終也更能夠專注於使用當前、以及未來肯定滿街跑的 AI 工具，也會更知道該怎麼選擇、驗證、進而全面發揮 ChatGPT 的能力。

Last modified on 2023-03-19