# 24   我目前選擇 AI 工具的三個原則

本週 GPT 4 正式推出、微軟推出了 Microsoft 365 Copilot ,Google 也宣佈了將導入 AI 到 workspace ,除此之外,還有好多好多。

我感覺最近好像存在於一條很特別的時間軸上,每天一早打開 Twitter ,一定,一定會看到又有新的 AI 消息。可能是某個串了 ChatGPT API 的新產品推出或者發布更新,可能是某個專業人士分享他用 AI 後的心得,又可能是有些人發表了某個看起來超厲害的模型,並且附帶著不遠的將來,這個模型將有可能怎樣被使用的想像。

我有看到一些追 AI 資訊追得很勤的人說,真的是追不下去了,資訊出現的速度以及量,已經過載;也有看到有些人說,感覺有學不完的新技術與工具,有點焦慮。

我這禮拜也開始有資訊過載的感覺,而且我相信這個趨勢不會再回頭,只會愈來愈多。而關於新技術或工具的焦慮,我倒是還好,可能因為嘗試使用不同工具本來就是我非常感興趣的事情。但焦慮之外更大的問題可能是時間有限,假設我還有許多想學想做的事,就勢必得要放棄去嘗試某些新的工具,只能專注在特定的範圍裡面。

從這兩個問題點延伸出來,我這禮拜都在思考兩件事:過濾與選擇

過濾的目標,是讓自己減少看到「我已經知道的事」,盡量讓自己能夠去拓展與探索「我知道我還不知道的事」以及「我不知道我不知道的事」。

選擇的目標,是讓自己更釐清,我該以什麼樣的原則去嘗試與學習不同的 AI 產品?哪些需求是真的需要靠 AI 幫忙?哪些則是偽需求?

關於如何過濾,我可能還需要一些時間,好好把「我已經知道的事」給紀錄整理出來,這樣子未來在看到各種資訊時可以更快速的篩掉他們。

這期的電子報先來討論後者,關於選擇的事。


我的三個選擇原則

3 月初,OpenAI 開放了 ChatGPT 的 API ,所有人開始可以透過 API ,開發新的 ChatGPT 產品,也可以在自己既有的產品裡面串接 Chat API ,讓產品 AI 化。

我將這些串接 API 的產品分成兩類,一類的目標是打造一個更好的 ChatGPT client,例如提供更好的歷史對話功能、提供專門的 system prompt 設定欄位、甚至是可以直接整合 ChatGPT 跟 new Bing Chat 在同一個視窗。

第二類的目標則是運用 ChatGPT 的 API ,打造一個更好的產品。在這些產品裡面用戶不需要設定 API key,甚至不需要懂什麼是 API ,他們只會知道,原本熟悉的產品多了 AI 的功能。至於怎麼達成的,放在黑盒子裡就好。

經過這陣子的探索,我逐漸確立我自己選用 AI 工具的原則,他們可以歸納為下列三點:

  1. 我只選擇我自己能控制與掌握設定,或者能清楚看到系統如何設定的工具。
  2. 我只選擇在特定功能上比網頁版 ChatGPT 做得更好的工具。
  3. 我只選擇,我真的有使用需求的工具。

這三個原則至少要滿足一個,若能滿足兩個、甚至三個都滿足就更好。以下簡單說明這三個原則。


只選擇自己可以設定、或者可以看到設定的工具

串接 ChatGPT API 時,通常會需要針對使用場景設定 system prompt ,它的功能是設定這次對話中助手的性格、角色、以及行為模式。

舉例來說,若設定 system prompt 為「你是一個言簡意賅的助手,若使用者沒有要求你回覆,你只會回應:我知道了。」他在回話時,就比較不會天馬行空的回覆你。

相反地,假設你的設定是「你是一個友善的助手,你會盡可能地將對話延續下去。」他在回話時,就會盡量回覆得很詳盡。

實際以這兩個 system prompts 來測試看看,我對他們都輸入了同一句話:「我最喜歡的寶可夢是卡蒂狗。」

第一個助手依照指示,只回答我:「我知道了」。

第二個助手依照指示,跟我尬聊:「卡蒂狗是一個非常可愛的寶可夢,牠是第七代中的一種犬類型寶可夢。你喜歡卡蒂狗的哪些特點呢?」(內容有錯,請忽略這點)

換句話說, system prompt 的設定內容,會大幅影響這個 ChatGPT 助手的表現。單純這麼簡單的 prompt 都會有影響,若是複雜一點的任務或指令,影響程度就更大。

因此回到所有串接 API 的工具上,假設我不知道這個工具在 system prompt 怎麼下指令,我就比較無法判斷,透過這個工具得出來的摘要、翻譯、總結、發想等內容,是否真的值得信賴;我也無法判斷,他是否真的完全發揮了 ChatGPT 的能力。

所以若是那種主打著更方便更好用的 ChatGPT client ,無論是 web 版本、app 版本、或者是串接不同通訊軟體的 chatbot ,我都會盡量確認我可以看到他是怎麼設定的、或者是確認「我可以自行設定」,我才會去使用它、並且享用其他更好的附加功能。避免本末倒置,為了一些附加功能,反而弱化了 ChatGPT 的表現。


只選擇在特定功能上比網頁版 ChatGPT 做得更好的工具

也有許多產品的 AI 串接與設定方式完全不對用戶揭露,對於這類工具,我則會看,他是否在特定功能上做得比 ChatGPT 網頁版更好。

網頁版本的 ChatGPT 已經可以做到許多非常神奇的事,這邊就不再贅述,但 ChatGPT 目前還無法聯網讀取最新的資料,也無法在 https://chat.openai.com/chat 以外的地方使用,這就給了其他產品發揮的空間。

以聯網找資料來說, new Bing , perplexity 或者是 phind 的表現都很不錯。而在使用場景方面,有些瀏覽器插件讓使用者可以在瀏覽任何網頁時都使用 ChatGPT ,或者是 Raycast 這類效率工具串上 API 後,也可以隨處啟動 ChatGPT ,這對我來說就會是加分的項目,會在特定的場景使用它們。

除此之外,更深度整合工作流程的 AI 產品也屬於這一類,例如 notion , craft 和 readwise reader 的 AI 工具,都可以讓用戶在做原本想做的事情時,額外多了 AI 的幫助。這帶來的好處是工作場景與流程的持續不中斷,因此這類工具我也會樂意選擇使用。

這類主打特定功能的工具裡面,我目前最喜歡的是 OpenAI translator ,他既是開源專案,滿足了第一項的條件,又主打「翻譯」這個很常需要的情境,並且提供很到位的介面與功能。例如以目前版本來說,就提供了翻譯、潤色、總結、分析、以及「解釋代碼」等五個不同的功能,等於無論是翻譯外語、或者是翻譯程式語言都可以直接在這個介面上完成。

換個角度來說,若一個串了 API 的 AI 工具,「看起來」沒辦法在任何層面表現得比網頁版的 ChatGPT 還好,我覺得就沒有必要去用它。


只選擇自己真的有使用需求的工具

我覺得這一個原則稍微有點 tricky ,但仔細想想後發現,它是我不至於被 AI 工具淹沒的重要原則。

舉例來說,我目前很少在閱讀 PDF ,也很少在看 YouTube 影片,所以雖然看到許多人在推薦相關的好用工具如 ChatPDFGlarity,我都還未嘗試使用它們。同樣地,若是某個我原本沒在使用的筆記軟體加上了 AI 的功能,我可能也還不會去使用它們。

相反地,假設是目前的我確實存在的需求,看介紹或 demo 也有看到覺得不錯、厲害的亮點,就會去測試使用看看。


小結:三個原則背後的考量都是效率

這三個原則背後各代表一個核心的概念:

  • 只選擇自己可以設定、或者可以看到設定的工具:代表可驗證品質
  • 只選擇在特定功能上比網頁版 ChatGPT 做得更好的工具:代表能力更好
  • 只選擇自己真的有使用需求的工具:代表更專注、不分心

這些核心的概念再進一步收攏歸納後,共通點是,我在使用 AI 工具上可以更有效率。我不會因為用了某工具反而做得更差、我也不會迷失在萬千 AI 工具裡面不知道接下來要幹嘛、該選哪個用。

推薦這些原則給大家!

不過,我覺得在這些之前還要有個前提是,你已經有初步使用過 ChatGPT ,並且思考過自己有哪些任務可以請他處理,此時你既可以知道 ChatGPT 的表現大概在哪個程度,也會有一些「如果這個地方可以用 ChatGPT 就好了!」的感慨,這時再來套用上述的原則就會更有效率,最終也更能夠專注於使用當前、以及未來肯定滿街跑的 AI 工具,也會更知道該怎麼選擇、驗證、進而全面發揮 ChatGPT 的能力。


Last modified on