GPT 不好用是真的,但只會越來越好用到你害怕
2024 年 6 月 23 日GPT 全能賽(一):社群文案改寫,ChatGPT 比較厲害
2024 年 8 月 7 日幾個月前寫過 ChatGPT 不好用? 6個你”可能”對 GenAI 生產力工具的誤會 以及 GPT 不好用是真的,但只會越來越好用到你害怕 兩篇文章,獲得很多討論;只不過寫完後就颳起了黃仁勳旋風,身邊的朋友開始越來越多人想開始使用 AI 聊天機器人,主要原因大致有:
1.在工作時不想動腦,如何用AI聊天機器人提升至少30%工作效率 2 .多出來的時間,可以用來做更多其他(自己)的事 3.想多一些不同觀點或創意,當作自己的第二大腦。
但你還是只認識 ChatGPT 嗎?如果你還不認識 Google 出的 Gemini、Anthropic研發的Claude、微軟的Copilot,還有黃仁勳都愛用的 Perplexity,今天大叔將透過這篇,來幫小白們初步快速了解他們在”語言模型” (Language model) 差別是什麼?以及因為語言模型的不同,而造成的優勢強項是那些?接著將它們的差異化給它們一個性格定位,讓你跟人在談 AI 時,瞬間變得高大尚。
最後,如果你有選擇障礙,或是想要在不同需求特別想測試哪個聊天機器人,大叔將提供你一個務實的建議。
作為第二大腦的共同基本能力
首先,什麼是語言模型呢?簡單來說,就是讓 AI 能夠理解和生成人類語言的技術。每個聊天機器人背後都有一個強大的語言模型(Large Language Model,簡稱LLM),就像他們的大腦,經過像是神經突觸交互運作下的進行思考,之後透過統計語言學的技術,產出對話內容。
這五款聊天機器人(ChatGPT、Gemini、Claude、Copilot、Perplexity)共同的功能主要包括以下幾個方面:
1. 文本生成:所有這些聊天機器人都能生成自然語言的文本,適用於各種場景,如問答、創意寫作和職場文檔。
2. 多領域應用:它們都能應用於多種領域,包括醫療、金融、料理、職場寫作和創意寫作等。
3. 摘要功能:這些機器人都具備生成文本摘要的能力,能夠從長篇內容中提取關鍵信息。
4. 即時回應:所有聊天機器人都能提供即時的回應,雖然回應速度可能有所不同。
5. 用戶互動:這些平台都支持與用戶的互動,能根據用戶的輸入進行調整和反饋。
6. 雙向翻譯與文法檢查:能針對全世界多國語言進行直譯和文法檢查
語言模型的不同:造就腦部不同的超能力
不過就像每個人都有大腦,但大腦的差異,也造就了思考反應的不同。所以,今天就是要解剖這五個模型的大腦,來一窺究竟這些大腦的表現,而就在2024九月,知名創投公司a16z公佈第三屆生成式 AI 應用 100強報告中,以web版本,ChatGPT 排名榜首、Perplexity 排名第三、Claude 排名第四,而 Gemini和 Copilot (但手機板排名前十名) 是不在排名的。
,以
(一) 聊天機器人中的學霸:ChatGPT
相信大家認識的第一個聊天機器人肯定是一年多前爆紅的 ChatGPT,由 OpenAI 開發,使用 Transformer 架構,訓練於大量互聯網文本。擅長生成自然、流暢的文字,能處理多種語言和上下文。
目前免費版本為 ChatGPT 3.5,但資料只更新到2021的資料;目前升級到 GPT-4o 是 ChatGPT Plus 使用的語言模型,能提供更詳細和準確的回應,特別在長篇討論中有優勢。擅長創造各種文字格式,像是詩歌、劇本,甚至寫程式碼也難不倒它!例如之前有人請他扮演方文山,也一首很周杰倫的中國風歌詞;或是請它教你用 Python 寫一個簡單的計算機程式;又或是代替媽媽替寶貝寫一篇睡前關於貓的故事。
它的 DALL-E 和 Playground 的衍生功能,在圖片的生成與語音文字的處理上,也都相當成熟,其中 DALL-E 的3D 繪圖能力,只要給予適當的 Prompt,幾乎能生成一張跟實際拍照的相片。
此外,它在讀取文件與分析文件上,也是非常強悍的,不管丟入 word、Excel、PPT、PDF、JEPG 等各式檔案,不只能提取訊息,更能分析內容後,預測趨勢和產生可視化圖表。所以如果你是會計人員,丟一份財報,它會幫你進行統計分析,製作可視化的圓餅圖或長條圖等,也會幫你預測分析下一年度的獲利情形。
它就像你坐位旁的學霸,也像運動場上的全能型選手,好像什麼都難不倒,擅長處理各種類型的任務。理解力強,回答全面且有深度。
不過,它最獨一無二的功能就是 GPT Builder,讓一些特殊領域或專業人士,奠定在既有的 GPT 模型與資料庫下,開放讓所有人自行餵食資料,製作自己專屬的 GPT 並持續訓練它。你以為要創作自己的GPT很難嗎?錯!就算你是非理工的文學生,一樣可以輕鬆快速上手。
(二) 你最熟悉的老朋友:Gemini
相信幾乎所有人都用過谷哥,它就像你的老朋友,不管是問事、找地點、搜圖等,而 Gemini 正是 Google 最新、最强大的模型,結合了理解文字和圖像的能力,可以讓你用更直覺的方式和它互動,像是直接上傳圖片詢問相關資訊,目前最高版本為 Gemini 1.5 pro。其中付費版本,能整合 google 的所有工具,像是 workspace 等,進行整合性搜尋。
毫無意外因為 google 累積了各類型的文本知識庫,故專特定領域知識的精確性也都比較強,尤其是在科技和工程方面。常具備深度的技術性回應,提供精確的數據和分析。
例如你可請它解釋一下量子計算的基本原理;又或是你可以上傳一張風景照,問它這是哪裡,或是請它幫你用這張照片寫一篇旅遊日記;更厲害的是,如果你上傳一張複雜的圖表,問「這張圖表表達了什麼?」Gemini 可能會給出非常精確的分析,包括數據趨勢和潛在的商業洞察。
不過,就算你付費,它可就沒有 ChatGPT 圖像生成和資料分析的功能,更沒有 GPT Bulider 的強大生成器。
(三) 展現專業與道德倫理的電視台主播:Claude
Claude 是 Anthropic 開發的,而 Anthropic 正是由 OpenAI 脫離出來而成立的,所以都是奠定在 ChatGPT 基多模態模型礎上發展出來,能處理文字、語音和可能的圖像數據。跨領域能力強,能理解並結合不同類型的信息,該有的實力一樣都不會少。
但是為什麼要脫離呢?當然就是理念不合啊 ! 執行長Dario Amodei表示,Anthropic 的核心價值和 OpenAI 最大的不同,就是希望打造出人類不會恐慌的 AI。
所以 Claude 主打安全性及道德規範,擅長進行客觀分析和提供不同觀點的資訊。就像一般國際專業的新聞都會平衡多元報導 ( 台灣電視台大部分沒有喔!),儘可能從不同觀點深入分析一件事情,Claude 就像是這樣的新聞台主播,總是儘可能地客觀提供不同觀點的資訊。
特別是處理敏感話題時表現出色,擅長長篇對話。舉例:如果你問「關於環境保護,我們應該怎麼做?」Claude 可能會給出平衡的建議,同時提醒你考慮不同利益相關者的觀點。又或是你可以請它分析最近的時事議題,或是請它提供不同立場的觀點。
但小編我很喜歡它的原因之一,在於它除了告訴你答案外,還會主動分析它為什麼會這樣回答、這分析的結構是甚麼,讓你清楚理解它回應的邏輯和想法。這是很貼心的服務啊!!
(四) 直球對決的工程師直男:Copilot
由微軟開發,前身是 Microsoft Edge 也就是 Bing,基於 GitHub 的語言模型,針對編程和開發者輔助優化。顧名思義,Copilot 就像你的副駕駛,擅長整合各種微軟軟體和服務,提升工作效率。編程問題解答能力強,可以生成代碼片段和解釋。會偏向技術具體的解答,尤其是與軟件開發相關的問題。
也因為微軟開發,所以專注與 Microsoft Office 生態工具系統深度整合,目的在於於提高生產力,特別是在編程和辦公軟件方面,提供實用的工作建議。像是你可以請它幫你整理Word文件、製作 PowerPoint 簡報,或是幫你安排 Outlook 行事曆。舉例:如果你在 Word 文檔中輸入「幫我寫一封辭職信」Copilot 可能會直接在文檔中生成一個專業的辭職信模板。
不過,你對於微軟的形象是什麼?如果蘋果 Mac 相關產品是設計師的最愛,那麼微軟硬梆梆直球對決的工程師形象,絕對深植人心。因此,Copilot 就是給人這麼直覺的印象。就像 Copilot 一樣和 ChatGPT 和 Claude 一樣能生成圖像,但是相信我,工程師畫的圖和設計師畫的圖,真的明眼人都看得出來的。
(五) 帶來新鮮感的網紅:Perplexity
原本一開始是專為學術研究設計的 Perplexity,有著強大的檢索功能,可能依賴於大型搜索引擎數據。擅長搜尋和整理學術資料,並提供可靠的資料來源,像是學術論文網之外,其中消息來源也包含部落客、FB、 Youtube 等社群平台,讓小編我意外的是,連Google商家評分都能是訊息分析來源之一。擅長於提供情境化的答案,並解釋背後的原因,提供詳細且引用來源的回應,適合學術或查詢型需求。
Perplexity 注重實時信息檢索和事實核查。回答包含最新信息,並提供信息來源。它就像是一個超級網紅,就像老高與小茉,上知天文下知地理,總是可以給你新鮮感外,也能告訴你訊息來源的真實性。
我個人很喜歡Perplexity更多的原因,在於它的Pro Search會提供你它搜尋的關鍵字是哪幾個,這有助於你進一步分析它推理的合理性與邏輯性,也就此展開了它搜尋關鍵字的訊息來源。
此外,你問一個主要問題,Perplexity會在答覆後,在提供衍伸五個可能你會想知道的問題,協助你更完整的答覆。例如如果你問「最近有什麼重大科技突破?」Perplexity可能會給你一個最新的列表,並附上新聞源和發布日期。 然後,它會接著提供其他你可能想知道的問題,例如這些科技的應用領域有哪些、那些國家在這些科技上領先等。
付費版的 Perplexity 也可以選擇ChatGPT 4o、Claude 3.5等其他的 AI 模型,來得到不同的回覆,因此無論是上傳文件,或是使用 DALL-E 或 Playground 得到視覺化答案也是沒問題的。
而 Perplexity 的龐大搜尋檢索實力究竟有多強大,最近天下雜誌報導有國外媒體就指出,它竟然能翻牆到一些會員付費的網站後,撈取資料後進行分享,這對原創或版權擁有者可能十分不開心,但是對於我們這貪小便宜的
Users,可就是福音啦。
因此聽到這邊,是不是覺得Perplexity已經勝出了呢?
ChatGPT、Gemini、Claude、Copilot、Perplexity 的其他功能比較
功能 | 說明 | ChatGPT | Gemini | Claude | Copilot | Perplexity |
圖像生成 | 透過prompt指令生成圖像 | 是 | 否 | 是 | 是 | 是 |
讀取文件 | 能接收、理解和處理用戶上傳的各種文件格式,如PDF、Word文檔或文本文件。包含信息提取、內容分析、格式轉換 | 是 | 是 | 是 | 否 | 是 |
資料分析 | 能夠對用戶提供的數據進行分析,這通常涉及統計學整理、圖表可視化和解釋與預測趨勢 | 是 | 否 | 是 | 否 | 是 |
設計GPTs | 創建屬於自己的GPT | 是 | 否 | 否 | 否 | 否 |
付費版價格(US) | 一定程度的免費使用,要更強大的功能都需要付費 | $20/月 | $21/月(升級Google One免費) | $20/月 | 微軟帳號免費 | $20/月 |
華爾街日報測試,第一名是?
如果你看我大叔的分析,已經給 Perplexity 冠軍了,那麼根據《華爾街日報》透過免費版的測試結果,在整體表現上,還是判給了Perplexity 奪冠,ChatGPT、Gemini、Claude、Copilot 分列二至五名。
Perplexity 在免費版本中提供最多的功能。在多項評比中表現優異,特別是在「概要」、「最新消息」和「程式」三個類別拿下第一。Gemini則在健康建議、財務建議和烹飪方面表現突出。
不過 ChatGPT 在免費版和付費版 ChatGPT Plus 中都有提供圖像生成功能。Gemini 目前尚未支援圖像生成,而,同樣華爾街對於 Copilot 這為工程師職男,在職場寫作和創意寫作方面表現,的確是較其他 GPT 差的。
還有其他選擇? 外掛型一站式 AI GPT: Sider 和 Monica
最後,如果你有選擇障礙,或是想要在不同需求特別想測試哪個聊天機器人,又或是已經考慮使用 Perplexity,大叔將建議你別選了,直接使用可外掛搜尋網頁的 一站式 AI:Sider 或是 Monica 就好,讓你在網頁搜尋時,就能直接在介面旁開起詢問問題。
不管是 Sider 或是 Monica,跟 Perplexity 一樣能選擇不同版本的 AI 模型,一樣也有免費版本,而付費版就能享用上述五項 GPT 的幾乎所有頂規功能(除了 GPT Builder、Playground 等細節功能無法)。
其中,用文字生成照片、去背、換背景、照片去文字等影像處理一樣也不缺外,其中關於 Youtube 的同步翻譯與摘要功能,更是一大好用的工具。特別是針對影片太長,想快速知道內文重點;又或是國外語言想知道內容卻聽不懂的困擾,現在這外掛式 AI,就能在你開啟 Yotube 時,側邊欄幫你同步摘要和翻譯。r
快試試看Monica >>