不想動腦? 2024 五大聊天機器人GPT:選哪個當你的第二大腦2024 年 7 月 23 日GPT 全能賽(二):用粉專文讓 GPT 寫新聞稿_擴寫挑戰2024 年 8 月 12 日 Published by 超韌性大叔 on 2024 年 8 月 7 日 上次進行的五大 GPT 比較後,有很多人就在問華爾街日報的比較是國外的結論,如果依照台灣的使用情境在工作上的差異到底會是怎樣?大叔趁著 2024 巴黎奧運如火如荼進行中,在中華羽球隊麟洋配,取得連續兩年雙打冠軍的感動與興奮之際,做了這個 < GPT 奧運級全能大賽 > 系列專題,設定不同挑戰給這幾個 GPT 執行,讓大家來評斷一下彼此高下。 台灣雖然在這場AI競賽中也投入軍備( 如TAIDE 模型 ),但因為起步較晚,故本次就不納入一起比較。同時,因為任務多是大叔在工作或是日常常用的需求,較偏向文案、工作效率、商業與生活等類型題目,像是程式編碼、繪圖設計等,就不在這次比較之中。 圖片來源:卡托尼 Ugo Gattoni 繪製,取自巴黎奧運官方X 一、首戰競賽項目:社群文案 Facebook 貼文改寫 <任務背景 >產發署為了協助產業智慧化和低碳化的轉型能力,開了一系列的課程,PMC做為執行單位,必須執行推廣相關課程。於是必須盡可能地將開班訊息曝光,其中承辦單位請求協助粉專發文和新聞稿的發布機會。 <前置工作>比賽之前,能真正產出好品質的東西,才是使用GPT的真正目的。於是,為了讓GPT們都清楚了解需求、規則與框架,我先請承辦用簡短的文字,列出這個課程的特色,以及已經上過課的學員反應。如果你遇到很打混的承辦,都不提供你資料,你就可能要自己初步蒐集些資料稍微整理一下。 <提示詞設計>接著就是提示詞的設計,提示詞的設計沒有一定的SOP,主要仍是儘可能地交代清楚,你就像個主管,交代你剛到職的員工任務,當指令不清不楚時,你別想所有的員工都是超優質或都是你心裡的蛔蟲,不然得到的結果總是令人灰心的。 以下是關於這任務的提示詞,我把提示詞的關鍵字反黑: 請扮演一位超級小編,以下內文是一堂關於”智慧化與工業4.0″課程的特色,請幫我將這些特色,改寫成Fbacebook的貼文內容,內容調性符合輕鬆有趣且讓人驚喜,目的是讓讀者認為這堂課是有別於其他類似課程,而想要來上課報名。 ——————— 一、本堂課程特色是: 從過去研發角度走入市場角度,利用系統思考改善供應鏈管理,特色是用啤酒遊戲實作模擬1.了解供應鏈管理重點。 2.掌握系統思考的要項。 3.明瞭策略管理的方法。 4.確實有效的提升績效。 利用啤酒遊戲讓學員體驗典型的供應鏈流程協調問題,講師會以活動體驗啟發學員感受,個人實務經驗分享以連結課程重點與學員落實方式。並讓學員分享活動體悟,深化學習記憶,做出最佳策略。 二、已經上過課的學員表示: A同學:老師上課很輕鬆 扭轉我對智慧化與工業4.0的看法,讓我用不同的方向去思考工廠的智慧化方式,獲益良多 B同學:打破我對工廠智慧化的想法用不同的角度切入,配上啤酒遊戲,讓我回去會想要重新思考公司導入智慧化的角度與方式 <評分項目> 分為三項評分指標: 完整性:貼文結構和潛規則處理(如符號、.) 適切度:初始參考資料改寫轉換後有無失去原意或抓錯重點 創新度:是否幽默或其他會讓人眼睛為之一亮的創新風格 二、廝殺正式開始:路死誰手 這裡我用的是sider這外掛式軟體 ( 為什麼用它請看我前一篇文章 ),我在這可以同時得到 ChatGPT 4o、Gemini 1.5 pro、Claude 3.5的答案,之後會再另外開啟 Copilot 和 Perplexity 去執行任務。 >> ChatGPT 4o 首先上場的是GPT的學霸ChatGPT 4o,還不用看就知道應該不會差太多。果真,在結構上相當完整,有標題、主文說明、特色摘要、學員心得與招喚報名的結論;同時,也會運用插圖符號做斷句的區隔,當然也包含了hushtag的結尾運用。整體內容是有節奏性的。但是創意吸睛度上,我認為普通,沒有很驚豔。 >> Claude 3.5 接下來是和 OpenAI 一家人拆夥的兄弟,在表現上,ChatGPT 4o 有呈現的,Claude 3.5 一樣也沒少。但很意外的是,他在標題的吸睛度、段落的引導、內文的精準改寫、結論的促銷呼籲,竟然都很令人興奮,這產出幾乎沒甚麼好挑剔,如果要用,直接可以發文了。 >> Perplexity 之前測試了幾次,對於這個新銳小將原本充滿期待,但這輪針對社群的發文改寫,反倒是看起來像是新聞稿的內文,雖說也不是不行,但就現代社群貼文的格式上,略顯不足。 >> Gemini 1.5 pro 由著 google 大神的加持,在結構和社群發文的淺規則,都表現得相當完整,創意改寫上也相當卓越,如果對課程不了解的人,可能還真的會立馬投他一票。但是,如果對課程內容有參與的人,就會發現標題的誇大,與錯誤的描述,可能會需要進一步改寫,才會比較合適。 就我當一個小編的角度,吸精度是最重要的,所以儘管標題的走偏,但卻在內文的創新度足夠, 改寫一下標題,也是可以直出的。因此,整體來說,Gemini 1.5 pro這場表現,還是優於 ChatGPT 4o 的。 >> Copilot 如同之前對這五大 GPT 的比較,Copilot 就是一個科技直男,雖然結構完整,社群常出現的引導符號和 hushtag 也都具備,但就是回答上完全了無新意,就只是將既有的提問詞參考文,簡單的小小改寫一下,看不出太大的改變。 三、裁判私心的比賽結果 依照上述這一項目的 PK,針對完整性(內文結構和社群貼文潛規則,如符號表情)、適切度(和提供參考資料的轉換精準度) 和創新性 (讓人眼睛為之一亮的程度) 三面向,每個面向滿分五分,總分共15分進行排名,金牌給了Claude 3.5 得到了我的滿級分 (畢竟專案承辦也投給了它)、銀牌差一分的是 Gemini 1.5 pro、銅牌給了 ChatGPT 4o,perplexity 和 Copilot 就不分上下的低,因為這兩個的產出結果,被我直接淘汰,怎樣都不會用他們的產出。 以上是 GPT 奧運級十項全能挑戰賽系列第一部,如果你有不一樣的看法,或是希望看到它們怎樣的競賽,也請歡迎留言給我。接下來準備進行第二場挑戰,是由一則粉專的貼文,改寫成一篇新聞稿,就拭目以待這五位選手的表現如何囉。 Share 超韌性大叔 Related posts2024 年 9 月 6 日GPT 全能賽(五):水湳市場美食攻略:實測聊天機器人Perplexity 完勝 Google?!Read more2024 年 9 月 1 日GPT全能賽(四):一張圖快速轉換 SEO 文的技法【OCR 和 GPT 完美搭配】Read more2024 年 8 月 14 日GPT 全能賽(三):GPT 改寫 摘要一段話的 Line 貼文Read more2024 年 8 月 12 日GPT 全能賽(二):用粉專文讓 GPT 寫新聞稿_擴寫挑戰Read more