在這波 AI 浪潮之下,我已經連續使用大型語言模型(LLMs)兩年多了。回想剛開始接觸時,這些 AI工具經常令人啼笑皆非。像是我在 2022 年初次用 OpenAI API 串接 LineBot 時,曾好奇問它:「鄭成功的媽媽是誰?」它竟然毫不猶豫地回答:「陳香梅」。我又繼續問它:「你認識陳芊霏嗎?」(我的二女兒),它居然煞有介事地表示:「陳芊霏是鄭成功的妹妹,也是一位歌手」。如今想起,這種語言模型的「幻覺」(Hallucination)雖然當時令人哭笑不得,但也充分反映了人們第一次接觸AI時常見的困惑與失望。
事實上,大型語言模型的誕生,是近年人工智慧發展的重要里程碑。在此之前,人工智慧已經歷經多次起伏,包含三次明顯的低谷期。然而近年來,隨著計算能力的暴增,加上深度學習與強化學習技術的突破,生成式語言模型才真正迎來了重大的發展,這項技術不僅應用在文字生成上,更擴展到圖片、影像、聲紋等多模態的輸入與輸出,讓應用的可能性大幅擴展,也更加全面且實用。這正是我決定撰寫這篇文章的主要原因之一。
然而面對這樣迅速且全面的技術革新,人們通常會出現兩種反應:一種是不知道該如何使用,因此望而卻步;另一種則是帶有抗拒,甚至認為這不過又是媒體炒作的話題,與過去被吹捧過頭的 NFT 或元宇宙並無差異。這種現象反映出許多人對 AI 技術的誤解與忽視,讓自己停留在初步使用的負面印象中,就像井底之蛙,限制了自己對新技術應用潛力的視野。
舉例來說,2023 年時李家同教授曾在社論中指出,不應該要求學生使用 ChatGPT 寫程式,因為這可能會讓學生失去訓練邏輯思考與流程圖設計的機會。李校長的擔憂並非毫無道理,因為許多初階開發者可能誤用 LLM 產生出一堆看似可行,但實際卻漏洞百出、充滿技術債的程式碼。然而透過正確的教育和指引,生成式 AI 其實可以成為極佳的開發輔助工具,例如 Coursera 線上課程《Generative AI for Software Development》所展示的做法:透過 LLMs 協助開發者撰寫更穩健的測試案例、進行自動化的程式碼除錯,甚至在設計系統架構時提供清晰且邏輯穩健的建議。這不僅避免了初學者掉進錯誤的技術陷阱,還能有效提升開發團隊的整體產能。
我在自己的實際應用中,也體驗到 LLMs 已深刻融入日常生活與工作流程,從資料篩選、自動化客服系統、流程優化到數據分析,這項技術的落地效果已經超越許多人的認知。忽視這樣快速落地的應用,只會讓自己錯失提升競爭力的重要機會。
正因如此,我決定寫下這篇《我與 LLMs 共事兩年來的真實應用經驗》,透過自己真實的經歷與應用案例,希望能幫助那些還停留在觀望或懷疑階段的朋友,打開新的視野,踏出接受新技術的第一步。
生成式 AI(Generative AI)指的是讓機器能夠創造出新的內容,包含文字、圖片、聲音甚至影像等。近年生成式 AI 之所以快速崛起,主要得益於大型語言模型(LLMs)與深度學習技術的突破。
從技術層面來看,LLM 包含兩個主要部分:參數檔案與推理程式。參數檔案即模型本身,是經由大量數據訓練而來的參數,以向量數值形式儲存,通常規模非常龐大,例如知名的 Llama 2-70B 模型就包含了約 700 億個參數。而推理程式則負責將這些參數載入,根據輸入的提示(Prompt)進行推理並輸出結果。