這場由 Andrej Karpathy(目前任職於 Open AI,也是前 Tesla 人工智慧總監)帶來的演講,深入探討了 AI 時代下軟體開發的變革。他指出軟體在過去幾年發生了兩次重大且迅速的轉變,這為即將進入這個行業的學生們創造了一個極其獨特且有趣的時機 。

https://youtu.be/vD7CIADHeDc?si=ONIiB68UY1dD861d

軟體進化史:從 1.0 到 3.0

Karpathy 將軟體發展分為三個階段:

LLM 的多重角色:公用事業、晶圓廠與作業系統

Karpathy 提出 LLM 具備多種特性:

技術擴散方向的顛倒與 LLM 的心理學

LLM 展現了一個前所未有的特性:它們顛覆了技術擴散的傳統方向 。過去新興且昂貴的技術如電力、加密技術或互聯網,通常是政府和企業首先採用,隨後才普及到消費者 。然而 LLM 卻是反過來的,它們首先在個人使用者中廣泛應用,例如用來解決「如何煮雞蛋」這樣的生活問題,而政府和企業在採用這些技術方面反而落後 。

在我們開始編程 LLM 之前,必須先了解它們的「心理學」。LLM 可視為「人類精神的隨機模擬」(stochastic simulations of people)。這些模型在網路上大量的文本資料上進行訓練,因此具備了類似人類的「湧現心理」(emergent psychology)。這是指 LLM 在訓練過程中,因巨量資料的學習,意外地、非預期地展現出了類似人類思維或心理的行為模式和能力。LLM 並未擁有真意識或情感,但卻展現出類似人類行為或認知過程的特定。

LLM 雖然擁有超乎常人的知識和記憶,例如能像電影《雨人》中的角色一樣記住大量資訊 ,但它們也存在一些認知缺陷: