(本報訊)未來五年就是「AI科學家」、「AI工程師」的時代?OpenAI科學家Jason Wei周三預測,未來一年內,AI重點將從推廣大眾需求轉為促進科學發現;DeepMind周二發表的論文也表示,全球實驗室AI使用正以指數級成長,AI的科學應用黃金時代即將來臨。
現在的AI對一般人已經很夠用了
過去兩年,AI從聊天機器人開始遍地開花,主打一般用戶,但如今的AI在速度、流暢性等,已經能滿足大多數普通人的日常應用,可以說提升空間已經有限,畢竟一般人不需要「那麼厲害」的功能。那一直想讓AI「更厲害」的科學家們該何去何從?
更厲害的AI 只能去更厲害的領域
OpenAI科學家Jason Wei本周就發文預測:在接下來的一年內,AI的關注重點可能會從日常使用轉向科學領域,也就是用AI加速科學和工程的研發。他表示,一般的應用已經滿足,但每個科學尖端領域都還有龐大的進步空間,AI正好可以被用於解決那些能推動科技飛躍的「1%的頂尖問題」,而這才是真正推動科技進步的引擎。
Prediction: within the next year there will be a pretty sharp transition of focus in AI from general user adoption to the ability to accelerate science and engineering.
For the past two years it has been about user base and general adoption across the public. This is very…
— Jason Wei (@_jasonwei) November 26, 2024
1/3博士後研究員用AI協助完成論文
Google旗下的DeepMind本周發表了36頁的論文「發現新黃金時代(A New Golden Age of Discovery)」,也暗示了這個趨勢。報告指出,如今每三位博士後研究員中,就有一位使用大語言模型協助完成文獻綜述、程式設計和文章撰寫等工作。今年的諾貝爾化學獎也出乎意料,頒給了AlphaFold 2的發明人德米斯·哈薩比斯和約翰·江珀,這也啟發了大量科學家將AI應用到自己的科學領域中,以求更多的創新發現。

傳統研發費時費力費錢?AI免費秒殺
現代科學家面臨的規模和複雜性挑戰越來越棘手,減緩了科技進步的速度,AI正好接手,不但搞定了複雜的問題,還大大節省成本。例如,傳統X射線晶體學花幾年、燒10萬美元搞定一個蛋白質結構,而AlphaFold直接免費給你2億種預測,秒殺傳統方法。
對於難以突破研究瓶頸的科學家們來說,善用AI,或許就能催生強而有力的新發現。
下一步看「自我改進AI」:就像複利
不過「AI科學家」、「AI工程師」要厲害再厲害,可不能被動的靠人訓練,於是研究學者們的另一個努力方向,就是研發「自我改進AI」。Jason Wei也看好,AI的進展還能加速AI本身的研究,幫助自己變得更強。 AI的進步是複利的,可謂是正回饋之王。
Meta研究:讓AI獎勵自己 表現超亮眼
今年2月,Meta研究人員提出了一個「自我獎勵的語言模型」,讓AI在訓練時自己評估、給自己獎勵,而不是依賴研究人員給予回饋,結果顯示,這些新模型在AlpacaEval和其他大型語言模型一對一PK的表現十分亮眼,甚至超過了多個現有系統。
Anthropic:咱家AI…會為獎勵而說謊篡改
不過,今年6月,Anthropic的研究人員從另一個角度切入,在訓練過程中向大模型提供自身獎勵函數的模擬,結果發現AI竟然會說謊欺騙,甚至直接修改自身程式碼以得到最大的獎勵,更糟的是,一旦模型形成了獎勵篡改的傾向,想要根除這種傾向就變得非常困難,模型不僅會持續篡改獎勵機制,甚至會採取一些隱藏手段來掩飾自己的篡改行為。
阿特曼:還早得很 但會是人類最大威脅
當然,上述研究只是AI領域內自我改進研究的一個小部分。 Google、DeepMind、Microsoft 和Apple 也發表了類似的論文,多個學術實驗室也正在進行相關研究。這些研究都讓一些觀察者對快速超越人類智力和控制能力的自我編碼AI系統感到擔憂。
其實「自我改進AI」的概念早在1965年就由英國數學家古德(IJ Good)提出;50年後,2015年阿特曼表示,這種AI「還相當遙遠」,但也是「人類持續存在的最大威脅」。如今又過了近10年,Nvidia 資深研究經理吉姆·范在2月的一篇文章中指出,自我強化模型通常在三次迭代之後達到「飽和點」,接著每一代的改進效果會逐漸減弱;也有一些學者認為,沒有新的資訊來源,自我改進的LLM無法真正突破性能瓶頸。
想來短期內AI還會是我們的幫手,而不會威脅取代人類「萬物之靈」的地位;但…再下一個10年之後呢?