2 月 25 日,人工智能國際頂級(jí)學(xué)術(shù)會(huì)議 AAAI 2025 開幕,在此次大會(huì)論文錄用結(jié)果中,中國電信人工智能研究院(TeleAI)科研團(tuán)隊(duì) 10 篇論文成功入選。
AAAI 會(huì)議由國際先進(jìn)人工智能協(xié)會(huì)主辦,是人工智能領(lǐng)域歷史最為悠久、最具影響力的頂級(jí)學(xué)術(shù)會(huì)議之一。本屆大會(huì)共收到 12957 篇有效投稿,最終 3032 篇文章脫穎而出,接收率為 23.4%。
中國電信人工智能研究院(TeleAI)科研團(tuán)隊(duì)的 10 篇論文不僅覆蓋大語言模型偏好對(duì)齊、視覺模型參數(shù)微調(diào)、正激勵(lì)噪聲(PI Noise)采樣和表征對(duì)齊等技術(shù)方面的突破,更包括人工智能與化學(xué)、醫(yī)療的交叉研究等多個(gè)方向的系列創(chuàng)新。
在基礎(chǔ)科學(xué)研究中,人工智能技術(shù)的創(chuàng)新作用越發(fā)凸顯。隨著大語言模型(LLM)的快速發(fā)展,AI 對(duì)科學(xué)文獻(xiàn)和技術(shù)專利的理解、分析和描述正得到廣泛應(yīng)用。
LLM 在化學(xué)任務(wù)中的重點(diǎn)之一是進(jìn)行“分子文本描述生成”(Molecule Captioning),即將分子的相關(guān)信息轉(zhuǎn)化為自然語言文本描述,并在其之間進(jìn)行對(duì)齊。然而,現(xiàn)有工作主要集中在單分子上,化學(xué)反應(yīng)和自然語言文本之間的一致性在很大程度上仍然未被探索。
作為專利和文獻(xiàn)的重要組成部分之一,對(duì)化學(xué)反應(yīng)進(jìn)行準(zhǔn)確描述不僅可以更好地理解化學(xué)反應(yīng)的過程,且有助于促進(jìn)化學(xué)合成和逆合成的自動(dòng)化相關(guān)研究。
為此,TeleAI 聯(lián)合華東師范大學(xué)等單位提出了一項(xiàng)“ReactGPT”框架,集成了基于化學(xué)反應(yīng)的指紋檢索模塊、特定領(lǐng)域提示設(shè)計(jì)模塊、兩階段上下文調(diào)優(yōu)模塊。
ReactGPT 框架旨在彌合化學(xué)反應(yīng)與文本之間的差距。實(shí)驗(yàn)結(jié)果表明,與先前模型相比,ReactGPT 在解決化學(xué)反應(yīng)問題和生成結(jié)構(gòu)正確的高質(zhì)量文本方面表現(xiàn)出色。
放射學(xué)報(bào)告對(duì)醫(yī)生的診斷意義重大,但人工撰寫不僅負(fù)擔(dān)重且易出錯(cuò),現(xiàn)有的自動(dòng)報(bào)告生成技術(shù) RRG(Radiology Report Generation)方法多基于監(jiān)督回歸或注入額外知識(shí),生成報(bào)告難以契合醫(yī)生多元偏好。
為應(yīng)對(duì)這一挑戰(zhàn),TeleAI 提出多目標(biāo)偏好優(yōu)化(MPO),將預(yù)訓(xùn)練的報(bào)告生成模型根據(jù)多個(gè)人類偏好進(jìn)行調(diào)整,具體通過多維獎(jiǎng)勵(lì)函數(shù)來微調(diào),并通過多目標(biāo)強(qiáng)化學(xué)習(xí)(RL)進(jìn)行優(yōu)化,從而使模型能夠在不同的偏好條件下生成符合特定醫(yī)生偏好的報(bào)告。
研究通過引入兩個(gè)新的模塊來實(shí)現(xiàn)與人類偏好的對(duì)齊。首先,設(shè)計(jì)了一個(gè)偏好向量融合(PVF)網(wǎng)絡(luò),它位于標(biāo)準(zhǔn)的 Transformer 編碼器和解碼器之間,利用多頭注意力機(jī)制和殘差連接將偏好向量與編碼后的圖像特征融合,實(shí)現(xiàn)條件生成。其次,提出了一個(gè)多目標(biāo)優(yōu)化(MOO)模塊,該模塊使用偏好向量表示偏好權(quán)重,并通過點(diǎn)積操作將