首頁
黨政
- 黨網(wǎng) · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
觀點
互動
可視化
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陜
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
民文
English
合作網(wǎng)站
舉報專區(qū)
登錄

退出

新研究提升人工智能決策算法適用性

2024年09月13日08:44 | 來源：科技日報

小字號

原標題：新研究提升人工智能決策算法適用性

近日，由北京大學人工智能研究院、工學院、計算機學院和倫敦國王學院共同完成的論文——《大規(guī)模多智能體系統(tǒng)的高效強化學習》在國際學術期刊《自然·機器智能》上發(fā)表。這一成果首次在大規(guī)模多智能體系統(tǒng)中實現(xiàn)高效去中心化協(xié)同決策，有利于提升人工智能決策算法的擴展性和適用性。

多智能體系統(tǒng)主要以龐大的智能體交互數(shù)據(jù)為基礎，利用大量計算資源驅動每個智能體學習如何與其他智能體合作執(zhí)行復雜任務，其核心范式是多智能體強化學習。

“比如一個無人機編隊，每架無人機都由人工智能控制，我們把每架飛機的控制器叫作智能體，這個無人機編隊由多個智能體構成，就是一個多智能體系統(tǒng)�！闭撐牡谝蛔髡�、北京大學人工智能研究院博士生馬成棟解釋。

馬成棟說，在真實大規(guī)模系統(tǒng)中，各個控制單位之間、控制單位與環(huán)境之間的交互成本往往非常高昂。這些系統(tǒng)中經(jīng)常存在客觀通信限制，如通信距離太遠、全局通信有隱私泄露風險、通信能耗限制等。控制單位之間難以實現(xiàn)全局信息交換，阻礙了人工智能決策算法在大規(guī)模系統(tǒng)中的擴展和應用。

當前，去中心化的多智能體強化學習成為國際學術界的研究熱點，其旨在探索一種算法，即在有限數(shù)據(jù)和資源條件下，將決策能力擴展到包含大量智能體的復雜真實系統(tǒng)中。

馬成棟說，去中心化的多智能體強化學習，以不依賴全局信息的方式讓每個智能體實現(xiàn)高效去中心化協(xié)同決策，展現(xiàn)出獨特優(yōu)勢。

論文通訊作者、北京大學人工智能研究院助理教授楊耀東介紹，研究團隊通過網(wǎng)絡化結構解耦系統(tǒng)的全局動態(tài)特性，使智能體能獨立學習局部狀態(tài)轉移、鄰域信息價值和去中心化策略，將復雜的大規(guī)模決策難題轉化為更容易求解的問題。得益于此，即使在樣本數(shù)據(jù)和信息交互受限的情況下，大型人工智能系統(tǒng)也能展現(xiàn)令人滿意的決策性能。

研究團隊在較為復雜的城市交通和電力網(wǎng)絡中，對包含數(shù)百個智能體的場景進行了測試。結果顯示，與中心化多智能體學習方法相比，去中心化的方法可將信息交換成本降低70%或更多。而且，隨著智能體數(shù)量不斷增長，這一比例還會顯著下降。同時，樣本效率可提升50%以上。

“這一研究成果對于將人工智能模型擴展到大型電力網(wǎng)絡、城市交通信號控制等大規(guī)模多智能體系統(tǒng)具有重要價值�！瘪R成棟舉例說，在大型電網(wǎng)系統(tǒng)中，節(jié)點之間信息交換和傳輸過于頻繁，難免會產(chǎn)生干擾。某些節(jié)點一旦發(fā)生故障，就會嚴重影響其他節(jié)點的性能。去中心化可以降低這一風險，提高電網(wǎng)系統(tǒng)穩(wěn)定性和安全性。

（記者楊雪）

(責編：郝孟佳、李昉)

分享讓更多人看到

人民日報報系

旗下網(wǎng)站

創(chuàng)新服務平臺

新研究提升人工智能決策算法適用性

客戶端下載

熱門排行