近年來,人工智能(AI)技術發展迅猛,并被快速推動應用到社會生活的各個方面,智能博弈領域正是其應用與實踐的熱點領域之一。2019年12月28日,第三屆全國兵棋推演大賽人機挑戰賽暨首屆全國智能博弈論壇在火熱的氛圍中落下帷幕,來自軍地科研院所、院校、國防軍工企業和智能博弈領域的260余位專家、學者觀摩了比賽盛況并參加了論壇交流。
所謂“人機挑戰賽”,即人類選手與AI智能體的對戰。本次挑戰賽的兵棋AI智能體——“戰顱”由國防科技大學系統工程學院研制;參加挑戰的人類選手是通過全國兵棋推演大賽總決賽篩選出的11名優秀選手。比賽吸引了眾多與會人員的關注,大家帶著強烈的好奇心爭相目睹“人與人工智能”的精彩對決。
比賽當日,國內眾多智能博弈與兵棋領域的專家蒞臨現場觀摩,中國指揮與控制學會監事長、中國工程院戴浩院士等嘉賓現場觀摩了比賽并致辭。比賽開幕式由中國指揮與控制學會理事劉忠教授主持。全國兵棋推演大賽總導演兼總裁判長楊南征、“戰顱”首席設計師馮旸赫、優秀參賽選手代表呂峒臻作為點評嘉賓,對現場比賽進行了精彩講解和點評。
比賽開始前,大賽總導演兼總裁判長楊南征介紹說,“戰顱”在賽前已經與全國兵棋推演大賽總決賽前48名的選手對戰了36場,目前保持全勝。本次人機對抗賽特別邀請了獲得全國賽特等獎、一等獎、二等獎的11名優秀選手分別挑戰智能體,將為我們帶來22場精彩對決。對于比賽結果,他更希望人類選手能夠挑戰成功。
經過1個半小時的緊張角逐,“戰顱”以全勝戰績贏得了冠軍。馮旸赫表示,“戰顱”的研發基于智能系統工程思想,融合知識推理、監督學習、半監督學習、集成學習和強化學習等一系列方法構建智能決策模型,充分利用人人對抗產生的優質數據和機機自打產生的大數據對智能體進行訓練。截止參賽,“戰顱”一共訓練了136天,每天一個計算節點大約自打160盤。據悉,“戰顱”的主創人員是國防科大一群平均年齡僅24歲的碩士生博士生,該智能體是他們集中攻關4個多月的智慧結晶。
中國指揮與控制學會智能博弈與兵棋推演專委會主任委員黃金才教授表示,從近一個月的參賽表現看,智能體不僅學會了一些人類選手的經典戰法,還獨創了部分特有的戰法戰術。當然,從比賽中也可以看出“戰顱”目前還存在很多局限性,這次戰勝人類選手也只是智能博弈技術在實踐應用中邁出的第一步,他表示,將帶領研發團隊進一步探索智能博弈的“無人區”,構建具有持續學習能力的智能體。
在11位人類挑戰者中,來自軍地院校的王俊翔、武煜強、余雷脫穎而出,成為人類選手的“前三甲”。三位選手在賽后采訪時表示,“戰顱”的優點是數據分析、學習能力強,能針對人類選手的操作、根據實時態勢改變應對策略,擅長精算、細算;而人類選手可以通過奇策奇招,針對“戰顱”的策略漏洞進行針對性打擊。
針對此次大賽的結果,劉忠教授表示,AI的獲勝并不代表人工智能技術在任務規劃領域超越了人類,AI智能體是在人類智慧的基礎上研發出來的,特別是在智能博弈領域,人工智能的學習效率及泛化性還有待提高,針對智能指揮與控制,要推動智能博弈技術從實驗室走向實踐應用,仍需砥礪前行。
在下午舉辦的首屆全國智能博弈論壇上,來自兵棋推演、智能指控、機器學習等領域的四位專家分別圍繞“兵棋推演的前世今生”、“智能指揮控制的實踐與思考”、“多智能體強化學習中的博弈與均衡”、“面向星際爭霸的大規模智能體訓練技術”等四個主題做了精彩報告,為現場觀眾帶來了一場智能博弈與兵棋推演的“學術盛宴”。
本次人機挑戰賽作為中國指揮與控制學會主辦的2019第三屆全國兵棋推演大賽的一項專題賽事,由國防科技大學系統工程學院和CICC智能博弈與兵棋推演專業委員會協辦,活動得到了中國電科五十二研究所、北京華戍防務技術有限公司等單位的大力支持。隨著AlphaGo、AlphaStar等不斷攻破人類智能高地,人工智能發展將對各行各業產生沖擊甚至顛覆性影響。本次“人機挑戰賽”作為探索智能博弈新方法、國防教育新模式的有效手段和載體,必將對人工智能技術的實踐應用產生重要影響。