AIDota2浜虹被楂锛浣藉琚棰浜_冬镜品知网

【摘要】AIDota2浜虹被楂锛浣藉琚棰浜...

哄锛绉腑

朵锛宠タ绉ヤ骇涓绌堕 Chubbler

讹涓界瀛㈣绠虹缁淇℃腑蹇

杩锛AI遍姒杩浣骇版ㄥぇ瀹堕娓浜浜哄伐鸿解垮娉锛AlphaGo锛浜虹被涓ゅぇ椤跺妫冲浜瀹锛骞跺濮娓娣″涔讹811ワ卞路椹锛Elon Musk锛虹涓浣AI瀹垛OpenAI Bot楂璋哄腑浜Dota2介璇疯The International锛锛骞跺1v1姣璧涓涓灞姣璧寮虹涔锛灏辫浜涔扮褰Dota2椤剁骇涓瀹Danylo Ishutin锛缁板Dendi锛濯浣褰冲楦块Dota2烘寮琚瀹ｅ娌枫

锛Dendi涓OpenAI Bot涓绾锛剧捐疯棰锛

浜讹璋锋DeepMind撮ū涔涔哄瑰０娆茶缁AI浜2涓椤剁骇瀹躲

浜哄伐鸿戒唬琛ㄧ璁＄洪灞堕癸ㄥ琛涓锋娼搴ㄤ环硷浣涓惧锛杩骞存ユ伴讳腑洪棰楂AI锛浜哄伐鸿斤村寰诲绫绘父绯诲ㄤ璧凤浠缁妫绫绘父璞℃存寰峰锛扮靛娓告Dota锛锛璧杞欢寮绮捐变技涔绘变汉绫荤娲诲崇郴骞朵瀵娓告ユ锛杩寮锛濡AlphaGo杩风娓告AI锛ㄥū涔涓浣挎浠璇稿浜虹被涓汉宸ユ鸿界崇郴浜哄伐鸿界灞瑰涓ョ娣卞ゥ绉瀛插

ｄヤ锛涓轰AI寮昏浠ユ父负ョ瑰

姝ｅAlphaGo涔讹璋锋涓DeepMindCEOㄦ璇达娓告璇AI绠娉瀹缇钩锛杩璁版涓瀛ㄦ璇樊锛藉瀹藉苟琛娴璇锛骞朵杩借褰姣釜浠ラ杩灞

"Games are the perfect platform for testing AI algorithms. There's unlimited training data, no testing bias, parallel testing, and you can record measurable progress."

-- Demis Hassabis, CEO and co-founder of DeepMind

锛AI绌惰涓父崇郴锛剧ヨ缁锛

辨瑙锛涓惰AI 绌惰辫烦娓告锛涓濡璇存父骞冲楂瀹ㄥ娴杩琛澧灏辨负AI 绌惰璺冲渚濡锛ㄥㄨㄩ┚椹剁郴缁涓浠ヨㄨ氦蹇AI讹涓轰垮ㄧ瀹澧涓琛娴璇涓烘甯哥杞琛浜洪版帮】澶у锛Princeton University锛绌跺㈤村惧浜╁ㄣ渚杞锛Grand Theft Auto锛娓告腑瀵AI璇氦蹇藉杩琛寮娴璇

辨瑙锛ㄨ浜娓告腑虹AI锛舵杩涓浠灞浜耽寰姣璧韩锛抽杩AI绠娉寮锛璁╁跺汉涓蜂浠峰澶绉藉锛杩煎疯瀛杩藉锛╃ㄥ剁娉涓轰汉绫诲烘村璐＄

浜瀹涓锛2014骞翠互ワ杩缁妇ㄦ父AI绔璧锛General Video Game AI Competition锛GVG-AI Competition锛稿灏辨璇AI瑙ｅ冲绉藉ㄨ椤规璧涓AI 瑕ㄦョ10娆Atari娓告腑瀵规骞跺涔濡浣璧㈠姣璧

姝ｅ垮娉ㄧ姝ｈ琛浜烘哄寮涔锛杩琛杩版瀵瑰涓凤娓告AI瀵规骞朵灞浜汉绫伙涓㈤寮娓告AI涔达虫涓父AI韩藉浠ヨ琛瀵瑰

锛浼缁淇缃瑰娓告宸涓GVG-AI绔璧涓AI涔寸淇缃瑰姣璧锛锛锛剧ヨ缁锛

浠ヨ锛AI寮藉ㄧ浠涔娓告

AI涓灞锛AI借琛绔ф父村澶澶骞夸涓ヨ锛绔х靛娓告涓轰袱绉绫诲锛瀹ㄤ俊寮锛complete information game锛娓告涓瀹ㄤ俊寮锛Incomplete information game锛娓告

瀹ㄤ俊寮娓告ㄨ绫绘父腑锛姣涓涓芥ユ朵涓瑰绛ラ寰芥扮归㈢纭俊寮锛灏村艾涓澶辩ぜ缈昏锛宸辨圭藉硷姝ㄧ郴缁锛界郴缁绛稿充俊借寮瀵规瀹ㄦ锛涔浜躲褰讹杩骞朵浣灏瑕浣垮虹娉ㄥ烘涔灏辫借瀵规归ワ浣戒娇烘寮〃涓娉瀵规充究ユ浣ㄩㄥ烘斤轰涔锛浣跺轰舵规轰褰㈠块哄锛告惰ㄧ锛

稿瀹ㄤ俊寮娓告涔澶┖渚电ヨ琛3璞℃绛绛杩琛杩绫绘父讹涓や釜瀹跺变韩涓涓锛扮婚㈠ㄥ姝ャ

锛瀹ㄤ俊寮娓告剧ヨ缁锛

涓瀹ㄤ俊寮锛瀵瑰朵涓汉瑰绛ョ┖村剁芥颁俊瑙ｇ涓澶纭涓涓汉瑰绛ョ┖村剁芥伴芥纭淇℃ㄨ绉典杩琛寮灏辨瀹ㄤ俊寮锛灏村艾涓澶辩ぜ缁х画缈昏锛瀹跺界ラ宸辨癸充浠繁锛姝ｅㄨ琛浣锛瀵逛圭瀹剁典ユ涓ㄥ稿渚瀛灏辨RTS娓告腑浜杩烽撅war fog锛璁╃瀹跺苟涓界存瀵规ㄦ锛瀵规╂村佃绾х寰寰电告ｄ绘界姝ｆ寮璋搴锛

稿涓瀹ㄤ俊寮娓告CS:GODota绛虫舵ワRTS锛绗浜虹О灏绘父

锛涓瀹ㄤ俊寮锛剧ヨ缁锛

充娇杩娓告楠锛瀹朵界板ㄤ俊寮褰娓告AI寮惧害瑕杩杩浣瀹ㄤ俊寮璀锛ㄦ绫绘父腑锛娓告AI涓汉绫荤瀹跺变韩稿灞匡涓翠稿绠娉锛AI瓒寮鸿绠藉灏辨浜ㄦ涔般AlphaGoㄤ瀵规涓烘淮姘翠婕婚诧灞绀哄哄宠濡涔灏变瓒充负濂浜

AlphaGo杩烽搴娓告AI虹涔浜虹被存轰腑璋库姒蹇典借涓哄浜库杩风涔舵璇存锛瀹涓ㄦ楗颁汉绫诲ぇ杩绠藉娉村灞㈢绐杩瀵逛AIヨ锛浜汉绫昏瑷濡杩烽句妫灞戒杩腑澶ㄥ杩琛涓撼绉宸层

ㄦ父AI绔璧涓澶娆Atari娓告藉浜ㄤ俊寮ㄨ浜娓告腑锛澶搴楂娆炬父AI浠杈句板昏触浜虹被瀹剁姘村钩ㄥ朵涓浜瑙稿绠娓告腑锛濡涔澶┖渚电ヨ娓告锛浜虹被瀹跺凡缁涓AI瀵规

ㄨ浜娓告腑锛AI浣琚骞朵锛涓姝ユ昏触浜虹被

姣杈娴琛ㄦ父AI璁瑰互2013骞NIPS涓琛ㄧ锛充繁搴Q缃缁锛Deep Q-Learning Network, DQN锛涓哄虹寮哄瀛锛Reinforcement Learning锛娣卞害绁缁缁锛Deep Neural Network,DNN锛缁涓袱绡腑璇瑙ｉ锛杩浠浠ャ涔涓轰绠瑕浠缁

?Playing Atari with Deep Reinforcement Learning. ArXiv 锛2013锛

?Human?level control through deep reinforcement learning. Nature 锛2015锛

棣锛绠瑕浠缁涓涓ュ寮哄瀛娣卞害绁缁缁

寮哄瀛锛Reinforcement Learning锛哄ㄤ汉锛浠ョ瑙ｄ负AI锛ㄤ澧浜や涓规寰濂辨╃锛涓琛瀛涓绉哄ㄥ涔瑰

锛寮哄瀛绀烘撅

濡炬绀猴浠澧涓哄ㄤ汉浼涓板扮舵锛State锛濂憋Reward锛杩涓ㄧ╁涔甯哥被浼笺涓寮濮锛哄ㄤ汉涓ラ澧浼瀵逛琛涓哄轰涔风搴锛浠浠澧涓瑙瀵舵锛杩灏辨涓圭澶磋〃绀虹ワPerception锛澧藉规哄ㄤ汉琛涓哄棣缁瀹涓涓便

渚濡ㄣ涔涓涓绉诲ㄥ诲锛濡瀵规娌℃浣氨浼澧涓锛ｄ杩涓姝ョ濂卞氨硷涔锛濂变负璐笺澶ャ琛ㄥ濂辩杩绋灏卞舰涓涓己瀛浜や娴绋锛AIㄨ绉浜や涓姝ｈ繁琛涓猴浠瀵圭澧烘浣崇搴瀵广

娣卞害绁缁缁锛Deep Neural Network,DNN锛锛涔琚О涓烘繁搴涔锛朵骇ユ浜瀛浠ā浜鸿涓缁涔翠淇″规寮虹哄ㄥ涔浠ユ浜哄伐鸿藉锛

浼ㄧワ浜鸿涓缁缁1000浜垮涓缁锛崇缁锛锛涓绁缁涔撮杩绐瑙褰兼歌ㄨ涔涓姣釜绁缁瑕舵ヨ颁釜涓磋绁缁浼ョ淇″锛杈1锛杈2锛杈3锛杩琛村锛缁琚扳杈哄锛灏绁缁缁缁缁杈虹ㄦ枫

辨瑙锛绁缁璁＄瀵规版璇澶锛锛缁杈哄锋冲抽瑕浣ㄨ绠洪锛杩涓腑存楠よ绉颁负缃缁

锛绁缁/娣卞害绁缁缁宸ヤ锛剧ヨ缁锛

娣卞害绁缁缁涓己瀛搴虫繁搴Q缃缁妯″锛娣卞害寮哄瀛锛渚濡锛ㄣ涔涓繁搴Q缃缁绠ユ绋锛杈ユ父濮婚缁杈烘ㄤ杈虹┖淬渚濡锛ㄣ涔涓╀绉伙Up锛涓绉伙Down锛涓Stay锛姒

锛娣卞害Q缃缁娴绋撅剧ヨhttps://blog.openai.com锛锛

濡锛Deepmind2013骞存虹涓涓翠负澶娣卞害Q缃缁缃缁缁杈ユ缁4甯ф父濮婚杈烘ㄤ挎剁Q锛涓翠负涓や釜风Н灞锛Convolutional Layer锛涓や釜ㄨ灞锛Fully Connected Layer锛

锛DQN缃缁缁撅剧ヨhttp://www.teach.cs.toronto.edu锛锛

浠板澶达涓涓杩娆Dota2浜烘哄瑙棰姣璧璺浠宸茬害涓ゅㄧ堕达OpenAI缁浜Dota AI涓浜姣璧缁锛涓杩杩淇锛骞舵ㄩㄧ锛涓杩浠浠ヤ娑腑娴涓浜锛

1.Dota瀹ㄤ俊寮锛瀹跺苟涓界磋寰瀵规浣缃娲诲ㄤ俊杩浣垮姣姝ョ崇芥ㄥ锋涓纭х′欢涓虹

2.AI哄ㄤ汉骞朵藉浜渚绫讳技涓绉诲ㄢ杩风寰浣蹇椤绘寰浣杞㈣缁瀹ㄤ娴绋锛灏卞璧瑙棰涓″垫浣

3.Dota哄ㄤ汉锛multi-agent锛浣寮锛杩AI棰锋хㄥ

4.浣跨ㄩ凤杩娑伴挎瑙绛ャ

OpenAI Bot╀1v1瀵规妯″绠舵ㄤ帮available actions锛舵绌洪达state space锛般ㄨ舵′欢涓锛瀵规抽负介╁绛ワ骞朵娑伴挎瑙澶哄ㄤ汉涔灏辨瀵规澧璁剧疆村绫讳技浜琛搞涓绫荤兼娓告涓姝ｇ虫舵ャ

锛涓浜界AI杈ヤ俊

煎娉ㄦ濡灏娓告缃负虫舵ワRTS锛妯″浠ョ锛灏辩OepnAI跺烘锛 OpenAI Bot杩揪浜虹被姘村钩变娉椴妫у娉藉灞э瀹杩娉汉绫荤瀹朵蜂ュ共瀵瑰涓惧板寮辩瑰苟浠ラ瀵广灏卞Deepmindㄥ婧2浜哄伐鸿藉涔澧锛SC2LE锛涓虹ｆ凤舵锛AI杩涓峰ㄥ虫舵ワRTS锛娓告腑瀵规浜虹被瀹剁藉

锛OpenAI Bot琚缈50浣娆★

浠缁妫绫绘父璞℃存寰峰锛扮稿靛娓告DotaCS锛锛AIㄥ浜涔ㄩㄧ妫绫绘父灏榄几浜虫舵ユ父浜虹被杩藉ㄥ澶х搴寤剁AI诲匡虫舵ユ父舵浼ㄩ㈡拨凤瀹ㄤ俊寮娓告涓浜浜虹被烘х楂搴濡涓ゅ戒氦锛ュ㈢绉绉绛モ璇辨娣卞ャ濂琚撮璧点璐兼澹颁昏タ澶╄娴封藉浠ュDota浠ュCS涓惧板搴褰卞

濡涓澶╋AI涔戒骇璋モ锛汉绫讳疯绛瑰阜骞绾垫í锛绫讳技靛奖缁缁绯诲涓ユ富鸿藉苟村浜浜虹被AI澶╃界炽ㄤAIц姐搴ㄩ讹浜虹被杩涓浜哄伐鸿界灞瑰浠ュ浜虹被涓汉宸ユ鸿界ャ

1.Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller. Playing Atari With Deep Reinforcement Learning. NIPS Deep Learning Workshop, 2013.

2.Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Andrei A. Rusu, Joel Veness, Marc G. Bellemare, Alex Graves, Martin Riedmiller, Andreas K. Fidjeland, Georg Ostrovski, Stig Petersen, Charles Beattie, Amir Sadik, Ioannis Antonoglou, Helen King, Dharshan Kumaran, Daan Wierstra, Shane Legg, Demis Hassabis. Human-level Control through Deep Reinforcement Learning. Nature, 518: 529533, 2015.

3.PySC2 - StarCraft II Learning Environment. https://github.com/deepmind/pysc2

4.Dota Bot Scripting - API Reference. https://developer.valvesoftware.com/wiki/Dota_Bot_Scripting_-_API_Referenc

绉腑解腑界哄绀句瑰╃ㄤ俊娈靛灞绉瀛绉瀛濞

辩腑借浣哄锛杞浇璇锋敞哄

AIDota2浜虹被楂锛浣藉琚棰浜

热门文章推荐

涓界瑙