知行编程网知行编程网  2022-06-16 12:00 知行编程网 隐藏边栏 |   抢沙发  4 
文章评分 0 次,平均分 0.0

神经网络变成小怪兽,还能互相 battle!这款游戏用最简单的方式训练神经网络

转自 | 机器之心   编辑 | 魔王

在游戏里训练「神经网络小怪兽」,学习强化学习!


想了解神经网络,但不知道如何入手?教程太枯燥,论文不好懂?

别怕,这里有款多人在线战术竞技游戏(MOBA),让你在西部牛仔的世界中训练自己的神经网络。在这里,所有「智能体」都是类似怪兽的生物,还有武器!

神经网络变成小怪兽,还能互相 battle!这款游戏用最简单的方式训练神经网络

故事的背景是:Derk 博士想要创建一个具备「神经网络」大脑的生物。

这款名为「Dr. Derk's Mutant Battlegrounds」的游戏是一个基于 AI 的实验性游戏。玩家的任务是武装自己的小怪兽(Derkling)并训练,与其他玩家进行 battle。

而这些小怪兽其实是货真价实的 AI:循环神经网络(RNN)。它具备 30 个输入、12 个输出、32 个记忆插槽(memory slot)、1 个隐藏层和 3000 多个参数,能够「看到」30 多项事物,还能自主决策。

神经网络变成小怪兽,还能互相 battle!这款游戏用最简单的方式训练神经网络


 哇,神经网络这么 cute 吗!是不是很想赋予它超能力?

闯关和 battle 胜利,你就可以升级小怪兽的能力和装备!而这对玩家的挑战在于:选择最好的装备和训练策略。

在这个游戏环境中,有大量策略可供探索,玩家可以教小怪兽进行大量尝试。比如教它们如何治疗上单,穿过敌人的队伍直达敌军老巢(雕像),或者戏耍对手…… 玩家可以在这里尽情尝试和探索不同的策略。

神经网络变成小怪兽,还能互相 battle!这款游戏用最简单的方式训练神经网络

经过多次迭代,小怪兽终于直达敌军老巢,干掉了敌方的雕像。

神经网络变成小怪兽,还能互相 battle!这款游戏用最简单的方式训练神经网络

小怪兽升级装备了,有枪!

神经网络变成小怪兽,还能互相 battle!这款游戏用最简单的方式训练神经网络

这次不再是与游戏内置的 boss 对战,而是玩家团战。看起来战况很激烈!

Derk 博士使用了哪些技术,帮助小怪兽成长

就整体技术而言,这款游戏使用的技术类似于 OpenAI Five。OpenAI Five 两年前打败了 Dota 2 人类玩家,不过这款游戏中的小怪兽的脑袋远不如「OpenAI Five」那么强悍。

此外,这款游戏的技术细节还包括:

  • 小怪兽通过 GA 在并行运行的 128 个「竞技场」(arenas)上进行训练;

  • 所有的模拟和神经网络均在 GPU 上运行,方便快速获取结果(在一台性能不错的计算机上 1 分钟内即可训练 200 代);

  • 智能体可以和游戏内置机器人 PK,也可以互相 battle(自对弈),或者将这两者结合起来;

  • 对于想要深度挖掘小怪兽的「大脑」,充分理解其行为的人而言,这款游戏提供了不错的可视化效果。


目前,这款游戏已发布到 Steam。

参考链接:

https://www.reddit.com/r/MachineLearning/comments/i1o8m0/p_i_created_a_game_for_learning_rl/
https://www.youtube.com/watch?time_continue=27&v=-Lqb8cce5tk&feature=emb_logo
https://derkgame.com


<section style="white-space: normal;line-height: 1.75em;text-align: center;"><strong style="color: rgb(0, 0, 0);font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;widows: 1;background-color: rgb(255, 255, 255);font-size: 16px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;box-sizing: border-box !important;overflow-wrap: break-word !important;">—</span></strong>完<strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;box-sizing: border-box !important;overflow-wrap: break-word !important;">—</span></strong></span></strong></span></strong></section><pre><pre style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;letter-spacing: 0.544px;white-space: normal;font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;widows: 1;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section><section style="margin-bottom: 15px;padding-right: 0em;padding-left: 0em;max-width: 100%;color: rgb(127, 127, 127);font-size: 12px;font-family: sans-serif;line-height: 25.5938px;letter-spacing: 3px;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(0, 0, 0);box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-size: 16px;font-family: 微软雅黑;caret-color: red;box-sizing: border-box !important;overflow-wrap: break-word !important;">为您推荐</span></strong></span></section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;">长尾分布下图像分类问题最新综述(2019-2020)</section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 14px;">LSTM终获正名,获IEEE 2021神经网络先驱奖!</span><br  /></section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;">特朗普拿H1B签证开刀,LeCun吴恩达等实名谴责!</section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;">数据分析入门常用的23个牛逼Pandas代码</section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="color: rgb(87, 107, 149);font-size: 14px;">如何在科研论文中画出漂亮的插图?</span><br  /></section></section></section></section></section></section></section></section></section>
神经网络变成小怪兽,还能互相 battle!这款游戏用最简单的方式训练神经网络

本篇文章来源于: 深度学习这件小事

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享