2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082 备案号:闽ICP备19027007号-6
本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。
谷歌的人工智能(AI)实验室DeepMind和游戏开发工作室暴雪宣布推出一系列旨在通过即时战略游戏星际争霸II加速人工智能研究的工具。
标有SC2LE的工具集包括暴雪的机器学习API; DeepMind的PySC2工具集的开源迭代; 一个65,000个匿名游戏重放的数据集,在接下来的几周内将扩展到超过500,000个,并将有助于模拟学习序列预测和长期记忆; 一套迷你游戏,用于测试特定星际争霸II任务的AI性能,例如收集矿物质,编制气体和选择单位; 以及一份概述环境和人工智能绩效初步基线结果的联合文件。
根据DeepMind研究科学家Oriol Vinyals,项目经理Stephen Gaffney和软件工程师Timo Ewalds 的博客文章,在非专为此类研究设计的游戏中测试人工智能,以及人类玩家优秀的“对于基准代理性能至关重要”。
“星际争霸的部分长寿归功于丰富的多层次游戏,这也使其成为人工智能研究的理想环境,”博客文章称。
“例如,虽然游戏的目标是击败对手,但玩家还必须执行和平衡一些子目标,例如收集资源或建筑结构。
“此外,游戏可能需要几分钟到一个小时才能完成,这意味着游戏早期采取的行动可能无法在很长一段时间内获得回报。最后,地图只是部分被观察到,这意味着代理商必须使用组合记忆和计划成功。“
他们补充说,星际争霸游戏中有大约1亿个可能的动作,而在Atari游戏中 - DeepMind也用于人工智能研究 - 只有300个基本动作。根据DeepMind的说法,游戏的受欢迎程度也意味着需要学习大量的重播数据,以及人工智能玩的大量反对者。
DeepMind表示它具有孤立的元素,包括单位类型,健康状况和地图可见性,将游戏分解为“功能层”,迷你游戏有助于为AI提供可管理的块来学习基本操作。
“我们最初的调查表明,我们的代理商在这些迷你游戏中表现良好。但是当涉及到整个游戏时,即使是最强大的内置AI,即使是强大的基线代理商,如A3C也无法赢得单一游戏,”博客帖子说,并补充说,一个代理人未能完成琐碎的任务,如保持其工人采矿。
“我们希望这些新工具的发布将建立在AI社区已经在星际争霸中完成的工作的基础上,鼓励更多的DeepRL研究,并使研究人员更容易专注于我们领域的前沿。”
DeepMind在11月份宣布它将使用星际争霸II作为人工智能和机器学习研究的测试平台,在全球范围内开放环境。
“我们与星际争霸II团队密切合作,开发了一个支持类似于之前使用'脚本'界面编写的机器人的API,允许对各个单元进行编程控制并访问完整的游戏状态(还有一些新选项) ),“ DeepMind当时说道。
“最终,代理将直接从像素中播放,所以为了让我们在那里,我们开发了一个新的基于图像的界面,输出简化的低分辨率RGB图像数据用于地图和小地图,以及将功能分解为单独的选项'层',如地形高度场,单位类型,单位健康等。“
因此,AI引擎必须利用记忆,绘图,长期规划的技能,并使用不断收集的信息来适应计划的变化,这转化为分层规划和强化学习。
DeepMind还使用Go等复杂游戏来测试AI,其中AI AlphaGo在5月击败了世界冠军科杰。
Go,一个源自的古老棋盘游戏,与10 ^ 120种可能的国际象棋游戏相比,有10 ^ 761种可能的游戏。
然后,DeepMind 退出AlphaGo,转而专注于使用AI创建先进的算法,以帮助科学家开发治疗疾病,减少能量消耗和发明新材料。
DeepMind正与英国Moorfields眼科医院和伦敦大学学院(UCLH)信托基金会合作,通过算法阅读扫描。它还与卫生服务部门合作,尝试使用机器学习计划对个别头颈癌患者使用放射治疗,这可以改善手术的等待时间,并为全国的医生腾出更多时间。
2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082 备案号:闽ICP备19027007号-6
本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。