「强化学习简介」一份来自微软亚研的130PPT教程

知行编程网 2022-03-05 11:00 知行编程网 | 隐藏边栏 | 抢沙发 | 3 0

文章评分 0 次，平均分 0.0 ：

【导读】近年来，强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功，成为人工智能研究的热点。微软亚洲研究院的秦涛研究员在报告《强化学习简介》中对强化学习做一个简要介绍。

报告内容

该报告分为3个部分：

强化学习基础，包括:

马氏决策过程
Bellman方程
规划
最优控制
蒙特卡洛采样
TD算法

强化学习新算法，包括:

基于值函数的算法
基于策略函数的算法
基于两者的混合算法

强化学习所面临的挑战，如鲁棒性、样本效率等

讲者简介

秦涛博士，微软亚洲研究院资深研究员/经理，中国科学技术大学博士生导师。主要研究领域包括机器学习和人工智能（深度学习和强化学习的算法设计、理论分析及在实际问题中的应用），互联网搜索与计算广告，博弈论和多智能体系统，在国际会议和期刊上发表学术论文100余篇。曾任SIGIR、ACML、AAMAS领域主席，担任多个国际学术大会程序委员会成员，包括ICML、NIPS、KDD、IJCAI、AAAI、WSDM、EC、SIGIR、AAMAS、WINE，曾任多个国际学术研讨会联合主席。获得《北京青年》2017年度年度“工匠精神·青年榜样”奖。

资源获取方式：