知行编程网知行编程网  2022-03-05 11:00 知行编程网 隐藏边栏 |   抢沙发  3 
文章评分 0 次,平均分 0.0

「强化学习简介」一份来自微软亚研的130PPT教程

【导读】近年来,强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功,成为人工智能研究的热点。 微软亚洲研究院的秦涛研究员在报告《强化学习简介》中对强化学习做一个简要介绍。


报告内容


该报告分为3个部分:

  1. 强化学习基础,包括:

    • 马氏决策过程

    • Bellman方程

    • 规划

    • 最优控制

    • 蒙特卡洛采样

    • TD算法

  2. 强化学习新算法,包括:

    • 基于值函数的算法

    • 基于策略函数的算法    

    • 基于两者的混合算法

  3. 强化学习所面临的挑战,如鲁棒性、样本效率等


讲者简介


秦涛 博士,微软亚洲研究院资深研究员/经理,中国科学技术大学博士生导师。主要研究领域包括机器学习和人工智能(深度学习和强化学习的算法设计、理论分析及在实际问题中的应用),互联网搜索与计算广告,博弈论和多智能体系统,在国际会议和期刊上发表学术论文100余篇。曾任SIGIR、ACML、AAMAS领域主席,担任多个国际学术大会程序委员会成员,包括ICML、NIPS、KDD、IJCAI、AAAI、WSDM、EC、SIGIR、AAMAS、WINE,曾任多个国际学术研讨会联合主席。获得《北京青年》2017年度年度“工匠精神·青年榜样”奖。


资源获取方式:

  • 点击“阅读原文”下载资源

  • 或在输入关键词“MSRARLT4”获取下载链接


附部分PPT

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

「强化学习简介」一份来自微软亚研的130PPT教程

— 转自 专知 

为您推荐

【博文推荐】10月机器学习Top 10 文章/教程汇总

你可能需要一份《深度学习500问》

Github 2.2K星的超全PyTorch资源列表

【思考】正态分布为什么常见?

称霸Kaggle的十大深度学习技巧

本篇文章来源于: 深度学习这件小事

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享