「CV研究合辑」,是智东西公开(kai)课针对计(ji)算机视觉(jue)推出的(de)一档合辑,聚焦于计(ji)算机视觉(jue)前沿领域研究成(cheng)果与进展(zhan)的(de)讲(jiang)(jiang)解。每一讲(jiang)(jiang)由主(zhu)讲(jiang)(jiang)与答疑(yi)两个环节组成(cheng),其中,主(zhu)讲(jiang)(jiang)60分钟(zhong)(zhong),采用视频直播形式,答疑(yi)30分钟(zhong)(zhong),将在相应交流群进行。

我们(men)都知道,机器(qi)学(xue)(xue)(xue)习(xi)(xi)(xi)方(fang)法(fa)主(zhu)要可以分(fen)为四类(lei),监(jian)督(du)学(xue)(xue)(xue)习(xi)(xi)(xi)、半(ban)监(jian)督(du)学(xue)(xue)(xue)习(xi)(xi)(xi)、无监(jian)督(du)学(xue)(xue)(xue)习(xi)(xi)(xi)、以及强(qiang)化学(xue)(xue)(xue)习(xi)(xi)(xi)。不同于连接主(zhu)义的(de)监(jian)督(du)学(xue)(xue)(xue)习(xi)(xi)(xi)方(fang)法(fa),强(qiang)化学(xue)(xue)(xue)习(xi)(xi)(xi)是智能(neng)体通过与环境的(de)交互,观测交互结果以及获得(de)相应的(de)回报。这种学(xue)(xue)(xue)习(xi)(xi)(xi)的(de)方(fang)式(shi)是模拟人或动物的(de)一种学(xue)(xue)(xue)习(xi)(xi)(xi)方(fang)式(shi),因此强(qiang)化学(xue)(xue)(xue)习(xi)(xi)(xi)在机器(qi)人领域有着广泛的(de)应用。

传(chuan)统(tong)的强(qiang)化学(xue)习局限于动(dong)作(zuo)空间和样本空间都(dou)很小,且一般是离(li)散(san)的情境下(xia)。然而实际情况的任(ren)务(wu)则往往有着很大的状(zhuang)态空间和连(lian)续的动(dong)作(zuo)空间。当(dang)输入数据为图(tu)像,声音时,往往具有很高维(wei)度(du),传(chuan)统(tong)的强(qiang)化学(xue)习很难处理,此(ci)时就需要结合(he)深度(du)学(xue)习的方(fang)(fang)法,将高纬度(du)数据进行(xing)降维(wei)处理,即深度(du)强(qiang)化学(xue)习方(fang)(fang)法。

然而深度强化学习到底是什么样的方法,又有哪些应用,尤其在机器人领域又有怎样的进展呢?北京时间4月11日上午10点(硅谷时间4月10日晚7点、宾夕法尼亚州时间4月10日晚10点),智(zhi)东西公开课「CV研究合辑」第(di)3讲直播开讲,由卡内基梅隆大学博士胡亚飞(fei)和轻舟智(zhi)航高级(ji)感(gan)知工程师(shi)陈钰,为大家讲解《深(shen)度强化学习在机器人(ren)领域的研究》。

胡亚飞是卡内基(ji)梅隆大学博士,目(mu)前在计算(suan)机(ji)(ji)学院下的机(ji)(ji)器人(ren)系(xi)进行研究工作,主(zhu)要研究方(fang)向为动态(tai)场景下的视觉SLAM(包括(kuo)深度学习方(fang)法和传统几何方(fang)法)、强化学习在机(ji)(ji)器人(ren)决策(ce)与(yu)规划中(zhong)的应用以及2D/3D多目(mu)标跟(gen)踪等问题。他曾任ICRA, Autonomous Robot审稿人(ren)。

陈钰是轻舟智航(hang)高级感知工程师(shi),工作内(nei)容(rong)主要是多传(chuan)感器融合的追踪(zong);卡(ka)内(nei)基梅隆大学(xue)电子与计(ji)算机(ji)工程硕士、中(zhong)山大学(xue)数据科学(xue)与计(ji)算机(ji)学(xue)院(yuan)本(ben)科;曾(ceng)在(zai)(zai)阿里(li)巴巴达(da)摩院(yuan)机(ji)器智能部(bu)门、瑞芯微电子核心算法部(bu)门实习,有(you)多项美(mei)国专(zhuan)利;在(zai)(zai)CMU MLD Katerina Fragkiadaki实验室做研究助理;在(zai)(zai)知乎上撰写了深度学(xue)习专(zhuan)栏:CMU 10-703 深度强(qiang)化学(xue)习笔记(ji)。

CV研究合辑(ji)」此前已(yi)经完结两讲(jiang)(jiang)(jiang)。第一讲(jiang)(jiang)(jiang)由(you)(you)电子科技大学李文教授主讲(jiang)(jiang)(jiang),主题为《领(ling)域适应在计(ji)算机视觉中的研究和(he)应用(yong)》;第二讲(jiang)(jiang)(jiang)是由(you)(you)小牛动(dong)漫(man)资深算法工程师卢薇薇主讲(jiang)(jiang)(jiang)的《生成(cheng)式对抗网(wang)络GAN在动(dong)漫(man)领(ling)域的应用(yong)》。更(geng)多讲(jiang)(jiang)(jiang)次也已(yi)陆续(xu)敲定,会(hui)尽快公布。敬请期待(dai)。

直播信息

直播时间:4月11日10:00-11:30(北京时间)
直播平台:智东西公开课小程序
答疑地址:强化学习交流群(qun)

课程内容

主题:深度强化(hua)学习在机(ji)器人领域的研究

提纲:

1、深度强化学习的研究进展
2、深度强化学习在机器人领域的应用
3、仿真器如何解决自动驾驶领域长尾问题
4、imitation learning快速学习可操作的驾驶策略
5、使(shi)用A3C,DDPG进行smart agent方面的研究

讲师介绍

胡(hu)亚飞,卡内(nei)基梅隆大学(xue)博士,目(mu)前在计算机学(xue)院下(xia)的(de)机器人(ren)(ren)系进行研究工作;主(zhu)要研究方向(xiang)为动态场景下(xia)的(de)视觉SLAM(包括(kuo)深度学(xue)习(xi)方法和传统几(ji)何方法),强(qiang)化学(xue)习(xi)在机器人(ren)(ren)决策与规划中(zhong)的(de)应用,以及2D/3D多目(mu)标跟踪等问(wen)题;曾任ICRA, Autonomous Robot审稿人(ren)(ren)。

陈钰,轻舟智航高级感知工程师(shi),工作内容主要是(shi)多传(chuan)感器融合的追(zhui)踪;卡(ka)内基梅隆大学(xue)(xue)电子与计(ji)算(suan)(suan)机工程硕士、中山大学(xue)(xue)数据科学(xue)(xue)与计(ji)算(suan)(suan)机学(xue)(xue)院本科;曾在(zai)阿里巴巴达摩(mo)院机器智能(neng)部(bu)门、瑞芯微电子核心(xin)算(suan)(suan)法部(bu)门实习,有多项美国专(zhuan)利;在(zai)CMU MLD Katerina Fragkiadaki实验室做研究助理;在(zai)知乎上撰写了深度学(xue)(xue)习专(zhuan)栏:  CMU 10-703 深度强化(hua)学(xue)(xue)习笔(bi)记。

申请入群

本次课程的讲解分为主(zhu)(zhu)讲和答(da)疑两部分,主(zhu)(zhu)讲以视频直(zhi)播形式,答(da)疑将在「强(qiang)化学习交流群(qun)」进行。

加入(ru)交(jiao)流(liu)群,除了(le)可以免费(fei)收听直播之外,还能认识讲师,与更多同行(xing)和同学一起学习,并进(jin)行(xing)深度(du)讨论。

扫码添加小(xiao)(xiao)助手(shou)小(xiao)(xiao)开(ID:hikai19)即可申(shen)请(qing),备注“姓名-公司/学校/单位-职位/专业(ye)”的朋友将会优先审核通过哦~