12月13日下午,ok138太阳集团中国官方网站通过在线视频的方式举行了“崇德管理论坛”第十期学术交流活动。中南大学商学院博导施文教授应邀为广大师生作题为《Estimating the maximum mean: An upper confidence bounded approach》的辅导报告。
报告中,施教授介绍,如何估计多种决策随机方案中最优决策的绩效值一直是MS/OR和强化学习的重要问题。该问题在诸如马尔可夫决策过程(Fu,2017)和风险管理(Lesnevski等,2007)等领域都有非常广泛的应用。本文首次在机器学习Multiarmed bandit(MAB)的Upper confidence bound(UCB)框架下解决该问题。一般化原有的UCB的Exploration & Exploitation的平衡机制,给出了Exploration迭代的更快范围;在新的平衡机制下,证明了最优系统的仿真成本分配比例渐进收敛于1,而次优系统的渐进收敛于0;提出的大平均估计量(GA)的性质空白,给出了GA的强一致性、中心极限定理以及均方差;提出了一个自适应的最大分配比例估计量(LSA),并且也证明了同样的性质。
专家简介:
施文,中南大学商学院教授、博导,荷兰蒂尔堡大学、美国匹兹堡大学Katz商学院和香港城市大学商学院访问学者。主要研究领域为大数据分析、机器学习与文本挖掘、系统仿真及其在汽车召回/物流管理中的应用等。以第一作者身份在包括国际商学院公认的顶级期刊INFORMS Journal on Computing (UT Dallas 24),国际权威/主流期刊Naval Research Logistics、European Journal of Operational Research、Transportation Research Part A:Policy and Practice、 Reliability Engineering and System Safety、Simulation Modelling Practice and Theory以及国家自然科学基金委A类期刊《管理科学学报》《系统工程理论与实践》《科研管理》和《系统工程学报》等发表论文40余篇。
主持了包括国家自然科学基金青年项目、面上项目、博士后基金、省部级及各类项目7项,参与17项;曾获得省级人文社科优秀成果奖(最高等级A),校级优秀论文特等奖(全校共2人)和一等奖(全校共4人)等,获中国物流年会优秀论文二等奖2次和三等奖1次。
指导员工获中国高校大数据挑战赛全国一等奖、省级“互联网+”大赛一等奖、省级优秀本科学位论文。