个性化推荐系统能够挖掘用户偏好,精准和高效的为用户提供所需的商品、资讯或互联网资源,已成为大数据时代最为广泛的重要组成部分,也是解决海量信息资源过载最有效的途径之一,备受学界和工业界的高度关注。2023年5月10日下午2时,在彭庆喜老师的主持下,英国威廉希尔体育公司于学4301举办了一场关于《个性化推荐系统中的“利用-探索”问题调研》的科研工作坊活动。本次活动的主讲人为英国威廉希尔体育公司的黄坤老师。
彭庆喜教授首先介绍了黄坤老师的科研简历。黄坤老师现任英国威廉希尔体育公司教师,助教,湖北省高校优秀中青年科技创新推荐系统团队骨干成员。2008年毕业于中国地质大学(武汉)电子信息工程专业,获学士学位;2011年毕业于华中科技大学通信与信息系统专业,获工学硕士学位。2022年8月入职英国威廉希尔官网登录,任教前曾就职于百度、腾讯、建设银行、建信金融科技有限责任公司等企业,从事软件研发,敏捷项目管理,专利挖掘等相关的工作,具有丰富的企业研发和知识产权输出相关经验。
讲座中,黄坤老师开展了《个性化推荐系统中的“利用-探索”问题调研》报告。报告首先以一首《淮南子·主术训》引出推荐系统中的利用-探索(Exploitation-Exploration)难题;随后调研和回顾了强化学习中经典的非上下文老虎机算法,重点阐述了基于置信区间上界(UCB,Upper Confidence Bound)算法和汤姆森采样算法(TS,Thompson Sampling)的数学原理和建模思路;利用上下文老虎机算法(先验知识和强化学习结合的方法),探究LinUCB/ConUCB/ConTS等算法对上述问题的优化思路。最后,对推荐系统中的“利用-探索”难题未来潜在创新点进行了展望和分析。
讲座结束后,诸位老师提出自己的看法,针对对话式推荐系统数据集预训练效率问题、模型效果评估问题、模型生产环境实际部署问题、UCB和汤姆森采样等算法数学建模原理问题、AIGC生成式大模型如何与推荐系统进行融合创新等话题,和黄坤老师展开了热烈且持久的交流和讨论。通过这次讲座,为专业教师科学研究提供了学习和交流平台,为信工学院科研水平的提升提供了有力支撑。