12月9日晚,清华大学计算机系在自强科技楼13层报告厅举办2024年学生奖励大会暨钟士模奖学金评审会。
计算机系党政联席会全体成员、教师代表、杰出系友代表、企业代表等出席活动,钟士模奖学金候选人、国家奖学金得主、第六届1984级创新未来奖学金得主、其他系设奖学金得主及相关工作人员参加了会议。

系友刘怀宇学长(左一)、衣丰超学长(右一)
为获得“1984级创新未来奖学金”的学生颁奖

系友刘怀宇学长(左一)、衣丰超学长(右一)
为获得“1984级创新未来奖学金”的学生颁奖
奖励大会现场, 1984级系友、英诺天使基金管理合伙人刘怀宇学长、内蒙古科电数据服务有限公司总工程师衣丰超学长为本次获得1984级创新未来奖学金的9支优秀团队颁奖。
1984级创新未来奖学金设立于2019年,由1984级系友在清华大学计算机系60周年系庆时发起,旨在奖励计算机系做出突出科技或应用创新的研究生团体,每年奖励总金额为30万元,这也是清华大学首个以年级命名的奖学金项目。

第六届1984级创新未来奖学金终审合影
此前,清华大学计算机系第六届1984级创新未来奖学金终评答辩于11月17日自强楼举行,计算机系韩文弢老师、任丰原老师、苏航老师、李涓子老师、张立老师、冯建华老师、艾清遥老师;84级系友李竹学长(线上出席)、刘怀宇学长、衣丰超学长;以及英诺天使基金北京/西安基金合伙人王晟、水木清华校友种子基金合伙人丁昳婷学姐共11位嘉宾担任评委,以下为答辩现场详情:

第六届1984级创新未来奖学金评审嘉宾合影
第六届1984级创新未来奖学金评定结果
获奖 等级 | 团队 成员 | 项目名称 |
一等奖 | 刘世隆 | 多模态开放世界 检测感知模型 |
二等奖 | 张 丹 | 基于大模型自动获取推理 路径以优化奖励信号 和大模型自训练 |
二等奖 | 吴凌轩 刘松铭 | 双臂机器人扩散大模型 |
三等奖 | 张金涛王子腾胡越舟 | 大模型高效训练 与推理系统 |
三等奖 | 何 哲 李卓君王子轩 | 基于惯性传感的智能指环 手势交互技术 |
三等奖 | 李俊凯黎雍卉 李伟韬 | Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents |
三等奖 | 杨宗瀚刘子君 | 自我学习进化的 智能体系统 |
三等奖 | 程志立胡锦毅胡声鼎 | 面向多模态大模型的 具身智能体平台 |
三等奖 | 王子轩王浩宇黄 烁 | 以人为中心的高表现力 3D内容生成系统 |
以下为获奖项目详情:
一 等 奖

项目名称:多模态开放世界检测感知模型
团队成员:刘世隆
项目介绍:我们希望构建最强的开放世界检测模型。我们针对这一目标,对模型架构提出一系列改进、构建大规模数据集、提出新训练方案。
项目包括:1. DAB-DETR&DINO:设计并改进了基于Transformer的检测模型,最终第一次基于Transformer获得COCO榜单第一。2. Grounding DINO:构建大规模的开放世界数据集,并训练出了当前Hugging Face下载量最高的开放世界检测模型。3. LLaVA-Plus: 提出了新的多模态大模型增强方案,通过调用专家视觉模型提升大模型在检测等传统视觉任务的能力。
二 等 奖

项目名称:基于大模型自动获取推理路径以优化奖励信号和大模型自训练
团队成员:张 丹
项目介绍:针对大语言模型训练数据不足、训练模型依赖高成本人类标注与模型生成错误或无用结果等挑战,本项目研究开发一种新颖的方法自动获取语言模型生成的可靠推理路径,同时有效地利用奖励信号进行验证和语言模型自我训练。
包括:(1)提出了一个蒙特卡洛树搜索算法以自动标注中间节点的过程奖励,保证数据的多样性;(2)提出了一个过程奖励模型以准确计算推理步骤的奖励值,已保证获取高质量数据;(3)提出了一个自训练方法以同时训练策略模型和奖励模型。
二 等 奖

项目名称:双臂机器人扩散大模型
团队成员:吴凌轩,刘松铭
项目介绍:本项目构建全球首个针对双臂机器人操作任务的扩散基础模型——Robotics Diffusion Tranformer(RDT)。RDT 在多个高挑战性任务上展示出全球领先的泛化能力和操作精度,标志着机器人操作已实现从“小模型”到“大模型”,从“单臂”到“双臂”的飞跃。
三 等 奖

项目名称:大模型高效训练与推理系统
团队成员:张金涛,王子腾,胡越舟
项目介绍:本项目致力于构建高效的大模型训练与推理系统,针对大模型训练与推理成本高昂、计算瓶颈显著的问题,提出了多项技术创新,包括:(1)可微高效混合专家;(2)半结构化训练加速;(3)反向传播采样加速;(4)高吞吐量化注意力。
通过这些技术,项目实现了训练目标优化与显著的计算加速,大幅降低了模型的计算量和资源需求,同时确保甚至超越原有精度。在实际应用中,该系统显著减少了企业运营成本和用户延时。未来,项目将进一步优化训练成本、提升推理加速效率,并拓展至更多领域,推动高效大模型技术的普及与广泛应用。
三 等 奖

项目名称:基于惯性传感的智能指环手势交互技术
团队成员:何 哲,李卓君,王子轩
项目介绍:本项目突破了传统手势识别技术的局限,采用了智能指环这一创新载体,利用其低能耗、高精度、便携性等优势,结合惯性传感单元(IMU),为手势识别带来了新的解决方案。通过结合传统算法与机器学习,本研究在单指环上实现了精准的空间手势识别和精细的平面手势操控,15种空间手势识别准确率大于95%,平面书写任务上字母识别准确率90.94%,同时实现了一套包含命令输入,目标选择,文本输入的完整输入系统,展现了技术的前沿性和创新性。
三 等 奖

项目名称:Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents
团队成员:李俊凯,黎雍卉,李伟韬
项目介绍:项目开发了“Agent Hospital”虚拟医院模拟系统以模拟整个医疗流程,包括从疾病发生到诊断、治疗、康复等一系列环节,并通过LLM构建了医生和患者等智能体角色。为了提升医生智能体的治疗能力,项目提出了“MedAgent-Zero”的方法,该方法无需人工标注数据,而是医生智能体在虚拟环境中通过处理病患案例不断自我学习和进化,从而不断提高诊疗的准确性。
实验表明,经过大量模拟病例的训练,医生智能体在虚拟测试和实际评估中均表现出优异的诊疗能力。
三 等 奖

项目名称:自我学习进化的智能体系统
团队成员:杨宗瀚,刘子君
项目介绍:在大语言模型驱动下,智能体可通过与外界交互自主完成任务。依赖于文本理解、推理规划、文本与代码生成等基础能力,智能体已在软件工程、网页浏览、计算机操作等场景上实现了一定程度的自动化。对于智能体而言,通过在环境中不断交互,进行自我学习和持续进化是其关键的发展方向。
本项目围绕自我学习与进化这一核心问题进行了多项技术研究,提出智能体的进化准则,设计单智能体自我训练、多智能体组织优化与强化学习等方法和系统,在高度开放的环境中提高自我进化能力。
三 等 奖

项目名称:面向多模态大模型的具身智能体平台
团队成员:程志立,胡锦毅,胡声鼎
项目介绍:本项目构建了面向多模态大模型的具身智能体平台,为开发具身智能体提供功能强大的3D模拟环境和数据生成系统。模拟环境作为现实世界的模拟器,是智能体在3D交互场景中低成本、可扩展地进行实验的基础。与之配套的数据生成系统可以解决多模态大模型应用于具身智能体时,训练数据的规模和多样性不足的问题。
三 等 奖

项目名称:以人为中心的高表现力3D内容生成系统
团队成员:王子轩,王浩宇,黄 烁
项目介绍:以人为中心的高表现力3D内容生成系统致力于提升游戏、表演、影视等领域中3D内容的制作效率与质量,涵盖三维人体模型生成、人脸动画生成、肢体动作与相机运镜生成。
针对传统手工建模复杂且难以满足高质量需求的现状,我们开发了语义驱动的快速生成方法;为解决写实人脸动画制作成本高、流程慢的问题,研究了高效自动生成技术;同时提出针对肢体动作与相机运动的自动化生成方案,减少人工参与,赋予3D内容更丰富的表现力。
恭喜以上9支获奖队伍,1984级创新未来奖学金作为计算机系校友毕业30年之后给母校的回馈,将继续坚定不移地支持创新,让想象力生根发芽,助力学弟学妹不断开拓新的边界。
入群请加英小诺微信号:YN20171009