学院新闻

|学院新闻

您现在的位置

  |   网站首页

>

  |   正文

>

我院胡涛教授团队两项成果被自动化学会A类国际会议IEEE ICARM 2025录用并做报告

发布时间:2025-08-11  点击量:  来源:  作者:田野

【字体:

 大 

 中 

 小 

  打印  






第十届IEEE先进机器人与机电一体化国际会议(10th IEEE International Conference on Advanced Robotics and Mechatronics,简称ICARM 2025)于2025年8月1日-8月3日在英国朴次茅斯召开,会议由IEEE人与控制论学会(IEEE SMC)、IEEE机器人与自动化学会(IEEE RAS)联合主办,是中国自动化学会推荐的A类会议。智能科学与工程学院胡涛教授团队的两篇研究性论文“Human Dance Generation via Text-Music Integration”和“HEFT: Hierarchical Enhanced Fusion Transformer for RGB-D Salient Object Detection”被录用,第一作者分别为湖北民族大学智能科学与工程学院计算机技术专业2023级硕士研究生张业东和谭寒钟,通讯作者均为导师胡涛教授。





会议期间,团队研究生张业东做了题为“Human Dance Generation via Text-Music Integration”的报告。团队提出了一种名为VTM的新框架,以解决3D舞蹈和音乐节奏一致性方面的挑战。该框架的核心组件是一个跨模态Transformer,通过编码和量化文本和音乐来预测未来的人类运动姿态代码,从而实现与音乐的时序一致性,并协调各种运动节奏和音乐节拍。在真实数据集上的实验和用户研究表明,VTM在质和量上都取得了显著的先进表现。张业东同时作为Session Chair主持了“AI, Intelligent Control, Neuro-Control, Fuzzy Control and Their Applications & Teleoperation, Telerobotics, Haptics, and Semi-Autonomous Systems”Regular Seesion的分组报告。

研究生张业东作分组报告

团队谭寒钟做了题为“Hierarchical Enhanced Fusion Transformer for RGB-D Salient Object Detection”的报告。为解决传统 RGB-D 突出物体检测模型在多模态特征提取和融合上的局限,提出了一种分层增强融合Transformer模型(HEFT),以辅助机器人进行导航和避障。该模型采用编码器-转换器-解码器架构,其核心的 C2E-TC 转换器实现了高效的跨模态学习,并辅以多任务 TDTDP 网络提升密集预测性能。在七个基准数据集上验证了其有效性。

研究生谭寒钟作分组报告