报告题目:视觉Transformer模型结构设计及其应用
报 告 人: 张敬 副教授
报告时间:2024年01月11日(周四)10:00-11:00
报告地点:逸夫楼445A(线上)
研究生院 电气与控制工程学院
2024年1月10日
报告人简介:
张敬,博士,2015年毕业于中国科学技术大学自动化系,目前在悉尼大学计算机系从事博士后研究,主要从事计算机视觉与深度学习等人工智能领域的相关科学研究工作,在 CCF A类国际会议/期刊以及IEEE 汇刊等国际著名期刊已发表学术论文90余篇,谷歌学术引用6200余次。长期担任著名国际学术期刊和会议审稿人、程序委员会委员、高级程序委员会委员及领域主席。2023年晋升为美国电气和电子工程师协会(IEEE)高级会员。提出的ViTAE Transformer可广泛应用于图像分类、目标检测、语义分割、视频实例分割、图像抠图、目标跟踪、文字检测和识别、遥感图像分析等多个领域,取得了非常有竞争力的结果,相关GitHub仓库关注量超过5000。该模型在相关比赛或者公开数据集多次名列第一,受到广泛关注。