吴世涵 (Shihan Wu)

电子科技大学计算机科学与工程学院, 计算机科学与技术专业学术硕士在读

github
googleScholar
dblp

GitHub User's stars GitHub User's followers

自我介绍

电子科技大学计算机科学与工程学院学术硕士在读,专业为计算机科学与技术,GPA排名前1.3%。研究方向包括:

  • 视觉语言模型 (VLMs) 的高效迁移学习
  • 视觉语言动作模型 (VLAs) 的训练和测试时适应

已作为第一/共同第一作者发表2篇CVPR(CCF-A)论文,并获得国家奖学金优秀毕业生荣誉。

新闻

[2025.5.20] 🔥 我们的论文 "InSpire: Vision-Language-Action Models with Intrinsic Spatial Reasoning" 已经发布!

[2025.5.19] 🔥 我们的论文 "Policy Contrastive Decoding for Robotic Foundation Models" 已经发布!

教育经历

→ 完整列表

学术硕士在读, 电子科技大学计算机科学与工程学院,计算机科学与技术, 2023 - 至今

工学学士, 电子科技大学软件与信息工程学院,软件工程, 2019 - 2023

发表论文

→ 完整列表

注意: (*代表相同贡献)

Policy Contrastive Decoding for Robotic Foundation Models

Shihan Wu*, Ji Zhang*, Xu Luo, Junlin Xie, Jingkuan Song, Heng Tao Shen, Lianli Gao

机器人学 · 视觉语言动作模型 · 对比解码

2025.5

[项目主页] [PDF] [arXiv] [代码]

GitHub Repo stars

InSpire: Vision-Language-Action Models with Intrinsic Spatial Reasoning

Ji Zhang*, Shihan Wu*, Xu Luo, Hao Wu, Lianli Gao, Heng Tao Shen, Jingkuan Song

机器人学 · 视觉语言动作模型 · 虚假相关性

2025.5

[项目主页] [PDF] [arXiv] [代码]

GitHub Repo stars

[CVPR 2025] Skip Tuning: Pre-trained Vision-Language Models are Effective and Efficient Adapters Themselves

Shihan Wu, Ji Zhang, Pengpeng Zeng, Lianli Gao, Jingkuan Song, Heng Tao Shen

视觉语言模型 · 迁移学习 · 效率

2024.12

[PDF] [arXiv] [代码]

GitHub Repo stars

Rethinking Conditional Prompt Tuning for Vision-Language Models

Ji Zhang, Shihan Wu, Pengpeng Zeng, Lianli Gao, Jingkuan Song, Heng Tao Shen

视觉语言模型 · 迁移学习 · 提示调优

2024.8

[代码]

GitHub Repo stars

[CVPR 2024] DePT: Decoupled Prompt Tuning

Ji Zhang*, Shihan Wu*, Lianli Gao, Heng Tao Shen, Jingkuan Song

视觉语言模型 · 迁移学习 · 提示调优

2023.9

[PDF] [arXiv] [代码]

GitHub Repo stars

获奖与荣誉

→ 完整列表

优秀研究生, 电子科技大学, 2025

国家奖学金, 中华人民共和国教育部, 2024

优秀毕业生, 电子科技大学, 2023