Xiongkun Linghu

I was a senior research engineer at Beijing Institute for General Artificial Intelligence(BIGAI) from July 2023 to March 2026. In BIGAI, I was advised by Dr. Siyuan Huang and Dr. Baoxiong Jia. I obtained my M.S. from Tsinghua University in July 2023. Previously, I received my B.S. from Beijing Institute of Technology in July 2020.

I am generally interested in multimodal foundation models and embodied AI. My long-term goal is building powerful, reliable and safe embodied agents in the digital and physical world.

News

May 2026: 3D-RFT is accepted by ICML 2026.

January 2026: SceneCOT is accepted by ICLR 2026.

Publications

3D-RFT: Reinforcement Fine-Tuning for Video-based 3D Scene Understanding

Xiongkun Linghu*, Jiangyong Huang*, Baoxiong Jia, and Siyuan Huang

ICML 2026

arXiv HTML Code
SceneCOT: Eliciting Grounded Chain-of-Thought Reasoning in 3D Scenes

Xiongkun Linghu, Jiangyong Huang, Ziyu Zhu, Baoxiong Jia, and Siyuan Huang

ICLR 2026

arXiv HTML Code
Unveiling the Mist over 3D Vision-Language Understanding: Object-centric Evaluation with Chain-of-Analysis

Jiangyong Huang* ,Baoxiong Jia*, Yan Wang, Ziyu Zhu, Xiongkun Linghu, Qing Li, Songchun Zhu, and Siyuan Huang

CVPR 2025

arXiv HTML Code
Multi-modal Situated Reasoning in 3D Scenes

Xiongkun Linghu*, Jiangyong Huang* , Xuesong Niu*, Xiaojian Ma, Baoxiong Jia, and Siyuan Huang

NeurIPS, Datasets and Benchmarks Track, 2024

arXiv HTML Code
An Embodied Generalist Agent in 3D World

Jiangyong Huang*, Silong Yong*, Xiaojian Ma*, Xiongkun Linghu*, Puhao Li, Yan Wang, Qing Li, Songchun Zhu, Baoxiong Jia, and Siyuan Huang

ICML, 2024

arXiv HTML Code Demo
Switchable representation learning framework with self-compatibility

Shengsen Wu, Yan Bai, Yihang Lou, Xiongkun Linghu, Jianzhong He, and Ling-Yu Duan

CVPR, 2023

arXiv

Preprint

Bayesian Evidential Learning for Few-Shot Classification

Xiongkun Linghu, Yan Bai, Yihang Lou, Shengsen Wu,Jinze Li, Jianzhong He, and Tao Bai

arxiv, 2022

arXiv

Service

- Reviewers: I serve as the reviewer for NeurIPS, ICML, ICLR, CVPR, and ECCV

Experience

- 2023.7 - 2026.3, Research Engineer, BIGAI, Multimodal LLM, Embodied AI, 3D Vision
- 2021.12 - 2022.7, Intern, Huawei, Few-shot Learning and Uncertainty Modeling
- 2021.5 - 2021.11, Intern, Megvii, Few-shot Learning

Education

- 2020.8 - 2023.6, M.S., Department of Electronic Engineering, Tsinghua University
- 2016.8 - 2020.6, B.Eng, School of Information and Electronics, Beijing Institute of Technology