Haiteng Zhao

Bio

I am currently a full-time researcher at Shanghai AI Lab. I obtained my Ph.D. in Machine Learning and Intelligence from Peking University in July 2025. From September 2020 to July 2025, I pursued my doctoral studies at Sigma Lab, Peking University, supervised by Prof. Zhihong Deng. I also collaborated on several exciting projects at the University of Hong Kong with Lingpeng Kong and Qi Liu. Previously, I obtained a B.Sc. degree in Psychology from Peking University.

My current focus lies in exploring whether deep learning can effectively encode human-like intelligence, encompassing transfer, generalization, reasoning and planning capacities, scientific research capabilities, and more. My work primarily spans three key areas:

Machine Learning Theory: Investigating topics such as generalization theory, domain adaptation, transfer learning, and robustness. As large language models demonstrate impressive general capabilities, there is an urgent need to establish a foundational theory that can better predict these abilities.
AI for Science: I am deeply interested in the potential of AI in scientific research. Scientific research represents a complete philosophical methodology that uses symbolic language to understand and interpret the world, gain new insights through experiments and reasoning, and apply those insights to create new things. It is also the fundamental driving force behind the progress of human civilization. Although today's AI has demonstrated strong general capabilities, how it can exhibit effective scientific research abilities remains an open research question.
Reasoning and Planning: Addressing compositional generalization challenges in deep models, which are crucial for achieving human-like intelligence. My research in this area mainly focuses on intelligent agents.

I look forward to chatting and collaborating with you!

Publications

Most recent publications on Google Scholar.
^‡ indicates equal contribution.

All
#Machine Learning Theory
#AI4Science
#Reasoning&Agent

Exploring Visual Pretraining for Learning Language Intelligence

Zhonghan Zhao, Yiming Zhang, Wenwei Zhang, Haiteng Zhao, Xingguang Wei, Zhangwei Gao, Kuikun Liu, Yuzhe Gu, Size Wu, Haian Huang, Jianfei Gao, Haijun Lv, Demin Song, Yunhua Zhou, Qipeng Guo, Gaoang Wang, Kai Chen

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2026

Paper

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Intern-S1-Pro Team, Shanghai AI Laboratory

arXiv preprint

Paper

Achieving Olympia-Level Geometry Large Language Model Agent via Complexity Boosting Reinforcement Learning

Haiteng Zhao, Junhao Shen, Yiming Zhang, Songyang Gao, Kuikun Liu, Tianyou Ma, Fan Zheng, Dahua Lin, Wenwei Zhang, Kai Chen

International Conference on Learning Representations (ICLR) 2026

Paper

Long-horizon Reasoning Agent for Olympiad-Level Mathematical Problem Solving

Songyang Gao, Yuzhe Gu, Zijian Wu, Lingkai Kong, Wenwei Zhang, Zhongrui Cai, Fan Zheng, Tianyou Ma, Junhao Shen, Haiteng Zhao, Duanyang Zhang, Huilun Zhang, Kuikun Liu, Chengqi Lyu, Yanhui Duan, Chiyu Chen, Ningsheng Ma, Jianfei Gao, Han Lyu, Dahua Lin, Kai Chen

arXiv preprint

Paper

Intern-S1: A Scientific Multimodal Foundation Model

Intern-S1 Team, Shanghai AI Laboratory

arXiv preprint

Paper

Semi-off-Policy Reinforcement Learning for Vision-Language Slow-Thinking Reasoning

Junhao Shen, Haiteng Zhao, Yuzhe Gu, Songyang Gao, Kuikun Liu, Haian Huang, Jianfei Gao, Dahua Lin, Wenwei Zhang, Kai Chen

Advances in Neural Information Processing Systems (NeurIPS) 2025

Paper

MUR: Momentum Uncertainty guided Reasoning for Large Language Models

Hang Yan, Fangzhi Xu, Rongman Xu, Yifei Li, Jian Zhang, Haoran Luo, Xiaobao Wu, Luu Anh Tuan, Haiteng Zhao, Qika Lin, Jun Liu

The 64th Annual Meeting of the Association for Computational Linguistics (ACL) 2026

Paper

ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows

Qiushi Sun, Zhoumianze Liu, Chang Ma, Zichen Ding, Fangzhi Xu, Zhangyue Yin, Haiteng Zhao, Zhenyu Wu, Kanzhi Cheng, Zhaoyang Liu, Jianing Wang, Qintong Li, Xiangru Tang, Tianbao Xie, Xiachong Feng, Xiang Li, Ben Kao, Wenhai Wang, Biqing Qi, Lingpeng Kong, Zhiyong Wu

International Conference on Learning Representations (ICLR) 2026

Paper

Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning

Fangzhi Xu, Hang Yan, Chang Ma, Haiteng Zhao, Qiushi Sun, Kanzhi Cheng, Junxian He, Jun Liu, Zhiyong Wu

Annual Meeting of the Association for Computational Linguistics (ACL) 2025

Paper

φ-Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation

Fangzhi Xu, Hang Yan, Chang Ma, Haiteng Zhao, Jun Liu, Qika Lin, Zhiyong Wu

Annual Meeting of the Association for Computational Linguistics (ACL) 2025

Paper

BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning

Haiteng Zhao, Chang Ma, Fangzhi Xu, Lingpeng Kong, Zhi-Hong Deng

arXiv preprint

Paper

Non-myopic Generation of Language Model for Reasoning and Planning

Chang Ma, Haiteng Zhao, Junlei Zhang, Junxian He, Lingpeng Kong

International Conference on Learning Representations (ICLR) 2025

Paper

Instruction-Based Molecular Graph Generation with Unified Text-Graph Diffusion Model

Yuran Xiang, Haiteng Zhao, Chang Ma, Zhi-Hong Deng

arXiv preprint

Paper

Empowering Large Language Model Agents through Action Learning

Haiteng Zhao, Chang Ma, Guoyin Wang, Jing Su, Lingpeng Kong, Jingjing Xu, Zhi-Hong Deng, Hongxia Yang

Conference on Language Modeling (COLM) 2024

Paper

Exploring the Reasoning Abilities of Multimodal Large Language Models (MLLMs): A Comprehensive Survey on Emerging Trends in Multimodal Reasoning

Yiqi Wang, Wentao Chen, Xiaotian Han, Xudong Lin, Haiteng Zhao, Yongfei Liu, Bohan Zhai, Jianbo Yuan, Quanzeng You, Hongxia Yang

arXiv preprint

Paper

GIMLET: A Unified Graph-Text Model for Instruction-Based Molecule Zero-Shot Learning

Haiteng Zhao, Shengchao Liu, Chang Ma, Hannan Xu, Jie Fu, Zhi-Hong Deng, Lingpeng Kong, Qi Liu

Conference on Neural Information Processing Systems (NeurIPS) 2023

Paper

ChatPathway: Conversational Large Language Models for Biology Pathway Detection

Yanjing Li, Hannan Xu, Haiteng Zhao, Hongyu Guo, Shengchao Liu

Conference on Neural Information Processing Systems (NeurIPS) 2023 AI for Science Workshop

Paper

Are More Layers Beneficial to Graph Transformers?

Haiteng Zhao, Shuming Ma, Dongdong Zhang, Zhi-Hong Deng, Furu Wei

International Conference on Learning Representations (ICLR) 2023

Paper

Retrieved Sequence Augmentation for Protein Representation Learning

Chang Ma, Haiteng Zhao, Lin Zheng, Jiayi Xin, Qintong Li, Lijun Wu, Zhihong Deng, Yang Lu, Qi Liu, Lingpeng Kong

Conference on Empirical Methods in Natural Language Processing (EMNLP) 2024

Paper

Certified Robustness Against Natural Language Attacks by Causal Intervention

Haiteng Zhao^‡, Chang Ma^‡, Xinshuai Dong^‡, Anh Tuan Luu, Zhi-Hong Deng, Hanwang Zhang

International Conference on Machine Learning (ICML) 2022

Paper

Domain Adaptation via Mutual Information Maximization

Haiteng Zhao, Chang Ma, Qinyu Chen, Zhihong Deng

International Joint Conference on Artificial Intelligence (IJCAI) 2022 (Long presentation)

Paper

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Intern-S1-Pro Team, Shanghai AI Laboratory

arXiv preprint

Paper

Achieving Olympia-Level Geometry Large Language Model Agent via Complexity Boosting Reinforcement Learning

Haiteng Zhao, Junhao Shen, Yiming Zhang, Songyang Gao, Kuikun Liu, Tianyou Ma, Fan Zheng, Dahua Lin, Wenwei Zhang, Kai Chen

International Conference on Learning Representations (ICLR) 2026

Paper

Long-horizon Reasoning Agent for Olympiad-Level Mathematical Problem Solving

arXiv preprint

Paper

Intern-S1: A Scientific Multimodal Foundation Model

Intern-S1 Team, Shanghai AI Laboratory

arXiv preprint

Paper

ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows

International Conference on Learning Representations (ICLR) 2026

Paper

BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning

Haiteng Zhao, Chang Ma, Fangzhi Xu, Lingpeng Kong, Zhi-Hong Deng

arXiv preprint

Paper

Instruction-Based Molecular Graph Generation with Unified Text-Graph Diffusion Model

Yuran Xiang, Haiteng Zhao, Chang Ma, Zhi-Hong Deng

arXiv preprint

Paper

GIMLET: A Unified Graph-Text Model for Instruction-Based Molecule Zero-Shot Learning

Haiteng Zhao, Shengchao Liu, Chang Ma, Hannan Xu, Jie Fu, Zhi-Hong Deng, Lingpeng Kong, Qi Liu

Conference on Neural Information Processing Systems (NeurIPS) 2023

Paper

ChatPathway: Conversational Large Language Models for Biology Pathway Detection

Yanjing Li, Hannan Xu, Haiteng Zhao, Hongyu Guo, Shengchao Liu

Conference on Neural Information Processing Systems (NeurIPS) 2023 AI for Science Workshop

Paper

Retrieved Sequence Augmentation for Protein Representation Learning

Chang Ma, Haiteng Zhao, Lin Zheng, Jiayi Xin, Qintong Li, Lijun Wu, Zhihong Deng, Yang Lu, Qi Liu, Lingpeng Kong

Conference on Empirical Methods in Natural Language Processing (EMNLP) 2024

Paper

Achieving Olympia-Level Geometry Large Language Model Agent via Complexity Boosting Reinforcement Learning

Haiteng Zhao, Junhao Shen, Yiming Zhang, Songyang Gao, Kuikun Liu, Tianyou Ma, Fan Zheng, Dahua Lin, Wenwei Zhang, Kai Chen

International Conference on Learning Representations (ICLR) 2026

Paper

Long-horizon Reasoning Agent for Olympiad-Level Mathematical Problem Solving

arXiv preprint

Paper

Semi-off-Policy Reinforcement Learning for Vision-Language Slow-Thinking Reasoning

Junhao Shen, Haiteng Zhao, Yuzhe Gu, Songyang Gao, Kuikun Liu, Haian Huang, Jianfei Gao, Dahua Lin, Wenwei Zhang, Kai Chen

Advances in Neural Information Processing Systems (NeurIPS) 2025

Paper

MUR: Momentum Uncertainty guided Reasoning for Large Language Models

Hang Yan, Fangzhi Xu, Rongman Xu, Yifei Li, Jian Zhang, Haoran Luo, Xiaobao Wu, Luu Anh Tuan, Haiteng Zhao, Qika Lin, Jun Liu

The 64th Annual Meeting of the Association for Computational Linguistics (ACL) 2026

Paper

ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows

International Conference on Learning Representations (ICLR) 2026

Paper

Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning

Fangzhi Xu, Hang Yan, Chang Ma, Haiteng Zhao, Qiushi Sun, Kanzhi Cheng, Junxian He, Jun Liu, Zhiyong Wu

Annual Meeting of the Association for Computational Linguistics (ACL) 2025

Paper

φ-Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation

Fangzhi Xu, Hang Yan, Chang Ma, Haiteng Zhao, Jun Liu, Qika Lin, Zhiyong Wu

Annual Meeting of the Association for Computational Linguistics (ACL) 2025

Paper

BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning

Haiteng Zhao, Chang Ma, Fangzhi Xu, Lingpeng Kong, Zhi-Hong Deng

arXiv preprint

Paper

Non-myopic Generation of Language Model for Reasoning and Planning

Chang Ma, Haiteng Zhao, Junlei Zhang, Junxian He, Lingpeng Kong

International Conference on Learning Representations (ICLR) 2025

Paper

Empowering Large Language Model Agents through Action Learning

Haiteng Zhao, Chang Ma, Guoyin Wang, Jing Su, Lingpeng Kong, Jingjing Xu, Zhi-Hong Deng, Hongxia Yang

Conference on Language Modeling (COLM) 2024

Paper

Are More Layers Beneficial to Graph Transformers?

Haiteng Zhao, Shuming Ma, Dongdong Zhang, Zhi-Hong Deng, Furu Wei

International Conference on Learning Representations (ICLR) 2023

Paper

Certified Robustness Against Natural Language Attacks by Causal Intervention

Haiteng Zhao^‡, Chang Ma^‡, Xinshuai Dong^‡, Anh Tuan Luu, Zhi-Hong Deng, Hanwang Zhang

International Conference on Machine Learning (ICML) 2022

Paper

Domain Adaptation via Mutual Information Maximization

Haiteng Zhao, Chang Ma, Qinyu Chen, Zhihong Deng

International Joint Conference on Artificial Intelligence (IJCAI) 2022 (Long presentation)

Paper

Vitæ

Full Resume in PDF.

Shanghai AI Lab July 2025 -

Full-time Researcher
LLM Lab
Shanghai AI Lab Oct 2024 - July 2025

Research Intern
LLM Lab
Tencent Mar 2024 - Oct 2024

Research Intern
AI Lab NLP
Bytedance Aug 2023 - Feb 2024

Research Intern
Data-AML-US
The University of Hong Kong Sep 2022 - July 2025

Research Intern
HKU NLP
Microsoft Research Asia Jan 2022 - Oct 2022

Research Intern
Natural Language Computing (NLC) group
Nanyang Technological University June 2021 - July 2025

Collaborator
NAIL Group, NLP
Peking University Sep 2020 - July 2025

Ph.D. Student
CS, Machine Learning
Peking University July 2018 - July 2020

Research Assistant
Sigma Lab, Department of Machine Intelligence
Peking University Sep 2016 - July 2020

B.Sc. Student
Psychology

Thanks to Martin Saveski for the website template.