Hi! I am exploring something new now!

~~I am a research scientist at Shanghai AI Lab.~~ I got my PhD degree from the University of Hong Kong at the end of 2021, affiliated with the HKU database group and NLP group. Before that, I received my B.E. degree from Wuhan University in 2017.

I am building general OS agents: OS-Copilot, OS-Atlas, OS-Genesis, SeeClick.

I am looking for talented interns to work with me on OS agents and RL , please feel free to hit me up with your CV or questions if interested.

🔥 News

2025.02: OS-Atlas is accepted as a spotlight paper at ICLR 2025. See you in Singapore!
2024.05: SeeClick and Symbol-LLM are accepted to ACL main conference! See you in Bangkok!
2024.04: 🎉 New homepage!

📝 Selected Publications

ICLR'25 Spotlight

OS-ATLAS: A Foundation Action Model For Generalist GUI Agents
Zhiyong Wu, Zhenyu Wu, Fangzhi Xu, Yian Wang*, Qiushi Sun, Chengyou Jia, Kanzhi Cheng, Zichen Ding, Liheng Chen, Paul Pu Liang, Yu Qiao.

Check demos at Our Website
SOTA GUI grounding and action model upon which you can easily build your own agent. Code .
Repost and like us on Twitter

LLMAgents@ICLR 2024

OS-Copilot: Towards Generalist Computer Agents with Self-Improvement
Zhiyong Wu, Chengcheng Han*, Zichen Ding, Zhenmin Weng, Zhoumianze Liu, Shunyu Yao, Tao Yu, Lingpeng Kong.

Check demos at Our Website
Build your personal agents at Code .
Join our Discord to have fun, or follow us on Twitter

arXiv OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis, Qiushi Sun, Kanzhi Cheng, Zichen Ding, Chuanyang Jin, Yian Wang, Fangzhi Xu, Zhenyu Wu, Chengyou Jia, Liheng Chen, Zhoumianze Liu, Ben Kao, Guohao Li, Junxian He, Yu Qiao, Zhiyong Wu.
arXiv Interative Evolution: A Neural-symbolic Self-Training Framework for Large Language Models, Fangzhi Xu, Qiushi Sun, Kanzhi Cheng, Jun Liu, Yu Qiao, Zhiyong Wu.
ACL 2024 SeeClick: Harnessing GUI Grounding for Advanced Visual GUI Agents, Kanzhi Cheng, Qiushi Sun, Yougang Chu, Fangzhi Xu, Yantao Li, Jianbing Zhang, Zhiyong Wu.
ACL 2023 Self-adaptive In-context Learning, Zhiyong Wu, Yaoxiang Wang, Jiacheng Ye, Lingpeng Kong.
ICLR 2023 DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models, Shansan Gong, Mukai Li, Jiangtao Feng, Zhiyong Wu, Lingpeng Kong
ACL 2020Perturbed Masking: Parameter-free Probing for Analyzing and Interpreting BERT, Zhiyong Wu, Yun Chen, et al.

🤖 Interns

Jiacheng Ye (2022.1-2023.5) EMNLP’22a EMNLP’22b ICML’23
Sijie Cheng (2022.3-2022.8) AAAI’23
Yaoxiang Wang (2022.10-2024.4) ACL’23a ACL’23b
Zhenyu Wu (2022.10-2025.1) ACL’23b ICLR’25
Siyu Ren (2023.8-2024.2) ICLR’24
Qiushi Sun (2023.6-2025.1) COLM’24, Survey Paper
Fangzhi Xu (2023.8-2025.1) ACL’24 ICLR’25
Kanzhi Cheng (2023.8-2024.4) ACL’24
Yi Lu (2023.10-2024.4) preprint
Chengyou Jia (2024.3-2024.9) preprint

📚 Full Publication List

🤖 Agents

ICLR 2025 (Spotlight) OS-ATLAS: A Foundation Action Model For Generalist GUI Agents, Zhiyong Wu, Zhenyu Wu, Fangzhi Xu, Yian Wang*, Qiushi Sun, Chengyou Jia, Kanzhi Cheng, Zichen Ding, Liheng Chen, Paul Pu Liang, Yu Qiao.
arXiv 2024 AgentStore: Scalable Integration of Heterogeneous Agents As Specialized Generalist Computer Assistant, Chengyou Jia, Minnan Luo, Zhuohang Dang, Qiushi Sun, Fangzhi Xu, Junlin Hu, Tianbao Xie, Zhiyong Wu.
arXiv 2024 Interative Evolution: A Neural-symbolic Self-Training Framework for Large Language Models, Fangzhi Xu, Qiushi Sun, Kanzhi Cheng, Jun Liu, Yu Qiao, Zhiyong Wu.
LLMAgents@ICLR 2024 OS-Copilot: Towards Generalist Computer Agents with Self-Improvement Zhiyong Wu, Chengcheng Han, Zichen Ding, Zhenmin Weng, Zhoumianze Liu, Shunyu Yao, Tao Yu, Lingpeng Kong.
ACL 2024 SeeClick: Harnessing GUI Grounding for Advanced Visual GUI Agents, Kanzhi Cheng, Qiushi Sun, Yougang Chu, Fangzhi Xu, Yantao Li, Jianbing Zhang, Zhiyong Wu.
ACL 2024 Symbol-LLM: Towards Foundational Symbol-centric Interface For Large Language Models, Fangzhi Xu, Zhiyong Wu, et al.
Neural Networks TDAG: A Multi-Agent Framework based on Dynamic Task Decomposition and Agent Generation Yaoxiang Wang, Zhiyong Wu, Junfeng Yao, Jinsong Su
COLM 2024 Corex: Pushing the Boundaries of Complex Reasoning through Multi-Model Collaboration Qiushi Sun, Zhangyue Yin, Xiang Li, Zhiyong Wu, Xipeng Qiu, Lingpeng Kong.

❓ In-Context Learning

EMNLP 2024 A Survey on In-context Learning, Qingxiu Dong, Lei Li, Damai Dai, Ce Zheng, Zhiyong Wu, et al.
ACL 2024 (findings) LLM as Prompter: Low-resource Inductive Reasoning on Arbitrary Knowledge Graphs, Kai Wang, Yuwei Xu, Zhiyong Wu, Siqiang Luo
ACL 2023 Self-adaptive In-context Learning, Zhiyong Wu, Yaoxiang Wang, Jiacheng Ye, Lingpeng Kong.
ACL 2023 (demo) OpenICL: An Open-Source Framework for In-context Learning, Zhenyu Wu, YaoXiang Wang, Zhiyong Wu et al.
ICML 2023 Compositional Exemplars for In-context Learning, Jiacheng Ye, Zhiyong Wu, Jiangtao Feng, Tao Yu, Lingpeng Kong.
EMNLP 2023 Can We Edit Factual Knowledge by In-Context Learning? Ce Zheng, Lei Li, Qingxiu Dong, Yuxuan Fan, Zhiyong Wu, Jingjing Xu, Baobao Chang

📃 Data Augmentation using LLMs

ICLR 2023 Self-Guided High-Quality Data Generation in Efficient Zero-Shot Learning Jiahui Gao, Renjie Pi, Yong Lin, Hang Xu, Jiacheng Ye, Zhiyong Wu, et al.
EMNLP 2022 ZeroGen: Efficient Zero-shot Learning via Dataset Generation, Jiacheng Ye, Jiahui Gao, Qintong Li, Hang Xu, Jiangtao Feng, Zhiyong Wu, Tao Yu and Lingpeng Kong.
EMNLP 2022 ProGen: Progressive Zero-shot Dataset Generation via In-context Feedback, Jiacheng Ye, Jiahui Gao, Zhiyong Wu, Jiangtao Feng, Tao Yu, and Lingpeng Kong.

🎼 Interpretability

ACL 2024 (findings) How Vocabulary Sharing Facilitates Multilingualism in LLaMA?, Fei Yuan, Shuai Yuan, Zhiyong Wu, Lei Li
ACL 2023 (findings) Explanation Regeneration via Information Bottleneck Qintong Li, Zhiyong Wu, Lingpeng Kong, Wei Bi.
AAAI 2023 Unsupervised Explanation Generation via Correct Instantiations Sijie Chen, Zhiyong Wu, Jiangjie Chen, Zhixing Li, Yang Liu, and Lingpeng Kong
ACL 2021 Good for Misconceived Reasons: An Empirical Revisiting on the Need for Visual Context in Multimodal Machine Translation, Zhiyong Wu, Lingpeng Kong, Wei Bi, Xiang Li, Ben Kao.
ACL 2020Perturbed Masking: Parameter-free Probing for Analyzing and Interpreting BERT, Zhiyong Wu, Yun Chen, et al.
WSDM 2020 PERQ: Predicting, Explaining, and Rectifying Failed Questions in KB-QA Systems Zhiyong Wu, Ben Kao, Tien-Hsuan Wu, Pengcheng Yin, Qun Liu.

🧑‍🎨 Generative Model

ICLR 2025 Implicit Search via Discrete Diffusion: A Study on Chess, Jiacheng Ye, Zhenyu Wu, Jiahui Gao, Zhiyong Wu, Xin Jiang, Zhenguo Li, Lingpeng Kong.
arXiv 2024 A Controlled Study on Long-Context Extension and Generalization in LLMs., Yi Lu, Jing Nathan Yan, Songlin Yang, Justin T. Chiu, Siyu Ren, Fei Yuan, Wenting Zhao, Zhiyong Wu, Alexander M. Rush.
ICLR 2024 EMO: Earth Mover Distance Optimization for Auto-Regressive Language Modeling, Siyu Ren, Zhiyong Wu, Kenny Q Zhu.
EMNLP 2023 (findings) DiffuSeq-v2: Bridging Discrete and Continuous Text Spaces for Accelerated Seq2Seq Diffusion ModelsShansan Gong, Mukai Li, Jiangtao Feng, Zhiyong Wu, Lingpeng Kong.
ICLR 2023 DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models Shansan Gong, Mukai Li, Jiangtao Feng, Zhiyong Wu, Lingpeng Kong.
ACL 2021 Lexical Knowledge Internalization for Neural Conversational Models Zhiyong Wu, Wei Bi, Xiang Li, Lingpeng Kong, Ben Kao.
ACL 2021 Cascaded Head-colliding Attention Lin Zheng, Zhiyong Wu, Lingpeng Kong

Zhiyong Wu (吴志勇)