Research

arXiv

Reinforcement World Model Learning for LLM-based Agents

Xiao Yu, Baolin Peng, Ruize Xu, Yelong Shen, Pengcheng He, Suman Nath, Nikhil Singh, Jiangfeng Gao, Zhou Yu

Paper

ICLR 2026

Dyna-Mind: Learning to Simulate from Experience for Better AI Agents

Xiao Yu, Baolin Peng, Michel Galley, Hao Cheng, Qianhui Wu, Janardhan Kulkarni, Suman Nath, Zhou Yu, Jianfeng Gao

Paper

GitHub

ICLR 2026
(Workshop)

Dyna-Think: Synergizing Reasoning, Acting, and World Model Simulation in AI Agents

Xiao Yu, Baolin Peng, Ruize Xu, Michel Galley, Hao Cheng, Suman Nath, Jianfeng Gao, Zhou Yu

Paper

NeurIPS 2025
(Workshop)

AI Agents for Web Testing: A Case Study in the Wild

Naimeng Ye, Xiao Yu, Ruize Xu, Tianyi Peng, Zhou Yu

Paper

GitHub

ICLR 2025

ExACT: Teaching AI Agents to Explore with Reflective-MCTS and Exploratory Learning

Xiao Yu, Baolin Peng, Vineeth Vajipey, Hao Cheng, Michel Galley, Jianfeng Gao, Zhou Yu

Paper

GitHub

Website

ACL 2025

ConFit v2: Improving Resume-Job Matching using Hypothetical Resume Embedding and Runner-Up Hard-Negative Mining

Xiao Yu*, Ruize Xu*, Chengyuan Xue*, Jinzhong Zhang, Xu Ma, Zhou Yu

Paper

GitHub

EMNLP 2024

LIONs: An Empirically Optimized Approach to Align Language Models

Xiao Yu, Qingyang Wu, Yu Li, Zhou Yu

Paper

GitHub

NAACL 2024🏆

Teaching Language Models to Self-Improve through Interactive Demonstrations

Xiao Yu, Baolin Peng, Michel Galley, Jianfeng Gao, Zhou Yu

Paper

GitHub

RecSys 2024

ConFit: Improving Resume-Job Matching using Data Augmentation and Contrastive Learning

Xiao Yu, Jinzhong Zhang, Zhou Yu

Paper

GitHub

ACL 2024

LocalRQA: From Generating Data to Locally Training, Testing, and Deploying Retrieval-Augmented QA Systems

Xiao Yu*, Yunan Lu*, Zhou Yu

Paper

GitHub

EMNLP 2023

Prompt-Based Monte-Carlo Tree Search for Goal-oriented Dialogue Policy Planning

Xiao Yu, Maximillian Chen, Zhou Yu

Paper

GitHub

EMNLP 2023

KRLS: Improving End-to-End Response Generation in Task Oriented Dialog with Reinforced Keywords Learning

Xiao Yu, Qingyang Wu, Kun Qian, Zhou Yu

Paper

GitHub

ACL 2023

Controllable Mixed-Initiative Dialogue Generation through Prompting

Maximillian Chen, Xiao Yu, Weiyan Shi, Urvi Awasthi, Zhou Yu

Paper

EACL 2023

FastKASSIM: A Fast Tree Kernel-Based Syntactic Similarity Metric

Maximillian Chen*, Caitlyn Chen*, Xiao Yu*, Zhou Yu

Paper

GitHub

IEEE 2022

Distributed MQTT Brokers at Network Edges: A Study on Message Dissemination

Luoyao Hao, Xiao Yu, Tingrui Zhang, Henning Schulzrinne

Paper