I am a fourth-year CS PhD candidate at Yale University supervised by Arman Cohan. I am also a part-time Student Researcher at Google Deepmind. My research interests are in complex reasoning with Large Language Models, neuro-symbolic reasoning, reasoning evaluation and legal reasoning. I was a PhD student of the late Dragomir Radev.

Thesis committee:

Denny Zhou, founder and lead of the Reasoning Team in Google DeepMind
R. Thomas McCoy, from the Department of Linguistics at Yale University.

I completed my B.Eng Computer Science degree in Nanyang Technological University, Singapore where I worked with Shafiq Rayhan Joty on text generation and summarization.
At NTU, I was awarded the Best Final Year Thesis Gold Medal.

Experiences

5/2024 - Now: Student Researcher, Google DeepMind (Legacy Google Research).
5/2023 - 8/2023: Student Researcher, Google DeepMind (Legacy Google Brain).
5/2022 - 8/2022: Applied Scientist Intern, Amazon Web Services.
3/2019 - 7/2021: Research Assistant, Nanyang Technological University.
1/2020 - 6/2020: Scientist II, A*Star.
5/2020 - 11/2020: Research Intern, Yale University.

Publications

2024

FOLIO: Natural Language Reasoning with First-Order Logic
Simeng Han, Hailey Schoelkopf, Yilun Zhao, Zhenting Qi, Martin Riddell, Wenfei Zhou, James Coady, David Peng, Yujie Qiao, Luke Benson, Lucy Sun, Alex Wardle-Solano, Hannah Szabo, Ekaterina Zubova, Matthew Burtell, Jonathan Fan, Yixin Liu, Brian Wong, Malcolm Sailor, Ansong Ni, Linyong Nan, Jungo Kasai, Tao Yu, Rui Zhang, Alexander R. Fabbri, Wojciech Kryscinski, Semih Yavuz, Ye Liu, Xi Victoria Lin, Shafiq Joty, Yingbo Zhou, Caiming Xiong, Rex Ying, Arman Cohan, Dragomir Radev
EMNLP 2024
P-FOLIO: Evaluating and Improving Logical Reasoning with Abundant Human-Written Reasoning Chains
Simeng Han, Aaron Yu, Rui Shen, Zhenting Qi, Martin Riddell, Wenfei Zhou, Yujie Qiao, Yilun Zhao, Semih Yavuz, Ye Liu, Shafiq Joty, Yingbo Zhou, Caiming Xiong, Dragomir Radev, Rex Ying, Arman Cohan
EMNLP 2024
Scheherazade: Evaluating Chain-of-Thought Math Reasoning in LLMs with Chain-of-Problems
Stephen Miner, Yoshiki Takashima, Simeng Han, Ferhat Erata, Timos Antonopoulos, Ruzica Piskac, Scott J Shapiro
MetaMath: Integrating Natural Language and Code for Enhanced Mathematical Reasoning in Large Language Models
Xuyuan Xiong*, Simeng Han*, Ziyue Zhou, Arman Cohan
GraphIC: A Graph-Based In-Context Example Retrieval Model For Multi-Step Reasoning
Jiale Fu, Yaqing Wang, Simeng Han, Jiaming Fan, Chen Si, Xu Yang
Optimizing Language Model’s Reasoning Abilities with Weak Supervision
Yongqi Tong, Sizhe Wang, Dawei Li, Yifan Wang, Simeng Han, Zi Lin, Chengsong Huang, Jiaxin Huang, Jingbo Shang

2023

Eliminating Reasoning via Inferring with Planning: A New Framework to Guide LLMs’ Non-linear Thinking
Yongqi Tong, Yifan Wang, Dawei Li, Sizhe Wang, Zi Lin, Simeng Han, Jingbo Shang
Revisiting the Gold Standard: Grounding Summarization Evaluation with Robust Human Evaluation
Yixin Liu, Alexander R. Fabbri, Pengfei Liu, Yilun Zhao, Linyong Nan, Ruilin Han, Simeng Han, Shafiq Joty, Chien-Sheng Wu, Caiming Xiong, Dragomir Radev
ACL 2023

2022

CREATIVESUMM: Shared Task on Automatic Summarization for Creative Writing
Divyansh Agarwal, Alexander R. Fabbri, Simeng Han, Wojciech Kryscinski, Faisal Ladhak, Bryan Li, Kathleen McKeown, Dragomir Radev, Tianyi Zhang, Sam Wiseman
Automatic Summarization for Creative Writing Workshop at COLING 22

2021

Straight to the Gradient: Learning to Use Novel Tokens for Neural Text Generation
Xiang Lin, Simeng Han, Shafiq Joty
ICML’21 (as long talk ~3%)
Improving Zero and Few-Shot Abstractive Summarization with Intermediate Fine-tuning and Data Augmentation
Alexander Fabbri, Simeng Han, Haoyuan Li, Haoran Li, Marjan Ghazvininejad, Shafiq Joty, Dragomir Radev, Yashar Mehdad
NAACL’21

2020

Resurrecting Submodularity for Neural Text Generation
Simeng Han*, Xiang Lin* and Shafiq Joty

2019

Hierarchical Pointer Net Parsing
Linlin Liu*, Xiang Lin*, Shafiq Joty, Simeng Han, and Lidong Bing
EMNLP’19

Awards

Meta Research Grant 2024 on Complex Reasoning.
SM2 Scholarship, a full scholarship issued by Ministry of Education and Nanyang Technological University, Singapore
National Physics Olympiad Second Prize, China.
Terrainier NUS Hackathon Top-8
Climate Oracle Yale-NUS hack4climate Datathon 2nd Place in the Data Science Category
Blinkception NTU Hackathon 2nd Prize

Services and Organization

Program Committee: Automatic Summarization for Creative Writing Workshop at COLING 22
Reviewer: EMNLP, NAACL, NeurIPS, ICLR, AISTATS
Member: Yale Women in School of Engineering & Applied Science

Mentorship

If you are interested in collaborating with me, please complete the Recuriting Task and drop me an email!

Current: Frank Li (Yale CS & Math), Xuyuan Xiong (Shanghai Jiaotong University)
Past: Yilun Zhao (now at Yale CS), Zhenting Qi (now at Harvard Data Science), Hailey Schoelkopf (now at Anthropic), Wenfei Zhou (now at Nvidia)

Miscellaneous

I have lived in Luoyang, Tianjin, Guangzhou, Shenzhen, Los Angeles, Singapore, New Haven, New York, Mountain View, San Diego and Palo Alto.
I am a portrait photographer.
I am a multi-instrumentalist (Piano/Guzheng). My recent Guzheng performance.
Open Source Society Technical Director, Hackers for Charity Subcommittee

Simeng Han 韩斯萌