Publications

Lizhou Fan, Wenyue Hua, Lingyao Li, Frank (Haoyang) Ling, Yongfeng Zhang (2023). NPHardEval: Benchmarking Reasoning Ability of Large Language Models via Complexity Classes.

PDF Code Project