Tom's picture

6 5

Tom

TunaToro

·

AI & ML interests

None yet

Organizations

None yet

upvoted a paper 3 months ago

Reverse-Engineered Reasoning for Open-Ended Generation

Paper • 2509.06160 • Published Sep 7 • 148

upvoted 2 papers 4 months ago

VeriGUI: Verifiable Long-Chain GUI Dataset

Paper • 2508.04026 • Published Aug 6 • 158

PhysX: Physical-Grounded 3D Asset Generation

Paper • 2507.12465 • Published Jul 16 • 43

upvoted a paper 7 months ago

FormalMATH: Benchmarking Formal Mathematical Reasoning of Large Language Models

Paper • 2505.02735 • Published May 5 • 34

upvoted a paper 9 months ago

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published Feb 20 • 104

upvoted a paper over 1 year ago

PIN: A Knowledge-Intensive Dataset for Paired and Interleaved Multimodal Documents

Paper • 2406.13923 • Published Jun 20, 2024 • 24