admaxing's picture

11 12

admaxing PRO

dongou

·

https://dongou.tech/

AI & ML interests

None yet

Organizations

None yet

upvoted a paper 3 months ago

UI-Venus Technical Report: Building High-performance UI Agents with RFT

Paper • 2508.10833 • Published Aug 14 • 43

upvoted 2 papers 6 months ago

A Preliminary Study for GPT-4o on Image Restoration

Paper • 2505.05621 • Published May 8 • 11

G-FOCUS: Towards a Robust Method for Assessing UI Design Persuasiveness

Paper • 2505.05026 • Published May 8 • 17

upvoted 3 papers 7 months ago

T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT

Paper • 2505.00703 • Published May 1 • 44

Towards Understanding Camera Motions in Any Video

Paper • 2504.15376 • Published Apr 21 • 158

DreamO: A Unified Framework for Image Customization

Paper • 2504.16915 • Published Apr 23 • 24

upvoted a paper 10 months ago

VideoChat-Flash: Hierarchical Compression for Long-Context Video Modeling

Paper • 2501.00574 • Published Dec 31, 2024 • 6

upvoted an article 11 months ago

Article

MotionLCM-V2: Improved Compression Rate for Multi-Latent-Token Diffusion

Dec 11, 2024

•

17

upvoted a paper about 1 year ago

Fish-Speech: Leveraging Large Language Models for Advanced Multilingual Text-to-Speech Synthesis

Paper • 2411.01156 • Published Nov 2, 2024 • 11

upvoted 2 papers over 1 year ago

mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models

Paper • 2408.04840 • Published Aug 9, 2024 • 34

SpreadsheetLLM: Encoding Spreadsheets for Large Language Models

Paper • 2407.09025 • Published Jul 12, 2024 • 139