Jianzong Wu's picture

1 19 7

Jianzong Wu PRO

jianzongwu

·

https://jianzongwu.github.io

jianzongwu

AI & ML interests

Multimodal Learning

Recent Activity

upvoted a paper 1 day ago

MMaDA-Parallel: Multimodal Large Diffusion Language Models for Thinking-Aware Editing and Generation

upvoted a paper 27 days ago

Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

upvoted a paper 29 days ago

Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs

View all activity

Organizations

None yet

Papers 4

arxiv:2504.05979

arxiv:2412.07589

arxiv:2406.20085

arxiv:2406.17758

models 4

jianzongwu/DiffSensei

Updated Dec 11, 2024 • 40

jianzongwu/MotionBooth

Updated Jun 28, 2024

jianzongwu/lgvi

Text-to-Image • Updated Jun 4, 2024 • 2

jianzongwu/lgvi-i

Text-to-Image • Updated Mar 7, 2024

datasets 3

jianzongwu/MangaZero

Viewer • Updated Dec 11, 2024 • 32.7k • 113 • 31

jianzongwu/MotionBooth

Preview • Updated Nov 22, 2024 • 45

jianzongwu/rovi

Updated Mar 5, 2024 • 53 • 3