zhangtao's picture

2 14 4

zhangtao

zhangtao-whu

·

https://github.com/zhang-tao-whu

zhang-tao-whu

AI & ML interests

segmentation

Recent Activity

upvoted a paper 27 days ago

Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

published a dataset 28 days ago

zhangtao-whu/coconut

upvoted a paper 29 days ago

Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs

View all activity

Organizations

upvoted a paper 27 days ago

Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

Paper • 2510.20579 • Published 27 days ago • 55

published a dataset 28 days ago

zhangtao-whu/coconut

Updated 28 days ago • 17

upvoted a paper 29 days ago

Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs

Paper • 2510.18876 • Published 29 days ago • 35

upvoted a paper about 1 month ago

DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training

Paper • 2510.11712 • Published Oct 13 • 30

liked a dataset 2 months ago

LucasFang/FLUX-Reason-6M

Viewer • Updated Sep 12 • 5.89M • 13k • 81

liked a dataset 3 months ago

cyberalchemist/PixelWeb

Updated May 21 • 75 • 5

updated 4 datasets 4 months ago

zhangtao-whu/DW

Updated Jul 27 • 7.37k • 1

zhangtao-whu/sft_parquet

Viewer • Updated Jul 23 • 10.2M • 31

zhangtao-whu/sft_parquet

Viewer • Updated Jul 23 • 10.2M • 31

zhangtao-whu/sft_parquet

Viewer • Updated Jul 23 • 10.2M • 31