siyan zhao's picture

1 2 3

siyan zhao

siyanzhao

·

siyan_zhao

AI & ML interests

Machine Learning

Recent Activity

upvoted a paper about 1 month ago

SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models

authored a paper 2 months ago

d1: Scaling Reasoning in Diffusion Large Language Models via Reinforcement Learning

authored a paper 2 months ago

Inpainting-Guided Policy Optimization for Diffusion Large Language Models

View all activity

Organizations

upvoted a paper about 1 month ago

SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models

Paper • 2510.09541 • Published Oct 10 • 14

upvoted a paper 2 months ago

Inpainting-Guided Policy Optimization for Diffusion Large Language Models

Paper • 2509.10396 • Published Sep 12 • 15