Langlin Huang's picture

Langlin Huang

shrango

·

https://shrango.github.io/

AI & ML interests

LLM Reasoning, Machine Translation

Recent Activity

upvoted a paper 2 days ago

Small RL Controller, Large Language Model: RL-Guided Adaptive Sampling for Test-Time Scaling

upvoted a paper 15 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

upvoted a paper 17 days ago

Process Rewards with Learned Reliability

View all activity

Organizations

upvoted a paper 2 days ago

Small RL Controller, Large Language Model: RL-Guided Adaptive Sampling for Test-Time Scaling

Paper • 2606.03102 • Published 4 days ago • 13

upvoted a paper 15 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

Paper • 2605.21468 • Published 17 days ago • 50

upvoted a paper 17 days ago

Process Rewards with Learned Reliability

Paper • 2605.15529 • Published 22 days ago • 53

upvoted a paper 25 days ago

G-Zero: Self-Play for Open-Ended Generation from Zero Data

Paper • 2605.09959 • Published 26 days ago • 17

upvoted a paper 26 days ago

LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling

Paper • 2605.08083 • Published 29 days ago • 69

upvoted a paper 29 days ago

Nonsense Helps: Prompt Space Perturbation Broadens Reasoning Exploration

Paper • 2605.05566 • Published 30 days ago • 37

updated a model about 1 month ago

shrango/fake_english_advshape_policyshape_qwen3-1.7b-base

2B • Updated May 3 • 8

published a model about 1 month ago

shrango/fake_english_advshape_policyshape_qwen3-1.7b-base

2B • Updated May 3 • 8

updated a model about 1 month ago

shrango/ascii_advshape_policyshape_qwen3-1.7b-base

2B • Updated May 2 • 6

published a model about 1 month ago

shrango/ascii_advshape_policyshape_qwen3-1.7b-base

2B • Updated May 2 • 6

updated a model about 1 month ago

shrango/markovify_advshape_policy_shape_qwen3-1.7b-base

2B • Updated May 1 • 8

published a model about 1 month ago

shrango/markovify_advshape_policy_shape_qwen3-1.7b-base

2B • Updated May 1 • 8

updated a model about 1 month ago

shrango/random_la_advshape_policyshape_qwen3-1.7b-base

2B • Updated Apr 30 • 6

published a model about 1 month ago

shrango/random_la_advshape_policyshape_qwen3-1.7b-base

2B • Updated Apr 30 • 6

updated a model about 1 month ago

shrango/lorem_advshape_qwen3-1.7b-base

2B • Updated Apr 26 • 7

published a model about 1 month ago

shrango/lorem_advshape_qwen3-1.7b-base

2B • Updated Apr 26 • 7

updated a model about 1 month ago

shrango/lorem_policy_shape_adv_shape_qwen2.5-math_7b

8B • Updated Apr 25 • 3

published a model about 1 month ago

shrango/lorem_policy_shape_adv_shape_qwen2.5-math_7b

8B • Updated Apr 25 • 3

updated a model about 1 month ago

shrango/lorem_advshape_policyshape_qwen2.5_math_7b_170

published a model about 1 month ago

shrango/lorem_advshape_policyshape_qwen2.5_math_7b_170