Takashi Ishida's picture

3

Takashi Ishida

tksii

·

https://takashiishida.github.io

AI & ML interests

None yet

Recent Activity

upvoted a paper 4 days ago

Mitigating Reward Hacking in RLHF via Advantage Sign Robustness

authored a paper 5 days ago

Mitigating Reward Hacking in RLHF via Advantage Sign Robustness

authored a paper 5 days ago

LLM Routing with Dueling Feedback

View all activity

Organizations

tksii 's models

None public yet