Blog

Rlhf

Filter

All Posts self-improvement18 machine-learning18 stanford-cs33618 letters15 deep-learning15 motivation8 discipline7 mindset6 books5 focus4 productivity4 action4 +74 more

Tutorials·January 19, 2026·12 min read

CS336 Notes: Lecture 17 - Alignment, RL 2

RL foundations for LLMs: policy gradients, baselines for variance reduction, GRPO implementation details, and practical training considerations for reasoning models.

machine-learning alignment stanford-cs336 rlhf

Read

Tutorials·January 18, 2026·16 min read

CS336 Notes: Lecture 16 - Alignment, RL 1

Advanced RL for alignment: PPO implementation details, GRPO as a simpler alternative, overoptimization risks, and case studies from DeepSeek R1, Kimi K1.5, and Qwen 3.

machine-learning alignment stanford-cs336 rlhf

Read

Tutorials·January 17, 2026·10 min read

CS336 Notes: Lecture 15 - Alignment, SFT and RLHF

Post-training for helpful assistants: supervised fine-tuning on instructions, safety tuning, RLHF with preference data, PPO vs DPO, and the challenges of learning from human feedback.

machine-learning alignment stanford-cs336 rlhf

Read