Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: alignment
此标签下有4条笔记。
2026年5月11日
Training Language Models to Follow Instructions with Human Feedback
InstructGPT
RLHF
alignment
instruction-following
OpenAI
2026年5月07日
Qwen 技术报告
llm
qwen
alibaba
pretraining
alignment
rlhf
code-generation
math-reasoning
2026年4月30日
RLHF
RLHF
alignment
PPO
DPO
RL
2026年4月30日
大语言模型基础
LLM
transformer
scaling
alignment