Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: InstructGPT
此标签下有1条笔记。
2026年5月11日
Training Language Models to Follow Instructions with Human Feedback
InstructGPT
RLHF
alignment
instruction-following
OpenAI