Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: reinforcement-learning
此标签下有8条笔记。
2026年5月07日
GLM-5 从 Vibe Coding 到 Agentic Engineering
llm
agent
coding
glm
zhipu
agentic-engineering
reinforcement-learning
moe
2026年5月07日
Gen-Searcher
image-generation
agent
reinforcement-learning
search
multimodal
GRPO
2026年5月06日
Self-Evolving Agents 自演化智能体
agent
self-evolving
reinforcement-learning
lifelong-learning
2026年5月06日
Self-Evolving Agents 综述
agent
self-evolving
reinforcement-learning
survey
2026年4月30日
VisionCreator
image-generation
agent
MLLM
reinforcement-learning
Tencent
2026年4月30日
OneRec Technical Report
generative-recommendation
end-to-end
scaling-laws
reinforcement-learning
industrial-deployment
2026年4月30日
OneRec-V2 Technical Report
generative-recommendation
decoder-only
scaling-laws
reinforcement-learning
model-architecture
2026年4月30日
VisionCreator: A Native Visual-Generation Agentic Model
image-generation
agent
MLLM
reinforcement-learning
Tencent