Blog1

标签: reinforcement-learning

此标签下有8条笔记。

  • 2026年5月07日

    GLM-5 从 Vibe Coding 到 Agentic Engineering

    • llm
    • agent
    • coding
    • glm
    • zhipu
    • agentic-engineering
    • reinforcement-learning
    • moe
  • 2026年5月07日

    Gen-Searcher

    • image-generation
    • agent
    • reinforcement-learning
    • search
    • multimodal
    • GRPO
  • 2026年5月06日

    Self-Evolving Agents 自演化智能体

    • agent
    • self-evolving
    • reinforcement-learning
    • lifelong-learning
  • 2026年5月06日

    Self-Evolving Agents 综述

    • agent
    • self-evolving
    • reinforcement-learning
    • survey
  • 2026年4月30日

    VisionCreator

    • image-generation
    • agent
    • MLLM
    • reinforcement-learning
    • Tencent
  • 2026年4月30日

    OneRec Technical Report

    • generative-recommendation
    • end-to-end
    • scaling-laws
    • reinforcement-learning
    • industrial-deployment
  • 2026年4月30日

    OneRec-V2 Technical Report

    • generative-recommendation
    • decoder-only
    • scaling-laws
    • reinforcement-learning
    • model-architecture
  • 2026年4月30日

    VisionCreator: A Native Visual-Generation Agentic Model

    • image-generation
    • agent
    • MLLM
    • reinforcement-learning
    • Tencent

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community