Blog1
Search
搜索
暗色模式
亮色模式
探索
Home
❯
Wiki
❯
Concepts
文件夹: Wiki/Concepts
此文件夹下有40条笔记。
2026年5月06日
Self-Evolving Agents 自演化智能体
agent
self-evolving
reinforcement-learning
lifelong-learning
2026年5月03日
Agentic Harness Engineering (AHE)
agent
coding-agent
harness
self-evolution
observability
2026年5月03日
Harness 编码 Agent 线束
agent
coding-agent
harness
engineering
2026年5月01日
Agent 图像编辑
agent
image-editing
tool-use
reasoning
planning
2026年5月01日
VQ-VAE 离散 Token 化
tokenization
discrete-representation
VQ
generative-model
quantization
2026年5月01日
审美评估与推理
aesthetic
evaluation
IAA
RL
image-quality
2026年5月01日
编辑数据合成方法
image-editing
dataset
data-synthesis
methodology
2026年4月30日
AI 生成图像的情感偏差
emotion
bias
AI-safety
evaluation
2026年4月30日
CLIP 对比语言图像预训练
CLIP
多模态
对比学习
零样本
视觉语言
OpenAI
2026年4月30日
CTR 预估
recommender-systems
CTR
ranking
2026年4月30日
Chain-of-Thought 思维链
chain-of-thought
prompting
reasoning
emergent-ability
2026年4月30日
DPO 直接偏好优化
DPO
RLHF
对齐
偏好学习
2026年4月30日
DiT 扩散 Transformer
DiT
扩散模型
Transformer
架构
图像生成
2026年4月30日
Flow Matching
flow-matching
CNF
generative-model
optimal-transport
2026年4月30日
GPT 系列模型
GPT
OpenAI
LLM
generation
2026年4月30日
GRPO 分组相对策略优化
GRPO
RL
强化学习
推理模型
DeepSeek
PPO
2026年4月30日
LLM Agent 架构
agent
LLM
architecture
2026年4月30日
LoRA 低秩适配
LoRA
微调
高效训练
LLM
Stable-Diffusion
2026年4月30日
MAE 掩码自编码器
MAE
自监督学习
ViT
CV
何恺明
2026年4月30日
MLA 多头潜在注意力
MLA
注意力机制
KV-cache
推理效率
DeepSeek
MoE
2026年4月30日
MoE 混合专家模型
MoE
架构
DeepSeek
Kimi
Qwen
Google
Switch-Transformer
2026年4月30日
NSA 原生稀疏注意力
NSA
稀疏注意力
DeepSeek
长上下文
硬件对齐
2026年4月30日
PDF 文档解析
PDF
OCR
document-parsing
VLM
2026年4月30日
RAG 检索增强生成
RAG
检索增强
知识密集
DPR
幻觉
可追溯性
2026年4月30日
RLHF
RLHF
alignment
PPO
DPO
RL
2026年4月30日
RoPE 旋转位置编码
position-encoding
RoPE
transformer
LLM
2026年4月30日
Scaling Laws
scaling
LLM
compute-optimal
Chinchilla
2026年4月30日
Valence-Arousal 情感模型
emotion
psychology
continuous-emotion
valence
arousal
2026年4月30日
原生多模态模型
native-multimodal
next-token-prediction
unified-model
2026年4月30日
多模态 Agent
Agent
多模态
Kimi
DeepSeek
工具使用
2026年4月30日
多模态 Embedding 模型
embedding
multimodal
retrieval
contrastive-learning
2026年4月30日
多模态对比学习
contrastive-learning
multimodal
CLIP
SigLIP
2026年4月30日
情感图像编辑
emotion
image-editing
AIM
IET
2026年4月30日
扩散模型原理
diffusion
generative-model
DDPM
2026年4月30日
推理模型与强化学习
推理模型
RL
GRPO
CoT
强化学习
2026年4月30日
测试时计算扩展
test-time-compute
推理模型
scaling
MiniMax
DeepSeek
2026年4月30日
生成式推荐
recommender-systems
generative-model
paradigm
2026年4月30日
知识蒸馏
知识蒸馏
推理模型
模型压缩
能力迁移
DeepSeek
Kimi
2026年4月29日
llm-wiki-pattern
meta
methodology
knowledge-management
llm
2026年4月29日
多模态指令编辑与生成
image-editing
image-generation
multimodal
diffusion