Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: image-generation
此标签下有28条笔记。
2026年5月07日
Gen-Searcher
image-generation
agent
reinforcement-learning
search
multimodal
GRPO
2026年5月07日
PaperBanana
academic-illustration
agent
image-generation
scientific-figure
benchmark
2026年5月07日
Qwen-Image 技术报告
image-generation
qwen
alibaba
diffusion
multimodal
text-rendering
image-editing
2026年5月07日
Thinking with Visual Primitives
visual-reasoning
image-generation
primitives
multimodal
spatial-grounding
counting
topological-reasoning
2026年5月07日
Unify-Agent
image-generation
agent
multimodal
world-grounded
unified-model
2026年4月30日
ControlNet
image-generation
control
diffusion
foundational
DiT
2026年4月30日
EmotiCrafter
emotion
image-generation
valence-arousal
continuous-emotion
diffusion
model
2026年4月30日
GoT
image-generation
image-editing
reasoning
chain-of-thought
MLLM
2026年4月30日
Mind-Brush
image-generation
agent
reasoning
knowledge-retrieval
benchmark
2026年4月30日
OminiControl
image-generation
DiT
control
diffusion-transformer
minimal
2026年4月30日
Seedream 系列模型
Seedream
ByteDance
image-generation
image-editing
flow-matching
MMDiT
2026年4月30日
VisionCreator
image-generation
agent
MLLM
reinforcement-learning
Tencent
2026年4月30日
Adding Conditional Control to Text-to-Image Diffusion Models (ControlNet)
image-generation
control
diffusion
ControlNet
foundational
2026年4月30日
EmotiCrafter: Text-to-Emotional-Image Generation based on Valence-Arousal Model
emotion
image-generation
valence-arousal
continuous-emotion
diffusion
2026年4月30日
Generating Fearful Images: Investigating Potential Emotional Biases in Image-Generation Models
emotion
bias
AI-safety
image-generation
evaluation
2026年4月30日
GoT: Unleashing Reasoning Capability of Multimodal Large Language Model for Visual Generation and Editing
image-generation
image-editing
reasoning
chain-of-thought
MLLM
diffusion
2026年4月30日
Mind-Brush: Integrating Agentic Cognitive Search and Reasoning into Image Generation
image-generation
agent
reasoning
knowledge-retrieval
benchmark
2026年4月30日
OminiControl: Minimal and Universal Control for Diffusion Transformer
image-generation
DiT
control
diffusion-transformer
minimal
2026年4月30日
OpenGPT-4o-Image: A Comprehensive Dataset for Advanced Image Generation and Editing
image-generation
image-editing
dataset
GPT-4o
taxonomy
2026年4月30日
Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model
Seedream
image-generation
bilingual
DiT
flow-matching
text-rendering
2026年4月30日
Seedream 3.0 Technical Report
Seedream
image-generation
flow-matching
MMDiT
text-rendering
acceleration
2026年4月30日
Seedream 4.0: Toward Next-generation Multimodal Image Generation
Seedream
image-generation
image-editing
multimodal
DiT
flow-matching
acceleration
2026年4月30日
VisionCreator: A Native Visual-Generation Agentic Model
image-generation
agent
MLLM
reinforcement-learning
Tencent
2026年4月30日
情感计算与图像生成
emotion
image-generation
image-editing
affective-computing
AIM
2026年4月30日
扩散模型图像编辑与生成
diffusion
image-editing
image-generation
DiT
unified-multimodal
reasoning
benchmark
agent
2026年4月29日
多模态指令编辑与生成
image-editing
image-generation
multimodal
diffusion
2026年4月29日
DreamOmni2
model
diffusion
image-editing
image-generation
DiT
2026年4月29日
DreamOmni2: Multimodal Instruction-based Editing and Generation
image-editing
image-generation
diffusion
multimodal
VLM
DiT