Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: 图像生成
此标签下有15条笔记。
2026年4月30日
Denoising Diffusion Probabilistic Models
论文
扩散模型
图像生成
生成模型
score-matching
2026年4月30日
Emu3.5: Native Multimodal Models are World Learners
论文
多模态
原生多模态
世界模型
自回归
扩散模型
GRPO
图像生成
Tokens
2026年4月30日
FLUX.1 Kontext: Flow Matching Rectified Transformer for Unified Image Generation and Editing
论文
图像生成
图像编辑
流匹配
Rectified-Flow
统一模型
DiT
2026年4月30日
Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding
论文
多模态
统一模型
离散扩散
DiMOO
GRPO
图像生成
Params
2026年4月30日
OmniGen2: Towards Instruction-Aligned Multimodal Generation
论文
多模态
图像生成
图像编辑
In-Context生成
GRPO
指令对齐
Omni-RoPE
2026年4月30日
Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model
论文
图像生成
双语生成
中英文
DiT
LLM文本编码器
RLHF
2026年4月30日
Seedream 3.0 Technical Report
论文
图像生成
双语生成
DiT
REPA
流匹配
VLM奖励模型
2026年4月30日
Seedream 4.0: Toward Next-generation Multimodal Image Generation
论文
图像生成
图像编辑
多模态
多图生成
高效DiT
VAE
2026年4月30日
扩散模型架构比较 UNet vs DiT
扩散模型
UNet
DiT
架构比较
图像生成
2026年4月30日
DiT 扩散 Transformer
DiT
扩散模型
Transformer
架构
图像生成
2026年4月30日
FLUX
FLUX
扩散模型
Flow-Matching
图像生成
DiT
Black-Forest-Labs
2026年4月30日
Emerging Properties in Unified Multimodal Pretraining
论文
多模态
统一模型
MoT
Flow-Matching
涌现
图像生成
图像编辑
2026年4月30日
Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding
论文
多模态
统一模型
离散扩散
LLaDA
图像生成
图像编辑
Self-GRPO
2026年4月30日
OmniGen2: Towards Instruction-Aligned Multimodal Generation
论文
多模态
图像生成
图像编辑
In-Context生成
GRPO
指令对齐
Omni-RoPE
2026年4月30日
Tuna-2: Pixel Embeddings Beat Vision Encoders for Multimodal Understanding and Generation
论文
多模态
统一模型
Encoder-Free
像素嵌入
图像生成
图像编辑