Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: unified-multimodal
此标签下有17条笔记。
2026年4月30日
统一多模态模型架构比较
unified-multimodal
comparison
architecture
analysis
2026年4月30日
BAGEL
unified-multimodal
bytedance-seed
mot
interleaved-generation
2026年4月30日
Lumina-DiMOO
unified-multimodal
discrete-diffusion
shanghai-ai-lab
2026年4月30日
OmniGen2
unified-multimodal
instruction-alignment
baai
2026年4月30日
Show-o2
unified-multimodal
show-lab
nus
flow-matching
2026年4月30日
Tuna-2
unified-multimodal
encoder-free
pixel-space
meta-ai
2026年4月30日
UniWorld-V1
unified-multimodal
semantic-encoder
pku
image-editing
2026年4月30日
BAGEL 图文交错生成能力
unified-multimodal
interleaved-generation
BAGEL
comparison
2026年4月30日
关于统一多模态模型的问题
unified-multimodal
open-questions
2026年4月30日
BAGEL: Emerging Properties in Unified Multimodal Pretraining
unified-multimodal
bagel
mot
emergent-properties
2026年4月30日
Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding
unified-multimodal
discrete-diffusion
llima
lumina-dmoo
2026年4月30日
OmniGen2: Towards Instruction-Aligned Multimodal Generation
unified-multimodal
omnigen
instruction-alignment
grpo
2026年4月30日
Show-o2: Improved Native Unified Multimodal Models
unified-multimodal
show-o
flow-matching
3d-vae
2026年4月30日
Tuna-2: Pixel Embeddings Beat Vision Encoders for Multimodal Understanding and Generation
unified-multimodal
encoder-free
pixel-space
tuna-2
2026年4月30日
UniWorld-V1: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation
unified-multimodal
semantic-encoder
image-editing
uniworld
2026年4月30日
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities
unified-multimodal
survey
taxonomy
2026年4月30日
扩散模型图像编辑与生成
diffusion
image-editing
image-generation
DiT
unified-multimodal
reasoning
benchmark
agent