Blog1

标签: 统一模型

此标签下有11条笔记。

2026年4月30日
FLUX.1 Kontext: Flow Matching Rectified Transformer for Unified Image Generation and Editing
2026年4月30日
Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding
2026年4月30日
Show-o2: Improved Native Unified Multimodal Models
2026年4月30日
Tuna-2: Pixel Embeddings Beat Vision Encoders for Multimodal Understanding and Generation
2026年4月30日
UniWorld-V1: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation
2026年4月30日
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities
2026年4月30日
多模态模型的最终形态是原生统一还是模块化组装
2026年4月30日
Emerging Properties in Unified Multimodal Pretraining
2026年4月30日
Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding
2026年4月30日
Tuna-2: Pixel Embeddings Beat Vision Encoders for Multimodal Understanding and Generation
2026年4月30日
UniWorld-V1: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community