Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: benchmark
此标签下有16条笔记。
2026年5月07日
PaperBanana
academic-illustration
agent
image-generation
scientific-figure
benchmark
2026年4月30日
EmoArt
emotion
dataset
art
benchmark
2026年4月30日
Mind-Brush
image-generation
agent
reasoning
knowledge-retrieval
benchmark
2026年4月30日
Step1X-Edit
image-editing
MLLM
diffusion
open-source
benchmark
2026年4月30日
EmoArt: A Multidimensional Dataset for Emotion-Aware Artistic Generation
emotion
dataset
art
diffusion
benchmark
valence-arousal
2026年4月30日
ImgEdit: A Unified Image Editing Dataset and Benchmark
image-editing
dataset
benchmark
unified
2026年4月30日
Mind-Brush: Integrating Agentic Cognitive Search and Reasoning into Image Generation
image-generation
agent
reasoning
knowledge-retrieval
benchmark
2026年4月30日
OCRBench v2: An Improved Benchmark for Evaluating LMMs on Visual Text
benchmark
OCR
LMM
text-recognition
2026年4月30日
OmniDocBench: Benchmarking Diverse PDF Document Parsing
benchmark
document-parsing
PDF
VLM
2026年4月30日
OpenOneRec Technical Report: An Open Foundation Model and Benchmark to Accelerate Generative Recommendation
generative-recommendation
foundation-model
benchmark
scaling-laws
open-source
2026年4月30日
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing (RISEBench)
image-editing
reasoning
benchmark
evaluation
LMM
2026年4月30日
Step1X-Edit: A Practical Framework for General Image Editing
image-editing
MLLM
diffusion
benchmark
open-source
2026年4月30日
WEAVE: Unleashing and Benchmarking the In-context Interleaved Comprehension and Generation
multimodal
comprehension
generation
benchmark
multi-turn
interleaved
2026年4月30日
WorldEdit: Towards Open-World Image Editing with a Knowledge-Informed Benchmark
image-editing
benchmark
causal-reasoning
world-knowledge
2026年4月30日
多模态 Benchmark 与评估
benchmark
OCR
document-parsing
evaluation
2026年4月30日
扩散模型图像编辑与生成
diffusion
image-editing
image-generation
DiT
unified-multimodal
reasoning
benchmark
agent