Blog1
Search
搜索
暗色模式
亮色模式
探索
标签: OCR
此标签下有8条笔记。
2026年4月30日
Kimi-VL Technical Report
论文
多模态
VLM
MoE
OCR
Agent
长上下文
MoonViT
2026年4月30日
OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning
论文
OCR
Benchmark
多模态
LMM
文字识别
文本定位
推理
2026年4月30日
OmniDocBench: Benchmarking Diverse PDF Document Parsing with Comprehensive Annotations
论文
文档解析
Benchmark
OCR
PDF
多模态
2026年4月30日
olmOCR: Unlocking Trillions of Tokens in PDFs with Vision Language Models
论文
OCR
文档解析
VLM
PDF
开源
语言模型训练数据
2026年4月30日
PDF 文档解析
PDF
OCR
document-parsing
VLM
2026年4月30日
OCRBench v2: An Improved Benchmark for Evaluating LMMs on Visual Text
benchmark
OCR
LMM
text-recognition
2026年4月30日
olmOCR: Unlocking Trillions of Tokens in PDFs with VLMs
PDF
OCR
VLM
toolkit
open-source
2026年4月30日
多模态 Benchmark 与评估
benchmark
OCR
document-parsing
evaluation