Blog1

标签: 开源

此标签下有7条笔记。

  • 2026年4月30日

    DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

    • 论文
    • LLM
    • 缩放定律
    • 开源
    • 预训练
  • 2026年4月30日

    DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence

    • 论文
    • 代码模型
    • MoE
    • 开源
    • Code-Intelligence
  • 2026年4月30日

    LLaMA: Open and Efficient Foundation Language Models

    • 论文
    • 大语言模型
    • 开源
    • 高效训练
    • Scaling-Law
  • 2026年4月30日

    The Llama 3 Herd of Models

    • 论文
    • 大语言模型
    • 开源
    • 多语言
    • Tool-Use
    • Llama
  • 2026年4月30日

    Qwen3 Technical Report

    • 论文
    • LLM
    • MoE
    • 推理
    • 多语言
    • 开源
    • 蒸馏
  • 2026年4月30日

    gpt-oss-120b & gpt-oss-20b Model Card

    • 论文
    • 推理模型
    • MoE
    • 开源
    • MXFP4
    • 安全对齐
    • Agent
  • 2026年4月30日

    olmOCR: Unlocking Trillions of Tokens in PDFs with Vision Language Models

    • 论文
    • OCR
    • 文档解析
    • VLM
    • PDF
    • 开源
    • 语言模型训练数据

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community