Together AI 和 Agentica 的研究人员发布了 DeepCoder-14B,这是一个新的编程模型,其性能可与 OpenAI 的 o3-mini 等领先的专有模型相媲美。 该模型基于 DeepSeek-R1 构建,为将高性能代码生成和推理能力集成到实际应用中提供了更大的灵活性。重要的是,研究团队已完全开源 ...
此外,DeepCoder-14B-Preview 采用了迭代上下文扩展技术,使模型能够从较短的上下文长度开始学习,然后逐步泛化到更长的上下文。该模型的上下文窗口从 16K 扩展到 32K,最终在 64K上下文中评估时达到了60.6%的准确率。