Magistral — Mistral AI推出的首个推理模型
Hacker News 摘要原标题:Magistral — the first reasoning model by Mistral AI
Mistral AI近日宣布推出Magistral,这是他们首个推理模型,体现了领域特定、透明和多语言的推理能力。传统的线性思维无法完全模拟人类思考的复杂性,而推理语言模型的出现使得我们能够将复杂的问题分析和深刻理解的任务委托给人工智能,从而提升解决问题的能力。然而,目前这一领域仍然处于早期阶段,早期模型存在缺乏专业深度、透明度有限及推理一致性不佳等问题。
Magistral的发布具有重要意义,提供了开放版和企业版。Magistral被设计用来进行符合人类思维方式的推理,同时在多个专业领域内具备丰富的专业知识、可验证的透明推理,以及深厚的多语言灵活性。具体亮点包括:
• Magistral是一款双版本发布的模型,专注于现实世界的推理和反馈驱动的改进。
• 包括Magistral Small(24B参数的开源版本)和Magistral Medium(更强大的企业版本)。
• Magistral Medium在AIME2024测试中得分73.6%,而Magistral Small得分70.7%。
• 其推理过程原生支持多种语言,适用于从结构化计算、程序逻辑到决策树和规则系统的广泛企业用例。
• 新的思想模式和闪电反馈功能使得在Le Chat中接收回应的速度比大多数竞争对手快10倍。
• 发布支持一篇最新论文,该论文涵盖了对Magistral的综合评估、训练基础设施、强化学习算法及新的观察结果。
Magistral经过精细调整,优化了多步骤逻辑,提升了解释性,并提供用户语言中的可追溯思维过程,这不同于一般模型。模型在多种语言中保持高保真推理能力,尤其适合英语、法语、西班牙语、德语、意大利语、阿拉伯语、俄语和简体中文。在Le Chat中,Magistral Medium利用闪电回答功能实现了比大多数竞争对手快10倍的令牌吞吐量,支持实时推理和用户反馈。
应用场景方面,Magistral适用于需要较长思考过程和更高精准度的用途,从法律研究和金融预测到软件开发和创造性写作,解决了需要透明度和准确性的多步挑战。它特别适合于研究、战略规划、运营优化和数据驱动决策,能够执行基于多重因素的风险评估和建模,或在约束条件下计算最佳交付窗口。
对于需合规的行业(如法律、金融、医疗和政府)专业人士,Magistral提供可追溯的推理,确保每个结论都能通过逻辑步骤进行追溯,以满足高风险环境的审计需求。此外,它在编码和开发用例中显示出优势,通过序列化的多步骤操作显著提高了项目规划、后端架构、前端设计和数据工程能力。
Magistral Small是开源模型,可以在Apache 2.0许可证下自我部署,并可以从Hugging Face下载。用户可以在Le Chat或La Plateforme上试用Magistral Medium的预览版本。Magistral Medium还将在Amazon SageMaker、IBM WatsonX、Azure AI和Google Cloud Marketplace上提供。对于企业及定制解决方案,包括本地部署,请联系销售团队。
Mistral AI期待更多社区参与,推动思考语言模型的进一步发展,并欢迎对加入团队感兴趣的申请者。