1月25日消息,中国电信人工智能研究院发布了“复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。
该模型采用强化学习训练方法,结合探索和反思范式,显著提升了逻辑推理和数学推导的准确性。
在多项权威评测中,TeleAI-t1-preview表现优异,例如在美国数学竞赛AIME2024和MATH500测试中,分别获得60分和93.8分,大幅超越OpenAI的o1-preview和GPT-4o等标杆模型。
在研究生级别问答测试GPQA Diamond中,其得分也超过了GPT-4o,并与Claude3.5 Sonnet的性能相当。
TeleAI-t1-preview能够处理复杂的古文数学题,如《九章算术》中的题目。它先将文言文进行理解和简化,转换成现代汉语,再进行数学推导并给出答案。
这一过程展示了其在形象思维与抽象思维结合方面的能力,以及对古今单位换算的严谨处理。
TeleAI-t1-preview的发布标志着中国电信在人工智能领域的重大突破,为复杂推理任务提供了新的解决方案。
文章来源:
快科技
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!