新一代推理模型“Step Reasoner mini”亮相性能超越OpenAI对手

来源：网界网 | 2025-01-17 17:53:05

　　今天，阶跃星辰公司宣布推出其自研的推理模型——Step Reasoner mini(简称Step R-mini)。该模型在多个数学基准测试中表现突出，尤其是在AIME和Math等领域的测试成绩上，成功超越了目前广泛使用的o1-preview，并在LiveCodeBench的代码任务中也取得了更好的效果，表现出较为明显的优势，堪比OpenAI的o1-mini。

　　Step Reasoner mini的亮相标志着阶跃星辰在推理模型领域的一次重要突破。该模型通过大规模的强化学习训练，结合On-Policy(同策略)强化学习算法，使其不仅在解决数学、逻辑推理、编程代码等任务时展现出强大的准确性，还能够在文学创作和日常对话中展现出较高的创造性和人性化的交互能力。

　　据公司介绍，Step Reasoner mini的成功得益于其在训练过程中的创新方法。在强化学习训练的基础上，Step Reasoner mini利用先进的算法架构，能够更好地结合深度学习和强化学习的优势，以应对复杂的推理问题和多样的任务需求。这使得它不仅能够精准解答数学难题，还能处理诸如逻辑推理和程序代码生成等高难度任务，同时具备与人类进行自然对话的能力。

　　在日常应用场景中，Step Reasoner mini的表现尤为亮眼。其不仅在计算机科学领域的代码任务中表现出色，在处理数学公式、逻辑推理题目时也能够快速准确地给出答案。此外，模型的创新性体现在它还能够进行创意性的写作，生成丰富的文学内容，满足用户在文学创作领域的需求。无论是生成短篇故事、诗歌，还是参与日常聊天，Step Reasoner mini都展现出了相较于其他现有推理模型的优越性。

每日精选

新一代推理模型“Step Reasoner mini”亮相性能超越OpenAI对手

　　今天，阶跃星辰公司宣布推出其自研的推理模型——Step Reasoner mini(简称Step R-mini)。该模型在多个数学基准测试中表现突出，尤其

2025-01-17
佰维发布X570 Pro“天启”PCIe 5.0固态硬盘顺序读取速度突破14GB/s

　　在2025年国际消费电子展(CES)上，国内存储模组品牌佰维带来了全新的X570 Pro天启PCIe 5 0固态硬盘。这款固态硬盘搭载了慧荣最新的6nm

2025-01-17
小米电动滑板车5 Pro亮相续航里程为60公里

　　小米推出了电动滑板车 5 Pro，这款机型旨在让城市通勤更加方便。这款踏板车现已在小米的全球网站上上市，为全球骑手带来了性能、安全

2025-01-17
据传三星Galaxy S26系列采用硅碳电池技术

　　消费电子设备使用锂离子 (Li-ion) 电池已有十多年了。最近，智能手机制造商转向一种新的电池技术：硅碳负极电池。它使可折叠设备在折

2025-01-17
天猫精灵与夸克团队联合探索AI硬件新领域 AI眼镜成重点方向

　　天猫精灵硬件团队与夸克产品团队的整合，为智能硬件领域注入了新的活力。此次合并标志着两大团队将在人工智能技术的基础上，开展一系列

2025-01-17
比亚迪发布汉L与唐L 全面升级“龙颜美学”设计

　　在今日下午的比亚迪汉L和唐L设计发布会上，比亚迪王朝网销售事业部总经理路天宣布，品牌标志性的龙颜美学设计理念迎来了新的进化。这一

2025-01-17
小红书日活跃用户激增成为“TikTok难民”新聚集地

　　根据Similarweb最新的数据显示，截至2025年1月13日，小红书在美国的日活跃用户数大幅攀升，达到了约340万，比1月12日的70万和一周前的3

2025-01-17
波音公司宣布恢复已暂停的777X宽体喷气式飞机的测试

　　根据路透社1月16日的报道，波音公司宣布恢复其777X宽体喷气式飞机的测试工作，这是自2023年8月停飞以来的首次飞行测试。这标志着该机型

2025-01-17
黑峡谷发布Z2 Lite机械键盘具备三模连接和凯华定制木兰轴

　　黑峡谷发布了全新Z2 Lite机械键盘，定价479元，首发预约将在今晚8点正式开启。这款键盘在外观设计和功能性上都做了不少创新，尤其适合

2025-01-17
特斯拉推出春节归乡超级充电卡限时限量发售

　　特斯拉官方通过微博宣布，春节归乡超级充电卡正式上线，旨在为广大车主提供便捷的充电服务。用户可以通过特斯拉 Tesla App 或微信小

2025-01-17

新一代推理模型“Step Reasoner mini”亮相性能超越OpenAI对手

相关阅读

每日精选