130 lines
6.3 KiB
Markdown
130 lines
6.3 KiB
Markdown
# 会头脑风暴的 AI — 国内首个并行思考模型 问小白o4 来啦!
|
||
|
||
本文转载自: [会头脑风暴的 AI — 国内首个并行思考模型 问小白o4 来啦!](https://mp.weixin.qq.com/s/lOuFggxvgvmDy7jbNHygKg)
|
||
|
||

|
||
|
||
作为国内首个并行思考模型,问小白o4 最大的本事是能同时开八个“脑洞”琢磨你的问题,自动筛选最优思考路径,答案精准度飙升!
|
||
|
||
现Web/APP端全量上线啦!访问官网 wenxiaobai.com,即可体验全新满血版 问小白o4 模型,你可以将常用的大模型工具切换至 「小白o4」,体验Gemini 2.5 Deep Think顶级模型(月费约¥1800)同等先进的头脑风暴能力。
|
||
|
||
🌍 打破传统推理模型局限
|
||
|
||
问小白o4 是由问小白团队提出的第四代开源推理范式(4th open-sourced reasoning form)构建而成,融合了“Long‑CoT 强化学习”与“过程奖励学习(Process Reward Learning)”的端到端训练机制,使模型同时具备深度推理与高质量思考过程筛选能力。
|
||
|
||

|
||
|
||
* 多:想得更多,给得更多
|
||
|
||
问小白o4 同时启动8条并行思考路径,如同一个高效的“头脑风暴”团队,从不同角度、运用不同策略同步探索解题思路,让‘一次到位’成为默认体验。
|
||
|
||
* 快:轻量模型,给得更快
|
||
|
||
基于极致的模型压缩与引擎加速,问小白o4 的打字速度相较DeepSeek R1提升70%,显著降低了获取优质回答的时间成本。
|
||
|
||
* 好:优中选优,给得更好
|
||
|
||
基于最优思考的回答,问小白o4 在复杂任务上的性能显著超过OpenAI o3-mini-medium、Claude Opus 4,大幅提升回答的正确率与可解释性。
|
||
|
||

|
||
|
||
📈 模型性能提升
|
||
|
||
问小白 o4 是一款具备更强推理能力、更擅长处理复杂任务的Dense架构基础模型。作为当前开源复杂推理能力最强的模型之一,问小白 o4 以32B参数量在复杂数学和代码编程任务上实现了新的性能突破。
|
||
|
||

|
||
|
||
* 为了确保评估的稳定性,我们以avg\@64作为测试精度
|
||
|
||
1. 什么样的思考过程会被 问小白o4 的大脑选中?
|
||
|
||

|
||
|
||

|
||
|
||
2. 基于 问小白o4 强大的推理能力,能在哪些场景获得更好的体验?
|
||
|
||
将你的问题交给 问小白o4,它会自动构建不同思考过程,并筛选最优质的思考过程,基于此为你提供最佳解答。你无需手动多次重新生成选择最佳的结果,因为这一切 问小白o4 会自动帮你完成!
|
||
|
||
学科试题更准确
|
||
|
||
问小白o4 能够抽取题目知识点并对齐通用解法范式,结合策略合成与自证校验,自动匹配最优解题方法,实现更高准确率与更强泛化能力的智能解题。
|
||
|
||

|
||
|
||
> 思考1:分步硬拆造成重复,结果错误 ❌
|
||
>
|
||
> 思考2:过程层层套算,推理链条长,存在大量冗余 ❌
|
||
>
|
||
> .......
|
||
>
|
||
> 思考8:补集法与分类法联合验证,准确且高效✅→ ★最优解★
|
||
|
||
以下是用 问小白o4 回答2025年第十六届全国大学生数学竞赛决赛试题,极强的数学推理能力。
|
||
|
||
【题目一】:准确运用高斯散度定理和三重积分,正确计算出所需要的结果。
|
||
|
||
Prompt:设 $$a, b, c$$ 是正数, $$S$$ 是方向朝上的上半椭球面 $$\frac{x^2}{a^2} + \frac{y^2}{b^2} + \frac{z^2}{c^2} = 1$$ ($$z \geq 0$$). 计算 $$I = \iint\_{S} xy^2 dydz + yz^2 dzdx + zx^2 dxdy$$.
|
||
|
||
【题目二】:结合渐近曲线、挠率、高斯曲率等知识点,实现正确计算。
|
||
|
||
Prompt:设$C$ 是曲面 $S$ 上曲率不等于零的渐近曲线,其挠率为 $\tau$。设曲面 $S$ 的高斯曲率为 $K$。求$|\tau|$。
|
||
|
||
代码编程更高效
|
||
|
||
在代码生成与补全场景,问小白o4 能够识别推理过程中的逻辑错误,并综合考虑多种边界情况,筛选出最佳实践。
|
||
|
||

|
||
|
||
> 思考1:查询对象数据类型错误,结果错误 ❌
|
||
>
|
||
> 思考2:考虑片面,解答不完整 ❌
|
||
>
|
||
> .......
|
||
>
|
||
> 思考8:考虑到了多重边界情况,调用正确 ✅→ ★最优解★
|
||
|
||
以下是使用 问小白o4 生成的网页设计和小游戏。
|
||
|
||
【设计网页】基于本篇发布内容,问小白o4 为自己制作了一个官网,以此加深你对问小白o4的更多了解。
|
||
|
||
【贪吃蛇游戏】对用户的query快速响应,问小白o4 高效输出游戏设计代码。
|
||
|
||
Prompt:Create a classic Snake game using JavaScript, HTML, and CSS. The game should include the following features:
|
||
|
||
Smooth movement controls (arrow keys or WASD).
|
||
|
||
A scoreboard that updates dynamically as the player collects food.
|
||
|
||
A 'New Game' button to restart the game.
|
||
|
||
A 'Game Over' animation when the player collides with the wall or itself.
|
||
|
||
The snake should grow with each food item consumed.
|
||
|
||
Simple but visually appealing design with clear UI elements.
|
||
|
||
Ensure the code is structured, commented, and easy to modify if needed.
|
||
|
||
搜索场景更低幻觉
|
||
|
||
通过过滤低质思考过程,问小白o4 有效降低RAG场景下10%的思考过程幻觉率,让你的每一次搜索请求结果都更加准确。
|
||
|
||

|
||
|
||
> 思考1:混淆鞍山市和鞍山村,概念混乱 ❌
|
||
>
|
||
> 思考2:只停留在逐句摘抄检索结果,缺少结合问题的针对性和总结❌.
|
||
>
|
||
> ......
|
||
>
|
||
> 思考8:准确区分鞍山市和鞍山村,逻辑清晰,总结到位✅→ ★最优解★
|
||
|
||
🚀 即刻体验
|
||
|
||
前往 wenxiaobai.com 或下载更新 问小白App 至3.18.8最新版本,立即与 问小白o4 模型开启对话。
|
||
|
||

|
||
|
||
我们非常推荐你前往「问小白」Web端开启满血版8倍脑暴 ,或点击文章下方「阅读原文」直达。
|