Merge pull request #14 from liyupi/dev/lihua

feat: 更新AI 行业资讯
This commit is contained in:
程序员鱼皮
2025-09-02 16:06:01 +08:00
committed by GitHub
22 changed files with 1079 additions and 0 deletions
+32
View File
@@ -46,6 +46,38 @@ export default [
"title": "AI行业资讯",
"collapsable": true,
"children": [
{
"title": "2025-08",
"collapsable": true,
"children": [
"AI行业资讯/2025-08/ChatExcel获近千万天使轮融资,全链路AI DataAgent从数据获取到价值交易打造商业闭环平台",
"AI行业资讯/2025-08/DeepSeek App 更新至 1.3.0 版本,新增对话生成分享图功能",
"AI行业资讯/2025-08/Kimi 鸿蒙版 App 体验升级,使用华为仓颉 markdown 解析引擎滑动帧率提升至 2.4 倍",
"AI行业资讯/2025-08/OpenAI CFO透露公司在考虑IPO 有望成科技领域最大规模IPO",
"AI行业资讯/2025-08/会头脑风暴的 AI — 国内首个并行思考模型 问小白o4 来啦!",
"AI行业资讯/2025-08/华人团队破解Token限制,扩散模型的潜力超越自回归三倍!",
"AI行业资讯/2025-08/昆仑万维发布Skywork Deep Research Agent v2",
"AI行业资讯/2025-08/智元机器人发布灵创平台:稚晖君宣布机器人二次开发“0 门槛”将至,大幅降低动作编排难度",
"AI行业资讯/2025-08/腾讯 CodeBuddy IDE 代码助手国内版公测,DeepSeek-V3.1 最新模型免费用",
"AI行业资讯/2025-08/钉钉联手通义推出Fun-ASR语音识别大模型,可听懂家居、畜牧等十大行业黑话"
]
},
{
"title": "2025-07",
"collapsable": true,
"children": [
"AI行业资讯/2025-07/9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA智谱开源",
"AI行业资讯/2025-07/OpenAI 前 CTO的AI公司Thinking Machines Lab 获得 20 亿美元融资,估值达 120 亿美元",
"AI行业资讯/2025-07/X 平台将允许 AI 机器人撰写社区注释,由用户反馈决定相应内容是否公开展示",
"AI行业资讯/2025-07/不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵",
"AI行业资讯/2025-07/全栈国产化技术闭环初步贯通:银河麒麟操作系统与文心 4.5 系列模型开展深度技术合作",
"AI行业资讯/2025-07/刚刚,Meta宣布正式成立「超级智能实验室」!11人豪华团队首曝光",
"AI行业资讯/2025-07/微软被曝将“AI 使用量”纳入员工考核:不再是“可选项”,直接挂钩绩效",
"AI行业资讯/2025-07/英特尔 Day0 完成文心大模型 4.5 系列开源模型的端侧部署",
"AI行业资讯/2025-07/荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的",
"AI行业资讯/2025-07/马斯克 xAI 公司补充 100 亿美元“弹药”,火力聚焦打造地表最强 AI"
]
},
{
"title": "2025-06",
"collapsable": true,
@@ -0,0 +1,178 @@
# 9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源
本文转载自: [9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://www.qbitai.com/2025/07/303714.html)
<!--摘要样式-->
GLM-4.1V-9B-Thinking
> 金磊 发自 凹非寺
>
> 量子位 | 公众号 QbitAI
如果一个视觉语言模型(VLM)只会“看”,那真的是已经不够看的了。
因为现在真实世界的任务简直不要太复杂,要想让AI干点实事儿,光有多模态还不够,必须还得有**深度思考**的强推理能力。
而就在刚刚,**智谱**发布并开源了一个仅9B大小的模型——**GLM-4.1V-9B-Thinking**,在28项评测中一举拿下**23个SOTA**
毫无悬念地成为10B级别里**效果最好的VLM模型**;而在18项评测中,它都可以与自身8倍参数量的Qwen-2.5-VL-72B一较高下,甚至是超越的程度。
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/mpFVihGaazZMxacB.webp)
整体来看,GLM-4.1V-9B-Thinking之所以能够这般“以小搏大”,核心原因就是**会思考**:
引入了**思维链**Chain-of-Thought)推理机制,并通过**课程采样强化学习**RLCSReinforcement Learning with Curriculum Sampling)来全面提升模型能力。
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/C32oGObfnYldqJlk.webp)
值得一提的是,在智谱这次发布新模型之际,浦东创投集团和张江集团对其进行了**10亿元投资**,并将于近期完成首次交割。
评测是一方面,但也正如我们刚才提到的,现在的AI“贵在”得能干点实事儿,那么GLM-4.1V-9B-Thinking具体“疗效”如何,我们继续往下看。
例如我们在不给提醒的情况下,先“喂”GLM-4.1V-9B-Thinking一幅名画:
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/g7rrKPpfcWlwN6CM.webp)
然后向它提问:
> 这幅画中哪些元素违背物理规律?艺术家可能通过这些矛盾表达什么哲学思想?
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/1njqZCx0c3lOj51n.webp)
可以看到,GLM-4.1V-9B-Thinking先是看出了这是西班牙超现实主义画家萨尔瓦多·达利创作的《记忆的永恒》;然后也道出了画作中存在违背物理的视觉符号等。
我们再让它看一眼今年高考的一道图文并茂**数学真题**,并附上一句Prompt:
> 请帮我解决这个题目,给出详细过程和答案。
(PS:这道题很多大模型在之前都有出现过翻车。)
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/nX6EsOVavliqVSLB.webp)
GLM-4.1V-9B-Thinking在思考片刻过后,就会给出一个简洁且精准的答案——**A**:
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/e0igVDblQ6A5Gh0d.webp)
再如此前同样让一众大模型“头疼”的看时钟和日期问题,我们也让GLM-4.1V-9B-Thinking试一试:
> 看这张图,分别是什么时间和什么日期?
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/I96eAAYjIsvhwJqm.webp)
在同时处理两个易出错的问题时,GLM-4.1V-9B-Thinking依旧是给出了相对准确答案(时间有一点小偏差,应该是10点11分):
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/lQvM1eC0hEqFLYVx.webp)
以及还有生活中比较有趣且实用的例子——**看手相**:
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/5SrAZbqALeAiWH0j.webp)
有懂手相的小伙伴,也可以留言讨论GLM-4.1V-9B-Thinking看得是否准确哦~
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/gYbc1QVLAN3zbrs4.webp)
由此可见,GLM-4.1V-9B-Thinking在“边看边想”这件事已经达到了普通人的水准。
整体而言,它现在的能力包括但不限于:
* 超长视频解析:能看懂长达2小时的视频,准确分析其中的人物、事件和时间关系
* 智能读图问答:不仅能描述图片内容,还能结合常识进行逻辑推理和解答
* 理科解题助手:支持数学、物理等理科题目解答,提供详细解题步骤
* 图文识别转换:可精准提取图片/视频中的文字和表格,转为结构化数据
* 专业文档处理:擅长解读金融、政务等专业文件,快速提取关键信息
* 图像定位标注:能标出图片中指定对象的具体位置坐标
* 智能界面操作:可识别电脑/手机界面元素,执行点击、滑动等操作指令
* 看图写代码:根据设计图自动生成前端网页代码
在看完效果之后,我们再来聊聊GLM-4.1V-9B-Thinking背后的技术。
从GLM-4.1V-9B-Thinking的模型架构来看,主要包含三大块的内容,它们分别是:
* 视觉编码器(ViT Encoder
* 多层感知机适配器(MLP Projector
* 语言解码器(Language Decoder
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/QCMRt214OzzcM3My.webp)
**视觉编码器**就好比模型的 “眼睛”,团队给它选了AIMv2-Huge这个 “超级视力装备”。
一般的 “眼睛” 看视频用的是二维卷积,就像一张张照片,但GLM-4.1V-9B-Thinking这个 “眼睛” 换成了三维卷积,这样它就能像看电影一样,在时间维度上 “快进快退”,快速处理视频,效率大大提高。要是遇到静态图片,它就把图片多复制几份,假装是 “小短片”,保证输入格式统一。
为了让这个 “眼睛” 不管看到多宽多窄、多清晰的画面都能适应,团队还给它做了两个升级。
第一个是加了二维旋转位置编码,这就像给 “眼睛” 戴了一副 “特殊眼镜”,就算画面特别宽(宽高比超过 200:1),或者特别清晰(4K 以上分辨率),它也能稳稳地 “看清楚”。
第二个是保留了可学习的绝对位置嵌入,就像给 “眼睛” 记住每个画面位置的 “小本本”,在训练的时候,通过双三次插值,让它能灵活适应不同大小的画面。
**语言解码器**则是模型的 “嘴巴” 和 “大脑”,负责理解你的问题,然后给出答案。
团队把原来的旋转位置编码升级成了三维的,这让模型在同时处理画面和文字的时候,能更好地理解空间关系,就像你一边看地图一边听别人描述路线,能更快找到方向,而且它回答文字问题的能力一点没减弱。
**多层感知机适配器**就像是 “眼睛” 和 “大脑” 之间的 “翻译官”,把 “眼睛” 看到的信息翻译成 “大脑” 能理解的语言,让整个模型顺畅地工作。
在训练GLM-4.1V-9B-Thinking方面,则是包含三个阶段:预训练(Pretraining)、监督微调(SFT)和课程采样强化学习(RLCS)。
**预训练阶段**
在最初阶段,团队的目标是让模型具备广泛的图文理解能力。
为此,智谱采用了“双通道并行”的训练方式,对模型进行了12万步的训练。每次输入的文本长度为8192,整体批量大小为1536。训练用的数据包括图像配文字、图文混合内容、识别文字(OCR)、图像定位、指令问答等多种类型。
为了提高训练效率,团队还用了“样本拼接”的方法,把不同长度的训练数据拼成接近最大长度的长序列,这样可以尽可能多地利用显存,减少浪费。
为了让模型更好地处理高分辨率图片、视频片段以及特别长的文本,团队在训练中加入了更复杂的数据,比如视频的连续画面和长度超过8000字的图文内容。
在这个阶段,团队把输入的序列长度扩展到了3万多(具体是32,768),并采用了更高级的并行训练方式(两路张量并行加上四路上下文并行),继续训练了一万步,同时保持之前的总批量大小不变(1,536),以确保训练的稳定性和效率。
**监督微调(SFT)阶段**
在微调阶段,团队专门准备了一批高质量的“思维链”(CoT)训练数据,目的是提升模型在处理复杂因果关系和长篇推理问题时的能力。这些训练样本都按照统一的格式进行组织:
```
<think> {推理过程} </think> <answer> {最终答案} </answer>
```
微调时团队对模型的全部参数进行了训练,输入长度设为32768,批量大小为32。
训练内容来自多个实际任务场景,比如解数学题、多轮对话、任务规划和复杂指令的执行,数据形式包括图文结合、多模态输入和纯文本等多种类型。
这个阶段不仅进一步提升了模型处理多模态信息的推理能力,同时也让它在语言理解和逻辑推理方面依然表现稳定。
**课程采样强化学习(RLCS)阶段**
在SFT的基础上,团队还引入了课程采样强化学习来提升性能。
团队主要结合了基于可验证奖励的强化学习(RLVR)和基于人类反馈的强化学习(RLHF)来覆盖多个关键任务维度:
* STEM领域问题求解(数学、物理、化学)
* 多模态信息定位与理解(OCR、实体定位、视频分析)
* 智能体任务(GUI交互、代理规划)
* 文档与图表理解、逻辑推理、复杂指令执行等
团队采用“课程学习”的方式进行大规模强化训练,也就是先让模型从简单任务开始,逐步挑战更难的任务。通过这种由浅入深的训练策略,模型在实用性、准确性以及稳定性方面都有了明显的提升。
![9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA|智谱开源](https://pic.code-nav.cn/post_picture/1610518142000300034/lmRbWkiVSUjGEfr3.webp)
最后,关于GLM-4.1V-9B-Thinking的论文、代码等也均已开源,感兴趣的小伙伴可以看看文末链接哦~
论文地址:
https://arxiv.org/abs/2507.01006
开源列表:
[1]Githubhttps://github.com/THUDM/GLM-4.1V-Thinking
[2]ModelScopehttps://modelscope.cn/collections/GLM-41V-35d24b6def9f49
[3]Hugging Facehttps://huggingface.co/collections/THUDM/glm-41v-thinking-6862bbfc44593a8601c2578d
[4]HuggingFace 体验链接:https://huggingface.co/spaces/THUDM/GLM-4.1V-9B-Thinking-Demo
[5]魔搭社区体验链接: https://modelscope.cn/studios/ZhipuAI/GLM-4.1V-9B-Thinking-Demo
智谱MaaS开发平台bigmodel.cn同步上线GLM-4.1V-Thinking-Flash API
[1]API 使用指南:https://www.bigmodel.cn/dev/howuse/visual-reasoning-model/glm-4.1v-thinking
[2]API 接口文档:https://www.bigmodel.cn/dev/api/visual-reasoning-model/glm-4.1v-thinking
[3]体验中心:https://www.bigmodel.cn/trialcenter/modeltrial/text?modelCode=glm-4.1v-thinking-flash
<!--版权声明-->
*版权所有,未经授权不得以任何形式转载及使用,违者必究。*
@@ -0,0 +1,23 @@
# OpenAI 前 CTO的AI公司Thinking Machines Lab 获得 20 亿美元融资,估值达 120 亿美元
本文转载自: [OpenAI 前 CTO的AI公司Thinking Machines Lab 获得 20 亿美元融资,估值达 120 亿美元](https://news.aibase.com/zh/news/19708)
AI 创业公司 Thinking Machines Lab(思维机器实验室)正式宣布完成由安德森・霍洛维茨基金领投的20亿美元种子轮融资。这一消息在硅谷引发了广泛关注,标志着该公司的估值已经达到120亿美元。这家由 OpenAI 前首席技术官米拉・穆拉蒂(Mira Murati)创办的公司,自成立不到一年便吸引了包括英伟达、AMD 等在内的多家知名投资者。
![投资,融资,钱](https://pic.code-nav.cn/post_picture/1610518142000300034/iUGQOBhEnM4jOjOy.webp "投资,融资,钱 (图片来源图虫:已授站长之家使用)")
据了解,这笔融资不仅是思维机器实验室的里程碑,也是硅谷历史上规模最大的种子轮融资之一,反映出投资者对新兴 AI 项目的热情与期待。穆拉蒂在接受采访时表示,公司的首款产品将在未来几个月内发布,并将包括 “重要的开源项目”。她强调,这些产品将对研究人员及构建定制 AI 模型的创业公司起到支持作用。
尽管目前尚不清楚 Thinking Machines Lab 将推出怎样的开源 AI 模型,但穆拉蒂的表态已经引发了市场的极大关注。根据报道,Meta 曾与该公司进行过收购谈判,旨在增强其超级智能项目的实力,但最终并未达成协议。这也让 Thinking Machines Lab 成为业界少数被认为有潜力威胁到领先 AI 公司的创业公司之一。
与此同时,Thinking Machines Lab 的迅速崛起反映出当前 AI 行业的竞争愈发激烈。除了 OpenAI,该领域的其他主要参与者还包括 Anthropic 和谷歌的 DeepMind。投资者们纷纷希望在这一轮竞争中,能够找到 “下一个 ChatGPT”。
思维机器实验室的成功吸引了大量关注,也激励了更多的技术人才与创业者在 AI 领域不断探索创新,期待未来能有更多突破与成果的涌现。
> 划重点:  
>
> 🌟 Thinking Machines Lab 获得20亿美元融资,估值达到120亿美元。  
>
> 🤖 公司首款产品将在未来几个月发布,将包括重要的开源项目。  
>
> 🚀 Thinking Machines Lab 被视为有潜力威胁到领先 AI 公司的新兴创业公司。
@@ -0,0 +1,15 @@
# X 平台将允许 AI 机器人撰写社区注释,由用户反馈决定相应内容是否公开展示
本文转载自: [X 平台将允许 AI 机器人撰写社区注释,由用户反馈决定相应内容是否公开展示](https://www.ithome.com/0/865/140.htm)
[IT之家](https://www.ithome.com/) 7 月 2 日消息,X 平台宣布允许开发者在本月晚些时候创建各类 AI Agent 机器人,用来撰写贴文下方的 Community Notes 社区注释。
IT之家参考官方帮助页面获悉,AI 机器人首先需要“先赢得撰写注释的权限(**具体如何获得暂未公布**)”,后续机器人的社区注释权限会随着用户反馈而进一步开放或丧失。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/Spz18jlDyjC3K52I.webp "X 平台将允许 AI 机器人撰写社区注释,由用户反馈决定相应内容是否公开展示")
此外,相应机器人提交的社区注释只有在被多数人认为有帮助时才会真正显示在帖子上,同时注释内容将清晰标注“由 AI 撰写”,让用户一眼就能分辨。目前 X 平台仅开放 AI 在“用户主动请求注释的贴文”中进行撰写。
X 平台发言人 Keith Coleman 在接受彭博社采访时表示:“这些机器人可以用更少的人力,更快生成大量注释,但最终还是由人类决定机器人生成的哪些内容足够有用、值得展示”。他同时透露,目前 X 平台每天都有上百条社区注释由人工创建。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
@@ -0,0 +1,185 @@
# 不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵
本文转载自: [不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵](https://www.qbitai.com/2025/07/303502.html)
<!--摘要样式-->
中外技术节哪家强?
> 衡宇 发自 凹非寺
>
> 量子位 | 公众号 QbitAI
技术节早就不是走过场的科技圈装饰品了。
**放眼中外,谁家技术底子硬、AI方向稳,基本都要拿一场技术节出来亮家底。**
谷歌的I/O,是工程文化的集体涌现;苹果的WWDC,是产品哲学的年度布道;上海的WAIC,是产业方向与时代命题……
而另辟蹊径的**淘天集团**,连续办起一个名字听着就不走寻常路的技术节——
**硬核少年技术节。**
**今年6月30日至7月4日,硬核少年技术节已经办到第四届了,并且在北京、杭州两地同步举办**,一如既往不讲排场,讲真章。
![不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵](https://pic.code-nav.cn/post_picture/1610518142000300034/TCbhTnV5iaPX3Z9v.webp)
虽然这已经是淘天集团第四次办技术节,但依然年年起新潮,肉眼看得到的自我进化。
不变的是,今年为期一周的“硬核少年技术节4.0”依旧靠的是技术人自己一场场讲、一项项做,把能跑、能用、能打赢的技术成果摆上台。
当然,每一届都有新意。**今年尤其体现在落地形式更丰富、更贴着地表,分为AI展示场、AI交流场、AI开放场、AI比赛场,把技术铺展开来**。
其中,除了AI开放场的OpenDay在一众技术节上比较常见之外,其它的AI场设置都好玩又有料。
具体我们一一来看。
AI展示场是一个巨大的技术市集。
在这里,**淘天集团AIGX技术体系近40项最新技术成果,以Poster路演的形式展示了出来**。
这里提到的AIGX,是淘天集团与淘宝天猫商业场景紧密结合的一套技术体系。
其领域覆盖广泛,包括但不限于以下这些电商商业经营所需的全部场景:
* AIGI(索引)
* AIGR(推荐)
* AIGB(出价)
* AIGA(拍卖)
* AIGC(创意)
* AIGD(数据)
* ……
诸如此类的技术,在现场统统摆出来,**直观展示淘天AI赋能电商各场景的最新实践**。
![不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵](https://pic.code-nav.cn/post_picture/1610518142000300034/G9ohtXHEKPDDAuES.webp)
不得不提的是,**开幕式上,淘天集团公布了AIGX技术体系的多项最新进展**。
为了让业界共享AIGX技术体系能力,**淘天还宣布与爱橙科技联合开源了强化学习训练框架ROLL**。
目前ROLL已成功应用在多个淘天集团内部业务场景,它专为“高效、可扩展、易用”而打造,可高效支持十亿到千亿参数大模型训练,打通从小模型到600B+超大模型的强化学习训练落地路径。
在人类偏好对齐、复杂推理和多轮自主交互场景等关键领域,ROLL显著提升了大语言模型的性能,同时具备超高的训练效率。
博见社设立时的主旨是为分享技术领域的成果和趋势,探讨学界和产业界之间合作的新空间和新机会。
作为淘天自创的技术交心之处,**每期,博见社都聚焦一个主题领域,邀请工业界和学界技术专家、学者分享技术领域成果和趋势**,探讨面向未来的新趋势和新机会。
今年的特别之处,在于分出了集团交流场和学术交流场,在京杭双城同时举行,就“多模态智能”主题进行专场分享,并组织“多模态智能与AI Agent”的圆桌交流。
**杭州场看产业落地**,聚焦多模态大模型如何与业务融合,许主洪、林俊旸、骆卫华、刘越等内部技术负责人现身说法。
**北京场看研究原点**,来自中科院、清华、人大、哈工大、南京大学等高校的专家分享最前沿的大模型进展和相关观点。
到今天,作为AI交流场的博见社始终如一,高校、研究机构、工业界以及淘天集团内外部同仁,都能在这里进行技术交流和分享。
今年的AI比赛场有两个非常有趣的看点。
**一个是AI Hackathon 3.0比赛**,团队分组,经历创意脑暴、产品设计、代码攻关、Demo展示等过程。
众所周知,每年的黑客松都灵感四溅创意勃发,这已经很值得期待。
但更绝的是,**今年的比赛场还设置了个AI狼人杀**。
在AI狼人杀过程中,参赛者们需要自己训练AI Agent,让他们扮演预言家、女巫、村民等角色,并且各自制定游戏策略,通过语言生成与逻辑推理进行刺激的悍跳、站边、反向操作,经历“语言伪装-信息博弈-投票决策”的全流程对抗。
![不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵](https://pic.code-nav.cn/post_picture/1610518142000300034/TIaMYRxGEHNbvmWl.webp)
AI狼人杀原始设置为中文语境,采用经典狼人杀6人局规则*(预言家1/女巫1/狼人2/平民2)*,支持动态策略调整,比拼的是AI Agent在语言理解、社交推理与策略演化等多方面的能力。
关键在于,**谁都能上线WhoisSpy.ai训练自家AI Agent,争夺“代码影帝”**。
这场真人不露相的对抗,可不是随便混得过去的,狼人可得藏好了!
了解到今年硬核少年技术节4.0的策划,已经不难看出淘天对这场技术节投入了深厚的心力。
毕竟这个技术节不是一时兴起的热度操作,而**是淘天多年技术文化和体系演进的真实反映**。
回看前三届——
* 第一届,以“机甲少年”为主题,强调团队协作与系统设计能力;
* 第二届,用“乐高寻宝”和AI Hackathon,激发年轻技术人的创造力;
* 第三届,通过“AI谁是卧底”,挑战大模型的理解力与边界。
每一届都在进化,每一届都更硬核。
**场景在变,底色没变,那就是:实用主义的技术美学**
这就又要说回背后淘天多年沉淀下打造出的AIGX技术体系。如你所见,它不是实验室产品组合,而**是一整套覆盖电商经营场景,边跑边磨出来的系统技术支撑**。
把AIGX技术体系中的索引、推荐、出价、拍卖、创意、数据等能力连点成线可以发现,它具备基础研究、应用开发和产业化的完整链条。
咱单拎出来一个普通人最能感知的技术多说两句。
**技术节首日就披露了AIGR方面的最新进展:**
淘天官方宣布自研的百亿参数推荐大模型RecGPT,已全面接入手机淘宝首屏“猜你喜欢”信息流。
RecGPT融合了多模态认知、用户行为分析,以及对世界知识和实时热点的理解,能够精准捕捉用户长期兴趣和动态需求,还能结合消费者自身情况推理出商品的推荐理由。
![不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵](https://pic.code-nav.cn/post_picture/1610518142000300034/REdlTNoNzuFeHzvb.webp)
以前,手淘的“猜你喜欢”更多是“看后推”“搜后推”,**现在RecGPT会根据既往消费习惯、所在地区特色、季节需求等,在用户尚未意识到需求时,提前预判并给出贴心建议**。
比如,RecGPT发现某用户去年3月开始持续购买婴儿床、1段奶粉、安抚玩具等商品,即推断其家中新添了小宝宝。因此,预估宝宝满1周岁时,系统会主动推荐学步车、3段奶粉、早教玩具等适龄商品。
“双十一”期间,系统也会结合用户历史品牌倾向和店铺关注,精准推荐冬季童装的优惠组合。
实验阶段数据显示,搭载RecGPT的推荐信息流实现用户点击量两位数增长,用户加购次数实现了5%的增长。
亲身可感的更好用了,更实用了。
这种生动化的推荐逻辑,**让淘宝首页从“货架陈列”升级为“发现式消费场”**。
在AIGC方向,阿里妈妈的万相营造技术团队历经三年攻关,在AI多模态生成与商业工具集成方面取得突破,正式实现阿里云上商业化。
万相营造实现云上商业化,其中的象征意义很大,可敏捷上云,并打通云上B端客户的商业化链路,有助于覆盖部分AI研发成本。
AIGR、AIGC的进展只是AIGX技术体系的一个切片。
**整个AIGX体系的建立,也正是淘天集团“让AI沉下来”的真实写照**——不追逐短期风口,而是耐下性子,锚定复杂业务,把AI真正嵌入进业务流程的每一个环节。
而为期一周的技术节就像淘天集团AI技术体系的阶段性开仓,展示了AIGX相关技术的实力和肌肉,经得起外界的审视。
在浮躁与追风并存的AI时代,技术节有时候成了企业刷存在感的橱窗。
但淘天的硬核少年技术节,却硬生生做出了另一种范式:**是淘天集团年度最大的技术节日,也是一张最能展现其技术与工程厚度的名片**。
它背后拼的不只是技术栈的广度与深度,还有一种组织心态和技术观。
**“朝气”与“匠心”,就是技术副总裁、算法技术负责人,阿里妈妈CTO郑波对这一气质的精炼概括。**
![不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵](https://pic.code-nav.cn/post_picture/1610518142000300034/HOYkjmoD3MSwxrR1.webp)
其中,**朝气是一种心态也是一种氛围**。
它比较意象化,可以是敏捷、开放、更容易接受新事物,也能被解读为愿意冒险、不服就干。
它更像是一种内驱:愿意探索,不怕试错,对新趋势保持高度感知力。
在这届技术节里,大量年轻面孔站上主讲台、Demo墙,展示着他们真实在做的项目和系统。
而**匠心是一种精神也是一种传承**,大家都明白,保持一时的领先并不难,难的是秉承匠心,持续领先。
它追求的不是形式上的更新,而是系统能力的极致打磨。好似流水不争先,争的是滔滔不绝。
二者相加,既有火力,也能着陆。
正如硬核少年技术节历年来都不靠舞台灯光、明星站队出圈,比如AI狼人杀,设计它的初衷就是让AI Agent真正下场,希望借助多人社交博弈场景,去挑战大语言模型推理、意图识别、长期规划等难关。
可以看到,从第一届的“魔方接力”和“机甲挑战”,到如今复杂多模态交流场和社交博弈Agent训练,淘天给了年轻技术人一个最大胆的命题:你不只是参与者,你更是建造者。
**因上种种,硬核少年技术节才如郑波所说,是兼具朝气和匠心的AI宝藏屋**
> 7月2日(本周三)下午 14:00,此次技术节的AI交流场——【博见社】,将进行「多模态智能」方向的专场主题分享和「多模态智能与AI Agent」的圆桌交流。
>
> 嘉宾包括中科院自动化所研究员刘静、哈尔滨工业大学计算机学院长聘教授左旺孟、南京大学计算机学院教授王利民、清华大学计算机系副教授刘知远、中国人民大学准聘副教授李崇轩等学者。
>
> 欢迎大家预约直播观看!
![不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵](https://pic.code-nav.cn/post_picture/1610518142000300034/1WADZ0s6xblADxx8.webp)
<!--版权声明-->
*版权所有,未经授权不得以任何形式转载及使用,违者必究。*
@@ -0,0 +1,21 @@
# 全栈国产化技术闭环初步贯通:银河麒麟操作系统与文心 4.5 系列模型开展深度技术合作
本文转载自: [全栈国产化技术闭环初步贯通:银河麒麟操作系统与文心 4.5 系列模型开展深度技术合作](https://www.ithome.com/0/865/117.htm)
[IT之家](https://www.ithome.com/) 7 月 1 日消息,“文心 4.5 系列模型”昨日正式开源。麒麟软件今日发文宣布,**银河麒麟操作系统与文心 4.5 系列模型率先开展深度技术合作**,成为国产操作系统中首批适配的厂商,并成为其首批合作伙伴。
![图片](https://pic.code-nav.cn/post_picture/1610518142000300034/TFc9JuXKYiX19cmd.webp "全栈国产化技术闭环初步贯通:银河麒麟操作系统与文心 4.5 系列模型开展深度技术合作")
此前,飞桨深度学习框架 3.0 已率先与银河麒麟操作系统完成产品兼容性互认证,实现了顺利安装与稳定运行。官方表示,至此,从操作系统到 AI 框架、再到核心大模型的**全栈国产化技术闭环初步贯通**。
据介绍,文心 4.5 系列开源模型共 10 款,涵盖了激活参数规模分别为 47B 和 3B 的混合专家(MoE)模型(**最大的模型总参数量为 424B**),以及 0.3B 的稠密参数模型。文心 4.5 系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型 FLOPs 利用率(MFU)达到 47%。
IT之家从麒麟软件获悉,截至目前,银河麒麟操作系统已与包括文心 4.5 系列开源模型在内的**超过 20 家主流大模型及 AI 应用产品**建立了深度技术合作关系,涵盖基础模型、行业模型、垂直应用等多个层面,初步构建起覆盖 AI 全场景的操作系统支撑体系。
![图片](https://pic.code-nav.cn/post_picture/1610518142000300034/4cMgd8okSbfwt7Ed.webp "全栈国产化技术闭环初步贯通:银河麒麟操作系统与文心 4.5 系列模型开展深度技术合作")
**相关阅读:**
* 《[百度正式开源文心大模型 4.5 系列模型](https://www.ithome.com/0/864/640.htm)》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
@@ -0,0 +1,81 @@
# 刚刚,Meta宣布正式成立「超级智能实验室」!11人豪华团队首曝光
本文转载自: [刚刚,Meta宣布正式成立「超级智能实验室」!11人豪华团队首曝光](https://mp.weixin.qq.com/s/I9vrKrDfHIF_1Sdw9tYF2A)
机器之心报道
**编辑:杜伟**
Meta 又有了新动向!
这几天,Meta 挖人简直挖疯了,先后夺走了 OpenAI 约十位员工,目前已公开确认有七人。
今天,据彭博社等最新消息,在周一给 Meta 员工的一份内部备忘录中,扎克伯格宣布重组公司人工智能团队(包括研究、基础设施和产品),合并到新成立的「Meta 超级智能实验室」(Meta Superintelligence Labs)。
该部门将由数据标注初创公司 Scale AI 前 CEO Alexandr Wang 领导,并担任公司首席人工智能官。同时,扎克伯克还首次曝光了 11 位从 OpenAI、Anthropic、谷歌 DeepMind 那里挖来的顶尖人才。
扎克伯格表示,MSL 将吸纳公司的各个团队,致力于开发 Llama 开源系列大模型、相关产品和基础人工智能研究项目等。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/09O2GPP18xptMa6O.webp)
以下是扎克伯克完整的备忘录内容:
随着人工智能进步的加速,发展超级智能已指日可待。我相信这将是人类新纪元的开端,我本人将全力以赴,确保 Meta 引领这一进程。今天,我想详细介绍一下我们如何调整组织架构,以实现我们的愿景:「为每个人打造专属的超级智能」。
我们将把整个组织命名为「Meta 超级智能实验室」(Meta Superintelligence Labs,简称 MSL)。这包括我们所有的基础研究、产品和 FAIR 团队,以及一个新成立的专注于开发下一代模型的实验室。
Alexandr Wang 已加入 Meta,担任我们的首席人工智能官(Chief AI officer)并领导 MSL。Alexandr 和我共事多年,我认为他是同辈创业者中最杰出的一位。他对超级智能的历史性意义有着清晰的认识,并且作为联合创始人兼 CEO,他将 ScaleAI 打造成了一家高速发展的公司,几乎参与了行业内所有领先模型的开发工作。
Nat Friedman 也已加入 Meta,将与 Alexandr 搭档共同领导 MSL,负责我们的 AI 产品和应用研究工作。Nat 将与康纳(Connor)一起确定他未来的具体职责。他曾负责微软旗下的 GitHub,最近则运营着一家领先的 AI 投资公司。过去一年,Nat 一直担任我们 Meta 顾问委员会的成员,因此对我们的路线图和所需行动已有深入了解。
此外,今天还有几位实力强劲的新成员加入,或是过去几周内已经加入,我也很高兴在此一并宣布:
* Trapit Bansal — 思维链(CoT)强化学习技术开创者,OpenAI o 系列模型共同创建者。
* Shuchao Bi— GPT-4o 语音模式与 o4-mini 共同创建者,曾任 OpenAI 多模态后训练负责人。
* Huiwen Chang— GPT-4o 图像生成系统共同创建者,Google Research 期间发明 MaskGIT 及 Muse 文生图架构。
* Ji Lin — 参与开发 o3/o4-mini、GPT-4o、GPT-4.1、GPT-4.5、4o-imagegen 及 Operator 推理框架。
* Joel Pobar— Anthropic 推理系统专家,此前在 Meta 任职 11 年主导 HHVM/Hack/Flow/Redex 开发及性能工具与机器学习。
* Jack Rae— Gemini 预训练技术负责人及 Gemini 2.5 推理架构师,DeepMind 时期主导 Gopher/Chinchilla 早期大模型研发。
* Hongyu Ren(任泓宇)— GPT-4o/4o-mini/o1-mini/o3-mini/o3/o4-mini 共同创建者,曾任 OpenAI 后训练团队主管。
* Johan Schalkwyk— 前 Google FellowSesame 系统早期贡献者,Maya 项目技术主管。
- Pei Sun— 谷歌 Deepmind Gemini 后训练 / 编程 / 推理架构师,曾主导 Waymo 近两代感知模型开发。
- Jiahui Yu(余家辉)— o3/o4-mini/GPT-4.1/GPT-4o 共同创建者,曾任 OpenAI 感知团队负责人,Gemini 多模态系统联合主管。
- Shengjia Zhao— ChatGPT/GPT-4/4.1/o3 共同创建者,曾任 OpenAI 合成数据团队主管。
我对 Llama 4.1 和 4.2 的规划进展倍感振奋。这些模型驱动着 Meta AI—— 目前已在旗下应用收获超 10 亿月活跃用户,更有日益增长的智能体网络持续优化我们的产品与技术。我们将坚定不移地推进这些模型的迭代升级。
与此同时,我们将启动下一代模型的前沿研究,力争在未来一年左右达到技术巅峰。过去数月我遍访 Meta 内部、顶尖 AI 实验室及潜力初创企业,已为这项精英小团队计划组建核心班底。该团队仍在扩充中,后续将邀请公司 AI 体系内多位精英加入。
Meta 在向世界交付超级智能的进程中占据独特优势地位:我们拥有雄厚的业务实力支撑,能构建远超小型实验室规模的计算资源;具备服务数十亿用户的产品研发与增长经验;正开拓并引领高速增长的 AI 智能眼镜与可穿戴设备领域;更凭借企业架构优势,能以远胜同行的信念与魄力推进战略。
我坚信,此次人才涌入与模型研发的双轨并行策略,必将为「实现全民专属超级智能」的承诺奠定坚实基础。未来数周还将有更多顶尖人才加入各层级团队,敬请期待。我已准备好全力以赴投入这项工作。
目前,新加入 Meta 的人已经开始在社交媒体上宣传造势,比如 Jack Rae。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/82VQnZLhJC41SQn8.webp)
参考链接:
https://www.bloomberg.com/news/articles/2025-06-30/zuckerberg-announces-meta-superintelligence-effort-more-hires?srnd=phx-technology
https://www.cnbc.com/2025/06/30/mark-zuckerberg-creating-meta-superintelligence-labs-read-the-memo.html
https://www.theverge.com/news/695355/mark-zuckerberg-meta-ai-superintelligence-labs
![](https://pic.code-nav.cn/post_picture/1610518142000300034/pJ4Phvkkqm8pqZBm.webp)
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin.com
@@ -0,0 +1,21 @@
# 微软被曝将“AI 使用量”纳入员工考核:不再是“可选项”,直接挂钩绩效
本文转载自: [微软被曝将“AI 使用量”纳入员工考核:不再是“可选项”,直接挂钩绩效](https://www.ithome.com/0/864/820.htm)
[IT之家](https://www.ithome.com/) 6 月 30 日消息,据《商业内幕》27 日报道,微软开发者工具部门总裁 Julia Liuson 最近发出内部邮件,要求各级主管在评估员工绩效时,将其使用 GitHub Copilot 等内部 AI 工具的情况纳入考量。
Liuson 表示,AI 已**成为微软日常工作的核心**,就像团队协作、数据导向思维和沟通能力一样,使用 AI 不再是选择题,而是每个岗位的基本要求。她指出,员工是否有效使用 AI,应该被纳入对其**整体表现和影响力**的全面评估之中。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/iga0SA9I8wY3D62O.webp "微软被曝将“AI 使用量”纳入员工考核:不再是“可选项”,直接挂钩绩效")
知情人士透露,微软各团队的绩效考核标准不尽相同,目前已有部分团队考虑在下一个财年正式将 AI 工具使用情况作为绩效指标之一。
另据两位了解内情的人士称,这一改变旨在应对**微软内部 Copilot 服务推广缓慢**的问题。微软希望提升整体使用率,也希望产品开发人员更深入理解自家 AI 工具的运作方式。
目前 GitHub Copilot 正面临 Cursor 等 AI 编程服务的竞争压力。微软允许员工使用**符合安全规范的部分第三方工具**,知情人士称,Replit 就是其中之一。
IT之家注意到,巴克莱银行近期的一份报告显示,Cursor 在开发者市场的某个关键领域已超过 GitHub Copilot。
而 AI 编程工具间的竞争,也影响到微软与 OpenAI 的重要合作关系重谈进程。一位消息人士透露,OpenAI 正考虑收购 Cursor 的竞争对手 Windsurf,但由于与微软现有协议的条款,微软可获取 Windsurf 的知识产权,这让 OpenAI 和 Windsurf 均感到不安。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
@@ -0,0 +1,19 @@
# 英特尔 Day0 完成文心大模型 4.5 系列开源模型的端侧部署
本文转载自: [英特尔 Day0 完成文心大模型 4.5 系列开源模型的端侧部署](https://www.ithome.com/0/864/848.htm)
[IT之家](https://www.ithome.com/) 6 月 30 日消息,百度今日[正式开源文心大模型 4.5 系列模型](https://www.ithome.com/0/864/640.htm),涵盖 47B、3B 激活参数的混合专家(MoE)模型,与 0.3B 参数的稠密型模型等 10 款模型,并实现预训练权重和推理代码的完全开源。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/t6vtQA38mCuNQvSq.webp "英特尔 Day0 完成文心大模型 4.5 系列开源模型的端侧部署")
据英特尔中国消息,在此次文心系列模型的发布过程中,英特尔借助 OpenVINO  在模型发布的第零日实现对文心端侧模型的适配和在英特尔酷睿 Ultra 平台上的**端侧部署**。据介绍,OpenVINO  工具套件是由英特尔开发的开源工具套件,旨在优化和加速深度学习模型的推理性能,支持跨平台部署并充分利用英特尔硬件资源。
IT之家从英特尔中国获悉,从 2021 年开始,百度飞桨和英特尔 OpenVINO  进行深入合作,并进行深度适配。经过双方适配的众多模型,如 PaddleOCRPaddleSegPaddleDection 等,开发者**可直接将飞桨模型用 OpenVINO 推理和部署**,或通过 OpenVINO 的模型优化器转化为 IR 格式,进一步部署和推理。
[文心大模型 4.5 于今年 3 月发布](https://www.ithome.com/0/838/163.htm),是百度首个原生多模态大模型,在多模态理解、文本和逻辑推理等方面有显著提升,多项测试表现优于 GPT4.5,API 调用价格仅为 GPT4.5 的 1%。
百度文心大模型 4.5 系列模型开源地址如下:
<https://aistudio.baidu.com/modelsoverview>
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
@@ -0,0 +1,63 @@
# 荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的
本文转载自: [荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的](https://www.ithome.com/0/865/358.htm)
感谢IT之家网友 [F宝](https://m.ithome.com/html/app/open.html?url=ithome%3A%2F%2Fuserpage%3Fid%3D2090954) 的线索投递!
[IT之家](https://www.ithome.com/) 7 月 2 日消息,在今日晚间的荣耀 Magic V5 暨 AI 终端生态发布会上,荣耀宣布打造**全新荣耀 YOYO 智能体**,通过全栈个人知识库、全域智能体协同、全品牌终端互联三大 AI 闭环核心技术,拓展 1 小时的生命宽度。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/cYzkI8nrkIKz2kFO.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
荣耀 Magic V5 实现**八大一语 AI 功能**:“一语 PPT”“一语编程”“一语搜索”“一语传送”“一语打车”“一语识物”“一语看屏”“一语记忆”,效率提升,带来 PC 级生产力。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/xXOcMTfOn4XSBHvi.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/SUp7PS0emq3eYBGJ.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/ObVTl6Y1K6vX6sGV.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/pTjkhKrsip9qvK7e.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/tpzL76t1RHynJXQd.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/yIv3pgfODLXLHXFx.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/saQi1nltluU0rsQ8.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/lUASGocndBlwQa6Y.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/PXy9G5LzB126zD98.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/BRl6SyGXmjUqC6Tr.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
荣耀宣布带来 7 大智慧生态,与合作伙伴共筑主动服务的 AI 生态体验,覆盖智慧生活、智慧出行、智慧陪伴、智慧车联、智慧家居、智慧服务等 **7 大 AI 生态场景**
荣耀将打造**全新 AI Connect 平台**,将感知能力、大模型能力,互联能力等集成,共享给所有接入的生态合作伙伴,赋能各类产业集群。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/nmOs9z7929I7S6MN.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/pzwNWFppCKTxvQDv.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/0SED2ZZaECbHRYvH.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/aEsbmv5A1V26N0sK.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/2o2HF6rk8mVtKcF1.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/X9AtkeCrVuREAMuQ.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
IT之家从发布会获悉,荣耀正式宣布支持 MCP 和 A2A 协议,**将携手阿里、比亚迪、美的等合作伙伴**,在智能体服务生态、智慧车联、智慧家居领域开展深度合作。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/t2zCanKoa5zTBJ6L.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/1dkyt9EuZKF5b3nC.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/PYhPSbGfSVFfg2IO.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/ycnhrwzDspKp6eCd.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/mNw1UX4BoKFP5EJy.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
![](https://pic.code-nav.cn/post_picture/1610518142000300034/pbMVR21qB2Kl7GZ8.webp "荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的")
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
@@ -0,0 +1,17 @@
# 马斯克 xAI 公司补充 100 亿美元“弹药”,火力聚焦打造地表最强 AI
本文转载自: [马斯克 xAI 公司补充 100 亿美元“弹药”,火力聚焦打造地表最强 AI](https://www.ithome.com/0/865/157.htm)
[IT之家](https://www.ithome.com/) 7 月 2 日消息,CNBC 昨日(7 月 1 日)发布博文,报道称埃隆・马斯克(Elon Musk)为增强同 OpenAI 的竞争,通过 50 亿美元债务和 50 亿美元股权的方式,**成功筹集了 100 亿美元(IT之家注:现汇率约合 716.35 亿元人民币),继续烧钱推进 AI 发展。**
摩根士丹利昨日表示 xAI 公司已通过债务和股权筹集了共计 100 亿美元,其中 50 亿美元通过担保票据和定期贷款获得的,而另外 50 亿美元则是通过战略性股权投资获得的。
这笔资金为 xAI 注入了更多火力,[用于构建基础设施和开发其 Grok AI 聊天机器人](https://www.ithome.com/0/827/478.htm),以应对与其死敌 OpenAI,包括亚马逊支持的 Anthropic 在内的一大批其他竞争者。
马斯克于今年 5 月透露,xAI 公司在美国田纳西州孟菲斯的 Colossus 设施中安装了 20 万块 GPU,用于训练 AI。
马斯克当时表示,他的公司将继续从半导体巨头 Nvidia 和 AMD 购买芯片,并且 xAI 计划在孟菲斯以外建设一个拥有 100 万个 GPU 的设施。
关于公司最新筹集的资金,摩根士丹利表示所得款项将支持 xAI 继续开发前沿的人工智能解决方案,包括世界上最大的数据中心以及其旗舰平台 Grok。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
@@ -0,0 +1,71 @@
# ChatExcel获近千万天使轮融资,全链路AI DataAgent从数据获取到价值交易打造商业闭环平台
本文转载自: [ChatExcel获近千万天使轮融资,全链路AI DataAgent从数据获取到价值交易打造商业闭环平台](https://mp.weixin.qq.com/s/1SX6jKO-nfzJKiFxsgIJxQ)
![](https://pic.code-nav.cn/post_picture/1610518142000300034/fwwJ5QK6mmE3cTp8.webp)
**ChatExcel **团队近日已完成近千万天使轮融资。此次融资由上海常垒资本、武汉东湖天使基金投资。本轮资金主要用于加速产品研发迭代,以及全球化市场运营推广,进一步提升ChatExcel在数据智能体(DataAgent)领域的领先地位。
ChatExcel作为AI Native团队,由北京大学团队创业成立,是国内领先的生成式AI 表格处理与数据智能体,累计服务用户超千万次。获得央视《赢在AI+》创业大赛智能办公组第一名等多项荣誉,对AI技术保持前沿的探索和商业化落地的落地交付能力。目前已启动PreA轮融资。
01
ChatExcel定义AI DataAgent,打造数据全链路商业闭环平台
ChatExcel凭借其深厚的学术背景与卓越的技术研发能力,在AI 表格处理与DataAgent 技术上取得了突破性进展。用户仅通过对话,即可处理Excel和数据分析,将用户从繁琐的公式与运算中解放出来,有效降低了Excel和数据使用门槛。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/7vRSL9YwKeLq9tPD.webp)
“我们很高兴能够获得这笔天使轮融资,这不仅是对 ChatExcel 团队技术实力和创新理念的认可,更为我们的未来注入了强大的发展动力。” ChatExcel 创始人逄大嵬表示,“我们将利用这笔资金,围绕数据全链路(数据获取、数据准备、分析洞察、数据可视化、决策应用、价值交换)构建AI DataAgent,让数据流通起来,打造商业闭环。”
![](https://pic.code-nav.cn/post_picture/1610518142000300034/EoTeHsrRX71CvZsd.webp)
目前,ChatExcel支持不同数据源处理与分析应用 ,从Excel文件到数据库数据、互联网网页、第三方数据,并且训练出全球首款适配AIPC级端侧部署的数据垂直模型。同时,ChatExcel 团队正在积极推进产品的迭代升级,计划在未来几个月内推出更多新功能,进一步提升产品的智能化水平和用户体验。随着融资的到位, ChatExcel也将加速开拓海外市场,推动 Data Agent在世界范围内的广泛应用。
02
规模化落地彰显商业价值,千亿市场机遇可期
ChatExcel 作为AI Native团队,产品即AI,比传统公司更快、更轻、更能打。ChatExcel的商业价值已在实际应用中得到充分验证,自上线后,累计服务用户超千万次。在商业运营上,ChatExcel已经加入华为、联想、惠普、阿里云等大厂生态,为其商业化增长带来持续的支持与合作。
在数据合规上,通过推出“云 - 边 - 端产品矩阵”,全面升级了数据安全策略:云端隔离,文件加密,用户数据不参与大模型训练;ChatExcel一体机本地化部署,确保数据不出内网;AI PC电脑,让ChatExcel在本地处理用户的表格数据。真正做到了可信、多源、安全。
从市场规模来看,智能办公需求和数据分析需求日益增长,InData Labs分析显示,大数据分析市场 2024 - 2032 年将从3482.1亿美元增至超9240亿美元,为AI数据分析创造了巨大的市场机遇。ChatExcel通过技术创新和场景深耕,正在这一蓝海市场中构建独特的竞争优势。
此次近千万元的天使轮融资,将为 ChatExcel 的发展注入强大动力,ChatExcel将从AI的角度出发,重构传统的数据链路,进而加速数据平权,实现人人皆是数据分析师的愿景。
## ****福利!ChatExcel免费用**********🎁******
## ********
ChatExcel融资啦~先给大家来波福利,🎁口说无凭,宠粉还是要来点儿实际的~
🌟一键三连,截图私信小编,即可领取周会员~
🌟文末留言,留言点赞超过10个,截图私信小编,即可领取月会员~
登录chatexcel.com或者下载桌面端,无需额外操作,就可以开始免费用。
**相关文章推荐**
![](https://pic.code-nav.cn/post_picture/1610518142000300034/PdCuSx5Zi76bDXAc.png)
01
[【ChatExcel·企业版】正式上线,一站式AI 数据解决方案,打造企业数据大脑!](https://mp.weixin.qq.com/s?__biz=MzkzNDYwNDM3Mg==&mid=2247488351&idx=1&sn=d4b71436d60290875879911a8c36549a&scene=21#wechat_redirect)
![](https://pic.code-nav.cn/post_picture/1610518142000300034/3iUTxaEpC3HZtzUv.png)
02
[ChatExcel·桌面版全新上线、AI提示词优化、常用提示词保存功能上线|AiExcel更新](https://mp.weixin.qq.com/s?__biz=MzkzNDYwNDM3Mg==&mid=2247488329&idx=1&sn=82797957abd6ceae1df9798f1c8fcbf0&scene=21#wechat_redirect)
![](https://pic.code-nav.cn/post_picture/1610518142000300034/zYJ8RwUHfbXyQ51d.png)
03
[ChatExcel又又又迎来重大升级!处理速度提升300%,全球最快!](https://mp.weixin.qq.com/s?__biz=MzkzNDYwNDM3Mg==&mid=2247488254&idx=1&sn=04fb46bee37837fb5887a09e6e933bac&scene=21#wechat_redirect)
![](https://pic.code-nav.cn/post_picture/1610518142000300034/StiCcBbFFnjz3gUO.webp)
点击阅读原文,开始处理Excel👉👉👉
@@ -0,0 +1,9 @@
# DeepSeek App 更新至 1.3.0 版本,新增对话生成分享图功能
本文转载自: [DeepSeek App 更新至 1.3.0 版本,新增对话生成分享图功能](https://news.aibase.com/zh/news/20491)
**AIbase 报道**8月14日,DeepSeek App在手机应用商店发布了1.3.0版本更新。本次更新的核心亮点在于新增了**对话内容生成分享图**功能。
此项新功能允许用户将与DeepSeek App的问答对话内容直接生成为图片,从而省去了传统截屏分享的繁琐步骤。这一原生功能的推出,将为用户分享有趣的对话内容提供更便捷、美观的方式,大幅提升了社交分享的体验。
![QQ20250814-101645.png](https://pic.code-nav.cn/post_picture/1610518142000300034/YYGWaeO6J6JoIFPg.webp "QQ20250814-101645.png")
@@ -0,0 +1,49 @@
# Kimi 鸿蒙版 App 体验升级,使用华为仓颉 markdown 解析引擎滑动帧率提升至 2.4 倍
本文转载自: [Kimi 鸿蒙版 App 体验升级,使用华为仓颉 markdown 解析引擎滑动帧率提升至 2.4 倍](https://www.ithome.com/0/877/614.htm)
感谢IT之家网友 [有鲫雪狐](https://m.ithome.com/html/app/open.html?url=ithome%3A%2F%2Fuserpage%3Fid%3D2169131) 的线索投递!
[IT之家](https://www.ithome.com/) 8 月 24 日消息,据仓颉编程语言官方消息,Kimi 团队积极适配华为[鸿蒙](https://hmos.ithome.com/)系统,**已于今年 3 月推出了支持全量功能的鸿蒙版应用**,并通过内置仓颉 Markdown 渲染引擎,提升了长对话的渲染性能,实现流畅无卡顿的渲染效果。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/8DdSYDjkhGkNM9s4.webp "Kimi 鸿蒙版 App 体验升级,使用华为仓颉 markdown 解析引擎滑动帧率提升至 2.4 倍")
据称,**Kimi 鸿蒙版 App 集成仓颉前,遇到主线程耗时长,应用卡顿的情况**,线上故障率达到千分之二,其中多数为 appfreeze。主要原因是对话渲染时 markdown 解析部分性能较差,耗时较长。而仓颉社区三方库已具备高性能的 markdown 解析、渲染库。在仓颉团队的推动下,Kimi 采用了仓颉方案优化应用性能。
仓颉三方库社区 Cangjie-TPC 提供了:
> * markdown 解析引擎 **commonmark4cj**https://gitcode.com/ Cangjie-TPC / commonmark4cj),支持将 markdown 文本解析为节点树。
>
> * 公式解析库 **formula-ffi**https://gitcode.com/ Cangjie-TPC / formula-ffi),支持将 LaTeX 公式渲染为图片。
>
> * 语法高亮库 **prism4cj**https://gitcode.com/ Cangjie-TPC / prism4cj),支持解析代码块语法结构,标记高亮色彩。
>
> * markdown 组件库 **markdown4cj**https://gitcode.com/ Cangjie-TPC / markdown4cj),支持解析代码块语法结构,标记高亮色彩。
这四个库分别提供了**纯仓颉版本**和**互操作版本**,其中互操作版本将仓颉接口封装成了 ArkTS 接口,方便用户在混合工程中直接使用。Kimi 采用的解决方案是:使用互操作版本的 commonmark4cj、formula-ffi、prism4cj 进行文本的解析,在 ArkTS 侧自主开发渲染库,将解析结果渲染成 markdown 组件。
仓颉编程语言官方表示,Kimi 这样做牺牲了部分易用性,但好处是既可以受惠于仓颉相关解析库的高性能,又可以在 UI 侧定制灵活的需求。
**Kimi 集成仓颉三方库后,相比集成前的方案,整体滑动帧率得到 2.4 倍以上优化**。三个仓颉三方库为单点功能带来显著优化,其中 commonmark4cj 带来 4 倍优化,formula-ffi 带来 34 倍优化,prism4cj 带来 2 倍以上优化。具体测试数据如下:
| | | |
| :-----------------------------------------------------------------: | :------: | :----: |
| | **原版** | **仓颉** |
| **markdown 节点解析耗时**解析 13K 字符 | 80ms | 20ms |
| **数学公式解析耗时**测试会话(https://www.kimi.com/share/d28rvhj1cvfam4v242jg | 328.40ms | 9.58ms |
| **代码块染色**解析 203 行代码块 | 96ms | 44ms |
| **滑动帧率**60Hz 刷新率 | 25 帧 | 60 帧 |
IT之家从仓颉编程语言官方获悉,当前仓颉社区已收录超 140+ 三方库,常用的包括:
* markdown 解析和渲染库 **markdown4cj **(https://gitcode.com/Cangjie-TPC/markdown4cj)
* 压缩库 **zip4cj **(https://gitcode.com/ Cangjie-TPC / zip4cj) 和 **zlib4cj **(https://gitcode.com/Cangjie-TPC/zlib4cj)
* MQTT 通信协议库 **mqtt4cj **(https://gitcode.com/Cangjie-TPC/mqtt4cj)
* 图像加载缓存库 **droplet** (https://gitcode.com/Cangjie-TPC/droplet)
* **动画库 svga-cj**  (https://gitcode.com/Cangjie-TPC/svga-cj)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
@@ -0,0 +1,19 @@
# OpenAI CFO透露公司在考虑IPO 有望成科技领域最大规模IPO
本文转载自: [OpenAI CFO透露公司在考虑IPO 有望成科技领域最大规模IPO](https://www.techweb.com.cn/world/2025-08-24/2964926.shtml)
<!--文章开始-->
【TechWeb】8月24日消息,据外媒报道,因ChatGPT大火而备受关注的OpenAI,是当前在全球生成式人工智能方面走在行业前列的厂商,他们的大模型已经更新多代,也已获得了数百亿美元的融资,颇受投资者关注。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/5QZklwRg3FvArz2z.webp)
而外界对OpenAI的关注,除了他们的大模型,还有他们是否会IPO以及会在何时IPO。
对于IPO一事,OpenAI的首席财务官Sarah Friar近日在接受采访时,透露他们正在考虑在未来的某一时间点IPO,但并未透露时间表等更具体的消息。
Sarah Friar的这一表态,是首次有OpenAI的高管公开透露他们在考虑IPO,此前仅有CEO萨姆·奥尔特曼(Sam Altman)暗示IPO。
考虑到OpenAI员工近期出售60亿美元股票时的估值达到了5000亿美元,他们如果推进IPO,就有望成为全球科技领域规模最大的IPO。
但至于OpenAI会在何时IPO,要在正式推进后才会揭晓,能否成为科技领域规模最大的IPO,也要在上市时才会见分晓。(海蓝)
@@ -0,0 +1,129 @@
# 会头脑风暴的 AI — 国内首个并行思考模型 问小白o4 来啦!
本文转载自: [会头脑风暴的 AI — 国内首个并行思考模型 问小白o4 来啦!](https://mp.weixin.qq.com/s/lOuFggxvgvmDy7jbNHygKg)
![](https://pic.code-nav.cn/post_picture/1610518142000300034/e8VRRXDmgev9NjaY.webp)
作为国内首个并行思考模型,问小白o4 最大的本事是能同时开八个“脑洞”琢磨你的问题,自动筛选最优思考路径,答案精准度飙升!
现Web/APP端全量上线啦!访问官网 wenxiaobai.com,即可体验全新满血版 问小白o4 模型,你可以将常用的大模型工具切换至 「小白o4」,体验Gemini 2.5 Deep Think顶级模型(月费约¥1800)同等先进的头脑风暴能力。
🌍  打破传统推理模型局限
问小白o4 是由问小白团队提出的第四代开源推理范式(4th open-sourced reasoning form)构建而成,融合了“Long‑CoT 强化学习”与“过程奖励学习(Process Reward Learning)”的端到端训练机制,使模型同时具备深度推理与高质量思考过程筛选能力。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/EnFwBJV2bI8ttokr.webp)
* 多:想得更多,给得更多
问小白o4 同时启动8条并行思考路径,如同一个高效的“头脑风暴”团队,从不同角度、运用不同策略同步探索解题思路,让‘一次到位’成为默认体验。
* 快:轻量模型,给得更快
基于极致的模型压缩与引擎加速,问小白o4 的打字速度相较DeepSeek R1提升70%,显著降低了获取优质回答的时间成本。
* 好:优中选优,给得更好
基于最优思考的回答,问小白o4 在复杂任务上的性能显著超过OpenAI o3-mini-medium、Claude Opus 4,大幅提升回答的正确率与可解释性。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/ELKe3910CT0so8Kv.webp)
📈 模型性能提升
问小白 o4 是一款具备更强推理能力、更擅长处理复杂任务的Dense架构基础模型。作为当前开源复杂推理能力最强的模型之一,问小白 o4 以32B参数量在复杂数学和代码编程任务上实现了新的性能突破。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/KtHfUYTBrDXqbMzq.webp)
* 为了确保评估的稳定性,我们以avg\@64作为测试精度
1. 什么样的思考过程会被 问小白o4 的大脑选中?
![](https://pic.code-nav.cn/post_picture/1610518142000300034/sdsT90XMJPPgAToh.webp)
![](https://pic.code-nav.cn/post_picture/1610518142000300034/kqGysKNIuLjeDQzW.webp)
2. 基于 问小白o4 强大的推理能力,能在哪些场景获得更好的体验?
将你的问题交给 问小白o4,它会自动构建不同思考过程,并筛选最优质的思考过程,基于此为你提供最佳解答。你无需手动多次重新生成选择最佳的结果,因为这一切 问小白o4 会自动帮你完成!
学科试题更准确
问小白o4 能够抽取题目知识点并对齐通用解法范式,结合策略合成与自证校验,自动匹配最优解题方法,实现更高准确率与更强泛化能力的智能解题。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/XYoSxLj0ZbHdN8Ih.webp)
> 思考1:分步硬拆造成重复,结果错误 ❌ 
>
> 思考2:过程层层套算,推理链条长,存在大量冗余 ❌
>
> .......
>
> 思考8:补集法与分类法联合验证,准确且高效✅→ ★最优解★ 
以下是用 问小白o4 回答2025年第十六届全国大学生数学竞赛决赛试题,极强的数学推理能力。
【题目一】:准确运用高斯散度定理和三重积分,正确计算出所需要的结果。
Prompt:设 $$a, b, c$$ 是正数, $$S$$ 是方向朝上的上半椭球面 $$\frac{x^2}{a^2} + \frac{y^2}{b^2} + \frac{z^2}{c^2} = 1$$ ($$z \geq 0$$). 计算 $$I = \iint\_{S} xy^2 dydz + yz^2 dzdx + zx^2 dxdy$$.
【题目二】:结合渐近曲线、挠率、高斯曲率等知识点,实现正确计算。
Prompt:设$C$ 是曲面 $S$ 上曲率不等于零的渐近曲线,其挠率为 $\tau$。设曲面 $S$ 的高斯曲率为 $K$。求$|\tau|$。
代码编程更高效
在代码生成与补全场景,问小白o4 能够识别推理过程中的逻辑错误,并综合考虑多种边界情况,筛选出最佳实践。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/L3RU6bJy22Bkzajc.webp)
> 思考1:查询对象数据类型错误,结果错误 ❌
>
> 思考2:考虑片面,解答不完整 ❌
>
> .......
>
> 思考8:考虑到了多重边界情况,调用正确 ✅→ ★最优解★
以下是使用 问小白o4 生成的网页设计和小游戏。
【设计网页】基于本篇发布内容,问小白o4 为自己制作了一个官网,以此加深你对问小白o4的更多了解。
【贪吃蛇游戏】对用户的query快速响应,问小白o4 高效输出游戏设计代码。
PromptCreate a classic Snake game using JavaScript, HTML, and CSS. The game should include the following features:
Smooth movement controls (arrow keys or WASD).
A scoreboard that updates dynamically as the player collects food.
A 'New Game' button to restart the game.
A 'Game Over' animation when the player collides with the wall or itself.
The snake should grow with each food item consumed.
Simple but visually appealing design with clear UI elements.
Ensure the code is structured, commented, and easy to modify if needed.
搜索场景更低幻觉
通过过滤低质思考过程,问小白o4 有效降低RAG场景下10%的思考过程幻觉率,让你的每一次搜索请求结果都更加准确。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/EllHOP9McUieyAtW.webp)
> 思考1:混淆鞍山市和鞍山村,概念混乱 ❌
>
> 思考2:只停留在逐句摘抄检索结果,缺少结合问题的针对性和总结❌.
>
> ......
>
> 思考8:准确区分鞍山市和鞍山村,逻辑清晰,总结到位✅→ ★最优解★
🚀 即刻体验
前往 wenxiaobai.com 或下载更新 问小白App 至3.18.8最新版本,立即与 问小白o4 模型开启对话。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/IEPZsVwQxg37eHrk.webp)
我们非常推荐你前往「问小白」Web端开启满血版8倍脑暴 ,或点击文章下方「阅读原文」直达。
@@ -0,0 +1,15 @@
# 华人团队破解Token限制,扩散模型的潜力超越自回归三倍!
本文转载自: [华人团队破解Token限制,扩散模型的潜力超越自回归三倍!](https://news.aibase.com/zh/news/20482)
在 AI 领域,Token 的数量限制一直是一个亟待解决的问题。最近,一项由华人团队完成的研究引起了广泛关注,研究显示,扩散语言模型在 Token 数量受限的情况下,展现出比自回归模型多三倍的数据学习潜力。这一发现可能会为未来的语言模型训练开辟新局面。
这项研究的核心是一个参数规模为10亿的扩散模型,团队使用10亿个 Token 进行了480个周期的训练。在 HellaSwag 和 MMLU 基准测试中,该模型分别达到了56% 和33% 的准确率,且训练过程中未使用任何特殊技巧或数据筛选。更令人惊讶的是,即使在极度重复的数据训练中,模型的性能仍未出现饱和,表明它可以从同一数据中提取出更多有用的信息。
研究人员分析了扩散语言模型的强大数据学习能力,归结为两个主要原因。首先,扩散模型采用了双向建模和扩散目标,这使其能够更全面地挖掘数据中的信息,而传统的自回归模型在处理数据时存在因果限制。其次,扩散模型的计算密度更高,它在训练和推理过程中投入了更多计算资源,通过多次处理数据来优化预测,从而提升了模型的整体性能。
![image.png](https://pic.code-nav.cn/post_picture/1610518142000300034/vTafypzrE9Llse2E.webp "image.png")
尽管扩散模型对数据的重复使用表现出一定的鲁棒性,研究团队发现,随着训练周期的增加,模型会出现过拟合现象。然而,令人惊讶的是,即使在过拟合的情况下,模型在下游任务中的性能并没有立即下降,反而有时会继续提升。这是因为验证损失的变化与下游任务的准确率之间并不总是呈正相关,模型在处理有限的训练数据时,可能会对某些文本片段表现出过于自信。
这项研究的发现为未来 AI 模型的训练方法提供了新的思路,尤其在 Token 数量受限的情况下,扩散语言模型的应用前景将更加广阔。研究团队计划在接下来的工作中使用更大的模型和更多独特的数据,以进一步验证这些发现。
@@ -0,0 +1,21 @@
# 昆仑万维发布Skywork Deep Research Agent v2
本文转载自: [昆仑万维发布Skywork Deep Research Agent v2](https://news.aibase.com/zh/news/20505)
在SkyWork AI技术发布周的第四天,昆仑万维集团宣布了一项重大升级:Skywork Deep Research Agent v2。这一升级标志着天工超级智能体(Skywork Super Agents)的核心引擎得到了显著增强,为用户带来了更多模态、更高质量和更高效的体验。
Skywork Deep Research Agent自5月2日上线以来,已经在AI Office领域大幅改变了大模型的角色,通过skywork.ai平台为用户产出了大量信息密度极高的优质文档、PPT、表格以及其他交付物。新版本的Skywork Deep Research Agent v2引入了“多模态深度调研”Agent,首次整合了多模态检索、理解和生成,解决了传统Deep Research Agent产品依赖纯文本检索分析的局限。
![微信截图_20250814135746.png](https://pic.code-nav.cn/post_picture/1610518142000300034/1G7GJWKLyp4EN9zX.webp "微信截图_20250814135746.png")
昆仑万维Skywork团队推出的“多模态深度调研”Agent,通过技术创新,实现了多模态信息检索能力的提升,包括多模态爬取技术MM-Crawler、长距离多模态信息收集、异步并行Multi-Agent多模态理解架构和多模态结果呈现能力。这些技术突破使得研究人员等用户能够一次性获得信息完整、节奏顺畅、视觉友好的深度报告。
此外,昆仑万维还推出了“多模态深度浏览器”智能体,重塑了社交媒体内容分析与数据洞察。这一智能体通过多项关键自研技术优化,包括升级DOM+视觉推理方案、主流平台专项适配、并行搜索、多动作规划机制、智能筛选、人机无缝接管与隐私保护和安全承诺等,能够模拟人类浏览与交互方式,革新传统数据采集与分析模式。
Skywork Deep Research Agent v2在多项Agent任务评测上超越现有模型,达到行业SOTA水平。在权威的搜索评测榜单BrowseComp上,其性能尤为突出,正确率达到27.8%,开启并行思考模式后,正确率跃升至38.7%,刷新了行业SOTA纪录。
昆仑万维集团在统一模型领域的持续深耕,不断推动开源社区的发展。Skywork Deep Research Agent v2的发布,预计将在多模态内容生成、编辑和理解等领域产生深远影响,为全球用户带来更优质的智能体体验。
-**全球官网:**https://skywork.ai 
-**中国官网:**https://tiangong.cn
@@ -0,0 +1,15 @@
# 智元机器人发布灵创平台:稚晖君宣布机器人二次开发“0 门槛”将至,大幅降低动作编排难度
本文转载自: [智元机器人发布灵创平台:稚晖君宣布机器人二次开发“0 门槛”将至,大幅降低动作编排难度](https://www.ithome.com/0/877/233.htm)
[IT之家](https://www.ithome.com/) 8 月 22 日消息,智元机器人昨天举办首届合作伙伴大会,智元机器人联合创始人兼 CTO “稚晖君”彭志辉发布了**机器人动作与表达创作平台**“灵创平台 (LinkCraft) ”。
IT之家从官方获悉,该平台是一个“极具颠覆性”AI 加成的**机器人多模态内容生成与编辑**工具,拥有丰富的动作种类、支持**预览编辑、动作导入、编排演绎**等核心功能,可将机器人二次开发难度**降低到 0 门槛**。
![图片](https://pic.code-nav.cn/post_picture/1610518142000300034/hMpYqjjs3VKno5lx.webp "智元机器人发布灵创平台:稚晖君宣布机器人二次开发“0 门槛”将至,大幅降低动作编排难度")
彭志辉强调,机器人正从实验室走向生活和产业,但“交互表达”仍是瓶颈,合作伙伴和二开用户需要更简单、高效的方式来定制机器人行为,**“灵创平台的愿景是让机器人像人一样自然表达,让创作者像导演一样自由编排。”**
据悉,灵创平台 Beta 版本将于**今年 10 月**正式上线。以往,机器人动作演示的复杂性往往让非专业人员望而却步,需要专业的调试人员介入,而灵创平台的出现将会“彻底改变”这一现状。该平台内置了丰富的标准动作模板,将可以极大简化创作者在编排、调试机器人动作时的流程。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
@@ -0,0 +1,21 @@
# 腾讯 CodeBuddy IDE 代码助手国内版公测,DeepSeek-V3.1 最新模型免费用
本文转载自: [腾讯 CodeBuddy IDE 代码助手国内版公测,DeepSeek-V3.1 最新模型免费用](https://www.ithome.com/0/877/258.htm)
感谢IT之家网友 [动感超人233](https://m.ithome.com/html/app/open.html?url=ithome%3A%2F%2Fuserpage%3Fid%3D1847841) 的线索投递!
[IT之家](https://www.ithome.com/) 8 月 22 日消息,腾讯云代码助手 CodeBuddy 昨晚宣布,CodeBuddy IDE 国内版正式开放公测,无需邀请码即可免费使用最新的 DeepSeek-V3.1 模型。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/Vc4LwWz5fegMuy4F.webp "腾讯 CodeBuddy IDE 代码助手国内版公测,DeepSeek-V3.1 最新模型免费用")
IT之家附下载地址(Beta 版):[Tencent Cloud Code Assistant CodeBuddy AI Code Editor](https://copilot.tencent.com/ide/)
官方表示,CodeBuddy 可以真正实现**一个人变成一整个开发团队**的体验,支持产品设计、研发编码、部署验证等功能。
* 产品设计:**一句话生成可落地交互原型**,支持上传图片及局部调优。
* 研发编码:内置 Figma,**设计稿秒变可维护源码**。同时,内置腾讯云开发 CloudBase、EdgeOne Pages 及 Supabase,帮助开发者自动配置数据库、用户认证等后端服务,快速构建、部署站点和无服务器应用。
* 部署验证:通过 CloudStudio 一键部署至沙箱环境,并生成可分享链接。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
@@ -0,0 +1,35 @@
# 钉钉联手通义推出Fun-ASR语音识别大模型,可听懂家居、畜牧等十大行业黑话
本文转载自: [钉钉联手通义推出Fun-ASR语音识别大模型,可听懂家居、畜牧等十大行业黑话](https://mp.weixin.qq.com/s/HfYSXtcDa64t8W3EX-Chcg)
![](https://pic.code-nav.cn/post_picture/1610518142000300034/MqAf4WtOxvV8CELw.png)
8 月 22 日,钉钉、通义实验室语音团队宣布,联手推出新一代语音识别大模型 Fun-ASR,能听懂家装、畜牧等十大行业黑话,并支持企业专属模型定制训练。基于双方深度共建,Fun-ASR 能够准确转写各种语音信号,具备识别多行业术语、不同语言与口音的能力,也能结合上下文信息实现更精准的转录,并支持企业专属模型定制训练,让模型更懂企业场景。
目前,Fun-ASR 已被集成进钉钉的多个功能模块,包括会议字幕与同传、智能纪要、语音助手等,旨在构建一套稳定、高效、易扩展的语音识别基座,尤其适用对企业级语境理解、识别准确率有较高要求的场景。
![图片](https://pic.code-nav.cn/post_picture/1610518142000300034/vMlm1E9QN5Elv1wo.webp)
技术层面看,Fun-ASR 语音识别大模型的核心亮点在于三方面:
![](https://pic.code-nav.cn/post_picture/1610518142000300034/W0RKyeWFTY22RPmy.webp)
该模型经过上亿小时音频数据的训练,并结合钉钉多行业客户的真实场景共创,能够准确理解互联网、科技、家装、畜牧、汽车等十多个领域的专业术语。
实测数据显示,Fun-ASR 在保险行业的准确率较以往提升 18%,在家装、畜牧等行业也实现了 15%-20% 的提升。针对生僻词汇,Fun-ASR 还提供企业自定义热词能力,最多可支持 1000+ 热词导入。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/mMwgmz7Ue9x7Tylj.webp)
Fun-ASR 可结合企业在钉钉内的已有信息如通讯录、日程、知识库等,进行推理优化,有效缓解大模型造成的幻觉,提供更可靠的转写结果。该能力需经企业授权后方可生效。
![](https://pic.code-nav.cn/post_picture/1610518142000300034/u4wiRE8wXJYU9fB0.webp)
基于高效的端到端训练架构,该模型可利用企业提供的真实场景语音数据进一步做算法优化,以提升如品牌名、项目代号、产品名、人名等专属词汇的识别准确率。
以顾家家居与钉钉的合作为例,经过专属训练后,在顾家的门店销售给客户讲解产品时,该模型能够准确识别“比利时进口 Pulse 脉冲乳胶”、“独创 Sonocore 发泡工艺”等专业表述,为后续对客户需求的进一步分析提供可靠依据。
对于此次合作,通义实验室语音团队负责人李先刚表示:“我们很高兴能够与钉钉携手,共同推动语音识别技术在企业场景中的创新和应用。未来,我们将持续扩大 Fun-ASR 的数据和模型规模,不断提升大模型语音智能解决方案的可复制能力,为企业客户带来更高效、智能的产品体验。”  
钉钉 CTO 朱鸿也表示,“钉钉和通义团队仅用三个月的紧密协作,就实现了 Fun-ASR 模型的成功落地,并赢得了头部客户的高度认可。这是我们迈向行业领先的一次关键突破,也将为更多钉钉客户企业打造专业定制大模型提供可参考的范例。”
目前,Fun-ASR 的潜力尚未被穷尽,双方将继续探索在方言识别、噪声鲁棒性、多语种支持及企业深度定制等方向的升级工作,不断提升语音转写的精准度和实用性,为更多企业业务场景的智能升级赋能。
+40
View File
@@ -47,6 +47,46 @@
## AI行业资讯
[智元机器人发布灵创平台:稚晖君宣布机器人二次开发“0 门槛”将至,大幅降低动作编排难度](AI行业资讯/2025-08/智元机器人发布灵创平台:稚晖君宣布机器人二次开发“0%20门槛”将至,大幅降低动作编排难度.md)
[Kimi 鸿蒙版 App 体验升级,使用华为仓颉 markdown 解析引擎滑动帧率提升至 2.4 倍](AI行业资讯/2025-08/Kimi%20鸿蒙版%20App%20体验升级,使用华为仓颉%20markdown%20解析引擎滑动帧率提升至%202.4%20倍.md)
[OpenAI CFO透露公司在考虑IPO 有望成科技领域最大规模IPO](AI行业资讯/2025-08/OpenAI%20CFO透露公司在考虑IPO%20有望成科技领域最大规模IPO.md)
[会头脑风暴的 AI — 国内首个并行思考模型 问小白o4 来啦!](AI行业资讯/2025-08/会头脑风暴的%20AI%20—%20国内首个并行思考模型%20问小白o4%20来啦!.md)
[腾讯 CodeBuddy IDE 代码助手国内版公测,DeepSeek-V3.1 最新模型免费用](AI行业资讯/2025-08/腾讯%20CodeBuddy%20IDE%20代码助手国内版公测,DeepSeek-V3.1%20最新模型免费用.md)
[钉钉联手通义推出Fun-ASR语音识别大模型,可听懂家居、畜牧等十大行业黑话](AI行业资讯/2025-08/钉钉联手通义推出Fun-ASR语音识别大模型,可听懂家居、畜牧等十大行业黑话.md)
[昆仑万维发布Skywork Deep Research Agent v2](AI行业资讯/2025-08/昆仑万维发布Skywork%20Deep%20Research%20Agent%20v2.md)
[ChatExcel获近千万天使轮融资,全链路AI DataAgent从数据获取到价值交易打造商业闭环平台](AI行业资讯/2025-08/ChatExcel获近千万天使轮融资,全链路AI%20DataAgent从数据获取到价值交易打造商业闭环平台.md)
[华人团队破解Token限制,扩散模型的潜力超越自回归三倍!](AI行业资讯/2025-08/华人团队破解Token限制,扩散模型的潜力超越自回归三倍!.md)
[OpenAI 前 CTO的AI公司Thinking Machines Lab 获得 20 亿美元融资,估值达 120 亿美元](AI行业资讯/2025-07/OpenAI%20前%20CTO的AI公司Thinking%20Machines%20Lab%20获得%2020%20亿美元融资,估值达%20120%20亿美元.md)
[荣耀推出 AI Connect 平台:支持 MCP 和 A2A 协议,联合阿里、比亚迪、美的](AI行业资讯/2025-07/荣耀推出%20AI%20Connect%20平台:支持%20MCP%20和%20A2A%20协议,联合阿里、比亚迪、美的.md)
[DeepSeek App 更新至 1.3.0 版本,新增对话生成分享图功能](AI行业资讯/2025-08/DeepSeek%20App%20更新至%201.3.0%20版本,新增对话生成分享图功能.md)
[9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA智谱开源](AI行业资讯/2025-07/9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA智谱开源.md)
[全栈国产化技术闭环初步贯通:银河麒麟操作系统与文心 4.5 系列模型开展深度技术合作](AI行业资讯/2025-07/全栈国产化技术闭环初步贯通:银河麒麟操作系统与文心%204.5%20系列模型开展深度技术合作.md)
[刚刚,Meta宣布正式成立「超级智能实验室」!11人豪华团队首曝光](AI行业资讯/2025-07/刚刚,Meta宣布正式成立「超级智能实验室」!11人豪华团队首曝光.md)
[马斯克 xAI 公司补充 100 亿美元“弹药”,火力聚焦打造地表最强 AI](AI行业资讯/2025-07/马斯克%20xAI%20公司补充%20100%20亿美元“弹药”,火力聚焦打造地表最强%20AI.md)
[X 平台将允许 AI 机器人撰写社区注释,由用户反馈决定相应内容是否公开展示](AI行业资讯/2025-07/X%20平台将允许%20AI%20机器人撰写社区注释,由用户反馈决定相应内容是否公开展示.md)
[微软被曝将“AI 使用量”纳入员工考核:不再是“可选项”,直接挂钩绩效](AI行业资讯/2025-07/微软被曝将“AI%20使用量”纳入员工考核:不再是“可选项”,直接挂钩绩效.md)
[英特尔 Day0 完成文心大模型 4.5 系列开源模型的端侧部署](AI行业资讯/2025-07/英特尔%20Day0%20完成文心大模型%204.5%20系列开源模型的端侧部署.md)
[不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵](AI行业资讯/2025-07/不走寻常路的淘天技术节:AI狼人杀、Poster路演、博见社轮番上阵.md)
[「库克接班人」官宣退休:苹果二号人物,主导Apple Watch诞生](AI行业资讯/2025-06/「库克接班人」官宣退休:苹果二号人物,主导Apple%20Watch诞生.md)
[港股一天敲六个锣!“仓储机器人第一股”极智嘉IPO首日市值超210亿](AI行业资讯/2025-06/港股一天敲六个锣!“仓储机器人第一股”极智嘉IPO首日市值超210亿.md)