微软开源 Phi-4 系列小参数模型,推理能力媲美 DeepSeek
微软开源了三个新版 Phi-4 小参数模型,分别是 Reasoning、Min-Reasoning 和 Reasoning-plus。 Phi-4-Reasoning 的基础架构源自微软开源的 Phi-4 模型,为了提升其推理能力,微软通过监督微调和强化学习相结合的训练方法行了深度强化。 该方法的核
Hugging Face 发布 Open Computer Agent,文字指令远程操控虚拟电脑
Hugging Face 推出了免费云端 AI 智能体工具 Open Computer Agent,支持用户通过文本指令,远程操控基于 Linux 的虚拟计算机,使用 Firefox 等应用。 https://huggingface.co/spaces/smolagents/computer-age
投入16年仍未见回报,Robotaxi离自动驾驶的「终极梦想」依旧遥远
Robotaxi 多少可以称的上是一个「神奇」的商业概念。 神奇在所有把 Robotaxi 作为主营业务的公司都在亏损和烧钱;也神奇在烧了这么多年钱后,依然有新的资方进入;更神奇在哪怕强如 Google,花了近 16 年时间,到现在也没完全确定 Robotaxi 的长期商业模式。 这不,Robota
拓扑材料中首现不寻常手性量子态,为未来量子技术发展提供关键线索
【总编辑圈点】 科技日报北京 5 月 12 日电 (记者张梦然)最新一期《自然·通讯》杂志刊登了一项由美国普林斯顿大学领导的研究成果:团队利用新开发的扫描光电流显微镜,在一种被称为 KV3Sb5 的 Kagome 晶格拓扑材料中,首次直接观测到电荷密度波背后隐藏的手性对称破缺现象。这一发现不仅解答了
第一个“退群”的小米友商出现了
在小米汽车的强力冲击下,第一个“受害者”出现了。 5 月 7 日,吉利汽车宣布将对新能源汽车品牌极氪私有化,价格为每股 ADS 25.66 美元,总报价 65 亿美元。相较过去 30 个交易日的均价,吉利这份报价溢价 20%。 极氪成立于 2021 年,从吉利拆分后,2024 年 5 月登陆纽交所。
微软旗下 AI 开发平台支持 A2A 协议
微软宣布,旗下 Azure AI Foundry 和 Microsoft Copilot Studio 两大开发平台已支持最新的 Agent 开发协议 A2A,并且还加入了 GitHub 上的 A2A 工作组,为协议和工具做出贡献。 谷歌在 4 月初发布的 A2A 允许智能体在不同的云、应用程序和服
Linux Mint 新版本即将发布,代号 "Zara"、基于 Ubuntu 24.04 LTS
Linux Mint 团队在最新月度简报中确认了即将推出的两个版本的命名。Linux Mint 22.2 代号为 “Zara”,预计将在未来几个月内面世,继续基于 Ubuntu 24.04 LTS 打造。 而基于 Debian 的 LMDE 7 则被命名为 “Gigi”,其发布时间预计紧随 Debi
Meta 任命前谷歌 DeepMind 主管为 AI 研究实验室新负责人
根据彭博社的报道,Meta 公司已任命 Robert Fergus 为其基础 AI 研究实验室(FAIR)的新负责人,接替于四月宣布离职的 Joelle Pineau。 Fergus 在担任 Meta 新职务之前,曾在 Google DeepMind 工作了约五年,担任研究总监。在此之前,他还曾在
零一万物联创戴宗宏离职创业,曾带头组建了 AI Infra 团队
根据《智能涌现》的独家报道,零一万物联合创始人、技术副总裁戴宗宏于近日离职创业。 在零一万物期间,戴宗宏负责 AI Infra 团队,主要解决大批量并行训练时的系统瓶颈,提升训练效率,降低训练成本。据了解,戴宗宏的创业项目,在近期获得了创新工场的投资。 关于上述信息,零一万物回复表示,零一万物联合创
IBM 将三大 AI 项目移交给 Linux 基金会
IBM 已向 Linux 基金会旗下的 LF AI & Data 基金会移交了三大 AI 项目,分别是 Docling、BeeAI 和 Data Prep Kit。 “这些项目的诞生源于填补 AI 开发工具关键空白的需求。它们将成为更广泛社区构建 AI 应用程序和代理工作流的催化剂,推动生成式 AI
Raspberry Pi OS 引入全新锁屏界面,改进自动登录
任何拥有 Raspberry Pi 电脑的用户现在都可以下载新版 Raspberry Pi OS,它具有全新的锁屏界面、改进的自动登录选项、全新的打印机应用程序、Linux 6.12 系统以及更佳的触摸屏操控体验。现有用户只需在终端中输入两个非常简单的命令即可更新,而想要全新安装的用户则可以使用 R
快手开源 KuaiMod,多模态 AI 专治各种劣质内容
快手推出了基于多模态大模型的创新方案 KuaiMod,旨在优化短视频平台生态并提升用户体验。 KuaiMod 的核心在于其对短视频内容的质量判别。传统的内容判别方法往往依赖于静态规则和人工标注,成本高且难以应对用户偏好的动态变化。而 KuaiMod 通过构建一个包含 1000 条真实短视频的数据集,
IT运维为了打赏游戏主播,偷走公司158台平板电脑进行倒卖
据《新闻晨报》报道,前不久上海一派出所接到了辖区某公司报警称,公司 32 楼仓库内数台平板电脑被盗。接报后,民警经现场勘查,结合报警人提供的信息,警方初步推断此案很可能系内部人员作案。通过对案发地及周边公共视频进行判断分析,迅速锁定了一名身穿黑色 T 恤的男子,而此人正是公司内部员工。 经查,犯罪嫌
Meta 开源 LlamaFirewall,面向 AI 智能体的安全框架
Meta 开源了名为 LlamaFirewall 的安全框架,用于应对 AI 智能体不断演变的威胁格局,为生产环境中的 AI 智能体提供系统级安全保护。 https://meta-llama.github.io/PurpleLlama/LlamaFirewall/ 随着大型语言模型(LLMs)嵌入
国轩高科:全球首款 20MWh 储能舱相关专利将向全球公开
IT 之家 5 月 12 日消息,据国轩高科今日消息,由中国化学与物理电源行业协会组织的“20MWh 高性能电化学储能电池系统”科技成果鉴定会,在安徽六安市金寨国轩新能源有限公司召开,鉴定会高度肯定了该项目成果的创新性、技术性和应用性,一致认为达到“国际领先”水平,并颁发科技成果评价证书。 ▲国轩高
前日产CEO卡洛斯·戈恩锐评老东家:已经奄奄一息,自己早就预见了
IT 之家 5 月 12 日消息,现年 71 岁的前日产 CEO 卡洛斯・戈恩在接受法国 BFM TV 采访时表示,自己“早就看到了”日产的困境:“我预见到了日产的衰退和联盟的解体。” 至于日产出了什么问题,戈恩直言不讳地指出,责任在于公司领导层:“决策太慢了。问题的根源在于日产的管理层。” 这位以
孟羽童:与董明珠不存在“互撕”,她是重要的贵人
董明珠前秘书孟羽童自从离职后,就开始主要经营自己的小红书账号,目前粉丝 146 万。账号简介中称是“前董事长秘书”。 近日,有网友在其账号下评论称:“都已经互撕了,我感觉你不写某董事长秘书比较好,首先,大家都认识你,你不写大家也知道你之前的履历,你写了反而让人感觉你在自降身份。” 对此,孟羽童回应称
维基百科公布新 AI 战略:利用 AI 提升志愿者效率,而非取代人工
IT 之家 5 月 12 日消息,维基百科运营方维基媒体基金会今年 4 月末发布了其 AI 战略,将人工智能视为辅助百科编辑者跨越技术障碍、提高效率的有利工具,而非代替人类编辑志愿者工作的手段。 基金会强调,志愿者社区是维基百科能取得成功的“最重要且独特的因素”,近 25 年来诸多编辑的研究、思考、
一个「always」站在大模型技术C位的传奇男子
西风衡宇发自凹非寺 量子位 | 公众号 QbitAI 怎么老是你???(How old are you) 这是最近网友不断对着 Transformer 八子之一的 Noam Shazeer(为方便阅读,我们称他为沙哥)发出的灵魂疑问。 尤其是最近 Meta FAIR 研究员朱泽园分享了他们《Phys
开源即屠榜!UniME多模态框架登顶MMEB训练榜,刷新多项SOTA纪录
UniME 团队投稿 量子位 | 公众号 QbitAI 告别 CLIP 痛点,更懂语义关联的跨模态理解新 SOTA 来了! 格灵深瞳、阿里 ModelScope 团队,以及通义实验室机器智能团队联合发布通用多模态嵌入新框架 UniME,一经推出就刷新 MMEB 训练榜纪录。 图片于 2025 年 5
Qwen上新AI前端工程师!一句话搞定HTML/CSS/JS,秒变React大神
梦晨发自凹非寺 量子位 | 公众号 QbitAI Qwen 上新“AI 前端工程师”Web Dev,一句话开发网页应用。 三大件 HTML,CSS,JavaScript 一个工具全包了,定睛一看用的还是 React 框架。 几秒钟生成个人网站,布局美观还带特效,接下来改改内容上传 GitHub Pa
字节Seed首次开源代码模型,拿下同规模多个SOTA
克雷西明敏发自凹非寺 量子位 | 公众号 QbitAI 字节 Seed 首次开源代码模型! Seed-Coder,8B 规模,超越 Qwen3,拿下多个 SOTA。 它证明“只需极少人工参与,LLM 就能自行管理代码训练数据”。 通过自身生成和筛选高质量训练数据,可大幅提升模型代码生成能力。 这可以
首次系统评估Qwen3在量化下的鲁棒性:8bit下仍保持近乎无损性能
北航联合团队投稿 量子位 | 公众号 QbitAI Qwen3 强势刷新开源模型 SOTA,但如何让其在资源受限场景中,既能实现低比特量化,又能保证模型“智商”不掉线? 来自北京航空航天大学、西安电子科技大学和苏黎世联邦理工学院的联合研究团队找到了破局关键。 团队对 Qwen3 的 5 种后训练量化
面壁CEO李大海:物理世界要实现AGI,一定是通过端侧智能
编辑部整理自凹非寺 量子位 | 公众号 QbitAI 未来物理世界要实现 AGI,一定是通过端侧智能。 面壁智能 CEO 兼联合创始人李大海在第三届中国 AIGC 产业大会上分享了他们的经验认知。 作为当前端侧智能的领跑者,面壁智能在过去一段时间以来可谓是进展频频。 他们发布了端侧模型 MiniCP
AI开源社区来了国家队!华为百度第一时间加入
克雷西发自凹非寺 量子位 | 公众号 QbitAI 央企通信巨头,牵头搞起了一个开源社区? 而且模型、数据等各种资源应有尽有,还有学习资料和交流空间 这个社区,就是由中国电信天翼云牵头发起的魔乐社区(Modelers.cn)。 魔乐社区不只有在线平台,还在线下正式成立了理事会,对社区进行管理建设。
刚刚,ChatGPT的深度研究可以连接GitHub了!网友:这是真·RAG
金磊发自凹非寺 量子位 | 公众号 QbitAI ChatGPT 在深夜又更新了一波大的—— 深度研究(Deep Research)功能,现在可以直接连接到 GitHub 了! 那么效果又是怎样的呢? 例如我们在点击“深度研究”的同时,提出一个需求: 我最近加入了团队,并接到一项任务要求熟悉我们的
DeepSeek精度效率双提升,华为信工所提出思维链“提前退出”机制
DEER 团队投稿 量子位 | 公众号 QbitAI 长思维链让大模型具备了推理能力,但如果过度思考,就有可能成为负担。 华为联合中科院信工所提出了一种新的模式,让大模型提前终止思考来避免这一问题。 利用这种方法,无需额外训练,就可以让大模型的精度和效率同时提升 这种方式名为 DEER,也就是动态提
突破多模态奖励瓶颈!R1-Reward用强化学习赋予模型长期推理能力
R1-Reward 团队投稿 量子位 | 公众号 QbitAI 多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用: 在训练阶段,它可以提供稳定的 reward; 在评估阶段,它可以选择更好的 sample 结果; 单独使用时,它可以直接作为 evaluator
Bye,英伟达!华为NPU,跑出了准万亿参数大模型
金磊发自凹非寺 量子位 | 公众号 QbitAI 现在,跑准万亿参数的大模型,可以彻底跟英伟达 Say Goodbye 了。 完成此举的,正是华为! 技术报告:https://arxiv.org/abs/2505.04519 要知道,在此之前,训练万亿参数大模型这事,是有诸多“拦路虎”在身上的。 例