AI 驱动下的上下文治理与管理范式革命
研发效能白皮书:AI 驱动下的上下文治理与管理范式革命一.范式转移:从代码核心到上下文核心的演进战略背景分析 在 AI 驱动的"Web Coding"时代,软件研发的底层逻辑正在发生根本性变化。过去二十年,开发者在 SegmentFault 或 Stack Overflow 上找答案,靠人写代码。现 ...
论文解读:LLM 不直接改代码,也能让程序跑快 3 倍?
今天这篇论文「[Agentic Auto-Scheduling: An Experimenta l Study of LLM-Guided Loop Optim ization」讲的是一个很具体的问题:LLM 能不能参与编译器优化,让程序跑得更快? 这里的 Loop,指的是程序里的循环结构,比如 f ...
小厂面试官问我:“公司内部文档不多,直接用小模型代替 RAG 可行吗?”,我笑了说:“RAG 解决的不是文档多不多的问题。。”
大家好,我是R哥。 有个兄弟前段时间面试,面试官问了他一个很有意思的问题: 公司内部文档并不多,可能就几十份文档、几百页内容,为什么还要上 RAG?直接训练一个小模型不行吗? 很多人听到这个问题,第一反应是肯定可以。毕竟文档量不大,把这些资料整理出来,微调一个小模型,然后直接提供问答能力,看起来似乎 ...
大模型备案材料的语料标注规则,到底怎么写?
大模型备案材料的语料标注规则,到底怎么写? 原创 · 大模型备案指南 · 2026-06-29 做生成式大模型备案的朋友,十有八九都被《语料标注规则》这份材料折磨过。 翻来覆去就是那几个模块:标注人员怎么管、标注规则怎么定、数据格式怎么弄、质量怎么评估……但真动手写的时候,很多人又不知道从哪下笔,写 ...
Flow Matching 训练的输入分布问题:从 VAE Latent 统计性质到归一化工程实践——以 VoxFlash-TTS 为例
摘要:本文从 OT-CFM 插值路径的统计性质出发,系统推导 Flow Matching 模型输入分布与输出速度场分布的均值和方差,分析 VAE KL 散度权重对 latent 点云分散程度的影响,并借鉴图像生成领域的 SNR 失配理论,从理论角度论证逐通道归一化对 Flow Matching 训练 ...
为什么 FDE 正在成为商业落地的唯一解药
AI 时代的"无名英雄":为什么 FDE 正在成为商业落地的唯一解药?1. 引言:顶配大厨与听不懂的需求 想象一下,目前的通用大模型(LLM)就像是一个厨艺绝顶、刀工出众,却完全不通人情的顶级大厨。他能在零点几秒内将食材切成一万根细丝,展示出令人惊叹的"技术确定性"。然而,当你作为顾客对他说"我想吃 ...
Runlet:一个小而清晰、Provider Neutral 的 Python Agent Runtime
调用模型很简单,真正麻烦的是把它做成一个稳定、可控、可观测的runtime。 大多数 Python 开发者都可以在几分钟内完成第一个 demo:发一个请求,拿到模型回复,打印结果。真正的问题通常从下一步才开始。当一个简单的模型调用逐渐演变成真实应用里的 agent runtime,你很快会碰到流式输 ...
15天学会AI应用开发(十)把文本嵌入模型换成国产模型
前面两篇文章在演示RAG功能时,做向量化的文本嵌入模型都用国外的all-MiniLM-L6-v2,该模型主要适用英文,对于中文总体也能用,但在细节上处理欠佳。本文就来介绍如何使用国产离线的文本嵌入模型替换国外模型,以及如何体现国产模型的比较优势。 一、all-MiniLM-L6-v2的缺点 虽然al ...
DeepSeek 表格怎么导出到 Excel 或 Word?复制后错列怎么办
DeepSeek 表格怎么导出到 Excel 或 Word?复制后错列怎么办 很多人让 DeepSeek 生成表格后,第一反应是直接复制到 Word 或 Excel。短表格通常没问题,但只要列数多、单元格里有换行、竖线、编号、链接,复制后就可能变成一整段文字,或者列和列对不上。 这类问题的核心不是 ...
15天学会AI应用开发(九)利用Chroma持久化向量数据
上一篇文章通过all-MiniLM-L6-v2模型结合FAISS实现了简单的RAG检索功能,但FAISS运行于内存中,无法持久化保存向量数据,重启后又得重新对文本做向量化,比较浪费算力资源。本文就来介绍如何使用向量数据库来持久保存向量数据。 一、向量数据库Chroma Chroma是一个本地向量数 ...
为什么很多 AI Agent 一上线就开始烧钱?我在这个开源项目里看到了答案
ClawRouter 是一个面向 AI Agent 的开源本地路由层,它关注的不只是多模型调用,而是模型选择、成本控制、fallback、Token 压缩和 Agent 运行时调度。 ...
四周实现非母语教学APP
极致的极简主义和无干扰设计(Zero-Distortion Design)正是目前少儿启蒙产品最稀缺的特性。现在的App充斥着各种金币、动画和复杂UI,反而分散了孩子的注意力。每关15个短句30个插画,全部都是根据我的提示词AI生成,教材是让ChatGPT蒸馏了Reading Eggs、Raz Ki ...
MCP 到底是什么?为什么 Agent 都想接上它
当我们聊起 Agent,或者阅读相关内容时,经常会看到一个词:MCP。它看起来像一个偏底层的技术名词,我们可以先来简单地记住这样一句话:MCP 是一套让 Agent 连接外部资料和工具的通用方式。 为什么 Agent 需要 MCP?因为我们要让 Agent 真正干活,第一步往往是得让它看见任务现场。 ...
Agent Mail 产品介绍与 Trae Solo Agent 实测
Agent Mail 产品介绍与 Trae Solo Agent 实测一、产品基础信息Agent Mail(Agently Mail)是 QQ 邮箱团队面向 AI Agent 推出的专属邮箱服务,官网:https://agent.qq.com/,官方帮助文档:https://help.agent.q ...
模型训练入门教程:从MNIST手写数字迁移到EMNIST手写字母的识别之路
很多人入门深度学习,第一步就是复制 GitHub 上的 MNIST 代码,跑通,看到 99% 的准确率,然后就以为自己会 CNN 了。 我也一样。直到我开始问自己一些“较真”的问题,才发现:代码能跑 ≠ 我真的懂 这篇教程,记录我从调包、解剖、设计,再到踩完迁移学习坑的全过程。没有玄学,只有一步一 ...
2026年全网最深入讲解大模型备案【附:评估测试题+备案参考文件】
文章目录 (一)适用主体 (二)语料安全 (三)模型安全 (四)安全措施要求 (五)词库要求 (六)安全评估要求 (七)附录大模型备案材料源文件 2024年3月1日,我国通过了《生成式人工智能服务安全基本要求》(以下简称《AIGC安全要求》),这是目前我国第一部有关AIGC服务安全性方面的技术性指导 ...
RAG ≠ 多跳推理 —— 关于知识、关联与推理目标的框架设想
关于一个区分 RAG 与多跳推理的设想 知识、关联与推理目标的三层框架 引言:一个直觉的起点 RAG(Retrieval-Augmented Generation)和多跳推理(Multi-hop Reasoning)经常被放在一起讨论。很多人都默认一个隐含前提:RAG做得好,多跳推理自然就能做好;或 ...
我制作了一个 AI 导航网站,分享给大家
推荐一个简洁、无广告的 AI 导航网站。AI3927 链接地址:https://ai3927.com AI3927(ai3927.com)从诞生第一天起就有一条铁律:不接广告、不搞付费推荐、不挂联盟链接。 拟态风格 粘土风格 暗色玻璃 多种暗黑风格 整个网站从玻璃拟态到霓虹赛博朋克,整整 9 套主题 ...
300 个 Agent 一起干活,Claude 负责验收:一次自进化的 Loop Engineerig 实践
大多数人打开 Kimi,只是把它当成一个聊天框。输入一个问题,等它回答,然后关掉页面。当然这用法没毛病,但 0xMovez 给出了他的 Kimi 最佳实践,在本文中我们将一同感受他是如何让 300 个 Agent 一起干活,并让 Claude 当“包工头”验收成果的。 我们可以重点关注下 Kimi ...
未来,什么才是 AI“正确的使用方式”
本文以“大模型不是马,而是大脑”为核心视角,重新定义 AI 系统结构,指出当前问题不在模型能力,而在 Agent 作为“身体”的不成熟。笔者认为,人类正在通过实践逐步定义 AI 的正确使用方式。 ...


