0

AI 驱动下的上下文治理与管理范式革命

研发效能白皮书:AI 驱动下的上下文治理与管理范式革命一.范式转移:从代码核心到上下文核心的演进战略背景分析 在 AI 驱动的"Web Coding"时代,软件研发的底层逻辑正在发生根本性变化。过去二十年,开发者在 SegmentFault 或 Stack Overflow 上找答案,靠人写代码。现 ...

PetterLiu 发布于 2026-06-30 14:27 评论(0) 阅读(5)
0

论文解读:LLM 不直接改代码,也能让程序跑快 3 倍?

今天这篇论文「[Agentic Auto-Scheduling: An Experimenta l Study of LLM-Guided Loop Optim ization」讲的是一个很具体的问题:LLM 能不能参与编译器优化,让程序跑得更快? 这里的 Loop,指的是程序里的循环结构,比如 f ...

小七-七牛开发者 发布于 2026-06-30 13:55 评论(0) 阅读(7)
0

小厂面试官问我:“公司内部文档不多,直接用小模型代替 RAG 可行吗?”,我笑了说:“RAG 解决的不是文档多不多的问题。。”

大家好,我是R哥。 有个兄弟前段时间面试,面试官问了他一个很有意思的问题: 公司内部文档并不多,可能就几十份文档、几百页内容,为什么还要上 RAG?直接训练一个小模型不行吗? 很多人听到这个问题,第一反应是肯定可以。毕竟文档量不大,把这些资料整理出来,微调一个小模型,然后直接提供问答能力,看起来似乎 ...

Java技术栈 发布于 2026-06-30 09:56 评论(0) 阅读(11)
0

大模型备案材料的语料标注规则,到底怎么写?

大模型备案材料的语料标注规则,到底怎么写? 原创 · 大模型备案指南 · 2026-06-29 做生成式大模型备案的朋友,十有八九都被《语料标注规则》这份材料折磨过。 翻来覆去就是那几个模块:标注人员怎么管、标注规则怎么定、数据格式怎么弄、质量怎么评估……但真动手写的时候,很多人又不知道从哪下笔,写 ...

Cyobobo 发布于 2026-06-30 09:18 评论(0) 阅读(6)
0

Flow Matching 训练的输入分布问题:从 VAE Latent 统计性质到归一化工程实践——以 VoxFlash-TTS 为例

摘要:本文从 OT-CFM 插值路径的统计性质出发,系统推导 Flow Matching 模型输入分布与输出速度场分布的均值和方差,分析 VAE KL 散度权重对 latent 点云分散程度的影响,并借鉴图像生成领域的 SNR 失配理论,从理论角度论证逐通道归一化对 Flow Matching 训练 ...

刺猬的温驯 发布于 2026-06-29 17:56 评论(0) 阅读(68)
0

为什么 FDE 正在成为商业落地的唯一解药

AI 时代的"无名英雄":为什么 FDE 正在成为商业落地的唯一解药?1. 引言:顶配大厨与听不懂的需求 想象一下,目前的通用大模型(LLM)就像是一个厨艺绝顶、刀工出众,却完全不通人情的顶级大厨。他能在零点几秒内将食材切成一万根细丝,展示出令人惊叹的"技术确定性"。然而,当你作为顾客对他说"我想吃 ...

PetterLiu 发布于 2026-06-29 15:40 评论(0) 阅读(18)
0

Runlet:一个小而清晰、Provider Neutral 的 Python Agent Runtime

调用模型很简单,真正麻烦的是把它做成一个稳定、可控、可观测的runtime。 大多数 Python 开发者都可以在几分钟内完成第一个 demo:发一个请求,拿到模型回复,打印结果。真正的问题通常从下一步才开始。当一个简单的模型调用逐渐演变成真实应用里的 agent runtime,你很快会碰到流式输 ...

Farmer.D 发布于 2026-06-28 13:37 评论(0) 阅读(9)
2

15天学会AI应用开发(十)把文本嵌入模型换成国产模型

前面两篇文章在演示RAG功能时,做向量化的文本嵌入模型都用国外的all-MiniLM-L6-v2,该模型主要适用英文,对于中文总体也能用,但在细节上处理欠佳。本文就来介绍如何使用国产离线的文本嵌入模型替换国外模型,以及如何体现国产模型的比较优势。 一、all-MiniLM-L6-v2的缺点 虽然al ...

aqi00 发布于 2026-06-28 11:36 评论(2) 阅读(213)
0

DeepSeek 表格怎么导出到 Excel 或 Word?复制后错列怎么办

DeepSeek 表格怎么导出到 Excel 或 Word?复制后错列怎么办 很多人让 DeepSeek 生成表格后,第一反应是直接复制到 Word 或 Excel。短表格通常没问题,但只要列数多、单元格里有换行、竖线、编号、链接,复制后就可能变成一整段文字,或者列和列对不上。 这类问题的核心不是 ...

【DS随心转】 发布于 2026-06-27 18:36 评论(0) 阅读(15)
0

15天学会AI应用开发(九)利用Chroma持久化向量数据

​上一篇文章通过all-MiniLM-L6-v2模型结合FAISS实现了简单的RAG检索功能,但FAISS运行于内存中,无法持久化保存向量数据,重启后又得重新对文本做向量化,比较浪费算力资源。本文就来介绍如何使用向量数据库来持久保存向量数据。 一、向量数据库Chroma Chroma是一个本地向量数 ...

aqi00 发布于 2026-06-27 11:28 评论(0) 阅读(149)
0

为什么很多 AI Agent 一上线就开始烧钱?我在这个开源项目里看到了答案

ClawRouter 是一个面向 AI Agent 的开源本地路由层,它关注的不只是多模型调用,而是模型选择、成本控制、fallback、Token 压缩和 Agent 运行时调度。 ...

小华同学ai 发布于 2026-06-27 11:10 评论(0) 阅读(19)
0

四周实现非母语教学APP

极致的极简主义和无干扰设计(Zero-Distortion Design)正是目前少儿启蒙产品最稀缺的特性。现在的App充斥着各种金币、动画和复杂UI,反而分散了孩子的注意力。每关15个短句30个插画,全部都是根据我的提示词AI生成,教材是让ChatGPT蒸馏了Reading Eggs、Raz Ki ...

PetterLiu 发布于 2026-06-26 15:30 评论(0) 阅读(14)
0

MCP 到底是什么?为什么 Agent 都想接上它

当我们聊起 Agent,或者阅读相关内容时,经常会看到一个词:MCP。它看起来像一个偏底层的技术名词,我们可以先来简单地记住这样一句话:MCP 是一套让 Agent 连接外部资料和工具的通用方式。 为什么 Agent 需要 MCP?因为我们要让 Agent 真正干活,第一步往往是得让它看见任务现场。 ...

小七-七牛开发者 发布于 2026-06-26 10:39 评论(0) 阅读(19)
0

Agent Mail 产品介绍与 Trae Solo Agent 实测

Agent Mail 产品介绍与 Trae Solo Agent 实测一、产品基础信息Agent Mail(Agently Mail)是 QQ 邮箱团队面向 AI Agent 推出的专属邮箱服务,官网:https://agent.qq.com/,官方帮助文档:https://help.agent.q ...

PetterLiu 发布于 2026-06-26 10:14 评论(0) 阅读(484)
2

模型训练入门教程:从MNIST手写数字迁移到EMNIST手写字母的识别之路

很多人入门深度学习,第一步就是复制 GitHub 上的 MNIST 代码,跑通,看到 99% 的准确率,然后就以为自己会 CNN 了。 我也一样。直到我开始问自己一些“较真”的问题,才发现:代码能跑 ≠ 我真的懂​ 这篇教程,记录我从调包、解剖、设计,再到踩完迁移学习坑的全过程。没有玄学,只有一步一 ...

pie_thn 发布于 2026-06-25 17:28 评论(0) 阅读(199)
0

2026年全网最深入讲解大模型备案【附:评估测试题+备案参考文件】

文章目录 (一)适用主体 (二)语料安全 (三)模型安全 (四)安全措施要求 (五)词库要求 (六)安全评估要求 (七)附录大模型备案材料源文件 2024年3月1日,我国通过了《生成式人工智能服务安全基本要求》(以下简称《AIGC安全要求》),这是目前我国第一部有关AIGC服务安全性方面的技术性指导 ...

Cyobobo 发布于 2026-06-25 16:34 评论(0) 阅读(23)
0

RAG ≠ 多跳推理 —— 关于知识、关联与推理目标的框架设想

关于一个区分 RAG 与多跳推理的设想 知识、关联与推理目标的三层框架 引言:一个直觉的起点 RAG(Retrieval-Augmented Generation)和多跳推理(Multi-hop Reasoning)经常被放在一起讨论。很多人都默认一个隐含前提:RAG做得好,多跳推理自然就能做好;或 ...

听歌戴耳机 发布于 2026-06-25 16:02 评论(0) 阅读(7)
0

我制作了一个 AI 导航网站,分享给大家

推荐一个简洁、无广告的 AI 导航网站。AI3927 链接地址:https://ai3927.com AI3927(ai3927.com)从诞生第一天起就有一条铁律:不接广告、不搞付费推荐、不挂联盟链接。 拟态风格 粘土风格 暗色玻璃 多种暗黑风格 整个网站从玻璃拟态到霓虹赛博朋克,整整 9 套主题 ...

一灯架构 发布于 2026-06-25 15:58 评论(0) 阅读(39)
0

300 个 Agent 一起干活,Claude 负责验收:一次自进化的 Loop Engineerig 实践

大多数人打开 Kimi,只是把它当成一个聊天框。输入一个问题,等它回答,然后关掉页面。当然这用法没毛病,但 0xMovez 给出了他的 Kimi 最佳实践,在本文中我们将一同感受他是如何让 300 个 Agent 一起干活,并让 Claude 当“包工头”验收成果的。 我们可以重点关注下 Kimi ...

小七-七牛开发者 发布于 2026-06-25 14:56 评论(0) 阅读(20)
0

未来,什么才是 AI“正确的使用方式”

本文以“大模型不是马,而是大脑”为核心视角,重新定义 AI 系统结构,指出当前问题不在模型能力,而在 Agent 作为“身体”的不成熟。笔者认为,人类正在通过实践逐步定义 AI 的正确使用方式。 ...

vivo互联网技术 发布于 2026-06-25 11:33 评论(0) 阅读(40)