AI
刷新
软间隔:让支持向量机更“宽容”

博主头像 在SVM中,软间隔是一个重要的概念,它允许模型在一定程度上容忍误分类,从而提高模型的泛化能力。 本文将详细介绍软间隔的定义、与硬间隔的区别、损失函数的作用,最后使用 scikit-learn 进行实际演示。 1. 软间隔 vs 硬间隔 在支持向量机中,软间隔是指允许某些数据点违反分类边界(即误分类) ...

别再堆文档了,大模型时代知识库应该这样建

博主头像 有人说,大模型+知识库就是新一代的员工。 可你有没有想过,如果你把一堆资料往员工桌上一扔,不教、不管,还想让他做出像样的工作,结果会如何? 这是很多人现在“用知识库喂大模型”的真实写照。 这篇文章是我在进行了数千小时的知识库实践后的一些思考:不仅告诉你“是什么”,更帮你弄明白“怎么做”。 AI粉嫩特 ...

DeepSeek模型MOE结构代码详解

其实在DeepSeek-R1爆火之前,DeepSeek V2在我们行业就已经妇孺皆知了,它独特的MOE结构值得研究一下。这篇文章是基于 ZOMI酱 的2个视频写的,这2个视频讲的很好,建议大家都学习一下:《MOE终于迎来可视化解读!傻瓜都能看懂MoE核心原理!》和《使用昇腾NPU手撕MoE单机版代码 ...

一文带你看透什么是ResNet

博主头像 目录什么是ResNet提出背景梯度爆炸/梯度消失:退化现象:原理解析网络结构参考资料 什么是ResNet 首先我们来看什么是ResNet,其全称为Residual Network(残差网络),是一种深度学习的网络结构,由微软研究院的何凯明等人于2015年提出。ResNet最大的创新在于引入了“残差模 ...

核函数:让支持向量机从“青铜”变“王者”

博主头像 在机器学习领域,支持向量机(SVM)是一种强大的分类算法,而核函数则是其核心组件之一。 核函数的本质是一个「空间映射工具」。 当原始数据在低维空间中线性不可分时(如环形、月牙形数据),核函数能将数据隐式地映射到更高维的特征空间,使得在高维空间中数据变得线性可分,同时避免直接计算高维特征的爆炸性计算量 ...

TAPD中AI集成-需求辅助编写

博主头像 相关背景技术基础成熟自然语言处理(NLP):AI可通过解析会议记录、邮件等非结构化文本,自动提取需求关键词(如“用户身份验证”“响应时间”),并分类为功能类、体验类或BUG类,准确率超过98%。 机器学习模型:通过分析历史项目数据(如需求变更频率、资源分配规律),AI可预测需求变更风险,优化任务拆解 ...

大模型参数组成计算QwQ-32B为例

计算大模型参数量主要依赖于模型的架构和各层配置,我们把常用大模型分为三层:输入层、transformer层、输出层。 输入层 参数组成是Embedding的词表总和 transformer层 参数组成包括归一化参数、QKV的参数、输出全连接线性变换参数、FFN投影参数 输出层 归一化参数、全连接线性 ...

理解元模型

本文是由AI (DeepSeek v3)根据动态模型和XWorker的文档生成的,是AI自己的对元模型的理解。 文章是网页版,全文链接是:https://www.xworker.org/do?sc=_local.web.statichtml.novel.UnderstandMetaModel1 咖啡 ...

要做大模型备案的企业,必须准备的安全测试题、拦截词、大模型备案文件

博主头像 文章目录 (一)大模型备案的适用主体 (二)大模型训练语料安全 (三)大模型安全 (四)安全措施要求 (五)拦截词/安全词库要求 (六)大模型内容安全评估要求 (七)附录大模型备案材料源文件 (八)广东省公布的获得大模型备案补贴名单 我国于2024年3月1日正式发布首部生成式人工智能安全技术标准《生 ...

张高兴的大模型开发实战:(五)使用 LLaMA Factory 微调与量化模型并部署至 Ollama

目录环境搭建与配置数据集准备WebUI 配置微调参数模型导出与量化导入 Ollama LLaMA Factory 是一个开源的全栈大模型微调框架,简化和加速大型语言模型的训练、微调和部署流程。它支持从预训练到指令微调、强化学习、多模态训练等全流程操作,并提供灵活的配置选项和高效的资源管理能力,适合开 ...

用 AI 实现一个 GBK/GB2312 转 UTF-8 工具:轻松解决文本编码转换难题(附完整源码)

用 AI 实现一个 GBK/GB2312 转 UTF-8 工具:轻松解决文本编码转换难题 在处理历史文件或与不同系统交互时,我们经常会遇到 GBK 或 GB2312 编码的文本文件。虽然现在 UTF-8 是主流,但手动转换这些旧编码文件既繁琐又容易出错。为了解决这个问题,我开发了一个简单的图形界面工 ...

Chat to MySQL 最佳实践:MCP Server 服务调用

博主头像 一、场景说明: 通过 1Panel+MaxKB 两个开源工具结合 MCP 服务实现 Chat to Mysql。 二、资源准备 MySQL:数据库以及数据库表(培训认证中心运营数据表) 1Panel:开源 Linux 运维管理平台 MaxKB: 强大易用的开源 AI 小助手 三、操作说明 步骤一:完 ...

coze工作流-一分钟生成爆款中式养生视频

博主头像 视频效果:见 公众号"AI创变坊"文章《coze工作流-一分钟生成爆款中式养生视频》 工作流实现拆解 工作流全貌(这个工作流实现确实比较麻烦,搞了一整天) 一、文本处理、批处理结节点 文本处理把用户输入的养生词句 按照句号 分割,批处理循环处理每句话 注意:并行运行数量不要过大,不然会报错 二、循环 ...

<1···789···50>