在SVM中,软间隔是一个重要的概念,它允许模型在一定程度上容忍误分类,从而提高模型的泛化能力。 本文将详细介绍软间隔的定义、与硬间隔的区别、损失函数的作用,最后使用 scikit-learn 进行实际演示。 1. 软间隔 vs 硬间隔 在支持向量机中,软间隔是指允许某些数据点违反分类边界(即误分类) ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
有人说,大模型+知识库就是新一代的员工。 可你有没有想过,如果你把一堆资料往员工桌上一扔,不教、不管,还想让他做出像样的工作,结果会如何? 这是很多人现在“用知识库喂大模型”的真实写照。 这篇文章是我在进行了数千小时的知识库实践后的一些思考:不仅告诉你“是什么”,更帮你弄明白“怎么做”。 AI粉嫩特 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
其实在DeepSeek-R1爆火之前,DeepSeek V2在我们行业就已经妇孺皆知了,它独特的MOE结构值得研究一下。这篇文章是基于 ZOMI酱 的2个视频写的,这2个视频讲的很好,建议大家都学习一下:《MOE终于迎来可视化解读!傻瓜都能看懂MoE核心原理!》和《使用昇腾NPU手撕MoE单机版代码 ...
目录什么是ResNet提出背景梯度爆炸/梯度消失:退化现象:原理解析网络结构参考资料 什么是ResNet 首先我们来看什么是ResNet,其全称为Residual Network(残差网络),是一种深度学习的网络结构,由微软研究院的何凯明等人于2015年提出。ResNet最大的创新在于引入了“残差模 ...
在机器学习领域,支持向量机(SVM)是一种强大的分类算法,而核函数则是其核心组件之一。 核函数的本质是一个「空间映射工具」。 当原始数据在低维空间中线性不可分时(如环形、月牙形数据),核函数能将数据隐式地映射到更高维的特征空间,使得在高维空间中数据变得线性可分,同时避免直接计算高维特征的爆炸性计算量 ...
作者:痴者工良 博客地址:https://www.whuanle.cn/ 示例项目地址:https://github.com/whuanle/mcpdemo 近期 MCP 协议越来越爆火,很多开发者都投身参与 MCP Server/Client 的开发,各个大厂也纷纷推出自己的 MCP 集成平台或开 ...
相关背景技术基础成熟自然语言处理(NLP):AI可通过解析会议记录、邮件等非结构化文本,自动提取需求关键词(如“用户身份验证”“响应时间”),并分类为功能类、体验类或BUG类,准确率超过98%。 机器学习模型:通过分析历史项目数据(如需求变更频率、资源分配规律),AI可预测需求变更风险,优化任务拆解 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
计算大模型参数量主要依赖于模型的架构和各层配置,我们把常用大模型分为三层:输入层、transformer层、输出层。 输入层 参数组成是Embedding的词表总和 transformer层 参数组成包括归一化参数、QKV的参数、输出全连接线性变换参数、FFN投影参数 输出层 归一化参数、全连接线性 ...
本文是由AI (DeepSeek v3)根据动态模型和XWorker的文档生成的,是AI自己的对元模型的理解。 文章是网页版,全文链接是:https://www.xworker.org/do?sc=_local.web.statichtml.novel.UnderstandMetaModel1 咖啡 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
文章目录 (一)大模型备案的适用主体 (二)大模型训练语料安全 (三)大模型安全 (四)安全措施要求 (五)拦截词/安全词库要求 (六)大模型内容安全评估要求 (七)附录大模型备案材料源文件 (八)广东省公布的获得大模型备案补贴名单 我国于2024年3月1日正式发布首部生成式人工智能安全技术标准《生 ...
目录环境搭建与配置数据集准备WebUI 配置微调参数模型导出与量化导入 Ollama LLaMA Factory 是一个开源的全栈大模型微调框架,简化和加速大型语言模型的训练、微调和部署流程。它支持从预训练到指令微调、强化学习、多模态训练等全流程操作,并提供灵活的配置选项和高效的资源管理能力,适合开 ...
用 AI 实现一个 GBK/GB2312 转 UTF-8 工具:轻松解决文本编码转换难题 在处理历史文件或与不同系统交互时,我们经常会遇到 GBK 或 GB2312 编码的文本文件。虽然现在 UTF-8 是主流,但手动转换这些旧编码文件既繁琐又容易出错。为了解决这个问题,我开发了一个简单的图形界面工 ...
一、场景说明: 通过 1Panel+MaxKB 两个开源工具结合 MCP 服务实现 Chat to Mysql。 二、资源准备 MySQL:数据库以及数据库表(培训认证中心运营数据表) 1Panel:开源 Linux 运维管理平台 MaxKB: 强大易用的开源 AI 小助手 三、操作说明 步骤一:完 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
视频效果:见 公众号"AI创变坊"文章《coze工作流-一分钟生成爆款中式养生视频》 工作流实现拆解 工作流全貌(这个工作流实现确实比较麻烦,搞了一整天) 一、文本处理、批处理结节点 文本处理把用户输入的养生词句 按照句号 分割,批处理循环处理每句话 注意:并行运行数量不要过大,不然会报错 二、循环 ...
错误原因 pip安装依赖时出现报错:ConnectError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。 这通常表示在尝试从 Python 包索引 (PyPI) 下载 python-docx 包时遇到了网络连接问题。 而默认的下载源在国外服务器上,所以连接常常不稳定。 解 ...