1.概述 在人工智能的创新浪潮中,检索增强生成(RAG)技术以其高效调用外部知识、提升生成内容准确性的能力备受瞩目,而模型上下文协议(MCP)则为不同模型间的交互与协同提供了标准框架。当 RAG 的知识检索优势与 MCP 的灵活交互能力相遇,不仅能大幅提升 AI 系统的实用性与智能水平,还能为复杂场 ...
背景 梳理tensorflow serving的项目主要模块及其功能 梳理tensorflow serving的请求调用链路和生命周期 主要模块及其功能 apis/ 包含服务API定义和接口规范 定义了模型服务的gRPC和REST API 负责处理预测请求和响应的数据结构 core/ 项目的核心实现 ...
背景 公司需研发AI大语言模块相关应用,涵盖智能搜索、客服、预测分析、供应链优化、合规管理等场景,涉及自然语言处理(NLP)、图像识别、机器学习等技术。需在 本地部署大模型服务器 或 采购DeepSeek API服务 之间选择最优方案。根据业务需求优先级,推荐 混合部署策略:本地部署服务器适用场景: ...
基于LLM大模型的随机文章生成智能体一.基于代码编程实现我们当前是使用siiconflow的远程模块API, 采用Deepseek V3模型, 先看日志程序流程时序图总计生成10篇文章花费10分钟另一组程序输出目录10篇文章,按段落匹配下载的30张图片二. 扣子空间与最终结果,花费50分钟扣子空间生 ...
1.概述 本文将围绕构建兼具本地运行大型语言模型(LLM)与MCP 集成能力的 AI 驱动工具展开,为读者提供从原理到实践的全流程指南。通过深度整合本地大模型的隐私性、可控性优势与 MCP 工具的自动化执行能力,帮助用户以低门槛、高效率的方式,打造个性化 AI 助手,实现任务自动化 —— 无论是文档 ...
提示词 准确的真实发票数据 https://source.xtechcn.com/xrhsc/other/2025/05/21/1925128521245523968.jpg"请提取发票图像中的以下信息:\n" +"- 发票代码\n" +"- 发票号码\n" +"- 开票日期\n" +"- 校验码\ ...
扣子智能体websdk集成默认PAT是不安全的,官方也推荐使用JWT认证,就涉及到服务端集成OAUTH认证。另一个是默认PAT集成,每个人打开同一个session对话,并不满足实际生产环境需求。配置First, 云端创建一个 OAuth应用 [服务类应用],如下:具体进一步的操作是服务端集成在服务端 ...
引言 面试中的每一秒都至关重要,许多求职者反馈:面对面试官的犀利提问,要么因“卡壳”错失良机,要么因追求准确而延误回答时机。作为以顶级GPT为核心的AI面试助手,面试精灵始终致力于解决用户痛点。继 AI 联网搜索功能后,我们重磅推出“双栏模式”,让极速响应与精准答案兼得——极速&精准我全都要! “双 ...
引言 在职场竞争日益激烈的今天,面试已成为决定职业发展的关键一步。许多专业人士虽然在专业领域拥有深厚的知识,却可能缺乏面试技巧。为了帮助这些专业人士更轻松地获得理想的工作,我们推出了革命性的AI面试助手——面试精灵(interview-genie.com)。 在校招过程中,笔试往往是企业筛选人才的第 ...
为什么人类程序员仍然比大语言模型(LLMs)强大? 作者:antirez 这是一个简短的小故事,告诉你为什么人类的编程能力仍然远远领先于当前的AI技术。请注意,我并不是反AI的人,熟悉我的朋友都知道这一点。我日常都会使用大语言模型(LLMs),包括今天也是如此。当我需要快速验证自己的想法、进行代码审 ...
Puzzles 8: Long softmax puzzles8是计算batch的softmax,题目如下: Softmax of a batch of logits. Uses one program block axis. Block size B0 represents the batch o ...
SmolVLM2轻量级视频多模态模型,应用效果测评 目 录 1. 前言... 2 2. 应用部署... 2 3. 应用效果... 4 1.1 风景图像理解... 4 1.2 事故现场理解... 5 1.3 仿真图像理解... 6 1.4 数量统计描述... 7 1.5 图像文字理解... 8 1.6 ...
你是否有这样的经历:”知识库文档越来越多,知识库问答却越来越不靠谱,RAG检索到的都是一堆不相关的内容。“ 在这个信息爆炸的时代,我们不缺资料,缺的是找到"对的资料"的能力。 元数据和标签看似普通,却能很大提升RAG能力。 这篇文章聊一聊它们如何辅助RAG系统真正理解用户意图,精准找到需要的信息。 ...
欢迎参加 Gradio & MCP 智能体主题黑客松! 准备好了吗?一场以智能体(Agent)和模型上下文协议(Model Context Protocol,简称 MCP)为核心的全球在线黑客松即将来袭! 本次活动由 Hugging Face 举办,我们将共同探索基于 Anthropic MC ...
介绍 GeekAI 基于AI大语言模型的AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 OpenAI, Claude, 通义千问,Kimi,DeepSeek等多个平台的大语言模型。 基于极客学长大佬的开源项目geekai 二次开发而来。首先感谢大佬的开源,致敬。大佬的项目地址:htt ...
度量学习是一种神奇的机器学习技术,它的核心目标就是教会机器如何更好地衡量不同数据点之间的 “距离” 。 在我们日常生活中,距离这个概念很直观,比如两点之间的直线距离。 但在机器学习的世界里,数据通常是高维的,比如一张图片可以被表示为一个包含像素值的高维向量。 那么,如何衡量这些高维数据之间的相似性或 ...
背景 笔者最近在工作中需要用到一些高性能计算的优化,于是准备着手系统性进行学习。有大佬建议先从triton学起,并且推荐了triton puzzles和triton的tutorial作为入门资料。以下是我练习triton puzzles时对一些解法的分析,记录一下作为心得。 练习题库git http ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
微软开源的BitNet模型(特别是BitNet b1.58 2B4T)是一种革命性的低精度大语言模型(LLM),1.58位三值权重:权重仅取-1、0、+1三种值,每个参数平均占用约1.58位存储,结合8位整数激活值(W1.58A8配置),大幅压缩模型体积,通过创新的量化技术和架构设计,在性能、能效和... ...