前言 书接上文,上一小节简单介绍了一元回归的基本原理、使用方式,作为运维,实践才是最重要的,那本小节就来实践一下我们之前的话题:探索cpu与qps的关系 获取数据 1. cpu数据 由于我的监控数据在阿里云的prometheus上面,并且阿里云也提供了一种查询方式,通过本地搭建的prometheus ...
公司内部部署了一个QWen-Coder的7B小模型,这个模型虽然不大,但是验证后发现效果还不错。 所以,希望能够在VS Code中使用这个模型来辅助编写代码,这样就可以避免使用其他付费模型。 1. 安装插件 在 VS Code 的开源 AI 插件中,Continue 这个插件评价还不错,功能也能满足 ...
1. AI技术正构建起全方位防护网 1.1. 银行借助异常检测技术拦截欺诈交易 1.2. OkCupid通过深度学习过滤不雅图片与不当信息 1.3. 医生借助监督学习预测心脏病风险 1.4. 相机推荐系统通过强化学习优化用户选择 1.5. 爱彼迎利用意图分析技术,识别投机性用户的不良行为 2. AI ...
介绍 (1) 发表:NIPS'24 (2) 背景 考虑直接与 Linux 终端直接互动的 Agent 的简单设置,我们发现 LM Agent 很难在这种环境下可靠地采取行动。例如,它无法提供简单的命令来编辑一个小文件段,并且如果用户进行无效编辑,则不会提供任何反馈。这些缺陷大大阻碍了性能,激发了对代 ...
1. AI是驱动第四次工业革命的通用技术 1.1. AI不仅被用作科学家的实验工具,而且开始广泛渗透到日常生活中,重塑着我们的工作、教育、社交、健康乃至情感体验 1.2. 着眼于构建公平、透明且负责任的AI系统,确保技术进步惠及每一个人,尤其是那些在传统社会结构中常被忽视的群体 1.3. AI不再是 ...
GPT-5智能提升多少很难说,相信后面更深度的体验才能感受到它的优缺点。从目前的感受而已,很有主动性,积极建议下一步动作,感觉多了一个催我干活的队友。 ...
作者:傅榕锋,OceanBase 高级技术专家 在过去一年, OceanBase 在AI 能力方面快速发展, 从2024年6月社区用户基于OceanBase基础向量能力实现RAG小助手,到10月发布第一个正式向量版本 OceanBase 4.3.3,可用于生产环境。随后快速和 Llamalndex、 ...
背景GLM4.5V 是智谱AI于2025年8月11日发布的开源视觉推理模型,基于新一代旗舰文本基座模型 GLM-4.5-Air 开发,延续了 GLM-4.1V-Thinking 技术路线。参数规模:总参数 106B,激活参数 12B。 性能表现:在 41 个公开视觉多模态任务中,综合效果达到同级别开 ...
欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族! GPT OSS 是 OpenAI 推出的 重量级开放模型,面向强推理、智能体任务以及多样化开发场景。该系列包含两款模型:拥有 117B 参数的 gpt‑oss‑120b 和拥有 21B 参数的 gpt‑oss‑20b。二者皆采用 ...
介绍 (1) 发表:Arxiv 6.12 (2) 挑战 主要探讨了基于 LLM 的 APR 的两个主要类别:代理和程序。尽管这两个范式都表现出希望,但它们依然表现出两个重要的局限性: 忽视历史修复经验:现有方法都忽略了从同一存储库中先前解决的问题中积累的宝贵历史经验,而实际上,软件项目在其演变过程中 ...
背景OpenAI于北京时间2025年8月8日凌晨1时举行了线上发布会,正式推出GPT-5。CodeBuddy IDE,主打“产品-设计-研发部署”全流程一体化,旨在降低开发门槛,尤其适合独立开发者和非技术背景的用户。CodeBuddy整合了PRD、TRD、DRD文档生成、Figma设计稿转网页、 ...
当全球首个L4级多智能体蜂群系统在ISC2025的开幕式上展示一句话生成的10分钟史诗大片时,台下观众惊叹的不仅是技术奇观,更是一位中国互联网老兵向新时代递交的答卷。 ISC 2025大会以“ALL IN AGENT”为主题,这是周鸿祎全力锚定的新一轮AI浪潮的核心坐标。从杀毒软件革命到安全云布局, ...
前言 在运维职业生涯中,qps是一个绕不开的话题,leader经常在问,我们的qps是多少,系统能不能抗住啊???老板在问,我们的qps是多少,有没有降本的空间啊???面试的时候,面试官问,你们的qps是多少啊。。。。 如果我能预测qps与系统压力之间的关系,那一定很不错吧?关于leader,我们的 ...
背景 笔者写过多个模型OOP重构实践,包括《基于CodeBuddy自定义Agent知识库重构实践》与《Trae智能复杂项目重构实践》,三方与其他主流模型的评测今天我们在Trae来试试Kimi K2模型:实践杂上下文,长度可以满足,一次性对话。我们看重构多个文件还生成一个markdown文档# Thi ...
OceanBase 社区布道师基于 OceanBase 开发开源了代码文档检索引擎,使用 OceanBase 处理向量存储、元数据管理和相似度检索,理解对应的 GitHub 代码仓库,欢迎大家试用! ...
捏着鼻子用多了就会发现:各家模型都有自己擅长的能力,这与不同平台所掌握的优质数据有关系,比如电商跨境,本地生活,内容制作,行业分析等。 ...
介绍 (1) 发表:ISSTA'24 (2) 背景 软件工程涉及程序改进的过程,特别是软件维护(例如,程序错误修复)和软件演变(例如,功能添加) 自动化程序维修任务对实现自动软件工程愿景的重要性。鉴于自动化程序维修的动机,并且开发人员经常花费大量的时间来修复错误。本工作提出了 AutoCodeRov ...
20个AI 爱好者必听的顶级播客(含推荐单集)1. TWIML AI 播客The TWIML AI Podcast 深入探讨机器学习与人工智能,邀请业内顶尖专家进行访谈。内容涵盖 AI、机器学习、深度学习、自然语言处理与数据科学。无论你是行业专家、技术型商业领袖,还是科技爱好者,都会有所收获。主持人 ...
前两天朋友刷到HRM这个27M模型的文章,想让我试着部署训练一下。此文用于记录部署过程 前期准备 克隆仓库 sapientinc/HRM 安装CUDA 我的CUDA是已经安装好的12.8版本,安装过程不再赘述 安装torch torch版本如下 Version: 2.7.1+cu128 pip in ...