AI
刷新
"When Large Language Models Confront Repository-Level Automatic Program Repair How Well They Done" 论文笔记

博主头像 介绍 (1) 发表:ICSE'24 (2) 背景 APR 任务的这些模型的当前评估仅关注错误所在的单个功能或文件的有限上下文,从而忽略了存储库级上下文中的有价值信息。现有的数据集要么不是在存储库中构建的,例如 Quixbugs,要么无法准确恢复存储库级错误的方案,例如 Defects4J。本文研究了 ...

Policy Gradient原理和Python实现

博主头像 今天重温一下RL on-policy算法的始祖:Policy Gradient算法。第一节先讲原理。第二节讲Python代码实现。第三节讲Policy Gradient算法的引申思考。 一、Policy Gradient原理 要讲Policy Gradient算法,需要先简要介绍一下Markov奖励 ...

解密prompt系列58. MCP - 工具演变 & MCP基础

博主头像 作为`结构化推理`的坚定支持者,我一度对MCP感到困惑:Agent和工具调用的概念早已普及,为何还需要MCP这样的额外设计呢?本文就来深入探讨MCP,看看它究竟解决了什么问题。我们将分几章解析MCP:本章理清基础概念和逻辑,后面我们直接以一个Agent为例演示全MCP接入的实现方案。 ...

百度Comate的AI编程工具小试

博主头像 背景百度Comate基于文心大模型(ERNIE-Code),结合百度内部编程大数据及GitHub优质开源数据训练,具备深度语义理解能力。 支持100+编程语言(如Go、Java、Python、JavaScript等),兼容主流IDE(VS Code、JetBrains系列)。Zulu智能体提示词依然 ...

学习理论:代理损失函数的泛化界与Rademacher复杂度

博主头像 在之前的博客中我们提到过,设l为在标签Y上定义的0-1多分类弃权损失的代理损失,则我们可以在此基础上进一步定义弃权代理损失L。在这篇博客中,让我们把注意力转移一个新的方向——代理损失函数的泛化误差界(generalization error gap)。差值R_L(hat{h}) - widehat{... ...

演练:使用VB开发多智能体协作的荣格八维分析器

在大语言模型高速发展的时代,我们面对困难的语义分析任务,通过构建智能体进行处理是一个流行趋势。本文将介绍如何使用 Visual Basic .NET 开发一个多智能体协作系统,用于分析聊天记录中特定人物的荣格八维人格类型。 本文使用 CC-BY-NC-SA 4.0 协议。转载或者 AI 模型/智能体 ...

GLM4.5在线版快速开发实践

博主头像 背景1. GLM4.5​​ GLM(General Language Model,通用语言模型)是大语言模型(LLM)的一种技术路线,以支持多模态、长文本理解和复杂推理为特点。GLM4.5的代码生成能力基于对海量代码语料(如GitHub开源项目、技术文档、问答社区)的学习,支持​​主流编程语言​​( ...

还在为调试提示词头疼?一个案例教你轻松上手!

博主头像 如何从提示词小白变成高手? 最近豆包发布了全新的模型,迫不及待地进行了测试。我最喜欢使用的功能就是深度思考模式,这个模式能够在处理复杂问题时提供极大的帮助。而且现在它还赠送了很多免费的推理额度,完全足够个人使用,真是非常划算! 今天,我们将在提示词的功能优化过程中应用这个新模型,看看整体效果如何,毕 ...

CodeGeeX体验GLM4.5模型与实践

博主头像 背景各模型概要性能评估Ghost Comments看那些右箭头,就是动态注释,没有真实写入文件代码BUG修复总体一般,没有智能体的特色,只有CodeGeeX问答模式。增加注释速度快,但不生成方法头部的注释解释代码文字解释后,生成了流程图实战代码扩展性修改PK提示词@workspace #codeba ...

人工智能驱动企业:通过情境感知AI重塑组织4个人生产力

4 个人生产力 Sasha 是一名手术室护士。今天是平常的一天。她正在为一位病人制定术前程序。今天的手术是标准的——疝气手术。然而,即使是常规手术,术前程序也会因病人的既往病史和当前健康状况而异。 制定术前计划不仅仅是重复标准模板,它还涉及关键决策。Sasha 必须概述针对每位病人的具体步骤。她必须 ...

Git工作面试必知必会操作-命令行篇

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

清华大学软件学院长聘副教授龙明盛:Timer 3.0 已经成为了“满血版”的时序大模型

博主头像 7 月 5 日,2025 时序数据库技术创新大会在北京成功举办,清华大学软件学院长聘副教授龙明盛在大会上做主题报告《Timer 3.0:新一代生成式时序大模型》,深入剖析当前时间序列分析领域面临的核心挑战,系统阐述了时序大模型的技术演进趋势与行业痛点,并重点分享清华团队自主研发的时序大模型 Time ...

AI营销应用与出海

博主头像 反思脑图FAQ问:在复合的增长手段之下,如何确定哪一种手段更有效,是否存在数据安慰剂的问题?对于自杀式增长的现象,你们怎么看?答:这是一个有效的问题,我们现在面临的情况是,在复合增长手段中,很难判断哪一种手段更为有效,甚至可能存在数据安慰剂的现象。自杀式增长指的是投入后看到销售同步增长,但不确定这种 ...

cursor1.3 重大更新!复刻 claude code!

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

cursor1.3 重大更新!复刻 claude code!

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

人工智能驱动企业:通过情境感知AI重塑组织3意图智能

3 意图智能 意图至关重要。请见同一家公司的两位高管。Sadiq 是该公司总法律顾问办公室的律师。Beth 是该公司的采购分析师。为了节省时间仔细阅读公司收到的最新合同,两人都要求 ChatGPT 对其进行总结。ChatGPT,一个大型语言模型 (LLM),发挥了它的作用。它快速生成了合同的要点,概 ...

<1···345···50>