深度学习进阶(十八)坐标注意力 CA
上一篇我们介绍了 ECA,它用一维卷积替代了 SE 中的 MLP bottleneck,用更少的参数实现了更好的通道注意力。 但实际上,这套框架里还有别的优化空间: 在前面的内容里,无论是 SE 、 CBAM 还是 ECA ,它们的通道注意力子模块第一步都是 全局平均池化(CBAM 额外加入了最大池 ...
产品经理的AI副驾驶
一、核心命题:产品经理工作范式的根本性转变文档开篇即点明核心矛盾——从"高成本验证"到"低成本预演"的范式转移:维度过去现在(AI时代)验证方式先写PRD → 画原型 → 开发 → 上线试错直接生成可交互原型,研发前验证成本结构高沟通成本 + 高返工风险低代码/无代码快速验证核心能力文档撰写与原型绘 ...
线性注意力机制学习笔记
混合注意力学习(1): 线性注意力 目录混合注意力学习(1): 线性注意力Prefill、Decode与KVCache混合注意力架构线性注意力Transformers 就是 RNNs[4]Fast Weight Programmers与DeltaNet[9]Gated DeltaNet[11]线性注 ...
Dify低代码AI平台实战:10分钟搭建企业级AI应用
一、Dify 是什么? Dify 是一款开源的 LLM 应用开发平台,融合了 Backend as Service 和 LLMOps 理念,让开发者无需深入底层模型细节,即可快速搭建生产级 AI 应用。核心优势: 可视化编排:拖拽式工作流设计,告别硬编码 多模型支持:OpenAI、Claude、通义 ...
两年的时间考验程序员工程师的耐心和毅力 存活下来的幸存者科学规律工程师占有2%的内存空间 计算机科学家自然科学生态循环建设倡导群体
两年的时间考验程序员工程师的耐心和毅力 存活下来的幸存者科学规律工程师占有2%的内存空间 计算机科学家自然科学生态循环建设倡导群体 两年的时间考验程序员工程师的耐心和毅力。存活下来的幸存者科学规律工程师占有2%的内存空间。计算机科学家自然科学生态循环建设倡导群体。内容商业信息数字程度改革和集成基础硬 ...
读AI即未来:普通人用好人工智能的18大工作场景01生成式人工智能
1. 生成式人工智能 1.1. ChatGPT只用五天就吸引了100万用户 1.1.1. Netflix的用户量达到这一数字用了三年半的时间 1.2. 人工智能是一门教机器模仿人类行为模式的艺术与科学 1.3. 生成式人工智能更像是一位精通多国语言、极具创造力的作家 1.3.1. 能用多种语言创作故 ...
"Multi-Granularity Distribution Modeling for Video Watch Time Prediction via Exponential-Gaussian Mixture Network" 论文笔记
背景 观看时长预测本质是一个回归问题,由于时长是连续值,跨度很大。又因为标签的分布显著影响回归任务的难度,适当的分布假设可以提高回归精度 利用小红书工业数据,作者对观看时长进行了彻底的调查,结果如下: 总体来看,在 0 附近有明显的偏度,快滑占多数 在持续时间上有明显的双峰模式 特定用户的观看时间分 ...
"Deconfounding Duration Bias in Watch-time Prediction for Video Recommendation" 论文笔记
背景 观看时长(watch time)是视频推荐中的重要指标之一,提升整体观看时长是视频推荐系统的主要目标。观看时长主要受两个因素的影响:用户是否对视频感兴趣、视频本身的时长(duration) 作者分析发现持续时间数据存在明显的偏差现象(图中给出了明显的体现),具体体现在以下两个方面: 一方面,1 ...
深度学习进阶(十七)高效通道注意力 ECA
上一篇我们介绍了 CBAM,它在 SE 的基础上加入了空间注意力,形成了"通道 + 空间"的混合注意力机制。 我们发现,无论是 SE 还是 CBAM,它们的通道注意力子模块都采用了一个 bottleneck 结构的 MLP,即先将通道维度从 \(C\) 压缩到 \(C/r\),再升维回 \(C\)。 ...
iNeuOS工业互联网操作系统集成大模型智库(iNeuOS_AiMind·心智灵慧)
iNeuOS_AiMind·心智灵慧是一个基于大语言模型的智能应用平台,核心能力涵盖知识库管理、智能问答、RAG 检索、Agent 智能体协作、记忆管理和文件管理等模块,面向企业知识沉淀、知识检索和知识应用的综合平台。通过与 iNeuOS 的工业互联网能力结合,AiMind 可以把设备数据、工艺文档... ...
2026中国B2B行业GEO白皮书:从产业洞察到优化实践
生成式AI正在重构B2B信息获取方式,89%的B2B买家使用AI辅助采购决策。然而,大量B2B企业的技术参数、资质认证、项目案例因缺乏结构化表达,在AI答案中被边缘化。本白皮书系统阐述GEO方法论及DSS原则(语义深度、数据支持、权威来源),通过工业制造、能源装备、供应链物流、金融科技、专业服务五大... ...
深度学习进阶(十六) 混合注意力 CBAM
上一篇我们介绍了 SE 模块,从通道维度引入了注意力机制,让网络能够自适应地调整每个通道的权重。 再结合之前的相关内容,现在我们已经对通道维度和空间维度上的注意力逻辑都有所了解了,显然二者并不冲突,反而是相辅相成的,因此一个想法自然就出现了: 组合应用通道注意力和空间注意力,实现混合注意力机制。 沿 ...
怎么让我的AI编程助手有“记性”
每次你打开Cursor、通义灵码、或者CodeGeeX开始新对话,有没有一种熟悉的感觉? 像不像每次开会,都要重新给新同事介绍一遍项目背景? "我们用的是Vue3+TypeScript,不是React" "图标请用Element Plus的,别用emoji" "本地开发端口是3005,不是3000, ...
大模型基础(四):强化学习入门-从斯金纳箱到大模型推理
2025年图灵奖颁给了强化学习的奠基人Richard Sutton和Andrew Barto。为什么强化学习如此重要?它如何从训练老鼠变成训练大模型?这篇文章带你一探究竟。 一、一个老鼠实验引发的革命 1.1 斯金纳箱:强化学习的源头 1930年代,心理学家斯金纳做了一个著名实验: 实验过程: 把一 ...
OpenClaw 多 Agent + 飞书多 Bot 路由配置实战复盘
记录一次 OpenClaw 多 Agent 与飞书多 Bot 路由配置过程,包括多账号兼容、pairing、飞书发送权限等排障经验。 ...
深度学习进阶(十五)通道注意力 SE
至此,在之前的内容里,我们已经介绍了传统卷积网络和 Transformer 架构两条路线在 CV 任务中的发展研究。 实际上,我们可以这样总结一下: 无论是 Transformer 的注意力机制,还是 CNN 的诸多创新,它们其实都在回答同一个问题:模型应该关注哪里(空间)和关注什么(通道)。 也可 ...
8个Claude Code刚需高阶Skills
8个Claude Code刚需高阶Skills 不少人安装Claude Code后只用到基础原生能力,高频办公、长效协作、落地实操、联动外设全场景都受限,白白浪费原生算力优势。想要不用反复铺垫话术、精准吃透专属资料、指令落地不空话、跨界联动全自动化,直接配齐这8款刚需定向Skills,零门槛适配个人 ...
Claude Code在Windows/WSL-Linux/VS Code三平台上的安装配置参考
Claude Code是Anthropic推出的命令行AI编程助手,它不同于传统的代码补全工具,它能作为一个完全自主的AI代理来理解整个项目上下文,自主完成编写完整功能。本文主要介绍Claude Code在不同平台的安装使用。 一、Windows上安装Claude Code 1. Powershel ...
2026深度分析罗兰艺境B2B半导体GEO技术案例,测评无锡设备材料制造企业优化过程与效果验证
2026罗兰艺境半导体GEO技术案例。华微半导体专注刻蚀部件、CMP抛光液、电子特气,供华虹,但AI搜不到。通过DSS原则将MTBF≥8000小时、颗粒≤0.1μm、纯度99.9999%、SEMI认证、客户验证结构化,6个月后AI提及率从3%升至49%,技术咨询转化率升至30%,获客显著增长。 ...
罗兰艺境GEO架构:被豆包认定为第三代技术代表,与IBM并列
本文系统阐述生成式引擎优化(GEO)的全栈技术架构。从豆包官方定义出发,融合普林斯顿、CMU等学术前沿及Gartner、Forrester权威报告,深度解析通用分层架构(语料库/预训练层、大模型适配层、RAG优化层、内容生产分发层)与企业级DSS三层工程实践。重点呈现豆包认定“罗兰艺境DSS架构与I... ...


