AI - 第4页 - 网站分类

六个视频类Agent Skills

6 个的视频类Skills： 1. HyperFrames 一句话生成动效视频，文章、推文、产品介绍都能变成 MP4。适合产品宣发、教程开场、社交短视频。 https://github.com/heygen-com/hyperframes 2. video-use 让 coding agent 帮你 ...

2024-2026年最新视频质量评价方法调研报告

2024-2026年最新视频质量评价方法调研报告 VBench 论文：VBench: Comprehensive Benchmark Suite for Video Generative Models 发表：CVPR 2024 (Highlight) 代码：https://github.com/Vc ...

基于iNeuOS物联网(IOT)和AiInsight智能问数，【数据统计智能体】的构建和应用

iNeuOS_AiInsight·数智灵鉴的接入，它将自然语言理解能力与工业数据分析流程深度结合，让用户通过一句业务问题即可完成“数据定位、查询执行、结果分析、图表输出、报告生成”的完整闭环，显著降低了数据使用门槛。 ...

工业级 AI Skill 构建指南

工业级 AI Skill 构建指南：从单次指令到工程化工作流在 AI 原生应用的软件工程范式中，我们正经历从“提示词工程（Prompt Engineering）”向“技能工程（Skill Engineering）”的战略跃迁。对于架构师而言，单次 Prompt 的随机性是生产环境的死敌。工业级 S ...

读懂计算机视觉CV、语言感知(ASR/TTS)、多模态，就能理解AI是如何“看到”与“听到”世界的

当Transformer架构让AI能‘同时看到’整段文字，理解其中的讽刺与隐喻时，语言处理已不再只是识别，而是真正的语义理解。 ...

杀疯了！OpenAI 宣布 Codex 可以免费重置额度了，最多可以免费重置 4 次（附重置指南，赶快冲！！）

大家好，我是R哥。奥特曼大善人啊，今天无意间发现 Codex 可以免费重置次额度了，最多可以重置 4 次，没有任何套路，简单粗暴，，重置方法如下。先说第一种：首先点击左下角设置菜单：如果你看不到这个重置菜单项，请更新到最新版本再看下。然后再点击「1 次可用重置」菜单：再点击「重置使用次数 ...

世界杯进球那一刻，体育 App 怎么扛住流量高峰？

本文以世界杯进球瞬间的流量高峰为切入点，剖析体育App背后的高并发工程体系：通过流量分层（静态/热点/动态/互动）、事件驱动、多模式数据更新（WebSocket/SSE/轮询）、分层缓存、消息队列削峰解耦、视频智能分发及精细化降级限流等策略，系统性保障核心体验。 ...

我让 Claude 写了一个贪吃蛇游戏，然后用 ccglass 看清它发给模型的真实请求

title: 我让 Claude 写了一个贪吃蛇游戏，然后用 ccglass 看清它发给模型的真实请求 categories: [人工智能, 开发工具, 开源项目] tags: [AI Agent, Claude Code, AI编程, 可观测性, 开源工具, Prompt调试] keywords: ...

FDE-AI落地时代的“最后公里”解决者

深度洞察：FDE（前置部署工程师）——AI落地时代的“最后公里”解决者在人工智能技术的宏大叙事中，我们正处于一个决定性的拐点：AI正在从实验室的惊艳Demo向复杂的企业生产环境（Production Environment）大规模迁移。然而，模型能力的飞跃并不等同于商业价值的自动兑现。当企业发现精 ...

世界杯一粒进球被吹掉，背后可能有多少 AI？

世界杯进球被吹？背后是VAR+AI的精密协作：摄像机追踪29个身体点、球内传感器锁定传球瞬间、AI自动生成越位线与3D动画，再经VAR复核、主裁终裁。AI负责“测得准”，裁判负责“判得明”——技术让判罚更透明，却未消除规则语境下的争议。 ...

短短三天，英伟达和微软同时宣告：真正的AI电脑来了！

Agent和具身智能，一个扎根在虚拟世界里替你跑任务，一个走进物理世界替你动手操作。这篇文章，我们来聊聊这两条AI执行能力进化的核心路径。 ...

Book to skill 将书籍蒸馏为skill

Book to skill 将书籍<<ai agents in action>>蒸馏为skillBook-to-Skill AI Agent 时代诞生的知识转化方法论与工具集，核心是将书籍、专业文章、文档等静态文本知识，通过结构化蒸馏与重构，转化为大语言模型（如 Claude Code）可直接调用、 ...

【IoTDB 社区】白话时序大模型系列-6：为什么只有预测是开箱即用的？

时序预测、时序分类、时序填补……时序分析任务其实挺多的，各有各的名字，各有各的场景。但是，你有没有发现一个现象？市面上叫得上名字的时序大模型，TimesFM、Chronos、Timer，清一色全是做时序预测的。大家说的"开箱即用"、"零样本"、"预训练直接推理"，也都是指时序预测。为什么分类和 ...

深度学习进阶（三十）从 Transformer 到 LLaMA：现代 LLM 架构总览

上一篇我们介绍了 GQA，通过分组共享 KV Head，在注意力质量和推理效率之间找到了实际的平衡点。至此，从第 25 篇到第 29 篇，我们分别拆解了现代大模型的五个核心设计模块： RoPE：旋转位置编码，让 QK 点积天然感知相对位置。 RMSNorm：去掉均值中心化的简化归一化。 SwiGL ...

深度学习论文精读方法论

深度学习论文精读方法论：软件工程师的系统化指南对于软件工程师而言，深入学术研究领域往往伴随着一种强烈的挫败感：晦涩的术语、复杂的公式以及看似“奇迹”的实验结果，常让人觉得需要补充十年的背景知识才能读懂标题。然而，深度学习并非不可逾越的鸿沟。通过建立一套系统化的阅读协议，工程师可以利用自身的逻辑优势， ...

Event-Driven Agent 实战：Prometheus 告警 → LLM → Tool Calling → 自动恢复

前言本文主要描述Event-Driven开发中的ReAct模式，并且使用一个demo，彻底搞懂怎么在实际工作中使用Event-Driven模式话不多说，我们开始代码结构代码地址 . ├── agent.py # EventDrivenAgent 主逻辑，负责接收事件、调用 LLM、执行工具 ...

周一上线｜瑞幸把咖啡做进 CLI，Fable 5 短暂登场，Stonk Rider 骑上 K 线图

一边，模型和开发者工具还在继续往真实工作流里走：Gemini 3.5 Live Translate 开始做近实时语音翻译，Kimi-K2.7-Code 开源，DiffusionGemma 探索更快的文本生成，Codex 和 Chrome DevTools 也在继续给 Agent 补浏览器能力。另一... ...

一文读懂AI落地的三驾马车：大语言模型、RAG、多模态AI

你有没有遇到过这种情况：跑去问AI一个问题，它回答得滔滔不绝，逻辑清晰，听起来像模像样，但你就是有一种"哪里不对劲"的感觉。要么数据过时，要么答案与你的实际情况毫不相干，要么语气信心满满，内容却一本正经地偏了题。这种"AI大聪明"的尴尬，困扰过太多人。其实问题的根源不在于AI笨，而在于技术架构本 ...

智能体总是不听话？90% 的人没用对 Hermes 的「上下文」——这才是正确的打开方式

一文掌握 Hermes Agent 上下文系统：Context Files 定义全局人格与项目规范，Context References 动态注入代码与 Git 变更，@语法实时加载，让 AI 智能体彻底听话。 ...

和AI一起搞事情#7. 给游戏NPC接入Hermes？

有一阵没做游戏了，咱接着回来做中医游戏，这期咱们聊聊怎么给游戏NPC装个"智能大脑"，顺便看看开发过程中Hook这个老朋友的新玩法。项目代码在这里[tcm_odyssey] ...