刷新
Apache SeaTunnel × Hive 深度集成指南:原理、配置与实践

博主头像 在大数据处理的复杂生态中,数据的高效流转与整合是实现数据价值的关键。Apache SeaTunnel作为一款高性能、分布式、易扩展的数据集成框架,能够快速实现海量数据的实时采集、转换和加载;而Apache Hive作为经典的数据仓库工具,为结构化数据的存储、查询和分析提供了坚实的基础。 将Apach ...

MySQL 08 详解read view:事务到底是隔离的还是不隔离的?

博主头像 场景引入 我们知道,在可重复读的隔离级别下,一个事务A启动的时候会创建一个read view,之后在这个事务A执行期间,即使其他事务修改数据,事务A看到的仍然和启动时相同。 考虑一个问题,假如该事务A想要对一行做更新,而此时这行的行锁被其他事务B持有,那么事务A会被锁住而等待行锁。当事务A获取到行锁 ...

时序数据库技术创新大会:以 IoTDB 为核心,洞见「DB + AI」的工业物联未来

博主头像 2025 年 7 月 5 日,清华大学软件学院、天谋科技(北京)有限公司主办的 2025 时序数据库技术创新大会在北京成功举办。 以「下一站:DB + AI」为主题,超 30 位大咖嘉宾,包含中国工程院院士和来自清华大学、中国人民大学、北京科技大学、中国石油大学等学术界权威专家,携手中国商飞、国家电 ...

读商战数据挖掘:你需要了解的数据科学与分析思维09文本的挖掘

博主头像 1. 证据和概率 1.1. 对实例的了解视作支持或反对不同目标变量值的证据 1.2. 对实例的了解则可以表示为实例的特征 1.3. 如果你知道每个特征所提供的证据的强度,那么就能应用原则性方法,从概率上合并证据,从而得到有关目标变量值的结论 1.4. 作为消费者的我们,已经对网页上貌似免费的大量信息 ...

OceanBase PoC 经验总结(二)—— AP 业务

博主头像 首先为大家推荐这个 OceanBase 开源负责人老纪的公众号 “老纪的技术唠嗑局”,会持续更新和 #数据库、#AI、#技术架构 相关的各种技术内容。欢迎感兴趣的朋友们关注! 背景 前段时间,OceanBase 社区公众号转载了庆涛大佬的一篇《OceanBase PoC 经验总结(一)》,为大家介绍 ...

MySQL 07 行锁功过:怎么减少行锁对性能的影响?

博主头像 行锁是针对数据表中行记录的锁,是在引擎层由引擎实现的。 从两阶段锁说起 在InnoDB事务中,行锁是在需要的时候才加上的,但并不是不需要了就立即释放,而是等到事务结束时才释放,这就是两阶段锁协议。 知道这个设定后,如果事务中需要锁多个行,要把最可能造成锁冲突、最可能影响并发度的锁尽量往后放。 举个例 ...

读商战数据挖掘:你需要了解的数据科学与分析思维08评估模型

博主头像 1. 概述 1.1. 为了让数据科学给实际应用增加价值,数据科学家和其他利益相关者必须仔细地考虑他们究竟希望通过挖掘数据实现什么 1.1.1. 将数据挖掘的结果与他们的实际目标联系起来 1.1.2. 其影响既可能表现为统计报告中缺少对统计数据正确性的明确解释,也可能表现为不能找出有意义的方法来测量性 ...

MySQL 06 全局锁和表锁:给表加个字段怎么有这么多阻碍?

博主头像 根据加锁的范围,MySQL里面的锁大致可以分成全局锁、表级锁和行锁三类,本文先讨论前两种。 全局锁 全局锁是对整个数据库实例加锁,MySQL提供的加全局读锁的命令是Flush tables with read lock(下面简称FTWRL)。当需要让整个库处于只读状态时,可以使用这个命令,之后其他线 ...

MySQL 05 深入浅出索引(下)

博主头像 覆盖索引 假设要执行一条语句: select * from T where k between 3 and 5; 初始对列k建立了索引,表中数据为: 那么其执行流程为: 在k索引树上找到k=3的记录,取得ID=300; 到ID索引树查到ID=300对应的记录。 在k索引树上找到下一个值k=5的记录, ...

读商战数据挖掘:你需要了解的数据科学与分析思维07相似性

博主头像 1. 概述 1.1. 相似性是许多数据科学方法和商业问题解决方案的基础 1.1.1. 共通之处 1.1.2. 很多数据挖掘过程通常基于相似性或寻找“合适”的相似性来对个体进行分组 1.1.3. 分类模型生成分类边界来将目标变量值相同的个体归为同一组 1.2. 相似性可以用于分类和回归 1.3. 亚马 ...

MySQL 04 深入浅出索引(上)

博主头像 索引的常见模型 实现索引的方式有很多种,这里先介绍三种常见结构:哈希表、有序数组和搜索树。 哈希表:只适用于只有等值查询的场景。 有序数组:在等值查询和范围查询场景中的性能都非常优秀,但是在更新数据的时候需要挪动大量记录。因此,只适用于静态存储引擎。 二叉搜索树:树层数可能很高,可能一个节点上的数据 ...

MySQL 03 事务隔离:为什么你改了我还看不见?

博主头像 事务就是要保证一组数据库操作,要么全部成功,要么全部失败。在MySQL中,事务支持是在引擎层实现的,这也是InnoDB取代MyISAM的重要原因之一。 隔离性与隔离级别 事务的四大特性:原子性、一致性、隔离性、持久性。本文主要讨论隔离性。 当数据库上有多个事务同时执行的时候,可能出现脏读、不可重复读 ...

16. MySQL 多版本并发控制

博主头像 16. MySQL 多版本并发控制 @目录16. MySQL 多版本并发控制1. 什么是MVCC2. 快照读与当前读2.1 快照读2.2 当前读3. 复习3.1 再谈隔离级别3.2 隐藏字段、Undo Log版本链4. MVCC实现原理之ReadView4.1 什么是ReadView4.2 设计思路 ...

读商战数据挖掘:你需要了解的数据科学与分析思维06过拟合

博主头像 1. 概述 1.1. 数据科学中最重要的基本概念之二就是过拟合和泛化能力 1.2. 数据挖掘包含模型复杂度和过拟合概率之间的基本权衡 1.3. 如果数据所表现的现象本身就很复杂,那么就有必要构建一个复杂的模型,但复杂的模型对训练数据过拟合的风险也较高 2. 过拟合 2.1. “模式”事实上只是偶然出 ...

(二) 初次使用MySQL

博主头像 摘要 本文会围绕mysql会话来详细地介绍会话的获取、使用和终止的整个过程,主要包括: 登入mysql会话:通过mysql调用命令和身份凭证获取会话资格。 使用mysql会话:比如编写SQL语句、执行SQL语句和取消已执行的SQL语句。 登出mysql会话 此外,在文章的最后,还提供了快速调用mys ...

GreatSQL通过伪装从库回放Binlog文件

博主头像 GreatSQL通过伪装从库回放Binlog文件 一、适用场景说明 1、主库误操作恢复 利用 Binlog 在其他实例解析、回放,根据gtid只回放到指定位点。 2、网络隔离环境同步 备份恢复后可以拉去主库Binlog文件至新实例同步增量数据。 3、备份恢复遇到Binlog文件过大处理 恢复实例时有 ...

<123···50>