刷新
MySQL 主从复制之多线程复制

博主头像 目录一、MySQL 多线程复制的背景二、MySQL 5.5 主从复制1、原理2、部署主从复制2.1、主节点安装配置MySQL 5.52.2、从节点安装配置MySQL 5.53、检查主从库 server_id 和 log_bin 配置4、创建主从复制用户5、获取主库的二进制日志文件和位置6、配置从库连 ...

Spark习题汇总

博主头像 目录单选多选 单选 网络中很多数据是以图的形式呈现的,比如社交网络、交通事故,现场证据采集等,为了解决大型图的分布式计算问题,最适合采用以下哪种计算框架: Spark Core Storm Pregel (答案) Dremel Hadoop的生态系统组件之一Sqoop的功能是? 负责集群资源调度管理 ...

万字长文带你深入Redis底层数据结构

博主头像 Redis数据库的数据结构 Redis 的键值对中的 key 就是字符串对象,而 value 就是指Redis的数据类型,可以是String,也可以是List、Hash、Set、 Zset 的数据类型。 其实是Redis 底层使用了一个全局哈希表保存所有键值对,哈希表的最大好处就是 O(1) 的时间 ...

大数据调度组件之Apache DolphinScheduler

博主头像 Apache DolphinScheduler 是一个分布式易扩展的可视化 DAG 工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。 主要特性 易于部署,提供四种部署方式,包括Standalone、Cluster、Docker和Kubernetes ...

7、listener监听

博主头像 启动远程图形界面登录的工具 [root@db11g ~]# vncserver 监听 监听的启动 [oracle@db11g ~]$ lsnrctl start 判断监听是否启动 [oracle@db11g ~]$ netstat -tulnp | grep 1521 (Not all proces ...

新兴数据仓库设计与实践手册:从分层架构到实际应用(二)

博主头像 本手册将分为三部分发布,以帮助读者逐步深入理解数据仓库的设计与实践。 第一部分介绍数据仓库的整体架构概述; 第二部分深入讨论ETL在数仓中的应用理论,ODS层的具体实现与应用; 第三部分将围绕DW数据仓库层、ADS层和数据仓库的整体趋势展开; 通过这样的结构,您可以系统地学习每一层次的内容和设计原则 ...

【GreatSQL优化器-03】查询开销估算

博主头像 【GreatSQL优化器-03】查询开销估算 一、cost和read_time介绍 GreatSQL的优化器在创建执行计划的时候是根据每张表的行数和数据分布以及读数据硬盘消耗等信息来判断先查询哪张表后查询哪张表,要不要使用索引,这些表资源信息就被称为cost,俗称为"开销"。在这之前已经执行了upd ...

Pgloader极简教程

博主头像 目录简介安装安装概述CentOS编译安装使用命令行配置文件迁移可能遇到的错误更多配置参考总结引用 简介 pgloader是一个数据同步工具,用来将数据从其它地方迁移到postgresql中,支持从如下源迁移: 文件:CSV、Fixed Format、Postgres COPY text format ...

Redis中常见的数据类型及其应用场景

博主头像 五种常见数据类型 Redis中的数据类型指的是 value存储的数据类型,key都是以String类型存储的,value根据场景需要,可以以String、List等类型进行存储。 各数据类型介绍: Redis数据类型对应的底层数据结构 String 类型的应用场景 常用命令 存放键值:set key ...

读数据质量管理:数据可靠性与数据质量问题解决之道09数据可靠性

博主头像 1. 数据可靠性 1.1. 数据可靠性指的是一个组织在整个数据生命周期中提供高数据可用性和健康状况的能力 1.1.1. 是高数据质量带来的结果 1.1.1.1. 高质量的大数据是这个大规模转型平台的核心 1.1.2. 随着公司接收到比以往更多的事务型数据和第三方数据,以及组织中的所有员工在数据生命周 ...

【全面解读】Apache SeaTunnel常见问题全攻略

博主头像 使用SeaTunnel需要安装Spark或者Flink这样的引擎么? 不需要,SeaTunnel 支持 Zeta、Spark 和 Flink 作为同步引擎的选择,您可以选择之一就行,社区尤其推荐使用 Zeta 这种专为同步场景打造的新一代超高性能同步引擎。Zeta 被社区用户亲切的称为 “泽塔奥特曼 ...

DataOps for LLM 的数据工程技术架构实践

博主头像 导读 在 LLM 蓬勃发展的今天,数据工程已成为支持大规模 AI 模型训练的基石。DataOps 作为数据工程的重要方法论,通过优化数据集成、转换和自动化运维,加速数据到模型的闭环流程。本文聚焦新一代数据 & AI 集成工具- Apache SeaTunnel 在 DataOps 中的核心作用,并介 ...

Apache Dolphinscheduler数据质量源码分析

博主头像 Apache DolphinScheduler 是一个分布式、易扩展的可视化数据工作流任务调度系统,广泛应用于数据调度和处理领域。 在大规模数据工程项目中,数据质量的管理至关重要,而 DolphinScheduler 也提供了数据质量检查的计算能力。本文将对 Apache DolphinSchedu ...

Mysql篇-语句执行计划详解(explain)

博主头像 概述 使用 explain 输出 SELECT 语句执行的详细信息,包括以下信息: 表的加载顺序 sql 的查询类型 可能用到哪些索引,实际上用到哪些索引 读取的行数 Explain 执行计划包含字段信息如下:分别是 id、select_type、table、partitions、type、poss ...

读数据质量管理:数据可靠性与数据质量问题解决之道08扩展异常检测

博主头像 1. Python和机器学习扩展异常检测 1.1. 机器学习有助于大规模数据可观测性和数据监控 1.1.1. 配备了机器学习的检测器可以更灵活地应用到更多的数据表上,从而消除了随着数据仓库或数据湖的增长进行手动检查和手动操作的需要 1.1.2. 机器学习检测器可以实时学习和适应数据,并且可以捕获到人 ...

[20241118]NLS_LANG设置问题2.txt

[20241118]NLS_LANG设置问题2.txt--//链接 https://www.itpub.net/thread-2155589-1-1.html上的讨论。--//PiscesCanon指出:--//NLS_LANG设置错了,如果你的客户端是sqlplus,那么应该是NLS_LANG=. ...

安装MySQL8数据库

安装MySQL8 MySQL Community Server 社区版本,开源免费,自由下载,但不提供官方技术支持,适用于大多数普通用户。 MySQL Enterprise Edition 企业版本,需付费,不能在线下载,可以试用30天。提供了更多的功能和更完备的技术支持,更适合于对数据库的功能和可 ...

<1···383940···50>