刷新
老司机带你聊聊向量数据库

博主头像 老司机带你聊聊向量数据库 引言 随着人工智能、大数据技术的发展,传统数据库已经难以满足某些复杂应用场景的需求,尤其是在图像、语音、文本等非结构化数据的处理上,传统的精确匹配方式已经显得力不从心。 最近几年,向量数据库应运而生,成为了热门话题。向量数据库的核心优势在于它可以通过将数据转化为高维向量,在 ...

读数据工程之道:设计和构建健壮的数据系统22获取阶段考虑因素

博主头像 1. 有边界与无边界数据 1.1. 无边界数据是现实中存在的数据,是事件发生时的数据,要么是间断的,要么是连续的、持续的和流动的 1.2. 有边界数据是跨越某种边界(如时间)对数据进行归类的一种便捷方式 1.2.1. 所有的数据在有边界之前都是无边界的 1.3. 长期以来,业务流程通过切割离散的批次 ...

PostgreSQL逻辑复制常见错误以及处理方式

博主头像 在PostgreSQL和SQLServer中,有一个共同的特点,相比如物理复制,逻辑复制可能会存在较多的一些细节和可能错误的发生,作为SQLServer Replication(逻辑复制)的深度用户,有必要深入学习试验一下PostgreSQL的逻辑复制的一些细节。 订阅端的主要订阅选项信息 crea ...

PostgreSQL 16逻辑复制改进 (译)

博主头像 原文地址:https://www.pgedge.com/blog/postgresql-16-logical-replication-improvements-in-action 我之前简要介绍了PostgreSQL中的复制方法,并概述了PostgreSQL 16中逻辑复制的一些关键特性。在这篇博客 ...

读数据工程之道:设计和构建健壮的数据系统21数据获取

博主头像 1. 数据获取 1.1. 数据获取是将数据从一个地方移动到另一个地方的过程 1.1.1. 数据获取与系统内部获取是不同的 1.2. 数据获取是数据工程生命周期中将数据从源系统移入存储的一个中间步骤 1.3. 数据集成则是将来自不同来源系统的数据组合到一个新的数据集 1.4. 数据获取的核心是数据管道 ...

Sql高级

博主头像 1. sql高级 1.1. 索引与视图 1.1.1. 常见的数据结构 1.1.2. 索引 1.1.2.1. 作用 1.1.2.2. 定义 1.1.2.3. 分类 1.1.2.4. 设计原则 1.1.2.5. 语法 1.1.3. 视图 1.2. 事务与锁 1.2.1. 事务的原理 1.2.2. 事务的 ...

【2024有效】WordPress忘记密码找回登录密码的最简单有效的方法

博主头像 这个找回Wordpress后台密码密的方法,前提是,可以操作数据。 最近忘记了极客侠网站登陆密码,还是按照以前的方法,进入数据库直接修改数据库, 但是现在wordpress密码的加密不是简单的MD5所以不能用一个md5加密好的密码去替换数据库, 这里的关键所在就是不知道现在的加密方式, 于是又百度了 ...

工具分享丨数据闪回工具MyFlash

博主头像 工具分享丨数据闪回工具MyFlash 在当今数字化的时代,数据已经成为了企业和个人最宝贵的资产之一。数据不仅仅是简单的信息集合,它更是决策的依据、业务的支撑以及创新的源泉。 数据丢失是一种极其危险且令人头疼的情况。想象一下,企业因系统故障、人为误操作或遭受恶意攻击而丢失了关键的业务数据,这可能导致业 ...

数据集成的未来:一文搞懂 EtLT 新技术的崛起

博主头像 前瞻性技术通常具有创新性,并受到早期采用者的欢迎,从而提供一定的商业价值。 说到数据集成,有人可能会质疑这有什么好讨论的——这不就是简单的 ETL 吗?从各种数据库中提取数据,进行转换,最后加载到不同的数据仓库中。 随着大数据、数据湖、实时数仓、大规模模型等的兴起,数据集成架构从数据仓库时代的ETL ...

MySQL 复习(一):建表约束

博主头像 MySQL 复习(一):建表约束 MySQL 复习(一):建表约束 1. 主键约束 -- 添加:alter table table_name add primary key (字段) -- 删除:alter table table_name drop primary key 1.1 添加主键约束 1 ...

读数据工程之道:设计和构建健壮的数据系统18数据存储系统(上)

博主头像 1. 单机存储和分布式存储 1.1. 存储系统是存在于原材料之上的抽象层次 1.2. 磁盘是一种原始存储材料,而主要的云对象存储平台和HDFS是利用磁盘的存储系统 1.3. 随着数据存储和访问模式变得越来越复杂,并超出了单一服务器能做到的支持,将数据分布到一个以上的服务器上变得很有必要 1.4. 数 ...

mysql主从复制概述和配置

概述 主从复制是指将主数据库的DDL和DML操作通过二进制日志传到从库服务器中,然后在从库上对这些日志重新执行(也叫重做),从而使得从库和主库的数据保持同步。 MySQL支持一台主库同时向多台从库进行复制,**从库同时也可以作为其他从服务器的主库*实现链状复制。 一般主库称为Master从库Slav ...

MariaDB 和 GreatSQL 性能差异背后的真相

博主头像 MariaDB 和 GreatSQL 性能差异背后的真相 前言 最近项目上遇到了两次 MariaDB 和 GreatSQL 的对比,GreatSQL受到客户质疑,最后经过排查抓到性能差异背后的真相。基于此做个分享。 版本 MariaDB版本:10.3.39 该版本为麒麟V10 yum安装 Great ...

应对复杂架构下的监控挑战?统一运维可观测能力是关键!

博主头像 在全球数字化变革背景下,企业需适应数字经济与市场变化,进行系统性数字化转型。在“十四五”规划指导下,企业纷纷探求数字化应用之路,大数据、云计算、人工智能、区块链等技术成了热门话题,其中云运维备受瞩目。 企业在数字化转型中难免会碰到云上系统规划、运维体系建设、云上安全等挑战,因此用可观测性来改进现有监 ...

保姆级 | MySQL的安装配置教程(非常详细)

博主头像 一、下载Mysql 从官网下载MySQL,这里我选用的是Mysql8.0.34版本 二、安装Mysql 下载完成后直接双击进行安装,打开后的页面如下所示: “Developer Default”是开发者默认 “Server only”仅作为服务器安装 “Clientonly”仅作为客户端安装 “Fu ...

mysql建议单表2000万条数据的由来

Mysql在建表之初就要考虑到他的存储量和性能问题,所以一般Mysql数据库建议单表最大两千万,但是为啥是两千万呢这里我们解释一下,知其然还要知其所以然! 这一块的知识解释起来会涉及一点存储引型的相关知识了这里给提供一个基本概念,但是了解完之后会对InnonDB引型会有一定的了解 数据页相关知识 首 ...

HDFS 重要机制之 checkpoint

博主头像 核心概念 hdfs checkpoint 机制对于 namenode 元数据的保护至关重要, 是否正常完成检查点是评估 hdfs 集群健康度和风险的重要指标 editslog : 对 hdfs 操作的事务记录,类似于 wal ,edit log文件以 edits_ 开头,后面跟一个txid范围段,并 ...

<1···464748···50>