Apache Doris是一款基于 MPP 架构的高性能、实时分析型数据库。它以高效、简单和统一的特性著称,能够在亚秒级的时间内返回海量数据的查询结果。Doris 既能支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。 基于这些优势,Apache Doris 非常适合用于报表分析、即席查询、统一 ...
在数据库技术迭代加速的 2025 年,PostgreSQL(PG)已从一款“开源关系型数据库”演变为驱动数字化转型的核心引擎。其凭借开源社区的活力、技术架构的灵活性与多场景适配能力,正以“纵向深化功能、横向拓展生态”的姿态重塑行业格局。根据最新 DB-Engines 排名,PostgreSQL 稳居 ...
1. 伦理数据预处理 1.1. 仅仅通过去身份化措施是远远不够的 1.2. 仅仅去除信息的敏感属性并不足以消除对敏感群体(如外国学生)的偏见 1.3. 找到方法消除数据集中存在的偏见并利用生成的预测模型来避免歧视现象的出现 1.4. 对数据集采用k-匿名、l-多样性或t-贴近度法等手段以加强隐私保护 ...
版权声明:本文为CSDN韩悸桉博主原创文章 原文链接:https://blog.csdn.net/qq_38566465/article/details/140185092 一、查看数据库中的字符集 -- 查看数据库中的字符集 show variables where Variable_name l ...
针对大事务问题对业务存储过程改造 一、问题描述 1. 问题现象 业务调用存储过程没有成功,发现存在大事务,单独拿出来执行发现问题。 greatsql> INSERT INTO `ywdb1`.`t1`( `TIMEKEY`, `zbbh`, `zcbl`, `zcblms`, `zjzh`, `zj ...
时序数据的存储并不是应用的最终目的,利用强大的可视化 BI 工具将时序数据转化为监控、分析业务实时状态的有效抓手,已成为驱动智能决策与业务增长的核心路径。 国产原生时序数据库 IoTDB 为工业物联网提供高性价比的时序数据管理能力,与 DataEase 数据可视化平台深度融合形成完整解决方案: 实时 ...
[20250514]truncare table相关数据段的确定与恢复.txt--//这几天一直在做truncare table,drop table的非常规恢复,通过修改obj$表的DATAOBJ#指向原来的数据段号,然后通过rowid扫描--//的方式收集数据。该方式最大的缺点就是恢复很慢,原始 ...
1. 后门 1.1. 政府经常主张在加密标准中设置“后门”,这样他们就能够在适当的时候(比如在获得法院命令之后)检索个人数据 1.2. “五眼情报联盟”(Five Eyes intelligence alliance) 1.2.1. 如果电信和科技公司不为执法机构和政府提供“合法获取”公民加密信息 ...
他是企业级 AIOps 专家 他是 Apache SeaTunnel 的活跃贡献者 ♂️ 他热爱爬山、骑行,也热衷于代码世界的每一场冒险 本期,我们邀请到来自「移动云能力中心」的倪佳晖,带你走进他与 SeaTunnel 社区之间那些真实、热血又有趣的成长故事。 GitH ...
1.升级背景 因项目需要使用数据质量模块功能,可以为数仓提供良好的数据质量监控功能。故要对已有2.0版本升级到3.0版本以上,此次选择测试了3.0.1 和 3.1.1 两个版本,对进行同数据等任务调度暂停等操作测试,最后选择3.0.1 版本 原因: 3.1.1 在测试sql任务时 ,同时启动上百sq ...
引言 PostgreSQL 中的外部数据封装器(Foreign Data Wrapper, FDW)是一种扩展,允许您像访问 PostgreSQL 数据库中的表一样,访问和操作存储在外部数据源中的数据。FDW 使 PostgreSQL 能够与多种数据存储系统(包括关系型和非关系型)进行集成,并以统一 ...
一、引言 某老系统数据库从 Oracle 迁移至 GreatSQL 过程中,首批迁移(存储过程、表结构、基础数据)顺利完成。然而,第二批数据迁移时出现主键冲突问题:原Oracle数据库中存在主键字段A与a(忽略大小写后视为相同值),但 GreatSQL 默认排序规则 utf8mb4_0900_ai_ ...
1. 加密 1.1. 在数据保护的基本方法中,加密可能是最重要的一种方法 1.1.1. 加密的基本概念是指将信息进行编码,只有经过授权的人才可访问它 1.1.2. 在现代社会,这是保障个人数据安全储存和传输的重要工具 1.1.3. 信息编码被称为密码 1.1.4. 在加密中,密文仍能被还原成明文 1 ...
[20250512]drop table的恢复3(包含lob类型字段).txt--//作为系列测试,增加drop table的恢复(包含lob类型字段)的情况,建立表包含lob字段,每个lob字段包含2个段,1个数据段,1个其--//索引段。当drop table时,相关数据段全部删除(包括索引段也 ...
题目来自于某位发帖人在某 Excel 论坛的求助,他需要将电表缴费数据按照缴费区间拆开后再按月份汇总。当时用手工处理数据,自称一千条数据就需要处理一天。我将这个问题转化为 SQL 题目。 ...
Apache DolphinScheduler社区答疑Star第三期评选活动圆满完成啦!本次活动旨在表彰那些长期为社区用户提供专业解答、积极推动技术交流的社群管理员。经过社区成员的公开票选,和上期一样,在25个社区群中共有2位表现突出的管理员获得最多投票。让我们热烈祝贺以下获奖者(按排名顺序): � ...
作者 | Tina Agent 正在成为 2025 年 AI 世界最炙手可热的关键词之一。 无论是大模型厂商、AI 初创公司,还是企业级应用团队,几乎都在讨论“多智能体协作”“自动化决策流程”以及“具备工具调用能力的 AI 系统”。 谷歌、英伟达等科技巨头纷纷布局,上个月亚马逊还成立了一个专注于 A ...
Apache DolphinScheduler 社区 Meetup 又来啦!本次活动,我们特别邀请到了来自 Zoom 的技术专家师彬杰,带来《DolphinScheduler 在 Zoom 的生产实践》主题分享,揭秘全球最大的线上会议平台 Zoom 是如何在业务中高效使用 DolphinSchedu ...
1. 伦理数据的收集 1.1. 隐私保护技术,如加密、模糊处理和差分隐私,这些技术着眼于保持隐私与个人数据的收集和存储之间的平衡 1.2. 有偏差的数据科学模型通常是由所收集的数据的偏差造成的 1.3. 重视伦理的数据收集实践是人体实验 1.4. 所有的数据科学项目都离不开数据 1.4.1. 就隐私 ...
两种不同的用户活跃度,留存率居然完全一致。这究竟是为什么?欢迎阅读【数分基本功】系列的第 1 篇。该系列会讲一些数据分析的基本问题,必要时增加拓展和深入 ...