1. 伦理建模 1.1. 女性的隐形歧视问题 1.2. 可解释性问题,即能够解释预测结果 1.2.1. 之所以需要能够解释预测结果,是因为我们既要获得对模型的信任,又要有所感悟,还要改进模型 1.3. 可解释性方法 1.3.1. 复杂模型可解释性方法(LIME) 1.3.2. 反事实分析方法 1.3 ...
1. ε-差分隐私 1.1. 差分隐私的概念是由辛西娅·德沃克(Cynthia Dwork)提出的,是数据科学的黄金标准之一,它将隐私纳入其中 1.2. 差分隐私的目标是让社会科学家共享有用的统计数据,这些统计数据与敏感数据库有关 1.2.1. 如果不考虑隐私问题便回答,就可能会泄露私人敏感信息 1 ...
1. 再识别 1.1. 我们生活在数字化时代,行为数据记录着我们的一举一动的 1.1.1. 行为数据会带来隐私风险,主要因为有完全相同记录行为的人数极少,所以才可以进行再识别 1.1.2. 加强k-匿名会大大降低此类数据的效用,因为此类数据具有细粒度属性,因此建立在此类数据上的预测模型的精确度往往会 ...
【SQL破案系列】第一篇:如果监控摄像头拍下了很多车辆的行车轨迹,那么如何利用这些行车轨迹来分析车辆运行的特征,是不是能够分析出犯罪分子“踩点”的位置 ...
TimechoDB v2.0.3 版本正式发布! TimechoDB 是由 IoTDB 原厂团队开发的是企业级时序数据库产品。V2.0.3 版本新增元数据导入导出脚本适配表模型、Spark 生态集成(表模型)、AINode 返回结果新增时间戳,表模型新增部分聚合函数和标量函数,同时对数据库监控、性能 ...
Apache Doris是一款基于 MPP 架构的高性能、实时分析型数据库。它以高效、简单和统一的特性著称,能够在亚秒级的时间内返回海量数据的查询结果。Doris 既能支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。 基于这些优势,Apache Doris 非常适合用于报表分析、即席查询、统一 ...
在数据库技术迭代加速的 2025 年,PostgreSQL(PG)已从一款“开源关系型数据库”演变为驱动数字化转型的核心引擎。其凭借开源社区的活力、技术架构的灵活性与多场景适配能力,正以“纵向深化功能、横向拓展生态”的姿态重塑行业格局。根据最新 DB-Engines 排名,PostgreSQL 稳居 ...
1. 伦理数据预处理 1.1. 仅仅通过去身份化措施是远远不够的 1.2. 仅仅去除信息的敏感属性并不足以消除对敏感群体(如外国学生)的偏见 1.3. 找到方法消除数据集中存在的偏见并利用生成的预测模型来避免歧视现象的出现 1.4. 对数据集采用k-匿名、l-多样性或t-贴近度法等手段以加强隐私保护 ...
版权声明:本文为CSDN韩悸桉博主原创文章 原文链接:https://blog.csdn.net/qq_38566465/article/details/140185092 一、查看数据库中的字符集 -- 查看数据库中的字符集 show variables where Variable_name l ...
针对大事务问题对业务存储过程改造 一、问题描述 1. 问题现象 业务调用存储过程没有成功,发现存在大事务,单独拿出来执行发现问题。 greatsql> INSERT INTO `ywdb1`.`t1`( `TIMEKEY`, `zbbh`, `zcbl`, `zcblms`, `zjzh`, `zj ...
时序数据的存储并不是应用的最终目的,利用强大的可视化 BI 工具将时序数据转化为监控、分析业务实时状态的有效抓手,已成为驱动智能决策与业务增长的核心路径。 国产原生时序数据库 IoTDB 为工业物联网提供高性价比的时序数据管理能力,与 DataEase 数据可视化平台深度融合形成完整解决方案: 实时 ...
[20250514]truncare table相关数据段的确定与恢复.txt--//这几天一直在做truncare table,drop table的非常规恢复,通过修改obj$表的DATAOBJ#指向原来的数据段号,然后通过rowid扫描--//的方式收集数据。该方式最大的缺点就是恢复很慢,原始 ...
1. 后门 1.1. 政府经常主张在加密标准中设置“后门”,这样他们就能够在适当的时候(比如在获得法院命令之后)检索个人数据 1.2. “五眼情报联盟”(Five Eyes intelligence alliance) 1.2.1. 如果电信和科技公司不为执法机构和政府提供“合法获取”公民加密信息 ...
他是企业级 AIOps 专家 他是 Apache SeaTunnel 的活跃贡献者 ♂️ 他热爱爬山、骑行,也热衷于代码世界的每一场冒险 本期,我们邀请到来自「移动云能力中心」的倪佳晖,带你走进他与 SeaTunnel 社区之间那些真实、热血又有趣的成长故事。 GitH ...
1.升级背景 因项目需要使用数据质量模块功能,可以为数仓提供良好的数据质量监控功能。故要对已有2.0版本升级到3.0版本以上,此次选择测试了3.0.1 和 3.1.1 两个版本,对进行同数据等任务调度暂停等操作测试,最后选择3.0.1 版本 原因: 3.1.1 在测试sql任务时 ,同时启动上百sq ...
引言 PostgreSQL 中的外部数据封装器(Foreign Data Wrapper, FDW)是一种扩展,允许您像访问 PostgreSQL 数据库中的表一样,访问和操作存储在外部数据源中的数据。FDW 使 PostgreSQL 能够与多种数据存储系统(包括关系型和非关系型)进行集成,并以统一 ...
一、引言 某老系统数据库从 Oracle 迁移至 GreatSQL 过程中,首批迁移(存储过程、表结构、基础数据)顺利完成。然而,第二批数据迁移时出现主键冲突问题:原Oracle数据库中存在主键字段A与a(忽略大小写后视为相同值),但 GreatSQL 默认排序规则 utf8mb4_0900_ai_ ...
1. 加密 1.1. 在数据保护的基本方法中,加密可能是最重要的一种方法 1.1.1. 加密的基本概念是指将信息进行编码,只有经过授权的人才可访问它 1.1.2. 在现代社会,这是保障个人数据安全储存和传输的重要工具 1.1.3. 信息编码被称为密码 1.1.4. 在加密中,密文仍能被还原成明文 1 ...
[20250512]drop table的恢复3(包含lob类型字段).txt--//作为系列测试,增加drop table的恢复(包含lob类型字段)的情况,建立表包含lob字段,每个lob字段包含2个段,1个数据段,1个其--//索引段。当drop table时,相关数据段全部删除(包括索引段也 ...
题目来自于某位发帖人在某 Excel 论坛的求助,他需要将电表缴费数据按照缴费区间拆开后再按月份汇总。当时用手工处理数据,自称一千条数据就需要处理一天。我将这个问题转化为 SQL 题目。 ...