刷新
读数据科学伦理:概念、技术和警世故事02FAT流程框架

博主头像 1. 概述 1.1. 任何一种框架或核查表都会很快过时(因此需要定期更新)​:数据源、技术、应用程序和伦理考量都在不断地变化 1.2. 将FAT流程框架作为通用的指导准则 2. 三个属性 2.1. 公平、责任和透明(FAT) 2.1.1. 前两个准则用于评定伦理概念,比如隐私、歧视和可解释性 2.1 ...

读数据科学伦理:概念、技术和警世故事01数据科学伦理导读

博主头像 1. 数据科学伦理的兴起 1.1. 数据科学实践包括:获取数据、​(预)处理数据、分析数据、对数据进行建模、评估结果,然后使用模型或结果学习知识、支持论点或做决策 1.2. 数据科学家 1.2.1. 被誉为21世纪最具吸引力的职业 1.2.2. 不仅要在现有数据集上调用预先定义库,还要在数据科学项目 ...

探索表访问方法功能:顺序扫描分析

博主头像 引言 在之前的文章中,我们讨论了 PostgreSQL 表访问方法 API 的基础知识以及堆元组(heap tuple)与元组表槽(Tuple Table Slot,简称 TTS)之间的区别。 本文将深入探讨 PostgreSQL 核心如何通过特定的 API 调用实现顺序扫描。 涉及的 API 为了 ...

GreatSQL Hash Join 条件列长度对执行计划的影响

博主头像 GreatSQL Hash Join 条件列长度对执行计划的影响 一、问题发现 在一次开发中发现当执行 Hash Join 用 VARCHAR 字段作为连接的时候,字段长度长短不同时候,执行计划也不一样。看下面3个例子。 1、连接条件字段长度为20的场景 greatsql> CREATE TABLE ...

读数据自助服务实践指南:数据开放与洞察提效20成本管理服务

博主头像 1. 成本管理服务 1.1. 为了利用云中可用的无限资源,企业需要无限的预算 1.1.1. 成本管理对于确保数据平台的有限预算与业务优先级的有效配合至关重要 1.1.2. 由于有众多选择,所以成本管理就像黑盒,需要不断优化成本,以适应日常工作中变化的工作负载 1.2. 操作阶段的最后一部分是成本管理 ...

SeaTunnel二次开发进阶:企业级复杂场景下的亿万级数据处理与智能容错机制

博主头像 作者:史德昇 随着数据来源的不断复杂化及业务需求的快速演进,通用的数据集成框架在实际落地过程中往往面临诸多挑战:数据结构不规范、字段缺失、敏感信息混杂、数据语义不清等问题频繁出现。为了更好地应对这些复杂场景,某上市网络安全龙头企业基于 Apache SeaTunnel 进行了二次开发,构建了一套可扩 ...

Hi 同学,快来开源之夏认领你的 IvorySQL 开源任务!

博主头像 Hi~同学! 想和技术大牛一起参与开源吗? 如果你对数据库、PostgreSQL 感兴趣,那么就来参与开源之夏吧!一年一度的开源之夏已经开启,是高校学生参与开源的不二之选,绝对不容错过。 IvorySQL 社区再一次参与其中,发布了 2 个项目。欢迎各位同学来认领哦! 开源之夏简介 开源之夏是由中国 ...

IvorySQL 再次走进北京大学研究生开源公选课

博主头像 2020年1月COPU(中国开源软件推进联盟)成员开会讨论面向高校的开源示范课程,由联盟副秘书长北京大学荆琦老师牵头筹备,并首先在北大软微学院试点。本次是中国PostgreSQL分会联合会员企业应邀第五次参与授课,课程吸引了国内头部开源大厂积极加入,包括众多开源项目。课程面向北大研一学生(研一第二学 ...

[20250506]drop table的恢复2.txt

[20250506]drop table的恢复2.txt--//尝试drop table的恢复,前提没有备份的情况不得已为之的方法,前面测试提到drop table时清除段头里面的Extent Map以及--//Auxillary Map的信息。这样通过建立新表的方式也只能像truncate tab ...

【IoTDB 线上小课 15】树表双模型,到底该怎么选?

博主头像 【IoTDB 视频小课】第十五期,双模型科普继续,这次是大家最关心的选择问题! 关于 IoTDB,关于物联网,关于时序数据库,关于开源... 一个问题重点,3-5 分钟,我们讲给你听: 不再迷茫,我们告诉你如何选择! 上期视频我们详细解读了为什么 IoTDB 要推出树表双模型, 那么树模型和表模型的 ...

读数据自助服务实践指南:数据开放与洞察提效18模型部署服务

博主头像 1. 模型部署服务 1.1. 编写一次性脚本来部署模型并不困难 1.2. 针对模型训练类型(在线与离线)​、模型推理类型(在线与离线)​、模型格式(PAML、PFA、ONNX等)​、终端类型(Web服务、IoT、嵌入式浏览器等)以及性能要求(由预测/秒和延迟定义)的不同组合,管理这些脚本非常困难 1 ...

<1···101112···50>