刷新
读数据自助服务实践指南:数据开放与洞察提效04搜索服务

博主头像 1. 搜索服务 1.1. 重点是在开发洞察的迭代过程中找到相关的数据集(表、视图、模式、文件、流和事件)和工件(指标、仪表盘、模型、ETL和即席查询)​ 1.2. 搜索服务简化了数据集和工件的发现过程 1.2.1. 通过搜索服务,数据用户可以使用关键字、搜索通配符、业务术语等表达他们要查找的内容 1 ...

读数据自助服务实践指南:数据开放与洞察提效03元数据目录服务

博主头像 1. 元数据目录服务 1.1. 通过与数据分析师和科学家交谈,用户发现了一个包含客户账单记录相关细节的数据集 1.2. 企业内部并不缺乏数据,但是如何使用数据来解决业务问题是当前的一大挑战 1.3. 以仪表盘和机器学习模型的形式构建洞察需要对数据属性(称为元数据)有清晰的理解 1.4. 在缺乏全面的 ...

读数据自助服务实践指南:数据开放与洞察提效02洞察耗时

博主头像 1. 定义洞察耗时记分卡 1.1. 洞察耗时是度量从原始数据到提取洞察所需时间的总体指标 1.2. 每个企业在与提取洞察相关的痛点上有所不同 1.2.1. 由于现有流程的成熟度、技术、数据集、数据团队技能、行业垂直度等方面的差异,企业的痛点也不相同 1.3. 每个指标都是根据与该指标相关的任务能否完 ...

读数据自助服务实践指南:数据开放与洞察提效01数据介绍

博主头像 1. 数据介绍 1.1. 数据是新的石油 1.1.1. 当今的企业拥有丰富的数据,但缺乏数据洞察力 1.1.2. 目前,企业内部的结构化数据、半结构化数据以及非结构化数据的数据量呈指数级增长 1.1.3. 尽管在数据湖中收集了大量数据,但它们可能不一致、无法解释、不准确、不及时、未标准化或不充分 1 ...

《数据资产管理核心技术与应用》-常见的开源数据资产管理平台介绍与底层架构实现总结

博主头像 《数据资产管理核心技术与应用》是清华大学出版社出版的一本图书,全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与存储、数据血缘、数据质量、数据监控与告警、数据服务、数据权限 ...

GreatSQL启动崩溃:jemalloc依赖缺失问题排查

博主头像 GreatSQL启动崩溃:jemalloc依赖缺失问题排查 故障现象: 之前协助用户安装 GreatSQL 测试环境时,遇到一个 case,数据库初始化时没有报错,但是使用mysqld_safe去启动,会直接 crash ,详情报错如下: ..... <jemalloc>: Error in mun ...

【IoTDB 线上小课 14】我们为什么要做树表双模型?

博主头像 【IoTDB 视频小课】第十四期,双模型视频版科普,从我们的设计思路讲起... 关于 IoTDB,关于物联网,关于时序数据库,关于开源... 一个问题重点,3-5 分钟,我们讲给你听: 这次真的可以全都要! 还有朋友不知道吗?我们的 2.0.1-beta 版本正式发布表视图啦! 时序数据库底层模型, ...

金融行业数字化转型破局:WhaleScheduler如何重塑万级任务调度体系?

博主头像 数字浪潮下的金融突围战 在国家"十四五"数字经济发展规划与金融科技发展纲要的推动下,某国有大行地区性分行正面临数字化转型的关键战役。随着每日数据处理任务激增至近万量级,原有自研调度系统已难以支撑业务扩张需求。本文将深度解析该行如何通过国产信创调度平台实现技术突围。 一、传统架构之困:数字金融转型的三 ...

3月报|DolphinScheduler项目进展一览

博主头像 各位热爱 Apache DolphinScheduler 的小伙伴们,社区3月报来啦!来查看上个月项目的进展吧! 月度Merge Star 感谢以下小伙伴上个月为 Apache DolphinScheduler 所做的精彩贡献(排名不分先后): “@ruanwenjun,@yingh0ng,@MYs ...

MySQL 高可用性:数据库的"永不停机保障"

博主头像 MySQL 高可用性:数据库的"永不停机保障" 就像现代城市需要 24 小时不间断的供电、供水和急救服务,现代应用系统也需要"永不宕机"的数据库支持...让我们一起探索 MySQL 的"高可用性"世界,学习如何为数据库构建一套可靠的"永不停机保障"! 什么是 MySQL 高可用性? M ...

MySQL下200GB大表备份,利用传输表空间解决停服发版表备份问题

博主头像 MySQL下200GB大表备份,利用传输表空间解决停服发版表备份问题 问题背景 在停服发版更新时,需对 200GB 大表(约 200 亿行数据)进行快速备份以预防操作失误。 因为曾经出现过有开发写的发版语句里,UPDATE语句的WHERE条件写错了,原本只需要更新几行数据,最终导致更新了半张表的数据 ...

SQL Server 分区表与性能优化

博主头像 遇到不少工作了很多年的人,这部分人不懂数据库的优化,更不懂分区表,但是他们总是把性能瓶颈寄希望于分区表,认为分区表是一个万能的解药,但凡是有点性能问题,第一个就想到分区,把分区表当做终极大招,什么性能问题都能解决。难道是在网上看一个分区demo之类的口水文章,从此就对分区深信不疑,你有没有考虑过自己 ...

GitHub 无法访问?IoTDB 开源代码有保障!

博主头像 UTC 时间 2025 年 4 月 12 日 20:01 开始,全球代码托管平台 GitHub 出现区域性访问异常,受影响用户反馈非登录状态下访问返回 403 限制提示。经 GitHub 官方确认,此次异常系配置变更导致的意外影响,导致该问题的配置更改已被撤销,用户不应再遇到相关问题。 GitHub ...

<1···131415···50>