刷新
Apache SeaTunnel Committer 进阶指南

博主头像 Apache SeaTunnel 作为一个开源的数据集成工具,旨在简化和加速海量数据的采集和传输。 社区的 Committer 是指拥有项目存储库的写权限的社区成员,即 Committer 可以自行修改代码、文档和网站,也可以合并其他成员的贡献。成为 Apache SeaTunnel Committ ...

Percona Toolkit 神器全攻略(性能类)

博主头像 Percona Toolkit 神器全攻略(性能类) Percona Toolkit 神器全攻略系列共八篇,前文回顾: 前文回顾 Percona Toolkit 神器全攻略 Percona Toolkit 神器全攻略(实用类) Percona Toolkit 神器全攻略(配置类) Percona T ...

[20240911]查看超长视图的定义2.txt

[20240911]查看超长视图的定义2.txt--//昨天看了链接:https://www.anbob.com/archives/8295.html,提供了另外的方式获得超长定义试图的长文本。--//我重复验证看看.1.环境:SYS@book> @ver2 PORT_STRING : x86_64 ...

如何将图片转换为向量?(通过DashScope API调用)

博主头像 本文介绍如何通过模型服务灵积DashScope将 图片转换为向量 ,并入库至向量检索服务DashVector中进行向量检索。 模型服务灵积DashScope,通过灵活、易用的模型API服务,让各种模态模型的能力,都能方便的为AI开发者所用。通过灵积API,开发者不仅可以直接集成大模型的强大能力,也可 ...

数据资产入表全流程解析,助力企业数据要素价值释放

博主头像 数据资产入表即数据资产会计核算,指的是把有价值的数据编制进资产负债表,作为企业沉淀的无形资产,让数据要素的交易流通变得合规,数据价值可计算。 2023年8月21日,财政部发布《企业数据资源相关会计处理暂行规定》,并于2024年1月1日开始实施,首次将数据资源纳入企业会计核算体系,明确了数据资产入表的 ...

万字长文 | Apache开源社区出海的“踩坑”之路,看完这3点你就明白了

博主头像 引言 作为一名软件行业的从业者,我已经在开源社区Remote工作了两年时间。“技术运营” 是一个相对小众的职业,所以如果你在这个行业工作,却找不到自己热情所在或擅长的事情,可能会感觉缺乏价值感(这一点我老板也很认同)。 然而,如果你愿意为自己的情怀买单,并全心投入其中,这确实是一件伟大的事情。 我并 ...

GreatSQL 异步复制及搭建

博主头像 GreatSQL 异步复制及搭建 一、简介 复制就是将一个数据库数据复制到一个或多个数据库上,复制的过程是异步的,其工作原理是通过binlog(二进制日志)记录事务变更然后传送到从库并重放事务,保持数据一致 二、复制过程 1-1 复制过程图 2.1 binlog日志 GreatSQL 复制是基于 b ...

SparkSQL练习:对学生选课成绩进行分析计算

博主头像 题目内容: 对学生选课成绩进行分析计算 题目要求: (1)该系总共有多少学生; (2)该系共开设来多少门课程; (3)每个学生的总成绩多少; (4)每门课程选修的同学人数; (5)每位同学选修的课程门数; (6)该系DataBase课程共有多少人选修; (7)每位同学平均成绩; 数据预览: 每行数据 ...

单个48TB大小SQL Server数据库备份导致日志文件无法截断

博主头像 单个48TB大小SQL Server数据库备份导致日志文件无法截断 SQL Server 版本:SQL Server 2019背景在一个48T大小的单数据库环境中,采用简单恢复模式,日志文件大小限制为600G。执行一次完整备份时,耗时超过12小时,导致日志文件无法截断并达到上限,后续事务无法正常写入 ...

大数据集群内核参数调优

博主头像 tcp mem 相关 net.ipv4.tcp_rmem = 4096 131072 6291456 读取缓冲区,单位字节 net.ipv4.tcp_wmem = 4096 16384 4194304 发送缓冲区,单位字节 net.ipv4.tcp_mem = 760707 1014278 1521 ...

数据同步方式何来“高级”与“低级”之说?场景匹配才是真理!

博主头像 导读:数据同步方式的重要性对于数据集成领域的兴从业者不言而喻,选择正确的数据同步方式能让数据同步工作的成果事半功倍。目市面上的数据同步工具很多,提供的数据同步方式也有多种,不同的数据同步方式有什么区别?如何选择适合自己业务需求的数据同步方式呢?本文将对此进行深入分析,并深入剖析WhaleTunnel ...

《数据资产管理核心技术与应用》读书笔记-第四章:数据质量的技术实现(三)

博主头像 《数据资产管理核心技术与应用》是清华大学出版社出版的一本图书,全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与存储、数据血缘、数据质量、数据监控与告警、数据服务、数据权限 ...

mybatis plus 常用知识汇总(保姆级教程!~)

博主头像 介绍: MyBatis-Plus 是基于 MyBatis 框架的一个增强工具,主要目的是简化 MyBatis 的开发过程,提供更加简洁、方便的 CRUD 操作。它是在保留 MyBatis 强大功能的基础上,通过封装和优化一些常见操作来提高开发效率。 MyBatis-Plus 提供了许多开箱即用的功能 ...

时空人工智能介绍

博主头像 时空人工智能 时空人工智能是AI领域的新型创新应用技术,定义为以时空为‘索引’对多源异构数据进行时空化治理和融合,并借力知识工程和AI算法进行智能化分析,从而挖掘知识和辅助决策。时空AI是地理空间智能、城市空间智能和时空大数据智能等的统一表示,包括从时空感知、认知到决策预知的多项核心技术。其应用生态 ...

hadoop基础知识分享(一)

博主头像 写在前面 今天学习hadoop部分的知识。 Hadoop 概述 Hadoop 是一个适合海量数据的分布式存储和分布式计算的平台。Hadoop 的处理思想是“分而治之”。它起源于 Google 的三篇文章:Google FS(GFS),MapReduce,BigTable。Hadoop 主要包含三个核 ...

海豚调度清理:使用 API 轻松清理工作流历史版本记录,一键减少关系日志和任务定义日志表的数据量

博主头像 本系列文章是 DolphinScheduler 由浅入深的教程,涵盖搭建、二开迭代、核心原理解读、运维和管理等一系列内容。适用于想对 DolphinScheduler了解或想要加深理解的读者。 推荐阅读: 海豚调度监控:使用图关系解决核心链路告警问题,减轻任务运维负担,用户五星好评! 海豚调度 ...

<1···454647···50>