



. ├── 1-你好,大数据平台!/ │ ├── [ 29M] 1-1 做驾驭“多赛道” 的 “全能型” 大数据人才,获岗位自由切换和晋升“优先权” │ ├── [ 14M] 1-2 如何成为一个大数据工程师 │ ├── [7.0M] 1-3 站在数据工程师角度看大数据平台 │ ├── [ 25M] 1-4 一叶知秋:企业大数据平台初探 │ └── [8.3M] 1-5 浅谈大数据平台和数据中台的关系 ├── 2-大数据平台的地基:快速搞定Hadoop集群安装部署/ │ ├── [3.6M] 2-1 阶段一:做集群的管理者 │ ├── [ 11M] 2-2 拆解自动部署步骤 │ ├── [ 46M] 2-3 JSch实现远程命令执行 │ ├── [ 36M] 2-4 Freemarker实现配置自动生成 │ ├── [ 32M] 2-5 核心模块:配置文件加载 │ ├── [ 40M] 2-6 核心模块:机器初始化及免密 │ ├── [ 41M] 2-7 核心模块:配置模板生成 │ ├── [ 40M] 2-8 自动部署核心逻辑开发 │ ├── [ 68M] 2-9 自动部署Hadoop集群 │ └── [3.2M] 2-10 本章小结 ├── 3-平台基础模块之监控和预警/ │ ├── [ 13M] 3-1 监控系统的必要性 │ ├── [ 37M] 3-2 Prometheus实现机器监控 │ ├── [ 28M] 3-3 PromQL查询及报警配置 │ ├── [ 13M] 3-4 再谈Prometheus架构 │ ├── [6.1M] 3-5 Hadoop重点监控指标梳理 │ ├── [ 25M] 3-6 实战:Hadoop重点监控采集及监控图表配置 │ ├── [ 37M] 3-7 扩展:自定义Exporter开发 │ └── [3.2M] 3-8 本章小结 ├── 4-平台底层引擎之HDFS存储治理/ │ ├── [8.8M] 4-1 认识数据治理 │ ├── [ 10M] 4-2 数仓分层策略 │ ├── [6.5M] 4-3 HDFS元数据分析 │ ├── [ 20M] 4-4 FSImage元数据分析 │ ├── [ 23M] 4-5 实战:遍历HDFS存储空间 │ ├── [8.5M] 4-6 Hadoop3新特性:EC纠删码技术 │ ├── [ 27M] 4-7 EC转换命令测试 │ ├── [8.2M] 4-8 为什么HDFS不适合存储小文件 │ ├── [5.8M] 4-9 如何解决小文件存储的问题 │ ├── [ 53M] 4-10 实战:Text类型小文件合并程序开发 │ ├── [ 16M] 4-11 实战:ORC类型小文件合并程序开发 │ └── [3.6M] 4-12 本章小结 ├── 5-平台底层引擎之YARN计算治理/ │ ├── [9.0M] 5-1 认识计算治理 │ ├── [ 15M] 5-2 YARN的三类调度策略 │ ├── [ 47M] 5-3 CapacityScheduler配置实战 │ ├── [5.4M] 5-4 任务分析组件:Dr Elephant │ ├── [ 19M] 5-5 DrElephant采集任务运行信息 │ └── [4.1M] 5-6 本章小节 ├── 6-企业数据平台建设第一步:打造集群管理平台/ │ ├── [8.1M] 6-1 设计一个集群管理平台 │ ├── [6.4M] 6-2 数据采集和集群概览功能详解 │ ├── [5.0M] 6-3 HDFS数据治理模块详解 │ ├── [4.7M] 6-4 YARN计算治理模块详解 │ ├── [ 55M] 6-5 核心功能:HDFS JMX采集 │ ├── [ 66M] 6-6 核心功能:Yarn JMX采集 │ ├── [ 11M] 6-7 HDFS健康度评分指标 │ ├── [ 18M] 6-8 HDFS基础数据采集详解 │ ├── [ 94M] 6-9 核心功能:HDFS 数据详情采集 │ ├── [ 14M] 6-10 认识规则引擎 │ ├── [ 47M] 6-11 规则引擎Drools实战 │ ├── [ 71M] 6-12 核心功能:HDFS健康度评分 │ ├── [ 12M] 6-13 YARN健康度评分指标 │ ├── [ 67M] 6-14 核心功能:YARN健康度评分 │ ├── [ 52M] 6-15 集群概览服务及接口 │ ├── [ 26M] 6-16 存储计算详情列表服务及接口 │ ├── [ 60M] 6-17 健康度评分服务及接口 │ ├── [ 40M] 6-18 审计日志服务及接口 │ └── [ 30M] 6-19 集群管理平台前端开发及联调 ├── 7-扩展:Hadoop如何开发和测试/ │ ├── [ 17M] 7-1 Hadoop开发与测试 │ ├── [ 16M] 7-2 基准测试工具:TestDFSIO │ ├── [ 20M] 7-3 基准测试工具:NNBench │ ├── [9.3M] 7-4 基准测试工具:MRBench │ ├── [ 26M] 7-5 Yarn SLS测试实战 │ ├── [8.7M] 7-6 Hadoop上线流程 │ └── [5.1M] 7-7 本章小结@优库it资源网 ├── 8-扩展:面试题和分布式系统延伸/ │ ├── [7.9M] 8-1 逃不过的面试 │ ├── [ 11M] 8-2 常见Hadoop面试题(一) │ ├── [7.7M] 8-3 常见Hadoop面试题(二) │ ├── [4.0M] 8-4 Prometheus面试题 │ ├── [ 16M] 8-5 聊聊分布式系统 │ ├── [9.7M] 8-6 再看HDFS存储架构 │ ├── [ 17M] 8-7 分布式系统的中心化问题 │ ├── [ 11M] 8-8 再谈CAP定理 │ └── [ 11M] 8-9 阶段小结 ├── 9-企业数据平台建设第二步: 实现统一数据视图/ │ ├── [ 10M] 9-1 阶段二:做数据处理的执行者 │ ├── [9.4M] 9-2 阶段二学习路线图 │ ├── [ 15M] 9-3 为什么建设统一数据视图 │ ├── [ 11M] 9-4 元数据管理的三个问题 │ ├── [ 13M] 9-5 统一数据视图架构及模块划分 │ ├── [ 66M] 9-6 数据源模块实体及链接参数抽象 │ ├── [ 78M] 9-7 核心功能:多数据源管理及验证 │ ├── [ 48M] 9-8 核心功能:多数据源链接抽象 │ ├── [ 65M] 9-9 核心功能:多数据源元数据查询功能 │ ├── [ 49M] 9-10 核心功能:数据查询功能开发 │ ├── [ 63M] 9-11 核心功能:自动更新库表信息 │ ├── [ 20M] 9-12 数据编目实体介绍 │ ├── [ 42M] 9-13 数据编目服务开发 │ ├── [ 13M] 9-14 数据质量及接口管理模块介绍 │ ├── [ 38M] 9-15 数据质量及接口服务开发 │ ├── [ 33M] 9-16 元数据管理服务前端开发 │ ├── [ 24M] 9-17 番外篇:元数据体系架构的演进 │ ├── [ 13M] 9-18 番外篇:Apache Atlas介绍 │ ├── [9.1M] 9-19 番外篇:DataHub介绍 │ └── [ 16M] 9-20 本章小结 ├── 10-平台能力建设之计算引擎/ │ ├── 【认准一手完整 www.ukoou.com】 │ ├── [6.1M] 10-1 大数据计算引擎学习路线 │ ├── [ 14M] 10-2 MapReduce架构图解 │ ├── [ 26M] 10-3 实战:MapReduce实现WordCount程序 │ ├── [9.1M] 10-4 Hive架构图解 │ ├── [ 19M] 10-5 实战:Hive基础命令及JDBC操作 │ ├── [ 16M] 10-6 Spark架构及提交流程 │ ├── [ 19M] 10-7 Spark核心数据结构 │ ├── [ 36M] 10-8 实战:Spark实现WordCount程序 │ ├── [ 28M] 10-9 实战:Spark DataFrame操作 │ ├── [9.9M] 10-10 Spark常见优化策略 │ ├── [ 15M] 10-11 Presto架构介绍 │ ├── [ 13M] 10-12 Presto内存模型介绍 │ ├── [9.8M] 10-13 实战:Presto命令行及JDBC操作 │ ├── [5.4M] 10-14 Hive TestBench介绍 │ ├── [ 14M] 10-15 扩展:再看MapReduce性能 │ ├── [ 16M] 10-16 扩展:Shuffle的演进 │ ├── [ 13M] 10-17 扩展:SQL join优化演进 │ ├── [7.4M] 10-18 番外篇:数据血缘之Hive Hook │ ├── [ 38M] 10-19 番外篇:实战HiveHook表级别数据血缘 │ ├── [4.0M] 10-20 番外篇:数据血缘之Presto EventListener │ ├── [ 60M] 10-21 番外篇:实战PrestoEventListener获取运行SQL │ ├── [7.3M] 10-22 番外篇:数据血缘之SparkListener │ └── [5.2M] 10-23 本章小结 ├── 11-平台能力建设之数据采集服务/ │ ├── @优库it资源网ukoou.com │ ├── [ 11M] 11-1 为什么要建设数据管道 │ ├── [ 12M] 11-2 DataX架构介绍 │ ├── [ 54M] 11-3 实战:Datax实现Mysql和HDFS数据采集 │ ├── [ 30M] 11-4 实战:Datax增量采集配置 │ ├── [7.9M] 11-5 SeaTunnel架构介绍 │ ├── [ 31M] 11-6 实战:SeaTunnel实现Mysql数据采集 │ ├── [ 15M] 11-7 实战:SeaTunnel增量采集配置 │ ├── [ 10M] 11-8 重探SeaTunnel设计 │ ├── [ 12M] 11-9 SeaTunnel的Zeta引擎 │ ├── [ 11M] 11-10 如何设计一个数据管道系统 │ └── [ 12M] 11-11 本章小结 ├── 12-平台能力建设之任务调度服务/ │ ├── [ 10M] 12-1 为什么需要调度系统 │ ├── [8.8M] 12-2 Airflow介绍 │ ├── [ 36M] 12-3 Airflow WebUI介绍 │ ├── [ 41M] 12-4 Airflow DAG实战 │ ├── [ 12M] 12-5 DolphinScheduler介绍 │ ├── [ 30M] 12-6 Dolphinscheduler工作流配置实战 │ ├── [ 24M] 12-7 Dolphinscheduler集成Datax │ ├── [ 34M] 12-8 Dolphinscheduler任务参数 │ ├── [ 38M] 12-9 Dolphinscheduler特殊任务类型 │ ├── [ 30M] 12-10 Dolphinscheduler资源中心 │ ├── [ 28M] 12-11 Dolphoinscheduler接口 │ ├── [ 21M] 12-12 如何设计一个调度系统 │ └── [ 26M] 12-13 本章小结 ├── 13-平台能力建设之数据开发平台/ │ ├── [7.2M] 13-1 为什么需要大数据开发平台 │ ├── [ 19M] 13-2 Zeppelin&Hue介绍 │ ├── [ 23M] 13-3 实战Hue操作HDFS和Hiveserver2 │ └── [ 12M] 13-4 如何设计一个大数据开发平台 ├── 14-扩展:深入了解SQL的解析和优化/ │ ├── [6.0M] 14-1 Sql on Hadoop引擎介绍 │ ├── [ 12M] 14-2 Sql on Hadoop引擎平台使用痛点 │ ├── [8.9M] 14-3 统一执行服务介绍 │ ├── [ 13M] 14-4 Calcite介绍 │ ├── [ 18M] 14-5 Calcite架构及集成场景图解 │ ├── [9.6M] 14-6 SQL解析简介 │ ├── [ 66M] 14-7 实战:Calcite解析SQL │ ├── [ 42M] 14-8 实战:Calcite自定义语法一 │ ├── [ 57M] 14-9 实战:Calcite自定义语法二 │ ├── [ 52M] 14-10 实战:Calcite支持自定义csv数据源 │ ├── [ 11M] 14-11 SQL优化简介 │ ├── [ 10M] 14-12 SQL常用优化规则 │ ├── [ 12M] 14-13 SQL优化核心步骤 │ ├── [ 41M] 14-14 实战:Calcite进行CBO优化 │ └── [ 11M] 14-15 本章小结 ├── 15-企业数据平台建设第三步: 统一数据查询入口/ │ ├── [ 22M] 15-1 统一执行服务介绍及技术架构 │ ├── [ 22M] 15-2 核心数据表设计与开发 │ ├── [ 11M] 15-3 gRPC介绍 │ ├── [8.8M] 15-4 grpc通信消息体设计与开发 │ ├── [ 57M] 15-5 高可用方案介绍 │ ├── [ 28M] 15-6 主从选举代码开发 │ ├── [115M] 15-7 Router核心分发模块开发 │ ├── [ 59M] 15-8 执行节点核心模块开发 │ ├── [ 52M] 15-9 辅助分析功能开发 │ ├── [103M] 15-10 Presto执行节点开发 │ ├── [ 95M] 15-11 查询提交方法及接口开发 │ ├── [ 42M] 15-12 查询接口测试 │ ├── [ 55M] 15-13 HiveServer2执行节点开发 │ ├── [9.2M] 15-14 Apache Livy服务介绍 │ ├── [ 68M] 15-15 Spark On Livy执行节点开发 │ ├── [ 50M] 15-16 Livy Client模块开发 │ ├── [ 84M] 15-17 RouterJDBC模块开发 │ ├── [ 17M] 15-18 RouterJDBC测试程序开发 │ ├── [ 48M] 15-19 RouterClient可执行客户端开发 │ └── [9.4M] 15-20 RouterClient功能测试 ├── 16-平台能力建设之数据仓库/ │ ├── [ 24M] 16-1 认识数据仓库 │ ├── [ 14M] 16-2 什么是数据集市 │ ├── [ 17M] 16-3 数据仓库架构 │ ├── [ 17M] 16-4 为什么需要数据建模 │ ├── [ 13M] 16-5 数据仓库分层 │ ├── [ 15M] 16-6 数据仓库常见概念 │ ├── [ 20M] 16-7 常见的数据建模方法 │ ├── [ 13M] 16-8 维度建模详解 │ ├── [ 11M] 16-9 维度建模示例 │ ├── [ 23M] 16-10 离线数仓&实时数仓 │ ├── [ 13M] 16-11 常见数据仓库建设规范 │ ├── [ 22M] 16-12 简谈数据治理 │ ├── [9.5M] 16-13 数据质量评估 │ ├── [9.0M] 16-14 数据质量管理流程 │ ├── [ 10M] 16-15 数据质量监控框架及解决方案总结 │ ├── [ 12M] 16-16 初探DataOPS │ └── [7.4M] 16-17 数据仓库本章小结 ├── 17-企业数据平台应用第一步:数据分析与可视化/ │ ├── [ 13M] 17-1 阶段三:做数据价值发现的引领者 │ ├── [6.5M] 17-2 阶段三学习路线 │ ├── [9.9M] 17-3 为什么需要数据分析和可视化平台 │ ├── [ 11M] 17-4 SuperSet介绍 │ ├── [ 33M] 17-5 实战:SuperSet图表配置操作 │ ├── [ 12M] 17-6 销售数据分析业务场景 │ ├── [ 22M] 17-7 母婴数据集导入大数据集群 │ ├── [ 37M] 17-8 母婴数据分析图表 │ └── [ 12M] 17-9 如何设计一个数据可视化平台 ├── 18-扩展:标签系统技术选型之ClickHouse/ │ ├── [ 16M] 18-1 什么是标签 │ ├── [ 17M] 18-2 透过用户画像看标签 │ ├── [ 15M] 18-3 为什么要建设标签体系 │ ├── [ 18M] 18-4 标签平台建设技术选型 │ ├── [ 55M] 18-5 三类Bitmap操作实战 │ ├── [ 14M] 18-6 ClickHouse介绍 │ ├── [ 24M] 18-7 ClickHouse基本操作 │ ├── [ 14M] 18-8 ClickHouse核心架构 │ ├── [ 36M] 18-9 MergeTree引擎详解 │ ├── [ 24M] 18-10 HDFS、Hive数据导入至ClickHouse │ ├── [ 13M] 18-11 ClickHouse JDBC实战 │ ├── [ 12M] 18-12 ClickHouse Bitmap操作 │ └── [8.4M] 18-13 本章小结 └── 19-企业数据平台应用第二步:数据标签体系与用户标签实战/ ├── [9.1M] 19-1 标签平台技术架构及模块划分 ├── [4.8M] 19-2 核心数据表介绍与开发 ├── [ 15M] 19-3 标签存储设计 ├── [ 31M] 19-4 测试数据创建 ├── [ 54M] 19-5 开发:测试数据录入ClickHouse一 ├── [ 35M] 19-6 开发:测试数据录入ClickHouse二 ├── [ 41M] 19-7 表达式转换为Clickhouse SQL一 ├── [ 39M] 19-8 表达式转换为Clickhouse SQL二 ├── [ 26M] 19-9 标签查询核心功能 ├── [ 22M] 19-10 标签查询接口测试 ├── [ 45M] 19-11 重点接口监控实现 ├── [ 14M] 19-12 标签平台前端集成 └── [ 16M] 19-13 课程小结 └── 资料代码/
