
会员
数据自助服务实践指南:数据开放与洞察提效
更新时间:2022-05-20 19:19:20 最新章节:19.5 总结
书籍简介
本书主要介绍数据洞察及其四个阶段,第1部分为自助服务数据发现,包括元数据目录服务、搜索服务、特征存储服务、数据迁移服务、点击流跟踪服务。第二部分为自助服务数据准备包括数据湖管理服务、数据整理服务、数据权限治理服务。第三部分为自助服务数据构建,包括、数据虚拟化服务、模型训练服务、持续集成服务、A/B测试服务。第四部分为自助服务数据实施,包括查询优化服务、管道编排服务、模型部署服务、质量监控服务、成本管理服务。通过学习本书,数据工程师、数据科学家和团队经理将学习如何构建一个自助数据科学平台,帮助你的组织中的任何人从数据中提取见解。
品牌:机械工业出版社
译者:吴瑞诚 熊畅 王晓倩
上架时间:2022-04-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
(美)桑迪普·乌坦坎达尼
最新上架
- 会员本书瞄准当前高校MySQL数据库教学与实验的需求,在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础,内容包含:数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验,所编排的各个实验与第一篇中的各章(除第10、11章外)内容相对应,计算机12万字
- 会员本书共5篇,分为14章介绍了PowerBI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇(第1-3章),主要针对初学者,从零开始,系统且全面地讲解了PowerBI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇(第4-6章),介绍了PowerBI数据的整理操作、表格中行/列数据的管理,以及PowerBI数据的高级处理、M函数的使计算机0字
- 会员本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预计算机13.6万字
- 会员本书从与数据要素关系最密切的信息、权属、价值、安全、交易等五个维度出发,汇聚不同学科背景的既有文献,整合现有观点,对数据要素的多维特性进行探讨,以丰富人们对数据要素的认知,凝聚共识,澄清数字时代的发展与治理迷思,为未来的相关创新提供起点。计算机14.5万字
- 会员这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。计算机14万字
- 会员本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例,深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章,第1章介绍了ETL概念和ETL工具,让读者在了解ETL相关的概念后,立刻上手ETL工具Kettle;第2~6章介绍了Kettle工具转换相关的组件,包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容,内容与ETL流程匹配,能帮助读者快速掌握ETL计算机8.1万字
- 会员《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块:第一模块是基础理论,包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容,旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块,包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导,而是更为关注网络科学的思维习惯和研究方式,兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员计算机0字
同类书籍最近更新
- 会员本书以《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》为背景,旨在从概念和技术的角度对数据隐私与数据治理进行系统概述。首篇从历史与系统的角度介绍数据隐私与数据治理的基础,后三篇分别侧重大规模数据收集、机器学习,以及数据治理中的隐私问题,介绍其相应的技术基础,总结当下的关键问题与技术方案。本书从全新的数据生态的角度介绍数据隐私与数据治理,在内容介绍上,以技术与算法的讲解为主,数据库12.6万字
- 会员随着医学研究和信息技术的快速发展,多元数据分析方法广泛应用于医学各个领域。R是一款优秀的开源软件,有着实用的统计计算与可视化功能。本书使用R语言,结合精选的医学实例介绍常用多元统计分析方法。统计分析方法只有在实际应用中才能得到直接、生动的验证。本书强调实战和应用,尽量淡化统计公式的推导和计算过程。通过本书的学习,读者能熟练使用R语言及相关包实现多元统计计算,还能更深入地理解多元数据分析方法。本书可数据库7.4万字
- 会员本书不仅是一本业务数智化体系的科普书,还是作者多年在真实业务场景下进行数智化实践的经验总结。本书系统总结了一套完整的数智化解决方案——3M数智化体系。全书共包括11章,第1~3章主要对数字化和数智化进行介绍;第4~8章围绕3M数智化体系展开,详细说明了业务数智化的适用范围和准备工作、整体构思、思想、落地方法和落地产品;第9~11章介绍了内容行业、O2O行业、生产制造业的数智化实践,以案例形式进行实数据库18.5万字
- 会员本书基于流行稳定版Flink1.13进行讲解,从Flink数据处理思想开始讲起,带领读者深入理解Flink的基本架构,进而由浅入深结合具体案例进行讲解,详细剖析了Flink中DataStreamAPI的使用,并对Flink中的时间语义、状态、容错机制等重要概念进行了详尽的阐释。同时,本书还对实际开发常用的FlinkSQL、CEP等高层级API进行了细致讲解,以电商网站中的实际应用为场景,提供数据库19.9万字
- 会员本书是一本全面介绍数据库管理的书籍。基础介绍篇介绍了数据库、SQL、MySQL以及数据类型等概念,并介绍了MySQL的安装和查询;实践入门篇详细介绍了数据库的创建、查询、插入、修改和删除等语句的使用方法;中高级篇深入介绍了MySQL关键字、运算操作、日期函数、视图、操作符等,同时介绍了如何对数据库文件进行备份和恢复;应用实战篇以核酸数据库系统为例,介绍业务流程、系统流程、分布式系统、Redis、核数据库3.5万字
- 会员本书对统称为NoSQL的分布式非关系数据库的原理和使用方法进行介绍。第1章,首先介绍NoSQL的起源背景和设计理念,以及相关技术概念。然后介绍大数据技术体系,以及NoSQL在云计算和容器化趋势下的发展。第2章,首先回顾关系型数据库的主要机制,然后介绍NoSQL数据库的常见技术原理,以及NoSQL的常见数据模型等。第3章,对MongoDB进行介绍,重点介绍基本使用方法和编程方法。第4章,对Mongo数据库16万字