强化学习:原理与Python实现在线阅读
会员

强化学习:原理与Python实现

肖智清
开会员,本书免费读 >

计算机网络编程语言与程序设计12.2万字

更新时间:2019-10-11 15:10:40 最新章节:12.3 本章小结

立即阅读
加书架
下载
听书

书籍简介

全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强化学习算法,结合TensorFlow实现源码。第三部分介绍强化学习综合应用案例。
品牌:机械工业出版社
上架时间:2019-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理
    肖智清人工智能17.2万字

同类热门书

最新上架

  • 会员
    本书是一本致力于Web开发技术的实战指南。本书紧跟行业的最新发展趋势,全面而深入地阐述了SpringBoot3和Vue3在企业级应用开发中的集成与应用。全书共分为8章,从SpringBoot3的基础入门到Vue3的高级应用,再到前后端通信、测试与部署,每一章的内容都经过精心设计,以确保读者能够掌握关键的技能。第8章特别提供了一个综合案例,展示如何综合运用全书知识来构建一套完整的应用系统
    刘伟编著计算机14万字
  • 会员
    全书分为3篇。第1篇介绍编译器基础知识,包括中间表示,重点介绍SSA、数据流分析、支配、循环等知识,此外还介绍了LLVM的后端描述语言TableGen。第二篇剖析分LLVM代码生成,其中对代码生成的每一步骤都有提及,着重介绍指令选择、指令调度、寄存器分配和编译优化。同时还以BPF后端为例总结了如何基于LLVM开发一款新后端的编译器。第三篇附录主要总结了LLVM代码生成过程中使用的IR、BPF指令集
    彭成寒 李灵 戴贤泽 王志磊 俞佳嘉计算机22.5万字
  • 会员
    本书以PySide6/PyQt6的实际应用为主线,以理论基础为核心,引导读者渐进式学习PySide6/PyQt6的编程基础和实际应用。本书共12章,可分为5部分。第一部分介绍基于项的控件、基于模型/视图的控件(第1章和第2章),第二部分介绍处理数据库、文件、路径、缓存相关的类和应用方法(第3章和第4章)、第三部分介绍使用Graphics/View框架绘图、绘制二维图表和三维图表的相关类和应用方法(
    邢世通编著计算机5.9万字
  • 会员
    本书提供了关于适应度函数、自动化架构治理和演进式数据的技术、知识和技巧。本书分为三个部分:第一部分包括定义演进式架构机制的章节——介绍团队如何使用技术和工具来构建适应度函数、部署管道以及其他管理和演进软件项目的机制;第二部分包括围绕耦合、复用和其他相关结构考虑因素的架构风格和设计原则,以帮助读者实现清晰的长期演进;第三部分探讨了第一部分中介绍的工程实践与第二部分中的结构考虑因素的交叉点。
    (美)尼尔·福特 (美)丽贝卡·帕森斯 (英)帕特里克·夸 (美)普拉莫德·萨达拉奇计算机12.8万字
  • 会员
    《TypeScript+Vue.js前端开发从入门到精通》以一个一线前端架构师的视角,深入浅出地介绍TypeScript与Vue.js整合开发大型前端应用的全部技术细节。全书共17个章节,主要内容包括TypeScript基础、面向对象编程、Vue中的模板、组件属性和方法、用户交互处理、组件基础与进阶、Vue响应性编程、动画技术、脚手架VueCLI和Vite工具的使用、ElementPlusUI
    张益珲编著计算机13.1万字
  • 会员
    本书跟随了Node.js的标准与行业的发展趋势,在介绍新标准与新技术的同时兼顾了理论基础和实际应用,主要内容分为基础和应用两部分,基础部分内容包含了Node.js环境配置,npm项目管理,JavaScript语法基础,Node.js基本模块的原理与使用,异步代码的编写与组织,应用部分包含了网络编程,桌面应用开发以及测试和调试。本书讲解与示例并重,由浅入深地剖析了Node.js模块与语言原理,并通过
    李锴编著计算机10.9万字
  • 会员
    《C语言王者归来》详细讲解了C语言的相关知识,从基本概念开始,逐步讲解程序流程控制、循环、字符串、指针、函数、结构、文件输入与输出,以及完整的大型项目设计。同时本书还进一步讲解了数据结构的基础知识,如串行、堆栈、队列与二叉树,奠定读者未来学习算法的基础。本书最后一章则是介绍C++与C语言的差异,由此可以帮助读者学习面向对象的程序开发方法。
    洪锦魁计算机14.3万字
  • 会员
    这是一本全面讲解RAG技术原理、实战应用与系统构建的著作。作者结合自身丰富的实战经验,详细阐述了RAG的基础原理、核心组件、优缺点以及使用场景,同时探讨了RAG在大模型应用开发中的变革与潜力。书中不仅揭示了RAG技术背后的数学原理,还通过丰富的案例与代码实现,引导读者从理论走向实践,轻松掌握RAG系统的构建与优化。无论你是深度学习初学者,还是希望提升RAG应用技能的开发者,本书都将为你提供宝贵的参
    汪鹏 谷清水 卞龙鹏计算机8.4万字
  • 会员
    《剑指JVM:虚拟机实践与性能调优》共分5篇:引言篇讲述了Java与Java虚拟机的关系,以及Java虚拟机的相关知识;第1篇讲述了运行时数据区,涉及Java内存区域的各个核心结构,以及对象创建的各种细节;第2篇讲述了垃圾收集,涉及各种收集算法、垃圾收集器;第3篇讲述了字节码与类的加载;第4篇讲述了性能监控与调优,带领读者学习Java虚拟机常用的监控与调优工具,并附有企业级的性能调优案例。
    尚硅谷教育计算机23万字