![深度强化学习实践(原书第2版)在线阅读](https://wfqqreader-1252317822.image.myqcloud.com/cover/297/40216297/b_40216297.jpg)
会员
深度强化学习实践(原书第2版)
更新时间:2021-08-18 17:40:31 最新章节:25.7 总结
书籍简介
本书的主题是强化学习(ReinforcementLearning,RL),它是机器学习(MachineLearning,ML)的一个分支,强调如何解决在复杂环境中选择最优动作时产生的通用且极具挑战的问题。学习过程仅由奖励值和从环境中获得的观察驱动。该模型非常通用,能应用于多个真实场景,从玩游戏到优化复杂制造过程都能涵盖。
品牌:机械工业出版社
译者:林然 王薇
上架时间:2021-07-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
(俄)马克西姆·拉潘
同类热门书
最新上架
- 会员本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用计算机8.1万字
- 会员《洞察AIGC:智能创作的应用、机遇与挑战》内容分为3篇:第1篇AIGC的蜕变讲述AIGC的发展历史及其背后的智能;第2篇AIGC的应用讲述AIGC在文学创作、日常办公、知识管理、科研出版、工业制造、健康医疗、金融服务、品牌营销领域的应用现状及常用工具;第3篇AIGC的机遇与挑战讲述AIGC的资本与技术前景,同时提出需要注意的风险。计算机13.9万字
- 会员本书旨在帮助读者全面理解知识图谱的基本原理和概念。通过清晰的解释和实例,读者将深入了解知识图谱的构建、表示、推理等关键知识点。此外,本书通过提供代码实战,引导读者亲自动手构建知识图谱,并应用各种技术和工具进行实践。这种实践性的讲解方法可帮助读者更深入地理解知识图谱的实际应用。本书的目标是帮助读者全面理解知识图谱的基本原理和概念,并通过代码实战构建知识图谱。同时,本书也提供了关于大语言模型与知识图谱计算机9.6万字
- 会员增长是企业利用计算机、大数据、人工智能等新技术实现经营增长的新思路和新方法,本书作为该领域的入门级读物,介绍了AIGC在增长领域的技术和实战应用。本书分为4部分,第1部分、第2部分、第4部分主要针对有兴趣了解AIGC背后技术原理、增长模式的变化以及截至2023年3月业界、学术界的最新技术进展的读者;第3部分包含AI的基础知识、基础模型,并从实战应用角度介绍作为应用开发者如何高效上手与利用最新的开源计算机21.9万字
- 会员本书是一本全面介绍机器学习方法特别是算法的新书,适合初学者和有一定基础的读者。机器学习可以分成三大类别,监督式学习、非监督式学习和强化学习。三大类别背后的算法也各有不同。监督式学习使用了数学分析中函数逼近方法、概率统计中的极大似然方法。非监督式学习使用了聚类和贝叶斯算法。强化学习使用了马尔可夫决策过程算法。机器学习背后的数学部分来自概率、统计、数学分析以及线性代数等领域。虽然用到的数学较多,但是最计算机7.4万字
- 会员本书兼顾机器学习基础、经典方法和深度学习方法,对组成机器学习的基础知识和基本算法进行了比较细致的介绍,对广泛应用的经典算法如线性回归、逻辑回归、朴素贝叶斯、支持向量机、决策树和集成学习等算法都给出了深入的分析并讨论了无监督学习的基本方法,对深度学习和强化学习进行了全面的叙述,比较深入地讨论了反向传播算法、多层感知机、CNN、RNN和LSTM等深度神经网络的核心知识和结构;对于强化学习,不仅介绍了经计算机20.6万字
- 会员人工智能(AI),尤其是生成式语言模型和生成式人工智能(AIGC)模型,正以惊人的速度改变着我们的世界。驾驭这股潮流的关键,莫过于探究自然语言处理(NLP)技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅,让其亲身感受,并动手搭建语言模型。本书主要内容包括N-Gram,词袋模型(BoW),Word2Vec(W2V),神经概率语言模型(NPLM),循环神经网络(RNN),Seq2Seq(S2计算机14万字