会员
强化学习:原理与Python实战
肖智清更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
肖智清
主页
同类热门书
最新上架
- 会员
大型语言模型实战指南:应用实践与场景落地
这是一本系统梳理并深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法的著作,也是一本能手把手教你构建角色扮演、信息抽取、知识问答、AIAgent等各种强大的应用程序的著作。本书得到了零一万物、面壁智能、通义千问、百姓AI、澜舟科技等国内主流大模型团队的负责人的高度评价和鼎力推荐。具体地,通过本书你能了解或掌握以下知识:(1)大型语言模型的基础理论,包括常见的模型架构、领计算机11.2万字 - 会员
智能控制与强化学习:先进值迭代评判设计
在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次计算机8.7万字 - 会员
人工智能新时代:核心技术与行业赋能
本书以人工智能为核心,上篇讲述了人工智能理论知识及发展蓝图规划,目的是帮助读者认识人工智能,找到入局人工智能领域的途径和方法;中篇罗列了可以为人工智能赋能的前沿技术,包括NLP、机器学习、大数据、物联网、区块链等;下篇总结了人工智能对交通、农业、医疗、制造、教育、金融、文娱等行业的影响和作用,旨在让读者了解人工智能是如何在这些行业实现商业化落地的。本书从多个角度出发,描绘了一幅完整的人工智能发展蓝计算机15.8万字 - 会员
破解深度学习(基础篇):模型算法与实现
本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的基础知识。本书总计9章,深入浅出地介绍了深度学习的理论与算法基础,从理论到实战全方位展开。前三章旨在帮助读者快速入门,介绍了必要的数学概念和必备工具的用法。后六章沿着深度学习的发展脉络,从最简单的多层感知机开始,讲解了深度神经网络的基本原理、常见挑战、优化算法,以及三大典型模型(基础卷积神经网络、基础循环神经网络和注意力神计算机14.8万字 - 会员
深度学习与计算机视觉:项目式教材
本书基于国产自主可控龙芯处理器,系统地介绍计算机视觉领域的基本理论与实践,并结合当前主流的深度学习框架和龙芯平台以项目式教学的形式讲述任务的实施。本书主要包括OpenCV基础功能实战、深度学习框架的部署、计算机视觉技术基础知识、图像分类网络的部署、目标检测网络的部署、图像分割网络的部署、龙芯智能计算平台模型的训练和龙芯智能计算平台的推理部署等内容。通过阅读本书,读者能够了解和掌握深度学习在计算机视计算机10万字 - 会员
一本书读懂大模型:技术创新、商业应用与产业变革
这是一本人人都能读懂的大模型综合指南,既是一本大模型的科普书,又是一本大模型的商业书。由中国电信研究院天翼智库官方出版,从核心技术、基础设施、商业应用、产业体系、安全治理5个维度全面讲解了大模型。语言上通俗易懂,内容上深入浅出,呈现上图文并茂,给读者良好阅读体验的同时,让读者对大模型的理解事半功倍!无论你是AI工程师,还是完全没有IT技术背景的爱好者;无论你是一线的从业人员,还是企业的管理者和决策计算机13.2万字 - 会员
AI帮你赢:人人都能用的AI方法论
本书强调“把AI作为方法”(AI即ArtifcialIntelligence,人工智能)这一核心理念,旨在引导读者掌握与AI对话的关键技巧,并将AI融入工作和生活真正体验AI带给人类的高效与便捷。本书从技术的发展规律人手,探讨了把AI作为方法的必然性和必要性,进一步剖析了算法与哲学在内在逻辑上的贯通性。此外,本书通过丰富多样的案例展示了AI的强大魅力,通过一系列“召唤术”帮助读者运用AI创造性地计算机9.7万字 - 会员
洞察AIGC:智能创作的应用、机遇与挑战
《洞察AIGC:智能创作的应用、机遇与挑战》内容分为3篇:第1篇AIGC的蜕变讲述AIGC的发展历史及其背后的智能;第2篇AIGC的应用讲述AIGC在文学创作、日常办公、知识管理、科研出版、工业制造、健康医疗、金融服务、品牌营销领域的应用现状及常用工具;第3篇AIGC的机遇与挑战讲述AIGC的资本与技术前景,同时提出需要注意的风险。计算机13.9万字 - 会员
奇点到来:AIGC引爆增长新范式
增长是企业利用计算机、大数据、人工智能等新技术实现经营增长的新思路和新方法,本书作为该领域的入门级读物,介绍了AIGC在增长领域的技术和实战应用。本书分为4部分,第1部分、第2部分、第4部分主要针对有兴趣了解AIGC背后技术原理、增长模式的变化以及截至2023年3月业界、学术界的最新技术进展的读者;第3部分包含AI的基础知识、基础模型,并从实战应用角度介绍作为应用开发者如何高效上手与利用最新的开源计算机21.9万字
同类书籍最近更新
- 会员
大模型实战:微调、优化与私有化部署
本书深入浅出地介绍了现代大型人工智能(ArtificialIntelligence,AI)模型技术,从对话机器人的发展历程和人工智能的理念出发,详细阐述了大模型私有化部署过程,深入剖析了Transformer架构,旨在帮助读者领悟大模型的核心原理和技术细节。本书的讲解风格独树一帜,将深奥的技术术语转化为简洁明了的语言,案例叙述既严谨又充满趣味,让读者在轻松愉快的阅读体验中自然而然地吸收和理解AI人工智能15.8万字 - 会员
基于信息增强的图神经网络学习方法研究
本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用人工智能8.1万字