模拟|Jupyter笔记本实现，慕尼黑工大220页免费书籍介绍基于物理的深度学习( 三 )_Burgers|深度|Jupyter|书

接下来，本章展示了如何让神经网络解决棘手的逆问题，即 Navier-Stokes 模拟的长期控制问题，遵循 Holl 等人研究。这项任务需要长期规划，因此需要两个网络，一个用于预测演变过程，另一个用于实现预期目标。
粗糙和参考流形的视觉概述

文章图片

强化学习
本章主要分两个小节：强化学习概述、用强化学习控制伯格斯方程（Burgers equation）。
深度强化学习（DRL）是深度学习领域中的一类方法，它可以让人工智能体与周围环境进行交互。在执行此操作过程中，智能体接收其行为奖励信号，并尝试辨别哪些行为有助于获得更高的奖励，从而相应地调整自身行为。强化学习在围棋等游戏方面非常成功，并且在机器人技术等工程应用方面也非常重要。
RL 的设置通常由两部分组成：环境和智能体。环境从智能体接收动作 a ，同时以状态 s 的形式向 a 提供观察，并奖励 r 。观察结果代表了智能体能够感知来自各个环境状态的信息的一部分。奖励是由预定义的函数提供的，通常是根据环境量身定制的，可能包括游戏分数、错误行为的惩罚或成功完成任务的奖励。
强化学习、环境与智能体相互影响

文章图片

本小节将 Burgers 方程的逆问题作为强化学习 (RL) 的实验平台。该设置类似于针对可微物理 (DP) 训练的逆问题。与之前类似， Burgers 方程简单但非线性，具有有趣的动力学，因此是 RL 实验的良好起点。本小节目标是训练一个控制力估计器网络，该网络应该预测在两个给定状态之间产生平滑过渡所需的力。
可微物理方法似乎比 RL 智能体产生更少的噪声轨迹，而两者都设法近似真值

文章图片

PBDL 和不确定性
本章主要分两个小节：后验推理介绍、RANS Airfoil Flows 与贝叶斯神经网络。
所有的测量、模型和离散化，都有其不确定性。对于测量，通常以测量误差的形式出现。另一方面，模型方程通常只包含我们感兴趣的一部分（剩余部分是不确定性的），而对于数值模拟，则引入了离散化误差。所以这里要问的一个非常重要的问题是，我们如何才能确保我们得到的答案是正确的。从统计学家的角度来看，后验概率分布捕获了我们对模型或数据可能存在不确定性的一些信息。
书籍完整目录如下：

模拟|Jupyter笔记本实现，慕尼黑工大220页免费书籍介绍基于物理的深度学习( 三 )

推荐阅读

如何找寻自我

缝纫机调线器怎么安装平车方法如何

强组词强字组词

火笋鸡翅的做法（增肥食谱）

闺女生日快乐祝福语朋友圈

LV请来潮牌设计师做艺术总监，看中的是啥

老虎豆怎么做好吃老虎豆图片怎样弄来吃

暖气有流水声是什么原因

皮球是什么体

手机怎样开通QQ空间

男生发mua说明 mua是什么意思

手指盖凹陷怎么回事

对自己的生活失去掌控咋调整

小米10s怎么没有月亮模式

我想找个偏僻的地方搞养殖！有没有推荐的地方？

南京养老金认证上门服务怎么申请南京市养老金认证

如何评价猪场阉割猪？

最后一个字是豹的成语

泰山散酒怎么样

猫发情的声音(猫发情的叫声)