基于 JAX 构建#

学习高级 JAX 用法的一个好方法是了解其他库如何使用 JAX,包括它们如何将该库集成到其 API 中、它在数学上添加了哪些功能以及它如何在其他库中用于计算加速。

以下是一些示例,说明如何使用 JAX 的功能来定义跨多个领域和软件包的加速计算。

梯度计算#

简易的梯度计算是 JAX 的一个关键特性。在 JaxOpt 库中,值和梯度直接被用户用于多个优化算法,具体可参考其源代码

类似地,上面提到的 Dynamax Optax 配对也是一个例子,说明了梯度如何使得过去具有挑战性的估计方法成为可能,例如使用 Optax 的最大似然期望

在多个设备上单核计算加速#

在 JAX 中定义的模型可以通过 JIT 编译实现单次计算加速。然后,相同的编译代码可以发送到 CPU 设备、GPU 或 TPU 设备以获得额外的加速,通常不需要额外的更改。这允许从开发到生产的流畅工作流程。在 Dynamax 中,线性状态空间模型求解器的计算密集部分已经被 jitted。一个更复杂的例子来自 PyTensor,它动态编译一个 JAX 函数,然后jit 构建的函数

使用并行化的单机和多机加速#

JAX 的另一个优点是使用 pmapvmap 函数调用或装饰器轻松并行化计算。在 Dynamax 中,状态空间模型使用 VMAP 装饰器进行并行化,一个实际的用例是多目标跟踪。

将 JAX 代码集成到您或您用户的工作流程中#

JAX 具有很强的可组合性,可以多种方式使用。JAX 可以与独立模式一起使用,用户可以在其中定义所有计算。但是,也可以使用其他模式,例如使用基于 JAX 构建的库来提供特定功能。这些可以是定义特定类型模型的库,例如神经网络或状态空间模型或其他模型,或者提供特定功能的库,例如优化。以下是每个模式的更具体示例。

直接使用#

可以直接导入和使用 JAX 来“从头开始”构建模型,如本网站所示,例如在JAX 教程使用 JAX 的神经网络中。如果您找不到针对特定挑战的预构建代码,或者如果您希望减少代码库中的依赖项数量,这可能是最佳选择。

可组合的特定领域库,暴露了 JAX#

另一种常见方法是提供预构建功能的包,无论是模型定义还是某种类型的计算。然后,这些包的组合可以混合搭配,以实现完整的端到端工作流程,其中定义模型并估计其参数。

一个例子是 Flax,它简化了神经网络的构建。Flax 通常与 Optax 配对使用,其中 Flax 定义了神经网络架构,Optax 提供了优化和模型拟合功能。

另一个是 Dynamax,它可以轻松定义状态空间模型。使用 Dynamax,可以使用使用 Optax 的最大似然法估计参数,或者使用来自 Blackjax 的 MCMC估计完整的贝叶斯后验。

JAX 完全对用户隐藏#

其他库选择在其特定于模型的 API 中完全包装 JAX。一个例子是 PyMC 和 Pytensor,其中用户可能永远不会直接“看到”JAX,而是使用 PyMC 特定的 API 包装JAX 函数