JAX 调试标志#

JAX 提供了标志和上下文管理器,可以更轻松地捕获错误。

jax_debug_nans 配置选项和上下文管理器#

摘要:启用 jax_debug_nans 标志以自动检测在 jax.jit 编译的代码中何时产生 NaN(但不在 jax.pmapjax.pjit 编译的代码中)。

jax_debug_nans 是一个 JAX 标志,当启用时,会在检测到 NaN 时自动引发错误。它对 JIT 编译有特殊处理 - 当从 JIT 编译的函数中检测到 NaN 输出时,该函数会立即重新运行(即不进行编译),并在生成 NaN 的特定原语处抛出错误。

用法#

如果你想追踪函数或梯度中出现 NaN 的位置,可以通过以下方式启用 NaN 检查器:

  • 设置 JAX_DEBUG_NANS=True 环境变量;

  • 在主文件顶部附近添加 jax.config.update("jax_debug_nans", True)

  • 在主文件中添加 jax.config.parse_flags_with_absl(),然后使用类似 --jax_debug_nans=True 的命令行标志设置选项;

示例#

import jax
jax.config.update("jax_debug_nans", True)

def f(x, y):
  return x / y
jax.jit(f)(0., 0.)  # ==> raises FloatingPointError exception!

jax_debug_nans 的优点和局限性#

优点#
  • 易于应用

  • 精确检测 NaN 的生成位置

  • 抛出标准的 Python 异常,并与 PDB 事后调试兼容

局限性#
  • jax.pmapjax.pjit 不兼容

  • 立即重新运行函数可能会很慢

  • 对误报(例如,有意创建的 NaN)报错

jax_disable_jit 配置选项和上下文管理器#

总结: 启用 jax_disable_jit 标志以禁用 JIT 编译,从而可以使用传统的 Python 调试工具,如 printpdb

jax_disable_jit 是一个 JAX 标志,当启用时,会禁用 JAX 中的 JIT 编译(包括控制流函数,如 jax.lax.condjax.lax.scan)。

用法#

你可以通过以下方式禁用 JIT 编译:

  • 设置 JAX_DISABLE_JIT=True 环境变量;

  • 在主文件顶部附近添加 jax.config.update("jax_disable_jit", True)

  • 在主文件中添加 jax.config.parse_flags_with_absl(),然后使用类似 --jax_disable_jit=True 的命令行标志设置选项;

示例#

import jax
jax.config.update("jax_disable_jit", True)

def f(x):
  y = jnp.log(x)
  if jnp.isnan(y):
    breakpoint()
  return y
jax.jit(f)(-2.)  # ==> Enters PDB breakpoint!

jax_disable_jit 的优点和局限性#

优点#
  • 易于应用

  • 可以使用 Python 的内置 breakpointprint

  • 抛出标准的 Python 异常,并与 PDB 事后调试兼容

局限性#
  • jax.pmapjax.pjit 不兼容

  • 不进行 JIT 编译运行函数可能会很慢