jax.ops.segment_sum#
- jax.ops.segment_sum(data, segment_ids, num_segments=None, indices_are_sorted=False, unique_indices=False, bucket_size=None, mode=None)[源代码]#
计算数组各段内的总和。
类似于 TensorFlow 的 segment_sum
- 参数:
data (ArrayLike) – 包含要被求和的值的数组。
segment_ids (ArrayLike) – 一个整数数据类型的数组,指示要被求和的 data 的段(沿其引导轴)。值可以重复,并且不需要排序。
num_segments (int | None | None) – 可选,一个非负整数值,表示段的数量。默认值设置为支持
segment_ids
中所有索引的最小段数,计算为max(segment_ids) + 1
。 由于 num_segments 决定输出的大小,因此必须提供静态值才能在 JIT 编译的函数中使用segment_sum
。indices_are_sorted (bool) – 是否已知
segment_ids
已排序。unique_indices (bool) – 是否已知 segment_ids 没有重复项。
bucket_size (int | None | None) – 将索引分组到的桶的大小。
segment_sum
在每个桶上单独执行,以提高加法的数值稳定性。默认值None
表示不进行分桶。mode (lax.GatherScatterMode | None | None) – 一个
jax.lax.GatherScatterMode
值,描述应如何处理超出范围的索引。默认情况下,范围 [0, num_segments) 之外的值将被删除,并且不参与求和。
- 返回值:
一个形状为
(num_segments,) + data.shape[1:]
的数组,表示段总和。- 返回类型:
示例
简单的 1D 段求和
>>> data = jnp.arange(5) >>> segment_ids = jnp.array([0, 0, 1, 1, 2]) >>> segment_sum(data, segment_ids) Array([1, 5, 4], dtype=int32)
使用 JIT 需要静态的 num_segments
>>> from jax import jit >>> jit(segment_sum, static_argnums=2)(data, segment_ids, 3) Array([1, 5, 4], dtype=int32)