jax.lax.conv_general_dilated_patches

jax.lax.conv_general_dilated_patches#

jax.lax.conv_general_dilated_patches(lhs, filter_shape, window_strides, padding, lhs_dilation=None, rhs_dilation=None, dimension_numbers=None, precision=None, preferred_element_type=None)[源代码]#

提取受 conv_general_dilated 的感受野约束的补丁。

使用给定的参数通过卷积运行输入。卷积的内核被构造为使得输出通道维度 “C” 包含展平的图像补丁，因此单个 “C” 维度表示，例如，三个维度 “chw” 被折叠。这些维度的顺序是 “c” + ‘’.join(c for c in rhs_spec if c not in ‘OI’)，其中 rhs_spec == dimension_numbers[1]，因此这个 “C” 维度的大小是每个补丁的大小，即 np.prod(filter_shape) * lhs.shape[lhs_spec.index(‘C’)]，其中 lhs_spec == dimension_numbers[0]。

以下文档字符串改编自 jax.lax.conv_general_dilated。

另请参阅

https://tensorflowcn.cn/xla/operation_semantics#conv_convolution

参数:

lhs (ArrayLike) – 一个秩为 n+2 的输入数组。
filter_shape (Sequence[int]) – 一个包含 n 个整数的序列，表示感受野的空间形状，其顺序由 rhs_spec = dimension_numbers[1] 指定。
window_strides (Sequence[int]) – 一个包含 n 个整数的序列，表示窗口之间的步长。
padding (str | Sequence[tuple[int, int]]) – 可以是字符串 ‘SAME’、字符串 ‘VALID’，或一个包含 n 个 (low, high) 整数对的序列，表示在每个空间维度之前和之后应用的填充。
lhs_dilation (Sequence[int] | None | None) – None，或一个包含 n 个整数的序列，表示在 lhs 的每个空间维度中应用的膨胀因子。LHS 膨胀也称为转置卷积。
rhs_dilation (Sequence[int] | None | None) – None，或一个包含 n 个整数的序列，表示在 rhs 的每个空间维度中应用的膨胀因子。RHS 膨胀也称为空洞卷积。
dimension_numbers (convolution.ConvGeneralDilatedDimensionNumbers | None | None) – 可以是 None，或一个 3 元组 (lhs_spec, rhs_spec, out_spec)，其中每个元素都是一个长度为 n+2 的字符串。None 默认值为 (“NCHWD…”, “OIHWD…”, “NCHWD…”)。
precision (lax.Precision | None | None) – 可选。可以是 None，表示后端的默认精度，也可以是 Precision 枚举值（Precision.DEFAULT、Precision.HIGH 或 Precision.HIGHEST）。
preferred_element_type (DType | None | None) – 可选。可以是 None，表示输入类型的默认累积类型，也可以是数据类型，表示将结果累积到该数据类型并返回该数据类型的结果。

返回值:

一个秩为 n+2 的数组，包含输出通道 (“C”) 维度中展平的图像块。例如，如果 dimension_numbers = (“NcHW”, “OIwh”, “CNHW”)，则输出的维度数为 “CNHW” = “{cwh}NHW”，其中维度 “C” 的大小等于每个块的大小 (np.prod(filter_shape) * lhs.shape[lhs_spec.index(‘C’)])。

返回类型:

Array

jax.lax.conv_general_dilated_patches

目录

jax.lax.conv_general_dilated_patches#