jax.numpy.histogram_bin_edges

jax.numpy.histogram_bin_edges#

jax.numpy.histogram_bin_edges(a, bins=10, range=None, weights=None)[source]#

计算 histogram 函数使用的区间边界的函数

LAX 后端实现的 numpy.histogram_bin_edges()

原始文档字符串如下。

函数。

参数:
  • a (array_like) – 输入数据。直方图是在展平后的数组上计算的。

  • bins (int序列标量str, 可选) –

    如果 bins 是一个整数,它定义了给定范围内等宽区间的数量(默认为 10)。如果 bins 是一个序列,它定义了区间边界,包括最右边的边界,允许非均匀的区间宽度。

    如果`bins` 是以下列表中的字符串,`histogram_bin_edges` 将使用所选方法计算最佳 bin 宽度,并据此计算 bin 的数量(有关估计器的更多详细信息,请参阅“注释”部分)。虽然 bin 宽度将针对范围内的数据进行优化,但 bin 的数量将计算为填充整个范围,包括空的部分。对于可视化,建议使用“auto”选项。自动 bin 大小选择不支持加权数据。

    ’auto’

    “sturges”和“fd”估计器之间的最小 bin 宽度。提供良好的全方位性能。

    ’fd’(Freedman Diaconis 估计器)

    稳健(对异常值有弹性)的估计器,考虑了数据变异性和数据大小。

    ’doane’

    Sturges 估计器的改进版本,在非正态数据集上效果更好。

    ’scott’

    不太稳健的估计器,考虑了数据变异性和数据大小。

    ’stone’

    基于留一法交叉验证对积分平方误差的估计的估计器。可以看作是 Scott 规则的推广。

    ’rice’

    估计器不考虑变异性,只考虑数据大小。通常会高估所需的 bin 数量。

    ’sturges’

    R 的默认方法,只考虑数据大小。仅对高斯数据最优,并且对于大型非高斯数据集会低估 bin 的数量。

    ’sqrt’

    平方根(数据大小)估计器,Excel 和其他程序因其速度和简单性而使用。

  • range(float, float), 可选) – bin 的下限和上限。如果未提供,则范围只是(a.min(), a.max())。范围之外的值将被忽略。范围的第一个元素必须小于或等于第二个。`range` 也影响自动 bin 计算。虽然 bin 宽度是根据`range`内实际数据的最佳值计算的,但 bin 计数将填充整个范围,包括不包含数据的部分。

  • weightsarray_like, 可选) – 与`a`形状相同的权重数组。`a`中的每个值仅对 bin 计数贡献其关联的权重(而不是 1)。目前任何 bin 估计器都没有使用此功能,但将来可能会使用。

返回值:

bin_edges – 传递给`histogram`的边缘

返回类型:

dtype 为 float 的数组