jax.numpy.histogram_bin_edges#
- jax.numpy.histogram_bin_edges(a, bins=10, range=None, weights=None)[source]#
计算 histogram 函数使用的区间边界的函数
LAX 后端实现的
numpy.histogram_bin_edges()
。原始文档字符串如下。
函数。
- 参数:
a (array_like) – 输入数据。直方图是在展平后的数组上计算的。
bins (int 或 序列 的 标量 或 str, 可选) –
如果 bins 是一个整数,它定义了给定范围内等宽区间的数量(默认为 10)。如果 bins 是一个序列,它定义了区间边界,包括最右边的边界,允许非均匀的区间宽度。
如果`bins` 是以下列表中的字符串,`histogram_bin_edges` 将使用所选方法计算最佳 bin 宽度,并据此计算 bin 的数量(有关估计器的更多详细信息,请参阅“注释”部分)。虽然 bin 宽度将针对范围内的数据进行优化,但 bin 的数量将计算为填充整个范围,包括空的部分。对于可视化,建议使用“auto”选项。自动 bin 大小选择不支持加权数据。
- ’auto’
“sturges”和“fd”估计器之间的最小 bin 宽度。提供良好的全方位性能。
- ’fd’(Freedman Diaconis 估计器)
稳健(对异常值有弹性)的估计器,考虑了数据变异性和数据大小。
- ’doane’
Sturges 估计器的改进版本,在非正态数据集上效果更好。
- ’scott’
不太稳健的估计器,考虑了数据变异性和数据大小。
- ’stone’
基于留一法交叉验证对积分平方误差的估计的估计器。可以看作是 Scott 规则的推广。
- ’rice’
估计器不考虑变异性,只考虑数据大小。通常会高估所需的 bin 数量。
- ’sturges’
R 的默认方法,只考虑数据大小。仅对高斯数据最优,并且对于大型非高斯数据集会低估 bin 的数量。
- ’sqrt’
平方根(数据大小)估计器,Excel 和其他程序因其速度和简单性而使用。
range((float, float), 可选) – bin 的下限和上限。如果未提供,则范围只是
(a.min(), a.max())
。范围之外的值将被忽略。范围的第一个元素必须小于或等于第二个。`range` 也影响自动 bin 计算。虽然 bin 宽度是根据`range`内实际数据的最佳值计算的,但 bin 计数将填充整个范围,包括不包含数据的部分。weights(array_like, 可选) – 与`a`形状相同的权重数组。`a`中的每个值仅对 bin 计数贡献其关联的权重(而不是 1)。目前任何 bin 估计器都没有使用此功能,但将来可能会使用。
- 返回值:
bin_edges – 传递给`histogram`的边缘
- 返回类型:
dtype 为 float 的数组