Skip to content

Commit

Permalink
Apply suggestions from code review
Browse files Browse the repository at this point in the history
Co-authored-by: Grace Cai <[email protected]>
  • Loading branch information
lilin90 and qiancai authored Jul 18, 2024
1 parent 5f1a81c commit f45a6a3
Show file tree
Hide file tree
Showing 4 changed files with 6 additions and 6 deletions.
2 changes: 1 addition & 1 deletion sql-statements/sql-statement-show-stats-buckets.md
Original file line number Diff line number Diff line change
Expand Up @@ -14,7 +14,7 @@ summary: TiDB 数据库中 SHOW STATS_BUCKETS 的使用概况。
| `Db_name` | 数据库名 |
| `Table_name` | 表名 |
| `Partition_name` | 分区名 |
| `Column_name` | 根据 `Is_index` 来变化`Is_index``0` 时是列名,为 `1` 时是索引名 |
| `Column_name` | 取决于 `Is_index` `Is_index``0` 时显示列名,为 `1` 时显示索引名 |
| `Is_index` | 是否是索引列 |
| `Bucket_id` | 桶的 ID |
| `Count` | 该桶和之前桶中所有数值的个数 |
Expand Down
2 changes: 1 addition & 1 deletion sql-statements/sql-statement-show-stats-histograms.md
Original file line number Diff line number Diff line change
Expand Up @@ -15,7 +15,7 @@ aliases: ['/docs-cn/dev/sql-statements/sql-statement-show-histograms/','/zh/tidb
| `Db_name` | 数据库名 |
| `Table_name` | 表名 |
| `Partition_name` | 分区名 |
| `Column_name` | 根据 `Is_index` 来变化`Is_index``0` 时是列名,为 `1` 时是索引名 |
| `Column_name` | 取决于 `Is_index` `Is_index``0` 时显示列名,为 `1` 时显示索引名 |
| `Is_index` | 是否是索引列 |
| `Update_time` | 更新时间 |
| `Distinct_count` | 不同值数量 |
Expand Down
2 changes: 1 addition & 1 deletion sql-statements/sql-statement-show-stats-topn.md
Original file line number Diff line number Diff line change
Expand Up @@ -14,7 +14,7 @@ summary: TiDB 数据库中 SHOW STATS_TOPN 的使用概况。
| `Db_name` | 数据库名 |
| `Table_name` | 表名 |
| `Partition_name` | 分区名 |
| `Column_name` | 根据 `Is_index` 来变化`Is_index``0` 时是列名,为 `1` 时是索引名 |
| `Column_name` | 取决于 `Is_index` `Is_index``0` 时显示列名,为 `1` 时显示索引名 |
| `Is_index` | 是否是索引列 |
| `Value` | 该列的值 |
| `Count` | 值出现的次数 |
Expand Down
6 changes: 3 additions & 3 deletions statistics.md
Original file line number Diff line number Diff line change
Expand Up @@ -6,7 +6,7 @@ aliases: ['/docs-cn/dev/statistics/','/docs-cn/dev/reference/performance/statist

# 常规统计信息

TiDB 使用统计信息作为优化器的输入,用来估算 SQL 语句中每个执行计划步骤处理的行数。优化器会估算每个可用执行计划的成本,包括[索引的选择](/choose-index.md)和表连接的顺序,并为每个可用执行计划生成成本。然后,优化器会选择总体成本最低的执行计划。
TiDB 使用统计信息作为优化器的输入,用于估算 SQL 语句的执行计划中每个步骤处理的行数。优化器会估算每个可用执行计划的成本,包括[索引的选择](/choose-index.md)和表连接的顺序,并为每个可用执行计划生成成本。然后,优化器会选择总体成本最低的执行计划。

## 收集统计信息

Expand Down Expand Up @@ -66,15 +66,15 @@ TiDB 根据表的变更次数自动调度 [`ANALYZE`](/sql-statements/sql-statem

### 直方图

直方图统计信息被优化器用于估算区间或范围谓词的选择,并可能用于确定列中不同值的数量,以估算 Version 2 统计信息中的等值或 `IN` 谓词(参见[统计信息版本](#统计信息版本))。
直方图统计信息被优化器用于估算区间或范围谓词的选择,并可能用于确定列中不同值的数量,以估算 Version 2 统计信息(参见[统计信息版本](#统计信息版本))中的等值查询或 `IN` 查询的谓词

直方图是对数据分布的近似表示。它将整个数值范围划分为一系列桶,并使用简单的数据来描述每个桶,例如落入该桶的数值数量。在 TiDB 中,会为每个表的具体列创建等深直方图,可用于估算区间查询。

等深直方图,就是让落入每个桶里的数值数量尽量相等。例如,对于给定的集合 {1.6, 1.9, 1.9, 2.0, 2.4, 2.6, 2.7, 2.7, 2.8, 2.9, 3.4, 3.5} 生成 4 个桶,那么最终的等深直方图就会如下图所示,包含四个桶 [1.6, 1.9],[2.0, 2.6],[2.7, 2.8],[2.9, 3.5],其桶深均为 3

![等深直方图示例](/media/statistics-1.png)

关于控制直方图的桶数量上限的参数 `WITH NUM BUCKETS`,参见[手动收集](#手动收集)小节。桶数量越多,直方图的估算精度就越高,不过也会同时增加统计信息的内存使用。可以视具体情况来调整桶的数量上限。
你可以通过 `WITH NUM BUCKETS` 参数控制直方图的桶数量上限,参见[手动收集](#手动收集)小节。桶数量越多,直方图的估算精度就越高,不过也会同时增加统计信息的内存使用。可以视具体情况来调整桶的数量上限。

### Count-Min Sketch

Expand Down

0 comments on commit f45a6a3

Please sign in to comment.