数据科学- 统计学简介

统计简介

统计是分析数据的科学。

创建预测模型后,我们必须评估预测的可靠性。

毕竟,如果我们不能依赖预测,那么它有什么价值呢?


描述性统计

我们将首先介绍一些基本的描述性统计数据。

描述性统计总结了数据集的重要特征,例如:

  • 计数
  • 总和
  • 标准偏差
  • 百分位数
  • 平均
  • 等等。

这是熟悉数据的良好起点。

我们可以使用 Python 中的 describe() 函数对数据进行汇总:

实例

print (full_health_data.describe())

Output:

Stat Describe

你在这里看到了什么有趣的东西吗?