AI 人工智能数据

智能需要数据

人类智能需要数据:

房地产经纪人需要有关已售房屋的数据来估算价格。

人工智能需要数据:

计算机程序也需要数据来估算价格。


存储数据

要收集的最常见数据是数字和测量值。

数据通常存储在表示值之间关系的数组中。

此表包含房价与大小:

Price7889991011141415
Size5060708090100 110120130140150

定量与定性

定量数据是数值:

  • 55 辆汽车
  • 15 米
  • 35 个孩子

定性数据是描述性的:

  • 天冷了
  • 很长
  • 很有趣


人口普查或抽样

人口普查是指我们为一个群体的每个成员收集数据。

样本是我们为某个组的某些成员收集数据的时候。

如果我们想知道有多少美国人吸烟,我们可以询问美国的每个人(人口普查),或者我们可以询问 10 000 人(样本)。

人口普查准确,但很难做到。 样本不准确,但更容易做到。


抽样说明

人口是我们想要从中收集信息的一组个体(对象)。

人口普查是关于人口中每个人的信息。

样本是关于一部分人口的信息(为了代表所有人)。


随机样本

为了让一个样本代表一个总体,它必须是随机收集的。

随机样本,是一个样本,总体中的每个成员都有相同的机会出现在样本中。


抽样偏差

抽样偏差(错误)发生在样本的收集方式使得某些个体不太可能(或更多)包含在样本中时。