数据科学 - Python 数据框

使用 Pandas 创建数据框

DataFrame 数据框是数据的结构化表示。

让我们用虚构的数字定义一个 3 列 5 行的数据框:

实例

import pandas as pd

d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9, 5], 'col3': [7, 8, 12, 1, 11]}

df = pd.DataFrame(data=d)

print(df)
亲自试一试 »

实例解析

  • 将 Pandas 库导入为 pd
  • 用名为 d 的变量中的列和行定义数据
  • 使用函数 pd.DataFrame() 创建数据框
  • 数据框包含 3 列 5 行
  • 使用 print() 函数打印数据帧输出

我们在 DataFrame() 前面写 pd. 让 Python 知道我们要激活 Pandas 库中的 DataFrame() 函数。

注意DataFrame中的大写D和F!


解释输出

这是输出:

Dataframe Output

我们看到"col1"、"col2"和"col3"是列的名称。

不要对从 0 到 4 的垂直数字感到困惑。 它们告诉我们有关行位置的信息。

在 Python 中,行的编号从零开始。

现在,我们可以使用 Python 来计算列数和行数了。

我们可以使用 df.shape[1] 来查找列数:

实例

计算列数:

count_column = df.shape[1]
print(count_column)
亲自试一试 »

我们可以使用 df.shape[0] 来查找行数:

实例

计算行数:

count_row = df.shape[0]
print(count_row)
亲自试一试 »

为什么我们不能自己数行数和列数?

如果我们使用包含许多列和行的较大数据集,您自己计算它会令人困惑。 您可能会错误地计算它。 如果我们正确使用 Python 中的内置函数,就可以确保计数是正确的。