这似乎是一个非常简单的问题……但我没有看到我期待的简单答案。

那么,我如何得到Pandas中给定列的第n行的值呢?(我对第一行特别感兴趣,但也会对更普遍的实践感兴趣)。

例如,假设我想在Btime中提取1.2值作为变量。

正确的做法是什么?

>>> df_test
    ATime   X   Y   Z   Btime  C   D   E
0    1.2  2  15   2    1.2  12  25  12
1    1.4  3  12   1    1.3  13  22  11
2    1.5  1  10   6    1.4  11  20  16
3    1.6  2   9  10    1.7  12  29  12
4    1.9  1   1   9    1.9  11  21  19
5    2.0  0   0   0    2.0   8  10  11
6    2.4  0   0   0    2.4  10  12  15

当前回答

另一种方法是:

first_value = df['Btime'].values[0]

这种方式似乎比使用.iloc更快:

In [1]: %timeit -n 1000 df['Btime'].values[20]
5.82 µs ± 142 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each)

In [2]: %timeit -n 1000 df['Btime'].iloc[20]
29.2 µs ± 1.28 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

其他回答

.iat和.at是获取和设置单个值的方法,比.iloc和.loc快得多。Mykola Zotko在他们的回答中指出了这一点,但他们没有充分使用。iat。

当我们可以使用.iat或.at时,我们应该只需要索引到数据帧一次。

这并不好:

df['Btime'].iat[0]

这并不理想,因为首先选择'Btime'列作为一个系列,然后使用.iat索引到该系列。

以下两种选择是最好的:

使用零索引位置: df。Iat[0,4] #获取第0行和第4列的值 使用标签: df。at[0, 'Btime'] #获取索引标签为0且列名为"Btime"的值。

这两个方法都返回值1.2。

要访问单个值,可以使用比iloc快得多的方法iat:

df['Btime'].iat[0]

你也可以使用take方法:

df['Btime'].take(0)

例如,要从“test”列和第一行中获取值,它的工作方式如下

df[['test']].values[0][0]

只有df[['test']]]。[0]返回一个数组

获取第一行并保存索引的另一种方法:

x = df.first('d') # Returns the first day. '3d' gives first three days.

另一种方法是:

first_value = df['Btime'].values[0]

这种方式似乎比使用.iloc更快:

In [1]: %timeit -n 1000 df['Btime'].values[20]
5.82 µs ± 142 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each)

In [2]: %timeit -n 1000 df['Btime'].iloc[20]
29.2 µs ± 1.28 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)