轴在熊猫中是什么意思?

下面是我生成一个数据框架的代码:

import pandas as pd
import numpy as np

dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB'))

然后我得到了数据框架:

+------------+---------+--------+
|            |  A      |  B     |
+------------+---------+---------
|      0     | 0.626386| 1.52325|
+------------+---------+--------+

当我输入命令时:

dff.mean(axis=1)

我得到:

0    1.074821
dtype: float64

根据pandas的参考，axis=1代表列，我希望命令的结果是

A    0.626386
B    1.523255
dtype: float64

我的问题是:轴在熊猫中是什么意思?

当前回答

熊猫的设计师韦斯•麦金尼(Wes McKinney)曾大量从事金融数据方面的工作。将列视为股票名称，将指数视为每日价格。然后，您可以猜测关于此财务数据的默认行为是什么(即，axis=0)。Axis =1可以简单地认为是“另一个方向”。

例如，诸如mean()、sum()、describe()、count()等统计函数都默认按列执行，因为对每只股票执行这些函数更有意义。Sort_index (by=)也默认为column。Fillna (method='ffill')将沿着列填充，因为它是相同的股票。Dropna()默认为row，因为您可能只是想丢弃当天的价格，而不是丢弃该股票的所有价格。

类似地，方括号索引指的是列，因为更常见的是选择股票而不是选择日期。

2016-07-15 02:56:44

其他回答

数组被设计为坐标轴=0，行被垂直放置，而坐标轴=1，列被水平放置。Axis指的是数组的尺寸。

2018-03-17 20:19:48

让我们想象一下(你会永远记住)，

熊猫:

轴=0表示沿着“索引”。这是一个行运算。

假设，要对dataframe1和dataframe2执行concat()操作，我们将从dataframe1中取出第一行并放入新的DF中，然后我们从dataframe1中取出另一行并放入新的DF中，我们重复这个过程，直到我们到达dataframe1的底部。然后，我们对dataframe2执行相同的过程。

基本上，将dataframe2堆叠在dataframe1之上，反之亦然。

在桌子或地板上堆一堆书

轴=1表示沿着“列”。这是一个按列的运算。

假设，要对dataframe1和dataframe2执行concat()操作，我们将取出第一个完整的列(a.k.)。第一个系列)的dataframe1，并放置到新的DF，然后我们拿出dataframe1的第二列，并保持相邻的(侧)，我们必须重复这个操作，直到所有列完成。然后，我们在dataframe2上重复相同的过程。基本上, 横向堆叠dataframe2。

把书摆放在书架上。

更重要的是，与矩阵相比，数组更好地表示嵌套的n维结构!所以下面可以帮助你更直观地看到轴是如何在一维以上的情况下发挥重要作用的。此外，你实际上可以打印/写入/绘制/可视化任何n-dim数组，但在矩阵表示(3-dim)中书写或可视化相同的内容在超过3维的纸张上是不可能的。

2018-04-17 18:02:16

实际上我们不需要记住轴=0轴=1代表什么。有时，axis可以是一个元组:例如axis=(0,1)我们如何理解这样多个dim轴?

我发现如果我们理解python slice[:]是如何工作的，就会更容易。

假设我们有一个一维数组: A = [0,1,0]

a[:] # select all the elements in array a

假设我们有一个2d数组:

M = [[0, 0, 1],
     [1, 0, 0],
     [0, 2, 1],
     [2, 0, 2],
     [3, 1, 0]]
M[1,:] # M[0]=1, M[1]=* --> [1, 0, 0]
M[:,2] # M[0]=*, M[1]=2 --> [1, 0, 1, 2, 0]
M[:,:] # M[0]=*, M[1]=* --> all the elements in M are selected

当计算时:

np.sum(M, axis=0) # [sum(M[:,0]), sum(M[:,1]), sum(M[:,2])]
np.sum(M, axis=1) # [sum(M[0,:]), sum(M[1,:]), sum(M[2,:]), sum(M[3,:]), sum(M[4,:])]
np.sum(M, axis=-1) # -1 means last dim, it's the same with np.sum(M, axis=1)
np.sum(M, axis=(0,1)) # sum(M[:,:])

规则很简单，当计算时将axis中指定的暗值替换为:。

2021-11-24 09:51:43

比如说，如果你用df。然后你将得到一个元组，其中包含数据帧中的行数和列数作为输出。

In [10]: movies_df.shape
Out[10]: (1000, 11)

在上面的例子中，在movies数据帧中有1000行和11列，其中'row'在索引0位置中提到，'column'在索引1位置中提到。因此'axis=1'表示列，'axis=0'表示行。

学分:Github

2021-02-08 18:43:55

在Pandas上有两种最常见的axis用法:

用作索引，如df。iloc [0, 1] 用作函数内的参数，如df.mean(axis=1)

当使用作为索引时，我们可以解释为axis=0代表行，axis=1代表列，即df。iloc(行、列)。所以,df。Iloc[0,1]表示从第0行和第1列中选择数据，在本例中，它返回1.52325。

当使用作为参数时，axis=0表示垂直跨行选择对象，而axis=1表示水平跨列选择对象。

因此，df.mean(axis=1)表示水平计算跨列的平均值，它返回:

0    1.074821
dtype: float64

轴的一般用途是用于选择要操作的特定数据。而理解轴的关键，是把“选择”和“操作”的过程分开。

我们用一种额外的情况来解释:df。下降(A轴= 1)

该操作是df.drop()，它需要目标对象的名称列，在这里是A。它和df。mean()不一样对数据内容进行操作。选择的是列的名称，而不是列的数据内容。由于所有列名都是水平排列在列之间的，所以我们使用axis=1来选择name对象。

总之，我们最好把“选择”和“操作”分开，对以下问题有一个清晰的认识:

选择什么对象是怎么安排的

2021-10-04 05:56:34

轴在熊猫中是什么意思?

推荐文章

最新文章

标签