轴在熊猫中是什么意思?

下面是我生成一个数据框架的代码:

import pandas as pd
import numpy as np

dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB'))

然后我得到了数据框架:

+------------+---------+--------+
|            |  A      |  B     |
+------------+---------+---------
|      0     | 0.626386| 1.52325|
+------------+---------+--------+

当我输入命令时:

dff.mean(axis=1)

我得到:

0    1.074821
dtype: float64

根据pandas的参考，axis=1代表列，我希望命令的结果是

A    0.626386
B    1.523255
dtype: float64

我的问题是:轴在熊猫中是什么意思?

当前回答

它指定了计算平均值的轴。默认情况下axis=0。这与numpy一致。显式指定axis时的平均使用量(在numpy中)。mean, axis==None，默认情况下，它计算扁平数组上的平均值)，其中，沿行轴=0(即，以pandas为单位的索引)，沿列轴=1。为了增加清晰度，可以选择指定axis='index'(而不是axis=0)或axis='columns'(而不是axis=1)。

+------------+---------+--------+
|            |  A      |  B     |
+------------+---------+---------
|      0     | 0.626386| 1.52325|----axis=1----->
+------------+---------+--------+
             |         |
             | axis=0  |
             ↓         ↓

2014-03-03 14:55:35

其他回答

实际上我们不需要记住轴=0轴=1代表什么。有时，axis可以是一个元组:例如axis=(0,1)我们如何理解这样多个dim轴?

我发现如果我们理解python slice[:]是如何工作的，就会更容易。

假设我们有一个一维数组: A = [0,1,0]

a[:] # select all the elements in array a

假设我们有一个2d数组:

M = [[0, 0, 1],
     [1, 0, 0],
     [0, 2, 1],
     [2, 0, 2],
     [3, 1, 0]]
M[1,:] # M[0]=1, M[1]=* --> [1, 0, 0]
M[:,2] # M[0]=*, M[1]=2 --> [1, 0, 1, 2, 0]
M[:,:] # M[0]=*, M[1]=* --> all the elements in M are selected

当计算时:

np.sum(M, axis=0) # [sum(M[:,0]), sum(M[:,1]), sum(M[:,2])]
np.sum(M, axis=1) # [sum(M[0,:]), sum(M[1,:]), sum(M[2,:]), sum(M[3,:]), sum(M[4,:])]
np.sum(M, axis=-1) # -1 means last dim, it's the same with np.sum(M, axis=1)
np.sum(M, axis=(0,1)) # sum(M[:,:])

规则很简单，当计算时将axis中指定的暗值替换为:。

2021-11-24 09:51:43

轴= 0表示从上到下轴= 1表示从左到右

sums[key] = lang_sets[key].iloc[:,1:].sum(axis=0)

给定的例子是取column == key中所有数据的和。

2017-11-16 13:59:37

我是这样理解的:

比如说，如果你的操作需要在数据框架中从左到右/从右到左，你显然是在合并列。你在不同的列上操作。这是轴=1

例子

df = pd.DataFrame(np.arange(12).reshape(3,4),columns=['A', 'B', 'C', 'D'])
print(df)
   A  B   C   D
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11 

df.mean(axis=1)

0    1.5
1    5.5
2    9.5
dtype: float64

df.drop(['A','B'],axis=1,inplace=True)

    C   D
0   2   3
1   6   7
2  10  11

这里需要注意的是，我们是在列上操作

类似地，如果您的操作需要在数据帧中从上到下/从下到上遍历，那么您正在合并行。轴为0。

2018-12-28 04:06:23

在Pandas上有两种最常见的axis用法:

用作索引，如df。iloc [0, 1] 用作函数内的参数，如df.mean(axis=1)

当使用作为索引时，我们可以解释为axis=0代表行，axis=1代表列，即df。iloc(行、列)。所以,df。Iloc[0,1]表示从第0行和第1列中选择数据，在本例中，它返回1.52325。

当使用作为参数时，axis=0表示垂直跨行选择对象，而axis=1表示水平跨列选择对象。

因此，df.mean(axis=1)表示水平计算跨列的平均值，它返回:

0    1.074821
dtype: float64

轴的一般用途是用于选择要操作的特定数据。而理解轴的关键，是把“选择”和“操作”的过程分开。

我们用一种额外的情况来解释:df。下降(A轴= 1)

该操作是df.drop()，它需要目标对象的名称列，在这里是A。它和df。mean()不一样对数据内容进行操作。选择的是列的名称，而不是列的数据内容。由于所有列名都是水平排列在列之间的，所以我们使用axis=1来选择name对象。

总之，我们最好把“选择”和“操作”分开，对以下问题有一个清晰的认识:

选择什么对象是怎么安排的

2021-10-04 05:56:34

比如说，如果你用df。然后你将得到一个元组，其中包含数据帧中的行数和列数作为输出。

In [10]: movies_df.shape
Out[10]: (1000, 11)

在上面的例子中，在movies数据帧中有1000行和11列，其中'row'在索引0位置中提到，'column'在索引1位置中提到。因此'axis=1'表示列，'axis=0'表示行。

学分:Github

2021-02-08 18:43:55

轴在熊猫中是什么意思?

推荐文章

最新文章

标签