轴在熊猫中是什么意思?

下面是我生成一个数据框架的代码:

import pandas as pd
import numpy as np

dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB'))

然后我得到了数据框架:

+------------+---------+--------+
|            |  A      |  B     |
+------------+---------+---------
|      0     | 0.626386| 1.52325|
+------------+---------+--------+

当我输入命令时:

dff.mean(axis=1)

我得到:

0    1.074821
dtype: float64

根据pandas的参考，axis=1代表列，我希望命令的结果是

A    0.626386
B    1.523255
dtype: float64

我的问题是:轴在熊猫中是什么意思?

当前回答

实际上我们不需要记住轴=0轴=1代表什么。有时，axis可以是一个元组:例如axis=(0,1)我们如何理解这样多个dim轴?

我发现如果我们理解python slice[:]是如何工作的，就会更容易。

假设我们有一个一维数组: A = [0,1,0]

a[:] # select all the elements in array a

假设我们有一个2d数组:

M = [[0, 0, 1],
     [1, 0, 0],
     [0, 2, 1],
     [2, 0, 2],
     [3, 1, 0]]
M[1,:] # M[0]=1, M[1]=* --> [1, 0, 0]
M[:,2] # M[0]=*, M[1]=2 --> [1, 0, 1, 2, 0]
M[:,:] # M[0]=*, M[1]=* --> all the elements in M are selected

当计算时:

np.sum(M, axis=0) # [sum(M[:,0]), sum(M[:,1]), sum(M[:,2])]
np.sum(M, axis=1) # [sum(M[0,:]), sum(M[1,:]), sum(M[2,:]), sum(M[3,:]), sum(M[4,:])]
np.sum(M, axis=-1) # -1 means last dim, it's the same with np.sum(M, axis=1)
np.sum(M, axis=(0,1)) # sum(M[:,:])

规则很简单，当计算时将axis中指定的暗值替换为:。

2021-11-24 09:51:43

其他回答

它指定了计算平均值的轴。默认情况下axis=0。这与numpy一致。显式指定axis时的平均使用量(在numpy中)。mean, axis==None，默认情况下，它计算扁平数组上的平均值)，其中，沿行轴=0(即，以pandas为单位的索引)，沿列轴=1。为了增加清晰度，可以选择指定axis='index'(而不是axis=0)或axis='columns'(而不是axis=1)。

+------------+---------+--------+
|            |  A      |  B     |
+------------+---------+---------
|      0     | 0.626386| 1.52325|----axis=1----->
+------------+---------+--------+
             |         |
             | axis=0  |
             ↓         ↓

2014-03-03 14:55:35

让我们看看Wiki上的表格。这是国际货币基金组织对2010年至2019年前十大国家GDP的估计。

1. 如果你想计算每个国家过去十年(2010-2019)的平均GDP，你需要做，df.mean(轴=1)。例如，如果你想计算美国从2010年到2019年的平均GDP, df。loc['美国',' 2010 ':' 2019 '].mean(轴= 1)

2. 如果我想计算所有国家每年的平均GDP(平均值)，你需要做，df.mean(轴=0)。例如，如果你想计算2015年美国、中国、日本、德国和印度的平均GDP, df。loc(“美国”:“印度”,' 2015 '].mean(轴= 0) 注意:上述代码只有在使用set_index方法将“国家(或附属领土)”列设置为索引后才能工作。

2019-01-02 17:27:12

这些答案确实有助于解释这一点，但对于非程序员(例如，像我这样第一次在数据科学课程背景下学习Python的人)来说，它仍然不是完全直观的。我仍然发现使用术语“沿着”或“每个”wrt的行和列是令人困惑的。

对我来说更有意义的是这样说:

轴0将作用于每个COLUMN中的所有row 轴1将作用于每个ROW中的所有COLUMNS

0轴上的均值是每列中所有行的均值，1轴上的均值是每行中所有列的均值。

从根本上说，这和@zhangxaochen和@Michael的意思是一样的，只是用一种更容易让我内化的方式。

2017-09-14 16:15:29

Axis指的是数组的维度，在pd的情况下。DataFrames轴=0是指向下方的维度，轴=1是指向右侧的维度。

示例:考虑一个形状为(3,5,7)的ndarray。

a = np.ones((3,5,7))

A是一个三维ndarray，即它有3个轴(“axis”是“axis”的复数)。a的构型看起来就像3片面包每片的尺寸都是5乘7。A[0，:，:]表示第0个切片，A[1，:，:]表示第1个切片，等等。

a.s sum(axis=0)将沿着a的第0个轴应用sum()。你将添加所有的切片，最终得到一个形状(5,7)的切片。

a.s sum(axis=0)等价于

b = np.zeros((5,7))
for i in range(5):
    for j in range(7):
        b[i,j] += a[:,i,j].sum()

B和a.sum(轴=0)看起来都是这样的

array([[ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.]])

在警局里。DataFrame，轴的工作方式与numpy相同。数组:axis=0将对每一列应用sum()或任何其他约简函数。

注意:在@zhangxaochen的回答中，我发现“沿着行”和“沿着列”这两个短语有点让人困惑。Axis =0表示“沿每列”，Axis =1表示“沿每行”。

2017-03-02 02:08:17

在Pandas上有两种最常见的axis用法:

用作索引，如df。iloc [0, 1] 用作函数内的参数，如df.mean(axis=1)

当使用作为索引时，我们可以解释为axis=0代表行，axis=1代表列，即df。iloc(行、列)。所以,df。Iloc[0,1]表示从第0行和第1列中选择数据，在本例中，它返回1.52325。

当使用作为参数时，axis=0表示垂直跨行选择对象，而axis=1表示水平跨列选择对象。

因此，df.mean(axis=1)表示水平计算跨列的平均值，它返回:

0    1.074821
dtype: float64

轴的一般用途是用于选择要操作的特定数据。而理解轴的关键，是把“选择”和“操作”的过程分开。

我们用一种额外的情况来解释:df。下降(A轴= 1)

该操作是df.drop()，它需要目标对象的名称列，在这里是A。它和df。mean()不一样对数据内容进行操作。选择的是列的名称，而不是列的数据内容。由于所有列名都是水平排列在列之间的，所以我们使用axis=1来选择name对象。

总之，我们最好把“选择”和“操作”分开，对以下问题有一个清晰的认识:

选择什么对象是怎么安排的

2021-10-04 05:56:34

轴在熊猫中是什么意思?

推荐文章

最新文章

标签