如果我有一个具有以下列的数据框架:
1. NAME object
2. On_Time object
3. On_Budget object
4. %actual_hr float64
5. Baseline Start Date datetime64[ns]
6. Forecast Start Date datetime64[ns]
我想能够说:对于这个数据框架,给我一个列的类型'对象'或类型'datetime'的列表?
我有一个函数,将数字('float64')转换为两个小数点后的位置,我想使用这个特定类型的数据帧列的列表,并通过这个函数将它们全部转换为2dp。
也许是这样的:
For c in col_list: if c.dtype = "Something"
list[]
List.append(c)?
获取特定dtype的列列表的最直接方法。“对象”:
df.select_dtypes(include='object').columns
例如:
>>df = pd.DataFrame([[1, 2.3456, 'c', 'd', 78]], columns=list("ABCDE"))
>>df.dtypes
A int64
B float64
C object
D object
E int64
dtype: object
获取所有'object' dtype列:
>>df.select_dtypes(include='object').columns
Index(['C', 'D'], dtype='object')
仅仅是列表:
>>list(df.select_dtypes(include='object').columns)
['C', 'D']
许多已发布的解决方案都使用df。Select_dtypes会不必要地创建一个临时的中间数据帧。如果你想要的只是“非数字类型(不是float32/int64/complex128/等等)的列的列表,只需执行其中一个(如果你只想要数字类型,则删除“not”):
import numpy as np
[c for c in df.columns if not np.issubdtype(df[c].dtype, np.number)]
from pandas.api.types import is_numeric_dtype
[c for c in df.columns if not is_numeric_dtype(c)]
注意:如果你想区分浮点数(float32/float64)与整数和复数,那么你可以使用np。浮动而不是np。上面两个解中的第一个或者下面两个解中的第一个。
如果你想让结果是pd。索引,而不是像上面那样只是列名字符串列表,这里有两种方法(第一种是基于@juanpa.arrivillaga):
import numpy as np
df.columns[[not np.issubdtype(dt, np.number) for dt in df.dtypes]]
from pandas.api.types import is_numeric_dtype
df.columns[[not is_numeric_dtype(c) for c in df.columns]]
其他一些方法可能会将bool列视为数值类型,但上面的解决方案不会这样做(使用numpy 1.22.3 / pandas 1.4.2测试)。