我相信有一个明显的方法来做到这一点,但不能想到任何圆滑的现在。
基本上,而不是引发异常,我想获得True或False,看看熊猫df索引中是否存在一个值。
import pandas as pd
df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d'])
df.loc['g'] # (should give False)
我现在工作的是以下内容
sum(df.index == 'g')
我相信有一个明显的方法来做到这一点,但不能想到任何圆滑的现在。
基本上,而不是引发异常,我想获得True或False,看看熊猫df索引中是否存在一个值。
import pandas as pd
df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d'])
df.loc['g'] # (should give False)
我现在工作的是以下内容
sum(df.index == 'g')
只是作为参考,因为这是我正在寻找的东西,您可以通过附加"来测试值或索引中的存在。方法,例如:
g in df.<your selected field>.values
g in df.index.values
我发现加上“。”使用其他python工具来获取简单的列表或ndarray out使存在或“in”检查更顺利地运行。我只是想把这个说给大家听。
df = pandas.DataFrame({'g':[1]}, index=['isStop'])
#df.loc['g']
if 'g' in df.index:
print("find g")
if 'isStop' in df.index:
print("find a")
多索引的工作方式与单索引略有不同。这里有一些多索引数据帧的方法。
df = pd.DataFrame({'col1': ['a', 'b','c', 'd'], 'col2': ['X','X','Y', 'Y'], 'col3': [1, 2, 3, 4]}, columns=['col1', 'col2', 'col3'])
df = df.set_index(['col1', 'col2'])
在df。索引仅在检查单个索引值时才适用于第一层。
'a' in df.index # True
'X' in df.index # False
检查df.index.levels查看其他级别。
'a' in df.index.levels[0] # True
'X' in df.index.levels[1] # True
登记df。索引组合元组的索引。
('a', 'X') in df.index # True
('a', 'Y') in df.index # False
with DataFrame: df_data
>>> df_data
id name value
0 a ampha 1
1 b beta 2
2 c ce 3
我试着:
>>> getattr(df_data, 'value').isin([1]).any()
True
>>> getattr(df_data, 'value').isin(['1']).any()
True
but:
>>> 1 in getattr(df_data, 'value')
True
>>> '1' in getattr(df_data, 'value')
False
很有趣:D
下面的代码不打印布尔值,但允许数据帧通过索引进行子集设置…我知道这可能不是解决问题的最有效的方法,但我(1)喜欢这个读取的方式和(2)你可以很容易地子集df1索引存在于df2:
df3 = df1[df1.index.isin(df2.index)]
或者df1索引在df2中不存在…
df3 = df1[~df1.index.isin(df2.index)]
我喜欢用:
if 'value' in df.index.get_level_values(0):
print(True)
Get_level_values方法很好,因为它允许您获得索引中的值,无论您的索引是简单的还是复合的。
如果在数据帧中只有一个索引[或者想在多个索引级别中检查第一个索引],请使用0(0)。使用1作为第二个索引,依此类推……