通过每次追加一行来创建Pandas数据框架

我如何创建一个空DataFrame，然后添加行，一个接一个?

我创建了一个空DataFrame:

df = pd.DataFrame(columns=('lib', 'qty1', 'qty2'))

然后我可以在最后添加一个新行，并填充一个字段:

df = df._set_value(index=len(df), col='qty1', value=10.0)

它一次只适用于一个领域。向df中添加新行有什么更好的方法?

当前回答

与ShikharDua的答案(基于行)中的字典列表不同，我们也可以将我们的表表示为一个列表字典(基于列)，其中每个列表按行顺序存储一列，前提是我们事先知道我们的列。最后，我们构造一次DataFrame。

在这两种情况下，字典键始终是列名。行顺序隐式存储为列表中的order。对于c列和n行，它使用一个c个字典列表，而不是一个n个字典列表。字典列表方法让每个字典冗余地存储所有键，并且需要为每一行创建一个新字典。这里我们只追加到列表中，这总体上是相同的时间复杂度(向列表和字典中添加条目都是平摊常数时间)，但由于操作简单，开销可能更小。

# Current data
data = {"Animal":["cow", "horse"], "Color":["blue", "red"]}

# Adding a new row (be careful to ensure every column gets another value)
data["Animal"].append("mouse")
data["Color"].append("black")

# At the end, construct our DataFrame
df = pd.DataFrame(data)
#   Animal  Color
# 0    cow   blue
# 1  horse    red
# 2  mouse  black

2019-12-30 01:35:57

其他回答

您可以为此连接两个数据框架。我基本上遇到了这个问题，用字符索引(不是数字)向现有的DataFrame添加新行。

因此，我在一个管道()中输入新行数据，并在一个列表中索引。

new_dict = {put input for new row here}
new_list = [put your index here]

new_df = pd.DataFrame(data=new_dict, index=new_list)

df = pd.concat([existing_df, new_df])

2020-04-30 14:07:19

你可以用df。Loc [i]，其中索引为i的行将是你在数据框架中指定的行。

>>> import pandas as pd
>>> from numpy.random import randint

>>> df = pd.DataFrame(columns=['lib', 'qty1', 'qty2'])
>>> for i in range(5):
>>>     df.loc[i] = ['name' + str(i)] + list(randint(10, size=2))

>>> df
     lib qty1 qty2
0  name0    3    3
1  name1    2    4
2  name2    2    8
3  name3    2    1
4  name4    9    6

2014-07-22 13:10:25

可以使用ignore_index选项将单行追加为字典。

>>> f = pandas.DataFrame(data = {'Animal':['cow','horse'], 'Color':['blue', 'red']})
>>> f
  Animal Color
0    cow  blue
1  horse   red
>>> f.append({'Animal':'mouse', 'Color':'black'}, ignore_index=True)
  Animal  Color
0    cow   blue
1  horse    red
2  mouse  black

2016-02-23 16:43:07

如果你有一个数据帧df，想要添加一个列表new_list作为一个新行到df，你可以简单地做:

df.loc[len(df)] = new_list

如果你想在数据帧df下添加一个新的数据帧new_df，那么你可以使用:

df.append(new_df)

2020-12-21 09:57:20

我们经常看到结构df。loc[下标]=…分配给一个数据帧行。Mikhail_Sam发布了包含这个构造以及使用dict并最终创建DataFrame的方法的基准测试。他发现后者是目前为止最快的。

但是如果我们替换df3。loc[i] =…(与预分配的DataFrame)在他的代码df3。值[i] =…时，结果会发生显著变化，因为该方法的执行与使用dict的方法类似。所以我们应该经常使用df。考虑[下标]=…但是请注意，.values有一个从零开始的下标，这可能与DataFrame.index不同。

2019-08-22 12:39:32

通过每次追加一行来创建Pandas数据框架

推荐文章

最新文章

标签