我有一个与这个问题非常相似的问题,但我仍然落后一步。我的Windows 7(抱歉)64位系统上只安装了一个版本的Python 3。
我按照这个链接安装了NumPy -正如问题中所建议的那样。安装很顺利,但当我执行
import numpy
我得到了以下错误:
导入错误:没有名为numpy的模块
我有一个与这个问题非常相似的问题,但我仍然落后一步。我的Windows 7(抱歉)64位系统上只安装了一个版本的Python 3。
我按照这个链接安装了NumPy -正如问题中所建议的那样。安装很顺利,但当我执行
import numpy
我得到了以下错误:
导入错误:没有名为numpy的模块
有人知道如何从R中的data。frame中移除一整列吗?例如,如果我得到这个data.frame:
> head(data)
chr genome region
1 chr1 hg19_refGene CDS
2 chr1 hg19_refGene exon
3 chr1 hg19_refGene CDS
4 chr1 hg19_refGene exon
5 chr1 hg19_refGene CDS
6 chr1 hg19_refGene exon
我想去掉第二列。
如何将数据帧列转换为数字类型?
我有一个熊猫DataFrame与“日期”列。现在我需要过滤掉DataFrame中日期在未来两个月之外的所有行。实际上,我只需要保留接下来两个月内的行。
实现这一目标的最佳方式是什么?
我从CSV文件中加载了一些机器学习数据。前两列是观察结果,其余列是特征。
目前,我做以下事情:
data = pandas.read_csv('mydata.csv')
它会给出如下内容:
data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))
我想把这个数据帧切成两个数据帧:一个包含列a和b,一个包含列c, d和e。
不可能写出这样的东西
observations = data[:'c']
features = data['c':]
我不确定最好的方法是什么。我需要一个pd.Panel吗?
顺便说一下,我发现数据帧索引非常不一致:数据['a']是允许的,但数据[0]是不允许的。另一方面,数据['a':]是不允许的,但数据[0:]是允许的。 这有什么实际的原因吗?如果列以Int为索引,这真的很令人困惑,给定data[0] != data[0:1]
我有问题让Chai的expect.to.throw在我的node.js应用程序的测试中工作。测试在抛出的错误上一直失败,但如果我在try和catch中包装测试用例并断言捕获的错误,它就可以工作。
是不是像我想的那样,期望。抛不掉?
it('should throw an error if you try to get an undefined property', function (done) {
var params = { a: 'test', b: 'test', c: 'test' };
var model = new TestModel(MOCK_REQUEST, params);
// neither of these work
expect(model.get('z')).to.throw('Property does not exist in model schema.');
expect(model.get('z')).to.throw(new Error('Property does not exist in model schema.'));
// this works
try {
model.get('z');
}
catch(err) {
expect(err).to.eql(new Error('Property does not exist in model schema.'));
}
done();
});
失败:
19 passing (25ms)
1 failing
1) Model Base should throw an error if you try to get an undefined property:
Error: Property does not exist in model schema.
我想取表格的数据
before = data.frame(attr = c(1,30,4,6), type=c('foo_and_bar','foo_and_bar_2'))
attr type
1 1 foo_and_bar
2 30 foo_and_bar_2
3 4 foo_and_bar
4 6 foo_and_bar_2
然后在上面的列"type"上使用split(),得到如下内容:
attr type_1 type_2
1 1 foo bar
2 30 foo bar_2
3 4 foo bar
4 6 foo bar_2
我想出了一些难以置信的复杂的东西,涉及到某种形式的应用,但我后来把它放错了地方。这似乎太复杂了,不是最好的办法。我可以使用strsplit如下所示,但不清楚如何将其返回到数据帧中的2列。
> strsplit(as.character(before$type),'_and_')
[[1]]
[1] "foo" "bar"
[[2]]
[1] "foo" "bar_2"
[[3]]
[1] "foo" "bar"
[[4]]
[1] "foo" "bar_2"
谢谢你的指点。我还没完全弄懂R列表。
我有一个熊猫数据框架与一列:
import pandas as pd
df = pd.DataFrame({"teams": [["SF", "NYG"] for _ in range(7)]})
teams
0 [SF, NYG]
1 [SF, NYG]
2 [SF, NYG]
3 [SF, NYG]
4 [SF, NYG]
5 [SF, NYG]
6 [SF, NYG]
如何将这列列表分成两列?
预期的结果:
team1 team2
0 SF NYG
1 SF NYG
2 SF NYG
3 SF NYG
4 SF NYG
5 SF NYG
6 SF NYG
我如何才能找到某一列的值是最大的行?
df.max()会给我每一列的最大值,我不知道如何得到相应的行。
我有一个列表,里面有很多我想合并的数据帧。这里的问题是,每个data.frame的行数和列数不同,但它们都共享关键变量(在下文中我将其称为“var1”和“var2”)。如果data.frames在列方面是相同的,我可以只rbind,对于plyr的rbind。填充可以完成这项工作,但这些数据不是这样的。
因为merge命令只适用于2 data.frames,所以我求助于互联网。我从这里得到了这个,它在R 2.7.2中完美地工作,这是我当时拥有的:
merge.rec <- function(.list, ...){
if(length(.list)==1) return(.list[[1]])
Recall(c(list(merge(.list[[1]], .list[[2]], ...)), .list[-(1:2)]), ...)
}
我将这样调用这个函数:
df <- merge.rec(my.list, by.x = c("var1", "var2"),
by.y = c("var1", "var2"), all = T, suffixes=c("", ""))
但在2.7.2之后的任何R版本中,包括2.11和2.12,这段代码会出现以下错误:
Error in match.names(clabs, names(xi)) :
names do not match previous names
(顺便说一句,我在其他地方看到了这个错误的其他引用,但没有解决方案)。
有办法解决这个问题吗?