我有一个包含数千个数字的文件,每个数字都在自己的行上:
34
42
11
6
2
99
...
我想写一个脚本,它将打印文件中所有数字的总和。我有一个解决办法,但不是很有效。(运行需要几分钟。)我在寻找一个更有效的解决方案。有什么建议吗?
我有一个包含数千个数字的文件,每个数字都在自己的行上:
34
42
11
6
2
99
...
我想写一个脚本,它将打印文件中所有数字的总和。我有一个解决办法,但不是很有效。(运行需要几分钟。)我在寻找一个更有效的解决方案。有什么建议吗?
当前回答
你可以使用awk:
awk '{ sum += $1 } END { print sum }' file
其他回答
我更喜欢用R来表示:
$ R -e 'sum(scan("filename"))'
c++“俏皮话”:
#include <iostream>
#include <iterator>
#include <numeric>
using namespace std;
int main() {
cout << accumulate(istream_iterator<int>(cin), istream_iterator<int>(), 0) << endl;
}
下面是一个使用python和生成器表达式的解决方案。在我破旧的笔记本电脑上测试了无数个数字。
time python -c "import sys; print sum((float(l) for l in sys.stdin))" < file
real 0m0.619s
user 0m0.512s
sys 0m0.028s
对于这样的任务,我更喜欢使用GNU数据集,因为它比perl或awk更简洁易读。例如
datamash sum 1 < myfile
其中1表示数据的第一列。
只是为了好玩,让我们用PDL (Perl的数组数学引擎)来做!
perl -MPDL -E 'say rcols(shift)->sum' datafile
rcols将列读入矩阵(在本例中为1D), sum (surprise)对矩阵中的所有元素求和。