我有一个包含数千个数字的文件,每个数字都在自己的行上:

34
42
11
6
2
99
...

我想写一个脚本,它将打印文件中所有数字的总和。我有一个解决办法,但不是很有效。(运行需要几分钟。)我在寻找一个更有效的解决方案。有什么建议吗?


当前回答

到目前为止,没有一个解决方案使用浆糊。这里有一个:

paste -sd+ filename | bc

如果文件有一个尾随换行符,尾随+将导致语法错误。通过移除后面的+来修复错误:

paste -sd+ fiilename | sed 's/+$//g' | bc

例如,计算Σn,其中1<=n<=100000:

$ seq 100000 | paste -sd+ | bc -l
5000050000

(对于好奇的人来说,seqn会在给定正数n的情况下打印从1到n的数字序列。)

其他回答

Bash变体

raw=$(cat file)
echo $(( ${raw//$'\n'/+} ))

$ wc -l file
10000 file

$ time ./test
323390

real    0m3,096s
user    0m3,095s
sys     0m0,000s

这里发生了什么?读取一个文件的内容到$raw var中,然后通过将所有新行更改为“+”来从该var创建数学语句

c++“俏皮话”:

#include <iostream>
#include <iterator>
#include <numeric>
using namespace std;

int main() {
    cout << accumulate(istream_iterator<int>(cin), istream_iterator<int>(), 0) << endl;
}

这是另一个简单的句子

( echo 0 ; sed 's/$/ +/' foo ; echo p ) | dc

这假设数字是整数。如果你需要小数,试试

( echo 0 2k ; sed 's/$/ +/' foo ; echo p ) | dc

将2调整为所需的小数数。

C总是以速度取胜:

#include <stdio.h>
#include <stdlib.h>

int main(int argc, char **argv) {
    ssize_t read;
    char *line = NULL;
    size_t len = 0;
    double sum = 0.0;

    while (read = getline(&line, &len, stdin) != -1) {
        sum += atof(line);
    }

    printf("%f", sum);
    return 0;
}

1M数字的计时(与我的python答案相同的机器/输入):

$ gcc sum.c -o sum && time ./sum < numbers 
5003371677.000000
real    0m0.188s
user    0m0.180s
sys     0m0.000s

用+替换所有的新行,加一个0并把它发送给Ruby解释器不是更容易吗?

(sed -e "s/$/+/" file; echo 0)|irb

如果你没有irb,你可以把它发送到bc,但是你必须删除所有的换行符,除了最后一个(echo)。最好使用tr,除非您拥有sed的博士学位。

(sed -e "s/$/+/" file|tr -d "\n"; echo 0)|bc