下载整个S3存储桶?

我注意到似乎没有从AWS管理控制台下载整个s3桶的选项。

有什么简单的方法可以把所有东西都装进我的桶里吗?我正在考虑使根文件夹公共，使用wget抓取它，然后再次使它私有，但我不知道是否有更简单的方法。

当前回答

Aws同步是完美的解决方案。它不是双向的。从源头到目的地只有一条路。此外，如果你在bucket中有很多项目，首先创建s3端点将是一个好主意，这样下载就会更快(因为下载不是通过互联网进行的，而是通过内部网进行的)，而且不收费

其他回答

AWS CLI是在本地下载整个S3存储桶的最佳选择。

安装AWS CLI。配置AWS CLI以使用默认的安全凭据和默认的AWS区域。下载整个S3桶使用命令 Aws s3 sync s3://yourbucketname localpath

不同AWS服务的AWS CLI参考:AWS命令行接口

如果桶相当大，有一个叫做s4cmd的命令可以进行并行连接，提高下载时间:

把它安装在Debian上就像

apt install s4cmd

如果你有pip:

pip install s4cmd

它将读取~/。s3cfg文件(如果没有安装s3cmd并运行s3cmd——configure)，或者您可以在命令上指定——access-key=ACCESS_KEY——secret-key=SECRET_KEY。

命令行类似于s3cmd。在这种情况下，建议同步，因为您可以取消下载并重新启动，而不必重新下载文件。

s4cmd [--access-key=ACCESS_KEY --secret-key=SECRET_KEY] sync s3://<your-bucket> /some/local/dir

如果你下载了很多数据(>1TB)，这可能会影响你的账单，先计算一下这将是成本

AWS SDK API是将整个文件夹和存储库上传到AWS S3以及在本地下载整个AWS S3存储桶的最佳选择。

上传整个文件夹到AWS S3: AWS S3 sync。s3: / / BucketName

本地下载整个AWS S3桶:AWS S3 sync S3://BucketName。

您还可以为AWS S3桶中的特定文件夹分配路径，如BucketName/ path。

您可以使用sync来下载整个S3桶。例如，下载当前目录下名为bucket1的整个桶。

aws s3 sync s3://bucket1 .

我已经为S3做了一些开发，我还没有找到一个简单的方法来下载整个存储桶。

如果您想用Java编写代码，那么jets3t库很容易用于创建存储桶列表并遍历该列表以下载它们。

首先，从AWS管理咨询器获取一个公共私钥集，这样您就可以创建一个S3service对象:

AWSCredentials awsCredentials = new AWSCredentials(YourAccessKey, YourAwsSecretKey);
s3Service = new RestS3Service(awsCredentials);

然后，获取bucket对象的数组:

S3Object[] objects = s3Service.listObjects(YourBucketNameString);

最后，遍历该数组，每次下载一个对象:

S3Object obj = s3Service.getObject(bucket, fileName);
            file = obj.getDataInputStream();

我把连接代码放在线程安全的单例中。由于显而易见的原因，省略了必要的try/catch语法。

如果你更愿意用Python编写代码，你可以使用Boto。

在查看BucketExplorer之后，“下载整个桶”可能会满足你的需要。

推荐文章