下载整个S3存储桶?

我注意到似乎没有从AWS管理控制台下载整个s3桶的选项。

有什么简单的方法可以把所有东西都装进我的桶里吗?我正在考虑使根文件夹公共，使用wget抓取它，然后再次使它私有，但我不知道是否有更简单的方法。

当前回答

使用awscli下载/上传文件到s3总是更好。同步将帮助您恢复没有任何麻烦。

aws s3 sync s3://bucketname/ .

其他回答

@Layke的回答很好，但如果你有大量的数据，不想永远等待，你应该阅读“AWS CLI S3配置”。

以下命令将告诉AWS CLI使用1,000个线程执行作业(每个小文件或多部分副本的一部分)，并查看100,000个作业:

aws configure set default.s3.max_concurrent_requests 1000
aws configure set default.s3.max_queue_size 100000

运行这些之后，你可以使用简单的sync命令:

aws s3 sync s3://source-bucket/source-path s3://destination-bucket/destination-path

aws s3 sync s3://source-bucket/source-path c:\my\local\data\path

在一个拥有4核CPU和16GB RAM的系统上，对于像我这样的情况(3-50GB文件)，同步/复制速度从9.5MiB/s提高到700+MiB/s，比默认配置提高了70倍。

你可以用s3cmd命令简单地得到它:

s3cmd get --recursive --continue s3://test-bucket local-directory/

Aws同步是完美的解决方案。它不是双向的。从源头到目的地只有一条路。此外，如果你在bucket中有很多项目，首先创建s3端点将是一个好主意，这样下载就会更快(因为下载不是通过互联网进行的，而是通过内部网进行的)，而且不收费

为了添加另一个GUI选项，我们使用了WinSCP的S3功能。它非常容易连接，只需要你的访问密钥和密钥在用户界面。然后，您可以从任何可访问的存储桶中浏览和下载所需的任何文件，包括嵌套文件夹的递归下载。

由于通过安全检查新软件可能是一个挑战，而且WinSCP相当普遍，因此使用它而不是尝试安装更专业的实用程序会非常有益。

你可以使用s3cmd下载你的桶:

s3cmd --configure
s3cmd sync s3://bucketnamehere/folder /destination/folder

您可以使用另一种名为rclone的工具。这是Rclone文档中的一个代码示例:

rclone sync /home/local/directory remote:bucket

推荐文章