Przesyłanie plików na konto S3 z wiersza poleceń systemu Linux

74

Mam kilka dużych plików na moim koncie hostowanym w systemie Linux, które muszę przesłać na konto S3. Nie chcę ich najpierw pobierać, a następnie przesyłać do S3.

Czy jest jakiś sposób, aby „przesłać” go za pomocą wiersza poleceń systemu Linux? Czy mogę uzyskać do niego dostęp za pośrednictwem strony internetowej współpracującej z Lynx?

siliconpi
źródło

Odpowiedzi:

30

S3cmd robi to, co chcesz. Przesyłanie i pobieranie plików, synchronizowanie katalogów i tworzenie wiader.

S3cmd to bezpłatne narzędzie i klient wiersza poleceń do przesyłania, pobierania i zarządzania danymi w Amazon S3 i innych dostawcach usług przechowywania w chmurze korzystających z protokołu S3, takich jak Google Cloud Storage lub DreamHost DreamObjects. Najlepiej nadaje się dla zaawansowanych użytkowników, którzy znają programy wiersza poleceń. Jest także idealny do skryptów wsadowych i automatycznego tworzenia kopii zapasowych na S3, uruchamianych z crona itp.

Alister Bulman
źródło
działa jak marzenie!
siliconpi
97

Amazon udostępnia teraz także własne narzędzia CLI.

Od http://aws.amazon.com/cli/

Korzystając ze znanej składni, możesz przeglądać zawartość swoich segmentów S3 na liście opartej na katalogu.

$ aws s3 ls s3://mybucket
      LastWriteTime     Length Name
      -------------     ------ ----
                           PRE myfolder/
2013-09-03 10:00:00       1234 myfile.txt
...

Możesz wykonywać rekurencyjne przesyłanie i pobieranie wielu plików w jednym poleceniu na poziomie folderu. Interfejs AWS CLI uruchomi te transfery równolegle w celu zwiększenia wydajności.

$ aws s3 cp myfolder s3://mybucket/myfolder --recursive
upload: myfolder/file1.txt to s3://mybucket/myfolder/file1.txt
upload: myfolder/subfolder/file1.txt to s3://mybucket/myfolder/subfolder/file1.txt
...

Polecenie synchronizacji ułatwia synchronizację zawartości folderu lokalnego z kopią w segmencie S3.

$ aws s3 sync myfolder s3://mybucket/myfolder --exclude *.tmp
upload: myfolder/newfile.txt to s3://mybucket/myfolder/newfile.txt
...

Dokumentacja poleceń związanych z plikami znajduje się tutaj .

Drew Noakes
źródło
5
najbardziej kompletna odpowiedź! :)
SergioFilhow
26

Jeśli nie możesz (być może korzystasz z hosta współdzielonego) lub nie chcesz instalować dodatkowych narzędzi, możesz po prostu użyć bash, curl i openssl.

http://tmont.com/blargh/2014/1/uploading-to-s3-in-bash

file=/path/to/file/to/upload.tar.gz
bucket=your-bucket
resource="/${bucket}/${file}"
contentType="application/x-compressed-tar"
dateValue=`date -R`
stringToSign="PUT\n\n${contentType}\n${dateValue}\n${resource}"
s3Key=xxxxxxxxxxxxxxxxxxxx
s3Secret=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
signature=`echo -en ${stringToSign} | openssl sha1 -hmac ${s3Secret} -binary | base64`
curl -L -X PUT -T "${file}" \
  -H "Host: ${bucket}.s3.amazonaws.com" \
  -H "Date: ${dateValue}" \
  -H "Content-Type: ${contentType}" \
  -H "Authorization: AWS ${s3Key}:${signature}" \
  https://${bucket}.s3.amazonaws.com/${file}

Zauważ, że zmodyfikowałem ten skrypt z tego w powyższym linku. Dodałem -Lopcję, ponieważ AWS może wstawić tam przekierowanie. -LOpcja nastąpi przekierowanie do Ciebie.

Jeszcze jedno zastrzeżenie. To nie zadziała dla plików większych niż 5 GB. Wymagają one przesyłania wielu części, co wymagałoby bardziej złożonego skryptu.

phylae
źródło
12

Skrypt powłoki zgodny z POSIX, który wymaga tylko openssl, curl i sed; obsługa AWS Signature Version 4, która jest wymagana dla regionu eu-central-1(Frankfurt) i zalecana dla pozostałych:

https://gist.github.com/vszakats/2917d28a951844ab80b1

#!/bin/sh -u

# To the extent possible under law, Viktor Szakats (vszakats.net)
# has waived all copyright and related or neighboring rights to this
# script.
# CC0 - https://creativecommons.org/publicdomain/zero/1.0/

# Upload a file to Amazon AWS S3 using Signature Version 4
#
# docs:
#    https://docs.aws.amazon.com/general/latest/gr/sigv4-create-canonical-request.html
#
# requires:
#    curl, openssl 1.x, GNU sed, LF EOLs in this file

fileLocal="${1:-example-local-file.ext}"
bucket="${2:-example-bucket}"
region="${3:-}"
storageClass="${4:-STANDARD}"  # or 'REDUCED_REDUNDANCY'

m_openssl() {
  if [ -f /usr/local/opt/[email protected]/bin/openssl ]; then
    /usr/local/opt/[email protected]/bin/openssl "$@"
  elif [ -f /usr/local/opt/openssl/bin/openssl ]; then
    /usr/local/opt/openssl/bin/openssl "$@"
  else
    openssl "$@"
  fi
}

m_sed() {
  if which gsed > /dev/null 2>&1; then
    gsed "$@"
  else
    sed "$@"
  fi
}

awsStringSign4() {
  kSecret="AWS4$1"
  kDate=$(printf         '%s' "$2" | m_openssl dgst -sha256 -hex -mac HMAC -macopt "key:${kSecret}"     2>/dev/null | m_sed 's/^.* //')
  kRegion=$(printf       '%s' "$3" | m_openssl dgst -sha256 -hex -mac HMAC -macopt "hexkey:${kDate}"    2>/dev/null | m_sed 's/^.* //')
  kService=$(printf      '%s' "$4" | m_openssl dgst -sha256 -hex -mac HMAC -macopt "hexkey:${kRegion}"  2>/dev/null | m_sed 's/^.* //')
  kSigning=$(printf 'aws4_request' | m_openssl dgst -sha256 -hex -mac HMAC -macopt "hexkey:${kService}" 2>/dev/null | m_sed 's/^.* //')
  signedString=$(printf  '%s' "$5" | m_openssl dgst -sha256 -hex -mac HMAC -macopt "hexkey:${kSigning}" 2>/dev/null | m_sed 's/^.* //')
  printf '%s' "${signedString}"
}

iniGet() {
  # based on: https://stackoverflow.com/questions/22550265/read-certain-key-from-certain-section-of-ini-file-sed-awk#comment34321563_22550640
  printf '%s' "$(m_sed -n -E "/\[$2\]/,/\[.*\]/{/$3/s/(.*)=[ \\t]*(.*)/\2/p}" "$1")"
}

# Initialize access keys

if [ -z "${AWS_CONFIG_FILE:-}" ]; then
  if [ -z "${AWS_ACCESS_KEY:-}" ]; then
    echo 'AWS_CONFIG_FILE or AWS_ACCESS_KEY/AWS_SECRET_KEY envvars not set.'
    exit 1
  else
    awsAccess="${AWS_ACCESS_KEY}"
    awsSecret="${AWS_SECRET_KEY}"
    awsRegion='us-east-1'
  fi
else
  awsProfile='default'

  # Read standard aws-cli configuration file
  # pointed to by the envvar AWS_CONFIG_FILE
  awsAccess="$(iniGet "${AWS_CONFIG_FILE}" "${awsProfile}" 'aws_access_key_id')"
  awsSecret="$(iniGet "${AWS_CONFIG_FILE}" "${awsProfile}" 'aws_secret_access_key')"
  awsRegion="$(iniGet "${AWS_CONFIG_FILE}" "${awsProfile}" 'region')"
fi

# Initialize defaults

fileRemote="${fileLocal}"

if [ -z "${region}" ]; then
  region="${awsRegion}"
fi

echo "Uploading" "${fileLocal}" "->" "${bucket}" "${region}" "${storageClass}"
echo "| $(uname) | $(m_openssl version) | $(m_sed --version | head -1) |"

# Initialize helper variables

httpReq='PUT'
authType='AWS4-HMAC-SHA256'
service='s3'
baseUrl=".${service}.amazonaws.com"
dateValueS=$(date -u +'%Y%m%d')
dateValueL=$(date -u +'%Y%m%dT%H%M%SZ')
if hash file 2>/dev/null; then
  contentType="$(file -b --mime-type "${fileLocal}")"
else
  contentType='application/octet-stream'
fi

# 0. Hash the file to be uploaded

if [ -f "${fileLocal}" ]; then
  payloadHash=$(m_openssl dgst -sha256 -hex < "${fileLocal}" 2>/dev/null | m_sed 's/^.* //')
else
  echo "File not found: '${fileLocal}'"
  exit 1
fi

# 1. Create canonical request

# NOTE: order significant in ${headerList} and ${canonicalRequest}

headerList='content-type;host;x-amz-content-sha256;x-amz-date;x-amz-server-side-encryption;x-amz-storage-class'

canonicalRequest="\
${httpReq}
/${fileRemote}

content-type:${contentType}
host:${bucket}${baseUrl}
x-amz-content-sha256:${payloadHash}
x-amz-date:${dateValueL}
x-amz-server-side-encryption:AES256
x-amz-storage-class:${storageClass}

${headerList}
${payloadHash}"

# Hash it

canonicalRequestHash=$(printf '%s' "${canonicalRequest}" | m_openssl dgst -sha256 -hex 2>/dev/null | m_sed 's/^.* //')

# 2. Create string to sign

stringToSign="\
${authType}
${dateValueL}
${dateValueS}/${region}/${service}/aws4_request
${canonicalRequestHash}"

# 3. Sign the string

signature=$(awsStringSign4 "${awsSecret}" "${dateValueS}" "${region}" "${service}" "${stringToSign}")

# Upload

curl -s -L --proto-redir =https -X "${httpReq}" -T "${fileLocal}" \
  -H "Content-Type: ${contentType}" \
  -H "Host: ${bucket}${baseUrl}" \
  -H "X-Amz-Content-SHA256: ${payloadHash}" \
  -H "X-Amz-Date: ${dateValueL}" \
  -H "X-Amz-Server-Side-Encryption: AES256" \
  -H "X-Amz-Storage-Class: ${storageClass}" \
  -H "Authorization: ${authType} Credential=${awsAccess}/${dateValueS}/${region}/${service}/aws4_request, SignedHeaders=${headerList}, Signature=${signature}" \
  "https://${bucket}${baseUrl}/${fileRemote}"

Zauważ, że skrypt włączy serwer

Domyślnie szyfrowanie AES256.

vszakats
źródło
Dla wyszukiwarek: To jest poprawne rozwiązanie dla eu-central-1 i ogólnie, jeśli pojawi się błądThe authorization mechanism you have provided is not supported. Please use AWS4-HMAC-SHA256
Steen
3

Alternatywnie możesz spróbować https://github.com/minio/mc

mczapewnia minimalne narzędzia do pracy z systemami pamięci masowej i systemami plików zgodnymi z Amazon S3. Posiada funkcje takie jak wznawianie przesyłania, pasek postępu, kopiowanie równoległe. mcjest napisany w Golang i wydany na licencji Apache v2.

Harshavardhana
źródło
To świetna odpowiedź. Niekoniecznie chcę to robić w bash, jak sugerują inne (dobre) odpowiedzi. Po prostu nie chcę instalować wszystkich zależności wymaganych przez awscli.
Michael Barton
1

Odkryłem, że powiązania AWS Pythona w botopakiecie ( pip install boto) są pomocne przy przesyłaniu danych do S3.

Można wywołać następujący skrypt: python script_name.py "sub_bucket_name" "*.zip"gdzie sub_bucket_namewskazuje nazwę katalogu, w którym pliki powinny być przechowywane w S3, i *.zipjest ścieżką globalną wskazującą jeden lub więcej plików do przesłania:

import sys, glob, os, boto
from boto.s3.key import Key

def percent_cb(complete, total):
    sys.stdout.write('.')
    sys.stdout.flush()

id = '< your id here >'               # AWS Access Key ID
secret = '< your secret here >'       # AWS Secret Access Key
bucket_name = '< your bucket here >'  # Bucket wherein content will be stored
conn = boto.connect_s3(id, secret)    # Establish a connection to S3
bucket = conn.get_bucket(bucket_name, validate=False)  # Connect to bucket
k  = Key(bucket)                      # Connect to the bucket's key

for i in glob.glob(sys.argv[2]):      # Read in files to push to S3

        sub_bucket = sys.argv[1]  # Directory within bucket where files will be stored
        k.key = sub_bucket + "/" + os.path.basename(i) # Path each uploaded file will have on S3

        k.set_contents_from_filename(i, cb=percent_cb, num_cb=10)  # Push data to S3

        print 'Uploading %s to Amazon S3 bucket %s' % (i, bucket_name)  # Report status
duhaime
źródło