Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

AWS ग्लू में मौजूद S3 बकेट के ऑब्जेक्ट संस्करणों के माध्यम से पेजेट करने के लिए Boto3 का उपयोग कैसे करें

समस्या कथन: boto3 . का उपयोग करें आपके खाते में बनाए गए AWS ग्लू डेटा कैटलॉग से S3 बकेट के ऑब्जेक्ट संस्करणों के माध्यम से पेजिनेट करने के लिए पायथन में लाइब्रेरी

इस समस्या को हल करने के लिए दृष्टिकोण/एल्गोरिदम

  • चरण 1: आयात करें boto3 और बोटोकोर अपवादों को संभालने के लिए अपवाद।

  • चरण 2: अधिकतम_आइटम , पृष्ठ_आकार और शुरुआती_टोकन इस फ़ंक्शन के लिए वैकल्पिक पैरामीटर हैं, जबकि bucket_name आवश्यक पैरामीटर है।

    • अधिकतम_आइटम लौटने के लिए रिकॉर्ड की कुल संख्या को निरूपित करें। यदि उपलब्ध रिकॉर्ड की संख्या> max_items फिर एक नेक्स्टटोकन पेजिनेशन फिर से शुरू करने के जवाब में प्रदान किया जाएगा।

    • पृष्ठ_आकार प्रत्येक पृष्ठ के आकार को दर्शाता है।

    • शुरुआती_टोकन पृष्ठांकित करने में मदद करता है, और यह पिछली प्रतिक्रिया से NextKeyMarker का उपयोग करता है।

  • चरण 3: boto3 lib . का उपयोग करके AWS सत्र बनाएं . सुनिश्चित करें कि क्षेत्र_नाम डिफ़ॉल्ट प्रोफ़ाइल में उल्लेख किया गया है। यदि इसका उल्लेख नहीं है, तो स्पष्ट रूप से region_name . पास करें सत्र बनाते समय।

  • चरण 4: S3 के लिए AWS क्लाइंट बनाएं।

  • चरण 5: एक पेजिनेटर बनाएं ऑब्जेक्ट जिसमें list_object_versions . का उपयोग करके S3 बकेट के ऑब्जेक्ट संस्करणों का विवरण होता है ।

  • चरण 5: पेजिनेट . को कॉल करें कार्य करें और max_items . पास करें , पृष्ठ_आकार और शुरुआती_टोकन PaginationConfig . के रूप में पैरामीटर, जबकि bucket_name बाल्टी पैरामीटर के रूप में।

  • चरण 6: यह max_size . के आधार पर रिकॉर्ड की संख्या लौटाता है और पृष्ठ_आकार

  • चरण 7: अगर पेजिंग करते समय कुछ गलत हो जाता है तो सामान्य अपवाद को हैंडल करें।

उदाहरण कोड

उपयोगकर्ता खाते में बनाए गए S3 बकेट के ऑब्जेक्ट संस्करणों के माध्यम से पृष्ठांकित करने के लिए निम्न कोड का उपयोग करें -

import boto3
from botocore.exceptions import ClientError

def paginate_through_object_version_s3_bucket(bucket_name, max_items=None:int,page_size=None:int, starting_token=None:string):
   session = boto3.session.Session()
   s3_client = session.client('s3')
   try:
   paginator = s3_client.get_paginator('list_object_versions')
      response = paginator.paginate(Bucket=bucket_name, PaginationConfig={
         'MaxItems':max_items,
         'PageSize':page_size,
         'StartingToken':starting_token}
       )
   return response
   except ClientError as e:
      raise Exception("boto3 client error in paginate_through_object_version_s3_bucket: " + e.__str__())
   except Exception as e:
      raise Exception("Unexpected error in paginate_through_object_version_s3_bucket: " + e.__str__())

#1st Run
a = paginate_through_object_version_s3_bucket('s3-test-bucket',2,5)
print(*a)
#2nd Run
for items in a:
next_token = (items['NextKeyMarker'])
b = paginate_through_object_version_s3_bucket('s3-test-bucket',2,5,next_token)
print(*b)

आउटपुट

#1st Run
{'ResponseMetadata': {'RequestId': 'XEVY**************CD0', 'HostId': **************', 'HTTPStatusCode': 200, 'HTTPHeaders': {'x-amz-id-2': *******************', 'x-amz-request-id': 'XEVYV***************', 'date': 'Sat, 03 Apr 2021 07:14:49 GMT', 'content-type': 'application/xml', 'transfer-encoding': 'chunked', 'server': 'AmazonS3'}, 'RetryAttempts': 0}, 'IsTruncated': True, 'KeyMarker': '', 'VersionIdMarker': '', 'NextKeyMarker': 'analytics-s3/template.json', 'NextVersionIdMarker': 'null',
'Versions': [{'ETag': '"e66659e02"', 'Size': 1554, 'StorageClass': 'STANDARD', 'Key': 'analytics-s3i/param.json', 'VersionId': 'null', 'IsLatest': True, 'LastModified': datetime.datetime(2020, 10, 29, 19, 50, 55, tzinfo=tzutc()), 'Owner': {'DisplayName': 'AWS.Development', 'ID': '928b5bd**************3d70'}},
{'ETag': '"22a4bf7**************9c1ed2612"', 'Size': 1756, 'StorageClass': 'STANDARD', 'Key': 'analytics-s3i/params.json', 'VersionId': 'null', 'IsLatest': True, 'LastModified': datetime.datetime(2021, 3, 10, 20, 10, 47, tzinfo=tzutc()), 'Owner': {'DisplayName': 'AWS.Development', 'ID': '928b5bde*****************2d4423d70'}}],
'Name': 's3-test-bucket', 'Prefix': '', 'MaxKeys': 5, 'EncodingType': 'url', 'DeleteMarkers': None, 'CommonPrefixes': None}

#2nd Run
{'ResponseMetadata': {'RequestId': '3V9*********703V', 'HostId': ****************', 'HTTPStatusCode': 200, 'HTTPHeaders': {'x-amz-id-2': '************************', 'x-amz-request-id': '3V9****************V', 'date': 'Sat, 03 Apr 2021 07:18:56 GMT', 'content-type': 'application/xml', 'transfer-encoding': 'chunked', 'server': 'AmazonS3'}, 'RetryAttempts': 0},
'IsTruncated': True, 'KeyMarker': analytics-s3i2/template.json', 'VersionIdMarker': '', 'NextKeyMarker': 'analytics-s3l/params.json', 'NextVersionIdMarker': 'null', 'Versions':
[{'ETag': '"dbd336ff00cb5af3d"', 'Size': 1557, 'StorageClass': 'STANDARD', 'Key': 'analytics-s3i3/param.json', 'VersionId': 'null', 'IsLatest': True, 'LastModified': datetime.datetime(2020, 10, 28, 18, 16, 38, tzinfo=tzutc()), 'Owner': {'DisplayName': 'AWS.Development', 'ID': '*****************'}},
{'ETag': '"66b49598df6"', 'Size': 21334, 'StorageClass': 'STANDARD', 'Key': 'analytics-s3i3/template.json', 'VersionId': 'null', 'IsLatest': True, 'LastModified': datetime.datetime(2020, 10, 28, 18, 16, 38, tzinfo=tzutc()), 'Owner': {'DisplayName': 'AWS.Development', 'ID': '****************'}}],
'Name': 's3-test-bucket', 'Prefix': '', 'MaxKeys': 5, 'EncodingType': 'url', 'DeleteMarkers': None, 'CommonPrefixes': None}

  1. AWS Glue Security में मौजूद सभी सुरक्षा कॉन्फ़िगरेशन का विवरण प्राप्त करने के लिए Boto3 का उपयोग कैसे करें?

    समस्या का विवरण - AWS Glue Security में मौजूद सभी सुरक्षा कॉन्फ़िगरेशन का विवरण प्राप्त करने के लिए Python में boto3 लाइब्रेरी का उपयोग करें। उदाहरण - एडब्ल्यूएस गोंद सुरक्षा में मौजूद सभी सुरक्षा विन्यास का विवरण प्राप्त करें। इस समस्या को हल करने के लिए दृष्टिकोण/एल्गोरिदम चरण 1 - अपवादों को संभ

  1. AWS Glue Security में मौजूद एक निर्दिष्ट सुरक्षा कॉन्फ़िगरेशन का विवरण प्राप्त करने के लिए Boto3 का उपयोग कैसे करें?

    समस्या का विवरण - AWS Glue Security में मौजूद एक निर्दिष्ट सुरक्षा कॉन्फ़िगरेशन का विवरण प्राप्त करने के लिए Python में boto3 लाइब्रेरी का उपयोग करें। उदाहरण - एडब्ल्यूएस गोंद सुरक्षा में मौजूद एक निर्दिष्ट सुरक्षा कॉन्फ़िगरेशन (नौकरी-सुरक्षा-सेटिंग्स) का विवरण प्राप्त करें। इस समस्या को हल करने के

  1. एडब्ल्यूएस गोंद से गोंद नौकरी को हटाने के लिए Boto3 का उपयोग कैसे करें?

    समस्या का विवरण − अपने खाते में बनाए गए ग्लू जॉब को हटाने के लिए पायथन में boto3 लाइब्रेरी का उपयोग करें। उदाहरण − आपके खाते में बनाए गए ग्लू जॉब transfer_from_s3 को मिटा दें। इस समस्या को हल करने के लिए दृष्टिकोण/एल्गोरिदम चरण 1 - अपवादों को संभालने के लिए boto3 और botocore अपवाद आयात करें। चरण