Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन में पाइडब और गूगल स्पीच रिकग्निशन एपीआई का उपयोग करके ऑडियो प्रोसेसिंग

इस ट्यूटोरियल में, हम ऑडियो फाइलों के साथ काम करने जा रहे हैं। हम इसमें सामग्री को पहचानने के लिए ऑडियो को टुकड़ों में तोड़ देंगे। हम ऑडियो फाइलों की सामग्री को टेक्स्ट फाइलों में भी स्टोर करेंगे। नीचे दिए गए आदेशों का उपयोग करके निम्नलिखित मॉड्यूल स्थापित करें।

पाइप इंस्टॉल पाइडब

यदि आप उपरोक्त आदेश चलाते हैं, तो आपको निम्न सफल संदेश प्राप्त होगा

pydub को एकत्रित करना https://files.pythonhosted.org/packages/79/db/eaf620b73a1eec3c8c6f8f5b0b236a50f9da88ad57802154b7ba7664d0b8/pydub-0.23.1-py2.py3-uncess-none-any इंस्टॉल किए गए पैकेज:pydub-0.23.1-py2.py3-uncess- कोई-कोई भी इंस्टॉल नहीं किया गया। पूर्व> 
पाइप इंस्टॉल ऑडियोरीड

यदि आप उपरोक्त आदेश चलाते हैं, तो आपको निम्न सफल संदेश प्राप्त होगा।

ऑडियोरीड एकत्रित करनाडाउनलोड करना https://files.pythonhosted.org/packages/2e/0b/940ea7861e0e9049f09dcfd72a90c9ae55f697c17c299a323f0148f913d2/audioread-2.1.8.tar.gzऑडियो पठन के लिए व्हील बनाना:ऑडियोरीड के लिए बिल्डिंग व्हील (सेटअप। ऑडियोरीड (setup.py):'हो गया' स्थिति के साथ समाप्त ऑडियोरीड के लिए बनाया गया पहिया:फ़ाइल नाम=ऑडियोरीड-2.1.8-cp37-none-any.whl आकार=23098 sha256=92b6f46d6b4726e7a13233dc9d84744ba74e23187123e67f663650f24390dc9d निर्देशिका में संग्रहीत डेटा:CAppedData \Local\pip\Cache\wheels\b9\64\09\0b6417df9d8ba8bc61a7d2553c5cebd714ec169644c88fc012सफलतापूर्वक निर्मित ऑडियोरीडसंग्रहित पैकेज स्थापित करना:ऑडियोरीडसफलतापूर्वक स्थापित ऑडियोरीड-2.1.8
पाइप इंस्टाल स्पीच रिकॉग्निशन

यदि आप उपरोक्त आदेश चलाते हैं, तो आपको निम्न सफल संदेश प्राप्त होगा।

स्पीच रिकॉग्निशन को एकत्रित करना डाउनलोड करना 3.8.1

हमारे पास इस प्रक्रिया में दो चरण हैं।

  • ऑडियो को टुकड़ों में तोड़ना।

  • हमें SpeechRecognition . का उपयोग करके सामग्री को निकालना होगा ।

अपनी लाइब्रेरी से एक ऑडियो फ़ाइल लें। आइए कोड शुरू करें।

उदाहरण

# मॉड्यूल आयात करना pydubimport भाषण_पहचान# ऑडियो फ़ाइल प्राप्त करना =pydub.AudioSegment.from_wav('audio.wav')# मिलीसेकंड में ऑडियो की लंबाई ऑडियो_लंबाई =लेन (ऑडियो) प्रिंट (f'ऑडियो लंबाई:{ऑडियो_लंबाई}' )# चंक काउंटरचंक_काउंटर =1ऑडियो_टेक्स्ट =ओपन ('ऑडियो_टेक्स्ट.txt', 'w+')# सेटिंग जहां ऑडियोपॉइंट को स्लाइस करना है =60000# ओवरलैप - स्लाइसिंगरेम के बाद शेष ऑडियो =8000# चंक्स और एंडिंगफ्लैग को ट्रैक करने के लिए वैरिएबल शुरू करना =0स्टार्ट =0एंड =0# रेंज में रेमफोर i की वृद्धि के साथ ऑडियो के माध्यम से पुनरावृत्ति (0, 2 * audio_length, बिंदु):# पहले पुनरावृत्ति अंत में =रेम अगर i ==0:प्रारंभ =0 अंत =बिंदु अन्य:# अन्य पुनरावृत्तियों प्रारंभ =अंत - रेम एंड =स्टार्ट + पॉइंट # अगर एंड ऑडियो_लेंथ से बड़ा है अगर एंड> =ऑडियो_लेंथ:एंड =ऑडियो_लेंथ # स्टॉप फ्लैग को इंगित करने के लिए =1 # ऑडियो चंक से एक चंक प्राप्त करना =ऑडियो [स्टार्ट:एंड] # चंक नाम चंक_नाम =f'chunk_{chunk_counter}' # c को स्टोर करना स्थानीय भंडारण के लिए हंक। ऑडियो से # पहचानकर्ता पहचानकर्ता को प्रारंभ करना =वाक्_पहचान। पहचानकर्ता () # स्पीच_रिकग्निशन के साथ एक सुने हुए ऑडियो का निर्माण करना। ऑडियोफाइल (चंक_नाम) चंक_ऑडियो के रूप में:चंक_लिस्टेड =पहचानकर्ता। सुनें (चंक_ऑडियो) # ऑडियो से सामग्री को पहचानने का प्रयास करें:# से सामग्री प्राप्त करना खंड सामग्री =पहचानकर्ता.पहचान_गूगल(chunk_listened) # फ़ाइल को लिखना त्रुटि के रूप में:प्रिंट ('इंटरनेट से कनेक्ट नहीं हो सकता') # ध्वज की जाँच करें यदि ध्वज ==1:audio_text.close() टूट जाता है

आउटपुट

यदि आप उपरोक्त कोड चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।

ऑडियो लंबाई:480052chunk_1 प्रारंभ:0 अंत:60000chunk_2 प्रारंभ:52000 अंत:112000chunk_3 प्रारंभ:104000 अंत:164000chunk_4 प्रारंभ:156000 अंत:216000chunk_5 प्रारंभ:208000 समाप्त:268000chunk_6 प्रारंभ:260000 अंत:320000chunk_7 प्रारंभ:312000chunk_8 प्रारंभ:372000chunk_7 प्रारंभ::364000 अंत:424000chunk_9 प्रारंभ:416000 अंत:476000chunk_10 प्रारंभ:468000 अंत:480052

फ़ाइल सामग्री की जाँच कर रहा है।

# फ़ाइल को फ़ाइल के रूप में ओपन ('audio_text.txt', 'r') के साथ रीड मोड में खोलना:प्रिंट (file.read ())

यदि आप उपरोक्त कोड चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।

अंग्रेज़ी और मैं यहाँ सैन फ़्रांसिस्को में हूँ मैं वापस सैन फ़्रांसिस्को में पिछले हफ्ते हम टेक्सास में एक शिक्षण देश में थे और द रीडर ऑफ़ टीचिंग कॉन्फ़्रेंस एक प्लेन था शिक्षण को फिर से सुधारें परिणामस्वरूप आप खराब के साथ हाउस बैकअप फ़ाइल हैं इसमें कुछ अंग्रेज़ी थी जल्द ही आ रहा है एक दिन केवल 12 बजे 1 बजे उसकी अंग्रेजी के बारे में सब कुछ अभी या मेरी ईमेल सूचियों पर पावरिंग आपके शहर में खेल अपना ईमेल ईमेल देखें हरजीत प्रेमिकाअगले मंगलवार कार्यालय का आनंद लेते हुए वर्ष की जांच करें अंग्रेजी सुनते रहें मुस्कुराते रहें अपनी अंग्रेजी सीखने का आनंद लेते रहें

निष्कर्ष

यदि आपको ट्यूटोरियल के बारे में कोई संदेह है, तो उनका टिप्पणी अनुभाग में उल्लेख करें।


  1. पायथन में gmplot पैकेज का उपयोग करके Google मानचित्र को प्लॉट करना?

    ऐसे कई तरीके हैं जिनसे आप Google मानचित्र पर भौगोलिक निर्देशांक बना सकते हैं। हालाँकि, यदि आप इसे स्थानीय फ़ाइल में सहेजना चाहते हैं, तो इसे पूरा करने का एक बेहतर तरीका gmplot नामक एक अजगर मॉड्यूल के माध्यम से है। पायथन लाइब्रेरी जीएमप्लॉट हमें गूगल मैप्स पर डेटा प्लॉट करने की अनुमति देता है। Googl

  1. पायथन में समाचार एपीआई का उपयोग करके शीर्ष समाचार प्राप्त करना

    समाचार एपीआई किसी भी वेब साइट से समाचार लेख खोजने और लाने के लिए बहुत प्रसिद्ध एपीआई है, इस एपीआई का उपयोग करके कोई भी किसी भी वेब साइट से शीर्ष 10 शीर्ष समाचार प्राप्त कर सकता है। लेकिन इस एपीआई का इस्तेमाल करने के लिए एक चीज की जरूरत होती है जो कि एपीआई की है। उदाहरण कोड import requests def

  1. मैक पर पायथन 3 का उन्नयन और उपयोग करना

    आप सोच सकते हैं कि आपके बिलकुल नए Mac में सभी प्रासंगिक सॉफ़्टवेयर का नवीनतम संस्करण है। अधिकांश उपयोगकर्ता ऐप्स के लिए, आप सही होंगे, लेकिन अंतर्निहित ढांचे के लिए यह एक अलग कहानी है। नए मैक अभी भी पायथन 2.7.10 के साथ जहाज करते हैं, भले ही सबसे हालिया स्थिर रिलीज पायथन 3.5 है। यदि यह संस्करणों के ब