संपादित 2 सप्ताह पहले द्वारा ExtremeHow संपादकीय टीम
वॉइस असिस्टेंटएआईस्पीच रिकग्निशनओपनएआईएनएलपीबॉटविकासएकीकरणआवाज़इंटरैक्शन
अनुवाद अपडेट किया गया 2 सप्ताह पहले
वॉयस असिस्टेंट बनाना एक रोमांचक परियोजना है जो आपको प्रोग्रामिंग, मशीन लर्निंग, और प्राकृतिक भाषा प्रसंस्करण (NLP) के विभिन्न क्षेत्रों की खोज करने की अनुमति देता है। कृत्रिम बुद्धिमत्ता में हालिया प्रगति के साथ, विशेष रूप से ChatGPT जैसे मॉडल, मजबूत वॉयस-ड्रिवन एप्लिकेशन बनाना आसान होता जा रहा है। इस गाइड में, हम आपको OpenAI द्वारा विकसित एक शक्तिशाली भाषा मॉडल ChatGPT का उपयोग करके एक वॉयस असिस्टेंट डिज़ाइन और कार्यान्वित करने की प्रक्रिया के माध्यम से चलेंगे। चलिए कदम-दर-कदम प्रक्रिया में डुबकी लगाते हैं और वॉयस असिस्टेंट बनाने के लिए आवश्यक घटकों का पता लगाते हैं।
वॉयस असिस्टेंट में आम तौर पर निम्नलिखित मुख्य घटक होते हैं:
शुरू करने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित हैं:
सबसे पहले, आपको अपना विकास परिवेश स्थापित करने की आवश्यकता है। अपने सिस्टम को तैयार करने के लिए इन चरणों का पालन करें:
mkdir voice_assistant
cd voice_assistant
python -m venv venv
venv\Scripts\activate
source venv/bin/activate
pip install openai speechrecognition pyttsx3
हम एक स्पीच रिकग्निशन लाइब्रेरी का उपयोग करेंगे उपयोगकर्ता की वॉयस इनपुट को कैप्चर और पहचानने के लिए। यहाँ इसे लागू करने का एक मूल तरीका है:
import speech_recognition as sr
def listen():
recognizer = sr.Recognizer()
with sr.Microphone() as source:
print("Say something...")
audio = recognizer.listen(source)
try:
text = recognizer.recognize_google(audio)
print(f"You said: {text}")
except sr.UnknownValueError:
print("Sorry, could not understand your speech.")
except sr.RequestError as e:
print(f"Could not request results; {e}")
return text
if __name__ == "__main__":
listen()
यह कोड माइक्रोफोन सेट करता है और वॉयस को सुनता है, जिसे फिर गूगल के स्पीच रिकग्निशन सेवा का उपयोग करके टेक्स्ट में परिवर्तित किया जाता है।
एक बार जब हमें टेक्स्ट इनपुट मिल जाता है, तो ChatGPT का उपयोग करके प्रतिक्रियाएं उत्पन्न करने का समय होता है। पहले, सुरक्षा कारणों से सुनिश्चित करें कि आपकी OpenAI API कुंजी को एक पर्यावरण चर के रूप में सहेजा गया है। अब, चलिए ChatGPT को एकीकृत करते हैं:
import openai
import os
openai.api_key = os.getenv("OPENAI_API_KEY")
def generate_response(prompt):
response = openai.Completion.create(
engine="text-davinci-003",
prompt=prompt,
max_tokens=150
)
return response.choices[0].text.strip()
if __name__ == "__main__":
user_input = "What is the weather today?"
response = generate_response(user_input)
print(f"ChatGPT: {response}")
generate_response
फ़ंक्शन ChatGPT को एक प्रॉम्प्ट भेजता है और एक पूर्ण प्रतिक्रिया लौटती है। आप मॉडल के आउटपुट पर बेहतर नियंत्रण के लिए इंजन और पैरामीटर समायोजित कर सकते हैं।
एक बार जब प्रतिक्रिया उत्पन्न हो जाती है, तो हम इस टेक्स्ट को वापस स्पीच में परिवर्तित करने के लिए pyttsx3 लाइब्रेरी का उपयोग करेंगे:
import pyttsx3
def speak(text):
engine = pyttsx3.init()
engine.say(text)
engine.runAndWait()
if __name__ == "__main__":
response_text = "The weather is sunny today with a high of 75 degrees."
speak(response_text)
यह फ़ंक्शन टेक्स्ट-टू-स्पीच इंजन शुरू करता है, इनपुट टेक्स्ट को बोलता है, और बोलने का कार्य पूरा होने का इंतजार करता है। प्रतिक्रिया निर्माण के साथ इसे जोड़कर एक बातचीत चक्र बनाएं।
अब, चलिए सब कुछ एक ही एप्लिकेशन में संयोजित करते हैं। हम स्पीच रिकग्निशन, ChatGPT एकीकरण, और टेक्स्ट-टू-स्पीच को एक सतत सुनने वाले चक्र में संयोजित करेंगे:
def main():
recognizer = sr.Recognizer()
with sr.Microphone() as source:
while True:
print("Listening...")
audio = recognizer.listen(source)
try:
user_input = recognizer.recognize_google(audio)
print(f"User: {user_input}")
if user_input.lower() in ["exit", "quit", "bye"]:
speak("Goodbye!")
break
response = generate_response(user_input)
print(f"ChatGPT: {response}")
speak(response)
except sr.UnknownValueError:
print("Sorry, could not understand your speech.")
except sr.RequestError as e:
print(f"Could not request results; {e}")
except Exception as e:
print(f"An error occurred: {e}")
if __name__ == "__main__":
main()
इस पूर्ण समाधान में, वॉयस असिस्टेंट तब तक कमांड सुनता रहता है जब तक आप "exit", "leave" या "bye" नहीं कहते। यह प्रत्येक कमांड को ChatGPT का उपयोग करके प्रोसेस करता है और आपको उत्तर पढ़कर सुनाता है।
अब जबकि आपके पास एक बुनियादी वॉयस असिस्टेंट है, उसके कार्यक्षमता को बढ़ाने के लिए यहां कुछ सुझाव दिए गए हैं:
ChatGPT का उपयोग करके वॉयस असिस्टेंट बनाना कई घटकों का एकीकरण करना शामिल है, जिनमें से प्रत्येक समग्र कार्यक्षमता में एक महत्वपूर्ण भूमिका निभाता है। जबकि यह मार्गदर्शिका बुनियादी समझ प्रदान करती है, अपने वॉयस असिस्टेंट को विस्तारित और वैयक्तिकृत करने की उच्चतम संभावना है। चाहे आप इसे व्यक्तिगत उपयोग के लिए ज्यादा विकसित करना चाहें या एक बड़े प्रोजेक्ट के हिस्से के रूप में, इस प्रक्रिया के माध्यम से अर्जित कौशल और ज्ञान अमूल्य होंगे। AI, NLP, और वॉयस रिकग्निशन तकनीक का पता लगाना जारी रखें जब आप अपना डिज़ाइन सुधारें और नवाचार करें।
यदि आपको लेख की सामग्री में कुछ गलत लगता है, आप कर सकते हैं