OpenAI DevDay 2024 : AI को और सस्ता और सुलभ बनाने के लिए चार नए फीचर्स
AI की दिग्गज कंपनी OpenAI ने हाल ही में अपने दूसरे डेवलपर सम्मेलन, DevDay का आयोजन किया। पिछले साल 2023 के DevDay में जहाँ GPT-4 Turbo, Assistants API, और Custom GPTs जैसे कई नए प्रोडक्ट्स लॉन्च किए गए थे, इस साल का कार्यक्रम थोड़ा शांत रहा और कोई बड़ा प्रोडक्ट लॉन्च नहीं किया गया। फिर भी, इस कार्यक्रम में कुछ छोटे-मोटे सुधार दिखाए गए और कंपनी ने अपने भविष्य की योजनाओं के बारे में बताया।

OpenAI ने इस कार्यक्रम में चार नए फीचर्स पेश किए – Vision Fine-Tuning, Realtime API, Prompt Caching, और Model Distillation। ये टूल्स डेवलपर्स को बेहतर एप्लिकेशन बनाने में मदद करेंगे, जिससे वे इस प्रतिस्पर्धी बाज़ार में टिके रह सकें। DevDay 2024 के ज़रिए, सैम ऑल्टमैन के नेतृत्व वाली कंपनी का लक्ष्य डेवलपर्स को सशक्त बनाना है। यह कंपनी की रणनीति में एक बड़ा बदलाव है, खासकर उस समय जब बड़ी टेक कंपनियाँ AI के क्षेत्र में तेज़ी से आगे बढ़ रही हैं।
आइए OpenAI के इन नए टूल्स पर एक नज़र डालें :
- Realtime API (रियलटाइम API) : OpenAI ने Realtime API को पब्लिक बीटा में पेश किया है। यह टूल सभी पेड डेवलपर्स को अपने एप्स में कम लेटेंसी और मल्टीमोडल अनुभव बनाने की सुविधा देता है। ChatGPT के Advanced Voice Mode की तरह, Realtime API छह अलग-अलग आवाज़ों (जैसे alloy, echo, fable, onyx, nova, और shimmer) के साथ प्राकृतिक स्पीच-टू-स्पीच बातचीत की सुविधा देता है। यह भी बताया कि वे Chat Completions API में ऑडियो इनपुट और आउटपुट की सुविधा भी जोड़ेंगे। डेवलपर्स GPT-4o में कोई भी टेक्स्ट या ऑडियो इनपुट दे सकते हैं और मॉडल टेक्स्ट, ऑडियो या दोनों में जवाब दे सकता है।
- Vision Fine-Tuning (विज़न फाइन-ट्यूनिंग) : यह इस कार्यक्रम का एक महत्वपूर्ण अपडेट था। OpenAI ने अपने सबसे शक्तिशाली लार्ज लैंग्वेज मॉडल GPT-4o के लिए विज़न फाइन-ट्यूनिंग की घोषणा की। इस फीचर से डेवलपर्स AI मॉडल की तस्वीरों और टेक्स्ट को समझने की क्षमता को अपने हिसाब से बदल सकते हैं। यह अपडेट भविष्य में सेल्फ-ड्राइविंग कार, विज़ुअल सर्च, मेडिकल इमेजिंग आदि क्षेत्रों में फायदेमंद हो सकता है।
विज़न फाइन-ट्यूनिंग की प्रक्रिया टेक्स्ट फाइन-ट्यूनिंग जैसी ही है। डेवलपर्स अब तस्वीरों के डेटासेट को सही फॉर्मेट में तैयार करके OpenAI के प्लेटफॉर्म पर अपलोड कर सकते हैं। कंपनी ने बताया कि यह फीचर सिर्फ 100 तस्वीरों के साथ भी GPT-4o के विज़न टास्क के प्रदर्शन को सुधार सकता है। ज्यादा टेक्स्ट और इमेज डेटा के साथ इसका प्रदर्शन और भी बेहतर हो सकता है।
- Prompt Caching (प्रॉम्प्ट कैशिंग) : प्रॉम्प्ट कैशिंग DevDay 2024 का मुख्य आकर्षण था। यह नया फीचर डेवलपर्स के लिए खर्च और लेटेंसी कम करने के लिए बनाया गया है। कई डेवलपर्स AI एप्स बनाते समय एक ही कॉन्टेक्स्ट को बार-बार अलग-अलग API कॉल्स में इस्तेमाल करते हैं, जिससे प्रोसेस जटिल हो जाता है। OpenAI ने अपने आधिकारिक पोस्ट में कहा, “आज हम प्रॉम्प्ट कैशिंग पेश कर रहे हैं, जो डेवलपर्स को खर्च और लेटेंसी कम करने में मदद करेगा। हाल ही में देखे गए इनपुट टोकन्स को फिर से इस्तेमाल करके, डेवलपर्स को 50 प्रतिशत की छूट और तेज़ प्रॉम्प्ट प्रोसेसिंग टाइम मिल सकता है।”
ये सभी अपडेट्स दर्शाते हैं कि OpenAI डेवलपर्स की ज़रूरतों को ध्यान में रखते हुए AI तकनीक को और भी उपयोगी, किफायती और सुलभ बनाने की कोशिश कर रहा है।
Check Out – Best in the segment Moto G85 5G की पूरी फोन विशिष्टताएँ..