छवि: यिंगयाईपुमी/एडोब स्टॉक मोज़ेकएमएल 1.3 बिलियन डॉलर के सौदे में डेटाब्रिक्स परिवार में शामिल हो जाएगा और मालिकाना जनरेटिव कृत्रिम बुद्धिमत्ता मॉडल के निर्माण के लिए अपनी “फैक्ट्री” प्रदान करेगा, डेटाब्रिक्स ने सोमवार को घोषणा की। बौद्धिक संपदा उल्लंघनों के डर को कम करने के लिए कंपनियां इस तरह एआई का उपयोग कर सकती हैं।
डेटाब्रिक्स की डेटा प्रबंधन तकनीक और मोज़ेकएमएल की एआई मॉडल बनाने की क्षमता का संयोजन कंपनियों को ओपनएआई के चैटजीपीटी जैसे सार्वजनिक जेनरेटर एआई पर निर्भर रहने के बजाय अपने स्वयं के बड़े भाषा प्लेटफॉर्म बनाने की अनुमति देगा।
मोज़ेकएमएल ने दो जेनरेटिव एआई फाउंडेशन मॉडल बनाए हैं : एमपीटी-7 (6.7 बिलियन मापदंडों के साथ) और एमपीटी- ((के साथ) .9 बिलियन पैरामीटर)। एमपीटी फाउंडेशन मॉडल डेटाब्रिक्स के अपने ओपन-सोर्स एलएलएम में शामिल हो जाएंगे: डॉली 1 और 2।
यहां जाएं:
डाटाब्रिक्स ने मोज़ेकएमएल को क्यों चुना डेटाब्रिक्स क्या है? निजी” एआई लक्ष्य एआई प्रशिक्षण, मोड़ और निर्माण को आसान बनाना है मोज़ेकएमएल के प्रतिस्पर्धी कौन हैं? डेटाब्रिक्स + एआई शिखर सम्मेलन से अधिक समाचार डेटाब्रिक्स ने मोज़ेकएमएल को क्यों चुना मोज़ेकएमएल डेटाब्रिक्स अधिग्रहण के लिए सही विकल्प था क्योंकि इसमें “सबसे आसान” है डेटाब्रिक्स के सीईओ और सह-संस्थापक अली घोडसी ने मंगलवार को डेटाब्रिक्स + एआई शिखर सम्मेलन में कहा, “बाजार में उपयोग के लिए कारखाना।” एक समान, प्रतिस्पर्धी कंपनी संस्कृति एक कारण के रूप में मोज़ेकएमएल के लिए उपयुक्त थी।
अधिग्रहण अभी भी विनियामक अनुमोदन के माध्यम से चल रहा है; यह सौदा जुलाई के अंत तक पूरा होने की उम्मीद है। घोडसी ने कहा, डेटाब्रिक्स के पास इस बारे में अधिक जानकारी होगी कि प्रक्रिया पूरी होने के बाद मोज़ेकएमएल के एआई प्रशिक्षण और अनुमान उत्पाद डेटाब्रिक्स सॉफ़्टवेयर के साथ कैसे एकीकृत होंगे।
डेटाब्रिक्स क्या है? डेटाब्रिक्स मुख्य रूप से उद्यम संगठनों के लिए डेटा भंडारण और डेटा प्रबंधन सॉफ्टवेयर प्रदान करता है, साथ ही डेटा प्लेटफ़ॉर्म माइग्रेशन और डेटा एनालिटिक्स को भी संभालता है। डेटाब्रिक्स ने AWS और अन्य बड़े एंटरप्राइज़ सॉफ़्टवेयर और सॉफ़्टवेयर-ए-ए-सर्विस प्रदाताओं के साथ साझेदारी की है।
डेटाब्रिक्स निजी एआई से भरे भविष्य की योजना क्यों बना रहा है घोडसी ने बताया कि उनकी कंपनी ” फ़ैक्टरियाँ” जहाँ ग्राहक अपने स्वयं के विनिर्देशों के अनुसार एलएलएम का निर्माण और प्रशिक्षण कर सकते हैं। इसका मतलब यह है कि कंपनियों को एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस कनेक्शन के लिए भुगतान नहीं करना पड़ेगा या मॉडल का उपयोग करने वाले किसी अन्य व्यक्ति के साथ मालिकाना डेटा साझा नहीं करना पड़ेगा; बाद वाला चैटजीपीटी या गूगल बार्ड का उपयोग करने वाली कंपनियों के लिए चिंता का विषय बन गया है। डेटाब्रिक्स ग्राहक डॉली और एमपीटी परिवारों के बीच चयन करने या मौजूदा मॉडलों में से किसी एक पर कस्टम जेनरेटिव एआई बनाने में सक्षम होंगे।
देखें: यह कैसे तय करें कि सार्वजनिक या निजी जेनरेटर एआई मॉडल आपके संगठन के लिए सही है (टेकरिपब्लिक)
बंद स्रोत या ओपन-सोर्स एआई फाउंडेशन मॉडल का उपयोग करना है या नहीं यह हर किसी के दिमाग में लड़ाई है आज, घोडसी ने कहा। डेटाब्रिक्स दृढ़ता से खुले स्रोत के पक्ष में है। शिखर सम्मेलन में एक प्रश्नोत्तर सत्र के दौरान कहा गया। “यह महत्वपूर्ण है कि हम उनकी ताकत, उनकी कमजोरियों, उनके पूर्वाग्रहों आदि को समझें।
“लेकिन हम यह भी सोचते हैं कि, सबसे महत्वपूर्ण बात, कंपनियां चाहती हैं अपने स्वयं के मॉडल के मालिक होने के लिए… वे किसी द्वारा प्रदान किए गए केवल एक मॉडल का उपयोग नहीं करना चाहते हैं, क्योंकि यह बौद्धिक संपदा है। और यह प्रतिस्पर्धी है।”
घोडसी ने कहा, ग्राहक अपने स्वयं के आईपी को नियंत्रित करना चाहते हैं और अपने डेटा को लॉक रखना चाहते हैं। डेटा प्रबंधन और एनालिटिक्स सॉफ्टवेयर कंपनी अलेशन के मुख्य प्रौद्योगिकी अधिकारी जुनैद सैय्यद भी ग्राहकों को जेनरेटिव एआई के बारे में पूछते हुए पाते हैं। हालाँकि, संगठनों के लिए यह जानना महत्वपूर्ण है कि वे प्रशिक्षण मॉडल को जो डेटा दे रहे हैं वह अच्छा है, उन्होंने TechRepublic को एक ईमेल में कहा।
” सैय्यद ने कहा, डेटा स्रोतों के प्रसार और डेटा की बढ़ती मात्रा ने लोगों के लिए अपने एआई मॉडल को प्रशिक्षित करने के लिए आवश्यक विश्वसनीय, शासित डेटा की खोज करना पहले से कहीं अधिक कठिन बना दिया है। “वास्तव में प्रभावी होने के लिए, जेनरेटर मॉडल को डोमेन-विशिष्ट डेटा कैटलॉग पर ठीक से ट्यून किया जाना चाहिए, और मनुष्यों को उनके आउटपुट की समीक्षा करनी चाहिए।”
सार्वजनिक या मालिकाना AI के बीच कैसे निर्णय लें कन्वर्सेशनल एआई और ऑटोमेशन कंपनी यूनिफोर के सह-संस्थापक और मुख्य कार्यकारी अधिकारी, उमेश सचदेव, उद्यम नेताओं को सलाह देते हैं कि वे यह तय करते समय खुद से निम्नलिखित प्रश्न पूछें कि क्या मोज़ेकएमएल जैसे फाउंडेशन मॉडल पर अपना एआई बनाना है या जीपीटी जैसे सार्वजनिक एआई का उपयोग करना है। शृंखला:
मॉडल प्रदाता मेरी लागत क्या होगी, और कितनी होगी जीपीयू के कारण बुनियादी ढांचे की लागत में वृद्धि? यदि हमारा उद्यम चैटजीपीटी का उपयोग करता है, तो क्या हम उन सामग्री प्रदाताओं के कानूनी निशाने पर होंगे जो डेटा के स्वामित्व या प्रशिक्षण को कानूनी रूप से चुनौती दे रहे हैं? यदि हम सार्वजनिक या खुले डेटा पर प्रशिक्षित किसी चीज़ का उपयोग नहीं करना चाहते हैं, लेकिन हमारे अपने उद्योग से अधिक स्वामित्व वाले डेटासेट का उपयोग करना चाहते हैं, तो हम पूछ सकते हैं कि क्या हमारा सारा डेटा एक ही स्थान पर तैयार है। यदि हमारा पायलट सफल हो जाता है, तो क्या इसका पैमाना बढ़ाया जाएगा? हमारी सभी विरासत प्रणालियों को इस एआई परत से जोड़ने के बारे में क्या ख्याल है? लक्ष्य एआई प्रशिक्षण, मोड़ और निर्माण को आसान बनाना है घोडसी ने डेटाब्रिक्स + एआई शिखर सम्मेलन में कहा, “अधिकांश संगठनों के लिए, उनके पास विशेष कार्य हैं जिन्हें वे करना चाहते हैं… और इसके लिए, हम चाहते हैं कि वे विशिष्ट मॉडलों को प्रशिक्षित और ट्यून करने में सक्षम हों।” घोडसी ने कहा, उद्यम ग्राहकों को जेनरेटिव एआई बनाने के लिए तकनीकी कौशल की एक निश्चित सीमा की आवश्यकता होती है। उनका अनुमान है कि मोज़ेकएमएल एआई प्रौद्योगिकी के निर्माण और प्रशिक्षण के लिए एक आसान तरीके की आवश्यकता को पूरा कर सकता है।
“उम्मीद है, अंततः, हम इसे बनाएंगे घोडसी ने शिखर सम्मेलन में कहा, “कुछ क्लिक के साथ आप कुछ कर सकते हैं।” सचदेव ने TechRepublic को एक ईमेल में कहा, डेटा संप्रभुता, स्केलेबिलिटी और लागत के बारे में बहुत कुछ उजागर करने की जरूरत है। “कंपनियां घोषणाएं और निर्णय लेने के लिए तेजी से आगे बढ़ रही हैं, लेकिन अधिकांश बड़ी तकनीकी लहरों की तरह, अवसर विकास की दूसरी या तीसरी लहर में सामने आएंगे।”
सैयद ने कहा, “यह एआई परिवर्तन व्यवसाय और प्रौद्योगिकी नेताओं को बता रहा है कि उनके डेटा वातावरण की वास्तविक स्थिति क्या है।” “डेटा इंटेलिजेंस प्लेटफ़ॉर्म और फ़ेडरेटेड डेटा गवर्नेंस वाले संगठन उन लोगों से पहले GenAI की शक्ति का लाभ उठाने में सक्षम होंगे जो अब केवल [अपनी] डेटा प्रबंधन रणनीति को आधुनिक बनाने में निवेश कर रहे हैं।”
मोज़ेकएमएल के प्रतिस्पर्धी कौन हैं? एआई प्रशिक्षण के क्षेत्र में प्रतिस्पर्धा भयंकर है; MosaicML NVIDIA, OpenAI, Anthropic और Google के साथ प्रतिस्पर्धा करता है। सोमवार को, NVIDIA ने स्नोफ्लेक डेटा क्लाउड में NVIDIA NeMo LLM डेवलपमेंट प्लेटफॉर्म और NVIDIA GPU-त्वरित कंप्यूटिंग को जोड़ने के लिए स्नोफ्लेक के साथ साझेदारी की घोषणा की।
डेटाब्रिक्स + एआई शिखर सम्मेलन से अधिक समाचार डेटाब्रिक्स + एआई शिखर सम्मेलन से चार अन्य प्रमुख अपडेट सामने आए:
डेल्टा लेक ओपन-सोर्स स्टोरेज फ्रेमवर्क होगा अब संस्करण 3.0 में उपलब्ध है, जो आसान पहुंच के लिए यूनिवर्सल फॉर्मेट (यूनिफॉर्म), डेल्टा कनेक्टर के लिए कर्नेल और लिक्विड क्लस्टरिंग डेटा लेआउट जोड़ता है। लेकहाउसआईक्यू एक प्राकृतिक है डेटाब्रिक्स यूनिटी कैटलॉग में भाषा चैट एआई चल रहा है। लेकहाउस एआई लेकहाउस डेटा प्लेटफॉर्म पर एलएलएम के लिए एक टूलकिट है; लेकहाउस फ़ेडरेशन पहले से सिल्ड डेटा मेश आर्किटेक्चर को एकीकृत करने का एक उपकरण है।
Be First to Comment