सीजी भास्कर, 24 जून। कृत्रिम बुद्धिमत्ता का इस्तेमाल अब तेजी से आम लोगों की दिनचर्या का हिस्सा बनता (Language Tax) जा रहा है। मोबाइल से लेकर दफ्तरों तक लोग अपनी भाषा में चैटबॉट्स से बातचीत कर रहे हैं। लेकिन हाल के दिनों में एक नई चर्चा ने तकनीक जगत का ध्यान खींचा है, जिसमें हिंदी समेत कई भाषाओं में बातचीत करने की कीमत को लेकर सवाल उठ रहे हैं।
तकनीक से जुड़े विशेषज्ञों और शोधकर्ताओं के बीच इस बात पर बहस तेज हो गई है कि क्या अलग-अलग भाषाओं के उपयोगकर्ताओं को समान सेवा के लिए अलग तरह की लागत चुकानी पड़ रही है। ताजा अध्ययन में सामने आए आंकड़ों ने गैर-अंग्रेजी भाषाओं का उपयोग करने वालों की चिंता बढ़ा दी है।
आखिर क्या है भाषा शुल्क Language Tax
रिसर्च के अनुसार हिंदी, अरबी और चीनी जैसी भाषाओं में कृत्रिम बुद्धिमत्ता आधारित सेवाओं का उपयोग करने पर अंग्रेजी की तुलना में अधिक टोकन खर्च होते हैं। कई भुगतान आधारित सेवाओं में शुल्क टोकन की संख्या के आधार पर तय होता है, इसलिए टोकन बढ़ने से लागत भी बढ़ सकती है।
टोकन से कैसे तय होती है लागत
किसी भी टेक्स्ट को समझने के लिए कृत्रिम बुद्धिमत्ता मॉडल उसे छोटे-छोटे हिस्सों में बांटता है, जिन्हें टोकन कहा जाता है। सवाल और जवाब दोनों के दौरान टोकन का इस्तेमाल होता है। जितने अधिक टोकन होंगे, उतनी अधिक प्रोसेसिंग की जरूरत पड़ेगी। रिसर्च में बताया गया है कि एक जैसी जानकारी को हिंदी में लिखने पर अंग्रेजी की तुलना में ज्यादा टोकन बनते हैं। इसका मतलब है कि समान काम के लिए सिस्टम को अतिरिक्त संसाधन लगाने पड़ते हैं।
शोध में क्या मिला
कृत्रिम बुद्धिमत्ता क्षेत्र के शोधकर्ताओं ने अलग-अलग भाषाओं में एक ही सामग्री का विश्लेषण (Language Tax) किया। इसके लिए विभिन्न टोकनाइजेशन सिस्टम की तुलना की गई, ताकि यह समझा जा सके कि कौन सी भाषा कितने टोकन उत्पन्न करती है।
हिंदी में कितना ज्यादा अंतर
विश्लेषण में पाया गया कि एक प्रमुख टोकनाइजर पर हिंदी टेक्स्ट को प्रोसेस करने के लिए अंग्रेजी के मुकाबले लगभग 1.37 गुना अधिक टोकन की आवश्यकता पड़ी। इससे यह संकेत मिलता है कि हिंदी उपयोगकर्ताओं के लिए लागत अपेक्षाकृत बढ़ सकती है।
अन्य भाषाओं में भी दिखा असर
एक अन्य विश्लेषण में हिंदी के लिए 3.24 गुना, अरबी के लिए 2.86 गुना और चीनी भाषा के लिए 1.71 गुना अधिक टोकन उपयोग होने की बात सामने (Language Tax) आई। इससे स्पष्ट होता है कि यह चुनौती केवल हिंदी तक सीमित नहीं है, बल्कि कई गैर-अंग्रेजी भाषाओं के उपयोगकर्ताओं को प्रभावित कर सकती है।





