AI में भी भाषा का खेल? हिंदी में सवाल पूछना पड़ सकता है महंगा, ‘लैंग्वेज टैक्स’ को लेकर नई बहस शुरू
नई दिल्ली: कृत्रिम बुद्धिमत्ता (AI) का उपयोग दुनिया भर में तेजी से बढ़ रहा है, लेकिन हालिया शोध ने एक दिलचस्प और महत्वपूर्ण सवाल खड़ा कर दिया है। दावा किया जा रहा है कि जो लोग अंग्रेजी के बजाय हिंदी, अरबी, चीनी या अन्य भाषाओं में AI चैटबॉट का इस्तेमाल करते हैं, उन्हें समान काम के लिए अधिक लागत चुकानी पड़ सकती है। विशेषज्ञ इस स्थिति को ‘लैंग्वेज टैक्स’ नाम दे रहे हैं।
AI कंपनियां अपने मॉडल को सभी भाषाओं के लिए समान रूप से उपयोगी बताती हैं, लेकिन तकनीकी स्तर पर भाषा की संरचना और टोकन प्रोसेसिंग के तरीके के कारण अलग-अलग भाषाओं के उपयोगकर्ताओं पर लागत का असर अलग हो सकता है।
क्या है टोकन और क्यों बढ़ जाती है लागत?
AI मॉडल किसी भी टेक्स्ट को सीधे शब्दों के रूप में नहीं समझते, बल्कि उसे छोटे-छोटे हिस्सों यानी ‘टोकन’ में विभाजित करके प्रोसेस करते हैं। अधिकांश AI सेवाओं की कीमत भी टोकन की संख्या के आधार पर तय होती है।
समस्या तब पैदा होती है जब एक ही बात हिंदी या किसी अन्य भाषा में लिखने पर अंग्रेजी की तुलना में अधिक टोकन बन जाते हैं। इसका मतलब यह है कि समान जानकारी को प्रोसेस करने के लिए AI सिस्टम को ज्यादा संसाधन खर्च करने पड़ते हैं, जिससे लागत भी बढ़ सकती है।
‘लैंग्वेज टैक्स’ क्यों कहा जा रहा है?
शोधकर्ताओं और डेवलपर्स के बीच इस अतिरिक्त लागत को ‘लैंग्वेज टैक्स’ कहा जा रहा है। उनका तर्क है कि यह ऐसा छिपा हुआ खर्च है, जो उपयोगकर्ता की भाषा के कारण पैदा होता है, न कि उसके द्वारा किए गए वास्तविक कार्य के कारण।
हाल ही में किए गए एक विश्लेषण में विभिन्न भाषाओं में एक ही सामग्री को AI सिस्टम के जरिए प्रोसेस किया गया। इसमें पाया गया कि अंग्रेजी की तुलना में हिंदी टेक्स्ट को समझने के लिए अधिक टोकन की आवश्यकता पड़ी।
शोध में क्या सामने आया?
विश्लेषण के अनुसार, कुछ AI सिस्टम में हिंदी भाषा के लिए अंग्रेजी के मुकाबले लगभग 1.37 गुना अधिक टोकन इस्तेमाल हुए। वहीं कुछ अन्य मॉडल में यही अंतर 3 गुना से भी ज्यादा देखा गया।
अरबी भाषा के लिए लगभग 2.86 गुना और चीनी भाषा के लिए करीब 1.71 गुना अधिक टोकन की जरूरत दर्ज की गई। इससे यह संकेत मिलता है कि कई गैर-अंग्रेजी भाषाओं के उपयोगकर्ताओं को तकनीकी रूप से अधिक टोकन खर्च करने पड़ सकते हैं।
क्या सभी उपयोगकर्ताओं पर पड़ेगा असर?
इसका प्रभाव मुख्य रूप से उन सेवाओं पर पड़ सकता है जहां भुगतान टोकन आधारित होता है या जहां उपयोग की सीमा टोकन संख्या से निर्धारित की जाती है। हालांकि मुफ्त उपयोगकर्ताओं के लिए इसका सीधा आर्थिक असर हमेशा दिखाई नहीं देता, लेकिन टोकन सीमा जल्दी समाप्त होने जैसी स्थितियां उत्पन्न हो सकती हैं।
विशेषज्ञों का मानना है कि जैसे-जैसे AI तकनीक विकसित होगी, विभिन्न भाषाओं के लिए टोकनाइजेशन सिस्टम बेहतर बनाए जाएंगे ताकि अलग-अलग भाषाओं के उपयोगकर्ताओं के बीच यह अंतर कम किया जा सके।
भाषाई समानता पर नई चर्चा
AI के बढ़ते उपयोग के साथ अब यह बहस भी तेज हो रही है कि क्या विभिन्न भाषाओं के उपयोगकर्ताओं को समान अनुभव और समान लागत मिल रही है। तकनीकी विशेषज्ञों का कहना है कि भविष्य के AI मॉडल में बहुभाषी दक्षता बढ़ाना और भाषाओं के बीच लागत संबंधी असमानता कम करना बड़ी चुनौती होगी।
