Marco Trombetti

भविष्य

आप पहचान कर, सर्फिंग और मॅक्रो प्रवाह का अनुमान लगाकर अपनी सफलता के मौकों को बढ़ा सकते हैं। इस तरह के रुझानों की पहचान करने का सबसे आसान तरीका भविष्य की सोच में लगे रहना है। अभी तक कोई टाइम मशीन उपलब्ध नही है: भविष्य के प्रयोग को आजमाने के लिए, आपको इस संदर्भ में होना चाहिए कि अधिकांश लोग उसे ही भविष्य की सोच होने पर यकीन करें। एक शोध प्रयोगशाला, एक अभिनव कंपनी और प्रौद्योगिकी में मजबूत आम रुचि वाले दोस्तों का एक समूह इस का एक बढ़िया उदाहरण हैं।

दीर्घ रुझानों को समझना महत्वपूर्ण है, इस विषय पर मैं यहां एक छोटा सा व्यक्तिगत अनुभव साझा करना चाहता हूँ।

कृत्रिम बुद्धिमत्ता आकर्षक और दहशतपूर्ण है। मानव भाषा और विशेष रूप से अनुवाद शायद मशीनों के लिए सबसे कठिन चुनौतियां हैं। प्राकृतिक भाषा सूचना का एक बहुत संपीड़ित माध्यम है जो विविध अर्थ से भरपूर है और जिसे समझने के लिए शब्दों से परे प्रासंगिक जानकारी की आवश्यकता लाजमी है।

मशीनों के लिए भाषा ही सबसे बड़ी चुनौती है क्योंकि सबसे अधिक स्मानवीय चीज भी यही है।

इसी वजह से, स्वचालित अनुवाद प्रणाली काफी धीरे प्रगति कर रही हैं; लेकिन, वह प्रगति तो अविवादित रूप से कर रहे हैं।

Translated, अनुवाद सेवा की जिसकी मैंने सह-स्थापना की थी, पिछले 17 वर्षों में हमने पेशेवर अनुवादकों को बेहतर और तेज़ी से अनुवाद करने में मदद करने के लिए कृत्रिम बुद्धिमत्ता लागू की है। हमने मानव और मशीन के बीच एक सहजीविता बनाने की कोशिश की है। हमने इसे कई तरीकों से किया है, लेकिन प्रत्येक वाक्य के लिए अनुवादकों को सुझाव (पूर्व-अनुवाद) के साथ एक बहुत ही महत्वपूर्ण दृष्टिकोण प्रदान किया है। हमने व्यावसायिक भाषाविदों के लिए एक अनुवाद उपकरण विकसित किया है जो वेब पर उपलब्ध सभी पेशेवर अनुवादित सामग्री को कृत्रिम बुद्धिमत्ता के साथ जोड़ता है जो पहले कभी नही देखे गए वाक्यों की भविष्यवाणी सलीके से कर सकता है। MateCat के नाम से पहजाने जाने वाले हमारे ओपन-सोर्स उत्पाद का यह आधार है।

अन्यों ने एंड-टू-एंड अनुवाद तकनीक के साथ पेशेवर अनुवादकों की जगह अधिकाधिक विघटनकारी दृष्टिकोणों की कोशिश की है। Google अनुवाद इसका सर्वोत्कृष्ट उदाहरण है।

पेशेवर अनुवादकों की मदद करके हम एक अनूठे अवसर का लाभ उठाने में सक्षम रहें हैं, अर्थात कई वर्षों की अवधि में कृत्रिम बुद्धिमत्ता की प्रगति को मापना।

हमने मापा हैं कि कृत्रिम बुद्धिमत्ता द्वारा प्रदान किए गए सुझावों में पेशेवर अनुवादक कितना सुधार करते हैं और हमने दिन-प्रतिदिन, माह-दर-माह और साल-दर-साल ऐसा किया है।

2003 में, यूरोपीय आयोग के बहुमूल्य वित्तीय सहायता से, हमने एक शोध परियोजना शुरू की जिसमें हमने हज़ारो लाखों शब्दो का अनुवाद किया और हमने पाया कि अंग्रेजी > इतालवी और अंग्रेजी > फ्रेंच के लिए समग्र सुधार दर (पोस्ट-संपादन प्रयास1) 43% रहा। 2015 में, इसी भाषा संयोजन का सुधार दर 27% था। दूसरी बार हमने MateCat में अनुवादित 5 करोड़ शब्दों का इस्तेमाल किया। तंत्रिकीय मशीन अनुवाद और MMT दोनों के संयाजन से, एक अनुवाद प्रणाली जो इस्तेमाल करनेवाले से अनुकूलित होने में सक्षम है, हमारा अनुमान हैं कि हम 2018 में 22% से 26% की सुधार दर तक पहुंच पाएंगे।

एक तकनीक अपनी अधिकतम क्षमता तक पहुंच चुकी हैं जबकी दूसरी अब भी पेश की जा रही होने के कारण यह सुधार अविरत और निरंतर जारी रहेंगे। दो बड़े बदलाव हुए हैं: सांख्यिकीय अनुवाद, जिसकी सेवा 2006 में शुरू हुई, और गहरा अध्ययन, जिसे 2016 के अंत में पेश किया गया।

अगर हम इस रफ़्तार से आगे बढ़ते रहे, तो जब मशीन अनुवाद को ठीक करने की कोई आवश्यकता ही ना रहे उस मुकाम पर हम कब तक पहुंचेंगे?

अगर हम आंकड़ों पर नज़र फेरते हैं, तो ऐसे प्रतीत होता है कि यह 2030 से 2035 के बीच हो सकता है।

हालांकि, एक और दिलचस्प तथ्य है जोकि हम अक्सर नजरअंदाज कर देते हैं: हम मनुष्य दोषरहित नहीं हैं।

जब हमने मानव भाषाविदों द्वारा किए गए शब्द-से-शब्द अनुवाद सुझावों (जिन्हें 100% मैच कहा जाता है) के 2 करोड़ शब्दों का विश्लेषण किया, तो हमने पाया कि अन्य व्यक्तियों के सुझावों में औसत सुधार दर 0% की बजाय 11% है। क्योंकि हम मानते है कि गलती करना तो मानवीय है और यह भी कि हममें से हर एक की अपनी एक अनूठी शैली होती है जिसे हम बढ़ावा देना चाहते हैं। जब हम अपूर्वता की बात करते हैं, तो हमें यह सुनिश्चित करना जरूरी है कि हम न्यूनतम मानदंड को परिभाषित करें। क्या यह पूर्ण निपुणता है? दुनिया का सबसे बढिया अनुवादक? या सिर्फ औसत पेशेवर अनुवादक?

यदि हम ऐसे मशीन से संतुष्ट हैं जो औसत पेशेवर अनुवादक से बेहतर अनुवाद करता है, तो 2025 इन भाषा संयोजनों में 11% सुधार दर तक पहुंचने के लिए अधिक व्यावहारिक तिथि हो सकती है। मेरे ख्याल में, वह भयावह रूप से नज़दीकी मामला है।

मैं सोच रहा था कि शायद मुझे अब Translated बेच देना चाहिए, क्योंकि व्यावसायिक अनुवादों के बाजार में काफी गिरावट आ सकती है, या फिर मुझे इससे भी बढिया अवसर हासिल करने के लिए परिवर्तन के मार्ग को अपनाने की कोशिश करनी चाहिए। अंत में, लोगों को शायद अनुवाद की अधिक ही आवश्यकता होगी, कम की नही। मैं अपने आप को Kodak की तरह फिल्म से डिजिटल के परिवर्तन के दौरान होने वाले बदलाव जैसा महसूस करता हूँ।

सच्चाई यह है कि मुझे इसके बारे में पहले से ही कुछ पता है और इसकी वजह से मैंने पहले ही तय कर लिया था कि हम इस से लडेंगे।

इसकी काफी संभावना है कि भविष्य में हर क्षेत्र में कृत्रिम बुद्धिमत्ता महत्वपूर्ण भूमिका निभाएगी। हालांकि मशीनो के लिए भाषा सबसे कठिन चीज़ है, यह संभव है कि कई अन्य क्षेत्रों में कृत्रिम बुद्धिमत्ता द्वारा इससे भी पहले व्यवधान होगा और स्टार्टअप विचारों के लिए यह एक उत्कृष्ट स्रोत बन सकता है।

1पोस्ट-संपादन प्रयास: हम अनुवाद उद्योग में कहीं और पाए जाने वाले फ़ज़ी मैच के समान एल्गोरिदम का इस्तेमाल सुधार दर को मापने के लिए करते हैं। विराम चिह्नो, बड़ा या छोटा केस और संरूपण त्रुटियों को ध्यान में लेने के लिए समायोजन के साथ एक शब्द-स्तरीय संपादन दूरी।