scheduleमगलवार श्रावण २९ गते, २०७५

इसरकार कि ईस ! सरकार

भाषा प्रविधि र भाषाप्रविधि

वर्तमान युगलाई प्रविधि (कम्प्युटर) को युग भनिन्छ । सन् १९३८ मा अलेन टुरिनको कृत्रिम बुद्धिले सञ्चालन हुन सक्ने मेसिन (टुरिन मेसिन) लाई कम्प्युटरको जन्म मान्दा आज असी वर्ष पुगेर एकासी वर्ष लागेछ । आज प्रविधि यस्तो वस्तु भइसक्यो जसको अभावमा अब सामाजिक व्यवहार चल्न प्राय: असम्भव हुन्छ । तर यही प्रविधिको ऐतिहासिकता केलाउँदै जाँदा आजका सूचना प्रविधिमा साम्राज्य जमाएका अमेरिका, वेलायत, जापान र दक्षिण कोरिया जस्ता देशहरुले भाषाप्रविधि माध्यमबाट यति ठूलो उपलब्धी हासिल गर्न सकेको देखिन्छ ।

कुनै पनि विषयलाई प्रष्ट्याउने काम भाषाले गर्दछ । भाषा यस्तो विषय हो जसले आज सम्मको मानवीय उपलव्धीलाई मूर्तरुप दिने काम गरेको छ । सूचना प्रविधिको विकासक्रमलाई नियाल्दा भाषाको धेरै टूलो योगदान देखिन्छ । गणित र तर्कशास्त्रका ज्ञाता नोम चम्स्की भाषाको चास्नीमा डुबेर अङ्ग्रेजी व्याकरणलाई सूचना प्रविधिको क्षेत्रमा उतार्न सफल भए । आज कम्प्युटर विज्ञानका क्षेत्रमा चम्स्की व्याकरणका चार तहलाई अनिवार्य अध्याहारका रुपमा लिइन्छ ।

चम्स्कीको यो व्याकरण कम्प्युटरका क्षेत्रमा आउनु भन्दा पहिलेदेखि नै अमेरिकामा प्रविधि र भाषालाई जोडने प्रयास भएको देखिन्छ । सन् १९४६ मा वर्तमान इराकको राजधानी बगदादबाट गणितज्ञ येहोसुहा बार हिलेल अमेरिकाको म्यासाच्युसेट प्रविधि प्रतिष्ठानमा गणित र कृत्रिम बौद्धिकताको प्राध्यापनमा आमन्त्रित भएर गएपछि एम आइ टी अमेरिकामा गणित र भाषाको सम्बन्धका बारेमा निकै ठुलो काम गरे । सन् १९५३ पछि चम्स्कीको उदय भयो र सूचना प्रविधिमा कृत्रिम बौद्धिकताले भाषासँग अझ बलियो नाता जोड्यो । सन १९५८-६० देखि त जोन बाकुज र पिटर नाउरको नामबाटै बी एन एफ व्याकरण (बिएनएफ ग्रामर) को सूत्रपात भयो । जुन व्याकरणबिना आज कम्प्युटर अनुप्रयोगको कल्पना पनि गर्न सकिदैन । भाषाप्रविधिको यस पृष्टभूमिलाई हेर्दा के प्रष्ट हुन्छ भने सूचना प्रविधिको विकासमा भाषाविद, गणितज्ञ र तर्कशास्त्रीहरुको सामूहिक प्रयासबाट कम्प्युटरमा भाषिक अनुप्रयोगले काम गर्न सकेको प्रष्ट हुन्छ ।

डा. लक्ष्मीप्रसाद खतिवडा

त्यसो हो भने के अङ्ग्रेजी कम्प्युटरको मातृभाषा हो त ? स्पष्ट भन्न सकिन्छ, होइन । अङ्ग्रेजी भाषालाई माध्यमका रुपमा प्रयोग गरेर कम्प्युटरले बुझ्ने कृत्रिम भाषाको निर्माण गरिएको हो । कम्प्युटरले त द्विआधारी अङ्क मात्र बुझ्दछ । ० र १ मात्र । तब अङ्ग्रेजी वर्ण र अङ्कदेखि बाहेकका वर्ण र अङ्क कम्प्युटरलाई पढाउन सकिन्छ कि सकिँदैन त ? उत्तर स्पष्ट छ, सकिन्छ । आज सूचना प्रविधि साम्राज्यको एउटा अङ्गका रुपमा देखिएको जापानले सन् १९७८ मा आइवीएमको मेसिनरी उद्योग आफ्नो देशमा स्थापना गरे लगत्तै जापानी भषामा वर्णको मानकीकरण सुरु गर्‍यो । जापानी वर्णकै माध्यमबाट आफ्नो भाषालाई द्विआधारी अङ्कमा रुपान्तरण गर्न सफल भयो र कम्प्युटरलाई जापानी भाषा बुझाउन सफल भयो । फलस्वरुप आज जापानका लुगाधुने मेसिन, विद्युतीय पाले, विद्युतीय खेलौना लगायत कम्प्युटरले जापानी भाषा अध्याहार (ल्याङ्ग्वेज प्रोसेसिङ) गर्न सक्छ र बोल्न पनि सक्छ । एउटा भाषा बस (ल्याङ्ग्वेज बस) वा प्रविष्टि बस (इनपुट बस) मा साराका सारा जापानी भाषाको व्याकरण समावेश गर्न सफल भएको उदाहरण हाम्रै सामु छ ।

नेपाली भाषाको हकमा भन्ने हो भने नेपालमा सूचना प्रविधिको विकास धेरै ढिलो देखापरेको हो । जहाँसम्म हिन्दीको प्रश्न आउँछ भारतमा सूचना प्रविधिका क्षेत्रमा दुई किसिमको सोचले काम गरेको पाइन्छ । अङग्रेजीमै काम गरे भइहाल्छ नि भन्ने सोच र हिन्दी लगायत स्थानीय भाषामा पनि काम गर्नुपर्छ भन्ने सोच । दोस्रो सोच हालसालै मात्र विकास भएको हो । पहिलो सोचले भारतको धेरै लामो समय देखिनै जरा गाडेको हो । कम्प्युटरमा पहिले आस्की मानकको विकास भयो र लिप्यन्तरणबाटै सामाजिक साँस्कृतिक ज्ञान एकतृत गर्न सकिन्छ, त्यसैले हिन्दी भाषामा भएको ज्ञान निधिलाई लिपि अन्तरले नै सङ्ग्रहित गरे भइहाल्छ देवनागरीमा प्रविधिको विकास गरिरहनु पर्दैन भन्ने अङ्ग्रेजी सोचले देवनागरी लिपि र यसमा लेखिने भाषामा सूचना प्रविधिमा काम हुनसकेन । फलस्वरुप अङ्ग्रेजी भाषाका माध्यमबाट भारतमा सूचना प्रविधिमा धेरै काम भए पनि स्थानीय भाषामा काम हुन ढिला भयो । वर्तमान परिवेशमा भने हिन्दीमा पनि मनग्गे काम हुन थालेको छ । नेपालको हकमा त नेपाली भाषामा पनि कम्प्युटर चलाउन सकिन्छ भन्ने सोच स्थापित हुनसकेकै छैन ।

नेपालमा सूचना प्रविधिका क्षेत्रमा एकाधिकारको अवस्था छ । यहाँ सूचना प्रविधि अङ्ग्रेजीमा मात्र सम्भव छ भन्ने कुराको धङ्धङी अझै मेटिन सकेको छैन । कम्प्युटर इन्जिनियरले मात्र कम्प्युटरको कुरा बुझ्छ र कम्प्युटरको कुरा अङ्ग्रेजीमा मात्र गर्नुपर्छ भन्ने मान्यताले गाँजेको अवस्था छ । कम्प्युटरको ज्ञान अरू विषयसँग मिलाएर वा अन्तर्भूत गरेर बुझ्नै सकिँदैन यो ज्ञान त अरू विषयको अपवर्जक (एक्सक्लुसिभ) हुन्छ भन्ने भ्रम छ । नेपालीमा कम्प्युटरको व्याख्यान गर्न थाल्यो भने बोक्रे इन्जिनियरको उपाधि पाउने अवस्था छ ।

नेपालमा देवनागरी वर्ण द्विआधारी अङ्कमा काम गर्न सक्ने अवस्थामा पुगिसक्यो भन्ने ज्ञानसम्म पनि सम्प्रेषण गर्न सकेको छैन । आज सरकारी काम काजलाई हेर्ने हो भने उच्च पदस्थ सरकारी अधिकारी आफ्नै मातहतका कार्यलय र विदेशस्थित दूतावासमा यो फण्ट र त्यो फण्ट पठाउने काममै सिमित छन् । अक्षर त क्षय वा क्षर नहुने वर्ण हो । यो फन्ट र त्यो फण्टको त कुरा पुरानो भइसक्यो भन्ने मानसिकताले अझै छाडेको छैन । सरकारी नीति नियामक निकाय र राजनीतिज्ञको स्थिति झनै दयनीय छ ।

दक्षिण एसिया, दक्षिण अमेरिका र कतिपय युरोपियन देशहरूमा कम्प्युटरका विद्यार्थीलाई आफ्नै देशको राष्ट्रभाषा वा स्थानीय भाषामा नै भाषा अध्याहार (ल्याङ्ग्वेज प्रोसेसिङ) गराउने व्यवस्था पाठ्यक्रममा राखिसकिएको अवस्था छ । तर नेपालको हकमा भने यस्तो पाठ्यक्रमको विकास गर्ने सोचको कुरा त परै जाओस् स्पष्ट सूचना प्रविधि नीति समेत आउन सकेको छैन । खुला स्रोत प्रणालीको विकासले उत्साही युवा इन्जिनियरहरूले स्थानीय भाषामा अलि अलि काम गरेता पनि साधन स्रोतको अभाव र विश्वविद्यालय नै प्रतिलिपि अधिकार अन्तर्गतको तर पाइरेसी गरेको कम्प्युटर प्रणालीमा निर्भर रहने प्रवृत्तिले गर्दा चाहे जस्तो प्रयोग गर्न सकिरहेका छैनन् । नियामक सरकारी निकाय सूचना प्रविधि नीतिमा पुनर्विचार गर्छु भन्छ, राष्ट्र सेवक नीति आएपछि लागु गर्ने कुरा गर्छ, प्रणाली विशेषज्ञ वा प्रविधिक मानक नै नभएर प्रकृया अघि बढाउने बाटो बन्द छ भनेर पन्सिन्छ अनि सामान्य जनता चाहिँ खै मैले त केही बुझ्या छैन ! भन्छ ।

देशको सूचना प्रविधिको परिवेश यस्तो छ अनि सरकार भन्छ अब इसरकार चलाउने हो नेपालमा । अङ्ग्रेजी भाषा कै माध्यमबाट इसरकारका सम्पूर्ण कुरा गर्ने हो भने ठिकै छ, दैनिक सरकारी चिठीपत्र समेत अङ्ग्रेजी मै लेख्न सुरू गर्नुपर्‍यो र सम्पूर्ण प्रशासनिक लगत अङ्ग्रेजी मै राख्नुपर्‍यो । नागरिकले अनिवार्य रुपमा अङ्ग्रेजी भाषामा दैनिक सरकारी कारोबार गर्नु पर्छ भनेर राष्ट्रिय सरकारी नीतिमा घोषणा गर्नुपर्‍यो । होइन भने सूचना प्रविधि नीतिमा परिवर्तन गर्नु पर्‍यो ।

एकातिर सूचना प्रविधि नीति कस्तो हुने भन्ने बारेमा सरकारी नीति नियामक अङ्ग आफै स्पष्ट छैन भने अर्कातिर नेपाल प्रज्ञाप्रतिष्ठान जस्तो गरिमामय संस्था चाहिँ इकार र उकार दाहिनेबाट दिने कि देब्रेबाट दिने अनि अंक र अङ्क, शंका र शङ्का विद्या र विद्‌या, बुद्ध र बुद्‌ध, पद्हति र पद्धति कसरी लेख्ने भनेर अन्तरराष्ट्रिय भाषा सम्मेलन गर्छ । प्रत्येक पाँच वर्षमा यस्ता नियम परिवर्तन गर्दै जाने र सरकारी संयन्त्रले जे गरोस् मतलब नराख्ने अनि विद्यार्थीलाई चाहिँ फेल गराउँदै जाने हो भने नेपाली भाषाको गन्तब्य पनि कृष्णभिर तिरै लम्कने देखिन्छ ।

नेपाली भाषामा कम्प्युटरको कुरा गर्दा बोक्रे इन्जिनियरको उपाधि मिल्ने वर्तमान स्थितिमा अङ्ग्रेजी भाषामा प्रविधि स्थानीयकरण र हस्तान्तरणको कुरा सामान्य जनतासमक्ष कसरी पुर्‍याउने । अङ्ग्रेजीको भाषा अध्याहार प्रणाणी त्यसै विकास भएको होइन । यो त संसार भरिका कम्प्युटर विज्ञानका शिक्षक र विद्यार्थीहरूले अङ्ग्रेजी भाषामै भाषा अध्याहार प्रणालीको प्रयोग, परीक्षण गर्नु गराउनु पर्ने बाध्यकारी पाठ्यक्रमका कारण सम्भव भएको हो ।

त्यसैले आजकल विकसित देश र कतिपय विकासोन्मुख देशहरूले आफ्नै राष्ट्रभाषा वा स्थानीय भाषामा भाषा अध्याहार प्रणालीको प्रयोग परीक्षण गर्नु पर्ने पाठ्यक्रम निर्माण गरिसकेका छन् । कम्प्युटरको प्रणाली तहमै वा जरैदेखि परिमार्जन गर्न प्रणाली तह (सिस्टम लेवल) मै खेल्नु पर्ने हुन्छ । प्रतिलिपि अधिकारवाला पद्धतिले प्रणाली परिवर्तन गर्न दिँदैन । सयौँ डलर पर्ने कम्प्युटर अनुप्रयोग विद्यार्थी / अनुसन्धाताले किनेर चलाउन सक्दैनन् । यस्तो अवस्थामा सक्नेले प्रतिलिपि अधिकारवाला कम्प्युटर अनुप्रयोग किनेर चलाउछन् र नसक्नेले खुला स्रोत पद्धति अपनाएर आफ्नो आवश्यकता पूरा गर्छन् । सरकारी तवरबाटै खुला स्रोत प्रणालीलाई व्यवस्थित गरिदिएर विद्यार्थीलाई प्रोत्साहन पनि गर्न सकिन्छ । हुन त ज्ञानको स्रोतमा बन्देज लगाउन नहुने हो । प्रयोगशालामा विज्ञानको प्रयोग गर्न प्रतिलिपि अधिकारले रोक्दैन । नयाँ नयाँ कुराको अनुसन्धान गर्न, विज्ञान पढ्न प्रतिलिपि अधिकारले छेक्दैन । प्रथम शताब्दीको टलमीको गणित अध्ययन गर्न र सातौँ शताब्दीको अलख्वाजिमिको अल्गोरिदमको तर्क पढ्न प्रतिलिपि अधिकारले रोक्दैन तर एकासी वर्ष अगाडि अलेन टुरिनको बौद्धिक मेसिन परीक्षण गर्न किन प्रतिलिपि अधिकारले बन्देज गर्ने ?

खुला स्रोत प्रणालीलाई आत्मसात गरेर स्थानीय भाषामा समेत कम्प्युटर प्रणालीका अनुप्रयोगहरूको अधिलगत (मेटाडाटा) राख्ने र एउटै काम पटकपटक दोहोर्‍याउन नपर्ने, समान किसिमको प्रविधि एक आपसमा आदान प्रदान गरी चलाउन पाउने नीति नियम बनाउन सके कम्प्युटर प्रविधिमा लाग्ने लागत असी गुणासम्म कम गराउन सकिन्छ । यसको प्रमाण दिन यो सानो लेखमा सम्भव छैन तर यो कुरा सत्य हो, समयक्रममा प्रष्ट पार्ने कोसिस हुनेछ । नमूनाका रूपमा यसो भन्न सकिन्छ । जस्तै सूचना प्रविधिका क्षेत्रमा प्रयोग हुने लगत र अधिलगत दुवैको शब्दकोश तयार गरेर मानकीकरण गर्ने अनि समान प्रकृतिको कामका लागि त्यही प्रणाली र लगत प्रयोग गर्न सकिन्छ । जुन एक पटक तयार गरेपछि कार, मोटरसाइकल वा फर्निचर उत्पादनमा जस्तो पुन उत्पादन गर्न उतिनै सामान, उतिकै पैसा र उतिकै मेहनत लाग्दैन । सयकडा एक प्रतिशतभन्दा कममा प्रतिलिपि उतार्न सकिन्छ । नेपाल सरकारका एक्काइसवटा मन्त्रालयले मात्रै यसो गर्ने हो भने झण्डै नब्बे प्रतिशत लागत बचाउन सकिन्छ । यस्ता लागत, तथ्याङ्कहरू मानक सहित द्विभाषिक सूची बनाएर राख्ने हो भने केही वर्षको अवधि मै कम्प्युटरलाई बहुभाषिक माध्यमबाट चलाउन सकिन्छ ।

सूचना प्रविधि उच्चस्तरीय आयोगले आ.व. २०६५ मा नेपाल सरकारलाई बुझाएको प्रगति प्रतिवेदन हेर्दा भाषा कम्प्युटिङ, सङ्केत समूह मानकीकरण (कोडिङ स्ट्यान्डर) र सञ्जाल मानकीकरण (वेव स्ट्यान्डर) को भौतिक काम शतप्रतिशत सम्पन्न भइसकेको भइसकेको देखिन्छ । यो विवरण झूठो नहुनुपर्ने हो । तर नेपाल सरकारले आजसम्म एउटा पनि सूचना प्रविधि मानक घोषणा गरेको छैन । सूचना प्रविधि उच्चस्तरीय आयोग जस्तो जिम्मेवार सरकारी निकायले यस्तो हचुवा प्रतिवेदन तयार नगर्नु पर्ने हो । यो आरोप होइन वास्तविकता हो । तर परिणाम के भयो ? सूचना प्रविधि उच्चस्तरीय आयोगले नै मृत्यु वरण गर्नु परो ।

सूचना प्रविधिको धरातलीय यथार्थ यस्तो छ अनि सरकार भन्छ अब नेपालमा इसरकार चलाउने हो । इसरकार चलाउनुभन्दा पहिले प्रविधि स्थानीयकरण र प्रविधि हस्तान्तरणका बारेमा केही कुरा सोच्नु पर्ने हो । इसरकारको छत ढलाइ गर्नु भन्दा पहिले प्रविधिको पिलर हाल्ने काममा स्पष्ट हुन सके राम्रो हुन्थ्यो । नत्र अहिले निर्माण गरेको इसरकारको गन्तब्य पनि कृष्णभिर तिरै जाँदैछ भन्ने कुरा निश्चित छ ।

यो पनि पढ्नुहोस्-
भाषा कम्प्युटिङ र अरण्य रोदनः गुहार गुहार भन्नुपर्ला जस्तो छ
नेपालमा भाषा कम्प्युटिङ र कल्पनाको लड्डू
भनीसाध्य छैन भाषाको समस्या
भाषाप्रविधिका एकासी वर्ष र नेपाली कम्प्युटिङमा खोलाको गीत

प्रतिकृया लेख्नुहोस्:

सम्बन्धित शीर्षकहरु

आजको लोकप्रिय

NTC
Vianet
Sajhajob