scheduleमगलवार श्रावण २९ गते, २०७५

नेपाल यसरी बनिरहेछ सूचना प्रविधिको परजीवी समाज

स्तम्भ: भाषा प्रविधि र भाषाप्रविधि

आइसिटी समाजमा सार्थक सहभागिताको लागि स्थानीय सामग्रीको विकास प्रमुख आधार हो । अहिलेको नेपाली समाज केवल विश्वव्यापी सञ्जाल सामग्री डाउनलोड गर्ने वैश्विक ग्राहकको रुपमा छ । हाम्रो समाज केवल डाउनलोड समाज हो । आइसिटीको विश्व परिवेशमा यस्तो समाज इ-दासत्वको समाज हो । इ-दासत्वबाट बच्नका लागि आइसिटीमा स्थानीय सामग्री विकास गर्नु भन्दा अर्को विकल्प छैन ।

नेपाल सरकारले एक दशक पहिले नै इ-सरकार, इ-हेल्थ, इ-कृषि, इ-शिक्षा, इ-प्रशासनजस्ता महत्वाकाङ्क्षी योजना बनाएको थियो । तर आइसिटीमा सरकारी कामकाजको भाषा मानकीकरण गरेको छैन । जब भाषाकै मानकीकरण गरेको छैन भने कम्प्युटरमा कस्तो काम हुन्छ ? सवारी साधनमा इम्बोस्ड नम्बर भित्र्याउने खेल त्यति कमजोर छैन ।

आइसिटीमा स्थानीय सामग्री विकासका लागि राष्ट्रिय भाषाप्रविधि नीति आवश्यक हुन्छ । भाषाप्रविधिको मानक बनाउन ऐन कानुन वा कम्तीमा निर्देशिका बनाउनु पर्छ । यस्तो कानुन बनाउन आइजिसी (इन्टर गभर्न्मेन्टल कमिटी) मा नेपालको सौदाबाजी कमजोर हुन्छ । किनभने नेपालको कम्प्युटर सञ्चालन पद्धति र कम्प्युटर मानव इन्टरफेस दुवै छैन । त्यसैले सूचना प्रविधिमा काम गर्न विदेशीको स्वीकृति लिनुपर्ने अवस्था छ । अन्य देशले बनाइदिएका उनीहरूकै भाषाका मानक प्रयोग गर्ने ग्राहक मात्रै हो नेपाली समाज ।

कम्प्युटरमा काम गर्नका लागि भाषा मानकीकरण अनिवार्य सर्त हो । आइसिटी वा वेब सामग्री उपभोक्ताको आफ्नै भाषामा विस्तार गर्न उपभोक्ताको भाषामा प्राविधिक नियमको खाँचो पर्छ । भाषाप्रविधि नीति भाषा कम्प्युटिङको लागि डिजाइन गरिएको हुन्छ जसले सफ्टवेयर घटकहरूमा नीतिहरू निर्दिष्ट गर्दछ । भाषा कम्प्युटिङमा भाषाका प्रत्येक शब्दलाई एउटा एकाइ वा अणुको रुपमा लिएर प्रत्येक अणुको मालालाई एउटा वाक्य र वाक्य वाक्यको मालालाई एउटा अनुच्छेद वा पाठका रुपमा व्यवस्थित गर्ने गरिन्छ जुन मेसिनले पढ्नसक्ने हुन्छ ।

डा. लक्ष्मीप्रसाद खतिवडा

अङ्ग्रेजीलाई केन्द्रमा राखेर गरिएको कम्प्युटर पहुँच योग्य संरचनात्मक व्याकरण अङ्ग्रेजी भाषाको व्यापकतासँगै सिद्धान्तका रूपमा सन्सारभर फैलियो । यो सिद्धान्त विशुद्ध भाषा विश्लेषणमा मात्र सिमित नभएर कम्प्युटरबाट भाषाको विश्लेषण गर्ने अनुप्रयुक्त पद्धतिमा पनि कैयौँ दशकदेखि मूलधारमा रहँदै आएको छ । कम्प्युटरको मातृभाषा अङ्ग्रेजी हो भनेर नेपालीमा भाषाप्रविधिको विकास जरोमै निमोठियो । डिजिटल प्रविधि जस्तो सर्भर, व्यक्तिगत कम्प्युटर र मोबाइल उपकरणहरूबाट समेत इन्टरनेटमार्फत नागरिक समक्ष सूचनामा सहज पहुँच पुर्‍याउने काम सरकारी नीतिले व्यवस्था गरेको हुनुपर्छ । त्यसका लागि स्वदेशी भाषामै इन्टरफेसको निर्माण गर्नुपर्छ र परम्परागत संस्कृतिका जानकारी भण्डारण प्रक्रियाको राम्रो व्यवस्था हुनु जरुरी हुन्छ ।

नेपाली भाषामा प्राविधिक पहुँचको लागि राष्ट्रिय स्रोतहरू उपलब्ध छैनन् भने अन्य राष्ट्र भाषामा त सम्भव नै भएन । नेपाल सरकारले नेपाली भाषालाई प्रविधि र डिजिटल इन्टरफेसको संसारमा पहुँचयोग्य बनाउनको लागि धेरै काम गर्न बाँकी छ । जस्तै इनपुट प्रणाली, वर्ण पहिचान र ती वर्णहरूको सङ्केतन (डिकोडिङ), डिजिटल सामग्रीलाई टोकनाइज गर्न, सञ्जाल सामग्री पढ्न मेसिनले पढन सक्ने शब्दकोश निर्माण गरेर मानकसहित कम्प्युटरलाई बुझाउन जरुरी हुन्छ ।

समग्र भाषाप्रविधिका लागि निम्नलिखित मानक अत्यावस्यक हुन्छन् ।
– इनपुट वा प्रविष्टि मानक, सङ्केतन वा एन्कोडिङ मानक
– सामग्री भण्डारण मानक, प्लेटफर्म र समान डेटाको पुनःप्रयोगको मानक
– शब्दकोश मानक, मेसिन अनुवाद मानक, विद्युतीय सामग्रीको प्रतिलिपि अधिकार
– आइसिटी मिडियामा सङ्गीत सामग्री ढाँचा मानक

विद्युतीय सञ्जालमा स्थानीय सामग्री आश्चर्यजनक रुपमा बढ्दैछ। तर नेपाली भाषामा यस्तो जानकारी अपेक्षाकृत सीमित छ । स्थानीय भाषामा जानकारी पहुँच त्यस देशका नागरिकको अधिकार हो । कम्प्युटरमा स्थानीय भाषा र संस्कृतिलाई स्थिर राख्न वा सक्षम बनाउन भाषाप्रविधि एक शक्तिशाली उपकरण हो । नीति निर्माताहरूले स्थानीय भाषाहरूमा सूचना पहुँचको संरक्षण गर्ने तरिकाहरू खोज्नुपर्ने हो ।
भाषाप्रविधि भनेको कम्प्युटेशनल भाषाको इन्जिनियरिङ कार्य हो । भाषाप्रविधिले सामूहिक विधि अपनाएर कम्प्युटर प्रोग्रामहरू गर्दछ जुन पाठ र भाषण विश्लेषण वा उत्पादन वा परिमार्जन गर्दछ । वर्णको पहिचान, वर्णको विभाजन, वर्णमालाको डिकोडिङ, डिजिटल ढाँचामा सामग्रीको टोकन गर्न, सन्देश वा मेसेज पढ्न, शब्द र वाक्यांशहरूमा दिइएको वाक्य पार्स गरेर वाक्यहरूको विश्लेषण गर्न स्थानीय भाषाको व्याकरणिक औपचारिकता प्रदान गर्नुपर्छ । नेपाली भाषामा यी सबै सिर्जनाहरू उत्पादन गर्न नेपाली कम्प्युटिङको विकास गर्नुपर्छ ।

भाषा कोडहरू भाषा कम्प्युटिङ मानकीकरण प्रक्रियासँग सम्बन्धित हुन्छन् । तिनीहरू विभिन्न सन्दर्भमा प्रयोग गरिन्छन् । साधारणतया, भाषा ट्यागहरू आईएसओमा आधारित हुन्छन् । भाषा इन्जिनियरिङमा भाषाकोडहरू र ट्यागहरू सामान्यतया गणना गरेर परिभाषित गरिन्छ । भाषाकोडका लागि उपलब्ध बहुभाषा ट्याग प्रणालीहरू विश्वव्यापी वर्णसेटमा सङ्केतन गरिन्छ । डिजिटल सामग्री विश्लेषणको सन्दर्भमा वर्ण पहिचान महत्त्वपूर्ण कार्य हो । कम्प्युटरमा भाषा पाठ प्रोसेसिङ उचित मानकसँग उचित एन्कोडिङमा हुनुपर्छ, अन्यथा कम्प्युटर स्क्रिन वा ब्राउजरले पाठ ठीकसँग प्रदर्शन गर्न सक्दैन ।

लोक्याल एक अन्तर्राष्ट्रिय भाषाकोड सेट हो जहाँ साधारणतया भाषा र सांस्कृतिक जानकारी उपलब्ध हुन्छ । लोक्यालले भाषा कम्प्युटिङ वातावरणलाई व्यवस्थित गर्दछ जुन भौगोलिक स्थानहरू, भाषा र सांस्कृतिक जानकारीहरू, राष्ट्रिय पहिचान जस्तै क्रमबद्धता, मिति र समय ढाँचाहरू, मुद्रा ढाँचाहरू, किबोर्ड लेआउटहरू र अन्य स्थानीय सांस्कृतिक पहिचान समावेश हुन्छन् । भाषा नामहरू, नम्बरका ढाँचाहरू, अङ्क चिन्हहरू, सङ्ख्यात्मक भाषा लिपि नामहरू, स्थानीय समय र क्षेत्रहरू, मिति र समयका ढाँचाहरू, गाउँ र शहरका नामहरू, गल्ली र बाटाका नामहरू, मुद्रा नाम, मुद्रा प्रतीक, सकारात्मक मुद्रा ढाँचा, नकारात्मक मुद्रा ढाँचा, दशमलव प्रतीक, अङ्क समूहको प्रतीक, रुपैयाँ समूहबद्धता जस्तै सय, हजार, लाख, करोड छुट्याउने तरिका मानक स्पष्ट हुनुपर्छ ।
कम्प्युटरमा प्रविष्टि वा किबोर्ड लेआउटले स्थानीय प्रणालीमा असर गर्दछ । अङ्ग्रेजको बच्चाले एक पटक किबोर्डमा हात बसाएपछि जिन्दगीभर पुग्छ । तर नेपालीको बच्चाले ३२ वटा किबोर्ड चलाउनु पर्छ । कहिले एउटा कहिले अर्को । कहिले प्रीति, कहिले कान्तिपुर, कहिले हिमाली, कहिले अशोक, कहिले मदन, कहिले मङ्गल के के के के । फन्ट जे जे प्रयोग गरे पनि प्रविष्टि एकैखाले हुनुपर्छ । एक पटक किबोर्डमा हात बसेपछि दश थरि किबोर्ड सिक्नु नपरोस् ।

फरक फरक देशको मिति र समयको ढाँचा विशिष्ट हुन्छ । वाइवाइ एमएम डिडि, डिडि एमएम वाइवाइ वा एमएम डिडि वाइवाइ (YYYY-MM-DD, DD-MM-YYYY वा MM-DD –YYYY) जस्ता स्थानीय संस्कृति अनुसारका ढाँचाहरु हुन्छन् । उदाहरणका लागि, ग्रेगोरी पात्रो अनुसार ०१/०१/२०१८ हुन्छ । तर विक्रम पात्रो अनुसार २०१८/०१/०१ हुन्छ । नेपाली इन्टरफेस स्थानीय भाषामा हुनुपर्छ र स्वचालित मिति रुपान्तरण गर्ने व्यवस्था हुनुपर्छ ।

नेपाली कर्मचारीले सरकारी कामको दैनिक सात घण्टामध्ये मिति परिवर्तनमा मात्र तीन घण्टा समय बिताउँछ । त्यसमा पनि नेपाल सरकारको आफ्नो मिति रुपान्तरण मानक छैन । कम्तीमा एक लाख कर्मचारीले प्रतिदिन तीन घण्टाका दररले महिनाको पचहत्तर लाख घण्टा र वार्षिक नौ करोड घण्टा त मिति परिवर्तनमा बिताउने रहेछ । अनि कर्मचारीको उत्पादकत्व भएन भनेर तिनै कर्मचारीले गाली खनुपर्छ ।

नेपालमा भएका बैङ्किङ अपराधमध्ये आफ्नो इन्टरफेस नहुनु, पाइरेटेड कम्प्युटर चलाउने पद्धति हुनु, पासवर्डको सुरक्षा गर्न नसक्नु, अर्काको सर्भरमा भर पर्नु जस्ता कमजोरी औँल्याएको छ । कम्प्युटर चलाउने बारे नेपालको एउटा पनि मानक छैन । जिओभी डट एनपी प्राइभेट कम्पनीको जिम्मा दिएको छ । सरकारमा बस्ने मन्त्रीहरू सांसद हुँदा कम्प्युटर चलाउन सिक्छन् त्यो पनि सरकारी खर्चमा । अनि नीति बनाउने कुर्सीमा पुग्छन् । सञ्जाल अपराध विज्ञान कुन चराको नाम हो सुनेको पनि हुँदैन । त्यस्तालाई कसरी कुरा बुझाउनु ? तैपनि आवाज उनीहरूकै सुन्नुपर्ने विचरा नेपालीहरूको नियति ।
कम्प्युटर इन्टरफेसमा मुद्रा प्रदर्शन गर्दा, लेनदेन गणना गर्दा स्थानीय मुद्रा सङ्केतको प्रयोग गर्नुपर्ने हो । विभिन्न देशहरूको राष्ट्रिय वा अन्तर्राष्ट्रिय मुद्रा सङ्केतक वा निर्देशक चिन्ह हुन्छ । जस्तै यूरो वा पाउन्ड वा रुबल, दिनार वा भाट लाई कम्प्युटरमा परिचित गराएर स्वचालित मुद्रा परिवर्तकको व्यवस्था गरेको हुन्छ । यस्तो कुरा कम्प्युटर खोल्दा नै स्वदेशी मानकमा कम्प्युटर खुल्नुपर्छ । कम्प्युटर खोल्दा नेपाली लोक्यालमा खुल्नु पर्ने हो तर नेपालको हकमा कि इएनजिबी वा ग्रेट ब्रिटेनको अथवा इएनयुएस वा अमेरिकाको लोक्यालमा खुल्छ । अनि उरन्ठेउला नेता गफ हाँक्छन्- नेपालको सरकार अब इ-सरकारका माध्यमबाट चलाउँछौँ । सरकारी कामकाजको भाषाको कम्प्युटरमा प्रविष्टि विधि र कसरी डाटा भण्डारण गर्ने भन्ने सम्म पनि थाहा छैन । कति दयनीय अवस्था छ यो देशको ।
नेचुरल ल्याङ्ग्वेज प्रोसेसिङ वा प्राकृतिक भाषा अध्याहार स्कुल कलेजमा पढाएर आफ्नो देशका सांस्कृतिक अवधारणाहरूको प्रतिनिधित्व हुनेगरी कम्प्युटरलाई बुझाउनु पर्छ अनिमात्र स्वदेशी भाषा संस्कृतिको रक्षा गर्न सकिन्छ भनेर कसरी बुझाउने ?

प्राकृतिक भाषा अध्याहारका माध्यमबाट भाषा र व्याकरणको अनुशासनद्वारा कम्प्युटरलाई स्थानीयकरण गर्न सकिन्छ । नेपाली भाषा मानकीकरण गर्न सके नेपाली भाषामा सफ्टवेयर उत्पादन गर्न सकिन्छ । नेपालको विकासमा स्वदेशी सोचको अभाबले गर्दा डिजिटल डाटा भण्डारण वा स्थानान्तरणमा सरकारको नियन्त्रण छैन । डाटा स्थानीयकरण नीतिमा डाटाको परिभाषादेखि स्थानीयकरण पूर्वाधार विकास हुनसकेको छैन । यस्तो काम गरिएन भने सूचना प्रविधिका माध्यमबाट हुने विदेशी भाषा र संस्कृतिको हस्तक्षेपले नजानिदो रुपले आइसिटि उपनिवेशतिर धकेल्छ ।

नेपाली भाषा कम्प्युटिङ, मानकीकरणको चुनौतीहरू पत्ता लगाएर आइसिटी एकीकरणमा काम गर्नसके अन्य राष्ट्रभाषा भाषी विद्यार्थी पनि आफ्नै मातृभाषामा काम गर्न प्रेरित हुन्छन् । यसबाट दबाब सिर्जना हुन्छ र फलस्वरुप नेपाललाई सूचना प्रविधिको क्षेत्रमा उपनिवेशबाट बाहिर निकाल्न नागरिक पहलमै राम्रा काम हुनसक्छन् ।

नेपाललाई आइसिटीमा सार्थक सहभागिता गराउन उचित नीतिको आवश्यक हुनु जरुरी छ । यसकाका लागि स्थानीय सामग्री प्रमुख आधार हो । भाषाप्रविधि बेगर यो सम्भव हुँदैन । विश्वव्यापी सञ्जाल सामग्री डाउनलोड गरेर मात्र इदासत्वबाट मुक्ति मिल्दैन । आइसिटीको परजीवी समाजका रुपमा नेपाललाई कहिलेसम्म फसाइराख्ने ?

प्रतिकृया लेख्नुहोस्:

सम्बन्धित शीर्षकहरु

आजको लोकप्रिय

NTC
Vianet
Sajhajob