यूनिकोड र नेपाली लेखाई

डिजिटल माध्यम

सामान्यतः डिजिटल उपकरणहरूको केन्द्रमा अत्ति नै सुक्ष्म उपकरणको सङ्गालो हुन्छ, यस्ता सुक्ष्म उपकरणलाई हामी ट्रान्जिस्टर भन्छौँ। यसलाई हामी दैनिक जिवनमा प्रयोग गर्ने बत्तीको स्वीचजस्तो मान्न सक्छौँ। यस्तो एउटा स्वीचको अवस्थालाई बिट पनि भनिन्छ। समान्यतः कुनै पनि स्वीच कि खुला हुन्छ कि बन्द हुन्छ। जस्तो कि हामीले दुईवटा स्वीच/वत्ती लियौ भने त्यसलाई चारवटा अवस्थामा राख्न सकिन्छ। दुबै निभेको, पहिलो बलेको दोस्रो निभेको, दोस्रो बलेको पहिलो निभेको र दुबै बलेको। यस्तो चारवटा अवस्था हामीले कुनै पनि माध्यमबाट सुरक्षित गर्न सक्यौँ भने, भविष्यमा त्यसलाई कुनै उपयोगी जानकारीको रूपमा लिन सकिन्छ। कम्प्यूटरम वा कुनै डिजिटल माध्यममा केही कुरा सञ्चय गर्नु भनेको, यस्ता स्वीचहरूलाई कुनै निश्चित तरिकाले खुला वा बन्द राख्नु हो। एउटा बत्ति मात्र लिँदा कि खुला वा कि बन्द‌ गरी दुईवटा मात्र सम्भावना भए जस्तै दुईवटाको बत्तिको क्रम लिँदा चारवटा अवस्थाको सम्भावना हुन्छ। यस्ता खुला र बन्द स्वीचहरूको क्रमलाई सजिलोका लागि कुनैपनि सङ्ख्याले चिन्न सकिन्छ। जस्तो कि हाम्रो उदाहरणको दुईवटा बत्ती बन्द भएकोलाई ०, पहिलो बन्द र दोस्रो खुला भएकोलाई १, पहिलो खुला दोस्रो बन्द भएकोलाई २ र दुबैवटा खुला भएकोलाई ३ भनेर मान्यौँ भने, कुनै निश्चित अवस्थाका खुला र बन्द वत्तीहरूलाई सङ्ख्याले चिन्न सकिन्छ। यस्तो अनुक्रमलाई सङ्ख्याले पनि चिनिने भएकैले तिनलाई डिजिटल (साङ्ख्यिक) माध्यम भनिएको हो।

इनकोडिङ्ग डिकोडिङ्ग

डिजिटल माध्यमको केन्द्रमा स्वीचहरूको अनुक्रम मात्र हुने भएकाले जुनसुकै प्रशोधन वा सञ्चयको कामका लागि सबै कुरालाई यस्ता सङ्ख्याहरूमा बदल्नु पर्छ। अत्यन्त सरल भाषामा भन्दा, यसरी सङ्ख्यामा बदल्ने प्रक्रियालाई इनकोडिङ्ग भनिन्छ। यस्तो किसिमले इनकोडिङ्ग गरिएका कुराहरूलाई फेरी मानिसले बुझ्ने किसिमले फोटो भए फोटो वा कुनै अक्षर भए अक्षरको रूपमा परिवर्तन गर्ने प्रक्रियालाई डिकोडिङ्ग भनिन्छ। यस्तै किसिमको इनकोडि्ग गर्ने एउटा तरिका भनेको आस्की (ASCII) कोडिङ्ग हो। अक्षरहरूलाई यसरी अङ्कमा बदल्ने यो कोडि्ग प्रक्रियामा कुनै पनि अक्षरलाई ८ वटा बत्तीको अनुक्रमले प्रतिनिधित्व गरिन्छ। यसरी आठवटा बत्तिको क्रमद्वारा २५६ वटा फरक अवस्थालाई चिन्न सकिन्छ। सुरूमा आस्की कोड गर्ने प्रक्रिया अङ्ग्रेजी भाषा लेख्न प्रयोग हुने रोमन अक्षर, अरबी अङ्क र केही विशेष सङ्केतहरूका लागि प्रयोग हुन्थ्यो। यो कोडिङ्ग प्रणालिमा ९७ भन्ने अङ्कले a भन्ने अक्षरलाई जानउँछ, जुन रोमनको ए भन्ने अक्षर हो। यसरी हामीले अङ्ग्रेजी शब्द cat लेख्दाखेरी ९९,९७,११६ गरी तीनवटा अङ्कको रूपमा कम्प्युटरमा सुरूमाक्षित हुन्छ। अब हामीले कम्प्युटरमा हेर्दा सामान्य भाषामा फन्टले यस्ता सङ्ख्याक्रमलाई देखेपछि तिनलाई डिकोडिङ्ग गरेर cat देखाइदिन्छ। त्यसैले फन्ट भनेको एक किसिमले यस्ता सङ्ख्याक्रमहरूलाई डिकोड गर्ने माध्यम हुन्। यी फन्टहरूसङ्ग कुन अङ्कलाई कस्तो आकारको अक्षर देखाउने भन्ने नियम र ती आकारहरू हुन्छन्। त्यसलै हामीले विभिन्न फन्टहरू प्रयोग गर्दा उही अक्षर पनि बिभिन्न स्वरूपमा देखिन्छ।

कम्प्यूटरमा नेपाली लेख्ने पुरानो तरिका

कम्प्यूटरको प्रयोग आजजस्तो सर्वब्यापी नहुँदा सम्म अक्षरहरूलाई आस्की कोडिङ्गकै माध्यमबाट डिजिटल माध्यममा राखिन्थ्यो। नेपाली भाषाका अक्षरहरू टाइप गर्न पनि यसैगरी आस्कीमा गरिन्थ्यो। प्रिति लगायतका फन्टहरूले निश्चित आस्की कोड भएका अक्षरहरूलाई नेपाली भाषाका अक्षर जस्तो देखाइदिन्थे र नेपाली भाषामा टाइप गर्न सकिन्थ्यो। उदाहरणको लागि, आस्की कोड १०९ भएको अक्षर अङ्ग्रेजी फन्टहरूमा m देखिन्थ्यो, जुन रोमन लिपिमा एम अक्षर हो। प्रिति जस्ता फन्टहरूले यसलाई खुट्टा झारेको अक्षरको रूपमा देखाउछन्। यस्तै गरि आस्की कोड १०७ भएको अक्षर अङ्ग्रेजी फन्टहरूमा k देखिन्थ्यो जुन रोमनको के अक्षर हो। अब नेपाली फन्टहरूमा भने यो प अक्षर देखिन्थ्यो। मानौँ अब हामीलाई फ लेख्नुपर्‍यो रे। प्रिति जस्ता फन्टहरूमा चाहिँ फ भन्ने अक्षर नै हुँदैन। तर हामीले यदि प र त्यस्को पछाडी खुट्टा झारेको अक्षर राख्यौँ भने त फ जस्तो देखिने भयो। त्यसैले ती फन्टहरूमा फ लेख्नुपर्‍यो भने, km लेखिन्थ्यो। त्यसरी टाइप गर्दा, के के अक्षर लेखियो भन्दापनि कस्तो देखियो सँग धेरै मतलब हुन्थ्यो। जस्तो कि क्र लेख्दा qm, झ लेख्दा em इत्यादि। इकार पनि त्यसैगरि लेखिन्थ्यो। जस्तो, कि लेख्नुपर्‍यो भने ls र की लेख्नुपर्दा sL। वास्तवमा भन्नुपर्दा कि र की एकै अक्षरका दुई रूप हुन। तर पुरानो तरिकाबाट लेख्दा त पुरै फरक लेख्नुपर्‍यो।

यूनिकोड

आस्कीमा जम्मा २५६ वटा मात्र अक्षरहरू अट्ने भएकाले र कम्प्युटरको सर्वब्यापीकरण बढ्दै गएपछि नयाँ इन्कोडिङ्ग प्रक्रियाको आवश्यकता पर्न गयो। यूनिकोड भनेको पनि यसैगरी अक्षरहरूलाई अङ्कमा बदन्ने एउटा तरिका हो। युनिकोडले आस्कीको जस्तो कुनै अक्षरलाई जनाउन जम्मा ८ वटा स्वीच मात्र नलिई ६४ वटा स्वीचहरूको सङ्गालो लिन्छ। यस्ता ६४ वटा स्वीचहरूको सङ्गालोद्वारा हामी खरबौँ अक्षरहरूलाई जानउान सक्छौँ। त्यसकारण हामीले आस्की जस्तो २५६ अक्षरमा सीमित हुनुपर्दैन। त्यसैले अब यूनिकोडमा आएपछि चाहिँ देवनागरी लिपिका सबैजसो अक्षरहरूले आफ्नै यूनिकोड पाएका छन् । त्यसैले पहिला आस्कीमा लेख्दा १०७ कोड भएको अक्षर कुनै फन्टमा प देखिने र कुनै फन्टमा k देखिन्थ्यो भने अब प अक्षरको आफ्नै यूनिकोड मान छ। त्यसलैले युनिकोडमा लेखिएका कुनै पनि अक्षरहरू फरक फन्टमा फरक आकारका देखिए पनि अन्तर्यमा चाहिँ एउटै मात्र हुन्छन्। त्यसले यूनिकोडका कागजतहरू वहनीय (पोर्टेबल) हुन्छन्।

युनिकोडमा रूपान्तरण

आस्की कोडिङ्गमा आधारित प्रिति जन्य फन्टहरूमा लेख्न बानी परेका हामी कतिपय मानिसहरू अझै त्यसमा लेख्न रूचाउँछौँ। जस्तो कि आस्की कोड वाला फन्टहरूमा अ अक्षरको अगाडी आकार चिह्न (ा) राख्दा आ बन्थ्यो तर यूनिकोडमा देवनागरी स्वर वर्णहरू (ब्यञ्जन र अरू पनि) सबैले आफ्नो आफ्नै कोड पाएकाले अ अक्षरको यूनिकोड मान र आ अक्षरको यूनिकोड मान भिन्नै छ। पुरानो आस्की मा लेख्दा आ लेख्नलाई अ लेखेर (ा) आकार अक्षर नै रखिन्थ्यो। सबैजसो डिजिल माध्यमहरूले अहिले युनिकोडमा सबैकुरा राख्न थालेका छन्। यसरी यूनिकोड चाहिने ठाउँमा चाहिँ आफुले आस्की कोडिङ्गमा आधारित प्रितिजन्य फन्टहरूमा लेखेको कागजातलाई कुनै यूनिकोड ‘कन्भर्टर’ प्रयोग गरी यूनिकोड लगेको पाइन्छ। यस्ता कन्भर्टरहरूले धेरै हदसम्म राम्रोसँग परिवर्तन गरेपनि केही कमजोरीहरूका कारण विभिन्न समस्या निम्त्याउँछन्। यसरी हेर्दा मैले धेरैजसो नेपाली पत्रिका, नाम चलेको सहित्यकारहरूले समेत अा लेखेको पाएको छु। यो कस्तो देखिन्छ भन्ने कुरा फन्टमा भर पर्ने कुरा भए पनि सिद्धान्ततः यो गलत हो किनकी आ छुट्टै अक्षर हो। अ को पछाडी आकार चिह्न (ा) राख्दा धेरैजसो फन्टले अा देखाइदिन्छन् जुन हेर्दा के नमिलेको के नमिलेको जस्तो देखिन्छ

आस्कीमा आधारित जन्य फन्टहरूमा कुनै पनि अक्षरको पछाडी आकार र चन्द्रविन्दु लागेको अवस्थामा जुन अक्षरलाई पहिला लेखेपनि उस्तै देखिन्थ्यो, जस्चो काँ लेख्दा क, आकार (ा) र चन्द्रविन्दु (ँ) लेख्दा पनि काँ र क, चन्द्रविन्दु(ँ) र आकार (ा) लेख्दा पनि काँ नै देनिन्थ्यो। किनकी प्रिति जन्य फन्टहरूमा के के अक्षर कुन क्रममा लेखियो भन्दापनि कस्तो देखियो भन्ने प्रमुख हुन्छ। वास्तवमा देवनागरीको आन्तर्यमा चाहिँ का आक्षरमा चन्द्रविन्दु लागेर काँ बन्ने भएकाले क, आकार (ा) र चन्द्रविन्दु(ँ) नै लेख्नुपर्ने हुन्छ। युनिकोडमा आधारित फन्टहरूले यस्ता कुरालाई छुट्ट्याएर लेख्छन्। त्यसैले क, चन्द्रविन्दु(ँ) र आकार लेख्दा कँा जस्तो देखिन्छ जुन गलत हो। अब युनिकोड कन्भर्टरहरू अलि राम्रोसँग बनाइएको छ भने यस्तो दुबैवटा अवस्थालाई पनि राम्ररी सुधार गर्न सक्छन् तर सबैले यस्तो कुरा सोचेर कन्भर्टर बनाएको पाँइँदैन।

तपाईँहरूले पनि अनलाई माध्यम पढ्दाखेरी फ को ठाउँमा पm लेखिएको देख्नुभएको होला, जसको कारण भनेको यसरी आस्कीमा आधारित डकुमेन्टलाई कन्भर्टर प्रयोग गरिएकाले गर्दा हो।

समाधान

सबैभन्दा उत्तम उपाय भनेको सिधै कुनै कागजतलाई युनिकोडमा आधारित सफ्टवेयर प्रयोग गरि सिधै युनिकोडमा लेख्नु हो। तर पुरानो आस्कीमा आधारित प्रितिजन्य फन्टमा बानी परेकाहरूलाई पनि यसमा फड्को मार्न केही असहज हुन सक्छ। यसका लागि पनि प्रिती फन्ट जस्तै किबोर्ड म्यापिङ्ग भएका किबोर्ड सिस्टमहरू पाइन्छन्। म स्वयं पहिला आस्कीमा आधारित प्रितिजन्य फन्टमा टाइप गर्थेँ। र केही वर्षदेखी मैले सिधै युनिकोडमा आधारित फन्टहररूमा टाइप गर्न थालेको छु। सुरूका केही हप्ता केही असहज भए पनि बानि परेपछि यो तरिका धेरै नै सजिलो र गल्तीरहित हुन जान्छ।