डाउनलोड मुद्रण

अ+   अ-

लेख

हिंदी, देवनागरी लिपि और यूनीकोड
जगदीप सिंह दाँगी


हिंदी भाषा (Hindi Language)

भारत के संविधान में 22 भारतीय भाषाओं का उल्लेख किया गया है। हिंदी संवैधानिक रूप से भारत की राजभाषा होने के साथ-साथ देश में सबसे अधिक बोली और समझी जाने वाली भाषा भी है। देश की कुल जनसंख्या में से लगभग 65 प्रतिशत लोग हिंदी को जानने व समझने वाले हैं। चीनी भाषा के बाद यह विश्व में भी सबसे अधिक बोली जाने वाली भाषा है। इसकी लिपि देवनागरी है।


लिपि (Script)

किसी भी भाषा के लिखने की व्यवस्था को ही लिपि कहते हैं। संस्कृत, हिंदी, मराठी आदि भाषाओं की लिपि का नाम देवनागरी है। इसी प्रकार अँग्रेज़ी भाषा की लिपि 'रोमन', उर्दू भाषा की लिपि 'अरबी-फ़ारसी', और पंजाबी भाषा की लिपि 'गुरुमुखी' है।


देवनागरी लिपि (Devanagari Script )

हिंदी की अपनी एक लेखन पद्धति है। हिंदी नागरी वर्ण चिह्नों में लिखी जाती है, जिसे नागरी लिपि या देवनागरी लिपि कहते हैं। देवनागरी लिपि में अनेक भारतीय भाषाएँ तथा कुछ विदेशी भाषाएँ भी लिखी जाती हैं। संस्कृत, पालि, हिंदी, मराठी, कोंकणी, नेपाली आदि भाषाएँ देवनागरी लिपि में लिखी जाती हैं। इसके अतिरिक्त कुछ स्थितियों में गुजराती, पंजाबी, बिष्णुपुरिया मणिपुरी, रोमानी, उर्दू आदि भाषाएँ भी देवनागरी लिपि में लिखी जाती हैं।

अधिकतर भारतीय लिपियाँ ब्राह्मी लिपि से विकसित हुई हैं। देवनागरी लिपि का विकास भी ब्राह्मी लिपि से हुआ है। नागरी भारत की लगभग 10 प्रमुख लिपियों में से एक है। देवनागरी एक आक्षरिक (सिलैबिक) लिपि है जो प्रचलित लिपियों (रोमन, अरबी, चीनी आदि) में सबसे अधिक वैज्ञानिक है। अधिकतर लिपियों की तरह देवनागरी भी बाएँ से दाएँ की तरफ़ लिखी जाती है। प्रत्येक शब्द के ऊपर एक रेखा खिंची होती है (कुछ वर्णों के ऊपर रेखा कटी होती है, जैसे:- ध, भ) जिसे 'शिरोरेखा' कहते हैं।

हिंदी के लिए प्रयुक्त देवनागरी लिपि में कुल 52 वर्ण हैं, जिनमें 11 मूल स्वर वर्ण (जिनमें से 'ऋ' का उच्चारण अब स्वर जैसा नहीं होता), 33 मूल व्यंजन, 2 उत्क्षिप्त व्यंजन, 2 अयोगवाह और 4 संयुक्ताक्षर व्यंजन हैं।

कुल 52 वर्ण = (11 मूल स्वर ) + (33 मूल व्यंजन ) + (2 उत्क्षिप्त व्यंजन ) + (2 अयोगवाह ) + (4 संयुक्ताक्षर व्यंजन )

 

 

(11 मूल स्वर )

अ आ इ ई उ ऊ ऋ ए ऐ ओ औ

(33 मूल व्यंजन )

क ख ग घ ङ

च छ ज झ ञ

ट ठ ड ढ ण

त थ द ध न

प फ ब भ म

य र ल व

श ष स ह

(2 उत्क्षिप्त व्यंजन )

ड़ ढ़

(2 अयोगवाह )

अं अः

(इन वर्णों को अब प्रायः वर्णमाला में सम्मिलित नहीं किया जाता)

(4 संयुक्ताक्षर व्यंजन )

क्ष त्र ज्ञ श्र

 

वर्ण (Characters/Letters )


हिंदी भाषा में प्रयुक्त एकल लिपि चिह्न वर्ण कहलाता है।

जैसे:- अ, आ, इ, ई, उ, ऊ, क, ख आदि।


वर्णमाला (The Devanagari Characters [ syllabary ])

वर्णों के समुदाय को ही वर्णमाला कहते हैं। हिंदी वर्णमाला में 52 वर्ण हैं। उच्चारण और प्रयोग के आधार पर हिंदी वर्णमाला के दो भेद किए गए हैं:-

1. स्वर (Vowels)

2. व्यंजन (Consonants)


स्वर (Vowels)

जिन वर्णों का उच्चारण स्वतंत्र रूप से होता हो और जो व्यंजनों के उच्चारण में सहायक हों, वे स्वर कहलाते हैं। ये संख्या में 11 हैं - अ आ इ ई उ ऊ ऋ ए ऐ ओ औ। (हिंदी मे 'ऋ' का उच्चारण स्वर जैसा नहीं होता। इसका प्रयोग केवल संस्कृत तत्सम शब्दों में होता है।)

उच्चारण के समय की दृष्टि से स्वर के तीन भेद किए गए हैं-

1. ह्रस्व स्वर (Short vowels)

2. दीर्घ स्वर (Long vowels)

3. प्लुत स्वर (Longer vowels)


1. ह्रस्व स्वर (Short vowels)

जिन स्वरों के उच्चारण में कम समय लगता है उन्हें ह्रस्व स्वर कहते हैं। जैसे:- अ, इ, उ। इन्हें मूल स्वर भी कहते हैं।


2. दीर्घ स्वर (Long vowels)

जिन स्वरों के उच्चारण में ह्रस्व स्वरों से अधिक समय लगता है, उन्हें दीर्घ स्वर कहते हैं। ये हिंदी में सात (7) हैं:- आ, ई, ऊ, ए, ऐ, ओ, औ

विशेष:- दीर्घ स्वरों को ह्रस्व स्वरों का दीर्घ रूप नहीं समझना चाहिए। यहाँ दीर्घ शब्द का प्रयोग उच्चारण में लगने वाले समय को आधार मानकर किया गया है।


3. प्लुत स्वर (Longer vowels)

जिन स्वरों के उच्चारण में दीर्घ स्वरों से भी अधिक समय लगता है, उन्हें प्लुत स्वर कहते हैं। जैसे सुनो ऽ ऽ।


मात्राएँ (स्वर चिह्न) (Dependent vowel signs)

व्यंजन के बाद स्वरों के बदले हुए स्वरूप (सांकेतिक रूप) को मात्रा कहते हैं। स्वरों की मात्राएँ निम्नलिखित हैं:-

स्वर

मात्रा ( स्वर चिह्न )

व्यंजन + मात्रा = अक्षर

अ वर्ण (स्वर) की मात्रा नहीं होती।

क = क

( क + ा ) = का

ि

( क + ि ) = कि

( क + ी ) = की

( क + ु ) = कु

( क + ू ) = कू

( क + ृ ) = कृ

( क + े ) = के

( क + ै ) = कै

( क + ो ) = को

( क + ौ ) = कौ

लेखन में मात्राएँ हमेशा किसी न किसी व्यंजन के साथ ही प्रयोग में लाई जाती हैं। 'अ' वर्ण (स्वर) की कोई मात्रा नहीं होती। व्यंजन वर्णों के अपने मूल स्वरूप में 'अ' स्वर अंतर्निहित होता है। किसी मात्रा के लगने पर यह अंतर्निहित 'अ' हट जाता है।


व्यंजन (Consonant)

जिन वर्णों के उच्चारण के लिए स्वरों की सहायता ली जाती है, वे व्यंजन कहलाते हैं। ये मूलतः संख्या में 35 हैं। इनके निम्नलिखित तीन भेद हैं:-

1. स्पर्श व्यंजन (Stop Consonants)

2. उत्क्षिप्त व्यंजन (Flap Consonants)

3. अंतःस्थ (अन्तस्थ) व्यंजन (Approximant Consonants)

4. ऊष्म (संघर्षी) व्यंजन (Sibilants)

 

1. स्पर्श व्यंजन (Stop Consonants)

'क' से 'म' तक 20 वर्ण स्पर्श तथा 5 व्यंजन स्पर्श संघर्षी व्यंजन कहलाते हैं। इनका उच्चारण करते समय जिह्वा का तालु, दाँत आदि से उच्चारण स्थानों से पूरा स्पर्श होता है। इन्हें पाँच वर्गों में रखा गया है और हर वर्ग में पाँच-पाँच व्यंजन हैं। हर वर्ग का नाम पहले वर्ग के अनुसार रखा गया है जैसे:-

- वर्ग : - (कोमल तालव्य व्यंजन)

Velar consonants (produced at the soft palate)

क ख ग घ ङ

- वर्ग : - (तालव्य व्यंजन)

च-वर्ग के व्यंजन स्पर्श-संघर्षी व्यंजन कहलाते हैं।

Palatal consonants (produced at the palate)

च छ ज झ ञ

- वर्ग : - (मूर्धन्य व्यंजन)

Cerebral consonants

(Tongue curls back to touch the palate)

ट ठ ड ढ ण

- वर्ग : - (दंत्य व्यंजन)

Dental consonants

(Tongue touches the upper teeth)

त थ द ध न

('न' का उच्चारण हिंदी में वर्त्स्य होता है)

- वर्ग : - (ओष्ठ्य व्यंजन)

Labial consonants (produced with the lips)

प फ ब भ म

i. स्पर्श:-

वर्ग

उच्चारण स्थान

अघोष अल्पप्राण

अघोष महाप्राण

सघोष अल्पप्राण

सघोष महाप्राण

नासिक्य

कोमल तालव्य

( कंठ्य )

कोमल तालु

मूर्धन्य

तालु का मूर्धा भाग

दंत्य

दाँत

(वर्त्स्य)

ओष्ठ्य

दोनों होठ

ii. स्पर्श-संघर्षी:-

वर्ग

उच्चारण स्थान

अघोष अल्पप्राण

अघोष महाप्राण

सघोष अल्पप्राण

सघोष महाप्राण

नासिक्य

तालव्य

तालु

 

 

2. उत्क्षिप्त व्यंजन (Flap Consonants)

ये निम्नलिखित दो हैं-

ड़, ढ़

ड़ (सघोष, अल्पप्राण, मूर्धन्य, उच्चारण स्थान, तालु का मूर्धा भाग)

ढ़ (सघोष, महाप्राण, मूर्धन्य, उच्चारण स्थान, तालु का मूर्धा भाग)


3. अंतःस्थ (अंतस्थ) व्यंजन (Approximant Consonants)

ये निम्नलिखित चार हैं -

य र ल व

य - (तालव्य, उच्चारण स्थान- तालु)

र - (वर्त्स्य, उच्चारण स्थान- वर्त्स)

ल - (वर्त्स्य, उच्चारण स्थान- वर्त्स)

व - (द्वयोष्ठ्य, उच्चारण स्थान- दोनों होठ)


4. ऊष्म (संघर्षी) व्यंजन (Sibilants)

ये निम्नलिखित चार हैं -

श ष स ह

श - (अघोष, तालव्य, उच्चारण स्थान- तालु)

ष - (अघोष, मूर्धन्य, उच्चारण स्थान- तालु का मूर्धा भाग। इसका उच्चारण हिंदी में 'श' जैसा ही होता है।)

स - (अघोष, वर्त्स्य, उच्चारण स्थान- वर्त्स)

ह - (सघोष, स्वरयंत्रीय, उच्चारण स्थान- स्वरयंत्र)


अयोगवाह वर्ण (Ayogwah characters)

स्वर व व्यंजन से बने वर्ण अयोगवाह कहलाते हैं। इसमें पहले स्वर का उच्चारण होता है, जैसे- अ+म्=अं और अ+ह्=अः


संयुक्त व्यंजन (Conjunct characters or consonants)

दो व्यंजनों के योग से बने हुए व्यंजनों को संयुक्त व्यंजन कहते हैं। हिंदी में निम्नलिखित चार व्यंजन (क्ष, त्र, ज्ञ, श्र) ऐसे हैं, जो दो-दो व्यंजनों के योग से बने हैं, किंतु एकल वर्ण के रूप में प्रयुक्त होते हैं।

क् और ष के योग से बना हुआ- क्ष

( क्+ष ) = क्ष

त् और र के योग से बना हुआ- त्र

( त्+र ) = त्र

ज् और ञ के योग से बना हुआ- ज्ञ

( ज्+ञ ) = ज्ञ

इसका उच्चारण हिंदी में 'ग्य' जैसा होता है

श् और र के योग से बना हुआ- श्र

( श्+र ) = श्र

वैसे तो जहाँ भी दो या दो से अधिक व्यंजन मिल जाते हैं, वे संयुक्त व्यंजन कहलाते हैं, किंतु देवनागरी लिपि में संयोग के बाद रूप-परिवर्तन हो जाने के कारण इन चारों संयुक्त व्यंजनों को हिंदी वर्णमाला के अंतर्गत गिनाया गया है। ये दो-दो व्यंजनों से मिलकर बने हैं। जैसे:- क्ष=क्+ष (अक्षर), त्र=त्+र (नक्षत्र), ज्ञ=ज्+ञ (ज्ञान), और श्र=श्+र (श्रम)।


शब्दों के अंतर्गत वर्ण ' ' के विविध रूप

(र + ा + म) = राम

(क + ् + र + म) = क्रम

(क + र + ् + म) = कर्म

(र + ा + ष + ् + ट + ् + र) = राष्ट्र


नासिक्य व्यंजन (Nasal Consonants)

स्पर्श व्यंजन तालिका के क-वर्ग, च-वर्ग, ट-वर्ग, त-वर्ग तथा प-वर्ग के पंचम वर्ण यानी ङ, ञ, ण, न, म को नासिक्य व्यंजन कहते हैं


अनुस्वार ( बिंदु ' ' ) (Anusvar)

इसका प्रयोग स्पर्श व्यंजन तालिका के पंचम वर्ण नासिक्य व्यंजन के स्थान पर होता है अर्थात् क-वर्ग, च-वर्ग, ट-वर्ग, त-वर्ग तथा प-वर्ग के पंचम वर्ण यानी ङ, ञ, ण, न, म के स्थान पर होता है। इसका चिह्न 'ं' है। अनुस्वार मूलतः व्यंजन ही है। जैसे:-

गङ्गा = गंगा

पञ्च = पंच

पण्डित = पंडित

हिन्‍दी = हिंदी

दम्भ = दंभ

ध्यान देने योग्य :-

  1. अनुस्वार के बाद यदि य, र, ल, व, श, ष, स, ह वर्ण आते हैं जो कि किसी वर्ग में सम्मिलित नहीं हैं तो केवल अनुस्वार का ही प्रयोग किया जाता है। तब उसे किसी वर्ण में नहीं बदला जा सकता। जैसे संयम, संरक्षण .. यहाँ अनुस्वार के बाद य और र वर्ण हैं जो किसी वर्ग के अंतर्गत नहीं आते इसलिए यहाँ बिंदु ही लगेगा।
  1. जब दो पंचम वर्ण एक साथ हों तो वहाँ पंचम वर्णों का ही प्रयोग किया जाता है। वहाँ अनुस्वार नहीं लगता। जैसे:- सम्मान, चम्मच, उन्नति, जन्म आदि।


(चंद्रबिंदु ' ') या अनुनासिक (Nasalisation Marker)

जब किसी स्वर का उच्चारण मुख और नासिका दोनों से किया जाता है तब उसके ऊपर चंद्रबिंदु (ँ) लगा दिया जाता है। वह अनुनासिक स्वर कहलाता है। अनुनासिक चिह्न 'ँ' को चंद्रबिंदु कहते हैं। जैसे:- चाँद, साँझ, आँख, गाँव, हँसना, आदि। यदि शिरोरेखा के ऊपर किसी मात्रा का प्रयोग हुआ हो तो स्थान की कमी को देखते हुए इस स्थिति में चंद्रबिंदु 'ँ' की जगह पर बिंदु 'ं' का भी प्रयोग होता है। जैसे:- मैं


विसर्ग (' ') (Visarga)

इसका उच्चारण ह् के समान होता है। (जहाँ 'ह' ध्वनि सघोष है वहीं विसर्ग ध्वनि अघोष है) इसका चिह्न ( ः ) है। जैसे:- अतः, प्रायः।


हल चिह्न (' ') ( Hal Sign)

जब कभी व्यंजन का प्रयोग स्वर से रहित किया जाता है, तब उसके नीचे एक तिरछी रेखा (्) लगा दी जाती है। यह रेखा हल कहलाती है। व्यंजन से अंत होने वाला शब्द हलंत शब्द कहलाता है। जैसे:- जगत्।


नुक्ता (' ') (Nukta)

हिंदी भाषा में अरबी और फ़ारसी भाषाओं से आए हुए कुछ शब्दों को देवनागरी में लिखने के लिए कुछ वर्णों के नीचे एक बिंदुनुमा चिह्न ('़') का उपयोग किया जाता है उसे ही नुक्ता कहते हैं। (जैसे क़, ख़, ग़, ज़, फ़ आदि)। नुक्ता का प्रयोग मुख्यतः वर्ण के सामान्य से भिन्न उच्चारण पर आधारित है।


वर्तनी (वर्णविन्यास) ( Spelling)

किसी भी भाषा की वर्तनी का अर्थ उस भाषा में शब्दों को वर्णों के निश्चित अनुक्रम से अभिव्यक्त करने की क्रिया को कहते हैं। भाषा के प्रत्येक शब्द की एक अपनी निश्चित वर्तनी होती है। किसी भी भाषा को उसकी लिपि के माध्यम से उस भाषा के वर्णों को एक निश्चित क्रम में लिखकर कोई शब्द निरूपित किया जाता है तो वही वर्णविन्यास उस शब्द की वर्तनी कहलाता है। जैसे:-

शब्द

वर्तनी ( वर्णविन्यास )

दल

द + ल

दाल

द + ा + ल

आज

आ + ज

समय

स + म + य

अमर

अ + म + र

शीतकाल

श + ी + त + क + ा + ल


देवनागरी अंक (Devanagari digits)

देवनागरी अंक निम्न रूप में लिखे जाते हैं। भारतीय अंकों के अंतरराष्ट्रीय रूप को मानक माना गया है।

अंतरराष्ट्रीय मानक

0

1

2

3

4

5

6

7

8

9

देवनागरी अंक

 

शून्य

एक

दो

तीन

चार

पाँच

छह

सात

आठ

नौ


चिह्न (Symbols)

हिंदी में विरामचिह्नों का प्रयोग:-

 

क्रम

नाम

विराम चिह्न

1

पूर्ण विराम या विराम

खड़ी-पाई (।)

2

अर्द्धविराम

(;)

3

अल्पविराम

(,)

4

प्रश्नवाचक

(?)

5

विस्मयसूचक (संबोधन चिह्न)

(!)

6

उद्धरण

("") ('')

7

योजक

(-)

9

कोष्ठक

[()]

10

हंसपद (त्रुटिबोधक)

(^)

11

रेखांकन

(_)

12

लाघव चिह्न

(॰)

13

लोप चिह्न

(...)

14

अवग्रह चिह्न

()

 

 

कंप्यूटर पर हिंदी

 

यूनीकोड क्या है ?

यूनीकोड अँग्रेज़ी के दो शब्दों, यूनीवर्सल (जागतिक) एवं कोड (कूट संख्या) से गठित एक नया शब्द है। अतः यूनीकोड का मतलब एक 'विशेष कूट संख्या' से है। यूनीकोड शब्द कंप्यूटर विज्ञान एवं प्रौद्योगिकी के क्षेत्र में प्रचलित है। इसे यूनीवर्सल कोड भी कहते हैं। कंप्यूटर कार्यक्रम के अंतर्गत यूनीकोड प्रत्येक वर्ण के लिए एक विशेष अंक प्रदान करता है, चाहे कोई भी प्लेट्फ़ॉर्म हो, चाहे कोई भी प्रोग्राम हो, चाहे कोई भी भाषा हो। यूनीकोड को व्यापक रूप से विश्वव्यापी सूचना आदान-प्रदान के मानक के रूप में स्वीकार किया जा चुका है।


यूनीकोड : तकनीकी परिचय

यह 16 बिट (2 बाइट) का कोड है। इसे ही यूनीकोड मानक माना गया है। यूनीकोड 16 - बिट एनकोडिंग का प्रयोग करता है; जोकि 65536 कोड-प्वाइंट (वर्ण) उपलब्ध कराता है। 16 बिट यूनीकोड में 65536 वर्णों (कैरेक्टरों) की उपलब्धता होने के कारण यह कोड विश्व की लगभग सभी लेखनीबद्ध भाषाओं के लिए सभी कैरेक्टरों को एनकोड करने की क्षमता रखता है। यूनीकोड मानक कैरेक्टर के बारे में सूचना और उनका उपयोग बताते हैं। कंप्यूटर उपयोक्ताओं के लिए जो बहुभाषी टेक्स्ट (पाठ) पर काम करते है, व्यापारियों, भाषाविदों, अनुसंधानकर्त्ताओं, वैज्ञानिकों, गणितज्ञों और तकनीशियनों के लिए यूनीकोड मानक बहुत लाभप्रद है। यूनीकोड मानक (स्टैंडर्ड) प्रत्येक कैरेक्टर को एक विलक्षण संख्यात्मक मान और नाम देता है। यह अंतरराष्ट्रीय मानक है। इससे हिंदी तथा अन्य भारतीय भाषाओं में कंप्यूटर पर अँग्रेज़ी की तरह ही सरलता से और शतप्रतिशत शुद्धता से कार्य किया जा सकता है।

 

आंतरिक तौर पर कंप्यूटर केवल द्विआधारी (बाइनरी) कूट अंकों (0 और 1) को ही समझता है। इसलिए हम जो भी वर्ण टाइप करते हैं वह अंततः 0 और 1 में ही परिवर्तित किए जाते हैं, तभी कंप्यूटर उन्हे समझ पाता है। किस भाषा के किस शब्द के लिए कौन-सा अंक प्रयुक्त होगा इसका निर्धारण करने के नियम विभिन्न कैरेक्टर-सैट (character set) या संकेत-लिपि प्रणाली (Encoding System) द्वारा निर्धारित होते हैं। ये प्रत्येक वर्ण के लिए एक अंक निर्धारित करके वर्ण संग्रहीत करते हैं। यूनीकोड का आविष्कार होने से पहले, ऐसे अंक देने के लिए सैकड़ों विभिन्न संकेत-लिपि प्रणालियाँ थीं। किसी एक संकेत लिपि में पर्याप्त वर्ण नहीं है। उदाहरण के लिए, यूरोपीय संघ को अकेले ही, अपनी सभी भाषाओं के वर्णों को संग्रहीत करने के लिए विभिन्न संकेत लिपियों की आवश्यकता होती है। यहाँ तक कि अँग्रेज़ी जैसी भाषा के लिए भी, सभी वर्णों, विरामचिह्नों और सामान्य प्रयोग के तकनीकी प्रतीकों हेतु एक ही संकेत लिपि पर्याप्त नहीं थी।

इन संकेत लिपियों में आपस में तालमेल भी नहीं है। इसीलिए, दो संकेत-लिपियाँ दो विभिन्न वर्णों के लिए, एक ही अंक प्रयोग कर सकती हैं, अथवा समान वर्ण के लिए विभिन्न अंकों का प्रयोग कर सकती हैं। किसी भी कंप्यूटर को विभिन्न संकेत लिपियों की आवश्यकता होती है; फिर भी जब दो विभिन्न संकेत लिपियों अथवा प्लेट्फॉर्मों के बीच डाटा भेजा जाता है तो उस डाटा के हमेशा खराब होने का जोखिम रहता है।


यूनीकोड के प्रयोग से क्या लाभ हैं ?

  1. एकरूपता। विभिन्न तरह के अस्की फ़ॉन्ट्स से छुटकारा मिलता है।
  2. हिंदी में ई-मेल, चैट आदि आसानी से कर सकते हैं।
  3. कार्यालयों के सभी कार्य कंप्यूटर पर हिंदी में आसानी से होते हैं।
  4. हिंदी में बनी फाइलों का आसानी से आदान-प्रदान कर सकते हैं।
  5. हिंदी की-वर्ड को गूगल या किसी अन्य सर्च इंजन में सर्च कर सकते हैं।


कंप्यूटर पर यूनीकोड में हिंदी देवनागरी के टंकण (टाइपिंग) हेतु कुछ विधियाँ

कंप्यूटर पर यूनीकोड आधारित हिंदी टाइपिंग (टंकण) करने के लिए सामान्यतः एक हिंदी उपकरण (टूल) की ज़रूरत होती है, जिसे आई॰एम॰इ॰ IME (Input Method Editor) टूल कहते हैं। यूनीकोड अस्की फ़ॉन्ट (कृतिदेव - 8 बिट कोड फ़ॉन्ट) की तरह व्यवहार नही करता जैसे कि हम एम॰एस॰ वर्ड में जाकर कृतिदेव फ़ॉन्ट चुन कर हिंदी टाइपिंग करने लगते हैं। यूनीकोड का प्रचलित फ़ॉन्ट मंगल (16 बिट कोड फ़ॉन्ट) है। एम॰एस॰ वर्ड में हम मंगल को कृतिदेव की तरह चुन कर हिंदी टाइपिंग नहीं कर सकते हैं। यूनीकोड आधारित हिंदी देवनागरी, आई॰एम॰इ॰ IME (Input Method Editor) टूल, आई॰एस॰एम॰ ISM (ISFOC Script Manager), प्रखर देवनागरी लिपिक, प्रलेख देवनागरी लिपिक आदि जैसे उपकरणों की सहायता से टंकित (टाइप) की जा सकती है।

वर्तमान में कंप्यूटर पर यूनीकोड आधारित हिंदी टंकण (टाइपिंग) हेतु मुख्यतः तीन विधियाँ बहु-प्रचलित हैं:-

1. रेमिंग्टन टंकण शैली

2. इन-स्क्रिप्ट टंकण शैली

3. फोनेटिक इंग्लिश आधारित टंकण शैली

इन तीनों प्रकार की टंकण शैली (विधि - Method) की अपनी-अपनी टंकण करने की एक विधा है और प्रत्येक के लिए अपना-अपना एक की-बोर्ड लेआउट (Keyboard Layout or Overlay) भी है।

यहाँ पर ध्यान देने योग्य बात यह है कि टंकण शैली (विधि - Method) और की-बोर्ड लेआउट (Keyboard Layout) दो भिन्न बातें हैं। तो आगे जाने से पहले प्रत्येक के लिए की-बोर्ड लेआउट की बात करते हैं।

यहाँ की-बोर्ड लेआउट से अभिप्राय यह है कि कुंजीपटल पर देवनागरी के विभिन्न वर्णों का एक निश्चित क्रम में कुंजीपटल की कुंजियों पर व्यवस्थित रूप से होना है। हिंदी टंकण के लिए निम्नलिखित तीन की-बोर्ड लेआउट बहु-प्रचलित हैं, जो इस प्रकार से हैं:-

1. टाइपर-राइटर लेआउट - इसे प्रायः रेमिंग्टन टाइप-राइटर के नाम से भी जाना जाता है। इसका लेआउट हिंदी टाइप-राइटर (टाइपिंग मशीन) पर आधारित है। यह काफ़ी पुराना और बहु-प्रचलित लेआउट है। यह लेआउट उन लोगों के लिए उपयोगी है जो कंप्यूटर पर आने से पूर्व ही इस लेआउट पर टाइपिंग सीखे हैं या पहले से ही इस पर टाइपिंग करने के आदी हैं।

 

रेमिंगटन की-बोर्ड लेआउट

 

सामान्य अवस्था

(1)

शिफ़्ट कुंजी दबा कर

(2)

रेमिंग्टन टंकण शैली: - टंकण शैली से यहाँ अभिप्राय यह है कि हिंदी शब्द टंकण (टाइपिंग) करने के लिए टंकणकर्ता किस क्रम में कुंजियों का उपयोग करता है। रेमिंग्टन की टंकण शैली का सिद्धांत इस प्रकार से है (The way you see, the way you type) अर्थात् "जिस तरह से आपको पाठ दीखता है, उसी तरह से (उसी वर्ण क्रम में) आप टाइप करते हैं"। जैसे कि आपको 'कविता' लिखना है तो वर्ण कुंजियों का टंकण क्रम इस प्रकार से होगा:-

क + ि + व + त + ा = कविता

इसी प्रकार:-

क + ा + य + र् = कार्य

क + फ + ़ + ् + य + ू + र् = कर्फ़्यू

स् + प + ा + े + ट + ् + र् + स = स्पोर्ट्स

ब + ि + ढ + ़ + य + ा = बढ़िया

रेमिंग्टन एक टच टाइपिंग प्रणाली है। टच टाइपिंग एक टंकण विधि है, जिसमें की-बोर्ड को बिना देखे केवल हाथों से छू-कर टाइप किया जाता है। यह हिंदी टाइपिंग की सबसे पुरानी विधि है। यह उन प्रयोगकर्ताओं के लिए एकदम सही और उपयोगी है जिन्होंने पहले से हिंदी टाइपराइटर पर हिंदी टाइपिंग सीखी है तथा इसके अभ्यस्त हैं। यह विधि अब काफी हद तक समयातीत (आउट-डेटेड) हो चुकी है तथा नए सिरे से हिंदी टाइपिंग सीखने वालों के लिए उपयोगी नहीं है। आजकल इसका प्रयोग मुख्य रूप से नॉन-यूनीकोड ग्राफिक्स तथा डीटीपी (डेस्कटॉप पब्लिशिंग) प्रोग्रामों में किया जाता है।

रेमिंग्टन टंकण शैली के तहत हिंदी टाइपिंग करने के लिए टंकणकर्ता को अँग्रेज़ी भाषा की जानकारी का होना कतई आवश्यक नहीं है। एकदम अँग्रेज़ी का ज्ञान न रखने वाले भी इस शैली से बखूबी टंकण कार्य कर सकते हैं।

2. डी.ओ.इ. फोनेटिक - इसे इन-स्क्रिप्ट लेआउट कहते हैं। इस लेआउट का मानकीकरण भारत सरकार के इलेक्ट्रॉनिक्स विभाग DOE (Department of Electronics) द्वारा किया गया तथा "ब्यूरो ऑफ इण्डियन स्टैंडर्ड्स" (BIS) द्वारा इसे राष्ट्रीय मानक घोषित किया गया। इस लेआउट की सबसे बड़ी खूबी यह है कि यह सभी भारतीय भाषाओं के वर्णों के लिए प्रयुक्त कुंजियों में समरूपता रखता है अर्थात् कुंजीपटल की कुंजी 'k' सभी भारतीय भाषाओं के लिए वर्ण 'क' की कुंजी रहेगी।


इन-स्क्रिप्ट की-बोर्ड लेआउट

सामान्य अवस्था

(1)

शिफ़्ट कुंजी दबा कर

(2)

 

इन-स्क्रिप्ट टंकण शैली :- इन-स्क्रिप्ट टंकण शैली का सिद्धांत इस प्रकार से है (The way you pronounce, the way you type) अर्थात् "जिस तरह से आप पाठ का उच्चारण करते हैं, उसी तरह से (उसी वर्ण क्रम में) आप टाइप करते हैं"। जैसे कि आपको 'कविता' लिखना है तो वर्ण कुंजियों का टंकण क्रम इस प्रकार से होगा:-

क + व + ि + त + ा = कविता

इसी प्रकार :-

क + ा + र् + य = कार्य

क + र् + फ + ़ + ् + य + ू = कर्फ़्यू

स + ् + प + ो + र् + ट + ् + स = स्पोर्ट्स

ब + ढ + ़ + ि + य + ा = बढ़िया

इन-स्क्रिप्ट टंकण भी एक टच टाइपिंग प्रणाली है। इसके ध्वन्यात्मक (वर्णक्रम) गुण के कारण एक व्यक्ति जो कि किसी एक लिपि में इन-स्क्रिप्ट टाइपिंग जानता हो वह सभी भारतीय लिपियों में, बिना उस लिपि के ज्ञान के भी श्रुतलेखन द्वारा टाइप कर सकता है। उदाहरण - तेलुगु में राम लिखना हो या हिंदी में, दोनो दशाओं में समान कुंजियाँ दबाने से काम बन जाता है अर्थात् यदि आप देवनागरी में टाइप करना जानते हैं तो तेलुगु में भी लिख सकते हैं।

इन-स्क्रिप्ट टंकण शैली के तहत हिंदी टाइपिंग करने के लिए टंकणकर्ता को अँग्रेज़ी भाषा की जानकारी का होना कतई आवश्यक नहीं है। एकदम अँग्रेज़ी का ज्ञान न रखने वाले भी इस शैली से बखूबी टंकण कार्य कर सकते हैं, परंतु टंकणकर्ता को हिंदी पढ़ना आना ज़रूरी है, क्योंकि यहाँ जो शब्द टाइप किया जाएगा वह उस शब्द के उच्चारण के वर्ण क्रम में ही कुंजियाँ प्रयोग कर टाइप कर सकेगा।

यह सभी प्रमुख प्रचालन तंत्रों (OS) में अंतर्निर्मित (Inbuilt) आता है इसलिए किसी अलग टाइपिंग औजार को इंस्टाल करने की आवश्यकता नहीं। वह सभी नवीन उपयोगकर्ता, जो कंप्यूटर पर पहले से हिंदी के लिए किसी भी प्रकार की टाइपिंग नहीं जानते उन्हें इन-स्क्रिप्ट ही सीखना चाहिए। इन-स्क्रिप्ट का कुंजीपटल विन्यास विशेष शोध द्वारा विशिष्ट क्रम में बनाया गया है, जिससे इसे याद करना अत्यंत सरल है।

मात्र एक हफ्ते के अभ्यास से ही इन-स्क्रिप्ट में लिखना शुरू किया जा सकता है। इन-स्क्रिप्ट में आमतौर पर एक वर्ण के लिए एक कुंजी होने से टाइपिंग की अशुद्धियाँ कम होती हैं। इन-स्क्रिप्ट लेआउट में भारतीय लिपियों के सभी यूनीकोड मानकीकृत चिह्नों को शामिल किया गया है। टच स्क्रीन डिवाइसों यथा टैबलेट पीसी तथा मोबाइल फोन आदि के लिए भी इन-स्क्रिप्ट की-बोर्ड पूर्णतया उपयुक्त है।

3. फोनेटिक इंग्लिश - इसे रोमनाइज्ड लेआउट कहते हैं। इसका ध्वन्यात्मक लिप्यंतरण आधारित की-बोर्ड लेआउट कंप्यूटर का वास्तविक की-बोर्ड लेआउट (QWERTY) ही है। ध्वन्यात्मक लिप्यंतरण (फोनेटिक ट्राँसलिट्रेशन) मशीनी लिप्यंतरण की एक विधि है। यह एक लिप्यंतरण विधि है, जिससे कि हिंदी आदि भारतीय लिपियों को आपस में तथा रोमन में बदला जाता है। इसकी कोई मानक लिप्यंतरण स्कीम नहीं होती। अलग-अलग टूल में अलग-अलग स्कीम प्रयोग होती है।


फोनेटिक इंग्लिश रोमनाइज्ड की-बोर्ड लेआउट

सामान्य अवस्था

(1)

शिफ़्ट कुंजी दबा कर

(2)

फोनेटिक इंग्लिश ( रोमनाइज्ड ) आधारित टंकण शैली :- इस टंकण शैली में प्रयोक्ता हिंदी (अथवा कोई इंडिक) टेक्स्ट को रोमन लिपि में टाइप करता है तथा यह रियल टाइम में समकक्ष देवनागरी (अथवा इंडिक लिपि) में ध्वन्यात्मक रूप से परिवर्तित हो जाता है। इस प्रकार का स्वचालित परिवर्तन ध्वन्यात्मक टेक्स्ट एडिटर, वर्ड प्रोसेसर तथा सॉफ्टवेयर प्लगइन के द्वारा किया जाता है। परंतु सर्वश्रेष्ठ तरीका फोनेटिक आइ॰एम॰इ॰ का प्रयोग है, जिसकी सहायता से टेक्स्ट किसी भी एप्लिकेशन में सीधे ही लिखा जा सकता है।

लेकिन इस टंकण शैली में कार्य करने के लिए प्रयोगकर्ता को अँग्रेज़ी का अच्छा-खासा ज्ञान होना आवश्यक है। यह कंप्यूटर के उन प्रयोगकर्ताओं के लिए बेहतर है, जो पहले से ही अँग्रेज़ी की टाइपिंग जानते हैं और हिंदी टाइप करना चाहते हैं। जैसे कि आपको 'कविता' लिखना है तो रोमन वर्ण कुंजियों का टंकण क्रम इस प्रकार से होगाः-

k + a + v + i + t + a + a = कविता

उसी प्रकार:-

k + a + a + r + y + a = कार्य

k + a + r + f + y + u + u = कर्फ्यू

s + p + o + r + t + s = स्पोर्ट्स

b + a + d + h + i + y + a + a = बढ़िया


End Text   End Text    End Text