Monday, September 6, 2010

मशीनी अनुवाद की समस्याएँ।(Problems of Machine Translation )

मशीनी अनुवाद की समस्याएँ। Problems of Machine Translation

अनुवाद मूल रुप से एक बौद्धिक प्रक्रिया है। जिसकी क्षमता केवल मनुष्य के पास है। अत: कोई भी कंप्यूटर पूरी तरह मानव बुद्धि की जगह नहीं ले सकता।किसी एक भाषा से दूसरी भाषा में अनुवाद की प्रक्रिया मात्र शब्दों का अनुवाद नहीं है बल्कि यह एक विचार प्रक्रिया है, वाक्य, शब्द और अर्थ के स्तर पर प्राकृतिक भाषाओं में व्याप्त संदिग्धता को समझ कर जब तक रीतिबद्ध नहीं कर लिया जाता तब तक मशीनी अनुवाद की कल्पना भी नहीं की जा सकती।”1 मशीनी अनुवाद में एक ओर प्राकृतिक बुद्धि और कृत्रिम बुद्धि की प्रक्रियाओं के मूल तत्वों का समावेश होता है दूसरी ओर संप्रेषण के सिद्धांतों, व्याकरण के नियमों और तर्क विज्ञान (logic science) के सिद्धांतों का भी समावेश होता है। मशीनी अनुवाद की समस्याओं को प्रमुख रुप से चार भागों में विभाजित किया जा सकता हैं।
2.1. अनुवाद पूर्व समस्याएँ (pre -Translation Problems)
2.2. अनुवाद की समस्याएँ (Translation Problems)
2.3. अनुवादोत्तर समस्याएँ (Post-Translation Problems)
2.4. अनुवादक की समस्याएँ (Translator/User problems)
मशीनी अनुवाद की समस्याएँ मशीनी अनुवाद में होने वाले घटकों के अकार्यक्षम व्यवहार के कारण उत्पन्न होती हैं। ये समस्यायें कई बार मशीन में होने वाले प्रोग्राम के कारण उत्पन्न होती हैं, तो कई बार मानव निर्मित होती हैं जिन्हें हम निम्न रुप से देख सकते हैं।
2.1. अनुवाद पूर्व समस्याएँ:-
यह समस्याएँ मशीनी अनुवाद का कार्य करने से पहले आने वाली समस्याएँ हैं। भारत एक बहुभाषिक देश होने के बावजूद भारत की अधिकांश जनसंख्या निम्न आय रेखा में रहती है जिसमें कई लोग अनुवाद को अपना व्यवसाय चुनते हैं। ऐसे लोगो के लिए .अनु. को आर्थिक रुप से उपयोग में लाना कठिन है। जैसे :- “MT is a very expensive endeavor, both in terms of the software development effort required and in terms of the linguistic resources which need to be assembled.2 दूसरी समस्या कंप्यूटर की सीमित उपलब्धता, उच्च कोटि के या तेज गति से कार्य करने वाले कंप्यूटर हैं। इस परिस्थिति में उपयोग कर्त्ता/कर्मचारी को कंप्यूटर की जानकारी होना या अनुवाद यंत्रों के संबंध में संपूर्ण जानकारी का अभाव भी एक अनुवाद पूर्व समस्या कही जा सकती है।
2.2 अनुवाद की समस्याएँ:- अनुवाद की समस्या प्रमुख रुप से अनुवाद की प्रक्रिया से जुड़ी हुई है। जिसे हम पुन: तीन भागों में विभाजित कर सकते हैं।
2.2.1 भाषा वैज्ञानिक समस्याएँ (Language problems)
2.2.2 व्याकरणिक समस्याएँ (Grammar problems)
2.2.3 भाषिक संसाधनों के उपयोग और निर्माण की समस्याएँ (for use and development of language tool)
2.1 भाषा वैज्ञानिक समस्याएँ :- मशीनी अनुवाद में भाषा वैज्ञानिक समस्याओं (Linguistic problems In म.अनु.) को Harold Somers ने निम्न रुप से विभाजित किया है जिसमें भाषा विज्ञान की अधिकतर समस्याओं पर विस्तृत रुप से विचार होना चाहिए।3
2.1.1 समस्या विश्लेषक (प्राकृतिक भाषा संसाधन के लिए) problems Analysis
(Apply to all NLP):- (क) शाब्दिक(Lexical) (ख) वाक्यगत(Syntactic), (ग) अर्थगत(Semantic)
2.1.2. म.अनु.में व्यतिरेकी समस्याएँ. (Contrastive problems In MT)
(क) शब्दगत (Lexical), (ख) संरचनागत (Structural), (ग) संदर्भपरक (Representational), (घ) शैली और प्रोक्तिपरक(problems in Style/Register)
(ड) अर्थगत भिन्नता (conceptual differences), (ढ) शाब्दिक अस्पष्टता (Lexical gaps)
1. Staructural divergence linked to lexical differences

2. Structural divergence linked to grammatical differences

3. Level shift: - Similar grammatical meanings conveyed by
Different devices
2.1.3 शाब्दिक विश्लेषण(Lexical Analysis)
2.1.3.1 विखंडिकरण प्रक्रिया (Segmentation)
2.1.1.1 रुप विज्ञान की (In Morphology):-
1. प्रकार्यात्मक रुपविज्ञान(Functional Morphology)
2. व्युत्पादक रुपविज्ञान (Derivational Morphology)
3. द्विअर्थी रुपविज्ञान(Ambiguous Morphology)
2.1.3.3 अपरिचित शब्द (Unknown words):- Misspelled, spelling, not in
Dictionary, because it a regular derivation, proper name, Compound
2.1.3.4 शाब्दिक अस्पष्टता (Lexical Ambiguity) :-
“(1) संरचनात्मक (Structural) बनाम (असंरचनात्मक) Unstructured
(2) (वास्तविक)Real बनाम (संयोगी)Accidental
(3) (सीमित)Local बनाम वैश्विक(Global)
(4) विश्लेषित Analytical (ड) वैश्विक अस्पष्टता Global Ambiguity
(5) सतही(Shallow) बनाम गहन अस्पष्टता (Deep Ambiguity) : -
अन्वादेशक Anaphora, (उदय)Raising, (कारक)Case-
रुपरेखा आधारित अस्पष्टता(Frame ambiguity), (परिणाम सूचक)
Quantifier and कर्त्ता आधारित (operator scope)”4

2.1.3.5 अस्पष्ट कोटियाँ (Category Ambiguities):-
1) अनेकार्थक शब्द (Homonymy):- (समध्वन्यात्मक शब्द) Homophones, Homographs (समान लिपि वाले शब्द) (proper names : - many proper names form Homonyms with meaningful words)
2). समोच्चारित शब्द :- (Polysemy) ये भाषिक समस्यायें मानव द्वारा किये जाने वाले अनुवाद में भी समान रुप से दृष्टिगत (निर्मित) होती हैं।
2.2 व्याकरणिक समस्याएँ:- मशीनी अनुवाद के लिए जिस प्रकार के व्याकरणिक मॉडल की जरुरत होती है वह स्वरुप परंपरागत व्याकरणिक मॉडल से भिन्न होता है। जिससे मशीनी अनुवाद के प्रकारो के अनुसार ही .अनु. के उपयोग में व्याकरण के प्रकार भी अलग-अलग दिखाई देते हैं। जिसमें से कुछ इस प्रकार हैं “FUG (kAY-1984), HPSG(Polard and Sag-1994), LFG(Bresnsn-1982), TAG (Joshi and Schables-1992), Panini Grammar”5 समस्याओं की इन कोटियों में भाषिक और व्याकरणिक समस्याएँ सबसे अधिक जटिल होती हैं।
2.3 भाषिक संसाधानों के उपयोग और निर्माण की समस्याएँ:- किसी एक .अनु. के निर्माण में लाए गए सभी भाषिक साधन (Language Tools (LTs)) किसी दूसरी भाषा के मशीनी अनुवाद यंत्र निर्माण के उपयोग में आएंगे यह निश्चित रुप से नहीं कहा जा सकता हैं भाषिक संसाधनों की यह समस्या भाषाओं की असमान संरचना के कारण उत्पन्न होती है। यह निर्माण कार्य कई जगह होता है। पाश्चात्य देशों में यह कार्य काफी तेजी से हो रहा है।

2.3.अनुवादेत्तर समस्याएँ:- कुछ ऐसी समस्याएँ भी होती है जो अनुवादेत्तर तो होती हैं लेकिन अप्रत्यक्ष रुप से उनका संबंध अनुवाद से ही होता है जिसे हम उपेक्षित (ignore) नहीं कर सकते। .अनु. के संदर्भ में प्रयुक्त सभी भाषिक संसाधन; किसी अन्य (दूसरी) भाषा के मशीनी-अनुवाद-यंत्र के निर्माण में प्रयुक्त होंगे यह निश्चित नहीं कहा जा सकता। किसी भी मशीनी अनुवाद के निर्माण में आने वाली समस्याएँ केवल अनुवाद से ही जुड़ी नहीं होती अपितु अन्य बहुत सी समस्यायें भी होती हैं, जैसे -
2.31.1 यांत्रिक (कंप्यूटर) समस्याएँ
2.3.1.2 अभिकलनात्मक भाषाविदों की अनुपस्थिति की समस्या
2.3.1.3 कंप्यूटरी कृत भाषा और प्रोग्राम को समझने की समस्या
मशीन द्वारा मिलने वाला (output(OP)) निर्गत पाठ (Formed language) कृत्रिम भाषा में मिलता है। जिसको मानवीय भाषा में लाकर व्यवस्थित रुप प्रदान करने के लिए मशीनी अनुवाद में कोई भाषिक साधन उपलबद्ध नहीं है।
2.4. अनुवादक की समस्याएँ :-
प्रत्येक समस्या का प्रभाव अनुवाद पर होता है लेकिन कुछ समस्याएँ मूल रुप से अनुवादक/प्रयोग कर्त्ता की होती हैं। अनुवाद पूर्व या अनुवाद के बाद निर्गत पाठ में कोई समस्या उत्पन्न हो जाने पर अनुवाद यंत्र ठीक करने के लिए .अनु. का उपयोग कर रहे उपभोक्ता को मशीन में सुधार के लिए मशीनी अनुवाद यंत्र निर्माण करने वाली संस्था से संपर्क करना पड़ेगा। समस्या किसी भी प्रकार की हो प्रयोग कर्त्ता स्वयं अनुवाद यंत्र ठीक नहीं कर सकता। इन समस्याओं के साथ मशीन ही नहीं अनुवादक/उपयोग कर्ता (Translator/user) भी जूझता है। मशीनी अनुवाद में समस्यायें तो बहुत हैं जिन पर एक विस्तृत चर्चा की आवश्यकता है। मशीनी अनुवाद की समस्याएँ भाषाओं के साथ कुछ भाषिक कारणों से बदल जाती हैं, लेकिन इनकी मात्रा कुछ हद तक कम होती है।
पाश्चात्य देशों मे संगणक भारत से कई वर्ष पूर्व आया जिसका उपयोग पाश्चत्य भाषा वैज्ञानिक और संगणक विज्ञानियों ने भली-भाँति समझ कर भाषा विश्लेषण के लिए संगणक का उपयोग किया। यह कार्य भारतीय मशीनी अनुवाद कार्य के शुरु होने से लगभग पच्चीस वर्ष पूर्व हुआ। जिसका परिणाम आज यह हुवा है कि भारत में मशीनी अनुवाद पर कार्य कर रहे विद्वान पाश्चात्य मशीनी अनुवाद यंत्रों को स्रोत यंत्रों के रुप में देखते hain.
BY Kamble Prakash Abhimannu, Ph.D Hindi Translation, New Delhi-67

समय