اکیسویں صدی میں اردو
صدف مرزا
لسانیات کی تاریخ اٹھا کر دیکھ لیجیے، زبان کوئی بھی ہو اسے اپنی ترقی اور عروج کے لیے تدریجی مراحل طے کرنے پڑتے ہیں۔
سکینڈے نیویا میں زبان کی ابتدا بڑی شاہراہوں پر اور پانیوں کے کنارے ایستادہ پتھر کی تختیوں پر لکھی تحاریر سے ہوئی۔ حروفِ تہجی کے شوشے بنانے اور پتھر پر کندہ کرنے کے لیے ان کی ہئیت میں سادگی ہوتی تھی۔ ارتقا اور ترقی کے دوران زبان سے والہانہ محبت کرنے والے شیدائیوں نے اس پر محنت کی۔ چھاپہ خانے کی ایجاد نے کتب کو عام کر دیا اور زبان روز افزوں ترقی کرنے لگی۔
گزشتہ صدی کے آخری عشرے اور نئی صدی کی ابتدا میں سائنسی کرشمات نے الف لیلوی انداز میں زبان کی ترقی کی رفتار بڑھا دی۔ کمپیوٹروں نے قلم اور کاغذ کو طاقِ نسیاں کی زینت بنا دیا، انٹر نیٹ تک بآسانی رسائی نے دنیا کو سمیٹ کر فلک جس طرح آنکھ کے تل میں ہے کہ مصداق افلاک کو بھی سعی اور جستجو کرنے والوں کے قدموں میں لا بچھایا۔
ویب سائٹس، بلاگز، معاشرتی رابطوں کے سلسلے، فیس بک۔ ٹویٹر نے سمندروں کو قطرہ شبنم اور کوہساروں کو رائی کر دیا۔
سب علوم و دانش کے خزانے اور انسانی تعلقات و روابط محض کلک کا کھیل ٹھہرے۔
لسانیات کے شعبے میں بھی اس ترقی کی دوڑ نے بے شمار تبدیلیاں پیدا کیں۔ اب زبان کی ساخت و پرداخت اور اس کی ترقی و ترویج کے بارے میں سائنسی انداز میں تحقیق ہونے لگی۔
لسانی ڈھانچے اور لغتیاتی تجزئیے کے لئے بھی جدید سائنسی انداز فکر اپنایا گیا۔
انٹر نیٹ پر کسی بھی زبان تک رسائی کو سہل کر دیا گیا۔
اور اکسویں صدی کی دہلیز تک پہنچتے پہنچتے سمارٹ موبائل فونوں نے عالمی زبانوں تک رسائی کو مسلسل پھیلتی کہکشاں میں بدل دیا۔
موبائل پر صوتی نظام نے اور پیغامات ریکارڈ کرنے کی سہولیات نے تلفظ کے بہت سے مسائل حل کرنے میں مدد دی اور پرانے رائج نظام The International Phonetic Alphabet —IPA کو طاق نسیاں کی زینت بنا دیا۔ اب کسی بھی لفظ کا مقامی تلفظ اور انگریزی تلفظ صرف ایک بٹن دبانے پر یا زبانی حکم دینے پر سماعتوں کے حضور پیش کر دیا جاتا ہے۔
موبائل پر انٹر نیٹ کہ سہولت نے کمپیوٹر کے سامنے ہمہ وقت دست دراز کرنے سے بچا لیا۔
جیب میں رکھے موبائل پر محفوظ لغات، ویب سائٹس، یو ٹیوب، انسائکلو پیڈیا نے علوم کے ایک سیل بے پناہ کو ایک کوزے میں مقید کر کے لوگوں کی دسترس میں کر دیا۔
اردو زبان بھی اس برق رفتار ترقی کے ساتھ ہم قدم و ہمرکاب ہونے کی کوشش کر رہی ہے۔ گو اس کے قدم سست رفتار رہے لیکن کمپوٹر پر بہت سے مراحل میں سے گزرتی، ان پیج و تصویری اردو کی بیساکھیاں سنبھالتے سنبھالتے آج اردو زبان کے شیدائیوں نے اسے یونی کوڈ کی صورت میں اسے باقی زبانوں کے مقابل لا کھڑا کیا ہے۔
یونیکوڈ اور اردو زبان کی ترقی
_____________________________________
"Unicode is a vital part of the effort to make computing global۔” — Rob Pike
’’یونیکوڈ کمپیوٹنگ کو عالمی سطح پر متعارف کروانے کی کوششوں کا اہم حصہ ہے‘‘
کمپیوٹر مختلف الفاظ، علامات ور دیگر نشانات کو مختلف اعداد کے تحت محفوظ کرتا ہے۔
اگرچہ کمپیوٹراس مقصد کے لیے مختلف کمپیوٹر کے نظام میں رنگا رنگ اعداد کا کوٹہ جمع ہوتا رہا لیکن یہ کبھی اس قابل نہیں ہو پایا تھا کہ تمام تر حروف و علامات کو اعدادی صورت میں ظاہر کر سکے ۔ بیک وقت کئی این کوڈنگ نظام موجود ہوتے تھے اور ان میں بعض اوقات یکساں اعداد مختص کر دئیے جاتے جس کی وجہ سے بہت سے مسائل پیدا ہوتے لیکن یونی کوڈ کے طے ہوتے ہی ان مسائل کا حل ممکن ہوا۔
یہ ڈیٹا کی بلا روک ٹوک ترسیل کو ممکن بناتا ہے اور سافٹ ویئرز کی مصنوعات اور ویب سائٹس کو با آسانی مختلف زبانوں اور پلیٹفارمز پر پڑھنے کے قابل بنانا ہے۔ یونیکوڈ کے ذریعے ہر ایک حرف و علامت کو ایک منفرد عدد دیا جاتا ہے جس کی بنیاد پر بلا شرط غیرے ہر زبان اور ہر کمپیوٹر پروگرام کے یہ انفرادیت قائم رہتی ہے۔
ایپل، ائی بی ایم ، مائکروسافٹ، اور ایسے ہی متعدد صف اول کے اس کو اختیار کر لیا۔
پھر جاوا، ایکس ایم ایل، جاوا سکرپٹ کے اشتراک کے بعد اس نظام کو مزید مقبولیت حاصل ہوئی۔
جدید آپریٹنگ سسٹم میں ، جدید براؤزنگ اور جدید مصنوعات میں اس کی موجودگی اور جدید معاون آلات کی فراہمی نے لسانی فروغ کو مزید ترقی دی۔
1987 میں جو بیکر Joe Becker ، لی کولنس Lee Collins اور مارک ڈیوس Mark Davis کی تحقیق و جستجو سے شروع ہونے والا یہ سفر 2014 کے ورژن کے پڑاؤ پر آ کر رکا ہے۔
یونیکوڈ کنسورشیم
The Unicode Consortium
________________________________
"ہمارے نصب العین کا ناگزیر جزو دانشور اور سائنس کمیونٹی کے ساتھ ساتھ عوام کی آموزش اور تعامل ہے۔”
یونیکوڈ کنسورشیم بین الاقوامی برق رفتار ترقی کے قدم بقدم چلنے کے لیے اور روز افزوں ترقی یافتہ تکنیکوں کو دنیا بھر میں فروغ دینے کے لیے عالمی ادارہ ہے جس کا اولین فریضہ سافٹ ویئرز کی تخلیق و ترقی ، بین الاقوامی معیار کی نگرانی، اور ڈیٹا کی ترسیل و تحفظ ہے۔ موجودہ دور میں لسانی ترقی و ترویج کی کلید یونیکوڈ غیر تجارتی بنیادوں پر اس کی بنیاد یونیکوڈ کے استعمال و فروغ کے لئے رکھی گئی تاکہ جدید سافٹ وئرز اور آلات میں اس کی موجودگی کو یقینی بنایا جا سکے۔دنیا بھر کے لوگوں کو بلا امتیاز لسانی پس منظر کے آزادانہ اور بلا معاوضہ استعمال و استفادہ کو ممکن اور موثر بنانے کے لیے کوشاں ہے۔ یونیکوڈ کنسورشیم کے اراکین میں کمپیوٹر اور انفارمیشن پروسسنگ انڈسٹری کی بے شمار کارپوریشن اور تنظیمیں شامل ہیں۔ یہ تمام آپریٹنگ سسٹمز سرچ انجنز اپلیکیشنز اور عالمی ویب کے استعمال و رسائی کے لیے سر گرم عمل ہے۔ اس کے اراکین میں کوئی بھی فرد یا کمپنی شامل ہو سکتی ہے۔ اس وقت ایڈوب سسٹمز، گوگل یاہو اور سلطنتِ عمان کی وزارت برائے اوقاف و مذہبی امور (Ministry of Endowments and Religious Affairs of Sultanate of Oman) شامل ہے
یونیکوڈ اور سمارٹ فون (انڈرائڈ اور آئی او ایس)
_________________________________________
سمارٹ فون کی دنیا میں بھی یونیکوڈ کی اپلیکیشنز نے انقلاب برپا کر دیا۔ آئی فون اور انڈرائڈ اور ساتھ ساتھ بلیک بیری نے بھی اس سے استفادہ کیا۔ اور تمام سمارٹ فونوں میں اس تکنالوجی کے باعث دنیا بھر کی زبانیں شامل ہو سکیں۔ گلیکسی ٹیب Galaxy Tab p1000 جب یورپ کو بیچی گئی تو اس کے ساتھ ہی تقریباً تمام یورپی زبانوں نے ایک جست لگائی۔لاطینی یونانی ڈینش نارویجن سویڈش اور جرمن وغیرہ اپنے مختلف اور اضافی حروفِ تہجی کے ساتھ موبائل کے کی بورڈ پر جگمگانے لگے۔ گلیکسی نے اسے اور بھی آسان بنا دیا۔
ایشیاء میں نہ صرف اردو بلکہ ہندوستان کی بیشتر زبانیں دیوناگری گرمکھی تامل تلگو اور گجراتی کی رسائی یونیکوڈ تک ہوئی۔ بنگالی تھائی تبتی غرض تمام تر مشرقی ایشیاء نے نئی صدی میں لسانی ترقی سے مستفید ہوا۔ گیللسی کے بعد سئی فون بھی یونیکوڈ کی فراہمی اور ان سے منسلک دیگر سہولیات فراہم کرنے لگا۔
دیگر مصنوعات کی نسبت موبائل بالخصوص گلیکسی نوٹ نے کمپیوٹرز سے بے نیاز کر دیا۔
ان پر موجود اپلیکیشنز نے نہ صرف اردو لکھنے کی سہولت فراہم کی بلکہ خودکار لغت کے انسلاک سے پروف ریڈنگ اور تصحیحات کی آسانی بھی میسر کی۔گیللسی سیریز نے ہر محاذ پر اولین فتح حاصل کی۔
2 ستمبر 2010 میں برلن میں ائی ایف اے ÌFA میں اس نے پہلے ماڈل کی نمائش کی۔
مغربی ترقی اور سہولیات سے ہٹ کر اردو کی دنیا کی طرف دیکھیے تو اردو زبان کو اکیسویں صدی کے ہمرکاب ہونے میں تاخیر تو ہوئی لیکن اس میں آہستہ روی سے پیشرفت ہوتی رہی۔
اردو کارپس
__________________________________
اردو کارپس میں ڈاکٹر حافظ صفوان نے اردو کارپس پر ایک مفصل مضمون پیش کیا جس میں انہوں نے برمنگھم یونیورسٹی کی سیاحت کے بعد انگریزی کارپس کی طرز پر 2006 اردو کارپس کا تعارف اور تجاویز پیش کیں۔
جدید سائینسی لسانی تحقیق و لغتیاتی تجز ئیے کے لیے ماہر لسانیات، تکنیکی ماہرین اور انگریزی زبان پر قدرت رکھنے والے افراد کے ایک گروپ کی ضرورت ہوتی ہے۔ ڈاکٹر حافظ صفوان محمد چوہان کی صورت میں اردو زبان کو تینوں خصوصیات فرد واحد میں مجتمع مل گئیں۔
ڈاکٹر حافظ صفوان محمد چوہان کی جانب سے مرکزِ فضیلت برائے اردو اِطلاعیات، مقتدرۂ قومی زبان اسلام آباد میں ’’دی بینک آف اردو‘‘ کے موضوع پر کام شروع کرنے کی تجویز دی گئی ہے۔
اردو کارپس: تکنیکی تعارف، اہمیت، ضرورت اور دائرہ و لائحۂ عمل‘‘ میں لکھتے ہیں ’’
’’دی بینک آف انگلش‘‘ کے نام سے انگریزی زبان کا ایک بڑا مال خانہ (Repository) جس کے روح و رواں آنجہانی پروفیسر جان میک ہارڈی سنکلیئر (John McHardy Sinclair) تھے، اِس وقت برمنگھم یونیورسٹی برطانیہ میں قائم ہے اور دنیا بھر میں جاری لسانیاتی تحقیقات کے لیے موزوں لسانی متون محققین اور تحقیقی اداروں کو فراہم کر رہا ہے۔ اِسی طرح کا ایک بڑا مواجہ ’’امریکن انگریزی کارپس‘‘ (COCA: Corpus of Contemporary American English) ہے۔ زیرِ نظر مقالے میں اِنھی کارپسوں کے ڈھب پر اردو کارپس بنانے کی ضرورت اور لائحۂ عمل کے بارے میں بتایا گیا ہے اور اِس اردو کارپس کو ’’دی بینک آف اردو‘‘ کا نام دیا گیا ہے۔ ‘‘
1: کارپس اور دی بینک آف انگلش/ امریکن انگریزی کارپس (COCA): مختصر تعارف
کارپس کیا ہوتے ہیں ؟ مختصر جواب یہ ہے کہ یہ مشین ریڈایبل متن ہوتے ہیں جنھیں لسانیاتی تحقیقات کے لیے اِکٹھا اور جمع کیا گیا ہو۔ ملاحَظہ کیجیے اوکسفرڈ کی تعریف:
A corpus is a collection of written material in machine۔readable form that has been put together for linguistic research
اپنے اسی مضمون کو آگے بڑھاتے ہوئے انہوں نے مشین ریڈ ایبل الفاظ یکجا کر کے فہرست بھی بنائی اور ان کے ترتیب کردہ اٹھارہ ہزار الفاظ کی یہ فہرست گوگل کی اردو ٹرانسلیشن میں استعمال کی جاتی ہے۔
اردو کارپس کے متوازی دوسری سائینسی پیشقدمی اردو او سی آر OCR پر مسلسل محنت و عرق ریزی سے ہوئی۔ Optical Character Recognition, or OCR اردو او سی آر بصری حرف شناسی یا نویسهخوانی اس سے مراد چھپے ہوئے متون اور عبارات کو خواہ وہ ہاتھ سے تحریر کی گئی ہوں یا سکین کی گئی ہوں، کسی کتاب یا اخبار سے لی گئی ہوں، سب کو ایک سافٹ وئر کے ذریعے خود کار باز شناسی کے قابل بنانا ہے تا کہ کمپیوٹر اس مواد کو جس میں الفاظ، علامات اور اعداد شامل ہیں از خود شناخت کر سکے بصری حرف شناسی کا یہ تکنیکی عمل مرحلہ وار ہوتا ہے
انگریزی زبان اور وہ زبانیں جن کے حروف زیادہ خمدار نہیں ہوتے باآسانی اس گلوبل دوڑ اور مسابقت کی فضا میں شامل ہوتے گئے اور لسانی انجنئرنگ اور لسانی ترقی و فروغ کی اس منظر نامے مین اپنا واضح مقام بنا لیا۔ جبکہ اردو زبان جسے دنیا کی چوتھی بڑی زبان کہا جاتا ہے ابھی اس میدان میں ابتدائی زینے طے کر رہی ہے۔
اگرچہ اردو کمپیوٹر اور نیٹ کی تاریخ بتاتی ہے کہ اس شعبے میں جس ذوق و شوق اور جستجو اور لگن سے کام ہونا چاہئے تھا وہ ابتدا میں اس کے مسائل اور مشکلات کے تذکرے ہی میں گزر گیا۔
نستعلیق
____________________________________________
اردو زبان کے حروف تہجی، اس کے دائروں، شوشوں، قوسوں اور اس کے باہمی ربط اور پیوستگی کی صورتوں کو کمپیوٹر کی ترقی کی راہ میں رکاوٹ سمجھا جاتا رہا۔ جبکہ اگر اس کا موازنہ چینی زبان کے ساتھ کیا جائے جسے ابتدائی طور پر اوپر سے نیچے اور دائیں سے بائیں پڑھا جاتا تھا تو یہ بات روز روشن کی طرح واضح ہو جاتی ہے کہ یہاں پر بھی تساہل پسندی اور آئین نو سے ڈرنے کے عوامل ہی پیش نظر رہے
اگر اردو زبان کو فارسی اور عربی کے بالمقابل بھی لا کھڑا کیا جائے تو بھی یہ بات وا ہوتی ہے کہ ان دونوں زبانوں نے نسخ پر ہی قناعت کرتے ہوئے اپنی بنیادی اور مرکزی توجہ زبان کی ترویج اور تشہیر پر رکھی جب کی اردو دنیا اپنے ذوق جمالیات کی تشفی میں نوری نستعلیق کے ظہور تک ساکن اور تن بہ تقدیر رہی۔
بصری شناخت کے لئے جب پہلے سے تیار شدہ متن، عبارت، یا سکین کی ہوئی چیز کو کمپیوٹر میں شناخت کے عمل سے گزارا جاتا ہے تو یہ عبارات اور تصاویر خود کار شناخت اور ایسے متن میں شامل ہو جاتی ہیں جن میں ایک عام متن کی طرح ترمیم و تصحیح کی گنجائش ہوتی ہے۔ صبر آزما اور تخلیقی اور تکنیکی صلاحیتوں کا امتحان دینا پڑتا ہے۔ کمپیوٹر پر یہ شناخت دو انداز میں ہوتی۔
مجموعی طور پر تجزیاتی طور پر تستعلیق کی صورت میں حروف کی ساخت اور ان کے بل کھاتے انداز کو تکنیک سانچے میں از سر نو شناخت کے قابل بنانا ایک بہت بڑا چیلنج تھا۔
اس سے عہدہ برآ ہونے کے لیے دنیا بھر کے ویب سے زیادہ استعمال ہونے والے لگیچر جمع کیے گئے۔
بی بی سی کی سائت کو اس عمل کے لیے منتخب کیا گیا کیونکہ بی بی سی اردو کی ویب سائٹ نے اردو نسخ ایشیا ٹائپ فانٹ کو کاس کی افادیت اور سہولت کی وجہ سے زیادہ اہمیت دی اور اس کی تقلید میں اکثر ویب سائٹس نے اسی فونٹ کو اختیار کیا۔ نستعلیق کے مقابلے میں اس کو کھولنا اور ڈاؤن لوڈ کرنا بھی نسبتا آسان ہے
او سی آر پر تحقیق کرتے ہوئے ماہرین کا اردو کے فونٹس کا مطالعہ بھی ضروری تھا۔ ایک طرح سے اردو کی ترقی نہ صرف کمپیوٹر کے ماہرین کی شب و روز کی عرق ریزی کی طلبگار ہے بلکہ اس کے ساتھ ماہرین لسانیات پر بھی ایک بھاری فریضہ عائد کرتی ہے کہ وہ جدید پیش رفت کے شانہ بشانہ اپنی تحقیقی کاوشوں کو تیز تر کرتے ہوئے تکنیکی میداں میں بھی قدم جمائیں تا کہ جستجو کا سفر کامیابی سے ہمکنار ہو سکے۔
۔ اردو زبان جب مسلسل تحریر کی صورت اختیار کرتی ہے تو اپنی اشکال بدلتی جاتی ہے۔ الفاظ کی ابتدا، وسط اور اختتام پر ایک ہی حرف خم کھاتا اپنی صورت تبدیل کرتا جاتا ہے۔ اردو میں ایسے حروف بھی ہیں جو دونوں اطراف سے منسلک نہیں ہوتے جیسے ” الف ‘‘ دوسرے وہ حروف ہوتے ہیں جو دونوں اطراف سے دوسرے حروف کے ساتھ جڑ جاتے ہیں مثلاً ’’ ب، اورت ‘‘’’ ان الفاظ کی صورتیں ملاحظہ فرمائیے ‘‘’’ تدبیر، اور بتدریج ‘‘’’
ان حروف کی تیسری قسم وہ ہوتی ہے جو بائیں جانب کے حروف میں ضم نہیں ہوتے مثال کے طور پر، ‘‘’ ر ‘‘’ اور ‘‘’ و ‘‘ جیسے، ‘‘’ امیر، راگ ‘‘’’ یا جیسے ‘‘’’ جیو، والا ‘‘’’ وغیرہ
اس کے بعد بیس سب سے زیادہ مستعمل حروف یکجا کیے گئے جن میں ا، ر، نے، کی، میں، کا، ہے، کر، کو، سے، ہو وغیرہ شامل تھے۔
الخوارزمی انسٹیٹیوٹ آف کمپوٹر سائنس نے یکم مارچ ۲۰۰۲ میں ڈاکٹر سرمد حسین کی زیر نگرانی اردو او سی آر کی تحقیق و ترقی کا پروجیکٹ شروع کیا۔ جس نے جستجو اور تجربات کے اس طویل سفر کے بعد ۲۰۱۴ جنوری میں تجرباتی طور پر آن لائن ایک سافٹ وئر پیش کیا اور یاران نکتہ داں کو اسے استعمال کرنے کی صلائے عام دی۔
کلام سے متن تک
Voice۔to۔text, Speech۔to۔Text Software، Talk to Text
__________________________________________
عالمی سطح پر انگریزی زبان میں ترقی کا عالم کن فیکون کی سطح کو چھوتا محسوس ہوتا ہے۔ کلام سے متن تک یا متن سے کلام تک کا سفر بٹن دبائے بغیر صوتی احکامات کے تابع بھی کر دیا گیا ہے۔ آپ اپنے کمپیوٹر یا موبائل کی سیٹنگ ایسے کر دیتے ہیں کہ آپ کو بٹن دبانے کی ضرورت بھی پیش نہیں آتی اور آپ زبانی احکامات کی سورت میں برق رفتاری سے اپنا کام کر سکتے ہیں۔
Speech recognition صوت شناسی کی سہولت سے کمپیوٹر یا موبائل کو اتنی دانشمندی سکھائی جا چکی ہے کہ وہ مختلف لب و لہجے میں کہی گئی بات کو شناخت کر کے اسے متن کی قبا دے سکے۔
مختلف ویب سائٹس پر ابتدائی حالت میں ایسے سافٹ وئر ملتے ہیں جن سے اردو ای میل یا اردو خبریں سننے کا تجربہ کیا جا رہا ہے گو کہ نتائج تسلی بخش نہیں ہیں۔
٭٭٭
Errandum:
Correspond, without s
Title, not titile
3) It is written, not weritten.
Sorrry!
From my position as an acrredited Text and discourse analyist I have the following comments about ” Urdu in 21. century”; 1) The titile of the text does not corresponds with the content of the article. 2) The content itself appears to be a cut-and-paste patchwork, not an indepenedent studyof the electronic revolution and its implications for the language development. There is lack of coherence and substantial pitfalls in reliance on computarised language programs are left untouched. 3) It is weritten in an Urdu style (with poetic expressions and metaphor) not suitable for a descriptive article, where the aim ought to be information and easy to comprehend communication.