شهد العقدان الأخيران من القرن العشرين والأول من القرن الواحد والعشرين، العصر الذهبي لتطوير البرمجيات المرتبطة باللغة العربية من قبل شركات عربية.
وظهرت خلال تلك الفترة برمجيات النشر المكتبي، التدقيق الإملائي والنحوي، وتحويل الكلام العربي المنطوق إلى نص وبالعكس، والقارئ الآلي للحروف المصورة (OCR)، والإملاء الصوتي، ومحركات البحث، والترجمة من اللغة العربية وإليها.
ورافق ذلك ظهور بوابات عربية كبيرة وواعدة على شبكة الإنترنت مثل، “أربيا أون لاين” و”الشبكة العربية” و”عجيب”، وجميعها اختفى لاحقا.
المدققات الإملائية والنحوية العربية
شهدت ثمانينيات وتسعينيات القرن الماضي تطوير وإطلاق العديد من المدققات الإملائية والنحوية العربية، كان أبرزها شركة أنظمة المعلومات العربية التي أسسها علاء الدين صلاح العجماوي عام 1982، والتي طورت مدققا إملائيا لأجهزة الماكنتوش، و”صخر” لبرامج الحاسب التي أسسها محمد الشارخ عام 1982، والتي طورت مدققا إملائيا للأجهزة التي تعمل بنظام دوس ومن ثم ويندوز، وشركة كولتك المصرية التي أسستها الدكتورة تغريد السيد عنبر عام 1990 لتطوير التقنيات اللغوية العربية، وطورت مدققا إملائيا لنظام ويندوز.
لم تتمكن الشركات العربية المطورة لهذه التقنيات اللغوية من الوصول إلى الشركات العالمية الكبرى، باستثناء الأخيرة التي نجحت في بيع مدققها الإملائي العربي لمايكروسوفت عام 1997، حيث تم دمجه بطاقم أوفيس 97، ثم ألحقته بالمدقق النحوي للغة العربية ضمن طاقم أوفيس 2000. لكن مايكروسوفت توقفت عن التعامل مع شركة “كولتك” خلال العقد الثاني من القرن الواحد والعشرين، وأنشأت فريقها الخاص لمتابعة العمل على المدققين العربيين للإملاء والنحو.
محركات البحث العربية
طورت العديد من الشركات العربية محركات بحث لشبكة الإنترنت منها محرك “أين” الذي انطلق عام 1997 وأغلق عام 2012، و”العربي” الذي انطلق عام 2006 وأغلق عام 2009، و”أنكش” الذي انطلق عام 2007 وأغلق عام 2010.
ولم تستطع تلك التجارب منافسة محركات البحث العالمية خاصة محرك غوغل الذي انطلق عام 1998 وبدأ بدعم اللغة العربية عام 2002.
وطوّرت شركة صخر محرك بحث “الإدريسي” الذي استخدمته العديد من الشركات وبعض مواقع الويب، وعلى الرغم من جودته في معالجة اللغة العربية، لم ينتقل ليتحول إلى محرك بحث شامل للإنترنت، إذ لا تكفي جودة معالجة اللغة للنجاح، فالبحث في الإنترنت يتطلب العديد من التقنيات الأخرى، كالزاحف (Crawler) الذي يجوب كافة صفحات الإنترنت التي يقدر عددها بالمليارات ويفهرسها ويتعرف على الفاسد منها ويتجنبه، ويتعرف على لغة كل صفحة، ويتعرف على حدود النصوص والمقالات ويستخرجها، ويتعرف على اسم المؤلف، ويتعرف على الصور وحدودها وعناوينها.
ومن التقنيات الأخرى الأساسية التي يتطلبها محرك البحث، ترتيب نتائج البحث بأفضل ما يمكن، والذي يتضمن عشرات المتغيرات وهو ما جعل محرك بحث غوغل الأول عالميا بعد فترة قصيرة من إطلاقه.
كما أن تطوير محرك بحث لشبكة الإنترنت يتطلب استثمارات كبيرة. فغوغل مثلا حصلت على تمويل قدره 25 مليون دولار بعد أقل من عام على إطلاقها، ثم حصلت في العام الذي يليه على 25 مليون دولار إضافية، وذلك عبر مستثمرين مغامرين من القطاع الخاص، وهو ما لم يكن متاحا للأسف في البلدان العربية.
وكان يفترض أن تدعم الجهات الحكومية العربية أحد محركات البحث العربية التي تم إنشاؤها وتسهم في تمويله بحيث ينمو ويتمكن من اقتطاع حصة جيدة من السوق المرتبط بالبحث عبر الإنترنت باللغة العربية على الأقل. فمحرك البحث الصيني “بايدو” (Baidu) الذي انطلق في 2000 ما كان ليحقق النجاح الكبير الذي حققه لولا الدعم الحكومي وضخ ملايين الدولارات فيه. وينطبق الأمر أيضا على محرك البحث الروسي “ياندكس” (Yandex).
الترجمة من العربية وإليها
أطلقت شركة “إيه.تي.إيه” (ATA) عام 2000 موقع المسبار (www.almisbar.com) لترجمة النصوص ومواقع الإنترنت من الإنجليزية إلى العربية. وفي العام ذاته أطلقت “صخر” موقعها للترجمة من الإنجليزية إلى العربية (Tarjim.com). وكان الموقعان واعدين، إلى أن أنهت غوغل العصر الذهبي لبرمجيات الترجمة العربية في شهر أبريل/نيسان عام 2005، بعد أن تفوقت ترجمة غوغل الإحصائية المطورة حديثا على ترجمة صخر وبرامج ترجمة أخرى في الاختبارات التي أجراها المعهد الوطني الأميركي للمعايير والتقنية (NIST).
وظفت غوغل الكم الهائل من المحتوى الذي جمعته عبر محرك البحث، لتطوير محرك الترجمة الإحصائي من الإنجليزية إلى العربية وبالعكس، وهو أمر كان متعذرا على الشركات العربية، لافتقارها لهذا الكم من المحتوى.
وتمكنت عدة شركات عالمية فيما بعد من تطوير محركات ترجمة من الإنجليزية إلى العربية وبالعكس، وعلى رأسها مايكروسوفت نظرا لامتلاكها قدرا من المحتويات مقاربا لما تملكه غوغل.
وشهد العقد الثاني من القرن الـ21 انتقال تطوير العديد من التقنيات اللغوية العربية واسعة الاستخدام من الشركات العربية إلى الشركات العالمية التي تبنت تطوير هذه التقنيات مستعينة بخبراء عرب. ولم يقتصر الأمر على التقنيات التي سبق أن تناولناها، بل شمل التعرف على الصوت العربي والإملاء الصوتي الآلي، والقارئ الآلي للحروف المصورة، وتحويل الكلام العربي المنطوق إلى نص وبالعكس.
هل ما تزال الفرصة متاحة أمام البلدان العربية للعمل على تطوير تقنيات اللغة العربية؟
الإجابة نعم. ففي شهر سبتمبر/أيلول 2022، أطلق الاتحاد الأوروبي مشروع إنشاء محرك بحث أوروبي لشبكة الإنترنت (OpenWebSearch.eu). يتلخص السبب المعلن لهذا المشروع في المخاوف الناشئة عن اختلال التوازن في سوق محركات البحث الذي تهيمن عليه عدة شركات كغوغل ومايكروسوفت وبايدو وياندكس، وتتحكم بالتالي بمحتوى الإنترنت، ما يهدد ديمقراطية المحتوى ويحد من الإمكانيات الابتكارية الأوروبية.
الحاجة إلى تطوير تقنيات اللغة العربية أكبر من الحاجة الأوروبية، لكن الأمر يتطلب إنشاء مركز عربي متخصص بذلك، تدعمه عدة بلدان عربية وخاصة الغنية منها، يستخدم الكم الهائل من المحتوى العربي المتوفر حاليا، لابتكار طرق جديدة وفعالة لمعالجة مسائل اللغة العربية المتشعبة بما في ذلك الموسيقى العربية وخطوط اللغة العربية.
اكتشاف المزيد من ينبوع المعرفة
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.