[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Arabic Spellchecker



Salam,

Nadim Shaikli a écrit :


Great, so you are on the list after all (and sorry to reply in english, its just much faster for me). So what is being shipped with apsell is faulty (with regard to arabic), when do you guys expect to have some data to replace what aspell is shipping with (are the aspell developers aware of these faults and have you guys talked to them about your upcoming improvements) ? Not to rush or put pressure on anyone but simply to know, hen can we expect an improved version of what is out there now ? To be honest I didn't even know that aspell shipped with arabic since their site [1] doesn't list arabic and notes it simply as "planned" (no mention of Farsi mind you even though the hunspell site listed an aspell dictionary, very confusing).

If its possible maybe we can setup an IRC meeting to see how we can
help else simply let us know and we'll gladly update (or even remove
and replace) duali with the info from ayaspell.


سأجيب عن الأسئلة في شقها العام أو المتعلق بالمادة اللغوية أما تفاصيل جانب التطوير فالأخ طه الزروقي أولى به. أولاً، إننا نعمل على برنامج هانسبل [1] Hunspell وليس أسبل Aspell لتوافق خوارزم الأول مع بعض خصائص اللغة العربية (العمل على اثنين من الزوائد مثلاً) [2] ولأنه يمكننا من إضافة وظائف جديدة خاصة باللغة العربية بشكل مستقل حيث استطاع الأخ طه من إضافة وظيفة تحل مشكل الأفعال المضاعفة وإشكالية التشكيل/الحركة بطريقة جد ذكية. المطلوب الآن حل مشكل الابدال والاعلال وتغيرات حروف الهمزة عندما تتوسط الكلمة حتى نتمكن من اشتقاق كلمة *كاتب* مثلاً من الجذر *كتب* وقد حلت جزئياً هذه المعضلة في آخر رسالة للأخ طه توصلت بها منه[3]. فيما يتعلق بالجانب اللغوي وأعني القاموسWordlist ، تصريف الأفعال وتصريف الأسماء فبعدما اختبرنا قاموس Tim Buckwalter تبين لنا عدم ملائمته لأسباب عدة منها احتوائه أخطاء لغوية كثيرة يستحيل تصحيحها في حيز زمني معقول، وكونه مادة لغوية مبنية بكيفية لا تسمح لنا بمعالجتها حسب الخصوصية التي تتميز بها اللغة العربية ( جذور، أوزان...الخ) كما أنه وبصفته مكنزا corpus مبنيا من مادة صحفية و غير مستمد لتصريف الكلمة العربية من المنابع فلا يخول له مصدره ولا طبيعة تأليفه أن يطمح لأن يكون قاموس مدقق إملائي ولم تكن أبداً تلك غايته عند نشأته... يمكن التحقق من محدوديته باختبار المدقق المعتمد عليه في إصدار الشهر الماضي [4] يكمن الحل بالعودة للأصل وهي معاجم اللغة العربية ومنها المعجم الوسيط والمعجم الغني يشكل أساسي (يتميز الثاني عن الأول بتوفيره للمشتقات كلها والمؤنث والجمع والتنوين وتحديد التعدي واللزوم لكل الأفعال مصحوبة بجذورها) ومعاجم أخرى للدعم والإغناء. هذه المعاجم هي التي ستمثل روافد القاموس اللغوي للتدقيق الإملائي. هذه المعاجم متوفرة على الشبكة [5] و بعد أن تحذف منها الشروح والتفسيرات ويعاد ترتيب مفرداتها ستفقد إذّاك هويتها الأولى ولن تبقى مقيدة بالرخص الأصلية التي تنطبق بالأساس على الشروحات والتفاسير والصور لأنه من غير المنطقي أن تكون قائمة كلمات لغة ما خاضعة لرخصة أياً كانت طبيعتها... فيما يتعلق بجانب تصريف الأفعال والأسماء فالمراجع اللغوية حاضرة لدينا وتحت تصرفنا ومنها ما استعمل أصلاً في المعالجة الرقمية للغة العربية ومن ضمنها ما ينسب للمشروع الأوربي (Dictionnaire Informatisé de la langue Arabe) الملقب DIINAR وخاصة الأبحاث التي أشرف على انجازها الدكتور يوسف ديشي من جامعة ليون بفرنسا[6]. نعمل حالياً على انشاء ملفات الزوائد Affixes files للأفعال وهي بعدد 128 نموذجا تصريفيا و نكاد ننتهي منها من جانب التصريف المحض ولكي نصرفها من ناحية المعنى (نحو العاقل وغير العاقل ...الخ) ننوي اتباع ما سطر في الصفحة المذكورة أدناه التي تمثل مسودة لما نريد انجازه [7]. شخصياً أتوقع الانتهاء من تصريف الافعال مع نهاية السنة الحالية أو بداية السنة المقبلة وهي الأصعب في المشروع مقارنة بتصريف الأسماء ولا استبعد أن يكون القاموس جاهزا منتصف العام المقبل...المهم أنه عندما سنحصل على اصدار وضيفي سنعلم بذلك الاخوة وسنكون مسرورين بوضعه ضمن قائمة برامج عيون العرب :) كان هذا ملخصاً لحيثيات مشروع انشاء القاموس العربي للتدقيق الاملائي وللاطلاع على التفاصيل المرجو الرجوع للروابط التي أعطيت وزيارة موقع ومدونة المشروع والاشتراك في القائمة البريدية الخاصة. وأذكر الإخوة أننا في حاجة لمن يساعدنا في تصنيف الأفعال حسب تعديها كما تبينه الصفحة الموالية: http://perso.menara.ma/~kebdani/ayaspell-dic/consignes.html

احتراماتي

محمد كبداني

[1]http://hunspell.sourceforge.net/
[2]http://perso.menara.ma/~kebdani/ayaspell-dic/fonctionnement.html
[3]http://groups.google.com/group/ayaspell-dic/browse_thread/thread/58fd49f3039bd720/
[4]http://sourceforge.net/projects/arabic-spell/
[5]http://lexicons.sakhr.com
     http://www.almeshkat.net/books/open.php?cat=16&book=2521
[6]http://docinsa.insa-lyon.fr/these/2004/abbes/these_v1.pdf
     http://docinsa.insa-lyon.fr/these/2004/abbes/these_v2.pdf
[7]http://perso.menara.ma/~kebdani/ayaspell-dic/consignes.html