[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: القاموس العربي للم دقق الإملائي



بصراحة شيء رائع جدا

On 7/6/06, Mohamed Kebdani < kebdani1 at menara dot ma> wrote:

السلام عليكم ورحمة الله وبركاته،

  تمهيد

منذ أن تبين وجود دعم للغة العربية في المدققات الإملائية الحرة و خاصة
Aspell و Hunspell بدأت تظهر في الأفق محاولات إنشاء قواميس تعمل مع هذه
المدققات. من المحاولات الأساسية تلك التي اختبرها الأخ محمد سمير و تلك
التي من ورائها مشروع Ivrix الإسرائيلي. إلاّ أن الملاحظ أن المشروعين معاّ
اعتمدا على قاموس Tim Buckwalter في هيئة لا تناسب بتاتاً المدقق الإملائي
حيث وصل أحد هذه القواميس إلى 200mo. مهما يكن، فقد افتقرت المحاولات، منذ
الوهلة الأولى، إلى خاصية مهمة ألا وهي الرجوع إلى ملف الزوائد affixe file
، كما أن البرنامج المختبر لدا المشروعين هو Aspell الأقل غنىً من حيث قواعد
الإلحاق في ملف aff مقارنة ببرنامج Hunspell. طبعاً، يبقى Hunspell بعيداً كل
البعد عن تلبية متطلبات اللغة العربية الاشتقاقية وبالمقابل لا بديل لنا
عنه إن أردنا استغلال الخصائص الالتصاقية للغة القرآن. لن يغنينا هذا عن
البحث عن كود يدمج في المدقق الإملائي يأخذ بعير الإعتبار خصوصية اللغة
العربية في مرحلة لاحقة.

وبعد!

شخصياً، بدأت مشروع إنشاء قاموس عربي للمدقق الإملائي منذ أسابيع ثم اتصلت
بالأخ  M.Sameer وعرضت عليه فكرة المساهمة في المشروع لكونه أدرى بالموضوع
وهو الذي أخذ المشعل من M. Zubeir وطور المدقق الإملائي Baghdad فأجابني
بأنه يحاول التوفيق بين العروض التي توصل بها وهي كثيرة وسيجيبني في أقرب
وقت ممكن. وبعد ايام اتصل بي الأخ طه الزروقي الذي هو الآخر بدأ انشاء
قاموس عربي معتمداً مثلي على Hunspell ومنسقاً عمله مع المطور الرئيسي لهذا
المدقق وهو جد متقدم في المشروع ويكاد ينتهي من تصريف الأفعال كما أكد لي
في رسالة له الأمس (لم يتبقى من قسم الإفعال إلا المعتلة منها حسب قوله).
وهكذا نلاحظ وجود ثلاثة مشاريع (دون احتساب المشروع الإسرائيلي) والله أعلم
بالأخريات اللاتي ما زالت قيد الكتمان، يعيــد كل واحد في ركنه اختراع
العجلة مع ما لهذا من هدر للجهد وتبذير للوقت.

والآن؟

حسب تجربتي المتواضعة في مشروع دؤلي Duali وبعد دراسة متأنية لخصائص
Hunspell واطلاع على مراجع عديدة تراثية وحديثة وتحليل لجوانب اللغة
العربية الصرفية بمساعدة زميل لي في هيئة التدريس أستاذ للغة العربية، وبعد
وقوفي على هفوات ونواقص مدققي Ms-office وصخر  Sakhr، وجدت أن نجاح المشروع
يتطلب المرور بالمراحل التالية:

  - أولها إيجاد كود code يحل مشكل التطويل والتشكيل .أظن أنه يكفي استعارة
هذه الخاصية من برنامج Duali باستنباطها من ملف aralex.py ثم تحويلها إلى
++C ووضعها تحت وضيفة LANG langcode لبرنامج Hunspell . فهل يوجد في القاعة
مبرمج يسمعني؟ :)

  - ثانيها وضع بطاقات "تصريفية" ذات طابع لغوي تصنف الأفعال حسب أوزانها،
مجردها ومزيدها، سالمها، مضعفها، مهموزها عينا أوفاء أو لاما، معتلها
المثال والأجوف والناقص والمقرون والمفروق منها والهجين بين المهموز
والمعتل. كما يجب أن تبين ما يطرأ عليها من نغييرات عند تصريفها للمعلوم
والمجهول و المؤكد والمنصوب والمجزوم لتسهيل انجاز المرحلة الثالثة؛

  - ثالثاً بناء ملف aff متكامل وموحد في حدود الإمكان متضمن لأعلام الأفعال
كلها مع تجنب خاصية التركيب على مستوى ملف dic حتى يمكننا استغلال نفس
كلماته في التوليد الصرفي للأسماء أيضا وبالتالي تخفيف الملف.

  - ثم أخيراً وليس آخرا، إنشاء ملف dic نموذجي محتوياً على قائمة من الأفعال
يمثل كل واحد منها صنفاً معينا حاملاً للأعلام المميزة لنوعه. كل مدخل/فعل
يكون مختلفاً عن الآخرين على الأقل في ضمير متصل... مثلاً  فعل قلب صحيح سالم
متعدي لعاقل-مفعول به واحد /فعل قلب صحيح مضعف متعدي لعاقل-مفعول به واحد
/فعل قلب صحيح مهموز الأول متعدي لعاقل- مفعول به واحد / فعل قلب صحيح
مهموز الوسط متعدي لعاقل -مفعول به واحد/ فعل قلب صحيح مهموز الاخير متعدي
لعاقل- مفعول به واحد/   الضمائر المتصلة الممكنة  ==>
0-ن-ا-وا/و-ون-نن-ان-نان-ي-ين-ت-نا-تا-تما-تم/تمو-تن + ني/ي-نا +
ك-كما-كم/كمو-كن-هم + ه-ها-هما-هن.

- المرحلة النهائية والتي ستستهلك وقتا كبيراً هو إنشاء ملف dic النهائي به
كل الأفعال التي ستنسخ من المعاجم والقواميس المتداولة مع تعليمها بالأعلام
التي تحيل تصريفها إلى ملف aff حسب تصنيفها (في المرحلة السابقة).

هذا في موضوع تصريف الأفعال أما تصريف الاسماء فذاك ما لم أتناوله بالدراسة
بعد ...

هذه خلاصة دراستي للموضوع ومن يحب الاطلاع على التفاصيل عليه بزيارة موقعي
الشخصي http://perso.menara.ma/~kebdani/ayaspell-dic
وإني إذ أضع هذه الدراسة بين أيديكم، فلكي يعلم المهتمون بمشروع المدقق
الإملائي ما توصلت به من نتائج واستفيد من اقتراهاتكم كما أهدف من خلال هذه
الرسالة طرح اشكالية التنسيق والتعاون بين المهتمين بإنشاء المدقق الغملائي
  فيتفقوا
على برنامج عمل موحد ونحدد منهجية عمل تجنبنا تبعثر الجهود بل وتحفزنا على
التكامل فيما بيننا.
وشكراً على تحمل قرائة رسالتي إلى نهاتها.

والسلام عليكم ورحمة الله وبركاته.
أخوكم محمد كبداني






_______________________________________________
Doc mailing list
Doc at arabeyes dot org
http://lists.arabeyes.org/mailman/listinfo/doc



--
My ToDo list for Arabian Linux:
1- finishing the  translation of OpenOffice 2.0 ....... Started
2- finishing the translation of KDE 3.5 ..... Pending
My blog :
http://zayedalsaidi.blogspot.com