[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Arabic Spellchecker
- To: General Arabization Discussion <general at arabeyes dot org>
- Subject: Re: Arabic Spellchecker
- From: Mohamed Kebdani <kebdani1 at menara dot ma>
- Date: Wed, 04 Oct 2006 23:04:16 +0000
- User-agent: Thunderbird 1.5.0.7 (X11/20060922)
السلام عليكم ورحمة الله وبركاته،
Mohammed Sameer a écrit :
On Tue, Oct 03, 2006 at 05:04:59PM -0700, Nadim Shaikli wrote:
Any other relevant news regarding this topic ?
We need a wordlist for aspell and another one for hunspell. I think the aspell one can be converted to hunspell but I'm not sure.
Maybe hunspell would need some coding related to Arabic but I don't know the status.
I've got an email from M. Kebdani regarding hiswordlist project but it was completely in Arabic which was very hard for me to understand. I did not reply and I started to be busy.
The wordlist I have and using for aspell (in debian BTW) is not good at all but it's a demonstration anyway.
End of the story: Ask M. Kebdani.
أود الإشارة إلى أنى لا أحسن الكتاية باللغة الاجليزية لذلك استسمح الاخوة
بالاجابة باللغة العربية عن التساؤل المطروح أصلاً في القائمة البريدية
للترجمة والتوثيق رغم القاعدة التي تقول بتخصيص القائمة البريدية العامة
والقائمة البريدية للتطوير باللغة الاجليزية! في بدابة رسالتي، سأبين كيفية
استعمال مدقق املائي للغة العربية على أوبن أوفيس (تحت نظام غنو لينكس) وفي
نهاية الرسالة سأعطي انشاء الله بعض التوضيحات حول المشروع الذي أعمل
فيه مع الاخوة طه الزروقي و منذر طه وآخرون ما زالوا يلتحقون بالمشروع :)
يوجد حالياً أربعة مشاريع تهتم بالتدقيق الإملائي للغة العربية، أهمها ذلك
الذي يطوره فريق غوغل Google والذي يضم Tim Buckwalter نفسه صاحب القاموس
العربي المفتوح الذي اعتمده مشروع دؤلي للأخ محمد الزبير ومشروع Ivrix
الإسرائيلي لاحقاً, طور هذا المدقق ليعمل مع أسبل Aspell ولكي يعمل مع
هانسبل Hunspell/Myspell وبالتالي على أوبن أوفيس ينبغي اتباع الطريقة التالية:
بعد فك الضغط عن ملف aspell6-ar-1.2-0.tar.bz2 الذي نجده في موقع
http://sourceforge.net/projects/arabic-spell/ ، يجب تحويل ar.cwl إلى
ar.wl بواسطة أمر preunzip ar.cwl ثم يغير اسم هذا الملف إلى ar.dic . يضاف
في مستهل الملف عدد 938958 وهو عدد مفردات القاموس. على مستوى نفس ملف
aspell6-ar-1.2-0.tar.bz2 تجد ملفاً آخر هو ar_affix.dat، نغير اسمه إلى
ar.aff ونستبدل مستهله من:
# This file was created automatically on 6/22/2006. Do not edit!
# It was created with:
# perl aspell-source-from-Buckwalter.pl . . .
SET UTF-8
إلى
SET UTF-8
TRY أئؤآإذضصثقفغعهخحجدشسيبلاتنمكطءرىةوزظ
FLAG long
بعد حفظ الملفين، تنقل إلى الدليل الخاص ب myspell :
cp ar.dic /usr/share/myspell/dicts/
cp ar.aff /usr/share/myspell/dicts/
على مستوى نفس الدليل /usr/share/myspell/dicts/، نضيف خصائص التدقيق
الإملائي العربي في ملف dictionary.lst كما يلي: بعد سطر
## !!! END AUTOMATIC SECTION -- DO NOT CHANGE !!!
نضيف العبارات التالية:
DICT ar TN ar
والآن جاء دور إعداد أوبن-أوفيس، حيث على مستوى الأدوات خيارات اللغة، يجب
تحديد اللغة التي ستدقق إملائياً و هي في المثال: عربية تونس TN.
وهكذا نستطيع استعمال ملفات التدقيق الإملائي لأسبل، إلاّ أن هذه الملفات
ثقيلة الوزن 21,2mo، تبطئ من تحميل أوبن أوفيس كما أن قاموسها يتضمن كثيراً
من الأخطاء... ولهذا لا بد من انتظار ما نحضره من ملفات التدقيق في إطار
مشروع آيسبل الذي يتفضل الأخ طه زروقي مشكوراً بتطوير بعض الوضائف الخاصة
باللغة العربية ولمن يريد تتبع مسيرة المشروع زيارة المدونة والموقع
الخاصين به والاطلاع على رسائل القائمة البريدية.
في الرابط الموالي تجدون ملخصاً لما تم انجازه إلى حدود الساعة:
http://groups.google.com/group/ayaspell-dic/browse_thread/thread/58fd49f3039bd720/
المدونة:http://ayaspell.blogspot.com
الموقع ():http://perso.menara.ma/~kebdani/ayaspell-dic
القائمة البريدية:http://groups.google.com/group/ayaspell-dic
والسلام عليكم ورحمة الله