[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[developers] المحللات الصرفي ة العربية الأساليب وال أهداف والعوائق
- To: avrst at googlegroups dot com, linux_syria at yahoogroups dot com, Development Discussions <developer at arabeyes dot org>, ayaspell-dic at googlegroups dot com
- Subject: [developers] المحللات الصرفي ة العربية الأساليب وال أهداف والعوائق
- From: Hamed al-Suhli <hamedsuhli at gmail dot com>
- Date: Wed, 29 Apr 2009 03:05:03 +0200
- Dkim-signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=gmail.com; s=gamma; h=domainkey-signature:mime-version:received:date:message-id:subject :from:to:content-type; bh=br7AwHVAdgP7gK41BohiOp1E3RItR/XhNI09kq9OMdo=; b=FUstrpwMi/rUTwfCtWgnzEyFuesVhwvJU6Q+pHHEXk6EWX/pLd3y2tRoxqGJa595Me BWfkWO+bZ6Vdw7TOQauqb0+vas8s4mUj5YvcoYjNWmUW31s9xYQBvnZW2pFisnrlJyaA /9+QFV0vvxUTz+ElZw8qFTMk9Ssz0dxQNfY9Y=
- Domainkey-signature: a=rsa-sha1; c=nofws; d=gmail.com; s=gamma; h=mime-version:date:message-id:subject:from:to:content-type; b=mIBg2yye6gmwT/jlXb5l9qICAURbBkU2IovKUjBhpRsrOdRo6/M/N0Lfc83VYWi8Qi 6A+tkeC8wZNLiKUfGSxkvscsGKALX1VODssKJGz4Y2NhYV/8FkKxm7zG/WEbGNGhjN03 Od04GTcwVOZN51QjWNO+4gco6ts92nk2yuGZg=
http://www.wataonline.net/site/modules/newbb/viewtopic.php?topic_id=6385&forum=110
في البداية تجب الإشارة إلى أنه بالنسبة للمنظمة العربية للثقافة والعلوم ومدينة العلوم فالمحلل الصرفي هو جزء من مشروعهم المعجم التفاعلي... ولكن بجهود الدكتور أمين القلق فقد تم توسيع الأمر نحو بحث المحللات الصرفية بشكل عام وليس فقط حاجة المعجم التفاعلي
مهما يكن فالمحلل الصرفي هو أداة إما بحثية أو لخدمة برنامج آخر كمحركات الفهرسة أو الترجمة الآلية أو القاموس... إلخ
ولهذا نجد عدم وضوح في تحديد دقيق لماهية التحليل الصرفي بين الباحثين في هذا المجال
ولكن بشكل عام تم الانتهاء دون إجماع على أن المحلل الصرفي سيحلل الكلمة
المفردة غير المشكولة خارج سياقها ويقدم قائمة بكل الاحتمالات الممكنة
وتحليلا للكلمة من أدوات وجذور ولواصق مشكولة مع وصف دقيق للأوزان والحالة
الإعرابية وربما الإشارة إلى تفاصيل لمسائل القلب والإعلال والإبدال والحذف
فعندما ندخل كلمة وهم فإن على المحلل أن يعطي:
وَهْمُ وَهْمَ وَهْمِ وَهْمٌ وَهْماً وَهْمٍُ، وُهِمَ المبني للمجهول وَهَمَ وَهِمَ من الجذر (و ه م)
وكذلك وَ حرف العطف، هَمَّ أي الفعل، هَمِّ هَمُّ هَمَّ المصادر من (ه م م ) أو هُمْ أي الضمير
............
......
مع أوزانها ونوع الكلمة وحالتها الإعرابية
للوصول إلى هذه الغاية هناك عدة آليات مستخدمة
-
المقارنة مع مكنز courpus يحوي كامل كلمات العربية مشكولة وهذا مطلب شبه مستحيل ويسبب بطئا شديدا وحجما هائلا
-
المقارنة مع فروع شجرية للمكنز يتم توليدها آنيا اعتمادا على قاعدة بيانات
جذور وجذوع ولواحق وأوزان أي المزج بين قاعدة بيانات جزئية وخوارزميات
توليد تصريفية وهذا الأسلوب استخدمه العديد إلا أن أكمل الأعمال في رؤيتي
هي للمجموعة الفرنسية (د.جوزيف ديشي د.محمد حسون د.رمزي عباس) ومكنزهم
ديوان وهناك أيضا عمل مغربي د.عز الدين المزروعي وعمل تونسي د.عبد المجيد
بن حمادو ويمكن أن يندرج ضمن هذا الأسلوب أيضا عمل التشيكي د.أوتاكار سمرز
في المشروع ElixirFM
-
إجراء تحليلات لتوقع الجذور المحتملة للكلمة إما من خلال المقارنة مع جداول بأطول وأشكال مفهرسة لتضييق الاحتمالات وهذه الطريقة اعتمدها باحث الدكتوراه الأردني مجدي صوالحة مع إجراءات إحصائية... أو استخدام خوارزميات تعرف الجذر التي تعتمد أسلوب إلغاء الاحتمالات على مستوى مجموعات الحروف وتكرار العملية ثم المقارنة للوصول للحلول وهذه دون قاعدة بيانات مدققة تؤدي إلى حلول لا تقبلها العربية وقد اعتمدها د.محمد سعيد الدسوقي وم.رياض سنبل من سورية وقد كانت خوارزمية تعرف الجذر من خلال الاقصاء التي ابتكراها مميزة
وللحديث تتمة
--
hamed suhli
http://sourceforge.net/projects/tarmeez