[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: building an Arabic encoding correction tool



I am talking about such this:

read it pleas!!
����� �� ����� ����� �������
----- Original Message -----
*From:* asem sawady <mailto:asemsawady at yahoo dot com>
*To:* avrst at googlegroups dot com <mailto:avrst at googlegroups dot com>
*Sent:* Monday, April 14, 2008 10:08 AM
*Subject:* ‏ [avrst:118] Re: توضي�­ �­ول الترميز الصوتي

أخÙ� Ø�­Ø§Ù…د لا خلا٠٠Ù� ما ذكرت Ùˆ Ø£Ù� ا ذكرت التعر٠الصوتÙ� لأÙ� Ù‡ المدى البرمجÙ� الأقرب لمشروعÙ� ا Ø�­Ù� Ø« Ù� تم تØ�­ÙˆÙ� Ù„ الأصوات البشرÙ� Ø© إلى بÙ� اÙ� ات Ø�­Ø§Ø³ÙˆØ¨Ù� Ø©.

Ùˆ كما قلت Ù…Ù� قبل Ø¥Ù� خبرتÙ� Ù Ù� موضوع الصوتÙ� ات متواضعة Ùˆ لكÙ� Ù� Ù� ÙƒÙ� ت أتØ�­Ø¯Ø« اÙ� طلاقا Ù…Ù� الرسم الذÙ� أرسته Ù„Ù� ا عÙ� الترمÙ� ز الصوتÙ� بالمقارÙ� Ø© مع خصوصÙ� ات اللغة العربÙ� Ø©: ٠مثلاً Ø�­Ø±Ù الأل٠٠Ù� اللغة العربÙ� Ø© Ù� مكÙ� Ø£Ù� Ù� Ø�­ÙˆÙ„ المعÙ� Ù‰ باطالته مثلاً (زÙ� ادة مدة مرور الهواء Ù Ù� الØ�­Ù� جرة) Ù„Ù� تØ�­ÙˆÙ„ إلى مد مثل ال٠رق بÙ� Ù� كلمتÙ� الآÙ� Ùˆ Ù‡Ù� ظر٠زماÙ� Ùˆ كلمة آلآÙ� Ùˆ هو سؤال است٠هامÙ� .

أتمÙ� Ù‰ Ø£Ù�  تكوÙ�  ٠كرتÙ�  وصلت بشكل أوضØ�­.

*/Hamed alSuhli <hamedsuhli at gmail dot com>/* wrote:
وعل� كم السلام أخ�  عاصم
أر٠ق ال� ص لم�  وصله مش٠را

Ø£Ù� ا لا أتØ�­Ø¯Ø« عÙ� التعر٠الصوتÙ� ولم أستطع Ø¥Ù� ضاØ�­ ٠كرتÙ� Ù Ù� الØ�­ÙˆØ§Ø±Ø§Øª السابقة التÙ� Ù� مكÙ� الرجوع إلÙ� ها Ù Ù� أرشÙ� ٠المجموعة Ù� ٠سها لسبب رئÙ� سÙ� هو Ø£Ù� ال٠كرة لم تكÙ� واضØ�­Ø© Ù Ù� ذهÙ� Ù� وقد مضى عام ÙˆÙ� ص٠خلال بØ�­Ø«Ù� عÙ� معلومات للوصول لوضوØ�­ كا٠لل٠كرة، للاÙ� طلاق للعمل ال٠كرة Ù‡Ù� باختصار الوصول لترمÙ� ز Ù� كا٠ئ العلاقات الصوتÙ� Ø© الطبÙ� عÙ� Ø© بأخرى رقمÙ� Ø© دعÙ� Ù� أبسط أساس ال٠كرة، Ù Ù� المستوÙ� الاقلÙ� دÙ� لدÙ� Ù� ا جملة الاØ�­Ø¯Ø§Ø«Ù� ات الدÙ� كارتÙ� Ø© ولدÙ� Ù� ا Ø£Ù� ضا ولÙ� ٠س المØ�­Ø§ÙˆØ± المتعامدة جملة الإØ�­Ø¯Ø§Ø«Ù� ات الدائرÙ� Ø© وإذا مالت المØ�­Ø§ÙˆØ± Ù� صبØ�­ لدÙ� Ù� ا جملة Ø¥Ø�­Ø¯Ø§Ø«Ù� ات مائلة، Ù‡Ù� اك قواÙ� Ù� Ù� تÙ� قل Ø£Ù� كائÙ� Ù…Ù� هذه المرجعÙ� Ø© إلى تلك Ù� سمÙ� ها قواÙ� Ù� Ù� التكا٠ؤ بÙ� Ù� الØ�­Ù‚Ù„Ù� Ù� ومÙ� Ù‡Ù� ا أوجدÙ� ا معاÙ� Ù� ر للتكا٠ؤ بÙ� Ù� Ø£Ù� Ø�­Ù‚Ù„Ù� Ù� Ù� مكÙ� التكا٠ؤ بÙ� Ù� هما، وهذه المعاÙ� Ù� ر واضØ�­Ø© Ù Ù� جبر الØ�­Ù‚ول Ù� Ø�­Ù� Ù Ù� Ø�­Ø§Ù„تÙ� ا هذه لدÙ� Ù� ا اللغة التÙ� Ù‡Ù� مكوÙ� ات صوتÙ� Ø© صر٠ة، Ù� رÙ� د Ø£Ù� Ù� وجد Ø�­Ù‚لا Ù Ù� ال٠ضاء الرقمÙ� Ù� كا٠ؤ "و٠قط" Ø�­Ù‚Ù„ المكوÙ� ات الصوتÙ� Ø© الإÙ� ساÙ� Ù� Ø© Ù…Ù� Ø�­Ù� Ø« علاقاتها (دلالاتها وروابط الدلالات) المعÙ� ÙˆÙ� Ø©ØŒ وهذا هو م٠هوم الترمÙ� ز الصوتÙ� كما هو معلوم Ù Ù� الصوتÙ� ات ٠إÙ� الأذÙ� الإÙ� ساÙ� Ù� Ø© التÙ� Ù‡Ù� مرجع العلاقات، تمÙ� ز Ù� سب الأصوات ولÙ� س الأصوات Ù� ٠سها، ٠تتالÙ� صوتÙ� Ù� Ø£Ø�­Ø¯Ù‡Ù…ا 200 هرتز 50 ملÙ� ثاÙ� Ù� Ø© والآخر 400 هرتز 200 ملÙ� ثاÙ� Ù� Ø© Ù� كا٠ؤ لدى الأذÙ� تتالÙ� صوتÙ� Ù� 400 ثم 800 Ù„Ù� ٠س المدد وإÙ� كاÙ� ت الأذÙ� تمÙ� ز الترددات Ù� ظرا لأÙ� أطوال الموجات ستبقى Ù…Ù� سوبة لأطوال المسارات Ù Ù� الأذÙ� Ù� ٠سها وهو ما Ù� سمÙ� Ù‡ طابع الصوت ٠تمÙ� ز صوت الط٠ل الØ�­Ø§Ø¯ عÙ� صوت الرجل الخشÙ� ولكÙ� هذا لا شأÙ� له أبدا بالمعÙ� Ù‰ بØ�­Ø« الدكتور Ù…Ù� صور الغامدÙ� الذÙ� هو المرجع المعتمد Ù� وضØ�­ تماما هذه الأمور، وقد أكدت دراسته ((رغم Ø£Ù� Ù‡ لم Ù� شر بوضوØ�­ للمصادر)) وأوضØ�­Øª Ø£Ù� الجهاز الصوتÙ� Ù� كوÙ� Ù Ù� Ø�­Ø§Ù„Ø© ثابتة لجمÙ� ع البشر عÙ� د إصدار Ù ÙˆÙ� Ù� Ù… معÙ� Ù� الذÙ� هو اÙ� تقال Ù Ù� الترددات الصوتÙ� Ø© Ù…Ù� Ø�­Ø§Ù„Ø© إلى أخرى اعتمادا على توضع الجهاز الصوتÙ� Ù� Ø�­Ù� لا Ù� رÙ� د التعر٠على ال٠وÙ� Ù� Ù… Ù…Ù� الصوت ال٠Ù� زÙ� ائÙ� أو الكهربÙ� أو Ø�­ØªÙ‰ الرقمÙ� هذا هو مجال برامج تعر٠الكلام ومشروع mbrolla ما Ù� رÙ� ده هو ترمÙ� ز العÙ� اصر الصوتÙ� Ø© الأساسÙ� Ø© رقمÙ� ا بØ�­Ù� Ø« Ù� Ø�­Ù‚Ù‚ تكا٠ؤا مطلقا بÙ� Ù� ال٠ضاء الأصواتÙ� الإÙ� ساÙ� Ù� وترمÙ� زÙ� ا Ø£Ù� الØ�­Ù‚Ù„ الرقمÙ� الذÙ� Ø£Ù� شأÙ� اه عÙ� دها Ù� مكÙ� Ù� ا القول Ø¥Ù� العلاقات الأصواتÙ� Ø© المعÙ� ÙˆÙ� Ø© التÙ� Ù� Ù� شؤها أو Ù� Ù…Ù� زها الإÙ� ساÙ� أصبØ�­Øª متكا٠ئة مع علاقات رقمÙ� Ø© واضØ�­Ø© وهذه Ù� مكÙ� Ù� ا ببساطة جدولتها ودراستها

موضوع دراست� ا هو ثلاث مستو� ات
المستوى الاشتقاقÙ� وقواعد التØ�­ÙˆÙ„ والشذوذ الصوتÙ� Ù Ù� اللغة العربÙ� Ø© وما سÙ� ضÙ� Ù Ù‡ Ù‡Ù� ا هو الجدولة والتÙ� ظÙ� Ù… لأÙ� معظم هذا المستوى قد درس مستوى العلاقات الصوتÙ� Ø© المعÙ� ÙˆÙ� Ø© بÙ� Ù� ال٠وÙ� Ù� مات "الØ�­Ø±ÙˆÙ " Ø£Ù� Ù� ظرÙ� Ø© ابÙ� جÙ� Ù� Ù Ù� الاشتقاق الأكبر والتÙ� تابعها Ø�­Ø³Ù� عباس Ù Ù� معاÙ� Ù� الØ�­Ø±ÙˆÙ العربÙ� Ø© وهو على جزئÙ� Ù� الجزء الأول Ù� ٠ترض Ø£Ù� العرب أوجدوا علاقات تكا٠ؤ بÙ� Ù� الأصوات والمعاÙ� Ù� الأساسÙ� Ø© الصر٠ة Ø£Ù� وجود علاقة بÙ� Ù� ض ر ب وبÙ� Ù� ٠عل الضرب كمعÙ� ى، وهذه Ù� ر٠ضها ٠ردÙ� Ù� اÙ� د دÙ� ساوروس مؤسس علم اللساÙ� Ù� ات الØ�­Ø¯Ù� ثة Ø£Ù� Ø£Ù� Ù‡ Ù„Ù� س Ù‡Ù� اك Ø£Ù� ربط بÙ� Ù� المعاÙ� Ù� الأساسÙ� Ø© والأصوات التÙ� وضعت للدلالة علÙ� ها <http://www.edunet.tn/ressources/resdisc/philo/philoelev/Livre/Lettres/H%20et%20M/langage/txt1.htm> الجزء الأول وهو ما Ù� عتر٠بوجوده دوÙ� توضÙ� Ø�­ لاطراده هو الآلÙ� ات المعÙ� ÙˆÙ� Ø© الاشتقاقÙ� Ø© Ù…Ù� المعاÙ� Ù� الأساسÙ� Ø© وهو ما Ù� سمÙ� Ù‡ ابÙ� جÙ� Ù� الدمج Ø£Ù� Ø£Ù� ض ر ب هو Ø�­ØµÙ� لة اÙ� دماج بÙ� Ù� معÙ� Ù‰ أساسÙ� ض ر ر Ø£Ù� الضرر ÙˆØ�­Ø±Ù الجر الباء... بÙ� Ù� ما Ù� ذهب علماء اللساÙ� Ù� ات المقارÙ� Ø© Ù Ù� اللغات الØ�­Ø§Ù…Ù� Ø© السامÙ� Ø© إلى Ø£Ù� الجذور كاÙ� ت Ø«Ù� ائÙ� Ø© ولمعاÙ� Ù� بسÙ� طة ثم تم تعقÙ� دها بدمج الجذور الثÙ� ائÙ� Ø© Ù Ù� ثلاثÙ� Ø© ورباعÙ� Ø© بÙ� Ù� ما Ø�­Ø§Ù ظت بعض المعاÙ� Ù� على Ø«Ù� ائÙ� تها دوÙ� قابلÙ� Ø© اشتقاق وهÙ� الØ�­Ø±ÙˆÙ هذا التمÙ� Ù� ز بÙ� Ù� معاÙ� Ù� أساسÙ� Ø© ومشتقة لم Ù� تم طرØ�­Ù‡ Ù Ù� اللساÙ� Ù� ات إلا مؤخرا خلال جهود الذكاء الصÙ� عÙ� المستوى الثالث هو العلاقات داخل الجملة البسÙ� طة Ø£Ù� ترابطات المعاÙ� Ù� ووسائل الربط والقضاÙ� ا الجمالÙ� Ø© وسهولة الل٠ظ أو السماع التÙ� أدخلت تعدÙ� لات Ù� سمÙ� ها شذوذات

أكت٠Ù�  Ø�­Ø§Ù„Ù� ا ولÙ�  عودة

Ø�­Ø§Ù…د السØ�­Ù„Ù� ------------------------------------------------------------------------


السلام عل� كم
أعتذر عÙ� ردودÙ� القلÙ� لة Ùˆ المتأخرة بسبب المشاغل الكثÙ� رة طبعا ÙƒÙ� ت اÙ� قطعت ٠ترة Ù…Ù� الزمÙ� عÙ� متابعة تطورات هذا المشروع Ùˆ لكÙ� Ù� Ù� أرى Ø£Ù� Ù‡ ما زال Ù� راوØ�­ مكاÙ� Ù‡ الأخ Ø�­Ø§Ù…د طبعا Ù� عر٠كثÙ� را Ù…Ù� آرائÙ� Ù Ù� هذا المشروع Ùˆ ÙƒÙ� ت اعترضت سابقا على إدخال موضوع التعر٠الصوتÙ� أما Ùˆ قد تم اعتماده ٠لا Ù� مكÙ� Ù� Ù� إلا موا٠قة الإجماع. طبعا موضوع التعر٠الصوتÙ� موضوع ضخم Ùˆ Ù� Ø�­ØªØ§Ø¬ دراسات معمقة Ùˆ Ù Ù� المستÙ� د الذÙ� أرسله الأخ Ø�­Ø§Ù…د إلÙ� Ù� ا خطوط أساسÙ� Ø© Ùˆ لكÙ� ها برأÙ� Ù� Ù„Ù� ست كا٠Ù� Ø©. مثلاً موضوع الترمÙ� ز الصوتÙ� أظÙ� Ø£Ù� Ù‡ ما Ù� زال Ù� اقصاً كوÙ� Ù‡ لم Ù� أخذ بعÙ� Ù� الإعتبار بعض الأمور مثل سرعة مرور التÙ� ار الهوائÙ� Ù Ù� الØ�­Ù� جرة Ùˆ مدة هذا المرور Ùˆ كوÙ� Ù� لست ملما بهذه الأمور ٠أظÙ� Ø£Ù� الأ٠ضل Ø£Ù� Ù� تم سؤال شخص متخصص (طبÙ� ب ) مثلاً. طبعاً مشاركتÙ� الØ�­Ø§Ù„Ù� Ø© Ù Ù� المشروع ستقتصر على الأ٠كار ٠قط رÙ� ثما Ù� تهÙ� Ø£ Ù„Ù� وقت Ù…Ù� ال٠راغ Ùˆ سأØ�­Ø§ÙˆÙ„ إ٠ادتكم قدر الإمكاÙ� مما هو متاØ�­ Ùˆ على كل Ø�­Ø§Ù„ أظÙ� Ø£Ù� العمل البرمجÙ� Ù„Ù� Ù� بدأ قبل Ø£Ù� Ù� تم استÙ� ٠اء المعطÙ� ات التÙ� ذكرها الأخ Ø�­Ø§Ù…د Ù Ù� ما عÙ� ÙˆÙ� Ù‡ باØ�­ØªÙ� اجاتÙ� ا اللغوÙ� Ø© الØ�­Ø§Ù„Ù� Ø© مع Ø£Ù� Ù‡ Ù� مكÙ� البدأ بالعمل البرمجÙ� بالتوازÙ� مع جمع المعلومات Ùˆ التدقÙ� Ù‚ إلا Ø£Ù� الأعضاء ال٠اعلÙ� Ù� Ù Ù� المشروع ما زالوا أقلة Ùˆ لذلك الأ٠ضل برأÙ� Ù� Ø£Ù� Ù� تم العمل بشكل متتالÙ� Ùˆ Ù„Ù� س متوازÙ� .
مع الشكر لكل م�  � ساهم ٠�  المشروع
عاصم السواد�  .
مطور برمجÙ� ات Ùˆ Ù…Ø�­Ù„Ù„ Ù� ظم.




--~--~---------~--~----~------------~-------~--~----~
You received this message because you are subscribed to the Google Groups "جمعية اللغة العربية الحاسوبية" group.
To post to this group, send email to avrst at googlegroups dot com
To unsubscribe from this group, send email to avrst-unsubscribe at googlegroups dot com For more options, visit this group at http://groups.google.com/group/avrst?hl=en
-~----------~----~----~----~------~----~------~--~---

Afief Halumi wrote:
I guess he is talking about a spell checker... It *should* be a simple
matter of installing an Arabic dictionary in whatever spell checker
Firefox uses(under the assumption that Mozilla didn't build their own
system)

On Mon, Apr 14, 2008 at 5:38 PM, Khaled Hosny <khaledhosny at eglug dot org> wrote:
On Mon, Apr 14, 2008 at 08:59:17AM +0200, Hamed alSuhli wrote:
 > alSalam aleikom,
 >
 > I am wondering if there are any encoding or display correction for
 > Arabic for Mozilla or OOo?
 > because I think the answer is not,
 > I suggest building an add ons for such application,
 > now I'm using M$ word "correct uncompleted text"
 > it's not good enough, but works.
 > and if you receive lots Arabic text, it's exosted to copy, paste, then
 > correct.
 >
 > As I'm not PHP or Java expert, I can't suggest doing it myself.
 > but I'm studdeing Wxwedget if I can do something?
 > or if you think it's long and difficult?
 > Tarmeez will handle this in year or more.

 Sorry, but I understand almost nothing, what do you mean by "Arabic
 encoding correction tool", what is it supposed to do?

 --
  Khaled Hosny

-----BEGIN PGP SIGNATURE-----
 Version: GnuPG v1.4.6 (GNU/Linux)

 iD8DBQFIA2xqRoqITGOuyPIRAkJIAJ4y20V3Pt/gOi8mAYdskoJddIxamQCfXhjE
 lA5cVsKFwnRDAXBE544n6e4=
 =oya3
 -----END PGP SIGNATURE-----

_______________________________________________
 Developer mailing list
 Developer at arabeyes dot org
 http://lists.arabeyes.org/mailman/listinfo/developer

_______________________________________________
Developer mailing list
Developer at arabeyes dot org
http://lists.arabeyes.org/mailman/listinfo/developer