المدقق النحوي العربي

من ويكي عربآيز
نسخة 12:50، 11 ديسمبر 2007 للمستخدم Hosny (ناقش | مساهمات) (تدقيق ؛))
اذهب إلى: تصفح، ابحث

يهدف المشروع إلى إنشاء مدقق نحوى عربي، يمكن دمجه فى مختلف الاصدارات الخاصه بمحررات النصوص و ذلك لدعم وجود الكيان العربى و دعم اللغه العربيه فى مختلف نظم التشغيل.

التصميم

يعتمد التصميم الأساسي للمشروع على استخدام لغة البرمجه Python و ذلك لإنشاء محرك لمعالجة النص العربي، وإخضاعه لمجموعه من القواعد المنطقيه التي تختص بضمان توافق النص مع القواعد النحويه للغه العربيه، واضعا في الاعتبار التعرف على نوع الكلمه، من خلال اخضاعها لمجموعه من المقارنات، بحيث يتم التعرف على نوع الكلمه من حيث كونها اسم أو فعل ..... ، يستفيد التصميم من امكانيات لغة Python فى معالجة اللغة العربيه بترميز UTF-8 و هو ما يساعد على دمج البرنامج فى مختلف محررات النصوص سواء كملحق له أو كجزء منه، باعتبار أن معظم محررات النصوص قادره على معالجة النصوص بترميز UTF-8.

يتم تصميم النظام للتعامل مباشرة على النصوص العربيه، و ذلك عن طريق استخدام قاعدة بيانات للكلمات، يتم عن طريقها تحديد نوع الكلمه و من ثم تحديد القواعد النحويه اللازمه للتعامل مع الجمله كلها، بحيث تطبق القواعد النحويه بشكل متتابع، أى أن الكلمات اللاحقه للكلمه هى التى يتم تطبيق القواعد النحويه عليها.

يتم استخدام لغة Python لإمكانية معالجة نصوص UTF-8 عن طريقها و فى نفس الوقت لكونها لغة تفسيرية، مما يسهل دمجها كملحق للعديد من محررات النصوص.