«آية سبل»: الفرق بين المراجعتين

من ويكي عربآيز
اذهب إلى: تصفح، ابحث
(تصحيح تحميل والرحمن)
ط
(مراجعتان متوسطتان بواسطة مستخدمين اثنين آخرين غير معروضتين)
سطر 1: سطر 1:
  +
إن أهمية [http://en.wikipedia.org/wiki/Spellchecker المدققات الإملائية] في مجال المعالجة الرقمية للغات الطبيعية من الأمور التي استرعت انتباه المهتمين بالحلول المكتبية منذ البدايات الأولى للإعلاميات، مما حفز الشركات على العمل على إنتاج هذه الأدوات والمعينات المعلوماتية - ذات المصدر المغلق في أغلبها - بوظائف متطورة أكثر فأكثر، تلبي حاجة مستعملي الحاسوب في المجال المكتبي بشكل خاص وتغني خدمات موزّعي البرامج المعلوماتية التي تدفع الملايين من أجل الحصول عليها (يناهز ثمن المدقق الإملائي العربي المليون دولار أمريكي في السوق العالمية لسنة 2006<ref>http://www.ameinfo.com/ar-69687.html</ref>).
<center>'''القاموس العربي للتــــدقيق الإمـلائي'''</center>
 
   
  +
على صعيد البرامج الحرة وإلى حدود 2006، لم يكن هناك أي مدقق إملائي عربي حر وظيفي، رغم تعدد المحاولات العربية المرتبطة بطريقة مباشرة أو غير مباشرة بمؤسسة [http://www.arabeyes.org/ عربآيز] أهمها محاولتي الأخوين محمد الزبير ببرنامج "[http://www.arabeyes.org/project.php?proj=Duali دؤلي]" ومحمد سمير ببرنامج " [http://home.foolab.org/cgi-bin/viewcvs.cgi/projects/baghdad/ بغداد]". تأخر الحصول على دعم لغة الضاد في البرامج الحرة بشكل عام وافتقادها لمدقق إملائي بشكل خاص يرجع أساسًا إلى تميزها بخصائص برمجية ولغوية معقدة نسبيًا، ندرة الكفاءة المختصة وضعف الاهتمام بالبرامج الحرة في المنطقة شعبيًا واقتصاديًا وجامعيًا. في آخر المطاف جاء الحل عبر بوابة البرامج الحرة بالتأكيد: برنامج التدقيق الإملائي [http://hunspell.sourceforge.net/ هانسبل] Hunspell المعتمد من قبل مشروع الديوان المفتوح أوبن أفس [http://www.openoffice.org/ OpenOffice.org] ومن برنامج [http://asspell.sourceforge.net/ أسبل] Aspell. البرنامجان مطوران أصلًا للغات اللاتينية ولكن بعد إضافة خاصية اليونيكود ودعم ثنائية الاتجاه إليهما أصبحا مؤهلين لدعم اللغات غير اللاتينية من ضمنها اللغة العربية.
<center>'''HUNSPELL-AR '''</center>
 
   
  +
بعد حصول دعم اللغة العربية في هذين البرنامجين - هانسبل وأسبل - ظهر للمهتمين بالشأن المعلوماتي الحر، تحدي آخر هو توفير القواميس العربية الخاصة بالتدقيق الإملائي والتي بدونها لن تؤدى هذه البرامج وظيفتها. لم يكن في الساحة إلاّ قاموسًا عربيًا واحدًا حرًّا هو قاموس تيم بوكولتر <ref>http://www.qamus.org/</ref> Tim Buckwalter المعتمد في بنائه على مكنز لغوي مكون من مادة صحفية أساسًا. للأسف، كان الباحث المطور تيم بوكولتر جاهلا للغة العربية وكانت المادة الصحفية المرجعية غير مدققة لغويًا، فترتّب عن ذلك احتواء القاموس على مفردات خاطئة في نسبة كبيرة منها رسمًا ولغةً مما أثر سلبًا على المدققات الإملائية المعتمدة عليه، وجعلها لا ترقى إلى المستوى المنتظر منها وهذا مثل المدقق أربيك-سبل <ref>[http://sourceforge.net/projects/arabic-spell/ arabic-spell]</ref>، منتوج شركة [http://www.google.com/intl/en/about.html غوغل] Google، الذي يعطي نتائج جد رديئة، تدفع المستعمل إلى الاستغناء عنه منذ الوهلة الأولى.
<center>'''لمشروع آيسبل'''</center>
 
   
  +
أمام هذا الوضع، كان ولا بدّ من الاعتماد على قدراتنا الذاتية، واستثمار معرفتنا بلغة الضاد فأهل مكة أدرى بشعابها: أولًا تكييف المدقق الإملائي مع عادة المستعمل تجاهل الحركات في كتاباته باللغة العربية ثم بناء قاموس عربي حر مناسب. من أجل بلوغ هذين الهدفين تمّ تأسيس مشروع بمواصفات مهنية حديثة تجمع كل شروط النجاح: موقع إنترنت <ref>http://perso.menara.ma/~kebdani/ayaspell-dic/</ref> في نسخة أولى مؤقتة باللغة العربية ثم تلاه آخر رسمي بالإنجليزية <ref>http://ayaspell.sourceforge.net/</ref> و العربية <ref>http://ayaspell.sourceforge.net/ar.html</ref> ثم الفرنسية <ref>http://forge.aaul.net/projects/ayaspell/M</ref> حيث يجد المهتم آخر الأخبار ويستطيع تحميل الملفات ويطّلع على الوثائق اللغوية ويكون على علم بالمنجزات و قائمة بريدية <ref>http://groups.google.com/group/ayaspell-dic</ref> حيث تناقش الاختيارات وتوضع الاقتراحات وتوضح الحلول التقنية وأخيرًا مدونة <ref>http://ayaspell.blogspot.com/</ref> حيث المقالات التي تنظر للمشروع ونصوص تفسر المقاربات وتشرح المنهجيات. كان الرهان هو تحقيق نتيجة بمستوى لا يقل قيمة عما يتداوله المستعملون لهذا الصنف من الأدوات المكتبية على الأنظمة المنغلقة وهكذا تمّ إنشاء القاموس العربي الحر للتدقيق الإملائي المفتوح Hunspell-ar أول منتوج مشروع آيسبل.
<center>'''<nowiki>***</nowiki>'''</center>
 
   
  +
يدخل المدقق الإملائي هذا، في حقيقة الأمر، ضمن مشروع شامل، هو مشروع آيسبل Ayaspell project ، الذي يهدف توفير أدوات المعالجة الآلية للغة العربية (و اللغة الأمازيغية <ref>[http://ayaspell.sourceforge.net/am.html</ref> مستقبلًا إن شاء الله) في بيئة البرامج الحرة، بالإضافة للمدقق الإملائي، أدوات الترادف المعجمي [http://en.wikipedia.org/wiki/Thesaurus Thesaurus]، التدقيق النحوي [http://en.wikipedia.org/wiki/Grammar_checker Grammar-checker] وقواميس الأنظمة المحمولة [http://en.wikipedia.org/wiki/Embedded_system Embedded systems] مثل الهواتف المحمولة وأجهزة PDA.
<center>'''The arabic spell-checker dictionary'''</center>
 
   
  +
== الخصائص الأساسية للقاموس ==
<center>'''from Ayaspell project'''</center>
 
   
  +
استدعى غياب قاموس عربي حر، بناء واحد يلبي شروط التدقيق الإملائي بالاعتماد على المعاجم اللغوية العربية المتداولة التراثية والحديثة. من هذه المعاجم معجم تصريف الأفعال العربية (مجموعة Bescherelle)، المعجم الوسيط، المعجم الغني، معجم المحيط ولسان العرب. هذه هي إذن الروافد المهيكلة لقاموس آيسبل الذي اصبح ثاني قاموس حر متوفر على الشبكة، حر بمعنى خضوعه للرخصة العمومية الشاملة GPL.
<center>'''<nowiki>***</nowiki>'''</center>
 
   
  +
تطلب إنشاء القاموس بشقيه (ملف DIC وملف AFF) أكثر من 1500 ساعة عمل على مدى قرابة سنتين من النشاط المتواصل (أبريل 2006 - يناير 2008) وتحليل آلاف المفردات من فعل واسم وأداة وحرف وتصنيفها وتوليدها حسب قواعد اللغة العربية النحوية والصرفية، ثم تحديد معناها لتمييز الفعل اللازم والمتعدي لعاقل أو غير عاقل والصفة العائدة على عاقل أو غير عاقل ومعرفة الشاذ منها والعادي. إجمالًا، تمت معالجة أكثر من 50.000 مفردة تتوزع على ما لا يقل عن 10.000 فعل عربي، 40.000 اسم وعشرات الحروف والأدوات النحوية وما استثني من هذا أو ذاك.
<center>'''ذ. محمد كبداني '''</center>
 
   
  +
تجدر الإشارة إلى كون هذه النتيجة، حصلنا عليها باستثمار خصائص هانسبل Hunspell العادية فقط ولم نلجأ إلا لخاصية برمجية جديدة واحدة متمثلة في (بهانسبل إصدارة 1.1.5 <ref>http://sourceforge.net/project/shownotes.php?release_id=494764&group_id=143754 Patch </ref>) تحت وظيفة IGNORE لتجاهل الحركات والتطويل في النص العربي المعالج من خلال تحويل الأخ طه زروقي، الكود المتعلق بها المبرمج أصلًا في برنامج "دؤلي" (لغة بايتون Python) إلى برنامج هانسبل (++C). ما زالت هذه الخاصية في حاجة للتعديل <ref>http://sourceforge.net/tracker/?group_id=205373&atid=993378</ref> وإلى تحسين لأنها تأثر سلبًا على نوعية الكلمات المقترحة في البديل الصحيح عندما تكون المفردة الخاطئة مشكولةً.
<center>'''27-01-2008'''</center>
 
   
  +
=== المُكَوِّن الفعلي ===
----
 
 
'''البطاقة التقنية'''
 
 
*'''الإنجاز:''' '''القاموس العربي للتدقيق الإملائي Hunspell-ar'''
 
*'''التنزيل:'''
 
http://sourceforge.net/project/showfiles.php?group_id=205373
 
http://forge.aaul.net/projects/ayaspell/
 
*'''المواقع:'''
 
http://ayaspell.sourceforge.net/
 
http://ayaspell.sourceforge.net/ar.html
 
*'''القائمة البريدية:'''
 
http://groups.google.com/group/ayaspell-dic
 
*'''المدونة:'''
 
http://ayaspell.blogspot.com/
 
*'''الجوائز:'''
 
'''الجائزة الخاصة خلال الملتقى الإفريقي الثالث للبرامج الحرة:''' Prix spécial des troisième rencontres africaines du Logiciel Libre
 
http://rall.logiciels-libres.org/rubrique.php3?id_rubrique=6
 
'''مشروع السنة حسب الجمعية المغربية لتنمية الإعلاميات الحرة:''' Projet Open Source de l'année (2007), Site Linux-Maroc, Association ADIL
 
http://81.192.48.26/linuxmaroc/modules.php?name=News&file=article&sid=143
 
 
 
----
 
 
 
<center>'''بســــم الله الرحمـــــن الرحــــــــيم'''</center>
 
 
 
'''الحـــــيثيات '''
 
 
 
إن أهمية [http://en.wikipedia.org/wiki/Spellchecker المدققات الإملائية] '''<nowiki>[1]</nowiki>''' في مجال المعالجة الرقمية للغات الطبيعية من الأمور التي استرعت انتباه المهتمين بالحلول المكتبية منذ البدايات الأولى للإعلاميات، مما حفز الشركات على العمل على إنتاج هذه الأدوات والمعينات المعلوماتية - ذات المصدر المغلق في أغلبها - بوظائف متطورة أكثر فأكثر، تلبي حاجة مستعملي الحاسوب في المجال المكتبي بشكل خاص وتغني خدمات موزّعي البرامج المعلوماتية التي تدفع الملايين من أجل الحصول عليها (يناهز [http://www.ameinfo.com/ar-69687.html ثمن المدقق الإملائي العربي] '''<nowiki>[2]</nowiki>''' المليون دولار أمريكي في السوق العالمية لسنة 2006) ...
 
 
 
على صعيد البرامج الحرة وإلى حدود 2006، لم يكن هناك أي مدقق إملائي عربي حر وظيفي، رغم تعدد المحاولات العربية المرتبطة بطريقة مباشرة أو غير مباشرة بمؤسسة [http://www.arabeyes.org/ عربآيز] '''<nowiki>[3]</nowiki>''' Arabeyes أهمها محاولتي الأخوين محمد الزبير ببرنامج "[http://www.arabeyes.org/project.php?proj=Duali دؤلي]" '''<nowiki>[4]</nowiki>''' Duali ومحمد سمير ببرنامج " [http://home.foolab.org/cgi-bin/viewcvs.cgi/projects/baghdad/ بغداد]" '''<nowiki>[5]</nowiki>''' Baghdad . تأخر الحصول على دعم لغة الضاد في البرامج الحرة بشكل عام وافتقادها لمدقق إملائي بشكل خاص يرجع أساساً إلى تميزها بخصائص برمجية ولغوية معقدة نسبياً، ندرة الكفاءة المختصة وضعف الاهتمام بالبرامج الحرة في المنطقة شعبياً واقتصادياً وجامعياً. في آخر المطاف جاء الحل عبر بوابة البرامج الحرة بالتأكيد: برنامج التدقيق الإملائي [http://hunspell.sourceforge.net/ هانسبل] '''<nowiki>[6]</nowiki>''' Hunspell المعتمد من قبل مشروع الديوان المفتوح أوبن أفس '''<nowiki>[7]</nowiki>''' [http://www.openoffice.org/ OpenOffice.org] ومن برنامج [http://asspell.sourceforge.net/ أسبل] '''<nowiki>[8]</nowiki>''' Aspell. البرنامجان مطوران أصلاً للغات اللاتينية ولكن بعد إضافة خاصية اليونيكود ودعم ثنائية الاتجاه إليهما أصبحا مؤهلين لدعم اللغات غير اللاتينية من ضمنها اللغة العربية...
 
 
 
بعد حصول دعم اللغة العربية في هذين البرنامجين - هانسبل وأسبل - ظهر للمهتمين بالشأن المعلوماتي الحر، تحدي آخر هو توفير القواميس العربية الخاصة بالتدقيق الإملائي والتي بدونها لن تؤدى هذه البرامج وظيفتها. لم يكن في الساحة إلاّ قاموساً عربياً واحداً حرّاً هو قاموس [http://www.qamus.org/ تيم بوكولتر ]'''<nowiki>[9]</nowiki>''' Tim Buckwalter المعتمد في بنائه على مكنز لغوي مكون من مادة صحفية أساساً. للأسف، كان الباحث المطور تيم بوكولتر جاهلا للغة العربية وكانت المادة الصحفية المرجعية غير مدققة لغوياً، فترتّب عن ذلك احتواء القاموس على مفردات خاطئة في نسبة كبيرة منها رسماً ولغةً مما أثر سلباً على المدققات الإملائية المعتمدة عليه، وجعلها لا ترقى إلى المستوى المنتظر منها وهذا مثل المدقق أربيك-سبل '''<nowiki>[10]</nowiki>''' [http://sourceforge.net/projects/arabic-spell/ arabic-spell] ، منتوج شركة [http://www.google.com/intl/en/about.html غوغل] '''<nowiki>[11]</nowiki>''' Google، الذي يعطي نتائج جد رديئة، تدفع المستعمل إلى الاستغناء عنه منذ الوهلة الأولى.
 
 
 
أمام هذا الوضع، كان ولا بدّ من الاعتماد على قدراتنا الذاتية، واستثمار معرفتنا بلغة الضاد فأهل مكة أدرى بشعابها: أولاً تكييف المدقق الإملائي مع عادة المستعمل تجاهل الحركات في كتاباته باللغة العربية ثم بناء قاموس عربي حر مناسب. من أجل بلوغ هذين الهدفين تمّ تأسيس مشروع بمواصفات مهنية حديثة تجمع كل شروط النجاح: [http://perso.menara.ma/~kebdani/ayaspell-dic/ موقع إنترنت] '''<nowiki>[12]</nowiki>''' في نسخة أولى مؤقتة باللغة العربية ثم تلاه آخر رسمي [http://ayaspell.sourceforge.net/ بالإنجليزية] '''<nowiki>[13]</nowiki>''' و[http://ayaspell.sourceforge.net/ar.html العربية] '''<nowiki>[14]</nowiki>''' ثم [http://forge.aaul.net/projects/ayaspell/ الفرنسية] '''<nowiki>[15]</nowiki>''' حيث يجد المهتم آخر الأخبار ويستطيع تحميل الملفات ويطّلع على الوثائق اللغوية ويكون على علم بالمنجزات و[http://groups.google.com/group/ayaspell-dic قائمة بريدية ]'''<nowiki>[16]</nowiki>''' mailling-list حيث تناقش الاختيارات وتوضع الاقتراحات وتوضح الحلول التقنية وأخيراً [http://ayaspell.blogspot.com/ مدونة ]'''<nowiki>[17]</nowiki>''' Blog حيث المقالات التي تنظر للمشروع ونصوص تفسر المقاربات وتشرح المنهجيات. كان الرهان هو تحقيق نتيجة بمستوى لا يقل قيمة عما يتداوله المستعملون لهذا الصنف من الأدوات المكتبية على الأنظمة المنغلقة وهكذا تمّ إنشاء القاموس العربي الحر للتدقيق الإملائي المفتوح Hunspell-ar أول منتوج مشروع آيسبل.
 
 
 
يدخل المدقق الإملائي هذا، في حقيقة الأمر، ضمن مشروع شامل، هو مشروع آيسبل Ayaspell project ، الذي يهدف توفير أدوات المعالجة الآلية للغة العربية (و[http://ayaspell.sourceforge.net/am.html اللغة الأمازيغية] '''<nowiki>[18]</nowiki>''' مستقبلاً إن شاء الله) في بيئة البرامج الحرة، بالإضافة للمدقق الإملائي، أدوات الترادف المعجمي '''<nowiki>[19]</nowiki>''' [http://en.wikipedia.org/wiki/Thesaurus Thesaurus]، التدقيق النحوي '''<nowiki>[20]</nowiki>''' [http://en.wikipedia.org/wiki/Grammar_checker Grammar-checker] وقواميس الأنظمة المحمولة '''<nowiki>[21]</nowiki>''' [http://en.wikipedia.org/wiki/Embedded_system Embedded systems] مثل الهواتف المحمولة وأجهزة PDA.
 
 
 
<div align="right">'''الخصائص الأساسية للقاموس'''</div>
 
 
<nowiki>استدعى غياب قاموس عربي حر، بناء واحد يلبي شروط التدقيق الإملائي بالاعتماد على المعاجم اللغوية العربية المتداولة التراثية والحديثة. من هذه المعاجم معجم تصريف الأفعال العربية (مجموعة Bescherelle)، المعجم الوسيط، المعجم الغني، معجم المحيط ولسان العرب. هذه هي إذن الروافد المهيكلة لقاموس آيسبل الذي اصبح ثاني قاموس حر متوفر على الشبكة، حر بمعنى خضوعه للرخصة العمومية الشاملة [GPL].</nowiki>
 
 
 
تطلب إنشاء القاموس بشقيه (ملف DIC وملف AFF) أكثر من 1500 ساعة عمل على مـدى قرابة سنتين من النشاط المتواصل (أبريل 2006 - يناير 2008) وتحليل آلاف المفردات من فعل واسم وأداة وحرف وتصنيفها وتوليدها حسب قواعد اللغة العربية النحوية والصرفية، ثم تحديد معناها لتمييز الفعل اللازم والمتعدي لعاقل أو غير عاقل والصفة العائدة على عاقل أو غير عاقل ومعرفة الشاذ منها والعادي. إجمالاً، تمت معالجة أكثر من 50.000 مفردة تتوزع على ما لا يقل عــــن 10.000 فعل عربي، 40.000 اسم وعشرات الحروف والأدوات النحوية وما استثني من هذا أو ذاك.
 
 
 
تجدر الإشارة إلى كون هذه النتيجة، حصلنا عليها باستثمار خصائص هانسبل Hunspell العادية فقط ولم نلجأ إلا لخاصية برمجية جديدة واحدة متمثلة في ([http://sourceforge.net/project/shownotes.php?release_id=494764&group_id=143754 Patch بهانسبل إصدارة 1.1.5]) '''<nowiki>[22]</nowiki>''' تحت وظيفة IGNORE لتجاهل الحركات والتطويل في النص العربي المعالج من خلال تحويل الأخ طه زروقي، الكود المتعلق بها المبرمج أصلاً في برنامج "دؤلي" (لغة بايتون Python) إلى برنامج هانسبل (++C). ما زالت هذه الخاصية في [http://sourceforge.net/tracker/?group_id=205373&atid=993378 حاجة للتعديل] '''<nowiki>[23]</nowiki>''' وإلى تحسين لأنها تأثر سلباً على نوعية الكلمات المقترحة في البديل الصحيح عندما تكون المفردة الخاطئة مشكولةً.
 
 
 
* '''المُـكَـوِّن الفـعلــي'''
 
   
 
مثلت معالجة الفعل العربي الشطر الأول من المشروع والجانب الأكثر استهلاكا للوقت واستدعت الوقوف على العشرات من المراجع اللغوية حيث يعتمد التدقيق الإملائي للفعل العربي للمشروع على مادة لغوية تحتوي على ما يفوق 10.000 فعل عربي وبعد إضافة الأشكال الخاصة بالإبدال/الإعلال والتضعيف/الإدغام وما يجري على الهمزة من تحولات، ارتفع عدد المفردات في قاموس آيسبل Ayaspell إلى ما يقارب 15.000 ( 14523 مفردة بالضبط).
 
مثلت معالجة الفعل العربي الشطر الأول من المشروع والجانب الأكثر استهلاكا للوقت واستدعت الوقوف على العشرات من المراجع اللغوية حيث يعتمد التدقيق الإملائي للفعل العربي للمشروع على مادة لغوية تحتوي على ما يفوق 10.000 فعل عربي وبعد إضافة الأشكال الخاصة بالإبدال/الإعلال والتضعيف/الإدغام وما يجري على الهمزة من تحولات، ارتفع عدد المفردات في قاموس آيسبل Ayaspell إلى ما يقارب 15.000 ( 14523 مفردة بالضبط).
 
   
 
بالنسبة للهيئات المتولدة بواسطة ملف الزيادات فإنها تغطي كل صيغ التصريف الممكنة في اللغة العربية ما عدا صيغ المؤكد وتتركب هذه الأفعال مع كل الزيادات السابقة الممكنة (سوابق Prefixes) وبأغلب الزيادات اللاحقة (لواحق Suffixes) باستثناء تلك المتعلقة بالتعدي لمفعولين.
 
بالنسبة للهيئات المتولدة بواسطة ملف الزيادات فإنها تغطي كل صيغ التصريف الممكنة في اللغة العربية ما عدا صيغ المؤكد وتتركب هذه الأفعال مع كل الزيادات السابقة الممكنة (سوابق Prefixes) وبأغلب الزيادات اللاحقة (لواحق Suffixes) باستثناء تلك المتعلقة بالتعدي لمفعولين.
 
   
 
من مميزات مدقق هانسبل Hunspell معتمدًا على قاموس آيسبل Ayaspell في الجزء الخاص بالأفعال مقارنة بالمدقق الإملائي للمجموعة المكتبية MsOffice:
 
من مميزات مدقق هانسبل Hunspell معتمدًا على قاموس آيسبل Ayaspell في الجزء الخاص بالأفعال مقارنة بالمدقق الإملائي للمجموعة المكتبية MsOffice:
   
   
* <nowiki>اعتماد تصريف أفعال القلوب: جزئيا [مدقق MsOffice: لا] فمثلاً نقول نظننا وتظنينك ولا يجوز قول نضربنا وتضربينك. </nowiki>
+
* اعتماد تصريف أفعال القلوب: جزئيا {مدقق MsOffice: لا} فمثلًا نقول نظننا وتظنينك ولا يجوز قول نضربنا وتضربينك.
* <nowiki>اعتماد التعدي إلى مفعولين: ليس بعد [مدقق MsOffice: لا] نحو يعطيكموها. </nowiki>
+
* اعتماد التعدي إلى مفعولين: ليس بعد {مدقق MsOffice: لا} نحو يعطيكموها.
* <nowiki>اعتماد الأفعال النادرة: نعم [مدقق MsOffice: لا] نحو ائتثر - أوجى.</nowiki>
+
* اعتماد الأفعال النادرة: نعم {مدقق MsOffice: لا} نحو ائتثر - أوجى.
* <nowiki>اعتماد كامل للمبني للمجهول: نعم [مدقق MsOffice: جزئيا] مثل شوددت من (شادَّ). </nowiki>
+
* اعتماد كامل للمبني للمجهول: نعم {مدقق MsOffice: جزئيا} مثل شوددت من (شادَّ).
* <nowiki>اعتماد الهيئات المتغيرة في صيغة الأمر للأفعال المهموزة والمضاعفة: نعم [مدقق MsOffice: لا] مثل "ايدب" و"فائدب" من أدب و"ود" و"ايدد" من ودّ. </nowiki>
+
* اعتماد الهيئات المتغيرة في صيغة الأمر للأفعال المهموزة والمضاعفة: نعم {مدقق MsOffice: لا} مثل "ايدب" و"فائدب" من أدب و"ود" و"ايدد" من ودّ.
* <nowiki>اعتماد سابقتين تتضمن همزة الاستفهام: نعم [مدقق MsOffice: لا] مثل أوتدري؟ أفتعلم؟ </nowiki>
+
* اعتماد سابقتين تتضمن همزة الاستفهام: نعم {مدقق MsOffice: لا} مثل أوتدري؟ أفتعلم؟
* <nowiki>اعتماد ثلاث سوابق: نعم [مدقق MsOffice: لا] نحو أفستكتبها؟ </nowiki>
+
* اعتماد ثلاث سوابق: نعم {مدقق MsOffice: لا} نحو أفستكتبها؟
* <nowiki>اعتماد صيغ التوكيد: ليس بعد [مدقق MsOffice: لا] نحو ليكتبنان. </nowiki>
+
* اعتماد صيغ التوكيد: ليس بعد {مدقق MsOffice: لا} نحو ليكتبنان.
* <nowiki>اعتماد التعدي النسبي للأفعال اللازمة: نعم [مدقق MsOffice: لا] نحو: وكم من انتصار انتصرناه بفضل جهاد شعوبنا...!!! ؛-) </nowiki>
+
* اعتماد التعدي النسبي للأفعال اللازمة: نعم {مدقق MsOffice: لا} نحو: وكم من انتصار انتصرناه بفضل جهاد شعوبنا...!!! ؛-)
   
   
* '''المُـكَـوِّن الاسمــي والحرفي '''
+
=== المُكَوِّن الاسمي والحرفي ===
   
 
بالإضافة للأسماء الجامدة والمصادر وصيغ النسبة المرتبطة بهما ، انكب المشروع على دراسة مشتقات الأفعال بأصنافها، اسم مفعول، اسم فاعل، مبالغة، أسماء التفضيل وصفات مشبهة. بعد نسخها من المعاجم المرجعية، تم تصنيفها وتوليد الهيئات الصرفية الممكنة منها (المؤنث، المثنى وجمع السالم) حسب القواعد النحوية للغة العربية المعروفة. مداخل القاموس تحتوي إذن على الكلمة في صيغة المفرد المذكر أو جمع التكسير واستثناءً على هيئة المفرد المؤنث أو جمع السالم.
 
بالإضافة للأسماء الجامدة والمصادر وصيغ النسبة المرتبطة بهما ، انكب المشروع على دراسة مشتقات الأفعال بأصنافها، اسم مفعول، اسم فاعل، مبالغة، أسماء التفضيل وصفات مشبهة. بعد نسخها من المعاجم المرجعية، تم تصنيفها وتوليد الهيئات الصرفية الممكنة منها (المؤنث، المثنى وجمع السالم) حسب القواعد النحوية للغة العربية المعروفة. مداخل القاموس تحتوي إذن على الكلمة في صيغة المفرد المذكر أو جمع التكسير واستثناءً على هيئة المفرد المؤنث أو جمع السالم.
   
  +
إجمالًا، نجد في القاموس : 10328 اسم-جامد، 13372 مصدر، 8406 اسم-الفاعل، 1807 اسم-مفعول، 2066 مبالغة-اسم-الفاعل، 1017 صفة-مشبهة، 378 اسم التفضيل، 862 اسم منسوب، بالإضافة إلى مفردات أخرى بعدد 4248 تتوزع بين الصفة والنسبة والاسم الجامد نسخت من معاجم مختلفة ومكانز ونصوص متنوعة. الحصيلة هي إذن: 42484 مفردة أما عدد الحروف والأدوات النحوية وما استثني من هيئات صرفية في قاموس آيسبل وصل إلى 611.
   
  +
من حيث التصريف، نجد في القاموس صيغًا لا تدعمها المدققات الإملائية المغلقة كصيغة الإضافة اللفظية (مثل: المقيمي الصلاة)، وكصيغ التعدي بحرف أو ظرف (مثل المذهوب بعقله أو المجلوس عليه) وصيغ كثيرة متعلفة بالسوابق مثل أوكاتبُ (أوكاتبون؟) أو وَلَكاتبُ (ولكاتبون) التي أهملتها المدققات الإملائية الأخرى لندرة استعمالها في الكتابات الحديثة على ما يبدو.
إجمالاً، نجد في القاموس : 10328 اسم-جامد، 13372 مصدر، 8406 اسم-الفاعل، 1807 اسم-مفعول، 2066 مبالغة-اسم-الفاعل، 1017 صفة-مشبهة، 378 اسم التفضيل، 862 اسم منسوب، بالإضافة إلى مفردات أخرى بعدد 4248 تتوزع بين الصفة والنسبة والاسم الجامد نسخت من معاجم مختلفة ومكانز ونصوص متنوعة. الحصيلة هي إذن: 42484 مفردة أما عدد الحروف والأدوات النحوية وما استثني من هيئات صرفية في قاموس آيسبل وصل إلى 611.
 
   
  +
تميزٌ آخر في قاموس آيسبل هو تعيين وتحديد تنوين النصب "صراحة" لتفادي الأخطاء المتعلقة بالممنوع من الصرف وتكيفًا مع تعود الكاتب العربي على رسم هذه الحركة بالرغم من إغفال حركات التشكيل في غالب الأحيان.
من حيث التصريف، نجد في القاموس صيغاً لا تدعمها المدققات الإملائية المغلقة كصيغة الإضافة اللفظية (مثل: المقيمي الصلاة)، وكصيغ التعدي بحرف أو ظرف (مثل المذهوب بعقله أو المجلوس عليه) وصيغ كثيرة متعلفة بالسوابق مثل أوكاتبُ (أوكاتبون؟) أو وَلَكاتبُ (ولكاتبون) التي أهملتها المدققات الإملائية الأخرى لندرة استعمالها في الكتابات الحديثة على ما يبدو.
 
   
  +
== مستقبل المشروع ==
تميزٌ آخر في قاموس آيسبل هو تعيين وتحديد تنوين النصب "صراحة" لتفادي الأخطاء المتعلقة بالممنوع من الصرف وتكيفاً مع تعود الكاتب العربي على رسم هذه الحركة بالرغم من إغفال حركات التشكيل في غالب الأحيان.
 
   
  +
من المظاهر السلبية في عمل المدقق الإملائي المعالج للنص العربي، البطء الكبير في اقتراح البديل الصحيح وضعف الدقة والحل المنتظر تجسيده في الإصدارات القادمة إن شاء الله، قصد تحسين فعالية المدقق الإملائي من حيث السرعة والنجاعة، هو إعادة بناء القاموس بالاقتصار على المستعمل من المفردات والتركيز على التصريف المتداول فعلًا في الكتابات الحديثة حسب المقاربة المبينة في الورقة الخاصة بها في مدونة المشروع والمعنونة "قاموس آيسبل بين "المستعمل والمهمل" في اللغة العربية <ref>http://ayaspell.blogspot.com/2007/09/blog-post.html</ref>. هذا من جهة، ومن جهة أخرى العمل على هيكلة القاموس بطريقة تتماشى مع [[المدقق النحوي العربي]] الذي بدأ الإخوة في عربآيز التفكير في برمجته ليعمل ضمن المجموعة المكتبية أوبن أوفس Openoffice.org.
   
'''مستقبــل المشــــروع '''
 
   
  +
== الجوائز ==
   
  +
* '''الجائزة الخاصة خلال الملتقى الإفريقي الثالث للبرامج الحرة''' (Prix spécial des troisième rencontres africaines du Logiciel Libre) ‏<ref>http://rall.logiciels-libres.org/rubrique.php3?id_rubrique=6</ref>
من المظاهر السلبية في عمل المدقق الإملائي المعالج للنص العربي، البطء الكبير في اقتراح البديل الصحيح وضعف الدقة والحل المنتظر تجسيده في الإصدارات القادمة إن شاء الله، قصد تحسين فعالية المدقق الإملائي من حيث السرعة والنجاعة، هو إعادة بناء القاموس بالاقتصار على المستعمل من المفردات والتركيز على التصريف المتداول فعلاً في الكتابات الحديثة حسب المقاربة المبينة في الورقة الخاصة بها في مدونة المشروع والمعنونة [http://ayaspell.blogspot.com/2007/09/blog-post.html ب][http://ayaspell.blogspot.com/2007/09/blog-post.html قاموس آيسبل بين "المستعمل والمهمل" في اللغة العربية] '''<nowiki>[24]</nowiki>'''. هذا من جهة، ومن جهة أخرى العمل على هيكلة القاموس بطريقة تتماشى مع [https://www.arabeyes.org/المدقق_النحوي_العربي المدقق النحوي العربي] '''<nowiki>[25]</nowiki>''' الذي بدأ الإخوة في عربآيز التفكير في برمجته ليعمل ضمن المجموعة المكتبية أوبن أوفس Openoffice.org.
 
   
  +
* '''مشروع السنة حسب الجمعية المغربية لتنمية الإعلاميات الحرة''' (Projet Open Source de l'année (2007), Site Linux-Maroc, Association ADIL) ‏<ref>http://81.192.48.26/linuxmaroc/modules.php?name=News&file=article&sid=143</ref>
   
  +
----
والله نسأل أن يجعل أعمالنا خالصة لوجهه،
 
  +
<div dir=ltr>
  +
{{references}}
  +
</div>
   
  +
'''البطاقة التقنية'''
والله وحده ولي التوفيق.
 
   
  +
*'''الإنجاز:''' '''القاموس العربي للتدقيق الإملائي Hunspell-ar'''
   
  +
*'''التنزيل:'''
<center>'''الروابط المذكورة حسب ترتيبها في التقرير لمن أراد التفاصيل:'''</center>
 
  +
http://sourceforge.net/project/showfiles.php?group_id=205373
   
  +
http://forge.aaul.net/projects/ayaspell/
  +
*'''المواقع:'''
  +
http://ayaspell.sourceforge.net/
   
  +
http://ayaspell.sourceforge.net/ar.html
[http://en.wikipedia.org/wiki/Spellchecker [1] http://en.wikipedia.org/wiki/Spellchecker]
 
   
  +
*'''القائمة البريدية:'''
[http://www.ameinfo.com/ar-69687.html [2] http://www.ameinfo.com/ar-69687.html]
 
  +
http://groups.google.com/group/ayaspell-dic
   
  +
*'''المدونة:'''
[http://www.arabeyes.org/ [3] http://www.arabeyes.org/]
 
  +
http://ayaspell.blogspot.com/
   
[http://www.arabeyes.org/project.php?proj=Duali [4] http://www.arabeyes.org/project.php?proj=Duali]
 
   
  +
----
[http://home.foolab.org/cgi-bin/viewcvs.cgi/projects/baghdad/ [5] http://home.foolab.org/cgi-bin/viewcvs.cgi/projects/baghdad/]
 
 
[http://hunspell.sourceforge.net/ [6] http://hunspell.sourceforge.net/]
 
 
[http://www.openoffice.org/ [7] http://www.openoffice.org/]
 
 
[http://aspell.sourceforge.net/ [8] http://aspell.sourceforge.net/]
 
 
[http://www.qamus.org/ [9] http://www.qamus.org/]
 
 
[http://sourceforge.net/projects/arabic-spell/ [10] http://sourceforge.net/projects/arabic-spell/]
 
 
[http://www.google.com/intl/en/about.html [11] http://www.google.com/intl/en/about.html]
 
 
[http://perso.menara.ma/~kebdani/ayaspell-dic/ [12] http://perso.menara.ma/~kebdani/ayaspell-dic/]
 
 
[http://ayaspell.sourceforge.net/ [13] http://ayaspell.sourceforge.net/]
 
 
[http://ayaspell.sourceforge.net/ar.html [14] http://ayaspell.sourceforge.net/ar.html]
 
 
[http://forge.aaul.net/projects/ayaspell/ [15] http://forge.aaul.net/projects/ayaspell/]
 
 
[http://groups.google.com/group/ayaspell-dic [16] http://groups.google.com/group/ayaspell-dic]
 
 
[http://ayaspell.blogspot.com/ [17] http://ayaspell.blogspot.com/]
 
 
[http://ayaspell.sourceforge.net/am.html [18] http://ayaspell.sourceforge.net/am.html]
 
 
[http://en.wikipedia.org/wiki/Thesaurus [19] http://en.wikipedia.org/wiki/Thesaurus]
 
 
[http://en.wikipedia.org/wiki/Grammar_checker [20] http://en.wikipedia.org/wiki/Grammar_checker]
 
 
[http://en.wikipedia.org/wiki/Embedded_system [21] http://en.wikipedia.org/wiki/Embedded_system]
 
 
[http://sourceforge.net/project/shownotes.php?release_id=494764&group_id=143754 [22] http://sourceforge.net/project/][http://sourceforge.net/project/shownotes.php?release_id=494764&group_id=143754 shownotes.php?release_id=494764&group_id=143754]
 
 
[http://sourceforge.net/tracker/?group_id=205373&atid=993378 [23] http://sourceforge.net/tracker/?group_id=205373&atid=993378]
 
   
[http://ayaspell.blogspot.com/2007/09/blog-post.html [24] http://ayaspell.blogspot.com/2007/09/blog-post.html]
 
   
  +
[[تصنيف: مشاريع]] [[تصنيف: مشاريع برمجية]]
[https://www.arabeyes.org/المدقق_النحوي_العربي [25] https://www.arabeyes.org/المدقق_النحوي_العربي]
 

نسخة 14:46، 8 يوليو 2014

إن أهمية المدققات الإملائية في مجال المعالجة الرقمية للغات الطبيعية من الأمور التي استرعت انتباه المهتمين بالحلول المكتبية منذ البدايات الأولى للإعلاميات، مما حفز الشركات على العمل على إنتاج هذه الأدوات والمعينات المعلوماتية - ذات المصدر المغلق في أغلبها - بوظائف متطورة أكثر فأكثر، تلبي حاجة مستعملي الحاسوب في المجال المكتبي بشكل خاص وتغني خدمات موزّعي البرامج المعلوماتية التي تدفع الملايين من أجل الحصول عليها (يناهز ثمن المدقق الإملائي العربي المليون دولار أمريكي في السوق العالمية لسنة 2006[1]).

على صعيد البرامج الحرة وإلى حدود 2006، لم يكن هناك أي مدقق إملائي عربي حر وظيفي، رغم تعدد المحاولات العربية المرتبطة بطريقة مباشرة أو غير مباشرة بمؤسسة عربآيز أهمها محاولتي الأخوين محمد الزبير ببرنامج "دؤلي" ومحمد سمير ببرنامج " بغداد". تأخر الحصول على دعم لغة الضاد في البرامج الحرة بشكل عام وافتقادها لمدقق إملائي بشكل خاص يرجع أساسًا إلى تميزها بخصائص برمجية ولغوية معقدة نسبيًا، ندرة الكفاءة المختصة وضعف الاهتمام بالبرامج الحرة في المنطقة شعبيًا واقتصاديًا وجامعيًا. في آخر المطاف جاء الحل عبر بوابة البرامج الحرة بالتأكيد: برنامج التدقيق الإملائي هانسبل Hunspell المعتمد من قبل مشروع الديوان المفتوح أوبن أفس OpenOffice.org ومن برنامج أسبل Aspell. البرنامجان مطوران أصلًا للغات اللاتينية ولكن بعد إضافة خاصية اليونيكود ودعم ثنائية الاتجاه إليهما أصبحا مؤهلين لدعم اللغات غير اللاتينية من ضمنها اللغة العربية.

بعد حصول دعم اللغة العربية في هذين البرنامجين - هانسبل وأسبل - ظهر للمهتمين بالشأن المعلوماتي الحر، تحدي آخر هو توفير القواميس العربية الخاصة بالتدقيق الإملائي والتي بدونها لن تؤدى هذه البرامج وظيفتها. لم يكن في الساحة إلاّ قاموسًا عربيًا واحدًا حرًّا هو قاموس تيم بوكولتر [2] Tim Buckwalter المعتمد في بنائه على مكنز لغوي مكون من مادة صحفية أساسًا. للأسف، كان الباحث المطور تيم بوكولتر جاهلا للغة العربية وكانت المادة الصحفية المرجعية غير مدققة لغويًا، فترتّب عن ذلك احتواء القاموس على مفردات خاطئة في نسبة كبيرة منها رسمًا ولغةً مما أثر سلبًا على المدققات الإملائية المعتمدة عليه، وجعلها لا ترقى إلى المستوى المنتظر منها وهذا مثل المدقق أربيك-سبل [3]، منتوج شركة غوغل Google، الذي يعطي نتائج جد رديئة، تدفع المستعمل إلى الاستغناء عنه منذ الوهلة الأولى.

أمام هذا الوضع، كان ولا بدّ من الاعتماد على قدراتنا الذاتية، واستثمار معرفتنا بلغة الضاد فأهل مكة أدرى بشعابها: أولًا تكييف المدقق الإملائي مع عادة المستعمل تجاهل الحركات في كتاباته باللغة العربية ثم بناء قاموس عربي حر مناسب. من أجل بلوغ هذين الهدفين تمّ تأسيس مشروع بمواصفات مهنية حديثة تجمع كل شروط النجاح: موقع إنترنت [4] في نسخة أولى مؤقتة باللغة العربية ثم تلاه آخر رسمي بالإنجليزية [5] و العربية [6] ثم الفرنسية [7] حيث يجد المهتم آخر الأخبار ويستطيع تحميل الملفات ويطّلع على الوثائق اللغوية ويكون على علم بالمنجزات و قائمة بريدية [8] حيث تناقش الاختيارات وتوضع الاقتراحات وتوضح الحلول التقنية وأخيرًا مدونة [9] حيث المقالات التي تنظر للمشروع ونصوص تفسر المقاربات وتشرح المنهجيات. كان الرهان هو تحقيق نتيجة بمستوى لا يقل قيمة عما يتداوله المستعملون لهذا الصنف من الأدوات المكتبية على الأنظمة المنغلقة وهكذا تمّ إنشاء القاموس العربي الحر للتدقيق الإملائي المفتوح Hunspell-ar أول منتوج مشروع آيسبل.

يدخل المدقق الإملائي هذا، في حقيقة الأمر، ضمن مشروع شامل، هو مشروع آيسبل Ayaspell project ، الذي يهدف توفير أدوات المعالجة الآلية للغة العربية (و اللغة الأمازيغية [10] مستقبلًا إن شاء الله) في بيئة البرامج الحرة، بالإضافة للمدقق الإملائي، أدوات الترادف المعجمي Thesaurus، التدقيق النحوي Grammar-checker وقواميس الأنظمة المحمولة Embedded systems مثل الهواتف المحمولة وأجهزة PDA.

الخصائص الأساسية للقاموس

استدعى غياب قاموس عربي حر، بناء واحد يلبي شروط التدقيق الإملائي بالاعتماد على المعاجم اللغوية العربية المتداولة التراثية والحديثة. من هذه المعاجم معجم تصريف الأفعال العربية (مجموعة Bescherelle)، المعجم الوسيط، المعجم الغني، معجم المحيط ولسان العرب. هذه هي إذن الروافد المهيكلة لقاموس آيسبل الذي اصبح ثاني قاموس حر متوفر على الشبكة، حر بمعنى خضوعه للرخصة العمومية الشاملة GPL.

تطلب إنشاء القاموس بشقيه (ملف DIC وملف AFF) أكثر من 1500 ساعة عمل على مدى قرابة سنتين من النشاط المتواصل (أبريل 2006 - يناير 2008) وتحليل آلاف المفردات من فعل واسم وأداة وحرف وتصنيفها وتوليدها حسب قواعد اللغة العربية النحوية والصرفية، ثم تحديد معناها لتمييز الفعل اللازم والمتعدي لعاقل أو غير عاقل والصفة العائدة على عاقل أو غير عاقل ومعرفة الشاذ منها والعادي. إجمالًا، تمت معالجة أكثر من 50.000 مفردة تتوزع على ما لا يقل عن 10.000 فعل عربي، 40.000 اسم وعشرات الحروف والأدوات النحوية وما استثني من هذا أو ذاك.

تجدر الإشارة إلى كون هذه النتيجة، حصلنا عليها باستثمار خصائص هانسبل Hunspell العادية فقط ولم نلجأ إلا لخاصية برمجية جديدة واحدة متمثلة في (بهانسبل إصدارة 1.1.5 [11]) تحت وظيفة IGNORE لتجاهل الحركات والتطويل في النص العربي المعالج من خلال تحويل الأخ طه زروقي، الكود المتعلق بها المبرمج أصلًا في برنامج "دؤلي" (لغة بايتون Python) إلى برنامج هانسبل (++C). ما زالت هذه الخاصية في حاجة للتعديل [12] وإلى تحسين لأنها تأثر سلبًا على نوعية الكلمات المقترحة في البديل الصحيح عندما تكون المفردة الخاطئة مشكولةً.

المُكَوِّن الفعلي

مثلت معالجة الفعل العربي الشطر الأول من المشروع والجانب الأكثر استهلاكا للوقت واستدعت الوقوف على العشرات من المراجع اللغوية حيث يعتمد التدقيق الإملائي للفعل العربي للمشروع على مادة لغوية تحتوي على ما يفوق 10.000 فعل عربي وبعد إضافة الأشكال الخاصة بالإبدال/الإعلال والتضعيف/الإدغام وما يجري على الهمزة من تحولات، ارتفع عدد المفردات في قاموس آيسبل Ayaspell إلى ما يقارب 15.000 ( 14523 مفردة بالضبط).

بالنسبة للهيئات المتولدة بواسطة ملف الزيادات فإنها تغطي كل صيغ التصريف الممكنة في اللغة العربية ما عدا صيغ المؤكد وتتركب هذه الأفعال مع كل الزيادات السابقة الممكنة (سوابق Prefixes) وبأغلب الزيادات اللاحقة (لواحق Suffixes) باستثناء تلك المتعلقة بالتعدي لمفعولين.

من مميزات مدقق هانسبل Hunspell معتمدًا على قاموس آيسبل Ayaspell في الجزء الخاص بالأفعال مقارنة بالمدقق الإملائي للمجموعة المكتبية MsOffice:


  • اعتماد تصريف أفعال القلوب: جزئيا {مدقق MsOffice: لا} فمثلًا نقول نظننا وتظنينك ولا يجوز قول نضربنا وتضربينك.
  • اعتماد التعدي إلى مفعولين: ليس بعد {مدقق MsOffice: لا} نحو يعطيكموها.
  • اعتماد الأفعال النادرة: نعم {مدقق MsOffice: لا} نحو ائتثر - أوجى.
  • اعتماد كامل للمبني للمجهول: نعم {مدقق MsOffice: جزئيا} مثل شوددت من (شادَّ).
  • اعتماد الهيئات المتغيرة في صيغة الأمر للأفعال المهموزة والمضاعفة: نعم {مدقق MsOffice: لا} مثل "ايدب" و"فائدب" من أدب و"ود" و"ايدد" من ودّ.
  • اعتماد سابقتين تتضمن همزة الاستفهام: نعم {مدقق MsOffice: لا} مثل أوتدري؟ أفتعلم؟
  • اعتماد ثلاث سوابق: نعم {مدقق MsOffice: لا} نحو أفستكتبها؟
  • اعتماد صيغ التوكيد: ليس بعد {مدقق MsOffice: لا} نحو ليكتبنان.
  • اعتماد التعدي النسبي للأفعال اللازمة: نعم {مدقق MsOffice: لا} نحو: وكم من انتصار انتصرناه بفضل جهاد شعوبنا...!!! ؛-)


المُكَوِّن الاسمي والحرفي

بالإضافة للأسماء الجامدة والمصادر وصيغ النسبة المرتبطة بهما ، انكب المشروع على دراسة مشتقات الأفعال بأصنافها، اسم مفعول، اسم فاعل، مبالغة، أسماء التفضيل وصفات مشبهة. بعد نسخها من المعاجم المرجعية، تم تصنيفها وتوليد الهيئات الصرفية الممكنة منها (المؤنث، المثنى وجمع السالم) حسب القواعد النحوية للغة العربية المعروفة. مداخل القاموس تحتوي إذن على الكلمة في صيغة المفرد المذكر أو جمع التكسير واستثناءً على هيئة المفرد المؤنث أو جمع السالم.

إجمالًا، نجد في القاموس : 10328 اسم-جامد، 13372 مصدر، 8406 اسم-الفاعل، 1807 اسم-مفعول، 2066 مبالغة-اسم-الفاعل، 1017 صفة-مشبهة، 378 اسم التفضيل، 862 اسم منسوب، بالإضافة إلى مفردات أخرى بعدد 4248 تتوزع بين الصفة والنسبة والاسم الجامد نسخت من معاجم مختلفة ومكانز ونصوص متنوعة. الحصيلة هي إذن: 42484 مفردة أما عدد الحروف والأدوات النحوية وما استثني من هيئات صرفية في قاموس آيسبل وصل إلى 611.

من حيث التصريف، نجد في القاموس صيغًا لا تدعمها المدققات الإملائية المغلقة كصيغة الإضافة اللفظية (مثل: المقيمي الصلاة)، وكصيغ التعدي بحرف أو ظرف (مثل المذهوب بعقله أو المجلوس عليه) وصيغ كثيرة متعلفة بالسوابق مثل أوكاتبُ (أوكاتبون؟) أو وَلَكاتبُ (ولكاتبون) التي أهملتها المدققات الإملائية الأخرى لندرة استعمالها في الكتابات الحديثة على ما يبدو.

تميزٌ آخر في قاموس آيسبل هو تعيين وتحديد تنوين النصب "صراحة" لتفادي الأخطاء المتعلقة بالممنوع من الصرف وتكيفًا مع تعود الكاتب العربي على رسم هذه الحركة بالرغم من إغفال حركات التشكيل في غالب الأحيان.

مستقبل المشروع

من المظاهر السلبية في عمل المدقق الإملائي المعالج للنص العربي، البطء الكبير في اقتراح البديل الصحيح وضعف الدقة والحل المنتظر تجسيده في الإصدارات القادمة إن شاء الله، قصد تحسين فعالية المدقق الإملائي من حيث السرعة والنجاعة، هو إعادة بناء القاموس بالاقتصار على المستعمل من المفردات والتركيز على التصريف المتداول فعلًا في الكتابات الحديثة حسب المقاربة المبينة في الورقة الخاصة بها في مدونة المشروع والمعنونة "قاموس آيسبل بين "المستعمل والمهمل" في اللغة العربية [13]. هذا من جهة، ومن جهة أخرى العمل على هيكلة القاموس بطريقة تتماشى مع المدقق النحوي العربي الذي بدأ الإخوة في عربآيز التفكير في برمجته ليعمل ضمن المجموعة المكتبية أوبن أوفس Openoffice.org.


الجوائز

  • الجائزة الخاصة خلال الملتقى الإفريقي الثالث للبرامج الحرة (Prix spécial des troisième rencontres africaines du Logiciel Libre) ‏[14]
  • مشروع السنة حسب الجمعية المغربية لتنمية الإعلاميات الحرة (Projet Open Source de l'année (2007), Site Linux-Maroc, Association ADIL) ‏[15]

البطاقة التقنية

  • الإنجاز: القاموس العربي للتدقيق الإملائي Hunspell-ar
  • التنزيل:

http://sourceforge.net/project/showfiles.php?group_id=205373

http://forge.aaul.net/projects/ayaspell/

  • المواقع:

http://ayaspell.sourceforge.net/

http://ayaspell.sourceforge.net/ar.html

  • القائمة البريدية:

http://groups.google.com/group/ayaspell-dic

  • المدونة:

http://ayaspell.blogspot.com/