الاثنين، شتنبر 10، 2007

قاموس آيسبل بين "المستعمل والمهمل" في اللغة العربية


الخصائص البنيوية للغة العربية المتعلقة بالتدقيق الإملائي

  • الخاصيـــة الأولى: الطبيعة الاشتقاقية للغة العربية، وهذا يعني أن هناك مادة لغوية معينة مثل (كتب) يمكن تشكيلها على هيئات مختلفة، كل هيئة منها لها وزن خاص ولها وظيفة خاصة كأن نقول كاتب، مكتوب، مكتب، كتب، كتيب ...ألخ. عدد الجذور في العربية أقل بكثير من العدد الموجود في اللغة الإنجليزية ولكن بتوظيف خاصية الاشتقاق نحصل على مفردات تعد بالملايين بينما في اللغة الإنجليزية لا يتجاوز هذا العدد مآت الآلاف.

  • الخاصيـــة الثانية: الطبيعة الالتصاقية للغة العربية، حيث توجد مادة لغوية يمكن تشكيل صيغ منها عن طريق لصق زوائد في أول المادة أو في آخرها. وباعتبار السوابق واللواحق المعمول بها في اللغة العربية، يمكن للكاتب التعبير بالكلمة نفسها عن التذكير والتأنيث، الإفراد والتثنية والجمع، الاستفهام والنداء ... إلخ. كلمة « أسيعطيكموها؟ » تلخص بصفة جيدة هذه الميزة.

  • الخاصيـــة الثالثة: قلة عدد حروف الحركة (Vowels) في العربية (ا، و، ي) مقارنة باللغة الإنجليزية (a, e, i, o, u, y, w) أو باللغة الفرنسية (,é, è, à, ù, û, ê, â, a, e, i, o, u, y, w)، والاعتماد الأساسي على التشكيل (الكسر، الفتح، الضم وتنونها) لضبط المعنى وتفادي الالتباس. حركات يهملها عادة المستخدم العربي في كتاباته [1].

  • الخاصيـــة الرابعة: الشدّة، على غرار حركات التشكيل الأساسية، يغفل الكاتب عمومًا الترميز للتضعيف بالشدة التي تعني تكرار الحرف في الكلمة العرية: قَدِمَ، قَدَّمَ.

  • الخاصيـــة الخامسة: تعوّد الكاتب العربي في بعض الأقطار مثل مصر على الخلط بين الألف والياء المتطرفة وتفشي عادة استعمال الأحرف مركبة لام-ألف (ﻻ، ﻵ، ﻷ، ﻹ) التي لا محل لها من الإعراب في عصر الحاسوب والتي يعود اصلها إلى إلزامات وإكراهات تقنية مرتبطة بالآلة الكاتبة قي بداية القرن الماضي ومن الصعب التخلص من هذه الرواسب التاريخية نظراً لاستمرار العمل بلوحة المفاتيح الموروثة عن الآلة الراقنة.

علاقة هذه الخصائص اللغوية بعمل المدقق في اكتشاف الخطأ واقتراح البديل الصحيح.

صعوبة اكتشاف الخطأ:
هذا المشكل مشترك بين كل اللغات لأن المدقق يتعامل مع المفردة في معزل عن جوارها و في غياب اعتبار المدقق للسياق الذي تأتي فيه المفردة، تبقى فائدة المدقق الإملائي جد محدودة من الناحية الدلالية، كما أن تعوّد الكاتب العربي على تجاهل التشكيل، لا يزيد الطينة إلاّ بلة لان النتيجة الحتمية هي تشابه المفردات فيما بينها بالرغم مع اختلاف معانيها. مثال: : ك، ت، ب قد تعني كَتَبَ ( الفعل الماضي) وقد تعني كُتُب (جمع كتاب)[1].

صعوبة اقتراح البديل الصحيح:
من عواقب هذه الخصائص اللغوية في مرحلة التصحيح الأساسية، التي يقترح المدقق المفردات البديلة بإضافة حرف أو حذفه أو باستبداله بآخر أو بتقسيم الكلمة الخطأ إلى كلمتين، ارتفاع عدد المفردات المرشحة للتصحيح وبيّنت المقارنة باللغات الأخرى أن العدد المتوسط للكلمات المقترحة هو 3 في اللغة الإنجليزية و 3,5 في الفرنسية و26,5 بالنسبة لمفردات اللغة العرية غير المشكولة [2].


والحالة هذه، كيف السبيل إلى تحسين مردودية المدقق الإملائي والرفع من فعاليته وفائدته؟
.

من بين الحلول الممكنة لتحسين فعالية المدقق الإملائي ضرورة مراعاة السياق الذي ترد فيه المفردة الخطأ : مقارنة المفردة الخاطئة بالمفردات المجاورة وبمفردات النص إجمالاً. هذه النوع من الحلول يدخل ضمن المدققات النحوية، لكن للأسف ما زالت البرامج المكتبية الحرة غير متوفرة على هذا النوع المهم من الأدوات اللغوية!

في عنوان المقالة "المستعمل والمهمل"، يكمن الحل الثاني. اقتبست هذا العنوان من مقال للمفكر المغربي محمد عابد الجابري يحلل فيه مشكل بناء القواميس العربية. يقول الكاتب « وأنا اعتقد أن مبدأ التمييز بين "المستعمل" و"المهمل" صالح للتطبيق(...) كوسيلة لـ "صنع" اللغة العربية المبسطة المطلوبة، وذلك على عدة مستويات، أولها مستوى المعاجم نفسها». يرى المفكر اختيار المفردات والتراكيب المستعملة بكثرة في مختلف مرافق الحياة والاقتصار على الأنماط والبنيات اللغوية الشائعة والضرورية للفهم والتعبير مثل لغة الصحافة والإذاعة والقصة والمقالة والنصوص العلمية.[3]

وعند التساؤل حول المعيار التطبيقي لاختيار هذه البنيات الغوية، نجد الإجابة في المنهجية التي وظفها محررو معجم « المنجد في اللغة العربية المعاصرة ».لقد تم جرد المفردات المنشودة في مرحلة أولى بالبحث في المادة اللغوية العربية عن تلك التي تقابل في معناها الحقيقي أو المجازي ما ورد في المعاجم الفرنسية والإنجليزية المعمول بها حديثاً ثم اضيفت في مرحلة ثانية المفردات التي جاءت في المعاجم العربية الحديثة التي ليس لها مثيل في اللغتين الفرنسية والإنجليزية.
بالاقتصار على التصريفات المستعملة فعلا في كتاباتنا الحديثة وبالتركيز على المفردات الملبية للمعيار أعلاه، يمكن للمدقق ان يعطي نتيجة تلبي حاجيات المستخدم العربي في القرن الواحد والعشرين كما أن سرعة المدقق ستتحسن بشكل ملموس وتكون قائمة المفردات البديلة المقترحة دقيقة ومركزة.

هذه هي إذن المنهجية التي ستعتمد لإعادة بناء قاموس آيسبل للتدقيق الإملائي في المرحلة المقبلة. قاموس، أتمنى أن يستفيد منه المستخدم العربي الذي اختار استعمال البرامج الحرة على غرار ما يجده المستخدم الذي يفضل الحلول المعلوماتية المملوكة...

والله نسأل أن يجعل أعمالنا خالصة لوجهه،
والله وحده ولي التوفيق.

محمد كبداني


[1] http://www.majma.org.jo/G05/06/04/19_files/المحاضرة%20الثانية.doc
[2] http://www.aljabriabed.net/tajdid3.htm
[3] http://www.sciences.univ-nantes.fr/info/recherche/taln2003/articles/zribi.pdf

هناك 6 تعليقات:

فوضى عارمة يقول...

حياكم الله و بارك فيكم و باعمالكم

Msoms يقول...

جميل أن نجد الحريصين على الحفاظ على تراث اللغة العربية بين هذا الزخم الهائل مما يساعد على فقدانها وضعف الكثير من أصحابها لغوياً وعلمياً ..

نشكركم كثيراً على هذه الخطوة السديدة

بحفظ الله دمتم

Aziz Oraij يقول...

بارك الله فيك..
نرجو إثراء المحافل الدولية التي تختص بالمحتوى العربي، والتي آخرها

مشروع المحتوى العربي المفتوح


http://wa2elblog.wordpress.com/2009/01/22/aoc/

غير معرف يقول...

Your blog keeps getting better and better! Your older articles are not as good as newer ones you have a lot more creativity and originality now keep it up!

B a s H e e R يقول...

السلام عليكم
كل الشكر على جهودكم الرائعة
هل هناك أي مدقق يمكن إضافته على انترنت اكسبلورر؟

كل الشكر على تجاوبكم

غير معرف يقول...

جهود رائعة ولكنكم أخفقتم في أمور:
1- لم تتقيدوا بالرسم الإملائي الاصطلاحي، فمثلاً الرحمن لا تكتب الرحمان.
2- كثير من كلمات القرآن لا يقبلها مشروعكم، وهذا خلل كبير.
3- أسماء الأعلام أيضا كثير منها لا يقبلها مشروعكم

نرجو لكم التوفيق، ومع ما ذكر من العيوب لكن مدققكم أفضل بكثير من مدقق مايكروسوفت أوفيس