السبت، 18 أكتوبر 2008

ocr


السلام عليكم

بما انه اني الان في صدد مشروع ارشفة الكترونية احببت ان اكتب اليكم

هذا الموضوع المتعلق بركن مهم من اركان الارشفة الالكترونية

الا وهي
Optical Character recognition
يرمز لها اختصارا ocr

اي التعرف الضوئي للحروف

وتاتي هذه الخدمة غاليا مع البرامج المرفقة بالسكنر الماسح الضوئي

ووضيفته يقوم بتحويل الوثيقة الورقية الى" وثيقة رقمية" قابلة للحياه... يعني

السكنر المعروف عن عمله هو سحب المدخلات اليه الى الحاسوب بصيغة صور

يعني اكدر اجيب الصورة الفوتوغرافية واحولها الى صورة رقمية

واقوم بالتعديلات عليها ببرامج

تحرير الصور كالفوتوشوب مثلا ....

لكن ما ذا عن الوثائق .... ان سحب الوثيقة بهيئة صورة سوف يحولها الى الحاسب

وكانها صورة يمكن تحريرها كصورة فقط

لكن ماذا عن محتوياتها من كتابات هل من المنطقي ان ادخل

وثيقة كتابيه الى برامج تحرير صور

طبعا لا .......من هنا ظهرت الحاجة الى الخدمة

التي تستطيع تحويل الوثائق الى خامات قابلة للتعديل

ببرامج تحرير النصوص كبرنامج محرر النصوص مايكروسوفت ورد مثلا

وبِشكل أدق هو ترجمة صورة الحرف إلى الترميز المحدد له (ASCII, Unicode)

وتسمى هذه العملية بعملية الرقمنة او ال digitization

في السابق كانت البرامج التي تقوم بهذا العمل تدرب باستخدام تقنيات الذكاء الصناعي

وتعمل على فونت أو اثنين بتلقيمها الشكل الرئيسي للحرف

أما الأنظمة الحديثة فتستطيع تمييز فونات كثيرة وبدقة عالية، وبعض البرامج تستطيع

تحويل ورقة من مجلة أجنبية مثلاً إلى نص قابل للتحرير مع الحفاظ على نوع الخط

وترتيب الورقة وأماكن الصور وكأن شيئاً لم يحصل سوى أنها دبت الحياة بصورة الورقة
ظهرت برامج عديدة منها OmniPage ومنها فاين ريدر وهناك برنامج من شركة

صخر لااعرفه صراحة وهل يلبي دعمه للغة العربية

لكن جميع هذه البرامج فاشلة ؟؟؟؟؟؟

في ماذا طبعا مامعقولة هاي الشركات فاشلة لكن فشلها مقصود

لانها جميعها لاتهتم باللغة العربية

لانه مع الاسف اللغة العربية اخر ماتهتم به هذه الشركات

فنجد هذه البرامج فعالة مع اللغات الاخرى

وتمكنك من اعادة تحرير الوثيقة المسحوبة بالماسح الضوئي السكنر


اقتباس
OmniPage: وهو برنامج OCR يميز كل لغات العالم إلا اللغة العربية والعبرية
وتقوم الشركة المنتجة له باستطلاع رأي لإدراج اللغة العربية على النسخة القادمة 16


اقتباس
Microsoft Office Document Imaging: طبعاً من سياسة
مايكروسوفت بحشر أنفها تقنياً بكل ما لايعنيها من برامج فقد أدرجت هذه الميزة على
نسخ Office الجديدة فهي موجودة بنسخة 2002 و

2003 ولكنها قاصرة بالتمييزولا تملك أدوات للغة العربية

بعد وبعد بحث وجدت البرنامج التالي

Readiris Pro 11 Mr.Underground Edition

بعد تجربته الصراحة يقدم دعم بنسبة لاتقل عن 80% للغة العربية

للنسخة الورقية النظيفة

يعني المهم يسحبلك الوثيقة بوجود بعض الاخطاء ببعض الاحرف

تستطيع تعد يلها خاصة باستخدام خاصية الاستبدال الي يوفرها مايكروسوفت ورد

مع تحياتي

LORD OF THE RINGS
Supervisor-General and Director of electronic forums
http://www.3yoonalbasrah.net/
لمناقشة الموضوع بشكل اكبر يمكنكم زيارته على الرابط التالي
http://www.3yoonalbasrah.net/forums/showthread.php?t=6908