আলোকভিত্তিক অক্ষর শনাক্তকরণ
আলোকভিত্তিক অক্ষর শনাক্তকরণ হাতে লেখা বা টাইপযন্ত্রে টাইপকৃত লেখার ছবিকে (সাধারণত স্ক্যানার দিয়ে স্ক্যান করা) কম্পিউটারে সম্পাদনাযোগ্য লেখায় অনূদিত করার যান্ত্রিক বা ইলেকট্রনিক পদ্ধতিকে বুঝায়। ইংরেজি ভাষায় এটিকে "অপটিক্যাল ক্যারেক্টার রিকগনিশন" (সংক্ষেপে "ওসিআর") নামে ডাকা হয়। কম্পিউটার বিজ্ঞানের যে শাখাগুলি আলোকভিত্তিক অক্ষর শনাক্তকরণের সাথে সম্পর্কিত সেগুলি হচ্ছে: বিন্যাস শনাক্তকরণ (প্যাটার্ন রিকগনিশন), কৃত্রিম বুদ্ধিমত্তা এবং যান্ত্রিক দর্শন (মেশিন ভিশন)।
বাংলা আলোকভিত্তিক অক্ষর শনাক্তকরণ
[সম্পাদনা]বাংলাতে গুগল টেসারাকটের আলোকভিত্তিক অক্ষর শনাক্তকরণ আছে সেটি আগে খুবই দুর্বল এবং ছাপা হরফের জন্য প্রযোজ্য ছিল। কিন্তু বর্তমানে গুগল ড্রাইভ ও গুগল ডক গুগল টেসারাকটের যে আলোকভিত্তিক অক্ষর শনাক্তকরণ প্রযুক্তি ব্যবহার করে তা বেশ উন্নত, ফলাফলও বেশ সঠিক। ২০০৭ সালে সি.আর.বি.এল.পি ল্যাব বাংলার জন্য এটি বানানোর একটি প্রচেষ্টা শুরু করে গুগলের সহায়তায়। এর পর বাংলাদেশ ও ভারতে অনেক বিশ্ববিদ্যালয় এবং গবেষণাগারে এটির গবেষণার কাজ এখনো চলছে।
বাংলা ভাষা হল জটিল ভাষা, এতে যুক্তাক্ষর এবং মাত্রার ব্যবহার আছে, বাংলার ন্যায় হিন্দিতেও এবং বিশ্বের আরও অনেক ভাষাতে যুক্তাক্ষর এবং জটিলতা আছে। তাই অনেক সময় কম্পিউটারের পক্ষে সেটিকে বুঝতে কঠিন হয়।
তথ্যসূত্র
[সম্পাদনা]বহিঃসংযোগ
[সম্পাদনা]- ICDAR ওয়েব্যাক মেশিনে আর্কাইভকৃত ১৩ জুলাই ২০০৯ তারিখে, a comprehensive conference on all aspects of document recognition
- Linux OCR: A review of free optical character recognition software