روشي ساده براي بازشناسي برخط زير-كلمات فارسي
محورهای موضوعی : electrical and computer engineering
سیدمحمد رضوی
1
,
احساناله کبیر
2
1 - دانشگاه بيرجند
2 - دانشگاه تربیت مدرس
کلید واژه: بازشناسيدستنوشته برخطزير-كلمهنقاط و علائم بازشناسيدستنوشته برخطزير-كلمهنقاط و علائمكمترين فاصله,
چکیده مقاله :
در اين مقاله روشي براي بازشناسي برخط زير-كلمات فارسي ارائه ميشود. ابتدا نقاط و علائم زير-كلمه و مكان نسبي آنها تشخيص داده ميشود و با توجه به آن زيرمجموعة همعلامتها از مجموعة زير-كلمات فارسي انتخاب ميشود. اگر اين زيرمجموعه فقط يك عضو داشته باشد آن كلاس به زير-كلمه ناشناخته نسبت داده ميشود و گر نه بدنة زير-كلمه ناشناخته با بدنههاي زير-كلمات همعلامت مقايسه ميشود. زير-كلمهاي كه يكي از بدنههاي منتسب به آن با بدنه زير-كلمه ناشناخته كمترين فاصله را داشته باشد، به زير-كلمه ناشناخته نسبت داده ميشود. سيستم بازشناسي علاوه بر شبيه ترين زير-كلمه، حداكثر 9 زير-كلمة ديگر را نيز كه در رتبههاي بعدي از نظر فاصله با زير-كلمه ناشناخته قرار ميگيرند، پيشنهاد ميكند. روش پيشنهادي براي يك پايگاه داده شامل 11 نمونه از هر زير-كلمه با يك فرهنگ 1000 زير -كلمهاي، آزمايش شده است. ميزان بازشناسي درست با در نظر گرفتن اولين گزينه بازشناسي 95/74% و با درنظر گرفتن 10 گزينه اول بازشناسي 87/97% است.
In this paper, a method for online recognition of Farsi subwords is presented. First, the dots and other signs of the input subword and their relative locations are recognized and the related group to that subword is chosen. If there is only one member in that group, its class is assigned to the input subword, otherwise, the subword body is compared to those of the group members and the subword with minimum distance to the input subword is found. The recognition system also proposes a maximum of nine subwords in the next ranks. The proposed method was tested on a database of 11 samples of 1000 subwords from different writers. The correct recognition rate for the first choice was 74.95%. It reached to 97.87% for the top 10 choices.