ارائه یک روش مبتنی بر گرادیان و کرنلهای شبکه عصبی عمیق بهمنظور تولید تصاویر بافتی
محورهای موضوعی : مهندسی برق و کامپیوتر
1 - دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر، دانشگاه اراک، اراک، ایران،
کلید واژه: تولید تصویر, تولید داده, گرادیان صعودی, شبکه عصبی کانولوشن. ,
چکیده مقاله :
تولید پایگاههای داده تصاویر یکی از ضروریات بینایی ماشین به شمار میرود. روشهای مختلفی مثل چرخش، تغییر روشنایی و زاویه دید، تغییر اندازه و ... برای افزایش دادههای تصویری وجود دارد. عیب این روشها آن است که تصاویر تولیدشده خیلی شبیه به تصاویر اولیه است و برای جلوگیری از بیشبرازش کفایت نمیکند. شبکههای مواد تخاصمی هم از همین مشکل برخوردار است. از بین همه انواع تصاویر، تصاویر بافتی چالشهای بیشتری دارند؛ چون تصاویر بافتی را نمیتوان مانند تصاویر معمولی با دوربین تصویربرداری تهیه کرد، زیرا بافت بهراحتی در همه جا در دسترس نیست و هر نوع تصویری دارای بافت نیست. امروزه شبکههای عصبی عمیق به دادههای حجیم برای آموزش نیاز دارند و در حال حاضر داده حجیم بافتی وجود ندارد. با استفاده از روش پیشنهادی میتوان مجموعه دادههای بافتی حجیم تهیه کرد. در این مقاله با استفاده از ضرایب کانولوشن شبکههای عمیق پیشآموزشدادهشده بافت جدید تولید میشود. در این روش با اعمال گرادیان صعودی به تصاویر حاصل از فیلترهای کانولوشن، تصاویر بافتی جدید به طور مصنوعی تولید میشود. تفاوت این روش با روشهای مولد آن است که این روش نیاز به تصاویر اولیه ندارد، بلکه در اینجا کلاس جدید بافتی تولید میگردد. پس از تولید بافت جدید، با روشهای پردازش تصویر تعداد آن افزایش داده میشود. این روش بین 3 تا 5 برابر سریعتر از چند شبکه مولد مشهور است. کیفیت تصاویر هم خیلی بهتر است. یک نمونه پایگاه داده بافتی تولید شده که شامل 2400 تصویر در 80 کلاس میباشد و در سایت Kaggle بارگذاری شده است.
Production of image databases is one of the necessities of machine vision. There are various methods such as rotating, changing the viewing angle, resizing, etc., to increase the image data. The disadvantage of these methods is that the generated images are very similar to the original images and it is not enough to prevent overfitting. Among all types of images, texture images have more challenges. In this research, a new texture is generated using the convolution coefficients of pre-trained deep networks. In this method, new textured images are artificially produced by applying an ascending gradient to the images resulting from convolution filters. The difference between this method and the generative methods is that there is no initial texture image to increase, but here a new class of texture image is generated from the coefficients of the pre-trained deep network. After the new texture is produced, its number is increased by image processing methods. This method is between 3 and 5 times faster than some well-known generator networks. The quality of the images is much better. With this method, a texture database example has been produced, which includes 2400 images in 80 classes, and has been uploaded to the Kaggle site.