گامی در راه رسیدن به شبکههای عصبی عمیق تمامنوری: بهکارگیری واحد غیر خطی نوری
محورهای موضوعی : مهندسی برق و کامپیوترآیدا ابراهیمی دهقان پور 1 , سمیه کوهی 2
1 - دانشگاه صنعتی شریف،دانشكده مهندسي كامپيوتر
2 - دانشگاه صنعتی شریف،دانشکده مهندسی کامپیوتر
کلید واژه: پردازش نوری, تابع فعالساز نوری, سرعت بالا, شبکه عصبی پیچشی, شبکه عصبی پیچشی نوری,
چکیده مقاله :
در سالهای اخیر، شبکههای عصبی نوری به علت سرعت بالا و توان مصرفی پایینی که دارند، بسیار مورد توجه قرار گرفتهاند. با این وجود، این شبکهها هنوز محدودیتهای زیادی دارند که یکی از این محدودیتها پیادهسازی لایه غیر خطی در آنهاست. در این نوشتار، پیادهسازی واحد غیر خطی برای شبکههای عصبی پیچشی نوری مورد بررسی قرار گرفته تا در نهایت با استفاده از این واحد غیر خطی بتوان به یک شبکه عصبی پیچشی تمامنوری عمیق با دقتی مشابه شبکههای الکتریکی، سرعت بالاتر و توان مصرفی کمتر رسید و بتوان قدمی در راستای کاهش محدودیتهای این شبکهها برداشت. در این راستا ابتدا روشهای مختلف پیادهسازی واحد غیر خطی مرور شدهاند. سپس به بررسی تأثیر استفاده از جاذب اشباعشونده به عنوان واحد غیر خطی در لایههای مختلف بر دقت شبکه پرداخته شده و نهایتاً روشی نوین و ساده برای جلوگیری از کاهش دقت شبکههای عصبی در صورت استفاده از این تابع فعالساز ارائه گردیده است.
In recent years, optical neural networks have received a lot of attention due to their high speed and low power consumption. However, these networks still have many limitations. One of these limitations is implementing their nonlinear layer. In this paper, the implementation of nonlinear unit for an optical convolutional neural network is investigated, so that using this nonlinear unit, we can realize an all-optical convolutional neural network with the same accuracy as the electrical networks, while providing higher speed and lower power consumption. In this regard, first of all, different methods of implementing optical nonlinear unit are reviewed. Then, the impact of utilizing saturable absorber, as the nonlinear unit in different layers of CNN, on the network’s accuracy is investigated, and finally, a new and simple method is proposed to preserve the accuracy of the optical neural networks utilizing saturable absorber as the nonlinear activating function.