تشخیص دستگاه قطعه های موسیقی سنتی ایرانی بر مبنای استخراج توالی نتها و استفاده از شبکههای LSTM
محورهای موضوعی : electrical and computer engineeringسینا غضنفری پور 1 , مرتضی خادمی 2 , عباس ابراهیمی مقدم 3
1 - دانشگاه فردوسي مشهد،دانشكده مهندسي برق و كامپيوتر
2 - دانشگاه فردوسی مشهد،دانشكده مهندسي
3 - دانشگاه فردوسی مشهد،دانشكده مهندسي
کلید واژه: تشخیص دستگاه موسیقی, توالی نت, دستهبندی سلسلهمراتبی, یادگیری عمیق, LSTM,
چکیده مقاله :
دستهبندی دستگاه قطعات موسیقی سنتی ایرانی توسط کامپیوتر برای علاقهمندان موسیقی دستگاهی ایرانی، موضوعی بسیار جالب ولی پیچیده و چالشبرانگیز است. این مسئله اولاً به دلیل کاربردهای فراوان آن در زمینههایی مانند آهنگسازی و آموزش موسیقی و ثانیاً به خاطر نیاز افراد عادی به کامپیوتر برای تشخیص دستگاه از اهمیت بالایی برخوردار است. در این مقاله روشی برای تشخیص دستگاه و زیردستگاه یک قطعه موسیقی ایرانی بر پایه استخراج نتهای متوالی، دستهبندی سلسلهمراتبی و استفاده از شبکههای LSTM ارائه شده است. در این روش، قطعه موسیقی در مرحله اول به یکی از سه دسته کلی، دستهبندی میشود. دسته اول صرفاً شامل دستگاه ماهور، دسته دوم شامل دستگاههای شور و نوا و دسته سوم شامل دستگاههای همایون، سهگاه و چهارگاه است. سپس برای هر دسته بسته به نوع آن، تعداد متفاوت دستهبندهای دیگر اعمال میشود تا این که یکی از 6 دستگاه و یکی از 11 زیردستگاه موسیقی سنتی ایرانی مشخص گردد. این تحقیق به هیچ سبک نوازندگی و ساز خاصی محدود نشده و تحت تأثیر سرعت و تکنیکهای نوازندگی قرار نمیگیرد. قطعات برچسبگذاری شده در پایگاه داده "اَرگ" که برای این تحقیق به وجود آمده است، به صورت تکنوازی هستند؛ اگرچه تعداد اندکی از آنها از همنوایی سازهای کوبهای (مانند تنبک) نیز در کنار سازهای ملودی بهرهمند میباشند. نتایج نشان میدهند که تشخیص 6 دستگاه اصلی و 11 زیردستگاه به ترتیب با دقت میانگین 5/74% و 35/66% انجام گرفته که نسبت به تحقیقات کمشمار مشابه، نتایج بهتری دارد.
Iranian "Dastgah" music classification by computer is a very interesting yet complex and challenging topic for those who are interested in Iranian Dastgah music. The aforementioned problem is important, firstly, due to its many applications in different areas such as composing and teaching music, and secondly, because of the needs of ordinary people to computer to detect the Dastgah. This paper presents a method for recognition of the genre (Dastgah) and subgenre (sub-Dastgah) of Iranian music based on sequential note extraction, hierarchical classification, and the use of LSTM networks. In the proposed method, the music track is first classified into one of the three general categories. The first category includes only "Mahour" Dastgah, the second category includes "Shour" and "Nava", and the third category includes "Homayoun", "Segah" and "Chahargah". Then, for each category, depending on its type, a different number of classifiers are applied until one of the 6 Dastgah and 11 sub-Dastgah of Iranian music are recognized. This research is not limited to any particular style of playing or instruments, it is also not affected by neither the speed nor the techniques of player. The labeled tracks in the "Arg" database, which is created for this research, are solo. However, some of them are also played by percussion instruments (such as the Tombak) along with melodic instruments. The results show that recognition of 6 main Dastgah and 11 sub-Dastgah have been approved by an average accuracy of 74.5% and 66.35%, respectively, which is more promising compared to other few similar studies.