Українські вчені розробили унікальний метод прогнозування популярності музики


Дослідники з КПІ створили штучний інтелект, який може передбачати успішність музичних треків на Spotify.

Ілюстративне зображення Freepik
Ілюстративне зображення Freepik

Дослідження, проведене вченими з Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського», відкриває нові можливості у передбаченні популярності музичних композицій за допомогою сучасних методів машинного навчання. Команда науковців на чолі з Антоном Буром, Тетяною Ліхоузовою та Юрієм Олійником розробила унікальну методику класифікації та прогнозування популярності музичних треків на платформі Spotify.

Сучасний світ музики надзвичайно динамічний, і платформи потокового музичного стрімінгу, зокрема Spotify, відіграють ключову роль у формуванні музичних трендів. Популярність музичних композицій безпосередньо впливає на доходи артистів, музичних лейблів та стратегії розвитку музичної індустрії. Саме тому завдання прогнозування успішності треків набуває особливої актуальності.

Дослідження базувалося на аналізі чотирьох великих масивів даних, отриманих з платформи Kaggle. Науковці створили унікальне сховище даних на базі SQLite, яке дозволяє ефективно зберігати та обробляти інформацію про музичні треки. Для класифікації популярності музичних композицій вчені розділили всі треки на три категорії: непопулярні, середньої популярності та хіти.

Команда дослідників випробувала чотири різні моделі машинного навчання для прогнозування популярності: Decision Tree Classifier, KNeighbors Classifier, XGBoost Classifier та Random Forest Classifier. Кожна модель мала свої особливості та обмеження. Зокрема, класичні моделі, такі як Decision Tree, показали чутливість до перенавчання, що обмежує їх практичне застосування.

Найбільш вражаючі результати продемонстрували дві моделі: XGBoost Classifier та Random Forest Classifier. Вони досягли точності прогнозування близько 86−87% та показника f1-score 0.81. Це означає, що штучний інтелект може досить точно передбачати, наскільки популярним буде музичний трек.

Особливістю дослідження стало те, що науковці перевірили ефективність моделей навіть без урахування року виходу треку. Це важливо, оскільки дозволяє застосовувати розроблену методику на різних музичних платформах, а не лише на Spotify.

Для оцінки ефективності моделей вчені розробили спеціальну функцію, яка дозволяє комплексно аналізувати результати. Функція обчислює ключові метрики якості: точність (accuracy), точність передбачення для кожного класу (precision), повноту (recall) та інтегральний показник F1-score.

Дослідження показало, що для прогнозування популярності музичних треків найкраще підходять моделі XGBoost та Random Forest. Вони демонструють високу стійкість до змін у наборі атрибутів і можуть бути ефективно використані в реальних умовах.

Практичне значення роботи полягає в тому, що розроблена методика може бути корисною для музичних продюсерів, артистів та стрімінгових платформ. Вона дозволяє заздалегідь оцінити потенційну популярність музичного твору, оптимізувати маркетингові стратегії та підвищити ефективність просування музичного контенту.

DOI