Оптичне розпізнавання нотного запису: виклики та перспективи

Автор(и)

  • Мельничук Христина Олегівна Національний університет «Львівська політехніка», вул. С. Бандери, 12. Львів, 79000, Україна Автор
  • Лясковська Соломія Євгенівна Kingston University, London, Friars Avenue London SW15 3DW Велика Британія Автор

DOI:

https://doi.org/10.15276/ict.01.2024.01

Ключові слова:

розпізнавання нотного запису, OMR, комп’ютерний зір, музична нотація, складність нотного запису, обробка зображень, ноти, партитури, оцінка OMR-систем

Анотація

Оптичне розпізнавання нотного запису (англ. Optical Music Recognition, OMR) як галузь комп’ютерного зору має глибоке коріння ще з шістдесятих років, але активно розвивається лише в останні кілька десятиліть. Основна мета OMR — автоматизувати процес перетворення музичної партитури у цифровий формат. Незважаючи на прогрес в обробці зображень, усе ще існують певні труднощі, викликані специфікою галузі, описані в роботі. Визначення поняття OMR є проблематичним, оскільки існує безліч формулювань — від конкретизованих, що відповідають чітким завданням, до більш узагальнених. У роботі запропоновано всеосяжне визначення, що дозволяє чіткіше окреслити семантичні межі досліджуваного поняття.

Обговорено особливості контекстуальності музичної нотації в порівнянні з текстовими системами письма. Розглянуто діапазон розмірів музичних позначень як окрему особливість нотного запису. Зазначено важливість впливу текстових позначень у партитурах на складність розпізнавання нот. Пояснено значення візуальних відмінностей між музичними символами та їхній вплив на точність розпізнавання. Висвітлено складність розпізнавання музичних творів з кількома голосами в межах однієї партії та творів з кількома партіями.

Розглянуто класифікацію типів музичних творів залежно від наявності кількох голосів та партій. Обговорено вплив формату партитур на складність розпізнавання. Зазначено вплив різних типів музичної нотації на процес OMR. Крім цього, у роботі розглянуто загальну структуру OMR-системи, запропоновану Д. Бейнбріджем та Т. Беллом, а також основні етапи процесу розпізнавання нотного запису відповідно до цієї структури. Проаналізовано структуру OMR-системи типу «знизу-вгору» за А. Пахою.

Обговорено труднощі оцінювання працездатності OMR-систем, наведено приклади з літератури. Також оглянуто наявне на сьогодні програмне забезпечення для OMR, його можливості й обмеження. Описано та узагальнено результати тестування одного з таких рішень — вбудованого в платформу MuseScore модуля Audiveris для перетворення нот у цифровий формат — на конкретних музичних творах.

Завантажити

Дані для завантаження поки недоступні.

Біографії авторів

  • автор Мельничук Христина Олегівна, афіліація Національний університет «Львівська політехніка», вул. С. Бандери, 12. Львів, 79000, Україна

    Бакалавр каф. Систем штучного інтелекту

  • автор Лясковська Соломія Євгенівна, афіліація Kingston University, London, Friars Avenue London SW15 3DW Велика Британія

    Д-р техніч.наук, доцент каф. Систем штучного інтелекту

Опубліковано

2024-10-01