Генеративна модель MST-GAN для покращення відео: якість, стабільність, ефективність

Микола Романович Максимів

doi:10.15276/ict.02.2025.39

Автор(и)

Максимів Микола Романович Національний університет «Львівська політехніка», вул. С. Бандери, 12. Львів, 79000, Україна Автор

DOI:

https://doi.org/10.15276/ict.02.2025.39

Ключові слова:

відео високої чіткості, відео-суперрезолюція, генеративні мережі, оптимізація на GPU, перцептивна якість, покадрова стабільність, продуктивність моделі, структурне прорідження, часовий дискримінатор, якість відео

Анотація

У роботі розглянуто аналіз вдосконалення архітектури MST-GAN (Multi-Scale Temporal GAN) для задач відеосуперрезолюції, спрямоване на забезпечення високої візуальної якості, міжкадрової стабільності та ефективної роботи в реальному часі. Модель поєднує багатомасштабне вирівнювання ознак, часову агрегацію та генеративну генерацію кадрів з використанням гібридної функції втрат. Особливу увагу приділено забезпеченню стабільності навчання: попереднє навчання генератора без дискримінатора, поетапне включення часової узгодженості, застосування перцептивних критеріїв та регуляризаційних технік дозволили уникнути типових проблем генеративного навчання, зокрема нестабільної динаміки та втрати різноманіття. У процесі тренування модель адаптована до реалістичних сценаріїв відео, що дозволяє їй зберігати якість навіть у складних сценах з динамічними об’єктами. Також описано низку апаратних оптимізацій, що включають структурне прорідження моделі, квантування ваг у формат INT8, компіляцію в TensorRT та організацію потокової обробки кадрів. У результаті MST-GAN досягла значного прискорення інференсу без помітної втрати якості. Якісні приклади на авторських відеоданих (зокрема, сцена з активним рухом) демонструють переваги моделі у збереженні текстур і плавності руху, порівняно з класичними методами збільшення зображення. На відміну від конкурентних підходів, MST-GAN дозволяє уникнути характерного «миготіння» та забезпечує природну передачу динаміки сцени. Отримані результати свідчать про придатність MST-GAN для використання у практичних системах відеопокращення, зокрема у відеострімах, моніторингових системах, AR-застосунках, де поєднання якості, стабільності та швидкодії є критично важливим.

Завантажити

Дані для завантаження поки недоступні.

Біографія автора

автор Максимів Микола Романович, афіліація Національний університет «Львівська політехніка», вул. С. Бандери, 12. Львів, 79000, Україна

Аспірант каф. Електронних обчислювальних машин

Генеративна модель MST-GAN для покращення відео: якість, стабільність, ефективність

Автор(и)

DOI:

Ключові слова:

Анотація

Завантажити

Біографія автора

Завантаження

Опубліковано

Номер

Розділ

Як цитувати