Порівняльний аналіз точності класифікації ансамблевих та індивідуальних моделей на прикладі даних фейкового мовлення
DOI:
https://doi.org/10.15276/ict.02.2025.05Ключові слова:
Deepfake, фейкове мовлення, ансамблева класифікація, машинне навчання, нейронні мережі, stacking, hard voting, soft votingАнотація
У сучасних умовах швидкого розвитку технологій глибокого навчання, синтезоване мовлення на основі deepfake створює значні ризики для інформаційної безпеки, включаючи маніпуляції в медіа та кіберзлочини. Дослідження присвячене порівняльному аналізу точності класифікації ансамблевих та індивідуальних моделей для виявлення фейкового мовлення. Метою є підвищення ефективності детекції діпфейків шляхом розробки ансамблевих класифікаторів на основі stacking з стратегіями агрегації прогнозів (hard voting, soft voting та soft voting з нечітким ранжуванням Гомперца). Використано датасет Fake or Real. В якості базових моделей використано K-nearest neighbors, support vector machines, random forest, extreme gradient boosting, logistic regression, multilayer perceptron, convolutional neural networks та long shortterm memory. З 657 ансамблів найкращий досяг accuracy 0,935 та F1-score 0,935, що на 3,9 % перевищує індивідуальні моделі. Результати підтверджують перевагу ансамблевих підходів у роботі з діпфейками.