ВИКОРИСТАННЯ ЗГОРТАЛЬНИХ НЕЙРОННИХ МЕРЕЖ ДЛЯ ІДЕНТИФІКАЦІЇ ОБЛИЧЧЯ ЛЮДИНИ
Анотація
В даній роботі розглянута нейронна мережа, завданням якої є ідентифікація обличчя людини. Ідентифікація особи людини зводиться до розв'язку завдання класифікації, а модель представлена у вигляді згортальної нейронної мережі. У якості прототипу взята нейронна мережа Lenet-5, яка застосовувана для ідентифікації рукописних цифр. Враховуючи, що ідентифікація особи є більш складним завданням, чим ідентифікація рукописних цифр, була змінена архітектура нейронної мережі.
Запропоновано три варіанти мережі різної архітектури, зроблене їхнє навчання на одній і тій же вибірці зображень обличчя людині, яка була створена для розв'язку завдання. При цьому використані різні функції активації й методи оцінки точності ідентифікації. Мінімізація функції помилки при ідентифікації виконана методами стохастичного градієнтного спуску (SGD) та Adam. У якості оцінки нейронних мереж різної архітектури використані час навчання й точність ідентифікації.
Перший варіант містить 4 шари згортки, 2 шари ЗНМ підвибірки (субдискретизації), вхідний шар та два повнозв’язних шари, один з яких є вихідним шаром. Час навчання та точність класифікації обличчя людини в цій мережі відповідно дорівнює 22,5 хвилин і 50%.
Другий варіант містить 3 шари згортки, 3 шари підвибірки, також вхідний шар та два повнозв’язних шари, один з яких є вихідним шаром. Час навчання та точність класифікації в цій мережі відповідно дорівнює 9,2 хвилин і 81,25%.
Найкращою, з точки зору точності класифікації та часу навчання, є третій варіант архітектури нейронної мережі. Вона побудована на основі другого варіанта мережі, але кількість нейронів в першому повнозв’язному шарі дорівнює 1024, замість 512. Час навчання та точність класифікації обличчя людини в цій мережі відповідно дорівнює 9,1 хвилин і 93,75%.
Подальше підвищення якості може бути досягнуте при збільшенні набору даних і, насамперед, вибірки навчання.
Ключові слова: класифікація, ідентифікація, нейронна мережа, згортальна нейронна мережа, моделювання, Lenet-5, шар субдискретизації, повнозв’язний шар, вихідний шар.
Повний текст:
PDFПосилання
Habr.com [електронний ресурс] Аналіз підходів розпізнання обличь - https://habr.com/company/synesis/blog/238129/.
Habr.com [електронний ресурс] Опис особливостей згортальних нейронних мереж - https://habr.com/post/309508/.
Deep Learning [електронний ресурс] Опис архітектури Lenet-5 - http://deeplearning.net/tutorial/lenet.html.
ИНТУИТ [електронний ресурс] Визначення понять навчання НМ з вчителем та без вчителя - https://www.intuit.ru/studies/courses/88/88/lecture/20555.
Efficient BackProp [електронний ресурс] Опис функції середньоквадратической помилки - http://yann.lecun.com/exdb/publis/pdf/lecun-98b.pdf.
Habr.com [електронний ресурс] Опис функції перехрестної ентропії -https://habr.com/company/wunderfund/blog/314872.
Machinelearning.ru [електронний ресурс] Опис методу градієнтного спуску -http://www.machinelearning.ru/wiki/index.php?title=Метод_градиентного_спуска
Habr.com [електронний ресурс] Опис функції мінімізації помилки Adam - https://habr.com/post/318970.
DataReview.info [електронний ресурс] Опис функції активації RELU - http://datareview.info/article/eto-nuzhno-znat-klyuchevyie-rekomendatsii-po-glubokomu-obucheniyu-chast-2.
AIPortal.ru [електронний ресурс] Функції активації в нейронних мережах - http://www.aiportal.ru/articles/neural-networks/activation-function.html.
Ievbras.ru [електронний ресурс] Опис функції активації Softmax - http://www.ievbras.ru/ecostat/Kiril/Library/Book1/Content394/Content394.htm
Посилання
- Поки немає зовнішніх посилань.