complete guide artificial neural network machine learning
Цей посібник пояснює, що таке штучна нейронна мережа, як працює ANN, структура та типи архітектури ANN та нейронної мережі:
найкращий музичний програвач та завантажувач для android
У цьому Навчання машинного навчання для всіх , ми дослідили все про Типи машинного навчання у нашому попередньому уроці.
Тут, у цьому посібнику, обговоріть різні алгоритми нейронних мереж, а також порівняння між машинним навчанням та ANN. Перш ніж ми дізнаємося, як ANN сприяє машинному навчанню, нам слід знати, що таке штучна нейронна мережа, та короткі знання про машинне навчання.
Давайте вивчимо більше про машинне навчання та штучну нейронну мережу !!
=> Прочитайте повну навчальну серію машинного навчання
Що ви дізнаєтесь:
- Що таке машинне навчання?
- Що таке штучна нейронна мережа?
- Структура біологічної нейронної мережі
- Порівняння біологічного нейрону та штучного нейрону
- Характеристика АНН
- Структура АНН
- Функція активації
- Що таке штучний нейрон?
- Як працює штучний нейрон?
- Основні моделі ANN
- Архітектура нейронної мережі
- Приклад мережі штучних нейронів
- Порівняння між машинним навчанням та ANN
- Нейронні мережі та глибоке навчання
- Застосування штучних нейронних мереж
- Обмеження нейронних мереж
- Висновок
- Рекомендована література
Що таке машинне навчання?
Машинне навчання - це галузь науки, яка надає комп’ютерам можливість вчитися та діяти без явного програмування. Це підполе штучного інтелекту.
Що таке штучна нейронна мережа?
ANN - це нелінійна модель, яка широко використовується в машинному навчанні та має перспективне майбутнє у галузі штучного інтелекту.
Штучна нейронна мережа є аналогом біологічної нейронної мережі. Біологічна нейронна мережа - це структура мільярдів взаємопов’язаних нейронів у мозку людини. Мозок людини складається з нейронів, які надсилають інформацію до різних частин тіла у відповідь на виконану дію.
Подібно до цього, Штучна нейронна мережа (ANN) - це обчислювальна мережа в науці, яка нагадує характеристики людського мозку. ANN може моделюватися як оригінальні нейрони людського мозку, тому частини, що обробляють ANN, називаються штучними нейронами.
АНН складається з великої кількості взаємопов’язаних нейронів, натхненних роботою мозку. Ці нейрони мають можливості вивчати, узагальнювати навчальні дані та отримувати результати зі складних даних.
Ці мережі використовуються в областях класифікації та прогнозування, ідентифікації шаблонів і тенденцій, проблемах оптимізації тощо. ANN навчається на основі даних навчання (вхідні та цільові результати відомі) без будь-якого програмування.
Вивчена нейронна мережа називається експертна система з можливістю аналізу інформації та відповіді на запитання певної галузі.
Офіційне визначення ANN, дане доктором Робертом Гехтом-Нільсоном, винахідником одного з перших нейрокомп'ютерів:
“… Обчислювальна система, що складається з ряду простих, дуже взаємопов’язаних елементів обробки, які обробляють інформацію за допомогою динамічного реагування стану на зовнішні входи”.
Структура біологічної нейронної мережі
Біологічна нейронна мережа складається з:
- Сома: Це ще називають клітинним тілом. Саме там розташоване ядро клітини.
- Дендрити: Це деревоподібні мережі, які зв’язані з тілом клітини. Він виготовлений з нервового волокна.
- Аксон: Аксон несе сигнал від тіла клітини. Він розпадається на нитки, і кожна нитка закінчується цибулиноподібною структурою, яка називається синапсом. Електричні сигнали передаються між синапсом і дендритами.
(зображення джерело )
Порівняння біологічного нейрону та штучного нейрону
Біологічний нейрон | Штучний нейрон |
---|---|
ML застосовується в електронній комерції, охороні здоров’я, рекомендаціях щодо продуктів тощо. | ANN застосовується у сфері фінансів, машинного навчання та штучного інтелекту. |
Він зроблений з клітин. | Клітини відповідають нейронам. |
Він має дендрити, які є взаємозв’язками між тілом клітини. | Ваги з'єднання відповідають дендритам. |
Сома отримує вхідні дані. | Сома схожа на чисту вхідну вагу. |
Аксон приймає сигнал. | Вихід ANN відповідає аксону. |
Характеристика АНН
- Нелінійність: Механізм генерації вхідного сигналу в ANN є нелінійним.
- Навчання під наглядом: Вхідні та вихідні дані картографуються, а ANN навчається за допомогою навчального набору даних.
- Навчання без нагляду: Цільовий результат не дається, тому ANN буде вчитися самостійно, виявляючи особливості в шаблонах введення.
- Адаптивна природа: Ваги з'єднань у вузлах ANN здатні самі регулюватись, щоб отримати бажаний вихід.
- Біологічна нейронна аналогія: ANN має структуру та функціональність, натхненну людським мозком.
- Відмовостійкість: Ці мережі відрізняються високою толерантністю, оскільки інформація розподіляється шарами, а обчислення відбуваються в режимі реального часу.
Структура АНН
Штучні нейронні мережі - це оброблювальні елементи у вигляді алгоритмів або апаратних пристроїв, змодельованих за нейрональною структурою кори головного мозку людини.
Ці мережі також називають просто нейронними мережами. НН утворена з багатьох шарів. Кілька шарів, які взаємопов’язані, часто називають «багатошаровим персептроном». Нейрони в одному шарі називаються “Вузлами”. Ці вузли мають “функцію активації”.
ANN має 3 основних шари:
- Вхідний рівень: Шаблони введення подаються на вхідні шари. Існує один вхідний рівень.
- Приховані шари: Може бути один або кілька прихованих шарів. Обробка, яка відбувається у внутрішніх шарах, називається «прихованими шарами». Приховані шари обчислюють результат на основі “ваг”, що є “сумою зважених зв’язків синапсу”. Приховані шари вдосконалюють вхідні дані, видаляючи надлишкову інформацію, і надсилають інформацію наступному прихованому шару для подальшої обробки.
- Вихідний рівень: Цей прихований шар з'єднується з 'вихідним шаром', де відображається вихідний результат.
Функція активації
Функція активації - це внутрішній стан нейрона. Це функція вхідного сигналу, яку отримує нейрон. Функція активації використовується для перетворення вхідного сигналу на вузлі ANN у вихідний сигнал.
Що таке штучний нейрон?
Штучна нейронна мережа складається з сильно взаємопов'язаних елементів обробки, що називаються вузлами або нейронами.
Ці нейрони працюють паралельно і організовані в архітектурі. Вузли з'єднані між собою за допомогою з'єднувальних ланок. Кожен нейрон несе вагу, що містить інформацію про вхідний сигнал.
Як працює штучний нейрон?
Штучний нейрон отримує вхід. Ці входи мають вагу, яка називається “синапс”. Ці нейрони (їх також називають вузлами) мають “функцію активації”. Ця функція активації працює на вході та обробляє його, щоб отримати вихід.
Зважена сума входів стає вхідним сигналом для функції активації, щоб отримати один вихід. Ці вхідні ваги регулюються таким чином, що нейронна мережа може регулювати свої параметри для отримання бажаного виходу.
Кілька загальних функцій активації, які використовуються в штучній нейронній мережі:
# 1) Функція посвідчення особи
Його можна визначити як f (x) = x для всіх значень x. Це лінійна функція, де вихідний результат такий же, як і вхідний.
# 2) Функція двійкового кроку
Ця функція використовується в одношарових мережах для перетворення чистого вводу на вихід. Вихідний результат є двійковим, тобто 0 або 1. Значення t являє собою порогове значення.
(зображення джерело )
# 3) Функція біполярного кроку
Функція біполярного кроку має біполярні виходи (+1 або -1) для чистого входу. T являє собою порогове значення.
# 4) Сигмоїдальна функція
Він використовується в мережах зворотного розповсюдження.
Він буває двох типів:
- Двійкова сигмоїдна функція: Її також називають однополярною сигмовидною функцією або логістичною сигмовидною функцією. Діапазон сигмоїдального функціоналу становить від 0 до 1.
- Біполярний сигмоїд: Біполярна сигмоїдна функція коливається від -1 до +1. Це схоже на функцію гіперболічної дотичної.
(зображення джерело )
# 5) Функція RampFunction
зважена сума входів означає 'добуток ваги вхідних даних та значення вхідних даних', підсумованих для всіх вхідних даних.
Нехай I = {I1, I2, I3… In} є вхідним шаблоном для нейрона.
Нехай W = {W1, W2, W3… Wn} - вага, пов'язаний з кожним входом у вузол.
Зважена сума входів = Y = (? Wi * Ii) для i = 1 до n
Основні моделі ANN
Моделі штучної нейронної мережі складаються з 3 сутностей:
- Ваги або синаптичні зв’язки
- Правило навчання, яке використовується для регулювання ваг
- Активаційні функції нейрона
Архітектура нейронної мережі
У ANN нейрони взаємопов’язані, і вихід кожного нейрона пов’язаний із наступним нейроном через ваги. Архітектура цих взаємозв’язків є важливою для ANN. Це розташування має форму шарів, а зв'язок між шарами та всередині шару є архітектурою нейронної мережі.
Найбільш відомими мережевими архітектурами є:
- Одношарова мережа прямого пересилання
- Багатошарова мережа прямого пересилання
- Єдиний вузол із власними відгуками
- Одношарова рекурентна мережа
- Багатошарова рекурентна мережа
Давайте детально розглянемо кожен із них.
C ++, як використовувати рядок
# 1) Одношарова мережа прямого пересилання
Шар - це мережа, утворена з нейронів. Ці нейрони пов’язані з іншими нейронами наступного шару. Для одного шару існують лише вхідний та вихідний шари. Вхідний рівень з'єднаний з вузлами вихідного шару вагами.
Всі вхідні вузли підключені до кожного з вихідних вузлів. Термін зворотного зв'язку вказує на відсутність зворотного зв'язку, що надсилається з вихідного рівня на вхідний рівень. Це утворює одношарову мережу прямого пересилання.
(зображення джерело )
# 2) Багатошарова мережа прямого пересилання
Багатошарова мережа складається з одного або декількох шарів між входом і виходом. Вхідний рівень просто приймає сигнал і буферизує його, тоді як вихідний рівень показує вихідний сигнал. Шари між входом і виходом називаються прихованими шарами.
Приховані шари не контактують із зовнішнім середовищем. При більшій кількості прихованих шарів вихідна відповідь стає більш ефективною. Вузли попереднього шару з'єднані з кожним вузлом наступного шару.
Оскільки вихідний рівень не підключений до вхідного або прихованого шарів, він утворює багатошарову мережу прямого пересилання.
# 3) Єдиний вузол із власними відгуками
Мережі, де вихідний рівень вихідного рівня надсилається назад як вхідний сигнал на вхідний рівень або інші приховані рівні, називаються мережами зворотного зв'язку. У системах зворотного зв'язку з одним вузлом існує один вхідний рівень, де вихідний сигнал перенаправляється назад як зворотний зв'язок.
# 4) Одношарова рекурентна мережа
В одношаровій рекурентній мережі мережа зворотного зв'язку утворює замкнутий цикл. У цій моделі один нейрон отримує зворотний зв'язок із собою чи іншими нейронами мережі або обома.
# 5) Багатошарова рекурентна мережа
У багатошаровій рекурентній мережі існує декілька прихованих шарів, і вихідний сигнал перенаправляється назад до нейронів попередніх шарів та інших нейронів у тих самих шарах або до того самого нейрона.
Приклад мережі штучних нейронів
Візьмемо нижченаведену мережу з заданим входом і обчислимо чистий вхідний нейрон і отримаємо вихід нейрона Y з функцією активації як двійковий сигмоїдальний.
На вході є 3 нейрони X1, X2 і X3, і один вихід Y.
Ваги, пов’язані з входами: {0,2, 0,1, -0,3}
Входи = {0,3, 0,5, 0,6}
Чистий вхід = {x1 * w1 + x2 * w2 + x3 * w3}
Чистий вхід = (0,3 * 0,2) + (0,5 * 0,1) + (0,6 * -0,3)
Чистий вхід = -0,07
Вихідні дані для бінарного сигмоїдального:
Х дорівнює -0,07
Вихід буде 0,517
як відкрити .json файли -
Порівняння між машинним навчанням та ANN
Машинне навчання | Штучна нейронна мережа |
---|---|
Машинне навчання вчиться на вхідних даних і виявляє моделі виходу вихідних даних, що цікавлять. | ANN використовуються в алгоритмах машинного навчання для навчання системи з використанням синапсів, вузлів та з'єднань. |
ML - це підмножина галузі штучного інтелекту. | ANN також є частиною галузі науки про штучний інтелект і підмножиною машинного навчання. |
Алгоритми ML вивчають дані, що надходять в алгоритм для прийняття рішень. Деякі з цих алгоритмів є класифікаційними. Кластеризація, аналіз даних асоціацій. | ANN - це наука глибокого навчання, яка аналізує дані за допомогою логічних структур, як це роблять люди. Деякі схеми навчання ANN - це геббіан, персептрон, зворотне поширення тощо. |
Алгоритми ML мають можливості самонавчання, але вимагатимуть втручання людини, якщо результат буде неточним. | Алгоритми ANN мають можливості самостійно налаштовуватись за допомогою ваг з'єднань, якщо результат виявляється помилковим. |
Алгоритми ML вимагають навичок програмування, структури даних та знань бази даних великих даних. | ANN також вимагає міцних навичок математики, ймовірності, структури даних тощо. |
Програми ML можуть прогнозувати результат для вивченого набору даних та коригувати себе для нових даних. | ANN може вчитися та самостійно приймати розумні рішення щодо нових даних, але це глибше, ніж машинне навчання. |
Навчання під наглядом і без нагляду підпадає під машинне навчання. | Навчання, таке як Кохенен, радіальне упередження, нейронна мережа з прямим вперед, підпадає під ANN. |
Деякі приклади ML - це результати пошуку Google тощо. | Деякі приклади ANN - це розпізнавання обличчя, розпізнавання зображень тощо. |
Нейронні мережі та глибоке навчання
Мережі глибокого навчання містять кілька прихованих шарів між входом і виходом. Ці мережі відрізняються глибиною захованих в них шарів. Вхідні дані проходять кілька кроків перед тим, як буде показано вихідні дані.
Ці мережі відрізняються від попередніх NN, таких як персептрон, який мав один прихований шар і називався дрібними мережами. Кожен прихований рівень у мережі глибокого навчання навчає дані з певними функціями на основі результатів попереднього рівня.
Дані проходять через багато шарів нелінійної функції на вузлі. Чим більше кількість шарів, тим складніші ознаки можна розпізнати, оскільки наступний шар буде виконувати агрегування ознак з попередніх шарів.
Кілька прихованих шарів у мережі збільшують складність та абстракцію. Ця глибина також називається ієрархією ознак. Завдяки цьому мережі глибокого навчання здатні обробляти великі розміри даних.
Деякі приклади мереж глибокого навчання включають групування мільйонів зображень на основі їх характеристик та схожості, фільтрацію повідомлень електронної пошти, застосування фільтрів до повідомлень у CRM, ідентифікацію мови тощо.
Мережі глибокого навчання можна навчити як на маркованому, так і на немаркованому наборі даних. Для немаркованого набору даних мережі, такі як машини для вибору Больцмана, виконують автоматичне вилучення функцій.
Мережа навчається автоматично, аналізуючи вхідні дані шляхом вибірки та мінімізуючи різницю у випуску та розподілі вхідних даних. Нейронна мережа тут знаходить кореляцію між особливостями та результатами.
Мережі глибокого навчання, навчені маркованим даним, можуть застосовуватися до неструктурованих даних. Чим більше навчальних даних надходить у мережу, тим точнішою вона стане.
Здатність мережі вчитись на немаркованих даних є перевагою перед іншими алгоритмами навчання.
Застосування штучних нейронних мереж
Нейронні мережі успішно використовуються в різних рішеннях, як показано нижче.
# 1) Розпізнавання шаблону: ANN використовується для розпізнавання зразків, розпізнавання зображень, візуалізації зображень, рукописного вводу, мовлення та інших подібних завдань.
# 2) Проблеми з оптимізацією: Такі проблеми, як пошук найкоротшого маршруту, планування та виготовлення, де необхідно задовольнити обмеження проблем та досягти оптимальних рішень, використовують NN.
# 3) Прогнозування: НН може прогнозувати результат ситуацій, аналізуючи минулі тенденції. Такі додатки, як банківська справа, фондовий ринок, прогнозування погоди, використовують нейронні мережі.
# 4) Системи управління: Системи управління, такі як комп'ютерна продукція, хімічна продукція та робототехніка, використовують нейронні мережі.
Обмеження нейронних мереж
Нижче наведено деякі недоліки нейронних мереж.
- Ці мережі є чорними ящиками для користувача, оскільки користувач не виконує жодних ролей, окрім подачі вхідних даних та спостереження за вихідними даними. Користувач не знає про навчання, що відбувається в алгоритмі.
- Ці алгоритми є досить повільними і вимагають багатьох ітерацій (їх також називають епохами) для отримання точних результатів. Це пояснюється тим, що центральний процесор обчислює ваги, функцію активації кожного вузла окремо, тим самим змушуючи витрачати час, а також ресурси. Це також спричиняє проблему з великим обсягом даних.
Висновок
У цьому посібнику ми дізналися про штучну нейронну мережу, її аналогію з біологічним нейроном та типи нейронної мережі.
ANN підпадає під машинне навчання. Це обчислювальна модель, що складається з безлічі нейронних вузлів. Ці вузли отримують вхідні дані, обробляють вхідні дані за допомогою функції активації та передають вихідні дані наступним шарам.
Входи пов'язані з вагами посилань зв'язку, які називаються синапсом. Базовий ANN складається з вхідного рівня, ваг, функції активації, прихованого шару та вихідного рівня.
Функції активації використовуються для перетворення вхідного сигналу у вихідний. Деякі з них мають бінарну, біполярну, сигмоїдальну та рампову функції. Існують різні типи ANN, такі як одношарова подача вперед, багатошарова передача вперед, періодичні мережі тощо, залежно від кількості прихованих шарів та механізмів зворотного зв'язку.
ANN з безліччю прихованих шарів між входом і виходом утворює мережу глибокого навчання. Мережі глибокого навчання мають високу складність та рівень абстракції, що робить їх здатними обчислювати дані великих розмірів з тисячами параметрів.
ANN використовується у галузі прогнозування, обробки зображень, систем управління тощо. Вони успішно застосовуються як вирішення низки проблем науки.
Сподіваємось, у цьому підручнику розказано все, що вам потрібно знати про штучні нейронні мережі !!
=> Відвідайте тут ексклюзивну серію машинного навчання
Рекомендована література
- Видобуток даних проти машинного навчання проти штучного інтелекту проти глибокого навчання
- Тестування мережевої безпеки та найкращі інструменти мережевої безпеки
- Типи машинного навчання: Контрольоване проти ненавчаного навчання
- 11 Найпопулярніших програмних засобів машинного навчання в 2021 році
- Підручник з машинного навчання: Вступ до ML та його застосування
- Посібник із маски підмережі (підмережі) та калькулятора підмережі IP
- Керівництво з оцінки та вразливості мережі
- 15 найкращих інструментів мережевого сканування (мережевий та IP-сканер) 2021 року