Нараховано винагороду

Цей матеріал написаний відвідувачем сайту, і за нього нараховано винагороду.

  • нейромережеві методи виявляються ефективнішими традиційних математичних підходів у багатьох сферах, проте не у всіх завданнях вони можуть працювати в реальному часі.
  • нейронні мережі використовують для отримання “передбачення” або “виведення”, при цьому для роботи в реальному часі нейромережі потрібно спрощувати.
  • спрощення робить нейромережу непридатною для отримання «висновків», тому безліч завдань досі не може оброблятися в реальному часі з їх допомогою.
  • новий дизайн чіпа (архітектура набору команд і архітектура процесора) дозволяє застосовувати “висновки глибокого навчання” для грошових транзакцій прямо під час операції.
  • кількість випадків шахрайства продовжує зростати, незважаючи на збільшення числа класичних інструментів виявлення, але все ще не запобігання шахрайства на основі штучного інтелекту.
  • чіп дозволяє істотно поліпшити ефективність виявлення і запобігання шахрайських операцій в режимі реального часу.

Реклама

Ibm telum process — це перший нейронний процесор ibm. Він був спроектований таким чином, щоб дати можливість використовувати висновки глибокого навчання при робочих навантаженнях підприємства в режимі реального часу, що особливо актуально для боротьби з шахрайством. Це стало можливо завдяки новій архітектурі чіпа, що підтримує апаратне прискорення роботи алгоритмів штучних нейронних мереж прямо під час виконання транзакцій.

Нейромережеві технології в безпеці

Існує безліч важкоформалізованих завдань, які неможливо ефективно вирішити алгоритмічно навіть із застосуванням сучасних потужних комп’ютерів, але можливо змоделювати за допомогою нейронних мереж. Чим більше шарів і елементів в кожному шарі нейромережі, тим складніші функції вона здатна описати. Так звані м’які обчислення за допомогою нейромережевих технологій мають ряд переваг над традиційними математичними методами. Наприклад, нейронні мережі ефективніше працюють з великим числом вхідних параметрів і краще виявляють нелінійні закономірності в сильно зашумлених неоднорідних даних.

Нейромережі застосовують у безлічі сфер. Найбільш популярні приклади-це розпізнавання об’єктів і людей на ваших фотографіях в хмарних сховищах або таргетинг реклами за вашими запитами в інтернеті. Однак існують і більш серйозні сфери застосування штучного інтелекту: для військових цілей або для забезпечення безпеки роботи фінансових установ, на зразок банків. За допомогою ші вже зараз вирішують як завдання класичної безпеки (розпізнавання образів на камерах спостереження), так і завдання конкретно фінансової безпеки (відстеження підозрілих фінансових угод і шахрайських операцій).

Всі вже чули про використання машинного навчання для виявлення підозрілих особистостей по патернах їх поведінки і міміці їх осіб. Банки, казино, музеї, державні установи головні замовники подібних систем. Системи забезпечення фінансової безпеки на базі ші набагато рідше на слуху, проте вони теж вже активно застосовуються.

Наприклад, організація hnc software inc. Розробила пз falcon, що дозволяє виявляти широкий спектр махінацій з кредитними та дебетовими картками. Система falcon навчається типовій поведінці клієнтів і моніторить співвідношення між операціями, виявляючи підозрілі. Сімейство систем prism від компанії nestor для виявлення шахрайства з банківськими картками також створені із застосуванням нейромережевих технологій. Ai в основі цих систем був навчений на вибірці з більш ніж півмільйона транзакцій з різними типами карт. Аналогічні рішення були розроблені фірмою itc для відстеження операцій з кредитними картками visa.

Реклама

Чому ж тоді ми все частіше чуємо про випадки шахрайства з банківськими картками і рахунками людей? проблема на стільки масштабна, що про неї говорять вже навіть по федеральних каналах у всіх країнах. Коротка відповідь: системи розпізнавання підозрілих патернів на камерах працюють в реальному часі, а системи виявлення шахрайських операцій — ні. Причина криється в тому, що насправді ці завдання досить сильно відрізняються, і нейромережі в них використовуються різним чином.

У чому різниця між» прогнозом «і» висновком ” нейронної мережі?

Нейронні мережі використовують як для “передбачення «(prediction), так і для отримання» виведення” (inference). В обох випадках спочатку за допомогою нейросеток шукають модель, яка виявить взаємозв’язок між незалежними змінними і результатом. Різниця в тому, як використовується отримана модель:

  • висновок-модель використовується для аналізу самих даних. (наприклад, процес їх генерації або взаємозв’язку в них.)
  • передбачення — модель використовується для прогнозування результатів від нових вхідних даних. (наприклад, розпізнавання обличчя та тварин на фотографіях.)

Оскільки висновок і передбачення переслідують різні цілі, то і використовуються вони в різних завданнях.

Реклама

Завдання, пов’язані з отриманням висновку, знаходяться більше в області статистики. Коли у нас є невеликий набір вхідних параметрів (скажімо, близько десяти; наприклад, вік, стать і т.д.) і, по суті, всього один простий результат так чи ні (в сенсі, це правильний набір чи ні). Нейронні мережі тут використовуються для пошуку і побудови моделей, що описують взаємозв’язки між змінними, а також для перевірки нових даних на реалістичність.

Завдання, пов’язані з передбаченням, частіше лежать в області машинного навчання. У них часто великий набір вхідних змінних (близько сотень і тисяч; наприклад, кольору пікселів картинки), а результат може бути як простий, так і складна відповідь (наприклад, марка автомобіля). І часто абсолютно неважливо які взаємозв’язки в даних виявить для себе нейронна мережа, головне, щоб вона дала модель, ефективно пророкує результат.

У сфері безпеки, як і в інших, існують завдання і першого, і другого типу. Розпізнавання облич на камерах типовий приклад використання машинного навчання для передбачення. У той час як контроль транзакцій, розрахунок можливого кредиту, виявлення збиткових угод — завдання швидше з області статистики, що вимагають не тільки передбачень, але і постійного всебічного аналізу. Тут нейромережі швидше потрібні для отримання повноцінних висновків і побудови моделей.

У обох типах завдань отримання даних моделей пов’язане з попереднім навчанням нейронних сіток. Однак навчання нейромережі-це ресурсовитратний процес. Наприклад, для навчання однієї з китайських моделей розпізнавання мови baidu знадобилося не тільки чотири терабайти навчальних даних, але і 20 екзафлопс обчислень — це 20 квінтільйонів (мільярд мільярдів) математичних операцій.

У процесі навчання відбувається калібрування всіх ваг зв’язків в нейронній сітці, але менш громіздкою вона від цього не стає. Варто ще врахувати великі витрати на переміщення і зберігання даних, з якими їй належить працювати. При сучасних технологіях робота такої програми в реальному часі на сервері може бути економічно виправдано далеко не для всіх цілей. А для цілого ряду завдань, де надходять дані оновлюються занадто швидко, побудова таких систем просто технічно нереалізується.

З іншого боку, вже давно відомо, що алгоритми ші далеко не перший рік сортують по обличчях зроблені нами фотографії локально прямо на наших девайсах. Причому вони працюють в тлі і досить оперативно на звичайних комп’ютерах і смартфонах. Значить існують методи, як отримати з попередньо навченої нейромережі щось на зразок швидкого і легкого додатка, яке буде пам’ятати результат навчання і ефективно працювати з новими даними.

Проблема спрощення нейронної мережі

Процес спрощення нейронної мережі називається вербалізацією. Існує два основних підходи як модифікувати вже навчену, але все ще громіздку сітку так, щоб збільшити швидкість її роботи і зменшити затримки. Проріджування (pruning) і функціональна заміна (functional replacement).

  • у першому підході з нейронної мережі видаляються всі параметри (по суті ваги), які після навчання перестали бути активними або надають малий вплив на помилку апроксимації. Аж до видалення з неї цілих ділянок або входів.
  • у другому-зменшується число шарів, шляхом заміни одного або навіть декількох одним обчислювальним кроком. Аж до опису всієї роботи навченої нейронної мережі у вигляді декількох взаємозалежних алгебраїчних або логічних функцій.

В результаті виходитьНабагато простіша програма, що є істотно спрощеною попередньо навченої нейронної сіткою, частково або навіть повністю заміненої звичайними функціями. Це вже можна запустити на смартфоні. Даний алгоритм здатний швидко і ефективно прогнозувати результат і давати просту відповідь (на кшталт: кішка це чи ні), але нічого більше він вже не може.

По суті, це стиснення з втратами якості, схоже на стиснення цифрового зображення. Дизайнер спочатку працює над величезним красивим зображенням з роздільною здатністю мільйон на мільйон пікселів. А, перед тим як викласти картинку в інтернет, стискає її в jpeg. Дозвіл і якість стануть менше, але майже не відрізняються для людського ока від оригіналу. Так само і алгоритм стискається і оптимізується для роботи в реальному часі зі збереженням необхідної точності прогнозу.

Основна ідея вербалізації — це спрощення без значного погіршення якості апроксимації для вирішення конкретного вузького завдання. Однак в результаті вербалізації буде істотно або повністю втрачена здатність до узагальнення нових статистичних даних. Тобто нейронна мережа втратить свою початкову здатність до навчання. Більш того, спрощення нейромережі подібним чином вже не дозволить її використовувати для подальшого аналізу взаємозв’язку змінних.

А якщо у вас з’явилася нова вибірка навчальних даних? або вам потрібно, щоб мережа не тільки передбачала, але і дообучалась в процесі? або вам важливо не тільки отримати відповідь, але і проаналізувати який внесок кожної зі змінних на вході в цю відповідь?

Все це можливо тільки при використанні початкової (навченої, але не спрощеної) нейронної сітки. Що повертає нас до початкової проблеми використання» справжніх ” нейромереж-дуже висока ресурсовитратність. А значить неможливість ефективно використовувати їх на актуальних платформах для роботи з швидко оновлюються даними в реальному часі.

При згадці терміна «передбачення нейронної мережі» часто мова йде вже про передбачення алгоритму, отриманого на основі навченої нейросітки. Висновки ж можна отримати тільки за допомогою повноцінної неспрощеної нейромережі. Щоб підкреслювати цю різницю між прогнозом і висновком, для останнього воліють використовувати більш конкретний термін — «висновки глибокого навчання» (deep learning inference).

Так що представила ibm?

Оголошений на конференції hot chips, процесор telum розроблявся протягом трьох років і, як очікується, зробить революцію в області виявлення шахрайства в банківській, фінансовій, торговельній, страховій і клієнтській сферах. Telum прийде на зміну ibm z15, а новий чіп ляже в основу платформ ibm z і linuxone наступного покоління. Запуск перших систем на базі telum запланований на першу половину 2022 року.

Ibm telum найбільш перспективний для таких строго регульованих галузей, як банківська справа і фінанси, оскільки чіп оптимізований для роботи в потоці переміщаються даних в реальному часі. Дане рішення перевершує традиційні нейромережеві підходи компаній, які, як правило, вимагають додаткових серверних потужностей для зберігання, переміщення та обробки даних необхідних для висновків глибокого навчання.

Недавнє дослідження ibm показало, що 90% респондентів вважають появу можливості збирати і запускати системи штучного інтелекту в будь-якій точці потоку даних важливим кроком вперед, оскільки зараз в сучасних компаніях ші інтегрується практично в усі процеси.

Кількість випадків шахрайства зростає, незважаючи на появу все нових систем для виявлення

На сьогоднішній день у фінансовій сфері є різні інструменти на базі ші для детектування шахрайства, проте більшість цих методів дозволяють виявити факт порушення тільки після того, як інцидент вже стався.

І, хоча вони вже жодного разу успішно застосовувалися, їх недолік в тому, що через обмеження сучасних технологій процес роботи з ними може зажадати багато часу і обчислювальних ресурсів. Особливо коли аналіз і виявлення шахрайства здійснюються далеко від самих критично важливих транзакцій і даних.

Системи для виявлення шахрайства на основі штучного інтелекту виходять виключно з даних минулого досвіду. Вони вивчають дії, поведінку та тенденції транзакцій на предмет аномалій. І в більшості випадків такі системи можуть виявити, що щось не так, і позначити це як шахрайство, але знову ж таки вже після виявлення аномалії.

Подібне ресурсовитратне виявлення шахрайства неможливо проводити в режимі реального часу через високі затримки. Оскільки до моменту виявлення шахрайства злочинець, ймовірно, вже здійснить задумане. Наприклад, більшість компаній, що випускають кредитні картки, зможуть виявити факт шахрайства тільки після того, як шахрай придбає товари або карта буде заявлена як вкрадена.

Згідно з даними федеральної торгової комісії, споживачі втратили в результаті шахрайства за 2020 рік понад 3,3 млрд доларів сша. Для порівняння: у 2019 році ця сума склала 1,8 млрд доларів сша. Самозванці залишаються найбільш поширеним типом шахраїв, про які повідомляється агентству.

Самозванці очолили список втрат через шахрайство з сумою близько 1,2 мільярда доларів сша. Покупки в інтернеті є другою за поширеністю категорією шахрайства, збитки від якої склали близько 246 мільйонів доларів сша. Особливий сплеск повідомлень споживачів про дані інциденти спостерігався в перші дні пандемії covid-19.

Нейронний процесор дозволить перейти від виявлення до запобігання шахрайства

Очікується, що ai-процесор допоможе підприємствам у війні з шахрайством перейти від позиції виявлення до позиції запобігання. Замість того, щоб зосереджуватися на виявленні випадків постфактум, не впливаючи прямим чином на статистику злочинів, компанії тепер нарешті зможуть почати запобігати масштабне шахрайство, при цьому не впливаючи на швидкість транзакції і якість обслуговування клієнтів.

Інноваційний централізований дизайн нового ші-процесора дозволить ще ефективніше використовувати його потужність при роботі з нейронними мережами. Крім виявлення та запобігання шахрайства, чіп також підходить для інших завдань фінансових послуг, таких як обробка позик, кліринг і розрахунки по операціях, боротьба з відмиванням грошей і аналіз ризиків.

Чіп реалізований на базі 7-нм техпроцесу і містить 8 процесорних ядер з глибоким суперскалярним конвеєром команд довільної черговості. Ші-процесор працює на тактовій частоті більше 5 ггц і оптимізований для гетерогенних обчислень під широке безліч різних завдань. Обсяг l2 кешу становить 32 мб на кожне ядро, а повністю перероблена інфраструктура кеш-пам’яті дозволяє формувати з кешу другого рівня віртуальні кеші l3 і l4 на 256 мб і 2 гб відповідно. Також завдяки новому дизайну архітектури систему можна масштабувати до 32 мікросхем telum, що працюють разом. А перероблений 8-канальний інтерфейс пам’яті здатний витримати відмову цілого каналу і забезпечити прозоре відновлення даних без впливу на час відгуку. Двочиповий модуль містить 22 мільярди транзисторів і 19 миль проводів на 17 металевих шарах.

Завдяки тому, що прискорювач telum можна розташувати в безпосередній близькості до критично важливих даних, його функції можливо інтегрувати прямо в роботу додатків. Це означає, що підприємства можуть проводити великий обсяг обчислень типу висновків глибокого навчання для конфіденційних транзакцій в реальному часі, не вдаючись до позаплатформних рішень штучного інтелекту, які негативно позначаються на продуктивності. Хоча останні, реалізовані на базі системи ibm з підтримкою telum, також стануть більш гнучкими і продуктивними.

Є ще кілька більш консервативних способів застосування даної системи. З її допомогою можливо поліпшити вже існуючі методи виявлення шахрайства на основі правил. Також стверджується, що дана платформа дозволить ефективніше використовувати машинне навчання для прискорення процесів затвердження кредитів, поліпшення обслуговування клієнтів, виявлення збиткових угод або транзакції, і аналізу рішень для створення більш ефективного процесу розрахунків. Правда, для деяких з нас це, схоже, закінчиться фразою – «ваш кредит несхвальний».

Що ж, мабуть, шахраям доведеться стати набагато більш підкованими в області технологій, адже обманювати тепер потрібно буде не тільки нас і банки, а й нейромережі. Звичайно, за умови, що ші-чіп отримає широке визнання в більшій кількості компаній. Хоча той факт, що цей і інші подібніЧіпи можна використовувати не тільки для захисту своїх клієнтів, але і для забезпечення більш швидкого виконання інших завдань і фінансових послуг, простіше кажучи, для збільшення прибутку, явно грає на руку його впровадження та освоєння.