Передбачення несправностей та помилок на основі Machine Learning. Частина 2 | GlobalLogic Ukraine

Передбачення несправностей та помилок на основі Machine Learning. Частина 2

Автор: Юрій Грицай, Software Engineer, Engineering, Consultant, GlobalLogic Ukraine

Продовжуємо розбиратись з предиктивним аналізом несправностей. Докладніше про сам аналіз та методики можна прочитати у частині першій.

Моделі для передбачення потреби технічного обслуговування – тест.

Для побудови успішних моделей для передбачення потреби технічного обслуговування необхідно 3 головні речі:

  1. доступність інформації;
  2. правильне формулювання проблеми;
  3. належна оцінка прогнозів.

Збір інформації

Щоб побудувати модель для передбачення несправності, нам потрібні архівні дані, які дозволяють фіксувати інформацію про події, що призводять до несправності. Під час збору цих даних важливо відповісти на наступні запитання:

  • Які типи несправностей можуть статися? Які саме ми намагаємось передбачити?
  • Яким є процес, який призводить до несправності? Чи це повільний, чи навпаки, стрімкий процес?
  • Які частини приладу\системи можуть бути пов’язані з кожним типом несправності? Як часто та наскільки точно потрібно виконувати вимірювання?

Формулювання проблеми

Коли мова йде про те, як слід сформулювати модель для передбачення потреби у ремонті, важливо пам’ятати про наступні запитання:

  • Який результат ви очікуєте від використання моделі?
  • Чи достатньо у вас архівних даних чи доступні лише статичні дані?
  • Чи позначено кожну записану подію, які вимірювання відповідають належному функціонуванню та які відповідають несправності? Або принаймні, чи відомо, коли кожен прилад вийшов з ладу(якщо коли-небудь таке траплялось раніше).
  • Коли доступні позначені події, яка частка є кількістю подій кожного виду несправностей та тих, які відповідають за коректну роботу.
  • Наскільки завчасно модель повинна вказати, що станеться збій?

Стратегії моделювання для правильного оцінювання прогнозів:

  • Модель на основі регресії для прогнозування часу роботи, що залишається перед тим як обладнання вийде з ладу.
  • Модель на основі класифікації для передбачення несправності протягом заданого періоду часу.
  • Позначення нетипової (аномальної) поведінки.
  • Модель (Survival) для передбачення можливості виникнення несправності протягом всього часу експлуатації приладу.

Розберемо кожну докладніше.

1. Модель на основі регресії для прогнозування часу роботи, що залишається перед тим як обладнання вийде з ладу

Головне запитання: скільки днів / циклів залишається до того моменту, коли система вийде з ладу?

Основні характеристики даних:

  • доступні статичні та архівні дані, кожна подія позначена. У наборі даних присутні кілька подій кожного типу несправності;
  • використовуючи статичні характеристики системи та того, як вона поводиться зараз, можна передбачити залишковий час;
  • моделюється лише один тип ‘’шляху до несправності’’: якщо можливі багато різних типів несправностей, а система поводиться кожного разу по-іншому під час процесу, який призводить до несправностей, потрібно проєктувати окрему модель для кожного типу;
  • доступні позначені дані та вимірювання, які були зроблені в різні моменти часу протягом експлуатації системи.

2. Модель на основі класифікації для передбачення несправності протягом заданого періоду часу

Головне запитання: чи вийде прилад з ладу за наступні N днів/циклів?

Основні характеристики даних:

  • доступні статичні та архівні дані, і кожна подія є позначена. Кілька подій різних типів несправностей є в наборі даних;
  • оскільки ми визначаємо несправність в певний період часу (а не в конкретний момент), дані по деградаційному процесу усереднюються;
  • моделі класифікації застосовуються до багатьох типів несправностей, при умові що вони сформульовані як багато класова проблема;
  • Доступні позначені дані та існує достатньо випадків кожного типу несправності, щоб тренувати та оцінювати модель.

3. Модель позначення нетипової (аномальної) поведінки

Обидві попередні стратегії потребують багатьох прикладів як і нормальної поведінки, так і поведінки, яка призводить до несправностей. Проте, скільком літакам ви б дозволили впасти, лиш для того, щоб зібрати дані? Отож, якщо ви маєте надважливі системи, то у вас часто є лише обмежені, або взагалі відсутні приклади відмов. У цьому випадку необхідна інша стратегія.

Головне запитання: Чи є конкретна поведінка нормальною?

Основні характеристики даних:

  • доступні статичні та архівні дані, проте або мітки є невідомі, або дуже мало випадків з несправностями спостерігалися раніше, або ж є занадто багато різних типів несправностей;
  • можливо визначити що є нормальною поведінкою і яка ж різниця між поточною та нормальною поведінкою пов’язана з шляхом, який веде до несправності;
  • можливість виявити аномальну поведінку за допомогою цієї моделі є і перевагою і недоліком водночас: модель повинна мати можливість позначити всі типи несправностей, попри відсутність попередніх знань про них. Однак аномальна поведінка не обов’язково призводить до невдачі. І якщо це відбувається, модель не надає інформації про проміжок часу, під час якого ця несправність може трапитися
  • Оцінка моделі для виявлення аномалії також є складною через відсутність промаркованих даних. Якщо доступні хоча б деякі промарковані дані про несправності, їх можна і потрібно використовувати для оцінки алгоритму.

Попередні три підходи застосовуються до прогнозування, надаючи нам достатньо інформації аби випередити несправність шляхом вчасно наданого технічного обслуговування. Однак, якщо ви зацікавлені в самому процесі, який призводить до несправності – остання стратегія для вас.

4. Модель (Survival) для передбачення можливості появи несправності протягом всього часу експлуатації приладу

Головне запитання: маючи набір характеристик, яким чином зміниться ризик виникнення несправності у часі?

Основні характеристики даних:

  • доступні статичні дані, записана інформація щодо кожної несправності, записана дата коли певний прилад вийшов з-під спостереження на предмет несправності;
  • модель оцінює ймовірність виходу з ладу обладнання з урахуванням статичних характеристик. Цей підхід є також корисним для аналізу впливу певних обставин на термін роботи.

Thank You.

The white paper will open in a new window.

If you experience issues with accessing or downloading the white paper, please contact info@globallogic.com.

click here to go back to the Insights page.