Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 2671-9940(Print)
ISSN : 2671-9924(Online)
Journal of the Korean Society of Fisheries and Ocean Technology Vol.56 No.4 pp.384-394
DOI : https://doi.org/10.3796/KSFOT.2020.56.4.384

Outlier detection of main engine data of a ship using ensemble method

Dong-Hyun KIM, Ji-Hwan LEE1*, Sang-Bong LEE2, Bong-Kyu JUNG3
Senior Researcher, Autonomous Ship Technology Center, Korea Marine Equipment Research Institute, Busan 49111, Korea
1Professor, Division of Systems Management and Engineering, Pukyong National University, Busan 48513, Korea
2CEO, LAB021, Busan 48508, Korea
2Professor, Marine Industry Research Center, Gyeongsang National University, Tongyeong 53064, Korea
*Corresponding author: jihwan@pknu.ac.kr, Tel: +82-51-629-6492, Fax: +82-51-629-6478
20200810 20201013 20201109

Abstract


This paper proposes an outlier detection model based on machine learning that can diagnose the presence or absence of major engine parts through unsupervised learning analysis of main engine big data of a ship. Engine big data of the ship was collected for more than seven months, and expert knowledge and correlation analysis were performed to select features that are closely related to the operation of the main engine. For unsupervised learning analysis, ensemble model wherein many predictive models are strategically combined to increase the model performance, is used for anomaly detection. As a result, the proposed model successfully detected the anomalous engine status from the normal status. To validate our approach, clustering analysis was conducted to find out the different patterns of anomalies the anomalous point. By examining distribution of each cluster, we could successfully find the patterns of anomalies.



앙상블 기법을 이용한 선박 메인엔진 빅데이터의 이상치 탐지

김 동현, 이 지환1*, 이 상봉2, 정 봉규3
한국조선해양기자재연구원 선임연구원
1부경대학교 시스템경영공학부 교수
2랩오투원 대표
3경상대학교 해양산업연구소 교수

초록


    Pukyong National University
    C-D-20171500Ministry of Trade, Industry and Energy
    P0006910

    서 론

    해운 산업은 자본 집약적인 사업이다. 한 척의 선박의 건조를 위해서는 선박의 운임과 운영 비용을 고려한 자 본 투자가 선행된다. 선박 총 운영 비용의 약 10~15%가 유지 보수에 사용되고 있어 적절한 유지 보수 선택은 선박 운영 효율성의 개선에 중요한 요소이다. 그리고 화물차나 항공기와 달리 선박의 경우 한번 출항하면 긴 시간 동안 바다를 항해해야 하므로, 운항 중 선박 엔진이 고장 날 경우 매우 큰 경제적 손실이 발생하게 된다 (Lazakis et al, 2010). 따라서 선박 엔진 고장을 사전에 식별하고 정비하는 활동은 매우 중요하다. 현재 선박의 고장 감시 시스템은 경보점을 설정하여 설정치보다 높 거나 낮음을 따라 경보하는 시스템이 대부분이다. 이러 한 고장 진단 체계는 이상 징후를 사전에 예측할 수 없 다. 그래서 고장 사후 조치나 정해진 주기에 따라 정비를 시행하는 계획 정비(PMS: Plan Maintenance System)를 적용하여 정박 시 항구에서 정비 주기가 임박한 선박 엔진 부품을 분해하여 교환, 점검하게 된다(Deris et al., 1999). 이같은 과정은 경제성과 효율성 측면에서 모두 좋지 않은데, 실제 엔진 부품의 상태가 양호하나 정비 주기에 따라 해당 부품을 정비 해야 됨으로 시간과 비용 이 소요될 뿐 아니라, 정비기간동안 운항할 수 없기 때문 에 경제적 손실이 발생한다. . 또한 사고 발생 후 조치 시 고장의 원인 규명이 용이하지 않고 고장 발생으로 인한 대규모 경제적 손실 규모가 커지게 되므로 선박 운영의 신뢰성을 높이는데 제한이 있어 오랜 전부터 예 방정비의 필요성이 요구되고 있었다(Kim et al, 2011). 그리고 최근 해운사의 디지털 물류 중요성이 커지고 있 어 선박 기관 설비를 최소 인력으로 관리, 운영하고 정비 비용과 시간을 아낄 수 있는 예방정비의 중요성은 더욱 커지고 있다.

    최근 위성 통신과 빅데이터 처리 기술의 발전으로 인해 선박을 구성하는 핵심부품의 상태를 실시간으로 수집하 고 모니터링 할 수 있게 되어 데이터에 기반한 선박 운항 효율 개선과 예방정비를 위한 기술적인 토대가 마련되었 다. 다수의 선행 연구에서 센서에서 수집된 마력, 속도 등의 항해정보를 사용하여 선박의 운항효율을 통계적으 로 분석하는 모델을 제안하였다(Mak et al., 2014;Aldous et al., 2015;Soner et al., 2018;Perer and Mo, 2017).

    본 연구는 선박 메인엔진에서 수집된 빅데이터 이상치 분석을 통한 선박 메인엔진 상태 진단 모델 개발을 다루 고 있다. 선박 운항 중 수집된 데이터에 통계적 기법을 사용하여 이상치를 탐지하는 소수의 연구가 존재한다. Bae et al. (2018)은 선박 모니터링을 위해 Phaladiganon et al., (2011)이 제안한 Bootstrap 기반의 T2 다변량 관리 도 통해 선박 메인 엔진의 상태를 모니터링 하는 체계를 제안하였다. 제안된 방법론은 데이터의 분포에 대한 가정 이 필요 없고 다변량 변수의 이상치 탐지로까지 적용을 확대할 수 있지만, 본 연구에서 수행되는 것처럼 다차원, 대량 데이터의 관리선을 설정하기 위해서는 매우 많은 수의 복원추출이 필요한바, 대규모 다차원 데이터의 이상 치 탐지에는 적용하기 어렵다는 단점이 있다. 반면 제안 하는 방법론은 부트스트랩 복원추출과 같은 절차가 필요 하지 않으며, 단일 모형을 학습하여 각 데이터 개체의 이상치 여부를 확률값으로 예측할 수 있다.

    본 연구에서는 7개월 이상 10초 주기의 선박 메인엔 진 운전 데이터를 활용하여 선박 메인엔진의 이상 운전 을 식별할 수 있도록 머신러닝 알고리즘인 앙상블 기법 을 적용하였다. 본 연구의 결과물을 활용하여 메인엔진 의 과거 운항데이터를 학습하고, 실선 메인엔진에 알고 리즘을 적용하여 메인엔진의 이상이 발생할 경우 즉시 이상 정도를 식별 할 수 있도록 연구하였다.

    재료 및 방법

    본 연구에서는 20만톤급 대형 벌크 선박에서 수집된 데이터를 활용하였다. 해당 선박은 20만톤급 벌크선박 으로 철광석 및 석탄을 수송한다. 해당 선박에 대한 제원 이 Table 1에 표현되어 있다. 해당 선박에는 10,000여개 의 센서가 부착되어 있는데 이들 센서는 선박의 GPS 위치, 속력, 풍속, 수심, 흘수 등의 운항 정보 뿐 아니라 메인엔진, 발전기, 보조기기와 같은 선박 추진에 필요한 기관 장비의 운전 상태를 실시간으로 모니터링 할수 있 다. 그리고 센서 데이터 뿐 아니라 선박의 화물량, 입출 항 시간, 항구 정보 수집을 위해 선박 승무원이 기록하는 운항 데이터도 수집하였다. 수집된 데이터는 Fig. 2에 표현된 운항데이터 통합관리 시스템을 통해 위성 통신 을 사용하여 육상으로 전송되어 클라우드형태의 데이터 베이스에 저장하였다.

    본 연구에서는 선박 메인엔진 이상치 탐지를 위해 2019년 7월 15부터 2020년 4월 20일까지 약 10개월 동 안 수집된 데이터를 사용하였다. 10개월간 주요 항해 경로를 Fig. 1에 표시되어 있다. Fig. 1에서 보이듯, 해당 선박은 한국-호주, 한국-미국을 총 3924시간, 48,566 해 상 마일을 운항한 기록을 확인할 수 있다. 또한 Fig. 2와 같이 운항선박에 데이터 취득 장비를 설치하여 선박 의 세부데이터를 획득하였다.

    본 연구의 대상이 되는 메인엔진은 선박의 추진을 담 당하는 핵심 장비이다. 메인엔진에는 연료유 소모량과 메인엔진 회전 RPM을 비롯하여 펌프, 실린더, 배기구, 터보차저 등 엔진 핵심 부품의 상태를 감지할 수 있는 센서가 부착되어 있다. 본 연구에서는 메인 엔진 운전 신뢰성과 관련된 주요 센서를 식별하였다. 해당 센서 목록은 31개로 식별되며 해당 센서 목록과 그에 대한 설명은 Table 2에 정리되어 있다.

    데이터 수집기간동안 10초 간격으로 데이터가 수집 되었으며, 그 결과 총 22,513,800개의 데이터 개체가 수 집되었다. 10초 간격으로 수집된 데이터를 그대로 학습 에 활용할 경우, 알고리즘의 학습시간이 오래 걸린다는 단점이 존재한다. 또한, 선박은 비행기나, 자동차와 같은 운송수단과 달리 정속 운항을 기본으로 하므로 데이터 자체의 변화가 크지 않다. 따라서 10분 평균 데이터의 분석을 통해 이상치가 발생하였다면, 그것은 센서 이상 과 같은 짧은 시간 극단적인 변화 때문에 발생한 것이 아니라, 지속해서 정상 운전상태에서 벗어난 것으로 해 석할 수 있으며, 이를 통해 메인 엔진의 이상을 파악할 수 있다. 마지막으로, 선상에서 수집된 데이터는 분석을 위해 육상으로 보내지게 되는데, 1초 간격의 통신빈도를 유지할 경우 통신비용이 과다하게 발생하므로 현실적인 운영환경과 맞지 않기 때문이다. 따라서 본 연구에서는 엔진 상태 변화의 주기가 짧지 않은 선박의 특성을 감안 하여 10분 간격으로 데이터를 평균내어 총 37,564개의 데이터를 학습에 사용하기로 하였다.

    본 절에서는 선박 메인엔진 이상치 탐지를 위해 사용 된 방법론을 소개한다. 부품의 고장 및 이상 증상을 탐 지하기 위해서는 시간에 따라 제품의 고장상태를 기록 한 시계열 형태의 데이터가 필요하다. 시계열에 따라 부품의 고장/정상 여부가 기록되어 있다면 지도학습 (supervised learning) 방법을 적용할 수 있다. 하지만, 고장비용이 매우 큰 선박의 경우 고장을 예방하기 위한 주기적 정비정책이 실행되므로, 실제 고장여부가 기록 된 데이터를 얻기가 어렵다. 따라서, 본 연구에서는 비지 도 학습(unsupervised Learning)을 통해 엔진 상태의 이 상치를 조기에 파악하는 것을 목표로 한다.

    데이터 수집후에는 데이터 전처리 과정이 시행되었 다. Fig. 3는 시간에 따른 선박 운항속도를 기록한 그래 프이다. 그림에서 보여지듯 선박은 운항상태와 정박상 태로 나누어짐을 알 수 있는데, 선박 엔진은 운항상태에 서만 활용되므로, 전체 데이터 중 운항상태에 해당하는 데이터만을 추출해야한다. 이를 위하여 운항선박의 선 장 및 항해사, 기관사, 육상 선박 관리 전문가 인터뷰 결과 해당 선박 메인엔진의 NCR (Normal Continuous Rating)은 89RPM이나 해당 선박은 회사 지침에 따라 저속운항을 하고 있음을 알 수 있었다. 저속운항 환경에 서는 메인엔진 50% 부하에 해당하는 RPM 70 이상인 경우 안정적인 항해상태로 판단할 수 있다는 의견에 따 라 RPM 70 이상, 89 이하의 데이터만을 추출하였다.

    또한 데이터 특성중 일부가 누락되어 있는 부분을 모 두 제거하였고, 해당 센서 제조사에서 제공하는 센서의 정상 범위를 벗어나는 데이터는 이상치로 간주하여 데 이터를 제거 후 사용하였다. 그 결과 10개월간 수집된 전체 37,564개의 측정 데이터 중 안정적인 항해 상태로 판단되는 13,794개의 데이터가 추출되었다. Fig. 4는 전 처리 후 학습에 사용될 데이터의 시간에 따른 선속 데이 터를 나타내고 있다. 데이터 전처리는 ME_RPM 기준으 로 실시하였으며, 안정적인 항해 데이터를 바탕으로 가 능한 많은 데이터를 사용하여 분석하였다.

    본 연구에서 취득한 데이터에는 엔진의 고장여부나 잔 여수명 등의 정보가 기록되어 있지 않으므로, 엔진 센서 에 기록된 데이터들의 분포만을 이용하여 이상치 탐지 를 수행하였다. 정상데이터의 경우 다수의 유사한 정상 데이터의 경우 다수의 유사한 데이터가 분포를 형성할 것이며, 이상치 데이터의 경우 이러한 정상데이터의 분 포로부터 멀리 떨어져 있을 것이다. 본 연구에서도 이와 같은 원리를 적용하여 엔진 상태 데이터를 파악하고, 이상치 데이터 분류를 위해 다수의 데이터 분포로부터 벗어난 개체를 파악하는 것을 목표로 하였다.

    본 연구에서는 이상치 탐지를 위한 머신러닝 기법으 로 앙상블 기법(ensemble technique)을 활용하였다. 앙 상블 기법이란 같은 데이터에 서로 다른 알고리즘을 가 진 여러개의 분류기를 결합하여 분류의 정확도를 높이 는 기법을 일컫는다. 앙상블 기법은 특정 알고리즘이 지나치게 데이터를 과적합(overfitting)하는 문제를 해결 할 뿐 만 아니라, 예측의 성능을 높일 수 있으므로, 데이 터 분석 분야에서 활발히 적용되고 있는 기법이다. 앙상 블 기법에는 학습에 사용하는 데이터를 복원추출하여 반복적으로 사용하는 bagging 방법과 여러 개의 머신러 닝 모델을 결합하는 stacking 방식이 존재하는데, 본 연 구에서는 stacking 방식을 적용하였다.

    Fig. 6은 선박 엔진 이상치 탐지에 적용된 앙상블 모형 을 설명하고 있다. 그림처럼 같은 선박 데이터를 서로 다른 7개의 이상치 탐지 알고리즘으로 학습하였다. Table 3은 이상치 탐지에 활용된 각각의 알고리즘을 설 명한다. 학습이 끝난 후 각각의 알고리즘을 이용하여 입력데이터 개체가 정상으로부터 얼마만큼 벗어나 있는 지를 측정할 수 있는 이상치 점수(anomaly Score)를 계 산한다. 다음으로 각 모형별로 이상치 점수가 상위 1% 에 속하는 데이터들을 추려내어 이상치로 가정한다. 마지막으로 다수결(majority voting)을 통해 이상치를 검출하는데 전체 7개의 모형 중 과반인 4개 이상의 모형에서 이상치로 검출된 데이터 개체를 이상치로 판단한다.

    결과 및 고찰

    앙상블 기법 적용 결과

    Fig. 7은 앙상블에 사용된 7개 알고리즘에서 계산된 이상치 점수를 데이터 개체에 따라 표현한 그래프이다. 모든 알고리즘에서 높은 이상치 점수를 보이는 소수의 데이터와 낮은 점수를 가진 대다수의 데이터로 구성되 어 있음을 알 수 있다. 이상치 점수의 분포는 ABOD를 제외한 6개의 분포에서는 모두 유사한 패턴을 보이지만, 정확히 일치하지는 않는 것을 확인할 수 있다. 본 연구에 서는 앙상블 기법의 원리에 따라 7개의 알고리즘에서 공통적으로 이상치로 예측된 데이터를 이상치로 판단하 고자 한다. 앙상블 기법의 목적은 가장 유효한 알고리즘 을 선정하는 것이 아니라, 여러개의 알고리즘을 동일한 데이터에 함께 적용함으로써 이상치 검출이 특정 알고 리즘에 종속됨되는 현상을 예방하고 보다 견실한 (robust) 예측을 목적으로 한다(Aggarwal, 2013). 본 연 구에서 사용된 개별 알고리즘은 이상치 점수를 통해 이 상치의 정도를 판단하는데, 알고리즘에 따라 서로 다른 척도를 가지고 있으므로 이를 결합하여 통일된 지표를 구하는 데에 어려움이 있다. 따라서 본 연구에서는 다수 결 투표(majority voting) 기법을 적용한다. 다수결 투표 기법은 과반 이상의 개별 탐지모형에서 이상치로 탐지 된 데이터만 이상치로 간주하는 기법이다.

    군집분석을 통한 이상치 유형 분류

    본 연구에서 제안한 방법론에 따라 13,794개의 관측 치로 구성된 데이터를 학습하였다. 학습결과 과반수 이상에서 이상치로 검출된 개체는 총 57개였다. 본 장에 서는 이상치의 패턴을 보다 자세히 파악하기 위하여 이 상치 데이터에 대하여 군집분석을 실시하였다. 군집분 석은 데이터 개체간의 거리계산을 통해 군집들을 찾아 내는 기법이다. 어떤 데이터 개체들이 같은 군집으로 분류된다면, 이들은 유사한 특성을 가진 데이터라고 해 석할 수 있다. 본 연구에서는 군집분석의 개수를 K개로 정해놓고 이에 맞는 최적의 군집을 찾는 K-means clustering 기법을 사용하였다. K-means clustering 기법 은 최적의 군집의 개수를 사전에 파악할 수 없으므로, 군집의 개수를 바꾸어가며 군집형성의 효과성을 파악하 는 과정이 필요한데, 이를 위해 데이터개체의 평균 실루 엣 지표값이 활용된다. 데이터 개체 i의 실루엣 지표는 다음 식과 같이 정의된다.

    s ( i ) = b ( i ) a ( i ) max ( a ( i ) , b ( i ) )

    여기서 a(i)는 군집의 응집도를 나타내며 해당 개체가 속한 군집 내부의 데이터와의 평균 거리이며, b(i)는 분 리도로서 해당군집에서 가장 가까운 다른 군집에 속한 개체와의 평균 거리를 나타낸다. 실루엣지표는 단위가 존재하지 않으며 –1에서 1의 값을 갖는데 보통 0.5 이상 의 값을 가지면 군집분석이 성공적으로 이루어졌다고 간주한다. 군집의 개수를 변경시켜가며 계산된 실루엣 지표의 변화가 Fig. 8처에 표시되어 있다. 본 연구에서는 군집의 개수를 2개로 설정하여 실험을 수행하였는데 이 상치로 탐지된 개체의 수가 크지 않으며, 군집의 변화에 따른 실루엣 지표의 변화가 크지 않으므로 군집을 2개로 설정하였다.

    군집간 특성비교를 통한 이상치 원인분석

    본 장에서는 이상치의 분포를 정상 분포와 비교하여 이상치가 성공적으로 검출되었음을 보이고자 한다. Fig. 9에 이상치로 판단된 집단 2개(파란색, 주황색)과 정상 데이터 집단(초록색)의 분포가 표시되어 있다. 그림에서 볼 수 있듯 특정한 특성들에서는 집단 간에 명확한 분포 의 차이를 보이는 것을 확인할 수 있다.

    보다 명확한 비교를 위하여 Fig. 10에 동일 데이터를 Boxplot 형태로 표현하였다. Fig. 10에 다른 집단과 확연 한 차이가 보이는 특성들을 이상치 집단에 해당하는 색깔 의 상자로 표시하였다. 노란색 상자로 표시된 영역은 노란 색 집단이 다른 집단과 확연한 차이를 보이는 데이터 특성 들을 의미한다. 눈에 띄는 차이점은 실린더의 출구 냉각수 온도를 의미하는 ME_CYL_CFW_OUTLET_TEMP인 데, 다섯 개의 냉각수 온도가 모두 다른 집단에 비해 확연히 낮은 경향을 확인할 수 있다. 그 외에도 노란색 집단은 재킷워터의 냉각수온도를 의미하는 ME_JCW_ INLET_TEMP도 낮은 것을 확인할 수 있다. 반면 두 번 째 이상치 집단으로 표시된 파란색 데이터들은 다른 집단 에 비해 실린더 배기구 가스 온도와 관련된 ME_CYL_ EXH_GAS_OUTLET 확연히 낮은 것을 확인할 수 있다. 또한 두 이상치 집단은 공통적으로 윤활유 관련 온도와 압력에 이상이 있는 것을 확인할 수 있다. Fig 11에 7개월 간 선박의 선속 기록과 함께, 이상치가 언제 발생했는지 를 표기도어 있다. 그림에서 볼 수 있듯이 이상치는 극히 일부의 구간에서 발생하는 것을 파악할 수 있으며 주로 선박의 가속이 이루어지는 운행 초기 시점이나 변속이 자주 이루어지는 지점에서 발생하는 것을 확인할 수 있 다. 또한 군집분석을 통해 분류한 이상치 유형에 따라 다 른 색깔로 표기하였다. 이같은 분석을 통해 작업자들은 이상치 원인을 시각화하여 빠르게 파악할 수 있다. 집중 하여 엔진이상의 원인을 파악하는데 활용할 수 있다.

    결 론

    본 연구에서는 선박 메인엔진에 부착된 센서로부터 수집된 빅데이터를 활용하여 엔진의 이상을 파악할 수 있는 방법론을 제안하였다. 이를 위해 실선에서 7개월 이상 수집된 데이터를 학습에 사용하였다. 본 연구에서 는 앙상블 기법을 적용하여 여러개의 이상치 탐지 모형 을 동시에 학습하고 이중 과반 이상의 모형에서 이상치 로 탐지된 경우 이상치로 간주하는 모형을 선택하였다. 이같은 방식을 통해 학습데이터의 변동에 덜 민감하면 서도 정확도를 유지하는 앙상블 기법의 장점을 활용할 수 있다 . 또한 검출된 이상치에 군집분석 기법을 적용하 고, 군집간의 데이터 특성의 차이를 그래프로 분석하여 이상치의 특성을 시각적으로 파악할 수 있었다.

    본 연구의 한계점은 다음과 같다. 첫째, 이상치 탐지 의 신뢰성을 높이기 위해 더 오랜 기간의 선박 데이터를 확보해야 한다. 이를 위해 적용 선박의 과거 데이터를 더 사용하거나 동일 기종의 다른 선박 데이터를 함께 사용하는 방안이 있다. 둘째, 앙상블 기법의 개선이 필요 하다. 현재 여러 모형의 동시 학습을 위해 같은 훈련데이 터를 사용하는 stacking 기법을 사용하고 있다. 앙상블 기법의 개선을 위해 데이터의 복원추출을 활용하는 bagging 기법과 stacking 기법을 결합하여 방법론을 개 선할 필요가 있다. 셋째, 본 모형은 anomal score를 통해 이상치의 정도를 정량화 할 수는 있지만 이상치의 원인 이 무엇인지 정량적으로 분석하는데에는 어려움이 있 다. 현재는 군집분석 및 그래프 비교를 통하여 이상치를 발생시키는 특성을 정성적으로 살펴보았으나, 향후에는 이를 정량화하여 표현할 수 있는 기법의 개발이 필요하 다. 이를 위하여 SHAP (Lundberg and Lee, 2017) 등 예측결과의 원인을 정량적으로 분석할 수 있는 기법의 적용이 필요하다.

    사 사

    이 논문은 2017학년도 부경대학교의 지원을 받아 수 행된 연구임(C-D-20171500). 또한 본 논문은 산업통상 자원부의 '국가혁신클러스터R&D' 사업의 지원을 받아 수행된 연구임(블록체인기반 선용품 거래추천시스템 개 발, P0006910).

    Figure

    KSFOT-56-4-384_F1.gif
    Ship route, Korea – Australia / Korea – U.S.A (2019-07-15 ~ 2020-04-20).
    KSFOT-56-4-384_F2.gif
    Data integrated management system.
    KSFOT-56-4-384_F3.gif
    Vessel ground speed time series data (raw data).
    KSFOT-56-4-384_F4.gif
    Vessel ground speed time series data (operational status).
    KSFOT-56-4-384_F5.gif
    Concept of outlier detection.
    KSFOT-56-4-384_F6.gif
    Outlier detection model using ensemble technique.
    KSFOT-56-4-384_F7.gif
    Outlier score for each algorithm.
    KSFOT-56-4-384_F8.gif
    Shilhouette coefficient with varying cluster numbers.
    KSFOT-56-4-384_F9.gif
    Comparison of distribution among two anomalous groups (blue and orange) and normal group (green).
    KSFOT-56-4-384_F10.gif
    Comparison of distribution among two anomalous groups (blue and orange) and normal group (green).
    KSFOT-56-4-384_F11.gif
    Distribution of anomalous point across vessel ground speed time series (blue triangle: cluster 0, orange triangle: cluster 1).

    Table

    Ship particular and main engine specification
    Data list for anomaly detection of main engine
    Outlier detection algorithm used in ensemble technique

    Reference

    1. Aggarwal, C.C.2013. Outlier ensembles: position paper. ACM SIGKDD Explorations Newsletter, 2013, 14, 49-58.
    2. Aldous L , Smith T , Bucknall R and Thompson P. 2015. Uncertainty analysis in ship performance monitoring. Ocean Engineering 110, 29-38.
    3. Bae YM , Kim MJ , Kim KJ , Jun CH , Byeon SS and Park KM. 2018. A case study on the establishment of upper control limit to detect vessel’s main engine failures using multivariate control chart. Journal of the Society of Naval Architects of Korea 55, 505-513.
    4. Deris S, Omatu S, Ohta H, Kutar LCS and Abd Samat P.1999. Ship maintenance scheduling by genetic algorithm and constraint-based reasoning. European Journal of Operational Research 112, 489-502.
    5. Kim KY , Kim YI and Yu YH. 2011. The Fault Diagnosis of Marine Diesel Engines Using Correlation Coefficient for Fault Detection. The Journal of Advanced Navigation Technology 15, 18-24.
    6. Lazakis I , Turan O and Aksu S. 2010. Increasing ship operational reliability through the implementation of a holistic maintenance management strategy. Ships and Offshore Structures, 5, 337-357.
    7. Lundberg SM and Lee SI.2017. A unified approach to interpreting model predictions. In Proceedings of advances in neural information processing systems 2017, 4765-4774.
    8. Mak L , Sullivan M , Kuczora A and Millan J. 2014. Ship performance monitoring and analysis to improve fuel efficiency. In Proceedings of 2014 Oceans St. John's 1-10.
    9. Perera LP and Mo B. 2017. Marine engine-centered data analytics for ship performance monitoring. Journal of Offshore Mechanics and Arctic Engineering 139, 1-28.
    10. Phaladiganon P , Kim SB , Chen VC , Baek JG and Park SK. 2011. Bootstrap-based T2 multivariate control charts. Communications in Statistics - Simulation and Computation 40, 645-662.
    11. Soner O , Akyuz E and Celik M. 2018. Use of tree based methods in ship performance monitoring under operating conditions. Ocean Engineering 166, 302-310.