바야흐로 디지털 시대...
이제 Social Network로 당신의 관계의 친밀도를 분석할 수 있어요! :)
‘Social Network’ 들어보셨을지 모르겠네요.
웹상에서 이용자들이 인적 네트워크를 형성할 수 있게 해주는 서비스입니다.
저희는 이 Social Network를 이용한 데이터 분석을 해보았습니다. :D
위의 그림과 같은 데이터의 Log를 분석 했는데요. (Log란 데이터의 기록을 말합니다.)
저희는 이 Log를 분석하기 위해 크게 두 가지 Tool을 사용했습니다.
① BAB Social Network
② ProM
먼저, ① BAB Social Network. 웬 밥....? 먹는 밥인가?.... 많이 생소하실 텐데요~
우리 조원 중 (컴퓨터 프로그래밍을 기가 막히게 하는^^) 한 명이 참여한 부산대 산업공학과 연구실에서 개발한 Tool입니다. 아래 그림을 보시죠.
이리도 복잡하게 얽혀 있는 관계들을 분석하는 Tool입니다.
Social Network Algorithm을 이용해 프로그래밍 한 것이죠.
그렇다면 ② ProM은? (BAB에 아직 구현하지 못한 알고리즘은 ProM으로 분석했답니다.)
왼쪽은 Fuzzy Mining인데, 이를 통해 Log의 핵심적인 Event의 흐름을 파악할 수 있어요.
오른쪽은 Heuristic Mining인데요. 보다 자세한 모델을 파악하기 위해 시도해보았습니다.
자, 그럼 본격적으로 Social Network 분석에 들어가 볼까요?
Originator Overview를 이용해 32개의 Originator 중 높은 빈도 수를 가지는 Originator를 중심으로 분석 했어요. (SL1, GC06이 8%, GC05, GC07이 6%, GC04가 5%)
저희가 분석해본 Social Network Algorithm은 총 4가지!
Working Together, Similar Task, Subcontracting, Handover of Work입니다.
먼저, Working Together!
두 originator가 Case에서 함께 발견되는 정도를 Counting하여 Originator들 간의 관련성을 파악하는 알고리즘입니다.
Threshold가 0.2일 때, 주요 Originator의 분포이네요. (SL1, GC07, GC08), (GC05, A63), (GC02), (GC06, etc.) 끼리 함께 일하는 것으로 확인됩니다.
다음은 Similar Task!
여러 Case에서 같은 Activity를 수행하는 Originator들 간의 관계를 파악하는 알고리즘입니다.
위의 도식은 Threshold 0.99에서의 Similar Task Analysis입니다.
다음은 Subcontracting!
쉽게 말해 John이 Mike, Sue, Pete에게 하청을 주는 것이라 생각하면 됩니다.
위의 도식은 Threshold가 0.005일 때, Subcontracting Analysis입니다.
마지막으로 Handover of Work!!
연속되는 Activity를 수행하는 Originator 사이의 관계를 파악하는 알고리즘이에요.
SL1이 GC03, GC07 등에게 Handover 하는 것이 보이나요?
이상으로 저희의 분석은 끝이구요!
이러한 분석을 통해 Originator간의 관계를 대략적으로나마 파악했습니다.
위와 같은 결과가 나오는군요.
결론적으로,
항만 물류는 작업장이 매우 넓고, 많은 작업자와 설비에 의해서 물류작업이 됩니다.
컨테이너를 운반하는 크레인과 트럭이 매우 많고, 복잡한 관계를 띄고 있구요.
저희는 작업주체인 크레인과 트럭간의 관계를 분석했습니다.
작업빈도가 높은 QuayCrane과 YardCrane으로 추측되는 SL1과의 관계에 초점을 맞추었습니다.
SL1의 경우 YardCrane의 집합일 거라고 추측해봤습니다.
QuayCrane과는 다르게 Originator가 하나의 그룹으로 주어진 이유나 그들 간의 관계를 더 자세히 파악하기 위해서는 Domain Knowledge가 필요할 것으로 예상됩니다.
이상 BAB으로 Social Network 정복하기였습니다.
부족한 점이 많으나 배워가는 과정이니 이해 부탁드려요^^
// 블로그 주인의 Comment
본 블로그는 부산대 산업공학과 수업 중 하나 인 '데이터 마이닝' 에서 텀프로젝트 결과물을 최대한 쉽게 올려놓은 것입니다. 보고서는 제가 쓴 것이 아니지만 제 블로그에 올리는 이유는 추억을 담기 위해서 입니다. 혹시나 다른 분들 보시고 틀린 점이 있더라도 학부생의 귀여움으로 보아주시면 감사하겠습니다 :)