본문 바로가기

ChemiPLUS

[케미E세이] 생산 엔지니어의 데이터분석대회 1등 수상기

한화토탈에너지스는 지난 2021년부터 임직원들의 데이터분석 역량을 기르고 업무에 활용할 수 있게 격려하기 위해 데이터분석대회를 열어왔는데요. 지난 해 열린 2회 데이터분석대회의 우승자가 바로 저랍니다! 한화토탈에너지스의 테이터분석대회가 어떤 대회인지, 잘 모르시는 분들이 많아 저의 경험과 함께 알려드리겠습니다~ 

 

 

01

한화토탈에너지스 데이터분석대회란?

   

 

2021년부터 개최된 한화토탈에너지스의 데이터분석대회. 데이터분석에 관심이 있는 한화토탈에너지스 임직원이라면 누구나 참여할 수 있는데요. JMP(데이터 분석 소프트웨어)나 파이썬(프로그래밍 언어)을 이용한 머신러닝을 다루며 공장 제품명, 생산량 예측 등 실제 업무와 관련이 있는 주제를 분석하여 ‘데이터 역량’을 강화할 수 있는 좋은 기회랍니다.


제가 우승한 2022년 데이터분석대회의 과제는 공장내의 각종 변수를 이용해 제품명을 예측하는 것이었는데요. 제품을 생산하는 공장마다 제품별 반응기의 온도나 압력과 같은 변수에 차이가 있어 머신러닝을 활용하면 변수별로 값의 차이가 납니다.  이를 분석해 어떤 제품을 생산하는지 예측할 수 있습니다. 대회 과제인 만큼, 여러 변수의 이름이 삭제된 채 공개되었으며 일반적인 공정지식만으로는 예측이 불가능해 어떤 개발환경에서, 어떤 알고리즘을 사용하는 지가 포인트가 됐었죠. 저는 Google Colab* 파이썬을 이용했고 XGBoost**를 통한 머신러닝으로 제품명을 예측할 수 있었습니다.


*Google Colab: 구글에서 제공하는 코딩 개발환경. 별도의 설치 없이 웹에서 편하게 코딩을 하고 구글 서버의 그래픽카드를 이용할 수 있다는 것이 장점


**XGBoost: 머신러닝 알고리즘의 한 종류. Boosting 기법을 병렬 학습하여 성능과 자원 효율이 모두 뛰어난 것이 특징 

 

 

02

데이터 분석, 비전공자도 할 수 있다!

  

 

사실 저는 데이터 분석과 관련된 전공 지식이 없었습니다. 그런 제가 어떻게 대회에 참여할 수 있었을까요?


저는 2021년 여름 한화토탈에너지스의 산학장학생으로 선발되었습니다. 입사까지는 반년의 시간이 남아 다양한 경험을 해보자고 마음을 먹었었죠. 그때 학교에서 주최하는 딥러닝 데이터분석대회 공지를 보았고, 평소 코딩을 배워보고 싶었던 터라 해당 경진대회에 도전하게 되었습니다.


당시 참여했던 대회는 딥러닝 기반의 무인 판매대 상품인식 인공지능 경진대회로 YOLO(You Only Look Once)라는 알고리즘을 활용해 사진이나 영상 속 사물을 인식하고 무인 판매대 솔루션을 구축하는 과제가 주어졌습니다. 이 알고리즘은 아마존 고(Amazon Go) 등 무인 판매대는 물론, 테슬라와 같은 자율주행 자동차에도 사용되는 알고리즘입니다. 한화토탈에너지스의 스마트 플랜트 영상 분석에도 사용되는 ‘객체 인지 알고리즘’이기도 하죠. 저는 YOLOv4 모델을 사용하여 무인 판매대에 놓을 여러 가지 상품을 인식하는 알고리즘을 구축했습니다.


저는 이 과제를 통해 코딩의 기초와 데이터 분석의 개념을 배웠고, 특히 데이터를 알고리즘에 학습시키기 전 미리 가공하는 ‘데이터 전처리’에 대해 많이 알게 되었습니다. YOLO와 같은 객체 인지 기술은 이미지를 학습하기 때문에 텍스트를 처리하는 머신러닝보다 수십 배, 수백 배 많은 데이터를 처리합니다. 따라서 한정된 환경에서 더 정확한 결과를 얻기 위한 데이터 전처리가 매우 중요하죠.

 

 

03

데이터분석대회 1등 소감은...

   

 

한화토탈에너지스 데이터분석경진대회를 위해서는 범주형 분류 알고리즘*을 사용해야 했습니다. 


저는 XGBoost, Random Forest, LGBM 등의 여러 가지 머신러닝 모델을 하나씩 적용해 보고 최적의 모델을 선택해 도입했는데, 그 덕분에 좋은 성적을 거둘 수 있지 않았나 싶습니다. 


또한 EVA공장은 스마트 플랜트 시범공장으로 선정되어 데이터 분석, AR, 영상 분석 등의 디지털 기술을 선적용하고 있었는데요. EVA생산팀의 일원으로서 데이터 분석 역량을 갖추고자 이번 경진대회에 많은 시간과 노력을 쏟았고, 열심히 해보자는 마음이 더 좋은 성과로 이어진 것 같습니다. 


참가에 의의를 두자는 마음으로 대회에 임했는데 운이 좋게도 1등을 수상하게 되어 너무나도 기쁘고 이번 대회 덕분에 데이터 분석 실력도 높일 수 있었습니다. 대회를 주최해 주신 IT전략팀을 포함한 모든 관계자 분께 감사의 말씀 드리고 싶습니다.


*범주형 분류 알고리즘: 특정 데이터들이 어떤 집단(범주)에 속하는지 분류하는 머신러닝 알고리즘 

 

 

04

데이터 분석에 관심이 있다면

   

 

우리 회사에서 대표적으로 사용되는 데이터 분석 도구는 JMP라는 프로그램입니다. 엑셀과 비슷한 UI를 갖고 있는 이 프로그램은 데이터 시각화와 데이터 분석에 강점이 있는데요. 코딩을 활용하면 수많은 코드가 필요한 분석 작업이 마우스 클릭 몇 번으로 해결되기 때문에, 데이터 분석 비전공자 입장에서는 아주 간편하고 강력한 데이터 분석 툴이라고 볼 수 있죠!


얼마전에 저는 ‘JMP Discovery Summit Europe’ 행사에 참여하기 위해 스페인을 방문했습니다. 행사에서는 전 세계 각 분야의 JMP 사용자들과 활용 경험 사례를 나누며 교류할 수 있었는데요. 이 경험을 통해 BASF, Solvay 등 해외 주요 화학 기업들의 JMP를 활용한 데이터 분석 사례를 접할 수 있었고, 현업에서의 JMP 활용 방안에 대해 인사이트도 얻게 되었습니다. JMP의 적절한 활용은 데이터 비전공자에게 큰 도움이 되므로, 업무를 수행하며 꼭 배워 보시기를 권합니다. 


더불어 이 글을 읽고 계신 분들 중 데이터 역량을 강화하고 싶지만, 무엇부터 해야 할지 몰라 고민인 분들이 계신다면, 이론 공부보다는 실습 위주의 교육을 수강하시는 것을 강력하게 추천해 드립니다! 특히 한화토탈에너지스의 사내 파이썬, JMP 데이터 분석 교육은 커리큘럼이 아주 잘 짜여 있고, 사이버연수원이나 한화인재경영원의 Codeit 코딩 강의도 추천할 만합니다. Codeit 강의는 왼쪽에 강의 영상, 오른쪽에 별도의 설치 없이 실시간으로 코딩을 할 수 있는 화면으로 구성되어 있어서, 강의를 들으며 실시간으로 코딩 실습을 할 수 있어 데이터 분석 실력 향상에 큰 도움이  되었습니다. 

 


저의 짧은 수기를 통해 많은 분들이 용기를 갖고 도전해 보셨으면 좋겠고, 더 많은 한화토탈에너지스 선후배분들과 함께 데이터 분석 및 코딩에 대한 재미있는 이야기를 나워보고 싶습니다. 감사합니다!

 

 

 


종합 케미칼 & 에너지 리더,

한화토탈에너지스에 대해 더 알고 싶다면?