유튜브에서는 내가 시청한 영상과 비슷한 영상을 추천하고, 내비게이션은 사용자의 운전 습관과 이용 기록, 실시간 도로 상황을 파악해 최적화된 경로를 제안합니다. 스마트폰에서 가전제품까지 실생활에 스며들어 삶의 편의성을 향상시키고 있는 인공지능(AI). 인공지능 기술은 과연 어떤 원리로 우리에게 정보 전달을 하고 있는 것일까요? 또, 어떻게 사용해야 인공지능을 ‘잘’ 사용할 수 있을까요?
01
AI의 판도를 바꾼 Self-attention
2017년 Google은 ‘Attention is All You Need’라는 논문에서 딥러닝 모델 ‘트랜스포머(Transformer)’를 소개했습니다. 이 모델의 가장 큰 특징은 ‘Self-attention’을 사용한다는 것인데요.
‘Self-attention’이란 입력된 문장의 각 단어들이 다른 단어들과 얼마나 유사한지를 측정하여, 문장 내 단어들 간의 관계를 파악하는 기술입니다. 예를 들어 ‘나는 어제 친구와 치킨을 먹었다’라는 문장에서 ‘치킨’, ‘먹었다’를 중요 단어로 인식하고, ‘어제’는 시점을 의미하는 거죠. 문장 내 각 단어들이 어떻게 연관되는지 계산을 통해 이해합니다.
인간에게는 이 일이 당연해 보이지만, 이전에는 컴퓨터가 이러한 관계를 이해하기 매우 어려웠습니다. ‘트랜스포머(Transformer)’는 이 문제를 해결해 인공지능이 사람의 언어를 제대로 이해하고 다양한 언어 작업에서 성능을 발휘하도록 만들었습니다. 이 기술은 ‘챗지피티(ChatGPT)’와 같은 언어 모델 인공지능의 기반이 되었으며 AI 개발의 판도를 바꾸었습니다.
02
초거대 언어모델 인공지능이 만들어지는 과정
초거대 AI 모델은 크게 세 단계를 거쳐 만들어집니다. 먼저, 대규모 데이터를 사용해 기초 모델(Foundation Model)을 구축합니다. 수많은 단어와 문장을 분석해 언어의 전반적인 패턴을 배우는 거죠. 물론, 이 과정만으로는 인간의 언어를 완벽히 이해할 수 없습니다.
두번째 단계는 파인 튜닝(Fine-tuning) 단계로, 특정 데이터를 통해 AI모델을 미세 조정하여 인간의 질문에 더 최적화된 답변을 할 수 있도록 합니다. 인공지능을 작업 및 목적에 맞게 재훈련 하는 거죠.
마지막으로 인간의 피드백을 통한 강화 학습을 거칩니다. AI가 생성한 답변을 인간이 평가하고, 피드백을 바탕으로 재학습과정을 거칩니다.
문제는 이렇게 만들어진 AI모델은 문맥을 이해하는데 뛰어나지만, ‘환각(hallucination)’ 현상이 발생할 수 있다는 점인데요. AI모델이 학습된 데이터를 바탕으로 문장을 만들 때 사실이 아닌 내용을 만들 수 있습니다. 학습된 정보의 한계를 넘어서 창의적으로 문장을 생성 하려하다 보니 발생하는 문제라고 할 수 있죠.
03
인공지능의 강점과 약점 이해하기
그렇다면, 이러한 문제가 생기지 않게 인공지능을 잘 사용하려면 어떻게 해야 할까요? AI를 현명하게 사용하는 첫 걸음은 바로 AI의 강점과 약점을 아는 것입니다.
현재 우리가 사용하는 AI는 [반복 작업, 복잡한 데이터 분석, 외국어 번역, 글쓰기] 측면에서 탁월한 성능을 보입니다. 특히 복잡한 데이터 속에서 패턴을 찾고 대량의 정보를 처리해 핵심을 도출하는 능력은 주요 강점 중 하나죠.
반면, [사고력을 요구하는 논리적 문제나 윤리적 문제] 등에서는 취약점을 갖고 있습니다. 거기다 학습된 데이터를 바탕으로 답변하기 때문에 [창의성] 측면에서도 한계점은 존재하죠. 때문에 많은 부분에서 인간의 개입이 필요합니다.
결국 우리는 AI가 잘하는 영역을 이해해서 적극적으로 활용하는 노력이 필요합니다.
04
다양한 AI경험 쌓기
AI의 강점과 약점을 파악하려면, 다양한 AI 서비스를 경험해 보는 것도 중요합니다. ChatGPT나 번역AI, 이미지 생성 AI 등 다양한 도구를 직접 사용하며 어떤 작업에 사용하면 좋을지, 어떤 작업에 약한지를 직접 체험해보는 것이 좋습니다.
예를 들어, ChatGPT를 사용해 글을 작성하거나 요약하며 AI의 문장 생성 능력을 파악할 수 있습니다. 이미지 생성 AI를 통해 창의적인 작업을 보조할 수 있죠.
특히 AI를 잘 활용하기 위해 필요한 ‘프롬프트 엔지니어링(Prompt engineering)*’ 방법은 다양한 질문을 던지며 경험하는 것입니다. AI를 많이 체험하는 것은 AI가 어떻게 동작하는지, 어떤 상황에서 유용 한지에 대한 이해도를 높일 수 있습니다.
*프롬프트 엔지니어링(Prompt engineering): 생성형 인공지능이 최적의 결과물을 낼 수 있게 프롬프트를 작성하고 정제, 최적화 하는 과정
05
양질의 데이터 모으기
AI를 잘 활용하기 위해 중요한 또 하나는 바로 ‘양질의 데이터’를 확보하는 것입니다. 초거대 언어 모델 인공지능은 크기가 클수록 성능이 좋지만, 이제는 소형 언어 모델 인공지능(SML*)도 양질의 데이터만 있다면 충분히 성능을 발휘할 수 있습니다. 인공지능은 데이터를 학습해 결과를 도출하는 시스템이라 학습된 데이터의 질이 AI 성능을 결정합니다.
앞으로는 기업이 보유한 고유 데이터나 특정 도메인의 데이터를 활용해 학습한 AI 모델들이 더 많이 등장할 텐데요. 평소 자신의 관심 분야에 대한 데이터를 모아 정리하는 습관을 들인다면 AI와 상호작용할 때 더 좋은 결과를 얻을 수 있을 겁니다.
*소형 언어 모델(Small Language Model): 초거대 언어 모델(LLM) 인공지능보다 매개 변수의 수가 적은 언어 모델. LLM의 주요 성능은 유지하되 용량을 줄여 최적화하는 데 초점을 맞춤
인공지능은 잠깐 유행하는 기술일까요? 아니면, 스마트폰처럼 우리 일상을 변화시킬 혁신의 도구일까요? 앞서 설명 드린 것과 같이 현재 AI는 여전히 사람의 개입이 필요한 불완전한 도구입니다. 그러나 그 잠재력은 무궁무진하고, AI가 활약하는 분야에 사용한다면 일의 효율을 높일 수도 있습니다. 데이터 분석, 반복 업무에 AI를 사용하고 인간의 윤리적 판단과 경험을 더한다면 보다 효과적인 결과를 낼 수 있지 않을까요? AI를 적극적으로 활용하고, 기능을 이해하려는 노력은 AI를 현명하게 사용하는 첫 걸음이 될 것입니다.
(글: DT추진팀 배봉환 프로)
종합 케미칼 & 에너지 리더,
한화토탈에너지스에 대해 더 알고 싶다면?
'ChemiPLUS' 카테고리의 다른 글
[케미E세이] 아스펜 옵티마이즈(Aspen Optimize) 24 행사에 발표자로 참석하다! (0) | 2024.09.30 |
---|---|
역사상 가장 친환경적인 대회, 파리올림픽 (0) | 2024.07.23 |
지구를 위한 어둠의 시간, 어스 아워란? (1) | 2024.03.20 |
‘취준시절 나도 궁금했다!’ 신입사원 4인방과 함께 알아보는 한화토탈에너지스, 무물타임! (1) | 2023.09.18 |
[서산탐구생활] 초록의 그늘 아래에서 즐기는 피서 (0) | 2023.08.10 |