
최근 인공지능(AI) 기술의 발전 속도는 가히 눈부시다. 불과 십 수년 년 전만 해도 AI는 주어진 규칙에 따라 동작하는 프로그램이나 간단한 머신러닝 알고리즘 정도였지만, 이제는 방대한 데이터를 스스로 학습하고 추론하는 딥러닝 시대로 접어들었다. 2017년에 ‘트랜스포머(Transformer)’라는 새로운 구조가 소개되어 AI 언어 모델의 성능을 획기적으로 끌어올렸고, 이는 오늘날 유행하는 대규모 언어 모델(LLM)의 토대가 되었다. 이러한 소프트웨어 발전의 배경에는 하드웨어 기술의 진보도 큰 역할을 하였다. 그간 컴퓨터 성능의 핵심은 중앙처리장치(CPU)였고, 이는 복잡한 연산을 순차적으로 처리(직렬식)하는 방식이다.
한편 컴퓨터 게이머들에게나 주로 관심을 받던 그래픽처리장치(GPU)는 수천 개의 코어로 동시 연산을 수행하는데 특화되어 있었고 CPU의 보조역할을 할 뿐이었다. 하지만 이러한 GPU의 병렬처리 특성은 대규모 AI 모델 학습에 필요한 방대한 연산에 적합하였고, AI시대의 총아로서 그간 반도체 시장을 호령하던 CPU 제조회사들을 밀어내고 단숨에 대표기업인 엔비디아를 시총 세계 1위의 회사로 만들어 주었다.
이렇게 갑작스레 우리 곁에 다가온 대표적 인공지능인 LLM은 불과 1-2년 사이에 우리의 생활을 급격히 변화시키고 있으며, 기존의 컴퓨터와의 상호작용 방식을 근본적으로 변화시키고 있다. 불과 몇 년 전만 해도 인공지능 모델들과의 소통은 정해진 명령어를 입력하고 기계적인 응답을 받는 수준에 그쳤지만, 오늘날의 LLM은 마치 인간과 대화하듯 자연스러운 응답을 제공하며 수개월이 멀다 하고 새로운 기능으로 인류를 놀래키고 있다. 이번 시론에서는 독자들의 AI 상식에 도움을 드리고자, 필자가 잠시라도 경험해 보았던 대표적 LLM 모델들(중국 모델은 제외)중 몇 가지를 소개하고, 인공지능 시대를 맞이하는 필자의 소견을 공유하고자 한다.
첫번째로 소개하는 Open AI사의 ChatGPT는 대중에 가장 큰 놀라움과 충격을 주었고 계속 업그레이드 되며 아직까지 최고의 성능을 보이고 있다. 코드작성, 문서생성, 요약 등 텍스트 기반 작업에 탁월한 성능을 보이고, 동사에서 출시되는 텍스트 기반 영상제작 프로그램(SORA), 그래픽 제작프로그램(DALL-E) 역시, 타 회사에서 나오는 모델들 보다 비용은 좀 높은 편이지만 종합적으로는 최고의 성능을 나타내고 있다. 후발주자와의 경쟁을 의식해서인지 월 20불 구독료의 Plus모델에서도 월 200불 모델에서나 제공하던 심층분석 옵션을 월 10회 제공하고, 최근에는 업로드한 사진을 지브리 유형의 만화로 바꿔주는 서비스로 세계적으로 화제가 되기도 하였다. 필자는 Plus모델을 호기심 반으로 구독하고 있는데, 장거리 운전을 할 때 앱을 키고 대화(영어 및 기타 외국어로도 가능)를 나누면 꽤 그럴듯하게 자연스럽고, 마치 마블영화 아이언맨의 인공지능 조력자로 나오는 쟈비스가 연상되기도 한다.
다음으로 ChatGPT 개발진이 나와서 창업한 Anthropic사의 Claude(3.7 Sonnet)도 평이 좋은데, 이는 광학문자인식(OCR) 등 이미지화된 텍스트를 인식하는 것과 복잡한 질문의 이해에 장점이 있다고 한다. 이런 특성으로 법조계에 종사하는 분들이 평하길 법정제출 의견서 초안 작성 시 다른 엔진보다 문장이 자연스럽고 변호사의 복잡한 명령을 잘 반영해준다고 하며, 인턴 변호사 두 명의 역할은 충분히 한다고 한다.
다음으로 Gemini(2.0 Flash)는 수년 전 알파고로서 인공지능의 위력을 처음 선보였던 구글이 개발한 것이기에 처음에는 많은 기대를 모았으나, Open AI와의 성능 비교에서 기대에 미치지 못하였고, 텍스트와 이미지를 함께 처리하는 멀티모달(multimodal) 능력에 장점은 있지만, OCR 성능은 Claude에 미치지는 못하다는 평가이다. 하지만 저력의 구글이기에 미래가 더 기대되는 모델이다. 다음으로Meta사의 Llama 3은 비 중국산 모델 중 유일하게 오픈소스로 공개된 것으로서 누구나 무료로 활용하고 모델을 함께 발전시킬 수 있다는 점이 큰 장점이다. 하지만 다른 엔진에 비해서는 일반 대중에 대한 범용성은 떨어지는 느낌이다.
마지막으로 Perplexity는 실시간 웹 검색과 LLM을 결합하여 최신 정보 탐색에 강점을 지닌 AI 엔진인데, 특히 학술분야의 자료를 검색하고 정리하는데 탁월하여 현재 학계에서는 가장 많이 사용되고 있다. 하지만 언어모델 자체보다는 검색기능에 무게를 두고 있어 창의적인 콘텐츠 생성에는 한계가 있다.
이외에도 하루가 멀다 하고 많은 새로운 AI엔진들이 시장에 나오고 있고, 각각의 장점을 내세우고 있다. 마치 예전 PC통신, 인터넷 초기시절 다양한 웹브라우져, 포털사이트들이 나와 경쟁하던 것이 연상되는데, 지금과 비교해 보면 그 수준은 유치하기 짝이 없었지만 당시에는 신세계를 경험하는 듯 했었다. 세상에 나온 지 몇 년 되지도 않은 LLM들은 이미 다양한 콘텐츠 제작이나 고객응대와 같은 비즈니스 분야에서부터, 코드작성과 디버깅 등의 소프트웨어 개발 업무, 기계공학, 바이오 제약분야까지 그 응용은 급속도로 확대되고 있다. 다행이 아직까지 이러한 LLM의 발전은 우리 사회 전반에 긍정적인 변화만을 가져오고 있는 듯 하다.
하지만 이런 변화에 대해 여러가지 우려도 커지고 있다. LLM이 생성한 정보의 신뢰성과 정확성, 데이터 편향성, LLM이 이용하는 자료에 대한 지적재산권 문제 그리고 인공지능으로 인한 인간들의 역할 변화(일자리 등)에 대한 것이 대표적이다. 실제로 많은 LLM 모델들은 때때로 ‘환각(hallucination)’이라고 불리는 오류를 일으켜 사실이 아닌 정보를 진실인 것처럼 포장하여 제시하기도 하고, 인공지능이 산출해낸 다양한 결과물은 인간의 것과 동등하거나, 점차 인간보다 우수한 경우가 많을 것이므로 그간 인간만이 하던 많은 일들의 의미가 퇴색되고 인간의 역할을 대치하는 상황이 될 수도 있다. 그러면 인간은 전혀 새로운 차원에서의 삶의 의미와 역할을 찾아야 할 것이고, 이것이 인류의 행복을 증진시키는 방향이 될는지 아니면 점차 무기력해지는 인류 도태의 시발점이 될는지는 누구도 장담키 어려울 것 같다.
당연하겠지만 치의학분야에서도 인공지능의 활용 가능성은 매우 클 것이다. 이미 영상진단, 교정치료 분야에는 구 버전의 형태이긴 하지만 임상에 적용이 되어 왔었고, 환자 교육 및 상담 시 24시간 응답해줄 수 있는 시스템을 구축하거나, 애매한 임상상황에서 치료의 방향을 결정할 때 LLM의 조언을 참고하는 것은 누구라도 쉽게 생각할 수 있는 응용분야이다. 교육 분야에서도 학생들에게 보다 세심한 맞춤형 학습 및 가상 임상실습환경을 제공할 수 있을 것이다. 다만 의료 분야의 적용에 있어서는 환자의 건강과 안전에 직결되는 만큼 좀 더 신중하여야 하고 반드시 전문가의 최종 검증과 판단을 거쳐야 할 것이다.
이미 인공지능으로 바뀌어 가는 세상의 흐름은 돌이킬 수 없다. 과거 경험으로 지금의 인공지능에 대한 경이로움도 10년 즈음 후에는 유치해 보일 듯 하지만, 이를 우리의 행운이자 특권이라고 생각하고, 내일은 또 어떤 인공지능 모델이 우리를 놀라게 할까를 기대해 보며 그저 즐거운 마음으로 신문물(?)을 즐겨보자.
※ 이 글은 본지 편집방향과 다를 수 있습니다.