구글의 제미나이(Gemini) 앱

2024.03.20 16:37:18

배광식 칼럼

인공지능(AI)은 인간과 같은 지능을 가진 기계를 만들고자 하는 노력으로, 70년의 역사가 있고, 크게 4번의 주요 흐름을 거쳤다.

 

1)초기 연구(1950년대-1970년대). 1956년 다트머스 회의에서 “인공지능”이라는 용어가 처음 사용되었고, 앨런 튜링의 튜링 테스트를 통해 인공지능의 가능성을 제시했고, 논리적 추론에 기반한 전문가 시스템(expert system)이 개발되었으며, 게임 플레이, 자연어 처리, 증명 등 특정 분야에서 성공을 거두었지만, 일반적인 지능을 구현하는 데는 한계가 있었다.

 

2)침체기(1970년대-1980년대). 초기 AI 연구의 한계와 높은 기대에 대한 실망으로 AI 연구에 대한 투자가 감소했으며, AI 연구는 전문가 시스템, 퍼지 논리, 신경망 등 특정 분야에 집중되었고, 컴퓨팅 성능 향상과 알고리즘 발전에도 불구하고, 일반적 지능을 구현하는 데 여전히 어려움이 많았다.

 

3)부활(1990년대-2010년대). 딥러닝 기술 발전과 컴퓨팅 성능 향상으로 AI 연구가 재활기를 띠었고, 이미지 인식, 음성 인식, 기계 번역 등 다양한 분야에서 딥러닝 기반 AI 모델이 성공을 거두고, 빅데이터 등장으로 AI 모델 학습에 필요한 데이터 확보가 용이해졌고, 구글, 페이스북, 애플 등의 IT 기업들이 AI 연구에 투자하며 AI 기술 경쟁이 심화되었다.

 

4)현재 (2020년대). 자율주행, 의료 진단, 금융 분석, 로봇 공학 등 다양한 분야에서 AI 기술이 활용되며 우리 삶에 큰 영향을 미치고 있고, 인공지능 윤리, 편향 문제, 안전성 등 AI 기술의 부정적 측면에 대한 논의도 활발히 이루어지고 있다.


구글의 거대 언어 모델(LLM)인 AI 챗봇 바드(Bard)가 2024년 2월 8일부터 공식적으로 ‘제미나이(Gemini)’로 리브랜딩해 명칭이 바뀌었다. 구글은 우선 자사의 모든 AI 제품 이름을 ‘제미나이’로 통합한다고 밝혔다. ‘(명칭 통합은) AI 관련된 제품과 서비스를 일컫는 생태계를 지칭하는 용어로 확대된 것’이며 ‘단순히 모델 이름을 넘어 멀티모달이라는 제미나이의 핵심 기능을 부각하기 위한 것’이다.


작년 12월 6일 공개된 제미나이 1.0은 텍스트뿐 아니라 이미지·음성·영상을 생성하는 멀티모달 기반의 AI 모델이다. 학습 규모에 따라 울트라(Ultra)·프로(Pro)·나노(Nano)로 나뉜다. ‘제미나이 울트라’는 가장 큰 규모로 챗GPT의 GPT-4와 경쟁에 들어갔다.

 

울트라는 작년 12월 공개 당시 수학·물리학·역사 등 50여개 주제를 활용해 지식과 문제 해결 능력을 평가하는 대규모 다중작업 언어 이해(MMLU)에서 정답률 90%로, 오픈AI의 GPT-4(86.4%)는 물론, 인간 전문가 점수(89.8%)를 넘은 최초의 모델이다.

 

‘프로’는 여러 분야에 광범위하게 적용되는 최적의 중형 모델이고, ‘나노’는 휴대폰 등에 탑재될 수 있는 소형 on-device 모델이다. 제미나이 울트라 출시 후 일주일 만에 제미나이 1.5프로가 출시되었고, 이는 영상 1시간, 오디오 11시간, 책 10권 이상, 코드 3만줄 및 70만개가 넘는 단어 등을 포함해 방대한 양의 정보를 한 번에 입력 처리할 수 있으면서도 NIAH(Needle in a Haystack, 모래사장에서 바늘 찾기) 벤치마크에서 99% 이상의 높은 능력을 보여준다. 제미나이 1.5프로는 더 적은 컴퓨팅 자원으로 제미나이 1.0 울트라에 필적하는 성능을 갖추고 있다. 


챗GPT처럼, 제미나이 앱(https://gemini.google.com/app)에 프롬프트를 입력하면, 이미 알고 있거나 기타 구글 서비스 등 다른 출처에서 가져오는 정보를 활용해 답변한다. 한 질문에 항상 세 가지 답변을 한다. 구글이 강력한 검색엔진의 특성을 가져 검색결과가 나열되던 것이, 제미나이 앱에서는, 제미나이가 생성형 AI인 까닭에 생성된 대답 중에 환각(Hallucination)현상으로 오답이나 엉뚱한 답을 꾸며내, 부정확한 정보를 제공하거나 불쾌감을 주는 대답을 하는 등 실수를 할 수 있다. 이를 보완하는 장치로 정확도를 확인하기 위해 답글 끝의 ‘구글 로고(G)’를 클릭하면 답글에 워터마크 없는 텍스트는 대답을 평가하기 위한 정보가 충분하지 않다는 의미이고, 주황색 워터마크 부분은 Google 검색에서 대답과 다른 콘텐츠를 찾았거나 관련 콘텐츠를 찾지 못했다는 것을 의미한다. 초록색 워터마크 부분은 Google 검색에서 대답과 유사한 콘텐츠를 찾았다는 의미이다. 그러나 검색으로 찾은 웹 콘텐츠도 정확하지 않을 수 있다.

 

따라서 대답 확인 기능으로 식별된 콘텐츠와 그 맥락을 잘 읽고 검토해 신중히 평가해야 한다. 답글 끝의 ‘thumb up 부호’ 또는 ‘thumb down 부호’를 클릭해 피드백 의견을 줌으로써 제미나이 개선에 도움을 줄 수 있고, ‘세로3점‘을 눌러’ ‘법적문제신고’도 할 수 있다. Gemini가 특정 웹페이지에서 장문의 인용구를 가져오는 경우, 해당 페이지를 출처로 표시한다.


구글 크롬 브라우저 우측 상단(아이폰은 좌측상단)의 삼각플라스크 모양은 ‘서치랩스(Search Labs)’로서, 작년 11월 9일, 미래형 검색 경험인 ‘서치랩스’ 및 ‘생성형 AI 검색(Search Generative Experience, SGE)’을 출시했다. 기존의 영어, 일본어, 힌디어에 더해 한국어, 스페인어, 포르투갈어, 인도네시아어 등 총 4가지 언어를 추가했으며 서치랩스와 생성형 AI 검색을 이용할 수 있는 국가도 한국을 포함해, 멕시코, 인도네시아 등 총 120개국으로 확대되었다.

 

초기 단계의 구글 제품들을 실험적으로 이용해보고 피드백을 나눌 수 있는 새로운 프로그램인 서치랩스는 안드로이드 및 iOS 환경 내 ‘구글’ 모바일 애플리케이션과 데스크톱의 크롬 브라우저로 이용할 수 있다. 각 환경에서 구글에 접속 시 상단의 삼각플라스크 아이콘을 클릭해 ‘SGE, 생성형 AI 검색’을 활성화하면 새로운 검색 경험이 가능하고, 검색 결과의 정보를 뒷받침해주는 리소스 링크를 표시해 이용자들이 직접 정보를 확인하고 더 자세히 찾을 수 있도록 지원한다.

 

향후 인공지능 기술 발전은 새로운 산업을 창출하고 기존 산업을 변화시킬 것이며, 또한 의료, 교육, 환경 등 다양한 분야에서 사회 문제 해결에 기여할 수 있다. 하지만 동시에 윤리적 문제, 편향 문제, 안전성 등 해결해야 할 과제도 산적해 있으며, 인공지능 기술을 올바르게 사용하고 관리하기 위한 노력이 필요하다.

 


 ※ 이 글은 본지 편집방향과 다를 수 있습니다. 

배광식 서울대 치의학대학원 명예교수
Copyright @2013 치의신보 Corp. All rights reserved.



주소 서울시 성동구 광나루로 257(송정동) 대한치과의사협회 회관 3층 | 등록번호 : 서울,아52234 | 등록일자 : 2019.03.25 | 발행인 박태근 | 편집인 이석초 | 대표전화 02-2024-9200 FAX 02-468-4653 | 편집국 02-2024-9210 광고관리국 02-2024-9290 Copyright © 치의신보. All rights reserved.