2022년부터 생성형 인공지능은 인공지능의 역사에 새로운 변곡점을 낳고 사회적인 화두가 되었다. 20222년에는 생성형 인공지능을 표방하는 챗봇인 챗지피티가 대중에게 공개되었고, 미국의 게임 기획자인 제이슨 엘런이 생성형 인공지능 기반 이미지 생성 프로그램을 이용해 그린 그림 <스페이스 오페라 극장>을 콜로라도 주립 박람회 미술대회에 출품해 1등을 차지하는 사건이 있었다.
일반적으로 인공지능이라고 부르는 기계학습 모델과 기본적인 구조는 유사하지만 데이터 학습과 패턴인식을 기반으로 종국에 행하는 작업이 ‘예측’에 그치지 않고 완전히 새로운 것을 ‘생성’까지 하는 모델을 지칭한다. 즉, 스스로 데이터를 학습하여 학습한 데이터와 유사하지만 완전히 동일하지는 않은 새로운 데이터를 만들어 낸다. 생성형 인공지능은 방대한 양의 데이터를 학습하고 데이터의 공통된 속성과 패턴을 학습한다. 이를 바탕으로 새로운 콘텐츠를 생성한다. 이미지 생성형 인공지능의 경우 대용량의 이미지-텍스트 쌍을 학습한 후 이용자가 메시지를 입력하면 자연어처리시스템이 하듯이 메시지의 주요 텍스트를 인식하고 이에 대한 이미지에 무작위의 점을 단계별로 추가해 알아볼 수 없을 정도로 그림을 망가뜨린 후 이용자의 메시지에 맞추어 다시 그림을 복원하는 과정을 반복한다. 이 과정에서 식별하여 제거한 노이즈의 양과 생성되는 이미지의 관계를 예측해가며 이미지가 생성된다.
현재는 텍스트, 이미지, 음악, 프로그래밍 코드 등을 생성하고 있다. 생성형 인공지능은 기계가 정말 인간의 지능을 가질 수도 있으며, 단순노동이 아니라 인간 고유의 영역인 창의성이나 창작에 기여할 수 있는 역량을 보여주었다. 생성형 인공지능은 ‘예측’을 주요 업무로 하던 인공지능이 ‘생성’까지 할 수 있다는 점에서도 인공지능의 역사에서 변곡점으로 이해되지만 동시에 이전에 없었던 윤리적, 사회적 문제를 낳을 수 있다는 측면에서도 공론화되고 있다. 예를 들어, 텍스트 생성 인공지능의 경우 논문, 비평문, 수필 등의 작문을 하기 위해 인터넷상의 문서를 학습하며, 이미지 생성 인공지능의 경우 아트 공유 플랫폼이나 이미지 공유 플랫폼에서 학습용 이미지를 수집한다. 모든 인공지능 학습 데이터가 그러하듯 이 과정에서 문서나 이미지 사용에 대한 동의를 구하거나 저작권료를 지불하지 않는다. 관련하여 2023년 1월 미국 캘리포니아에서는 예술가들과 이미지 공유 플랫폼인 게티이미지가 이미지 생성형 인공지능을 상대로 지적재산권 침해에 대한 소송을 제기했으며, 국내에서도 인공지능이 생성한 웹툰에 대해 보이콧을 선언했다. ‘AI 보이콧’은 방송작가, 일러스트레이터, 웹소설 작가 등 기존에 예술 창작가로 분류되던 직업군 전반으로 확대되고 있다.
또한 생성형 인공지능은 방대한 양의 데이터에 대해 허가를 받지 않고 수집할 뿐 아니라, 생성된 결과물을 제시할 때도 출처를 밝히지 않는 경우도 있다. 때로는 기업이 생성형 인공지능을 활용하여 작업을 수행하는 과정에서 다른 회사로 기업 기밀정보가 유출되기도 한다. 이는 현재의 생성형 인공지능이 최초의 훈련데이터뿐 아니라 이용자가 입력하는 데이터를 추가로 학습하고 있기 때문이다. 미국의 아마존이나 한국의 삼성 등 기업들은 이러한 이유로 회사 업무를 수행하는데 챗지피티를 사용하지 못하도록 하기도 한다. 각 교육기관에서도 챗지피티의 사용에 대해 규제하거나 최소한의 가이드라인을 제공해 무분별한 사용을 제한하고 있다.
2023년 3월 미래의 삶 연구소(Life of future institute)는 ‘거대 인공지능 실험을 중지하라’는 공개서한을 발표하기도 했다. 현재 공개된 가장 최신의 생성형 인공지능 언어모델인 지피티-4 이상의 인공지능 개발을 최소 6개월간 즉각 중단하라고 주장하면서, 인공지능이 인간에게 끼칠 수 있는 위협에도 불구하고 인간이 이를 완전하게 이해하고 통제하지 못하고 있다는 것이 이유로 거론되었다. 공동 규약이나 외부 기관 감사 등 안전한 관리감독 체계를 갖출 수 있도록 인공지능 개발을 일시적으로 유예해야한다는 것이다. 생성형 인공지능 이전에 제기되었던 데이터 편향 등의 문제가 충분히 논의되거나 해결되지 않은 상태에서 인공지능의 역량이 생성의 범주까지 확대되면서 사회적인 문제가 극대화되고 있다는 점도 지적되었다. 생성형 인공지능이 야기하는 환경문제에 대한 관심도 지속적으로 제기되고 있다. 근본적으로 대용량의 학습 데이터와 이를 처리할 수 있는 컴퓨팅 자원을 가동하는 전력은 엄청난 전기 사용량과 탄소 배출량을 필요로 하지만 이에 대한 정확한 수치를 공개하는 기술기업은 없는 실정이다.
그럼에도 불구하고 생성형 인공지능을 활용하는 분야는 계속해서 증가하고 있다. 생성형 인공지능을 활용해 개인화된 여행 일정, 여행 가이드, 여행 블로그, 여행 사진 등을 생성해주기도 하고, 생성형 인공지능을 활용해 만들어진 드라마나 예능 프로그램도 있다. 생성형 인공지능이 만든 배경음악을 사용한 영화나 생성형 인공지능이 만든 이미지를 배경화면으로 사용하는 홈쇼핑 채널도 있다. 약물 개발이나 새로운 물질을 발견하는 과학 연구 등에도 활용되고 있다. 생산성을 향상하고 기존에 없던 새로운 콘텐츠를 인간과 인공지능의 협업을 통해 생산할 수 있다는 잠재력은 꾸준하게 제기되고 있다. 또한 메타버스에 필요한 다양한 콘텐츠를 생성하는 데 활용되거나 소셜로봇의 행동 패턴을 생성하고 학습하는 데 활용되는 등 다른 플랫폼 및 기술들과 결합하여 더욱 폭넓게 활용될 수 있는 방안이 제기되고 있다.
작성자: 이정현(중앙대학교 인문콘텐츠연구소 HK연구교수)