From Plato’s cave to AI-made films and virtual K-pop stars, the rise of generative tools is eroding the boundary between original creation and imitation.
Members of the AI-generated K-pop girl group Zephyr, created by startup Higgsfield using ByteDance's Seedance 2.0 video-generation model, are shown in this image captured from the company's YouTube channel. Higgsfield, legally headquartered in Kazakhstan and founded in San Francisco by Silicon Valley engineers from Kazakhstan, recently introduced Zephyr, highlighting the rapid advances in AI-generated entertainment.HIGGSFIELD YOUTUBE CAPTURE
Kim Dae-shik
The author is a professor at KAIST.
GoogleAdmanager-KJD
The ancient Greek philosopher Plato argued that the world we see and experience is not ultimate reality but merely a shadow of perfect forms existing in the realm of Ideas. Like prisoners confined throughout their lives in a dark cave, mistaking shadows cast on the wall for truth, human beings confuse perception with reality. Plato called such imitation of truth "mimesis," and he regarded painters and sculptors with particular suspicion because they merely imitated an imitation.
Ironically, the very artists Plato criticized took immense pride in their ability to reproduce reality. The fifth-century B.C. painter Zeuxis famously boasted that his painting of grapes appeared so lifelike that birds tried to peck at them. His rival Parrhasius responded that deceiving birds was hardly impressive because he could deceive people. Inviting Zeuxis into his studio, Parrhasius claimed that an even greater painting was hidden behind a curtain. As Zeuxis reached to pull the curtain aside, he realized that the curtain itself had been painted. Accepting defeat, he acknowledged Parrhasius as the superior artist.
The painted curtain, the picture supposedly concealed behind it and the two painters themselves could all be understood, following Plato's reasoning, as mere shadows of truth. Yet one might ask whether Plato's own brain, along with the mouth and tongue through which he expressed such arguments, were themselves also forms of mimesis. If everything is ultimately an imitation of something else, does the distinction between original and copy retain any real meaning?
Three years have passed since ChatGPT ushered in the era of generative artificial intelligence. More recently, major technology companies have begun using AI to improve AI itself, accelerating the pace of progress once again. Generative AI is evolving into agentic AI, while AI-based image and video generation has advanced at remarkable speed.
During the past two years, AI has already demonstrated its ability to create visual content. Image generators such as Midjourney and DALL·E could instantly produce a picture in response to prompts such as "Draw a cute cat." Yet these systems suffered from a fundamental limitation: They struggled to edit existing creations consistently. Asking for a ribbon to be added to the cat's head usually produced not the same cat with a ribbon but an entirely new cat.
The reason lies in the architecture of large language models, which rely on transformer models. Because transformers generate outputs probabilistically rather than deterministically, identical prompts often produce slightly different results. That variability poses little problem for personal use, but it presents a serious obstacle for commercial production. Few audiences would pay to watch a feature-length film if its main character's face changed every few seconds.
Maintaining visual consistency in transformer-based AI content has long been considered an exceptionally difficult mathematical challenge. Yet beginning with Google's Nano Banana, released in 2025, AI systems became capable of preserving consistent images across multiple scenes. Even more striking is Seedance 2.0, unveiled earlier this year by ByteDance, the Chinese company best known for TikTok. The model can generate videos approaching Hollywood-level quality.
OpenAI CEO Sam Altman attends a talk session with SoftBank Chairman and CEO Masayoshi Son in Tokyo on February 3, 2025. AI company Anthropic said on Feb. 27 that it would not give the U.S. Department of Defense unrestricted use of its technology despite pressure to comply from the Pentagon. Washington had given the AI startup until that day to agree to unconditional military use of its technology, even if it violates ethical standards at the company, or face being forced to comply under emergency federal powers. Hours later, OpenAI CEO Sam Altman announced a deal with the Pentagon to use its models, with ″technical safeguards″ that the Defense Department agreed to in place.AFP/YONHAP
To make such models truly practical, however, additional AI systems specialized in video editing are required. That explains the emergence of companies such as Runway and Higgsfield. Higgsfield is particularly intriguing. Legally headquartered in Kazakhstan but founded in San Francisco by Silicon Valley engineers from Kazakhstan, the startup recently launched an AI-generated K-pop girl group called Zephyr using Seedance 2.0. It also screened a 95-minute AI-produced feature film at the Cannes Film Festival.
Reasonable debate remains about the artistic quality of AI-generated movies and virtual K-pop stars. One fact, however, is difficult to dispute: productivity. Higgsfield reportedly reduced the production cost of a feature film from more than 70 billion won to roughly 700 million won while completing the project with only 15 people. AI-generated K-pop groups can also be created almost endlessly. If Zephyr fails to attract audiences, another virtual group can simply be generated the following week. Traditional entertainment companies, by contrast, invest enormous sums and spend years training performers before they ever debut.
If Plato could witness AI producing writing, paintings and videos that are increasingly difficult to distinguish from human creations only three years after ChatGPT's debut, what would he think? And where will AI-driven mimesis stand three years from now, or 30 years, or even 300 years into the future?
In a world where nearly anything can be generated and imitated at will, what will separate the original from the copy? Living in 2026, between human creativity and AI-generated mimesis, we may prove to be the last generation that still remembers there was once a meaningful distinction between imitation and originality.
미메시스의 미래
김대식 KAIST 교수
고대 그리스 철학자 플라톤은 우리가 보고 느끼는 현실은 진정한 참이 아닌, 이데아 세상에서만 존재하는 완벽한 존재의 그림자일 뿐이라고 주장한 바 있다. 마치 평생 어두운 동굴에 갇혀 사는 자들이 벽에 비친 그림자를 진실로 착각하듯, 우리 역시 지각과 진실을 혼동하고 있다는 것이다. 진실의 모방을 ‘미메시스’라고 불렀던 플라톤은 특히 이런 미메시스를 또다시 모방하려는 화가와 조각가를 극도로 혐오했다.
하지만 정작 혐오의 대상이었던 고대 그리스 화가와 조각가들은 현실을 모방하는 자신의 능력에 대한 자만심으로 가득했다. 특히 기원전 5세기 화가 제욱시스는 자신이 그린 포도나무가 너무나 현실적이어서 새가 포도알을 쪼려고 했다며 자랑한다. 그러자 라이벌 화가 파라시오스는 새 같은 동물이야 누구나 속일 수 있지만, 자신은 사람도 속일 수 있다고 주장한다. 증거를 보여달라는 제욱시스를 스튜디오로 초대한 파라시오스는 사람도 속일 수 있는 그림이 커튼 뒤에 있으니 열어보라고 했고, 커튼을 열려던 제욱시시는 그 커튼 역시 그림이었다는 사실을 느끼고 파라시오스가 자신보다 더 훌륭한 화가라고 인정한다.
그림으로 그려진 커튼 뒤에 있는 그림. 그리고 그런 그림을 보러 간 제욱시스와 파라시오스. 이 모든 것들은 플라톤이 말한 대로 진실의 그림자인 미메시스일 뿐일 수 있다. 하지만 그런 생각을 하는 플라톤의 뇌와, 그런 말을 하는 플라톤의 입과 혀 역시 미메시스에 불과하지 않을까. 어차피 모든 게 모방의 모방이라면, 모방과 진실의 차이에 대한 논의 역시 무의미하지 않을까.
3년 전 챗GPT의 등장으로 생성형 인공지능(AI) 시대가 열렸다. 최근 빅테크들이 AI를 사용해 AI를 개선하기 시작하면서, 그 기술 발전속도가 다시 한번 빨라지고 있다. 덕분에 생성형 AI는 에이전틱 AI로 진화하기 시작했고, AI 기반 이미지와 영상 생성 기술 역시 최근 급격히 발전하고 있다. 물론 지난 2년 동안 우리는 이미 AI로 콘텐트를 만들 수 있었다. 이미지 생성 AI인 미드저니나 달리에 “귀여운 고양이 그려줘”라고 명령하면, 순식간에 귀여운 고양이 그림을 생성해주었다. 하지만 문제는 편집이 불가능했다는 점이다. “고양이 머리에 리본을 그려줘”라고 입력하면, 리본 쓴 고양이가 만들어지지만, 매번 새로운 고양이가 그려진다. 생성형 AI의 기반인 거대언어모델 (LLM)은 트랜스포머 모델을 사용한다. 하지만 트랜스포머는 본질적으로 정보를 확률기반으로 추론하기에, 동일한 프롬프트를 입력하더라도 대부분 조금씩 다른 결과물이 만들어질 수밖에 없다. 이렇게 생성된 콘텐트는 개인적으로 사용하는 데는 큰 문제 없겠지만, 돈을 벌 수는 없다. AI로 만들어진 장편영화 주인공의 얼굴이 몇 초마다 바뀐다면, 그런 영화를 관객이 돈을 주고 볼 일은 없을 테니 말이다.
트랜스포머를 기반으로 한 AI 콘텐트 모델의 일관성 유지는 수학적으로 매우 어려운 문제다. 하지만, 2025년 구글이 출시한 나노바나나를 시작으로 이미지들의 일관성 유지가 가능해졌다. 특히 틱톡으로 유명한 중국 바이트댄스가 올해 초 공개한 시댄스 2.0은 기존 할리우드 영화 수준의 영상을 생성해낸다. 시댄스 2.0 같은 AI 콘텐트 모델을 더 정교하게 활용하기 위해서는 영상편집에 특화된 모델이 추가로 필요하다. 런웨이나 힉스필드 같은 회사들이 존재하는 이유겠다. 특히 힉스필드는 매우 흥미로운 회사다. 카자흐스탄에 법인을 둔 힉스필드는 카자흐스탄 출신 실리콘밸리 엔지니어들이 샌프란시스코에 설립한 스타트업이다. 그런 힉스필드가 최근 중국 시댄스 2.0 모델을 활용해 인공지능 K팝 걸그룹 ‘제피르’를 론칭했고, 얼마 전 칸 영화제에서는 AI로 제작한 95분짜리 영화까지 상영했다.
AI로 만든 K팝 스타와 영화의 퀄리티에 대해서는 충분히 논란이 가능하겠지만, 한 가지만은 분명하다. 바로 생산성이다. 힉스필드는 기존 700억원 넘게 드는 영화 제작비용을 7억원으로 줄였고, 단 15명의 인원으로 AI 영화를 제작했다고 한다. 더구나 AI로 만든 K팝 스타들은 대량생산까지도 가능하다. 제피르가 흥행에 실패하면, 다음 주 새로운 그룹을 생성하면 될 테니 말이다. 몇 년 동안 연습생을 키우고 엄청난 비용을 투자해야 하는 기존 엔터테인먼트 회사들의 고민이 커질 수밖에 없는 이유다.
챗GPT 등장 3년 만에 현실과 구분하기 어려운 수준의 글과 그림과 영상을 만들고 있는 AI를 플라톤이 봤다면 어떤 생각을 했을까. 그리고 앞으로 3년, 30년, 아니 300년 후 AI는 어떤 수준의 미메시스까지 만들어낼 수 있을까. 모든 것을 언제든지 생성하고 모방할 수 있을 미래에 원작과 창작의 차이는 과연 무엇일까. 인간이 만든 오리지널과 AI가 만드는 미메시스 세상 사이에 사는 2026년 우리는 어쩌면 모방과 오리지널 이 두 단어의 차이를 기억하는 마지막 세대가 될 수도 있겠다.
This article was originally written in Korean and translated by a bilingual reporter with the help of generative AI tools. It was then edited by a native English-speaking editor. All AI-assisted translations are reviewed and refined by our newsroom.