[VIBE MAKERS Season 2] 생성형 AI를 활용한 나만의 동화책 만들기

홍민지, 조해창
MODULABS
YouTube 2025

Abstract

본 영상은 생성형 AI 기술을 활용하여 사용자가 입력한 키워드와 주제를 바탕으로 맞춤형 동화책을 자동 생성하는 프로젝트를 소개합니다. 창작의 진입 장벽을 낮추기 위해 LLM을 활용한 스토리텔링 자동화와 Stable Diffusion 기반의 삽화 생성 파이프라인을 구축했습니다. 특히 생성형 AI의 고질적인 문제인 '캐릭터 일관성' 유지를 위한 기술적 해결책을 제시하며, 웹 애플리케이션을 통해 누구나 쉽게 동화책을 제작할 수 있는 서비스 프로토타입을 시연합니다.

문제 정의

  • 일반 사용자가 개인화된 동화책을 제작하기에는 스토리 구상과 전문적인 삽화 드로잉에 높은 비용과 기술적 장벽이 존재함
  • 기존 이미지 생성 모델을 활용할 경우, 페이지가 넘어갈 때마다 주인공 캐릭터의 외형이 달라져 이야기의 몰입도를 해치는 일관성(Consistency) 문제가 발생함
  • OpenAI의 GPT 모델을 활용하여 사용자의 입력을 바탕으로 기승전결이 갖춰진 동화 스토리를 생성하고, 이를 이미지 생성용 프롬프트로 최적화하는 파이프라인 구축
  • Stable Diffusion 모델에 LoRA(Low-Rank Adaptation) 또는 프롬프트 엔지니어링 기법을 적용하여 특정 캐릭터의 스타일과 외형적 특징을 고정, 연속된 장면에서도 일관된 캐릭터 묘사 구현
  • Streamlit을 활용하여 사용자가 직관적으로 주제를 입력하고 생성된 텍스트와 이미지를 실시간으로 확인하며 동화책 형태로 열람할 수 있는 UI 개발
  • 사용자 의도에 부합하는 스토리와 고품질의 삽화가 결합된 완성된 형태의 동화책 생성 시연
  • 주인공 캐릭터의 의상, 헤어스타일, 이목구비가 여러 페이지에 걸쳐 일관되게 유지되는 기술적 성과 달성
  • 교육 및 엔터테인먼트 분야에서 비전문가도 쉽게 활용 가능한 AI 창작 도구로서의 가능성 확인

제안 방법

  • OpenAI의 GPT 모델을 활용하여 사용자의 입력을 바탕으로 기승전결이 갖춰진 동화 스토리를 생성하고, 이를 이미지 생성용 프롬프트로 최적화하는 파이프라인 구축
  • Stable Diffusion 모델에 LoRA(Low-Rank Adaptation) 또는 프롬프트 엔지니어링 기법을 적용하여 특정 캐릭터의 스타일과 외형적 특징을 고정, 연속된 장면에서도 일관된 캐릭터 묘사 구현
  • Streamlit을 활용하여 사용자가 직관적으로 주제를 입력하고 생성된 텍스트와 이미지를 실시간으로 확인하며 동화책 형태로 열람할 수 있는 UI 개발
  • 사용자 의도에 부합하는 스토리와 고품질의 삽화가 결합된 완성된 형태의 동화책 생성 시연
  • 주인공 캐릭터의 의상, 헤어스타일, 이목구비가 여러 페이지에 걸쳐 일관되게 유지되는 기술적 성과 달성
  • 교육 및 엔터테인먼트 분야에서 비전문가도 쉽게 활용 가능한 AI 창작 도구로서의 가능성 확인

실험 결과

  • 사용자 의도에 부합하는 스토리와 고품질의 삽화가 결합된 완성된 형태의 동화책 생성 시연
  • 주인공 캐릭터의 의상, 헤어스타일, 이목구비가 여러 페이지에 걸쳐 일관되게 유지되는 기술적 성과 달성
  • 교육 및 엔터테인먼트 분야에서 비전문가도 쉽게 활용 가능한 AI 창작 도구로서의 가능성 확인

Video Presentation