10월 과학기술인상, 서울공대 전기정보공학부 한보형 교수 선정
작성자
대외협력실
등록일
2025.10.17
조회수
67
10월 과학기술인상, 서울대 한보형 교수 선정
- 추가 학습 없이 무한 길이 영상 생성 추론 알고리즘(FIFO-Diffusion) 개발
- 영화·게임·광고 등 콘텐츠 제작 비용·시간의 획기적 단축 기대
▲ 서울대학교 전기정보공학부 한보형 교수
과학기술정보통신부와 한국연구재단은 이달의 과학기술인상 10월 수상자로 서울대학교 전기·정보공학부 한보형 교수를 선정했다고 밝혔다.
‘이달의 과학기술인상’은, 최근 3년간 독보적인 연구개발 성과를 창출하여 과학기술 발전에 공헌한 연구개발자를 매월 1명씩 선정하여 과기정통부 장관상과 상금 1천만 원을 수여하는 상으로, 과기정통부 과학기술진흥기금/복권기금의 재원으로 운용된다.
과기정통부와 연구재단은 ‘2025년 인공지능 주간(9.30~10.2)’을 맞아 추가 학습 없이 무한히 긴 영상을 생성하는 추론 알고리즘을 개발하는 등 컴퓨터 비전 분야에서 선도적인 연구를 수행하여 우리나라 인공지능 기술의 세계적 위상을 높인 한보형 교수를 수상자로 선정하였다.
최근 인공지능 연구에서 생성형 모델은 텍스트, 이미지, 오디오 등 다양한 영역에서 빠르게 발전해 왔으며, 그중에서도 영상 생성은 가장 고난도의 기술적 도전 과제로 주목받고 있다.
기존의 확산(diffusion)* 모델은 원하는 설명에 맞는 영상을 생성하는 데 널리 활용되고 있으나, 생성하는 영상 길이에 비례해 메모리 사용량이 기하급수적으로 증가하여 산업적 활용은 물론 학문적 연구에서도 한계가 있었다.
* 무작위 노이즈에서 시작해 점진적으로 노이즈를 제거(고품질 이미지를 복원)하는 역확산 방식
한보형 교수는 사전 학습된 확산(diffusion) 모델을 그대로 활용하면서도 사실상 무한히 긴 영상을 생성할 수 있는 피포 디퓨전(FIFO-Diffusion : First-In-First-Out)이라는 추론 알고리즘을 개발하여 이 문제를 해결하였다.
피포 디퓨전의 핵심은 대각선 디노이징(diagonal denoising)*으로 컨베이어 벨트처럼 순차적으로 프레임을 배치하여 앞쪽부터 단계적으로 영상을 생성(노이즈를 제거)하는 방식이다. 이 방식은 비디오 길이가 늘어나더라도 메모리 사용량이 고정되어 기존 모델의 메모리 한계를 극복할 수 있다.
* 기존과는 달리 여러 프레임에 걸쳐 서로 다른 노이즈 레벨을 갖는 프레임들을 동시에 디노이징
또한, 한보형 교수는 긴 시퀀스를 작은 구간으로 나눠 안정성을 높이는 ‘잠재 구간 분할’(Latent Partitioning)과 상대적으로 깨끗한 프레임을 활용하여 품질을 개선하는 ‘미래 참조 디노이징’(Lookahead Denoising) 기법을 더해 장시간 영상에서도 높은 화질과 시간적 일관성을 확보하였다.
해당 연구 성과는 2024년 12월 신경정보처리시스템학회(NeurIPS)에서 발표되었으며, 연구팀이 공개한 소스코드는 현재 깃허브(GitHub)에서 450개 이상의 별(star)을 받으며 전 세계 연구자와 개발자들에게 활용되고 있다.
한보형 교수는 “이번 연구는 기존 비디오 생성 모델이 가진 고정 길이 및 메모리 병목 문제를 새로운 추론 알고리즘으로 해결한 데 의의가 있다”라며 “향후, 영화, 게임, 광고 등 다양한 응용 분야에서 콘텐츠 제작 비용 및 제작 시간을 획기적으로 단축할 수 있을 것”이라고 기대를 밝혔다.
앞으로, 과기정통부는 과학기술 강국을 만들기 위해 과학기술인들이 AI 등 첨단 기술 연구에 전념할 수 있는 연구 생태계를 조성하고, 우수한 성과를 내는 연구자에 대한 보상과 예우를 더욱 강화해나갈 계획이다.
담당부서대외협력실
전화번호880-9148