본문 바로가기 메뉴 바로가기

서울대학교 공과대학

명예의 전당

전체 3 건

현재페이지 : 1 / 1

BiCQL-ML: 최대우도 기반 역강화학습을 위한 보수적 Q-러닝 프레임워크

참가 부문

연구발표부문
신청자

박준성
기획의도 및 내용

본 연구는 Offline 환경에서 전문가 시연 데이터만을 활용하여 보상 함수를 안정적으로 학습할 수 있는 새로운 Inverse Reinforcement Learning 알고리즘을 제안한다. 기존 기법들은 온라인 상호작용에 대한 의존성과 분포 외 행동에 대한 Q-value 과대평가 문제로 인해 학습 안정성이 저하되는 한계를 보였다. 이를 극복하기 위하여 본 연구에서는 Bi-level Conservative Q-learning with Maximum Likelihood (BiCQL-ML) 구조를 도입하였다. 본 방법은 상위 단계에서 전문가 행동의 우도를 최대화하도록 보상 함수를 학습하고, 하위 단계에서는 Conservative Q-learning을 통해 Q-function을 보수적으로 학습하는 교대 최적화 방식을 따른다. 이를 통해 정책을 직접 학습하지 않고도 전문가 행동을 설명 가능한 보상 함수와 안정적인 Q-function을 동시에 획득할 수 있다.
실험은 MuJoCo 시뮬레이터의 D4RL offline dataset을 활용하여 진행되었다. 그 결과, 제안한 알고리즘은 Behavior Cloning, DAC, ValueDICE 등 기존 기법 대비 일관되게 높은 평균 리턴을 기록하며 성능의 안정성을 입증하였다. 특히 제한된 데이터 환경에서도 우수한 일반화 성능을 확인하였으며, 기존 Offline IRL 기법을 능가하는 결과를 도출하였다.

이와 같은 성과는 실제 산업적 응용에서도 높은 활용 가능성을 갖는다. 특히 로봇 제어, 자율주행, 헬스케어 등과 같이 새로운 데이터 수집이 비용적·안전적 부담을 수반하는 분야에서 기존에 축적된 offline 데이터를 활용하여 신뢰성 있는 보상 학습을 수행할 수 있다. 따라서 본 연구는 데이터 자산을 기반으로 한 AI 응용의 실용성, 경제성 및 사업화 가능성을 동시에 제시하며, 향후 다양한 offline learning 문제로 확장될 수 있을 것으로 기대된다.

GOALMU

참가 부문

창작활동부문
신청자

백민주
기획의도 및 내용

본 과제에서 제작한 ‘GOALMU’는 사용 환경의 제약 없이 공중에서 메모가 가능한 웨어러블 펜이다. 사용자가 골무를 착용한 채 허공에서 그림을 그리거나 글씨를 작성하면, 실시간으로 자동 저장되고 클라우드 드라이브에 업로드되어 언제든 확인할 수 있다. 또한, 여러 획을 구분하여 작성할 수 있는 기능도 제공한다. 이름 ‘Goalmu’는 한글 ‘골무’와 영어 ‘Goal’을 결합한 것으로, 골무와 유사한 형태에서 착안하여 사용자가 아이디어나 즉각적인 생각을 놓치지 않고 기록함으로써 꿈에 한 발짝 더 다가갈 수 있기를 바라는 염원을 담았다. 인간의 기억은 시간이 지나면 왜곡되거나 사라지기 때문에, 이를 보완하기 위한 기록 수단은 끊임없이 발전해왔다. 현재 상용화된 스마트펜은 특수 종이 위에 글씨를 쓰면 디지털로 변환돼 저장되지만, 펜과 특수 종이를 소지하고 있어야 한다는 한계가 존재한다. 이에 우리는 종이와 펜 모두 없이도 디지털로 기록이 가능한 새로운 형태의 기록 방식을 고안하였다.
‘GOALMU’는 무선 기반으로 높은 자유도를 제공하며, 직관적인 인터페이스와 휴대성을 갖추고 있다. 기록은 자동으로 저장되어 사용자가 별도의 절차 없이 데이터를 관리할 수 있으며, 일상적인 메모뿐만 아니라 교육, 프레젠테이션, 원격 협업 등 다양한 활용이 가능하다. 또한, 기존 모션 트래킹 장치에 비해 저비용·고휴대성을 갖추어, 대중 시장으로의 보급은 물론 산업용 기록 장치, 장애인 보조 기기, 의료 현장 기록 장치 등 특수 목적 분야로의 확장 가능성도 높다. GOALMU는 웨어러블 디바이스 시장의 성장과 맞물려 상업적 잠재력이 크며, 새로운 기록 경험을 제공함으로써 사용자의 아이디어와 기억을 효과적으로 보존할 수 있는 혁신적 솔루션으로 자리매김할 수 있다.

Integrating isothermal amplification with aptamer probes: Development and colorimetric application of CLASSIC

참가 부문

연구발표부문
신청자

박지현
기획의도 및 내용

핵산탐지기술(Nucleic acid detection)은 DNA 등의 유전 물질을 분석하기 위한 기술이다. 대표적인 기술로는 실시간 중합효소 연쇄반응(quantitative polymerase chain reaction, qPCR)이 있다. qPCR은 특정 DNA 서열을 증폭, 검출 및 정량화 할 수 있지만, 고가의 장치와 전문적인 기술이 필요하다는 단점이 존재한다. 등온증폭반응법은 qPCR의 단점을 극복하기 위한 방법으로 여겨진다. 등온증폭반응법은 핵산 특이적 효소 등을 사용하며, 진단에 필요한 시간이 짧고 비교적 낮은 온도에서도 진행할 수 있어 에너지의 사용이 적다는 장점이 있다. 그러나 qPCR에 비해 낮은 서열 특이성을 보여 오류율이 높다는 것이 문제점으로 꼽힌다.
본 연구에서 개발한 CLASSIC(Combination of Light-up Aptameric probes for high Specificity and Sensitivity with Isothermal amplification and single-strand Conversion)은 높은 민감도와 특이성을 보이는 새로운 진단플랫폼이다. CLASSIC은 등온증폭반응법과 형광프로브를 활용해 별도의 라벨이 없는 핵산도 검출할 수 있다.
더 나아가, CLASSIC을 G-quadruplex DNAzyme을 활용한 colorimetric method에 응용하는 기술을 연구 중이다. Colorimetric method는 시료의 색 변화로 target sequence의 존재를 직관적으로 확인할 수 있으나, 민감도와 서열 특이성이 떨어진다는 단점이 있다. CLASSIC의 적용으로 colorimetric method의 낮은 민감도와 서열 특이성을 보완하면서도, 별도의 기기 없이 target을 검출하는 기술을 개발하고자 한다. 현재 probe 설계를 완료하였으며, target sequence의 유무 및 정량분석 또한 가능할 것으로 기대된다.

담당부서학생행정실

전화번호880-2277

loaction

명예의 전당

BiCQL-ML: 최대우도 기반 역강화학습을 위한 보수적 Q-러닝 프레임워크

GOALMU

Integrating isothermal amplification with aptamer probes: Development and colorimetric application of CLASSIC