본문 바로가기 메뉴 바로가기

서울대학교 공과대학

명예의 전당

전체 5 건

현재페이지 : 1 / 1

HH2R: Human Hands to Robots

참가 부문

창작활동부문
신청자

이우진
기획의도 및 내용

본 연구는 HMD 기반 camera hand-tracking으로 취득한 인간 손 SE(3)·joint pose를 실시간 로봇 joint-space 명령으로 변환하는 end-to-end teleoperation·dataset 파이프라인을 제안한다. 과제의 필요성은 고가 장비(모캡·데이터 글러브)와 복잡한 시뮬레이터 의존을 줄이고, 누구나 직관적으로 고품질 demonstrations를 대량 생성하려는 데 있다. 해결방안은 (1) HoloLens 2/Quest 3에서 marker-less hand tracking 수집, (2) Unity에 URDF를 임포트해 EE 목표를 정의하고 Analytical IK+Jacobian-DLS로 q-vector를 계산, (3) TCP 30 Hz로 ROS 2 joint_trajectory_controller에 전달해 실기 로봇을 구동하는 방식이다. 좌표계 정합·joint limits·collision을 Unity에서 선제 검증해 sim-to-real 일관성을 확보했고, low-pass filtering과 slew-rate 제한으로 실시간 안정성을 높였다. Quest 계열 hand tracking의 ≈1 cm 위치오차·≈10° 관절오차·≈45 ms 지연을 고려해 주기·보간을 설계했다. 결과물의 특장점은 컨트롤러/장갑 없이 구동되는 pure hand-tracking teleop, URDF single-source 기반의 기기·로봇 범용성, 표준 ROS 2 인터페이스로 인한 통합 용이성이다. 기대효과로는 BC/DAgger/RL·VLA 학습용 대규모 데이터 생성, 의료·제조 원격보조·교육 적용, SDK 패키징을 통한 사업화 가능성을 제시한다.

곡면 지형 및 표토층 조건에서의 완전파역산 기반 땅굴 탐지 성능 분석

참가 부문

연구발표부문
신청자

성하경
기획의도 및 내용

본 연구는 곡면 지형과 저속 표토층 조건에서 완전파형역산(FWI: Full Waveform Inversion)을 활용하여 소형 지하 땅굴 탐지 가능성과 성능을 평가하였다. 표토층 하부 경계의 임피던스 대비로 발생하는 다중반사파는 지진파 기록의 고주파 성분을 과도하게 증폭시켜 영상화 품질을 저하시킨다. 기존 땅굴 탐사에서는 이러한 문제를 줄이기 위해 송수신기를 지하에 삽입하는 VSP(Vertical Seismic Profiling) 기법이 사용되었으나, 탐사 범위가 좁고 많은 인력과 시간이 소요되는 한계가 있었다.

이를 보완하기 위해 본 연구에서는 주파수 점진적 역산(frequency continuation strategy)을 적용하였고, 이 과정에서 Butterworth IIR 대역통과 필터를 도입하여 불필요한 잡음과 다중반사파 성분을 억제하였다. 또한 수치 해의 정확성과 안정성을 위해 staggered grid 유한차분 기법을 적용하였으며, 배경 매질로는 비균질 마모시(Marmousi) 속도 모델을 사용하였다. 인공적으로 공동(cavity)을 삽입해 합성 데이터를 생성하고 이를 대상으로 역산을 수행하였다.

분석 결과, FWI gradient에서 땅굴 관련 속도 이상 신호가 안정적으로 부각되었고, 속도장의 수직 1차 미분을 통해 지층 경계와 공동 외곽이 뚜렷하게 나타났다. 특히, 전체 1 km × 150 m 도메인에서 가로 4 m × 세로 8 m 규모의 소형 땅굴을 성공적으로 탐지하였다. 본 연구 결과는 군사적 땅굴 탐지뿐만 아니라 도심지 지반 안정성 평가, 싱크홀·지하 공동 탐사, 노후화된 배수로 모니터링 등 다양한 분야에서 활용 가능성을 보여준다.

Beyond Simple Generation: Extending the Generalizability of Diffusion Models

참가 부문

연구발표부문
신청자

이현수
기획의도 및 내용

본 연구는 ‘Diffusion model 을 활용한 Context-aware content generation’ 을 위한 새로운 개념인 ‘Conditional Score Guidance’ 와 ‘Accelerated Likelihood Maximization’ 을 최초로 제안한다. 기존 diffusion model 은 image, video, human motion 등 다양한 single modality 생성에서 높은 성능을 보여주었으나, 단순한 modality generation 수준에 머물러 있어 domain-limited 된다는 한계가 존재한다. 반면 그래픽스 분야에서는 image editing, image inpainting, long video generation, 3D motion in-betweening 과 같은 task 가 여전히 해결되지 않은 채 남아 있으며, 이들은 모두 맥락적 이해가 필수적인 context-aware content generation 범주에 속한다. 이에 본 연구는 두 가지 핵심적 기여를 통해 기존 연구와 명확히 차별화된다. 첫째, 다양한 context-aware content generation task 에서 controllable modality generation 을 가능하게 하기 위해, conditional score function 을 수학적으로 유도하고 이를 새로운 guidance 방식으로 활용하였다. 둘째, 주어진 context 와 align 되는 content 를 효과적으로 생성하기 위해 accelerated likelihood maximization 기법을 수학적으로 유도하였다. 더 나아가, 이미지 편집 분야에 특화하여, diffusion sampling 의 각 cross-attention layer 가 생성한 출력을 adaptive 하게 control 하는 새로운 mixup 기법을 제안하였다. 실험 결과, 본 연구에서 제안한 방법이 다양한 응용 분야에 효과적으로 적용될 수 있음을 보였다.

방사형 엔진을 기반으로 한 안정적인 단일 바퀴 운송수단: 스파이크

참가 부문

창작활동부문
신청자

정동영
기획의도 및 내용

본 과제는 radial engine 피스톤 운동을 역이용해 안정성과 조작성 모두 확보한 단일 바퀴 운송수단 ‘SPIKE’를 개발하는 데 목적이 있다. 기존 monowheel vechicle은 사람의 높은 숙련도나, 복잡한 전자제어 기술을 요구한다는 한계가 있다. 특히 monowheel vechicle에 의한 연평균 168건의 부상, 32.9% 골절·52.9% 사지 부상 위험이 지적된 바 있다. SPIKE는 복수의 Shell을 방사형 크랭크에 기계적으로 동기화함으로써 전자센서나 복잡 제어 없이 기계적 시스템만으로 안전한 자동 균형·추진을 구현한다. 3D 프린터를 활용한 다수의 실험을 통하여 최적의 Shell 구조를 귀납적으로 발견하고, 라그랑쥬 역학을 활용한 구동원리의 이론적 근거를 제시한다. 더 나아가 스마트폰 앱을 연동한 SPIKE의 PID 튜닝 기반 속도 제어와 python을 이용한 radial engine 운동의 시각화를 구현하여 진입장벽이 낮은 인터페이스의 개발을 수행한다. SPIKE는 기계적 동기화를 이용해 속도 조절이 간단하고, center-of-mass shift 기술을 활용하면 방향 전환을 자유롭게 할 수 있기에 앞으로의 활용 가치를 더 기대할 수 있다. 그리고 제작·유지비용이 더 낮아 경제적이고, linear actuator 기술의 접목이나 인터페이스의 업그레이드로 화물 운송·재난 구조·군사 정찰 등 다양한 분야에 적용할 수 있어 발전 가능성이 높은 기술이다. 앞으로 SPIKE는 2023년 3.64억 달러에서 연평균 7.0% 성장 중인 개인용 이동시장에 경쟁력 있는 운송수단을 제시할 것이다.

Extend3D: Training-free 3D Scene Generation with Patchwise Extended Latent Refinement

참가 부문

연구발표부문
신청자

윤승우
기획의도 및 내용

기존의 3D 생성 모델들은 단일 object 생성에는 강점을 가졌으나, 복잡한 3D scene을 표현하는 데에는 한계가 있었다. 이는 대부분의 모델이 object-centric dataset으로 학습되었기 때문에 scene의 구조를 충분히 학습하지 못했기 때문이다. Scene dataset을 구축하는 것에는 큰 비용과 시간이 요구되기에 scene-level 3D 생성에는 제약이 있다. 본 연구에서는 이러한 문제를 해결하기 위해 추가적인 학습 없이, 기존의 pretrained object-centric model을 활용해, 단일 이미지로부터 3D scene을 생성하는 Extend3D를 제안한다.
Extend3D는 pretrained model에서 정의된 latent의 크기보다 넓은 크기의 latent를 통해 넓으면서 디테일한 3D를 표현한다. 이를 위해 latent와 이미지를 patch로 쪼개 각각에 flow matching을 적용한다. 하지만 object-centric 모델은 scene의 각 조각을 잘 만들지 못하기에, depth estimation을 통해 얻은 point cloud로 scene의 structure를 초기화한다. Structure latent를 noising, denoising 하는 것을 여러 번 반복해 structure를 개선하고 patch 단위로 디테일을 생성해 결과를 얻을 수 있다.
Extend3D는 기존의 3D 생성 모델들과 비교했을 때 가장 입력 이미지에 충실하면서도 기하적으로 디테일한 결과를 생성할 수 있었다. 본 연구는 별도의 학습과 데이터셋 없이 object-centric model을 통해 3D scene을 생성할 수 있다는 점에서 의의를 지니며, 향후 더 발전되 3D 생성 모델과 결합했을 때 더 좋을 결과를 얻을 수 있을 것으로 기대된다.

담당부서학생행정실

전화번호880-2277

loaction

명예의 전당

HH2R: Human Hands to Robots

곡면 지형 및 표토층 조건에서의 완전파역산 기반 땅굴 탐지 성능 분석

Beyond Simple Generation: Extending the Generalizability of Diffusion Models

방사형 엔진을 기반으로 한 안정적인 단일 바퀴 운송수단: 스파이크

Extend3D: Training-free 3D Scene Generation with Patchwise Extended Latent Refinement