GRADUATE SCHOOL OF
AI SEMICONDUCTOR

대학원 소식

[대학원 소식] 로봇 등 온디바이스 인공지능 실현 가능​ (2024.8.1.)

작성자관리자

작성일2024.10.18

조회수49

사진 1. (왼쪽부터) KAIST 전산학부 박종세 교수, 김윤성 박사과정, 오창훈 박사과정

< 사진 1. (왼쪽부터) KAIST 전산학부 박종세 교수, 김윤성 박사과정, 오창훈 박사과정 >

 

자율주행차로봇 등 온디바이스 자율 시스템 환경에서 클라우드의 원격 컴퓨팅 자원 없이 기기 자체에 내장된 인공지능 칩을 활용한 온디바이스 자원만으로 적응형 AI를 실현하는 기술이 개발됐다. 

우리 대학 전산학부 박종세 교수 연구팀이 지난 6월 29일부터 7월 3일까지 아르헨티나 부에노스아이레스에서 열린 ‘2024 국제 컴퓨터구조 심포지엄(International Symposium on Computer Architecture, ISCA 2024)’에서 최우수 연구 기록물상(Distinguished Artifact Award)을 수상했다고 1일 밝혔다.

논문명자율 시스템의 비디오 분석을 위한 연속학습 가속화 기법(DaCapo: Accelerating Continuous Learning in Autonomous Systems for Video Analytics) 

국제 컴퓨터 구조 심포지움(ISCA)은 컴퓨터 아키텍처 분야에서 최고 권위를 자랑하는 국제 학회로 올해는 423편의 논문이 제출됐으며 그중 83편 만이 채택됐다. (채택률 19.6%). 최우수 연구 기록물 상은 학회에서 주어지는 특별한 상 중 하나로제출 논문 중 연구 기록물의 혁신성활용 가능성영향력을 고려해 선정된다.

사진 2. 박종세 교수팀의 연구 발표 사진

< 사진 2. 박종세 교수팀의 연구 발표 사진 >

 

이번 수상 연구는 적응형 AI의 기반 기술인 연속 학습’ 가속을 위한 NPU(신경망처리장치구조 및 온디바이스 소프트웨어 시스템을 최초 개발한 점향후 온디바이스 AI 시스템 연구의 지속적인 발전을 위해 오픈소스로 공개한 코드데이터 등의 완성도 측면에서 높은 평가를 받았다. 

연구 결과는 소프트웨어 중심 자동차(SDV; Software-Defined Vehicles), 소프트웨어 중심 로봇(SDR; Software-Defined Robots)으로 대표되는 미래 모빌리티 환경에서 온디바이스 AI 시스템을 구축하는 등 다양한 분야에 활용될 수 있을 것으로 기대된다.

그림 1. 자율 시스템 상의 연속학습 연산 작업 흐름. 연속학습은 시스템 상에서 센서 데이터를 활용한 추론 작업 뿐만 아니라, 적응형 AI를 위해 훈련 데이터 생성을 위한 데이터 라벨링 작업 및 학습 작업을 포함한다.

< 그림 1. 자율 시스템 상의 연속학습 연산 작업 흐름. 연속학습은 시스템 상에서 센서 데이터를 활용한 추론 작업 뿐만 아니라, 적응형 AI를 위해 훈련 데이터 생성을 위한 데이터 라벨링 작업 및 학습 작업을 포함한다. >

 

상을 받은 전산학부 박종세 교수는 이번 연구를 통해 온디바이스 자원만으로 적응형 AI를 실현할 수 있다는 것을 입증하게 되어 매우 기쁘고 이 성과는 학생들의 헌신적인 노력과 구글 및 메타 연구자들과의 긴밀한 협력 덕분이다라며, “앞으로도 온디바이스 AI를 위한 하드웨어와 소프트웨어 연구를 지속해 나갈 것이다라고 소감을 전했다. 

이번 연구는 우리 대학 전산학부 김윤성오창훈황진우김원웅오성룡이유빈 학생들과 메타(Meta)의 하딕 샤르마(Hardik Sharma) 박사구글 딥마인드(Google Deepmind)의 아미르 야즈단바크시(Amir Yazdanbakhsh) 박사전산학부 박종세 교수가 참여했다.

그림 2. 개발한 온디바이스 적응형 AI 신경망처리장치(NPU) 내부 구조. 효율적 병렬 프로세싱을 위하여 2차원 시스톨릭 배열(Systolic Array) 구조를 기반으로 한다. 저전력 온디바이스 환경에서 연속학습이 가능하도록 하드웨어 자원 활용도를 극대화하는 공간적 자원 분할 기법과 마이크로소프트(Microsoft) MX 기반 다중 정밀도 연산 기법을 개발하였다.

< 그림 2. 개발한 온디바이스 적응형 AI 신경망처리장치(NPU) 내부 구조. 효율적 병렬 프로세싱을 위하여 2차원 시스톨릭 배열(Systolic Array) 구조를 기반으로 한다. 저전력 온디바이스 환경에서 연속학습이 가능하도록 하드웨어 자원 활용도를 극대화하는 공간적 자원 분할 기법과 마이크로소프트(Microsoft) MX 기반 다중 정밀도 연산 기법을 개발하였다. >

 

그림 3. 제시한 온디바이스 연속학습 시스템의 자원 할당 및 스케줄링 작업 알고리즘 흐름. 시스템을 구성하는 AI 모델 및 하드웨어 명세를 기반으로 성능을 예측하고, 이에 기반하여 시공간적인 자원 배분을 통해 변화하는 환경을 감지하여, 제한적인 온디바이스 자원만으로 모델을 효과적으로 적응시킨다.

< 그림 3. 제시한 온디바이스 연속학습 시스템의 자원 할당 및 스케줄링 작업 알고리즘 흐름. 시스템을 구성하는 AI 모델 및 하드웨어 명세를 기반으로 성능을 예측하고, 이에 기반하여 시공간적인 자원 배분을 통해 변화하는 환경을 감지하여, 제한적인 온디바이스 자원만으로 모델을 효과적으로 적응시킨다. >

 

 

한편 이번 연구는 한국연구재단 우수신진연구자지원사업정보통신기획평가원(IITP), 대학ICT연구센터(ITRC), 인공지능대학원지원사업인공지능반도체대학원지원사업의 지원을 받아 수행됐다.

 

원문: KAIST 연구뉴스(https://researchnews.kaist.ac.kr/researchnews/html/news/?mode=V&mng_no=38750&skey=&sval=&list_s_date=&list_e_date=&GotoPage=4)