한국HCI학회:학술대회논문집
- 기타
Domain
- Information/Communication > Information Processing Theory
2006.02a
-
촉감 제시 방법은 다른 사람에게 방해를 주지 않고 은밀하게 정보를 전달할 수 있는 장점이 있으며, 특히 시각 혹은 청각 장애인에게는 반드시 필요한 정보 전달의 수단이다. 또한 촉감을 이용한 정보의 전달은 시청각을 이용한 정보전달의 방법을 보완하거나 때로는 대체할 수도 있다. 본 논문에서는 웨어러블, 모바일, 또는 유비쿼터스 컴퓨팅 환경에서 사용할 수 있는 착용 가능한 진동촉감 제시 장치를 제안한다. 이 진동촉감 제시 장치는 25개의 진동모터를
$5{\times}5$ 의 형태로 배열하여 문자, 숫자뿐만 아니라 다양하고 복잡한 패턴을 표시할 수 있다. 코인형 진동모터 각각을 스펀지로 감싸고 푹신푹신한 재질의 패드에 세워서 배열하여 진동의 퍼짐을 최소화하고 사람의 글씨 쓰는 순서에 따라 진동모터를 순차적으로 구동시키는 새로운 추적모드를 제안하여 사용자의 문자 및 숫자 인식률을 크게 향상시켰다. 사용자 성능 평가에서는 사용자의 발등에 영문 알파벳을 표시하여 86.7%의 인식률을 얻었다. 또한 진동촉감 제시 장치를 이용하여 핸드폰에서의 발신자 정보표시를 한다거나 네비게이션 시스템에 적용할 수 있는 등의 유용한 응용분야를 제시하였다. -
본 논문에서는 3D 복원과 카메라 측정과정 없이 정확하게 카메라 자세를 계산하고 가상객체를 비디오에 합성하기 위한 단일 프레임 기반의 고속 계산 기법을 제안한다. 객체의 로컬 좌표와 단일 이미지에서의 대응되는 이미지 좌표로부터 카메라 자세를 계산한다. 정사영 투영모델에서의 분해기법에 기반한 구조 계산 방법으로 카메라 자세의 고속 추정이 가능하다. 정사영 투영모델에 기반하기 때문에 참조점의 설정에 따라 정확도가 달라진다. 객체에 따라 참조점을 설정하여 정확한 카메라 자세를 계산하는 방법을 제안한다. 카메라 자세 및 물체의 형태는 단일 프레임 기반으로 수행되며 카메라 자세 추정 결과가 즉시 비디오 합성에 사용될 수 있도록 하였다. 제안하는 기법의 유효성 입증을 위해 실사 비디오에 기반한 증강현실시스템을 구현하고 카메라 자세 계산과 비디오 합성의 전체 과정을 단일 프레임에 기반하여 실험을 수행하고 제안 기법의 실용성을 보였다.
-
본 논문은 다양한 형태의 객체데이터를 포함하는 하이브리드환경에 대한 안정적이고 사실적인 햅틱 제시 방법을 제안한다. 제안된 방법은 가상객체를 기술하는 방법에 의존하지 않고 일관된 방법으로 충돌검출 및 반력계산을 수행한다. 따라서 사용자 및 개발자는 부가적인 노력 없이 다양한 컨텐츠를 활용할 수 있으며, 빠르고 쉽게 가상환경을 구축할 수 있다. 또한 제안된 방법은 멀티 스레드로 구현된 안정화 연산을 수행하며, 이를 통해 느린 햅틱랜더링 속도를 가지는 환경에 대해서도 안정적이고 사실적인 역감을 제시한다. 따라서 제안된 방법은 다양한 응용분야에서 햅틱기술을 보다 쉽고 보다 효과적으로 적용할 수 있는 기회를 제공할 수 있다.
-
본 논문에서는 다시점 카메라부터 획득된 부분적인 3D 점군을 사용하여 실내환경의 3D 복원을 위한 새로운 방법을 제안한다. 지금까지 다양한 양안차 추정 알고리즘이 제안되었으며, 이는 활용 가능한 깊이 영상이 다양함을 의미한다. 따라서, 본 논문에서는 일반화된 다시점 카메라를 이용하여 실내환경을 복원하는 방법을 다룬다. 첫 번째, 3D 점군들의 시간적 특성을 기반으로 변화량이 큰 3D 점들을 제거하고, 공간적 특성을 기반으로 주변의 3D 점을 참조하여 빈 영역을 채움으로써 깊이 영상 정제 과정을 수행한다. 두 번째, 연속된 두 시점에서의 3D 점군을 동일한 영상 평면으로 투영하고, 수정된 KLT (Kanade-Lucas-Tomasi) 특징 추적기를 사용하여 대응점을 찾는다. 그리고 대응점 간의 거리 오차를 최소화함으로써 정밀한 정합을 수행한다. 마지막으로, 여러 시점에서 획득된 3D 점군과 한 쌍의 2D 영상을 동시에 이용하여 3D 점들의 위치를 세밀하게 조절함으로써 최종적인 3D 모델을 생성한다. 제안된 방법은 대응점을 2D 영상 평면에서 찾음으로써 계산의 복잡도를 줄였으며, 3D 데이터의 정밀도가 낮은 경우에도 효과적으로 동작한다. 또한, 다시점 카메라를 이용함으로써 수 시점에서의 깊이 영상과 컬러 영상만으로도 실내환경 3D 복원이 가능하다. 제안된 방법은 네비게이션 뿐만 아니라 상호작용을 위한 3D 모델 생성에 활용될 수 있다.
-
Home modification has come to be recognized as an important intervention strategy to manage health care conditions, maintain or improve functioning, ensure safety, and reduce the wheelchair user's dependency on others. However, the availability of skilled professionals with experience in home modifications for accessibility is limited. A system that enables accurate remote assessments would be an important tool to improve our ability to perform home assessments more easily and at decreased cost. A Remote Wheelchair Accessibility Assessment System (RWAAS) using Virtualized Reality(VR) technology was developed that enabled clinicians to assess the wheelchair accessibility of users' built environments from a remote location. Characteristics of the camera and 3D reconstruction program chosen for the system significantly affect its overall reliability. In this study, we performed two reliability analyses on the hardware and software components: 1) Verification that commercial software can construct sufficiently accurate 3D models by analyzing the accuracy of dimensional measurements in a virtualized environment; 2) comparison of dimensional measurements with four camera settings. Based on these two analyses, we were able to specify a consumer level digital camera and the Photomodeler Pro software for this system. And we then tested the feasibility of the selected software and hardware in an actual environment. Lastly, A field evaluation was performed to test whether this new system is comparable to the traditional method of accessibility assessment to evaluate its ability to assess the accessibility of a wheelchair user's typical built environment. The results of field trials showed high congruence between the assessments by two methods. Findings suggested that the RWAAS assessments have the potential to enable specialists to assess potential accessibility problems in built environments regardless of the location of the client, home, or specialist.
-
본 연구에서는 사지마비 장애인이 활용할 수 있는 동작을 이용하여 마우스, 문자 입력, 전동휠체어 제어 등에 활용될 수 있는 인터페이스 기술을 개발하였다. 사지마비 장애인이 활용 가능하면서도 착용이 쉽고 데이터 처리가 용이한 동작으로서 이물기 동작을 제안하였다. 좌측, 우측 및 양측 이물기 동작 및 이물기 시간의 조절을 통해 사지마비 장애인의 경우에도 다양한 명령어 형성이 가능하다. 이때, 이물기 동작의 인식은 관자놀이 부근에 위치한 관자근에서의 근전도 신호를 이용하였다. 본 연구에서는 데이터를 획득하여 전송하고 처리하기 위한 하드웨어와 소프트웨어를 함께, 전동휠체어 제어를 위한 응용 시스템도 개발하였다. 또한 개발된 시스템을 사지마비 장애인에게 적용하여 그 효용성을 평가하였다.
-
청각 장애인은 집에서 발생하는 여러 가지 소리나 가전 제품의 신호를 감지하지 못하므로 생활의 불편을 상당히 느끼고 있다. 이러한 사람들을 위해 소리 정보를 시각 정보로 변경하여, 사용자들의 시야에 보여주는 것을 목적으로 연구를 시작하였다. 본 연구에서는 집이라는 환경에서 사용자의 위치와 오리엔테이션 정보를 습득하여, 사용자에게 필요한 정보를 시야에 들어오는 범위에 방해되거나 불편하지 않게 표시하는 시스템을 제안한다. 프로젝터에 부착된 카메라를 이용하여 사용자를 인식하고, 사용자를 따라다니며 화면을 디스플레이 하는 기존 방법의 단점들을 해결하기 위해 위치 센서로 사람의 위치와 방향을 파악하여 사용자에게 필요한 정보를 사용자가 현재 바라보는 곳에 디스플레이 하는 방법을 제안한다. 3D 모델로 제작된 집의 구조를 이용하여, 프로젝터의 방향과 초점 제어를 사전에 계산하여 보다 정확한 위치에 정보가 디스플레이 되도록 하였다. 본 논문에서 제안하는 방법이 기존의 PDA 나 PC 모니터를 이용해 정보를 제공하는 방법보다 사용자들이 정보를 인지하는 데 걸리는 시간이 좀더 빠르고 이 방법을 선호하기 때문에, 청각 장애인에게 정보를 제공하는 시스템으로 적합하다는 결론을 도출하였다.
-
Kim, Kyung-Hee;Kim, Kee-Hyung;Kim, Ha-Na;Park, Ji-Woo;Sun, Jung-Hee;Lee, Jae-Hyung;Jung, Jong-Phil 52
선천적인 원인으로 인해 언어 장애를 겪고 있는 사람들이나 후두암 등 후천적 질환이 원인이 되어 의사 소통에 불편을 겪는 사람들이 있다. 본 논문에서 제안하는 '손으로 말해요'는 이러한 사람들의 의사 표현을 돕기 위한 장치이다. 뇌에 손상이 있거나 성대에 손상이 있어 말하는 것이 어려운 장애인들이 장갑모양의 입력장치와 목 부위에 부착된 스피커를 이용해 말할 수 있다. 이 스피커를 통해 흘러나오는 인공의 목소리로 의사 소통할 수 있다. 언어장애인을 위한 본 웨어러블 PC 의 특징은 먼저 블루투스 모듈을 이용한 간단한 손가락 동작만으로도 입력이 가능한 장갑 모양의 입력장치이다. 사용이 불편한 엄지 손가락을 제외한 나머지 네 손가락에 각 하나씩 양손 총 8 개의 스위치가 부착되어 있다. 사용자는 손가락을 굽혀 손바닥에 스위치가 닿도록 하거나 책상 등과 같이 편평한 탁자에 손가락 끝을 닿게 하여 스위치를 누를 수 있다. 장갑의 키 배열은 PC 키보드의 배열과 같아 사용자가 쉽게 적응할 수 있다. 다음으로 본 장치는 자연스러운 목소리가 흘러나오는 음성 합성 모듈을 탑재하였다. 모듈의 출력 음성은 실제 말하는 것과 같은 자연스러운 억양을 지니고 있으며, 스피커는 목소리가 흘러나오는 위치가 자연스럽도록 목 부위에 부착되어 있다. 그리고 HMD(Head Mounted Display)를 탑재하여 자신이 텍스트를 정확하게 입력하고 있는지 이를 통해 확인할 수 있다. 장갑을 제외한 모든 장비는 가방에 탑재하여 착용이 편리하도록 하였고, 장갑은 블루투스 모듈을 이용하여 이용에 불편을 주는 전선을 제거하였다. 본 논문에서 제안하는 '손으로 말해요'는 간단한 손가락 동작을 이용하여 자연스러운 목소리로 말하고자 하는 내용을 전달할 수 있기 때문에 언어장애로 불편함을 겪는 사람들에게 도움을 줄 수 있다. -
최근 들어 IT 기술의 비약적인 발전과 더불어 사용자의 편의성을 극대화 시키는 웨어러블 컴퓨팅 기술이 주목을 받고 있다. 이러한 기술은 일반인 뿐만 아니라 장애인들에게 큰 도움이 될 것이고, 현재 관련된 연구들이 활발히 진행 중에 있다. 본 논문에서는 청각장애인을 위해 개발된 웨어러블 단말 인터페이스 기술을 소개하고자 한다. 웨어러블 단말장치는 소형 마이크로폰을 통해 입력된 주변의 소리로부터 미리 정해진 주요한 소리를 실시간 감지하여, 시각과 촉각 정보로 변환하여 소리의 종류 및 방향을 청각장애인에 알려주는 기능을 한다. 시각정보는 안경식 소형 디스플레이를 통해 상황에 맞는 그래픽아이콘을 보여주고 동시에 소형 진동자들이 부착된 햅틱 슈트를 통해 촉각 정보가 전달된다. 본 연구에서 개발한 웨어러블 단말장치를 통해 청각장애인이 일상생활에서 발생되는 여러 가지 위험상황 또는 긴급상황에 적절하게 대처할 수 있도록 도와주고자 한다.
-
본 논문은 옛 궁궐 또는 민속마을과 같이, 어떠한 사건 또는 상황과 관계 있는 문화관광지를 관광하는데 있어서 몰입적 체험관광 시스템이 갖는 효용성을 탐구한다. 현재까지 대부분의 국내 문화관광지는 정적이고 정보전달 중심인 고전적 관람 형태를 유지하고 있다. 이는 관광 형태가 새로운 경험을 추구하는 방향으로 변화하고 문화 관광산업의 규모와 중요성이 커져가는 추세에서 해결해야 할 과제로 부각되고 있다. 본 연구에서는 이를 개선하기 위한 일환으로 몰입적 체험관광 개념을 탐구하였다. 몰입적 체험관광이란, 유적지 및 사적지 유형의 관광지에서 관련된 실황을 마치 시간여행을 하듯 생생하게 체험하는 관광 방식을 의미한다. 본 개념을 실현하기 위해 증강현실 기술을 활용하였으며 문화관광지에 적용할 수 있는 시스템을 고안하였다. 이 시스템은 한 장소에 고정되는 포스트 형태로 시청각적 증강현실을 구현하여 몰입적 체험 관광을 제공한다. 실제 유적지에서 일반관람객들을 대상으로 시청각적 증강현실 체험을 실험한 결과, 흥미와 현장감이 향상됨과 동시에 컨텐츠에 대한 이해도 또한 향상되는 것을 확인할 수 있었다. 이러한 연구 과정을 통해 유적지 및 사적지 유형의 문화관광지에서 관광의 질을 높일 수 있는 몰입적 체험관광의 효과와 가능성을 확인할 수 있었다. 더 나아가, 본 연구는 기술의 새로운 적용 방법을 통해 새로운 경험을 창출하는 측면에서 의의를 갖는다.
-
가상환경의 실시간 운동감을 제공하는 차량 시뮬레이터 기술에 있어, 그 현실성 제고를 위한 다양한 연구가 수행되어 왔으며, 최근에는 실제 대상의 운동감을 기록하고 이를 재생하는, 데이터기반 운동감 생성 시스템이 개발되었다. 이 방법은 실제 운동감을 제공하므로, 현실성 확보가 용이하나, 사용자와의 상호 작용이 없는 단순한 가상 컨텐츠의 제공 단계에 머물고 있다. 본 연구에서는, 컴퓨터 그래픽스 분야에서 활발히 연구되고 있는, 모션 캡쳐 데이터의 가공 및 합성 기술을 차량 시뮬레이터 구동 과정에 도입하여, 제어가 가능한, 실 데이터 기반 운동감을 생성하는, 새로운 방법을 제안하고자 한다. 이 방법은, 실제 차량의 운동데이터를 획득하고, 적절한 형태의 데이터 구조(운동감 조각)로 변환하여 데이터베이스에 저장하며, 실시간 시뮬레이션 시, 최적의 운동감 조각을 검색하고 합성하여 운동감 스트림을 제공하는 방법으로서, 현재의 시뮬레이션 상태 및 사용자의 요구 사항을 매개변수화 하여, 현실과 가장 가까운 운동감 생성방법을 제공한다. 또한, 차량 운동감 생성 시스템의 개발 및 모션 베이스 구동 실험을 통해, 제안한 방법에 의한 운동감의 현실성 제고 방안에 대해 소개하고자 한다.
-
슬관절 전치환술은 관절염이나 사고로 인해 일상적인 활동의 제약을 받는 환자의 슬관절을 인공 관절로 대체함으로써 본래의 기능을 복원하고자 하는 수술이다. 이 수술은 인공 관절의 위치 및 정렬에 매우 민감하게 영향을 받기 때문에 수술이 잘못되는 경우 정렬 이상으로 인한 해리, 삽입물의 파손, 인공 슬관절 주위 골절, 슬개골 탈구, 굴곡 각도의 제한 등의 증상이 발생할 수 있다. 현재의 인공 관절은 임상에 적용되는 다양한 인공 관절 중에서 적당한 형상의 관절을 선택하여 시술되고 있지만 환자의 골 형상에 정확히 일치하는 인공 관절 선택의 어려움 때문에 종종 시술 후 부작용이 발생한다든지 심지어는 재수술을 해야 될 경우도 발생하게 된다. 본 논문은 Mechanical CAD 소프트웨어인 CATIA에서 제공하는 절단, Assembly, Analysis, Kinematic Simulation 기능 등을 이용하여 가상 수술을 수행하는 과정을 보여준다. 슬관절 전치환술 과정을 그대로 재현하여 절단량과 절단각을 결정하고 환자의 골격 형상에 적합한 최적의 인공 관절을 실제 수술 전에 미리 선정할 수 있다. CAD 시스템을 이용함으로써 외과의들이 실제 수술 시에 시행착오법을 통해 인공 관절을 선택하는 과정을 줄이고 수술의 정확도를 높일 수 있다. 향후 ADAMS나 ANSYS와 연계하여 수술 후 동작이나 하중을 분석할 수 있으며, 수술 과정에 대한 교육용으로 활용될 수 있다.
-
분자 모델링 시뮬레이션은 신 물질, 신약 개발에 범용적으로 사용되는 중요한 컴퓨터 소프트웨어이다. 교육과 연구 등의 분야에서는 사용자가 직접 입력 도구를 사용하여 분자 모델을 시뮬레이션을 하는 경우가 존재한다. 사용자가 직접 시뮬레이션을 하기 위해서는 가상의 3 차원 시각화 환경은 물론 생화학적으로 안정성 여부 검증에 도움을 주기 위해 에너지 계산 결과를 제공해야 한다. 그러나 대다수의 분자 모델링 도구가 시각화 환경 제공을 위주로 개발되었으며 에너지 계산 수식이 복잡하여, 사용자가 시뮬레이션 하는 가운데, 실시간으로 에너지 계산을 제공하지 못한다. 이러한 단점을 극복 하고자 본 논문에서는 어떠한 분자 모델링 도구라도 빠르게 에너지 계산을 반환 받을 수 있는 웹 서비스 기반의 분산 시스템 환경을 구현하였다. 또한 실시간으로 사용자가 시뮬레이션 할 수 있도록 작업 선별 처리 알고리즘(Job Skip Operation)을 개발, 적용하여 최신의 에너지 계산 요청에 대한 반환을 보장하였다. 본 연구는 사용자가 상호작용 기법을 통하여 가상의 분자 모델링 환경에서 화학적으로 안정된 분자 물질의 결합 위치를 빠르게 찾을 수 있도록 도와준다.
-
대부분의 입체 영상물은 단지 화면을 입체로 보여주는 것만이 목적이다. 그러나 만약 입체 영상으로 표현된 가상 물체를 손가락을 뻗어 실제로 만져볼 수 있다면 현실감은 더욱 증가할 것이다. 본 연구에서는 입체영상 장치로 만든 가상 비누방울들을 실제 자기 손가락으로 터뜨리는 듯한 느낌을 가질 수 있도록 해주는 가상 현실 게임 시스템을 만들었다. 이 때 두 개의 위치/방향 센서를 이용하여 손가락 끝과 머리의 움직임을 추적하여 가상 공간과 현실 공간의 두 좌표계를 서로 일치시켜 볼 수 있도록 하였으며, 자체 제작한 진동촉각 장치를 이용하여 비누방울을 터뜨릴 때 손가락에 약한 진동 촉감을 제공하여 실제로 자신이 비누방울을 터뜨리는 듯한 느낌을 갖도록 하였다. 이러한 시도를 통해 입체영상 기술을 이용한 가상현실 게임에서의 진동촉각 장치의 활용 가능성을 확인하였다.
-
부모의 사회 활동 시간이 늘어남에 따라 아이들이 혼자 집에서 보내는 시간도 늘어나고 있다. 따라서 아이들의 자립심을 크게 제한하지 않으면서 노출되기 쉬운 실내 위험으로부터 아이들을 보호하고 아이의 심리, 감정적 상태에 따라 적절한 지도를 해주는 도움이 필요하다. 본 연구에서는 RFID 기술을 기반으로 아이들을 물리적 위험으로부터 보호하고 자연언어처리 기술을 이용하여 아이의 심리, 감정 상태에 따른 음악과 애니메이션의 멀티미디어 콘텐츠를 제공한다. 또한 지속적인 관심이 필요한 일정 관리, 일상 생활에서 도움을 주는 전자제품 사용법 안내 등의 정보를 제공하여 아이 스스로 자신의 일을 할 수 있도록 도움을 준다. 본 연구에서는 가상의 가정을 디자인하여 실현 가능한 시나리오를 중심으로 이와 같은 서비스를 시뮬레이션 한 결과를 보인다.
-
본 논문은 인지 및 행동 장애 재활 시스템을 구현하기 위하여 동영상인식 기반의CAMSHIFT 알고리즘을 적용시켰다. 주의력과 반응 시간을 측정하는 인지 장애 재활 시스템이 개발되었고 환자의 주의 집중력과 손 움직임의 조절력을 측정하고 시 지각 운동 능력을 측정하는 행동 장애 재활 시스템이 개발되었다. 실험은 중앙대학교 의료원 재활 의학과에서 실시하여 측정되었다. 본 논문에서 개발한 시스템은 훈련 과정을 객관적인 측정량과 오랫동안 연습할 수 있는 동기를 제공해 줌으로써 전통적인 치료법에 비해 흥미롭고 유용한 도구가 될 수 있음을 환자를 치료하는 치료사를 대상으로 PSS CogRehab 시스템과 비교하는 설문 조사를 통하여 증명한다.
-
컴퓨터가 우리의 일상적 환경으로 스며드는 유비쿼터스 컴퓨팅 환경에서의 인터페이스는 '컨텍스트 인식'과 더불어 이용자들과의 '긍정적인 사회적 관계'를 형성할 수 있어야 한다. 본 연구에서는 이 두 가지의 관점을 충족시킬 수 있는 인터페이스 에이전트의 유형으로 '자기를 노출하는 에이전트'를 제안하고, 에이전트의 자기노출에 대한 사용자의 사회적 반응을 측정하였다. 실험 결과, 1) 에이전트로부터 친밀성이 높은 노출을 받은 피험자들은 더 깊은 자기노출을, 많은 양의 자기노출을 받은 피험자들은 더 많은 양의 자기노출을 하였다. 2) 에이전트 자기노출의 깊이가 깊을수록 에이전트에 대한 호감과 신뢰는 감소하였다. 3) 피험자들은 처음 만난 자리에서 극히 개인적인 노출을 하는 에이전트보다는 일반적인 노출을 하는 에이전트와 장기적으로 더 친밀해질 것이라고 예측하였다. 이러한 결과는 컨텍스트를 인식하는 인터페이스 에이전트로 자기노출 에이전트를 이용할 경우 사용자의 심리적 구조를 파악하는데 효과적임을 보여주며, 단기적인 사용자 정보의 추출보다는 장기적 관점에서 호감과 신뢰를 쌓을 수 있는 이용자와 에이전트의 사회적 관계 달성이 우선적으로 고려되어야 함을 시사한다.
-
본 논문에서는 반몰입형 가상현실 시스템인 반응형 멀티미디어 시스템(RMS: Responsive Multimedia System)을 이용한 개인화된 스토리텔링 기법을 제안한다. 인간은 글, 그림, 영상 기술 등을 이용한 다양한 스토리텔링 기법을 개발해 왔으며, 가상 현실 기술을 통하여 기존의 멀티미디어보다 한차원 높은 수준의 스토리텔링을 가능하게 하였다. 제안된 스토리텔링 기법은 테이블 형태의 다감각 사용자 인터페이스, 사용자 정보 처리와 위치기반 이벤트를 결정하는 컨텍스트 인식 응용 모델 (vr-UCAM), 그리고 가상환경 네비게이션과 변화, 캐릭터의 애니메이션을 가능케 하는 가상공간 관리기로 구성된다. 제안된 스토리텔링 기법은 다감각 사용자 인터페이스를 통하여 직관적인 상호작용을 가능하게 한다. 그리고 컨텍스트 인식 응용 모델을 활용하여 사용자 개인정보를 스토리에 적용하여 개인화된 스토리가 전개될 수 있도록 한다. 그리고 가상 환경의 네비게이션, 가상 캐릭터, 날씨 및 환경의 변화 등을 조절하여 실감있게 스토리가 전개되도록 한다. 제안된 스토리텔링 환경을 검증하기 위해 운주사에 얽힌 설화를 기반으로 가상 운주사 체험 시스템을 구현하였다. 이를 통해, 반응형 멀티미디어 시스템을 이용한 스토리텔링의 가능성을 검증하였으며, 컨텍스트 인식 응용 모형을 활용한 개인화된 스토리텔링을 선보였다. 제안된 스토리텔링 기법은 문화교육, 에듀테인먼트, 예술 분야에 활용될 것으로 기대된다.
-
음악은 소리를 즐긴다는 뜻을 담고 있다. 감상자에게 단순한 청각적 자극을 넘어 즐거움을 주기 위해선 음악적인 경험이 뒷받침되어야 한다. 가상 현실을 이용한 사용자와 시스템 간의 상호작용을 음악 경험 제공에 접목하려는 시도는, 새로운 경험을 통해 일반인들이 보다 쉽게 음악을 접하고 체험함으로써 음악을 통해 즐거움을 얻을 수 있도록 도움을 주는 데에 그 목적이 있다. 가상 오케스트라를 구현하고 지휘 동작을 재현하는 것은 이러한 가능성을 극대화하는 연구이다. 본 논문에서는 가상 오케스트라를 구현하기 위해 필수적인 중간 단계로, 사용자의 지휘 동작을 감지하여 연주의 박자(속도)를 제어하는 지휘 시뮬레이션 시스템을 제시한다. 실제의 지휘 동작을 분석하고, 동작의 변화를 인식하기 위하여 가속도 센서를 이용, 공간상에서 지휘봉의 움직임을 가속도 정보로 수집하여 이에 상응하는 박자의 제어를 구현한다. 사용자의 박자 명시에 따라 변화하는 상하 방향의 가속도를 센서를 통해 전압 신호로 입력 받고, DSP 의 A/D conversion 모듈에서 디지털 신호로 변환, 일정 수준 이상의 신호를 박자 정보로 직렬통신을 통해 컴퓨터에 전달한다. 컴퓨터에서는 Max/MSP를 이용하여 각 박자 사이의 시간 간격을 측정하고 상응하는 MIDI 음악을 재생하는 방식으로 시스템이 구현된다. 기존 연구에서 사용된 CCD 카메라에 의한 Motion Tracking 을 보완하여 동작의 크기에 따라 음량을 조절한다. 본 논문에서 제시되는 시스템은 지휘 동작에서 가장 특징적으로 나타나는 상하 방향의 급격한 가속도 변화를 직접 입력 받기 때문에 기존 시스템에 비해 지휘 동작의 인식 성공률을 높일 수 있으며, 화상 처리 및 계산에 의한 지연을 최소화할 수 있다. 또한, 장치의 규모를 소형화하여 보다 지휘봉의 형태에 가까운 인터페이스를 제공하며, 적합한 응용 콘텐츠를 접목할 경우 게임 컨트롤러로의 발전 가능성이 있다.
-
본 논문에서는 상황 인지(Context Aware)를 이용한 제스처 인식 방법에 대하여 기술한다. 기존의 인식 방법들은 대부분 제스처의 개별적인 의미를 중심으로 제스처를 분류하는 방법을 사용한다. 그러나 이러한 방법들은 인식 알고리즘을 일반화하는데 있어서 다음과 같은 문제점들을 가지고 있다. 첫째, 인간의 모든 제스처를 제한된 특징으로 모호하지 않게 구별하기 어렵다. 둘째, 같은 제스처라 할지라도 상황에 따라 다른 의미를 내포할 수 있다. 이러한 문제점들을 해결하고자 본 논문에서는 확률 기반의 상황 인지 모델을 이용한 제스처 인식 방법을 제안한다. 이 방법은 제스처의 개별적인 의미를 인식하기 전에 대상의 상황을 추상적으로 분류함으로써 행위자의 의도를 정확히 파악할 수 있다. 본 방법은 시스템의 상태를 [NULL], [OBJECT], [POSTURE], [GLOBAL], [LOCAL]의 5 가지 상태로 정의한 뒤, 각 상태의 천이를 바탕으로 대상의 상황을 판단한다. 이러한 상황 정보에 따라 각 상태에 최적화된 인식 알고리즘을 적용함으로써 지능적인 제스처 인식을 수행할 수 있으며, 기존 방법들이 갖는 제스처 인식의 제약을 완화 시키는 효과가 있다. 따라서, 제안하는 제스처 인터페이스는 자연스러운 상호 작용이 필요한 지능형 정보 가전 혹은 지능형 로봇의 HCI 로 활용될 수 있을 것이다.
-
가상 품평 또는 가상 훈련 시스템과 같은 고품질, 고정밀 가상현실 애플리케이션에서는 사용자에게 자연스러운 상호작용을 제공하기 위해 고정밀 핸드인터페이스 기술을 필요로 하고 있으나, 현재까지 개발된 상호작용 기술은 산업 현장에서 사용하기에는 어려움이 많다. 따라서 본 연구에서는 직관적이고 자연스러운 상호작용을 위한 기술로서 저항이나 광학 방식 등의 센서를 이용한 기존 연구에 비해 높은 해상도와 빠른 갱신율을 제공하는 절대 변위 센서를 사용한 고정밀 장갑형 핸드 인터페이스 장치 개발과 사용자에게 이질감을 주었던 기존의 투박한 실리던형 핸드 모델이 아닌 가변형 스킨매쉬 기법을 적용한 사실적 핸드 모델 가시화 기술 및 복잡하고 잦은 캘리브레이션 과정을 극복하기 위한 2 가지 형태의 간단한 손동작만으로도 정확하고 신속한 캘리브레이션 작업을 지원하는 매니지먼트 툴의 개발을 제시한다.
-
3D 센서테이블은 디스플레이가 내장된 테이블 위에서 사용자의 맨손이 움직일 때 그것을 감지하고 반응하는 센싱정보를 처리하도록 만든 것으로 양안시차 방식의 3 차원 입체영상에서 보여지는 가상의 오브젝트와 사람과의 인터렉션이 가능하도록 설계되었다. 본 연구에서는 3 차원 공간에서의 맨손을 이용한 사람과 컴퓨터 간의 인터렉션 방법에 중점을 두고 있는데 맨손의 위치정보와 제스처를 알기 위해서 Electric Field Sensing 기법을 이용하였다. 현재 구현된 3D 센서테이블은 테이블로부터 30cm 이내의 거리에서 움직이는 맨손의 위치와 간단한 제스처를 인식할 수 있다. 이를 통해서 기존의 마우스나 키보드가 가졌던 3 차원 공간에서 사용할 때 불편했던 점들을 해소하고, 직관적이면서도 누구나 사용하기에 쉬운 인터페이스 방법을 제시함으로써 사람과 컴퓨터와의 인터렉션 방법을 확장시킬 수 있다. 또한 기존의 많은 연구에서 맨손을 이용한 기법들이 주로 2D 기반이었던 것에 비하여 본 시스템은 2D뿐 아니라 3 차원 공간에서도 활용할 수 있다는 장점을 가진다.
-
인간-컴퓨터 상호작용(HCI) 기술은 과거 컴퓨터란 어렵고 소수의 숙련자만이 다루는 것이라는 인식을 바꾸어 놓았다. HCI 는 컴퓨터 사용자인 인간에게 거부감 없이 수용되기 위해 인간과 컴퓨터가 조화를 이루는데 많은 성과를 거두어왔다. 컴퓨터 비전에 기반을 두고 인간과 컴퓨터의 상호작용을 위하여 사용자 의도 및 행위 인식 연구들이 많이 행해져 왔다. 특히 손을 이용한 제스처는 인간과 인간, 인간과 컴퓨터 그리고 최근에 각광받고 있는 인간과 로봇의 상호작용에 중요한 역할을 해오고 있다. 본 논문에서 제안하는 손 추출 및 추적 알고리즘은 비전에 기반한 호출자 인식과 손 추적 알고리즘을 병행한 자연스러운 손 추출 및 추적 알고리즘이다. 인간과 인간 사이의 상호간의 주의집중 방식인 호출 제스처를 인식하여 기반하여 사용자가 인간과 의사소통 하는 것과 마찬가지로 컴퓨터/로봇의 주의집중을 끌도록 하였다. 또한 호출 제스처에 의해서 추출된 손동작을 추적하는 알고리즘을 개발하였다. 호출 제스처는 카메라 앞에 존재할 때 컴퓨터/로봇의 사용자가 자신에게 주의를 끌 수 있는 자연스러운 행동이다. 호출 제스처 인식을 통해 복수의 사람이 존재하는 상황 하에서 또한 원거리에서도 사용자는 자신의 의사를 전달하고자 함을 컴퓨터/로봇에게 알릴 수 있다. 호출 제스처를 이용한 손 추출 방식은 자연스러운 손 추출을 할 수 있도록 한다. 현재까지 알려진 손 추출 방식은 피부색을 이용하고 일정 범위 안에 손이 존재한다는 가정하에 이루어져왔다. 이는 사용자가 제스처를 하기 위해서는 특정 자세로 고정되어 있어야 함을 의미한다. 그러나 호출 제스처를 통해 손을 추출하게 될 경우 서거나 앉거나 심지어 누워있는 상태 등 자연스러운 자세에서 손을 추출할 수 있게 되어 사용자의 불편함을 해소 할 수 있다. 손 추적 알고리즘은 자연스러운 상황에서 획득된 손의 위치 정보를 추적하도록 고안되었다. 제안한 알고리즘은 색깔정보와 모션 정보를 융합하여 손의 위치를 검출한다. 손의 피부색 정보는 신경망으로 다양한 피부색 그룹과 피부색이 아닌 그룹을 학습시켜 얻었다. 손의 모션 정보는 연속 영상에서 프레임간에 일정 수준 이상의 차이를 보이는 영역을 추출하였다. 피부색정보와 모션정보로 융합된 영상에서 블랍 분석을 하고 이를 민쉬프트로 추적하여 손을 추적하였다. 제안된 손 추출 및 추적 방법은 컴퓨터/로봇의 사용자가 인간과 마주하듯 컴퓨터/로봇의 서비스를 받을 수 있도록 하는데 주목적을 두고 있다.
-
전반사 성분은 직접 투사형 증강현실 시스템들이 가지는 대표적인 문제점으로서, 사용자의 시점에 따라 유동적으로 변하면서 프로젝션된 정보의 가시도(visibility)을 심각하게 저해한다. 이러한 전반사 성분의 발생을 해결하기 위해 여러 대의 중첩된(overlapping) 프로젝터를 이용하는 방법이 최근 제안되었다. 그러나, 전반사 성분은 사용자의 시점 뿐만 아니라, 스크린의 재질의 반사 특성에도 크게 좌우되는데, 이에 대한 고려가 없었다. 본 논문에서는 스크린의 재질에 따른 반사 특성을 고려함으로써, 보다 정확하게 전반사 성분을 검출, 회피하는 방법을 제안한다. 제안된 방법을 기존의 방법과 비교함으로써, 제안된 방법의 성능을 검증한다. 또한, 프로젝터 간의 기하 보정의 오차나 광학적 특성의 차이를 보완하기 위한 알고리즘을 개발, 이용함으로써 양질의 합성 결과를 제공해 준다.
-
본 연구는 공간적 정보의 청각적 제시 가능성을 확인하기 위해 머리전달함수(head-related transfer function: HRTF)를 통해 생성된 3D 사운드를 가상공간상 대상 위치의 직각형태(orthogonal pattern), 혹은 대각형태(diagonal pattern)의 조합으로 배열하여 투시장치(See-Through HMD)로 증강현실을 경험하고 있는 사용자 과제수행의 정확성을 측정하였다. 본 연구에서 실시한 실험들의 결과를 종합하면, 3D 사운드로 대상의 위치 정보를 제시할 때는 사용자로부터의 방향은 직각으로 위치시키는 정보 배열이 정확성을 확보할 수 있고, 또한 가상적 깊이를 이용하여 정보를 배열하는 것도 그 깊이를 구분할 수 있으나 정확성이 떨어짐을 확인하였다. 특히 보다 현실적인 과제 상황에서의 수행을 비교하기 위해 일차과제(primary task)를 하는 동안 제시된 청각자극 조건에서 이런 정확성의 차이가 마찬가지로 나타났다. 이런 결과를 통해 3D 사운드로 대상의 위치와 같은 공간적 정보를 제시 가능한 최적의 배열 형태를 제안하는데, 이는 어떤 패턴으로 정보를 구조화하여 제시하느냐에 따라 청각적 위치 정보 제시의 성공 여부가 결정된다는 것을 의미한다.
-
본 논문에서는 Video see-through HMD 에 기반 하여 증강 현실을 위한 손 인터페이스를 제안한다. 착용형 컴퓨터의 입력 장치로써 Video see-through HMD 에 부착된 USB 카메라로부터 영상을 입력 받은 후, HSV 컬러 공간에서 탐색 윈도우 안의 개체를 이중 임계 값을 이용해 손과 팔이 포함된 객체로 분리한다. 그 다음 거리 변형 행렬을 이용하여 손과 팔을 분리하고, 볼록 다각형 외각점 추출을 통해 손 끝의 좌표를 검출한다. 이를 기반으로 한 어플리케이션 "AR-Memo"은 현실세계에서 손끝에 가상의 펜을 증강하여 메모를 하고 이동중에 손바닥을 통해 메모를 볼 수 있다. 증강 현실 기반 손 인터페이스를 사용함으로써 사용자는 이동중에도 직관적으로 입력을 할 수 있다. 또한 어떠한 물리적인 장치나 마커를 손에 부착하지 않기 때문에 자연스러운 인터페이스이다. 본 시스템은 착용형 컴퓨터와 결합되어 사용자에게 편리한 인터페이스를 제공할 수 있을 것으로 기대된다.
-
컴퓨팅 디바이스의 존재를 의식 하지 않고 원하는 서비스를 제공 받을 수 있는 유비쿼터스 환경하에서는 최소한의 HCI 또는 배제된 HCI 가 요구된다. 이러한 요구를 충족시키기 위해 효율적인 서비스를 제공하는 시스템들은 추론을 통해 사용자의 의도 파악 및 그에 따른 서비스를 제공 할 수 있으나 그것에 대한 정확한 판단은 실질적으로 달성하기 어렵다. 또 다른 접근 방법으로는 Event-Condition-Action (ECA) Rule 형태 기반으로써 명확한 Event Trigger 와 Event 발생시의 상황 조건을 기반으로 이미 기술된 서비스를 제공하는 것이다. ECA에 의한 서비스의 제공은 확률 기반의 추론을 통한 서비스 제공보다 더욱 명확한 서비스 제공의 판단이 가능하나 복잡한 환경에서 방대한 양의 발생 가능한 모든 Rule에 대한 기술은 많은 노력이 필요하거나 심지어는 그것이 불가능하다는 단점을 갖고 있다. 이에 본 논문은 이러한 문제를 해결하고자 효과적인 서비스 제공을 위한 ECA Rule 자동 생성 기법을 소개하고자 한다. 본 논고에서 제안하는 시스템은 사용자의 행동과 상황을 추적 및 저장하여 그 정보를 바탕으로XML 형태의 ECA Rule을 자동 생성하여 그를 바탕으로 동일한 조건 및 상황 발생시 이미 기술된 서비스를 제공한다. 이러한 과정은 ECA Rule 기반의 서비스 제공 운용에 있어 가장 취약점인 ECA Rule 작성에 대한 사용자의 노력을 Rule의 양에 상관없이 손쉽게 해결 할 뿐만 아니라 각 사용자 별 Rule을 생성함으로써 유비쿼터스 환경하에서의 개인화된 서비스를 효율적으로 제공할 것이다.
-
유비쿼터스 컴퓨팅이 차세대 IT 패러다임으로 자리매김하면서 유비쿼터스 서비스 개발이 경쟁적으로 이루어지고 있다. 그러나 이에 일반적으로 사용되는 시나리오 기반 개발 공정은 유비쿼터스 서비스 개발에 필요한 여러 요구사항들을 채워주기 힘들다. 따라서 본 논문에서는 유비쿼터스 서비스 개발을 위해 시나리오 기반 접근법을 바탕으로 시나리오를 계층적으로 분석하고 이로부터 기술적 요구 사항을 도출하는 방법론을 제시한다. 그리고 이 방법론을 유비쿼터스 패셔너블 컴퓨터(UFC) 프로젝트에 실제 적용하였다. 착용형 컴퓨터를 입은 사용자가 유비쿼터스 컴퓨팅 환경 하에서 받을 수 있는 다양한 서비스 프로토타입을 구현하였다. 그 결과 유비쿼터스 회의 시나리오 상에서 필요한 여러 서비스들을 효과적으로 개발할 수 있었다.
-
유비퀴터스 컴퓨팅 또는 퍼베이시브 컴퓨팅 분야는 최근 많은 연구와 개발이 이루어지고 있는 반면 그 비전과 영향을 효과적으로 보여주는 응용이나 서비스가 마땅히 떠오르지 않고 있다. 막상 한 두 가지의 훌륭한 기반기술을 개발하여 확보하여도 그것을 효과적으로 보여줄 수 있는 응용이나 서비스를 개발하는 것은 또 다른 도전과제인 것이다. 본 논문은 시나리오 기반 방법론 (Scenario-Based Development: SBD)을 이용하여 유비퀴터스 컴퓨팅 환경에서 필요한 서비스와 응용을 발굴하는 방법을 제시한다. 본 논문에서 제시하는 방법에서는 개발 주최가 보유하고 있는 요소 기술들을 나열하고, 그 기술들이 갖고 있는 문제점을 파악하기 위하여 사용자 설문을 실시한다. 설문을 분석한 결과로 문제 시나리오를 작성하고, 문제 시나리오 분석을 통하여 해결 시나리오를 작성한다. 이 두 시나리오를 작성하고 분석하는데 있어서 유비퀴터스 컴퓨팅의 개념과 기술적 특성을 반영한다. 최종적으로 해결 시나리오로부터 새로운 응용 서비스를 발굴하여 프로토타입 시스템을 개발하게 된다. 마지막으로 제시된 방법론을 이용하여 개발된 OSGi 기반의 스마트 홈 방범 시스템, 상황인지 방송 컨텐츠 제공 시스템, 그리고 개인 안전 감시 시스템, 이렇게 세 가지 시스템을 간단하게 소개한다.
-
본 논문에서는 이러한 어려움에 대한 해결을 위해 우선 사용자가 가장 필요한 서비스를 어떻게 선정하는가에 대해 TELU 라는 기법을 사용하여 사용자 입장에서 필요로 할 만한 서비스를 선정하는데서 출발을 하였다. 이 유비쿼터스의 사용자 중심의 방법론은 T(시간) E(사건)L(장소)U(사용자)를 중심으로 주요 서비스의 영역을 설정하였다. 또한 유비쿼터스의 서비스는 성격상 미리 시뮬레이션을 하는 것이 매우 어려워서 실제 서비스 상황에서 사용자의 행동이 어떻게 될것인가를 예측하는 것이 애매한데 본 연구에서는 Role Play 이라는 기법을 도입하여 이러한 문제를 해결하려 하였다. 즉 TELU 를 통해 선정된 상황에 존재할 수 있는 다양한 인적/물리적 요소들을 파악하고 각 요소들의 역할을 실제 상황처럼 연출하고 수행함으로써 실제 상황에서 일어날 수 있는 사용자의 여러 행위들을 파악하였다. 이러한 방법은 기술위주가 아닌 사용자 중심의 유비쿼터스 서비스를 제안하는 방법으로 유비쿼터스 서비스가 단순한 '수행(Performance)'이 가능한 것이 아니라 인간이 더 큰 편익을 누리며 '사용(use)'할 수 있도록 돕는데 역할을 할 수 있을 것으로 기대된다.
-
햅틱 렌더링이 발전함에 따라서 촉감을 통하여 사용자에게 전달하려고 하는 가상 물체의 성질도 다양해 지고 있다. 이 논문은 균일하지 않은 강도(Stiffness)를 가지는 가상 물체를 기존의 페널티 기반 알고리즘(Penalty-based algorithms)을 사용하여 렌더링하는 경우 물체 표면의 모양(Topography)이 사용된 모델과 달리 왜곡되어 인지되는 현상을 해결하기 위한 햅틱 렌더링 알고리즘에 관한 연구를 보고한다. 첫 번째로 저자의 선행 연구인 힘 유지 가설(Force Constancy Hypothesis) - 사용자가 물체 표면의 모양을 획득하기 위해 물체를 만질 때 일정한 크기의 접촉 힘을 유지한다 - 을 소개한다. 다음으로 힘 유지 가설에 기반한 물체의 모양 및 강도를 왜곡 없이 정확하게 렌더링하는 알고리즘을 제안하고 폴리곤 모델에 적용하는 방법을 설명한다. 마지막으로 실험을 통하여 개발된 알고리즘의 성능을 입증한다.
-
본 논문은 광주과학기술원(GIST)에서 개발하고 있는 전남지역 '운주사'의 천불천탑 설화를 근간으로 한 반응형 가상 문화 체험 시스템(Responsive Multimedia System for virtual storytelling)의 햅틱 변형 상호작용에 관한 것이다. 기존의 디지털 문화재 체험 시스템은 사실적인 체험을 제공하기 위해 시각 및 청각 기술 개발에 많은 연구 및 노력이 이루어져왔다. 그러나 최근 인간의 인지 체계의 중요 요소인 촉감 상호작용의 중요성이 증대 됨에 따라, 본 논문에서는 가상 문화재 체험을 위한 햅틱 변형 알고리즘 및 상호작용 시스템을 개발하여 가상 불상을 만져보고 그 표면을 변형시키게 함으로써 몰입감을 증대하고 재미를 주는 시스템을 제공하였다. 아울러 체험의 몰입감 증대를 위해 본 시스템은 시/청각과 더불어 청각 효과를 가미하여 체험 시 발생되는 주변 환경의 소리(새, 물, 바람소리)를 제공하고, 기존의 문화체험 시스템과의 차별성을 위해 3 차원 입력장치를 이용하여 체험자가 직접 가상 불상을 변형시키면서 체험자 고유의 작품을 만들어낼 수 있는 상호작용을 제공한다. 따라서 제안된 햅틱 변형 상호작용 시스템은 체험자의 능동적 참여 및 흥미 유발을 통하여 문화 유산에 대한 교육적 효과 및 관심 증대에 기여할 수 있을 것이라 여겨진다.
-
3 차원 입력 장치는 키보드나 마우스 같은 일반적인 입력 장치로는 받아 들이기 어려운 3 차원 입력을 사용자로부터 간편하고 직관적인 방법으로 받아들일 수 있다는 측면에서 활발히 연구 및 사용되고 있다. 또한 햅틱 장치는 가상 물체의 조작에 따른 시각적인 피드백 외에 가상 물체의 느낌을 피드백 힘을 통해 사용자에게 전달해 줌으로써 컴퓨터와 사용자간의 상호 작용에 큰 도움을 준다. 본 논문은 햅틱 피드백이 적용된 실시간 가변형 모델과 효과적인 3 차원 입력에 대한 기반 연구를 하고자 한다. 그리고 이에 대한 한 가지 사례로써 햅틱 장치를 이용한 가상 판화 시스템을 제작 한다. 가상 판화 시스템은 시각 처리 부분과 촉각 처리 부분, 그리고 사용자의 3 차원 입력을 돕는 인터페이스 부분으로 구성되어 있다. 시각 처리 부분은 3 차원 공간 상에서 사용자의 조각에 따른 판화 표면의 변형을 처리하며 촉각 처리 부분은 실제 판화를 제작할 때 느끼는 촉각을 햅틱 인터페이스를 이용하여 사용자에게 전달한다. 이를 위해 먼저 시각 처리 부분에서는 NURBS 기반의 자유 형상 변형 (FFD)기법을 이용하였는데 가상 조각도에 의한 물체 표면의 지역적인 변형을 구현하기 위해 조각도가 닿는 부분에 대해 기조 격자점 (control point)을 증가시켜 원하는 부분에 대한 지역적인 변화를 용이하도록 하였고 다음으로 촉각 처리 부분에서는 S-chain 모델을 이용하였는데 S-chain 모델을 객체 전체에 적용하지 않고 접촉이 일어날 경우 그 접촉점을 기준으로 S-chain 모델을 지역적으로 적용하는 방법을 고안하여 실제 구현에 이용하였다. 인터페이스 적인 측면에서 사용자의 3 차원 입력장치를 통한 인터렉션은 사용자로 하여금 보다 자유로운 입력을 허용하지만 이에 따른 깊이 지각 문제를 발생시킨다. 이러한 문제를 최소화 시키고 사용자의 깊이 지각을 강화시키기 위해 사용자에게 제공되는 시각적 자극을 변형시키고 다양한 정보를 제공하도록 하였다. 가상 판화 시스템은 가상 환경에서 사용자의 조작에 따른 다양한 결과물을 제작 및 출력해 볼 수 있도록 해준다. 또한 가상 환경에서 이러한 기반을 제공함으로써 가상 환경의 장점인 복사, 이동 및 영구 보존 특성을 동시에 얻을 수 있다. 본 논문은 이러한 작업을 위한 기반 기술로써 햅틱 및 가변형 모델, 3 차원 입력 장치에 대한 시각적 인터페이스에 대해 다루고 이 기반 기술을 바탕으로한 가상 판화 시스템의 구현에 대하여 논하고자 한다.
-
햅틱 인터페이스 장치는 가상공간 상에서 얻어지는 시각적 효과와 더불어 힘(촉각)을 전달하여 사용자에게 현실감을 줄 수 있는 장치이다. 본 논문에서는 다양한 용도로 사용할 수 있는 2 차원 햅틱 인터페이스 장치를 설계 및 제작하고, 입체영상 시스템과 연동하여 오락실에서 흔히 볼 수 있는 에어하키 시스템을 가상현실 기술로 구현하였다. 이때 적절한 모델링과 햅틱 렌더링을 통하여 가상 에어하키 공을 칠 때 사용자가 핸들을 잡은 손으로 느끼는 충격과 반력을 2 차원 햅틱 인터페이스 장치를 통하여 느낄 수 있도록 하였다. 구현된 시스템의 시연을 통하여 공과 핸들의 충돌 시 공이 튕겨 나가는 방향과 속도가 실제와 유사하고 공과 핸들에서 충돌이 일어날 때 실제와 상당히 유사한 느낌은 얻을 수 있음을 확인하였다.
-
본 논문은 스포츠 방송의 몰입감 증대를 위한 진동촉감 제시 시스템 및 장치를 제안하며, 촉감 정보를 효과적으로 전달하기 위한 촉감제시 방법론 및 제어 알고리즘을 제안한다. 최근 디지털 컨텐츠의 전달에 있어 오감을 통한 정보 전달의 관심이 증대됨에 따라, 대중을 대상으로 다양한 정보를 전달하는 디지털 매체에서의 시청각과 더불어 촉감 제시의 역할과 중요성이 증대되었다. 따라서 본 논문에서는 실시간으로 동적인 현장 상황을 실감 있게 전달하는 스포츠 방송에서의 햅틱 효과와 역할 그리고 가능한 시나리오를 정의하고, 진동촉감 제시 장비를 설계하여 촉감 정보 표현에 대한 기초 연구를 수행하였다. 또한 제안된 촉감을 이용한 스포츠 방송 시나리오 중 축구 방송을 기반으로 사용자 촉감 인지 실험을 수행하였으며, 실험 결과를 바탕으로 축구 방송 시스템을 구축하여 실감방송 전시회 시연을 통해 진동촉감 시스템 및 촉감 제시 방법론을 검증하였다. 촉감이 인간의 오감 중 시청각 다음으로 정보를 인지하는 중요한 감각 체계인 만큼 많은 양의 정보를 대중에게 전달하는 방송 시스템에서 시청각과 더불어 효과적인 정보 전달 체계로써 기여할 것이라고 여겨진다.
-
최근에는 통신기술과 인터넷의 발달로 원격의 사람과 전화, 이메일, 메신저 또는 화상회의 시스템 등을 통해서 쉽게 의사소통 할 수 있다. 이 시스템들은 주로 음성, 그림, 동영상 또는 문자 기반의 시청각 정보를 서로 주고 받으며 자신의 의사 및 감정을 전달하는 통로를 제공한다. 그러나 일상 생활에서 시청각 정보 외에 촉감 정보도 서로 의사소통 하는데 중요한 역할을 한다. 악수, 포옹 등의 촉감 상호작용은 사람 사이에서 친근감을 표시하는데 가장 직접적인 방법으로 자신의 감정을 전달하거나 느낌을 표현하는데 사용된다. 그럼에도 불구하고 촉감 상호작용을 가능케 하는 의사소통 시스템의 연구는 아직 폭넓게 진행되고 있지 않다. 본 논문에서는 일상에서와 같이 원격에서도 상대를 바라 볼 수 있고 자연스럽게 접촉할 수 있는 원격 촉감 커뮤니케이션 시스템을 제안한다. 이 시스템에서는 로컬 사용자가 손가락으로 상대의 몸 특정 부위를 만질 수 있고 서로 그 촉감을 실시간으로 느낄 수 있다. 이 시스템은 크게 AR 시스템, 그래픽 시스템, 햅틱 시스템, 택타일 시스템의 부시스템들로 나눌 수 있다. AR 시스템에서는 몸의 한 부위에 사각형의 AR 마커를 부착한 원격 사용자를 웹카메라로 촬영하고 ARToolKit 을 사용하여 마커의 위치를 측정한다. AR 마커의 바로 밑에는 택타일 장치가 장착되어 있으며 이 부위를 통하여 원격의 사용자는 로컬사용자가 자신의 팔을 만지는 느낌을 받게된다. 그래픽 시스템은 로컬사용자에게 촬영된 원격 사용자와 측정된 마커의 위치가 대표하는 원격 사용자의 가상 피부, 그리고 자신의 가상 손가락을 보여준다. 햅틱 시스템에서는 촉감 장치를 사용하여 로컬 사용자의 손가락 위치를 구하여 원격 사용자의 가상 피부와 접촉했을 때 그 충돌을 감지하고 접촉력을 계산하여 촉감 장치에 반영함으로써 그 접촉력을 느낄 수 있도록 한다. 택타일 시스템에서는 원격 사용자의 AR 마커 밑에 장착된 배열 타입의 진동 촉감 장치에 접촉 정보를 주어 로컬 사용자와 접촉 했을 때 접촉 부위에 진동을 줌으로써 촉감을 느끼도록 한다.
-
본 논문에서는 촉각지원 네트워크 협업 테스트베드의 구현을 소개한다. 네트워크 촉감 상호작용을 위한 효율적인 실험 환경을 구축하기 위해서는 네트워크 제약 조건들을 정밀하게 조절하는 것이 가능하면서 사용자가 직접 경험을 통해서 현실감의 정도를 느낄 수 있어야 한다. 제안된 촉각지원 네트워크 협업 테스트베드는 본 요구사항을 만족시키기 위하여 두 대의 Phantom Omni 디바이스를 마스터 슬레이브 구조로 연결하고 FreeBSD (dummynet) 기반의 네트워크 에뮬레이터를 포함한다. 본 네트워크 에뮬레이터는 다양한 환경의 네트워크 시나리오를 지원하기때문에 촉감 상호작용의 질과 네트워크 간의 상관성 파악 및 네트워크 제약 보상 기법의 검증에 적용될 수 있다. 본 논문에서는 한 예로써 이를 기반으로 UDP 가 TCP 보다 촉감 상호작용에 더 적합한 프로토콜임을 보이는 실험을 소개하고 현실감있는 촉각지원 네트워크 협업 시스템을 위한 네트워크의 요구 조건을 살펴본다.
-
본 논문에서는 분산 촉각 가상 환경(DHVE; Distributed Haptic Virtual Environments)에서 촉각(haptic) 데이터가 어느 정도의 네트워크 트래픽을 가지며 또 효율적으로 통신 하는지에 대하여 실험하고 그 결과를 기술한다. 본 연구에서 제시하는 실험 데이터는 차세대 인터페이스로 떠오르는 촉각 장치의 높은 전송량과 실시간성을 요구하는 데이터가 분산 환경에서 서비스될 때 어떤 문제점을 가지는지에 대한 실질적이고 의미 있는 자료로 활용될 수 있을 것이다. 본 논문을 통해 우리는 기존의 분산 가상 환경들의 주요 논쟁점인 확장성(scalability), 안정성(safety) 등이 촉각 가상 환경에서는 어떻게 달라지는지 예측하고, 분산 가상 환경에서의 촉각 장치 활용의 유용성, 효율적인 네트워크 사용 방법, 촉각 기반 가상 환경이 구동될 수 있는 최저의 조건에 대해 고찰해 볼 수 있다. 본 논문은 차세대 인터페이스인 촉각 장치를 기존의 시스템에 안정적으로 추가하는 작업에 도움을 주며, 미래의 실감형 네트워크 가상 현실(Immersive Network Virtual Environment) 연구에 기초자료로 활용할 수 있을 것이다.
-
다양한 정보기기들의 복합화 형태로 진화하는 차세대 텔레매틱스 시스템에서는 운전자의 안정성 확보와 workload 감소가 중요한 이슈로 대두되어 Interface의 단순화, GUI Interaction의 극복 등의 대한 문제해결이 중요시 되고 있다. 이를 위해 본 연구에서는 사용자의 mental model를 고려한 운전자의 자유로운 navigation을 지원할 eyes-free 기술인 haptic interface를 지원하는 모델 개발을 목표로 기존 haptic interface를 지원하는 기기들의 문제점을 도출하고 차세대 텔레매틱스 시스템의 분석을 통해 기능적 요구사항을 정의하였다. 이를 기반으로 사용자에게 haptic interface를 통한 interaction을 제공함으로써 차세대 텔레매틱스 시스템을 지원하는 conceptual model을 개발하였다. 또한 haptic device design시에 고려되는 평가지표들을 선별하여 평가지표의 계층적 구조도를 작성한 후 AHP평가 모델을 개발하여 haptic device design 시의 중요 고려사항을 도출하고 중요도를 산정하여 초기 design 단계에서의 prototype에 대한 객관적이고 정량적인 평가를 제공하였다.
-
본 논문은 새로운 햅틱 API 인 "K-Touch"의 개발에 관한 것이다. 그래픽 하드웨어 기반의 핵심 역감 알고리즘을 기반으로 개발된 K-Touch API 는 가상 환경을 구성하는 다양한 데이터 형식(3D polygon model, volume data, 2.5D depth image)에 대한 햅틱 상호작용을 가능하게 하고, 새로운 햅틱 알고리즘 및 장치 개발에 필요한 소프트웨어 확장성을 제공함과 동시에 사용자가 쉽고 빠르게 햅틱 응용분야를 개발할 수 있도록 설계되었다. 아울러 햅틱 감각의 중요 요소인 역감 및 촉감 상호작용을 위해 기존의 햅틱 SDK 및 API 와 달리 역/촉감을 동시에 제시할 수 있는 알고리즘이 개발되었다. 본 논문에서 제안하는 새로운 햅틱 API 의 효용성을 검증하기 위해 다양한 응용분야의 예를 구현하였다. 새로운 햅틱 API 인 K-Touch 는 사용자 및 연구자에게 보다 효율적으로 햅틱 연구를 진행 할 수 있도록 도움을 주는 툴(Tool)로써 중요한 역할을 할 것으로 기대된다.
-
본 논문은 스마트 홈에서 다수 사용자를 대상으로 조화로운 미디어 서비스를 제공하는 ubiTV 응용을 제안한다. ubiTV 응용은 사용자의 상황정보를 수집하고 인식하기 위해 정형화된 컨텍스트를 이용하는 ubi-UCAM2.0 을 기반으로 구현되었다. ubiTV 응용은 사용자의 상황정보를 수집하기 위해 위치추적 센서, 출입문센서, 소파센서 그리고 PDA 기반의 리모컨을 활용한다. 그리고 수집된 정보를 기반으로 사용자의 컨텍스트를 인식하고 맞춤형 서비스를 제공하는 방송, 영화, 음악, 영상 및 웹 등의 다양한 미디어 서비스로 구성된다. 이를 기반으로 ubiTV 응용은 사용자의 컨텍스트 및 미디어 콘텐츠 정보를 기반으로 개인화된 서비스를 제공하고 추천한다. 또한, 사용자 및 미디어 서비스 간의 협력을 통해 조화로운 서비스 및 콘텐츠 공유를 지원한다. 그리고 파노라믹 영상을 기반으로 한 직관적인 사용자 인터페이스와 서비스 디스커버리를 통해 사용자들이 미디어 서비스를 쉽고 편리하게 제어할 수 있도록 한다. 실험결과, 제안된 ubiTV 응용은 현재의 널리 사용중인 미디어 시스템과 달리 다수의 사용자들이 미디어 서비스를 함께 이용하고 관심 있는 멀티미디어를 서로간에 공유함을 알 수 있었다. 따라서, 제안하는 ubiTV 응용은 다수의 사용자들이 다양한 미디어 서비스를 조화롭게 이용하도록 함으로서 스마트 홈 환경에서 중요한 역할을 할 것으로 기대된다.
-
본 논문에서는 홈 환경에서의 사용자의 컨텍스트에 따라 지능적으로 반응하는 미디어 콘텐츠인 vrFlora 을 소개한다. 이는 사용자의 정적인 프로파일 및 간단한 조작 정보 등을 이용하여 사용자의 명시적인 컨텍스트를 인지한다. 그리고 인지된 컨텍스트에 따라 vrFlora 의 자체적인 동기, 즉 감정과 욕구을 자율적으로 변화시키며 이에 따라 자발적인 반응을 표현한다. 더 나아가 사용자에 따라 동기의 변화 정도를 차별화 함으로써, 사용자에 따른 개인화된 반응을 나타낸다. 제안한 시스템의 유용성을 평가하기 위하여 스마트홈 환경을 위한 테스트 베드인 ubiHome 에 vrFlora 를 구현하였다. 그리고 사용자로 하여금 이를 자연스럽게 경험해 볼 수 있도록 하였다. 이를 통해 미래형 홈 환경에서의 지능형 미디어 콘텐츠에 대한 응용 가능성을 제시한다.
-
본 논문은 환경의 변화에 적응하여 지속적으로 서비스들의 협업을 지원하기 위한 통합 시스템으로 커뮤니티 관리 시스템을 제안한다. 이를 위해 커뮤니티라는 메타포를 사용하여 추상화된 레벨로 협업 모델을 정의하고 이를 런타임에 해석하여 물리적 환경의 실질적인 서비스들간의 실행 모델로 전환한다. 본 논문에서 제안한 시스템은 서비스들의 협업과 사용자의 인터랙션을 관리하는 커뮤니티 매니저(CM)와 서비스들의 협업모델을 실행 환경으로 매핑시키는 커뮤니티 프레임워크(CF) 그리고 CM 과 CF 에게 통합된 컨텍스트를 제공해 주는 시츄에이션 매니저(SM)로 구성되어 있다. 이 시스템에서 추상화된 협업 모델은 런타임에 물리적 공간으로 매핑되므로, 동적으로 실행 환경과 사용자의 특성을 인식하고 그에 맞는 협업 목표와 협업 대상을 변경시켜 실행 환경에 맞게 재구성 되는 것이 가능하다. 따라서 제안된 시스템을 통해 특정 환경에 고유하게 구축되던 시스템의 개발 비용에 대한 부담을 절감시키는 효과를 가져올 것으로 기대된다.
-
본 논문에서는 스마트 홈 환경에서 사용자의 컨텍스트를 사용하여 상황에 적합한 서비스를 제어할 수 있는 ubiController를 제안한다. 기존의 시스템에서는 서비스마다 개별적인 제어기가 사용되었기 때문에 서비스 전환 시 사용자에게 불편함을 초래하였다. 이런 문제를 개선한 통합 제어기에서도 사용자의 상황을 고려하지 않은 획일적인 인터페이스만이 제공되었다. ubiController는 홈 환경의 서비스를 발견할 수 있는 서비스 디스커버리 기능, 다양한 서비스를 제어할 수 있는 통합 제어 기능, 직관적이고 시각적인 GUI, 그리고 사용자의 행동과 위치 정보의 활용을 통해 적합한 서비스를 제어 메뉴 형태로 재구성한다. 제안된 시스템은 스마트 홈 테스트베드인 ubiHome에서 상황에 적합한 서비스 제어 메뉴를 생성하고 해당 서비스를 제어하는데 사용된다. 이러한 시스템을 통해 사용자는 스마트 홈이나 유비쿼터스 컴퓨팅 환경에 편재하는 수 많은 서비스 중에서, 관련있는 서비스를 보다 쉽고 빠르게 접근하여 제어할 수 있다.
-
기존에 개발된 사용자 선호 정보를 이용한 TV 추천 시스템은 대부분 사용자의 명시적인 요구에 따라 방송 프로그램을 추천하는 데 중점을 두고 개발되었다. 하지만, 유비쿼터스 환경이 도래함에 따라서 사용자의 요구에 따라 반응하는 수동적인 서비스 보다는 상황정보(Context)를 활용하여 능동적인 서비스를 지원할 수 있는 기술이 필요하다. 따라서 본 논문에서는 CAMUS(Context-Aware Middleware for URC Systems) 상황인식 미들웨어를 이용하여 사용자 위치 상황정보에 따라 능동적으로 추천할 수 있는 TV 추천 서비스 에이전트를 제안한다. 제안된 시스템은 CAMUS 기반 서비스 에이전트와 태스크를 구현함으로써, 상황정보에 따라 능동적으로 다채널에서 방송되는 프로그램 및 사용자의 선호도 정보를 분석하여 사용자가 원하는 프로그램을 추천한다.
-
TV 프로그램 전송 방식이 아날로그에서 디지털로 바뀌며, TV방송의 다채널화 현상이 일어나고 있다. 동시에 많은 채널을 시청하며, 정보를 습득하고자 하는 바쁜 현대인들에게 두 개 이상의 채널을 동시에 시청하면서, 이를 녹화하거나 모니터링 하고자 하는 Need가 점점 높아져 가고 있다. 두 개의 튜너를 이용하여 두 채널의 방송을 동시에 시청 할 수 있는 PIP(Picture in Picture-동시화면) 기능은 이러한 사용자 욕구를 해소함과 동시에, 프리미엄 TV의 기술적 특성으로 자리잡고 있다. 현재 LG전자 TV의 경우, PIP관련 기능은 5가지로 [동시화면] [부채널+] [부채널 -] [부화면 입력][주부전환] 이 있다. 이러한 PIP관련 기능은 리모컨에서 부가기능 버튼으로 동작하고 있으며, 리모컨 레이아웃의 복잡성을 증대시키는 큰 원인이 되고 있다. 특히 관련 버튼이 숨김 버튼으로 배치되어 있어 사용자는 버튼을 찾지 못하고 오히려TV OSD 메뉴 상에서 PIP기능을 찾는 오류를 범하고 있어 직관적인 사용성을 제안하지 못하고 있다. 따라서 본 연구에서는 리모컨에서 PIP관련 버튼을 줄임과 동시에 PIP 사용성을 높일 수 있는 개선안을 제안하고자 하였다. 연구 방법은 PIP 사용행태 분석을 통한 문제점 파악 후 2가지 개선안을 도출한 후 각각의 개선안에 대한 사용성 검증을 실시하였다. 그 결과, 기존의 리모컨 버튼으로 접근하는 것이 사용성이 더 좋을 것이라는 예상을 깨고, PIP기능 사용 시 OSD메뉴로 접근하는 것이 수행시간이 줄어들었음을 알 수 있었다. 이것은 TV라는 매체의 특성상 사용자는 TV화면에서 기능 수행 후 Feedback을 기대하며, TV화면 상에서 동작하는 것에 더 익숙하기 때문이다. 이는 향후 새로운 TV기능 구현 시 중요한 Impact로 작용할 수 있다. 그 이유는 리모컨 버튼을 활용하여 모든 기능을 수행하는 것보다, 특정 기능은 OSD상에서 구현하는 것이 TV의 직관적인 사용 Scene에 더 적합한 것을 파악할 수 있었기 때문이다.
-
기존의 정보 제공형 서비스에 시청자가 접근하기 위해서는 TV 시청을 중단하고 여러 단계를 거쳐서 이동해야 하고, 접근하는 시간이 시청자가 원하는 시간보다 오래 걸리는 단점이 있다. 본 논문에서는 이러한 접근성을 극복하기 위하여 데이터방송 위젯 애플리케이션을 제안한다. 본고에서는 실제 방송에 적용하기 위하여 개발한 실험용 위젯 애플리케이션을 중심으로 살펴보고자 한다. 위젯 애플리케이션으로 적용시킬 수 있는 정보는 무한하므로 위젯의 구조 또한 쉽게 응용하여 만들 수 있도록 설계하였다. 그리고, 화면상에 하나의 위젯만 떠있는 것이 아니라 다중의 위젯이 떠있는 상태를 관리할 수 있는 위젯 관리 애플리케이션도 살펴본다. 특정 플랫폼에 국한하지 않고 모든 플랫폼에 적용될 수 있도록 개발하였다.
-
디지털방송의 애플리케이션(Xlet)은 시청자와 방송프로그램간의 상호작용에 중요한 역할을 담당한다. 현재 이러한 애플리케이션 UI는 평면이미지로 구성하는 것이 대부분이며 화면상 영역은 2차원으로 제한된다. 본 논문은 이러한 2차원의 평면적인 느낌을 극복하고 3차원이 가진 다양한 이점을 살리기 위한 3차원 UI구현방법을 제시한다. 이를 위해, 본 논문은 가상의 3D System, Virtual Timeline, Animation Model 등을 구성하였다. 3D System이란 UI가 3차원 좌표계를 가지기 위한 환경을 말하며, Timeline과 Animation Model은 제한적인 성능의STB에서 보다 진보된 애니메이션을 UI에 적용하기 위한 기법이다. 이들은 다양한 애플리케이션 제작, 서비스 개발 등에 응용이 가능하다. 디지털방송은 매우 빠른 속도로 발전하고 있으며 새로운 형태의 서비스가 속속 등장하고 있다. 이러한 흐름에 발맞춰 3D UI는 기존의 TV 화면에서 보다 진보된 형태의 사용자 인터페이스의 모습을 보여줄 것이다.
-
본 고에서는, 리턴 채널을 이용하여 단일 시나리오 상에서 다수의 시청자들 상호간에 다양한 interaction 을 제공하는 Interactive-Book 을 제안한다. 기존의 e-Book 이 단순히 전통적인 종이 재질의 책 내용을 디지털 화한 뒤 이를 PC 혹은 PDA 상에서 접할 수 있도록 한 것이라면, 디지털 방송 환경에서의 Interactive - Book 은 기존의 Text 컨텐츠와 연관 있는 동영상, 애니메이션, 나레이션 등을 함께 제공하여 독자의 흥미를 유발시키는 동시에 컨텐츠에 대한 몰입감을 증대 시킨다. 또한, Interactive-Book 은 여러 사용자 들이 시나리오 상의 서로 다른 등장인물을 선택한 뒤, 리턴 채널로 연결되는 서버와 통신하여 시나리오상에서 자신이 선택한 등장 인물의 Role Playing을 제공한다. 그리고 각각의 사용자는 다른 시청자가 선택한 등장인물의 행동에 따라 자신이 선택한 캐릭터(등장인물)의 행동에 제약을 받거나, 혹은 반대로 다른 등장 인물에게 제약을 가할 수 있다. 아울러, 본 논문에서는 Interactive-Book 컨텐츠가 디지털 방송에서 현재 방송중인 채널의 컨텐츠와 관련 있는 연동형 애플리케이션 혹은 방송 채널과는 무관한 독립형 애플리케이션으로 제공 될 수 있음을 보이고, 효율적인 컨텐츠 개발, 수정, 제공을 위한 Interactive-Book 애플리케이션 개념 정립, 구조설계와 더불어 Xlet 을 이용한 애플리케이션 구현 방법에 대하여 논할 것이다.
-
최근 사용자에 대한 많은 정보를 얻는 것이 가능해지면서, 데이터마이닝 기법이나 Contents 추천 기법을 이용한 맞춤형 서비스가 가능하게 되었다. 특히, 대부분의 사람들에게 TV 프로그램 시청은 여가생활시간에서 가장 높은 비중을 차지 하고 있다. 따라서, 보다 지능적인 TV 프로그램 서비스를 제공하는 기술에 대하여 관심이 고조되고 있다. 본 논문에서는 TV-Anytime을 이용하여 개인화된 Electronic Program Guide (EPG)를 생성하고, 개인화된 EPG 정보를 활용하여 시청자에게 맞춤형 TV 프로그램 서비스를 제공하는 시스템에 대한 연구 결과를 제시한다. 또한 시청자의 시청패턴과 TV 프로그램 선호도를 바탕으로 시청자가 원하는 프로그램을 추천하는 TV Program Recommender Agent와 방송 및 TV 프로그램에 대한 대화를 담당하는 TV Program Helper Agent, 시스템 조정 및 메시지 전달을 담당하는 Coordinator Agent로 이루어진 멀티에이전트 기반 시스템 구조를 제시한다.
-
최근 들어 유치원과 초등학교에 로봇을 이용한 교육적 활용 연구가 시도되고 있다. 유비퀴터스 로봇 활용이 교사와 아동의 흥미 유발에 있어 매우 효과가 높은 것으로 나타나, 향후 유비쿼터스 로봇이 u-Learning 의 또 다른 매체로서의 가능성이 강조되고 있다. 이에 본 연구에서는 초등학교 수업에서 교사 보조 역할을 통한 유비퀴터스 로봇의 활용 가능성을 보기 위해, 초등 학생 6 학년의 기대 역할을 갖는 프로토 타입의 로봇과 컨텐츠를 개발하여 활용하는 실험을 실시하였다. 프로토 타입 로봇은 국어, 영어, 음악 교과를 대상으로 주기적으로 컨텐츠를 다운로드 할 수 있을 뿐만 아니라 아동의 얼굴과 이름을 저장하여 수업 운영 컨텐츠와 연동할 수 있다. 현장 실험을 통하여 아동이 유비쿼터스 로봇을 경험한 수업 시간의 횟수에 따라 로봇 외형과 수업 보조 서비스에 대한 선호도 차이를 알아봄으로써, 초등학교에서 유비퀴터스 로봇을 이용한 r-Learning에 있어서 일시적 신기효과가 아닌 지속적인 영향을 줄 수 있는 요인을 찾아보았다. 실험 결과, 지속적인 HRI 유지에 영향을 끼칠 수 있는 외형적 요인으로 로봇 얼굴과 로봇과 아동간 관계성을 지향하는 컨텐츠 개발이 필요함을 보였다.
-
본 작품은 고령자에게 생활의 도움을 주면서 감성적으로 인간 친화적 역할을 수행하는 것을 목적으로 제작한 로봇이다. 고령화 사회 속에서 혼자 사는 노인들이 증가하는 사회현상을 바탕으로 노인의 노화로 인한 신체적 약점들 중 가장 많이 눈에 띄고 보편적인 증상을 일상 속에서 보완해 줄 수 있는 로봇을 개발하는데 중점을 두었다. 단순히 기능적인 편리성뿐 만 아니라 시각적으로 노인에게 즐거움을 주고 위안을 줄 수 있는 친근한 로봇은 노인이 생활하는데 큰 활력소가 될 것이다.
-
In large scale environments like airport, museum, large warehouse and department store, autonomous mobile robots will play an important role in security and surveillance tasks. Robotic security guards will give the surveyed information of large scale environments and communicate with human operator with that kind of data such as if there is an object or not and a window is open. Both for visualization of information and as human machine interface for remote control, a 3D model can give much more useful information than the typical 2D maps used in many robotic applications today. It is easier to understandable and makes user feel like being in a location of robot so that user could interact with robot more naturally in a remote circumstance and see structures such as windows and doors that cannot be seen in a 2D model. In this paper we present our simple and easy to use method to obtain a 3D textured model. For expression of reality, we need to integrate the 3D models and real scenes. Most of other cases of 3D modeling method consist of two data acquisition devices. One for getting a 3D model and another for obtaining realistic textures. In this case, the former device would be 2D laser range-finder and the latter device would be common camera. Our algorithm consists of building a measurement-based 2D metric map which is acquired by laser range-finder, texture acquisition/stitching and texture-mapping to corresponding 3D model. The algorithm is implemented with laser sensor for obtaining 2D/3D metric map and two cameras for gathering texture. Our geometric 3D model consists of planes that model the floor and walls. The geometry of the planes is extracted from the 2D metric map data. Textures for the floor and walls are generated from the images captured by two 1394 cameras which have wide Field of View angle. Image stitching and image cutting process is used to generate textured images for corresponding with a 3D model. The algorithm is applied to 2 cases which are corridor and space that has the four wall like room of building. The generated 3D map model of indoor environment is shown with VRML format and can be viewed in a web browser with a VRML plug-in. The proposed algorithm can be applied to 3D model-based remote surveillance system through WWW.
-
Yang, Seung-Eun;Do, Jun-Hyeong;Jang, Hyo-Young;Jung, Jin-Woo;Park, Kwang-Hyun;Bien, Zeung-Nam 362
지능형 주거공간에서 손 지시 명령을 통하여 가전기기를 선택하거나 로봇에게 이동하여야 하는 장소를 알려 주기 위해, 기존의 시스템은 선택되는 대상 기기의 3 차원 절대 위치를 미리 알고 있어야 한다. 또한 카메라 위치가 변동되었을 경우, 카메라의 위치를 절대좌표계 기준으로 새롭게 측정해야 하는 불편함이 있다. 이를 해결하기 위해 본 논문에서는 팬/틸트 모듈을 가진 두 대의 USB 카메라를 임의의 위치에 배치하더라도, 두 번의 손 지시만으로 선택 대상이 되는 기기의 3 차원 위치를 파악하고 이를 동작시키는 방법을 다룬다. 제안하는 방법에서는 두 대의 카메라 간의 상대 좌표계를 형성하기 위해 각 카메라에 표식을 부착한다. 각 카메라에서 다른 카메라의 표식을 관찰하면 카메라 간의 거리 및 각도를 구할 수 있기 때문에, 하나의 카메라를 기준으로 3 차원 절대 좌표계를 자동으로 설정할 수 있다. 또한, 두 대의 카메라로 사용자의 얼굴과 손을 검출하면 얻어진 기준 좌표계에 대해 얼굴과 손의 3 차원 위치를 계산하고, 두 지점을 연결하는 방향 벡터를 구함으로써 사용자가 손으로 지시하는 방향을 찾는다. 따라서, 카메라를 임의의 위치에 두더라도 사용자의 손 지시 동작만으로 대상체의 차원 위치를 파악할 수 있게 된다. 개발된 시스템의 유용성을 검증하기 위해 각 가전기기의 위치를 제안한 방법으로 구하고 실제 위치와의 오차를 분석하였다. 제안한 방법은 두 대의 USB 카메라와 일반 PC 또는 마이크로 프로세서만으로 구현할 수 있기 때문에 비용이 적게 들고 실시간 처리가 가능하며 사용자의 환경에서 편리성을 높이는 등 많은 장점을 가진다. -
본 연구는 다중 사용자가 존재하는 환경에서 각 사용자의 요구를 만족시킬 수 있는 서비스를 탐색하고, 선택된 서비스를 또 다른 사용자에게 제공되는 서비스와의 충돌 없이 제공하기 위한 서비스 선택 모델을 제안한다. 이 모델은 개별 사용자의 프로파일을 관리하는 사용자 에이전트(User Agent), 환경 정보를 인지하는 센서 매니저(Sensor Manager), 현 환경에 존재하는 기기들의 상태를 관리하는 장치 매니저(Device Manager), 그리고 개별 서비스들 사이의 충돌을 회피하고 서비스를 선택하는 서비스 브로커 (Service Broker) 의 4 가지 타입의 에이전트로 구성되어있다. 사용자 에이전트는 사용자의 과거 행동 정보로부터 사용자의 선호 패턴 및 프로파일을 추출해 낸다. 센서 매니저는 현재 환경에 존재하는 센서들로부터 전달받은 환경 정보를 조합함으로써, 현재 상황을 특징 짓는다. 사용자 에이전트와 센서 매니저로부터 현재 사용자의 특성과 현재 상황 정보를 전달 받은 서비스 브로커는 그 사용자가 현재 상황에서 어떠한 서비스를 필요로 하고 있는지 판단한다. 서비스 선택은 인지된 현재 상황에서 수행 가능한 서비스 목록 중에서, 사용자의 선호도 및 프로파일에 의해 적절한 서비스가 선택 된다. 이렇게 선택된 서비스는 그 서비스를 제공하기 위한 장치들의 작동을 제어함으로써 사용자에게 제공된다. 서비스를 위한 장치를 선택하고, 작업을 할당하기 위해 서비스 브로커는 장치 매니저를 통해 현재 사용 가능한 장치들의 상태와 제공하려는 서비스와 충돌을 일으킬 수 있는 장치들의 상태 정보를 받아와 서비스를 위한 최적의 장치들을 선택하고 동작에 대한 제어 정보를 작성한다. 이렇게 만들어진 서비스 제공 계획은 장치 매니저에게 전달되고, 장치 매니저는 계획에 따라 실제 장치들을 제어한다. 이상의 다중 에이전트 모델을 통해, 특정 상황에 존재하는 사용자 개개인에게 특성화된 서비스를 충돌 없이 제공할 수 있다.
-
최근 에이전트 기반 시스템을 만들기 위한 기술로서, 에이전트 지향 개발방법론 (Agent Oriented Methodology)이라는 영역이 출현하여, 여러 연구 기관에서 에이전트 시스템을 만드는데 이를 적용한 성공 사례가 늘고 있다. 그러나, 이들을 가지고 복잡한 다중 에이전트 시스템을 개발하는 일은 여전히 경험이 많지 않은 개발자들에게 있어서 어려운 일에 해당된다. 본 논문에서는 개발자에게 에이전트 설계 시 부과되는 이러한 어려운 점을 대한 해결책으로서, 개발자들에게 기능에 따라 분류된 디자인 패턴을 지원하여 다중 에이전트 시스템 설계 및 개발을 지원하는 개발방법론을 제안한다. 또한, 우리는 요구사항 분석부터 코드 생성까지 개발 프로세스에 반영하는 지원 도구를 제안한다. 이 CASE 도구는 단계별 자동화 기능뿐만 아니라, 설계 과정에서 개발자들에게 디자인 패턴을 고려할 수 있는 기능을 제공한다. 이를 통해, 우리는 에이전트 시스템 개발자 및 에이전트에 대한 지식이 부족한 이들에게 멀티에이전트 시스템 설계와 개발을 보다 쉽고 빠르게 해결할 수 있도록 돕는다. 본 논문에서는 여행 도우미 시나리오(Travel Assistant Scenario)을 제안 개발 방법에 따라 적용시켰다. 최종적으로, 보다 쉬운 방식으로 에이전트 소스 코드를 생성해냈으며, 이를 통해 제안 개발방법론이 개발자들의 다중 에이전트 기반 시스템의 개발에 대한 부하를 줄여 줄 수 있다는 결론을 내렸다.
-
오늘날 분산 컴퓨팅 환경에서 운용되는 시스템이 증가함에 따라 시스템의 관리작업은 고수준(high-level)의 자동화에 대한 요구가 증가하고 있다. 이에 따라 시스템 관리방식이 전통적인 관리자 중심의 방식에서 시스템 스스로가 자신의 문제를 인식하고 상황을 분석하여 해결하는 자율 컴퓨팅 방식으로 변화하고 있으며, 이에 대한 연구가 많은 연구기관에서 다양한 방법으로 이루어지고 있다. 그러나 이러한 대부분의 기존 연구들은 문제가 발생한 이후의 치유에 주로 초점이 맞추어져 있다. 이러한 문제를 해결하기 위해서는 시스템 스스로가 동작환경을 인식하고 에러의 발생을 예측하기 위한 예측 모델이 필요하다. 따라서 본 논문에서는 자율 컴퓨팅환경에서 자가 치유를 지원하는 4가지의 예측 모델 설계 방법을 제안한다. 본 예측 모델은 ID3 알고리즘, 퍼지 추론, 퍼지 뉴럴 네트워크 그리고 베이지안 네트워크가 각 시스템 상황에 맞춰 적절하게 사용되는 방식이며, 이를 통해 보다 정확한 에러 예측이 가능해진다. 우리는 제안모델의 평가를 위해 본 예측모델을 자가치유 시스템에 적용하여 기존 연구와 예측의 효율을 비교하였으며, 그 결과를 통해 제안 모델의 유효성을 증명하였다.
-
온톨로지는 시맨틱 웹의 핵심 기술 요소로서 지식을 개념화하고 명세화해서 의미론적 지식체계를 구축한다. 온톨로지는 개념적 모델링(Conceptual Modeling)을 통해 실제 세계의 지식(Real World Knowledge)을 표현하는 중요한 수단으로 제안되었고, 수많은 정보에 대한 지식관리를 효과적으로 수행할 수 있는 토대를 제공한다. 본 연구에서는 연구과제회의를 대상으로 온톨로지를 설계 및 구축한다. 과제 진행에 수반되는 다양한 회의와 관련자료는 과제의 성공적인 수행을 위해 반드시 관리되어야 한다. 일반적으로 회의에서 참석자들 사이에 정보 공유 및 자료 검색이 어렵고 회의일정 조정이 번거로우며 회의자료 관리가 체계적이지 못하다. 따라서 연구과제 진행과정의 회의와 관련자료들을 분석/분류해서 개념적 모델링을 통해 연구과제회의 온톨로지를 구축하고자 한다. 향후 이를 활용하여 지능형 반응 공간에서 회의 관리 및 서비스 제공을 할 수 있다.
-
음악을 들을 때 사람이 인지할 수 있는 긴장감을 뜻하는 텐션(tension)은 조성음악의 기본을 이루는 중요한 요소이다. 본 논문에서는 임의의 곡의 텐션의 움직임을 B-스플라인 곡선을 이용하여 표현하고 이 곡선을 수정하여 음악의 긴장도를 조정할 수 있는 방법을 제안한다. 먼저, 우리는 음악에서 사용되는 다양한 코드들의 긴장도를 측정하는 방법세 가지를 제안한다. 첫 번째는 러달이 제시한 5도권 기반의 코드 거리 측정방식을 개량한 것이며, 두 번째는 츄가 제시한 나선형 모델의 거리 측정 방식을 응용한 것이며, 세 번째는 크럼한슬이 제시한 특정한 조성에서 각 구성 음들의 안정도와 구성 음들 사이의 음정의 조화성을 이용한 방법이다. 이 방법들을 이용하여 우리는 음악이 지니고 있는 긴장도를 수치적으로 나타낼 수 있다. 다음으로 B-스플라인 곡선을 이용하여 전체 곡의 텐션의 움직임을 표현한다. B-스플라인 곡선으로 표현된 텐션 곡선은 수정이 가해져 원곡의 긴장도를 변화시키는데 사용될 수 있다. 본 논문에서는 텐션 곡선의 높이를 이용하여 곡 전체의 긴장도를 변화시키는 방법과 스페이스-타임 최적화를 사용하여 특정 부분의 긴장도를 변화시키는 방법을 제안한다. 또한 B-스플라인 곡선을 통하여 새로운 코드 진행을 얻을 수 있는 방법을 소개한다. 게임이나 영화, 애니메이션에서 긴장되는 장면을 연출할 때 긴장감 있는 음악의 사용은 필수적인 요소이다. 본 논문에서 제안하는 방법을 통하여 음악의 긴장도라는 인지적인 요소를 B-스플라인 곡선이라는 수치적인 형태로 표현함으로써, 우리는 실시간으로 음악의 긴장도를 자동적으로 변화시킬 수 있다. 따라서 본 논문에서 제안하는 방법은 게임 같은 인터렉티브한 환경에서 사용자의 몰입성을 증가시키는 방법으로 특히 효과적으로 사용될 수 있다.
-
In this paper, we present effective methods for music summarization which summarize music automatically. It could be used for sample music of on-line digital music provider or some music retrieval technology. When summarizing music, we use different two methods according to music length. First method is for finding sabi or chorus part of music which can be regarded as the most important part of music and the second method is for extracting several parts which are in different structure or have different mood in the music. Our proposed music summarization system is better than conventional system when structure of target music is explicit. The proposed method could generate just one important segment of music or several segments which have different mood in the music. Thus, this scheme will be effective for summarizing music in several applications such as online music streaming service and sample music for Tcommerce.
-
정보통신 기술의 발달로 근래에는 인터넷 방송 서비스가 활성화되었으며 누구든 자유롭게 방송을 제작하거나 청취할 수 있다. 이러한 인터넷 방송을 이용하기 위해서는 PC 를 이용하는 방법이 일반적이지만 오디오 서비스만을 이용할 경우 불편하다. 본 논문에서는 낮은 사양의 시스템에서 인터넷 방송을 청취하기 위한 하드웨어와 소프트웨어 설계 기법 그리고 효율적인 버퍼링 방법을 제안하였다. 제안된 시스템은 8 비트 마이크로 컨트롤러, 32KB 의 메모리, Hardwired TCP/IP Stack 그리고 Hardwired MP3 디코더를 이용하여 설계하였으며 각 작업간의 스케쥴링을 위하여 타이머 인터럽트를 이용하였다. 16KB의 메모리로 몇 가지 버퍼링 기법을 제안했다. 폴링 방식은 가장 보편적인 방법으로 데이터를 전송받는 작업과 음악을 재생하는 작업이 순차적으로 이루어진다. 이 방법은 데이터 전송과 음악 재생을 동시에 할 수 없기 때문에 타이머 인터럽트를 이용한 버퍼링 모델이 사용된다. 두 번째로 메모리를 두개의 블록으로 나누어 한 블록에는 데이터를 저장하고 다른 한 블록에는 데이터를 내보내는 '더블 버퍼링'을 제안했다. 세 번째는 메모리 블록을 여러 단계로 나눈'n-Queue 버퍼링' 기법을 제안했다. 마지막으로 네트워크 상황에 따라서 블록의 개수를 유동적으로 조절하는 '가변 길이 n-Queue 버퍼링' 기법을 제안했다. 이 방법은 네트워크 상황에 따라 메모리의 크기를 유동적으로 할당하기 때문에 메모리 사용률이 높아지는 장점이 있다. 본 논문에서 제안하는 시스템은 운영체제를 사용하지 않았기 때문에 TV 나 오디오 등 다른 시스템에 이식이 용이하므로 다양한 기기에 적용이 가능하다.
-
개인용 미디어 단말로서 MP3 플레이어는 이제 음악 파일을 감상하기 위한 일상 생활에서 중요한 휴대 필수품이 되었으며 단순히 음악을 재생하는데 그치지 않고, 각종 정보들을 표시하기 위한 작은 화면이 부착되고 있으며 더 나아가 이미지 정보나 동영상을 표현할 수 있는 기능들이 추가 되고 있다. 이처럼 변화하는 멀티미디어 서비스에 발맞추어 MPEG 에서는 Multimedia Application Format (MAF) (ISO/IEC 23000) 라는 새로운 표준안을 제안하였다. MAF 표준안의 기본 방식은 산업 현장 및 사용자의 요구에 빠르게 부응하기 위해, 기존에 존재하는 표준안들을 결합시켜 새로운 멀티미디어 파일 포맷을 정립하였다. 그 첫 번째 결과물로서, 이미 널리 쓰이고 있는 MP3 파일 포맷에 새로운 기능을 추가하기 위한 Music Player MAF 포맷의 FDIS 가 제안되었다. Music Player MAF 는 MPEG-1 Audio Layer III(MP3) 와 MPEG-7 MDS 메타데이터 정보를 결합한 파일 포맷으로. 기존 ID3 태그에서 표현되는 정보 보다 훨씬 풍부한 메타데이터 정보와 더불어 선택적으로 하나의 JPEG 이미지를 포함한 형태로 이루어져 있다. 그러나, 현재의 파일 포맷은 시간이 고려되지 않은 하나의 JPEG 이미지만을 포함할 수 있기 때문에, 오늘날 사용자가 요구하는 다양한 멀티미디어 서비스를 제공하기에는 많은 한계점을 갖고 있다. 본 논문에서는 Music Player MAF FDIS 에 제안된 세가지 형태의 Music Player MAF 파일 포맷에 관해 기술 한다. 복수의 JPEG 이미지 및 텍스트를 저장하기 위하여 각각의 파일 포맷이 갖는 문제점을 언급하고 하나 이상의 JPEG 이미지와 자막 정보를 MP3 음악 정보와 동기화 시켜 추가 할 수 있는 기능을 추가를 제안한다. 또한 제안된 파일 포맷을 쉽게 생성할 수 있도록 기존의 XMT-O 스키마를 기반으로 MAF 를 위하여 새롭게 MAF XMT 스키마를 정의하고 정의된 스키마를 기반으로 구현된 Music Player MAF 의 저작툴과 제안된 확장 뮤직 플래이어 MAF 을 위한 재생툴을 구현한다.
-
본 연구는 데스크탑 PC 환경에서 사용될 수 있는 다양한 적응형 메뉴 인터페이스의 사용성을 평가한다. 선택 빈도에 따라 자동으로 변화하는 2가지 방식의 Adaptive menu와 사용자가 메뉴 내에서 원하는 항목의 위치를 직접 변경하는 Adaptable menu의 사용성을 일반적으로 많이 이용되는 Traditional menu와 비교하기 위해 사용자를 동원한 평가 실험을 수행하였다. Adaptive menu에는 선택 빈도가 높은 메뉴 항목이 메뉴의 상단으로 이동하는 Adaptive split menu와 자주 선택되는 항목이 굵은 글씨로 표현되는 Adaptive style menu가 포함된다. 각 방식의 적응형 메뉴가 자주 선택되는 메뉴 항목의 변화에 따라 얼마나 민감하게 영향을 받는지 비교하기 위해, 두 개의 각기 다른 선택 빈도 분포가 이용되었다. 각 실험 조건 별로 사용자가 메뉴 항목을 선택하는 데 걸린 시간과 오류 회수를 측정하였으며, 피실험자로 하여금 시인성, 효율성, 전반적 선호도 등의 주관적인 만족도를 평가하도록 하였다. 각각의 종속 변수들은 분산 분석(ANOVA), Chi-square test, Friedman test 등의 기법을 이용해 분석되었다. 분석 결과, Adaptable menu가 다른 방식의 메뉴들에 비해 수행도와 만족도 모두 높은 것으로 나타났으며, Adaptive split menu는 상대적으로 현실적인 조건 하에서 큰 효용을 갖지 못하는 것으로 나타났다. Adaptive style menu는 수행도 측면에서는 일반적인 메뉴와 큰 차이가 없었지만, 자주 선택되는 항목을 쉽게 파악할 수 있게 해 주고, 선택 빈도의 변화에도 민감하지 않기 때문에 사용자들에게 선호되는 것으로 나타났다. 본 연구의 결과는 데스크탑 PC의 적응형 메뉴 설계에 대한 이용될 수 있으며, 추후 휴대용 정보기기의 적응형 메뉴에 대한 사용성 연구의 기초 자료로도 활용될 수 있을 것으로 기대된다.
-
현재 대부분의 데스크탑 시스템에서 사용자는 단지 하나의 마우스를 사용해서 컴퓨터와 상호작용을 하고 있다. 본 논문에서는 각각의 손으로 동시에 두 개의 마우스들을 사용할 때, 작업 성능에 대한 효과를 살펴보고자 한다. 본 논문에서의 실험에서는 데스크탑 환경에 기반한 간단한 게임 (날아오는 총알 피하기와 잡기)에서 세 개의 독립 변수들로 한 손 또는 양 손 사용 여부, 주위 상황(총알)의 변화 속도, 그리고 두 커서(캐릭터)들간의 거리 차이를 사용하고, 종속 변수로 사용자의 작업 성능(부딪친 총알 개수)을 측정하였다. 실험 결과에 의하면, 두 커서 (또는 두 캐릭터)와의 동시 상호작용이 필요할 때 한 손보다는 양 손을 사용할 때의 작업 성능이 통계적으로 유의하게 좋았고, 두 커서 사이에 거리가 멀수록, 그리고 총알의 속도가 느릴수록 작업 성능은 유의하게 좋았다. 독립 변수들 사이에는 서로 유의한 교호작용이 나타나지 않았는데, 이것은 작업 성능에 대한 양손의 효과가 다른 독립 변수들의 각 레벨과는 상관이 없었다는 것을 의미한다.
-
본 논문은 몰입형 가상환경 시스템에서 3 차원 공간입력 인터페이스 시스템을 이용한 3 차원 오브젝트 설계, 오브젝트의 변형 등의 작업을 수행하기 위해 몰입형 가상환경 시스템이 갖는 부정확한 입력과 접근성을 향상시키기 위한 연구이다. 몰입형 가상환경 시스템은 가상 디자인 분야에서의 활용이 예견되고 있으나, 사용자의 입력이 부정확한 단점으로 인하여 정밀한 입력을 요구하는 작업을 진행하기 위해 많은 어려움을 겪고 있다. 본 논문에서는 가상 디자인 분야에서의 사용자 입력 정밀도를 향상 시키는 방법으로 공간격자를 제시하고 두 가지 실험을 통해 공간격자를 사용할 때 사용하지 않았을 때 보다 좀 더 높은 입력 정밀도를 갖는 것을 알 수 있었다.
-
최근 많은 관심을 끌고 있는 지문인식시스템은 사용자의 지문영상을 입력 받아 사전에 등록된 템플릿과 비교하여 사용자 여부를 확인하는 사용자 인증 도구이다. 지문을 입력 받기 위한 센서와 매칭 알고리즘 등이 활발히 개발되고 있으며, 실제로 전자상거래나 출입통제시스템 등의 많은 분야에 적용되고 있다. 지문인식시스템에 대한 기존의 평가는 수집된 지문 DB 에 대해 인식 성능이 얼마인지, 쌍둥이들을 잘 구분하는지, 위조 지문을 파악할 수 있는지 등 주로 지문인식 자체의 성능에 초점이 맞추어져 있었다. 하지만 지문인식은 사용자나 환경과 관련된 많은 요인에 영향을 받기 때문에, 시스템을 효과적으로 적용하기 위해서는 이들에 대한 분석이 필요하다. 지문인식시스템에 대한 사용성 평가는 시스템이 대상환경에 효과적으로 적용되도록 하고, 사용성 분석을 통해 보다 편리하고 효율적인 사용자 인터페이스의 개발을 유도한다. 본 논문에서는 지문인식에 영향을 주는 요인을 사용자와 시스템 측면에서 분석하고, 사용성 평가를 통해 효과적인 지문인식시스템 인터페이스 구축을 위한 가이드라인을 제시한다.
-
본 논문에서는 고화질 협업 환경에서 다수의 고화질 영상들을 처리하기 위한 타일드 디스플레이(tiled display)기반의 확장성있는 디스플레이 구조를 제안한다. 제안하는 구조는 대형 고화질 디스플레이를 제어하기 위한 기술과 다수의 고화질 영상을 제한된 시스템 자원을 이용하여 효율적으로 디스플레이 하기위한 기술을 다룬다. 제안된 시스템은 영상의 획득/디코딩/디스플레이와 같은 가시화를 담당하는 Scalable Visualization Consumer 로 명명된 확장형 가시화 응용을 포함한다. 제안된 기법들을 토대로 구현된 확장형 가시화 시스템의 성능을 평가하고자 한다.
-
최근 PC 클러스터를 이용한 초고해상도 영상표현 시스템(예: PowerWall
$^{TM}$ ) 혹은 몰입형 가상환경 표현시스템 (예: CAVE$^{TM}$ , RealityCenters$^{TM}$ ) 등과 같은 멀티프로젝션 디스플레이 시스템은 산업, 군사, 과학, 의학 등에 널리 활용되고 있다. 하지만, 이와 같은 멀티프로젝션 디스플레이 시스템은 다수의 PC 클러스터와 프로젝터의 연결에 의해 구성이 되기 때문에 그 제어 방법은 각각의 PC 및 프로젝터의 프로그램과 동작을 반복적으로 실행하여야 한다. 이에 PC 클러스터 및 프로젝터의 직관적인 제어가 가능하고 일괄적으로 운용할 수 있는 환경이 필요하다. 본 연구에서는 멀티프로젝션 디스플레이 시스템의 PC 클러스터 및 프로젝터의 제어와 운용에 관한 것으로, PC 클러스터에 필요한 응용프로그램 일괄실행, 일괄 power 처리와 프로젝터에 필요한 일시중지(Mute), 입력소스선택, 일괄 power on/off 수행 등에 관한 효과적인 인터페이스의 구현 및 제어 방법을 제시하고자 한다. -
본 논문에서는 저가의 보급형 프로젝터를 사용하고 Programmable GPU 기법중 Pixel Shader 기술을 이용하여 에지블렌딩을 수행하였으며,
$7{\times}4$ 개의 프로젝터로 구성된$6592{\times}2784$ 픽셀의 초고해상도를 가지는$5.6m{\times}2.4m$ 의 대형 타일드 디스플레이를 구축해 보았다. 또한 타일드 디스플레이용 응용프로그램으로서 타일드 디스플레이 시스템을 마치 하나의 컴퓨터처럼 작동시킬 수 있는 타일드 디스플레이 관리 프로그램을 개발했으며, 이 프로그램은 컴퓨터와 프로젝터 제어, 응용프로그램 실행 및 종료를 담당한다. 그 외에도 일반 컴퓨터에서는 실행이 불가능한 초고해상도의 이미지 및 동영상까지도 볼 수 있는 이미지 뷰어와 동영상 플레이어를 개발하였다. 또한 100 만 폴리곤 이상의 3D 모델을 실시간으로 인터렉션 할 수 있는 3D 뷰어 등을 개발 하였다. -
최근 전자기기에서 시각 및 청각과 함께 촉각 디스플레이가 정보를 출력하는 중요한 수단으로 부각되고 있다. 본 논문에서는 촉각 정보 출력을 위한 소형진동촉각(vibrotactile) 디스플레이 모듈을 개발하였다. 개발한 모듈은 주파수와 진폭을 독립적으로 조절할 수 있으며 핀이 직접 피부에 자극을 주기 때문에 몸체 전체가 떨리는 기존의 진동모터보다 정밀하고 다양한 촉각 표현을 할 수 있다. 또한 고전압을 이용하는 Piezo 방식과 달리 낮은 전력으로 동작이 가능하여 휴대장치에 직접 장착할 수 있는 장점을 가지고 있다.
-
가상환경 또는 실제환경에서 정보를 제공하는 햅틱 인터페이스의 필요성이 점점 증가 함에 따라 촉감을 제공 하기 위한 다양한 햅틱 장치가 개발되었고 각 장치의 특성과 성능 평가를 위해 기초적인 정신(심리) 물리학적 연구가 수행 되고 있다. 본 논문에서는 여러 가지 햅틱 인터페이스 중 손가락 끝에 부착하는 형태의 새로운 공기 촉감 제시장치(PTI: Pneumatic Tactile Interface)를 제시하고 이 장치의 유용성을 입증하기 위해 localization rate, 시간 분해능, 길이 분해능, 강도의 세기 등의 심리 물리학적 실험(Psychophysical Experiment) 수행 결과를 제시한다. 공기촉감 시스템은 50개의 출력까지 확장 가능한 공기촉감 하드웨어로 구성 되어있고 손가락 끝에 부착하는 형태로 구성 하기 위해 5*5의 배열의 디스플레이를 제작하였다. 16명의 피실험자가 A, B 두 그룹으로 나뉘어 각각 2가지의 심리물리학 실험을 수행하였다. localization rate의 경우 9개의 다른 자극의 위치를 구별하기 위해 3*3 배열로 구성된 밀집된 디스플레이와 확장된 디스플레이로 측정을 수행하여 각각 58.13%, 85.9%의 localization rate를 얻을 수 있었다. 그리고 100번의 반복 실험을 통해 약 2.6mm의 길이 분해능을 얻을 수 있었고 자극 강도 실험의 경우, 실제의 강도가 세짐에 따라 피 실험 자들이 느끼는 강도의 척도도 증가 하며, 강도가 약해 질수록 피 실험 자들이 느끼는 강도 역시 거의 선형적으로 감소함을 알 수 있었다. 그러나 시간 분해능의 경우에는 시스템을 구성하는 밸브의 성능으로 인해 20ms 이하의 시간 분해능 측정은 제한 되었다. 이러한 심리 물리학 실험을 통하여 개발된 공기촉감 제시장치가 다양한 정보를 전달하는데 충분하다는 결론을 내릴 수 있으며, 제안된 시스템을 사용하는 여러 가지 어플리케이션을 제시하였다.
-
컴퓨터 기술이 발전함에 따라 3 차원 입력시스템을 통한 모델링이 가능하게 되었다. 2 차원 시스템은 평면 입력을 공간상의 데이터로 바꾸기 위한 많은 기능과 메뉴들이 존재하지만 3 차원 시스템에서는 그러한 복잡한 기능 없이 입력 데이터가 곧바로 모델링에 적용될 수 있다. 하지만 아직까지 3 차원 입력시스템에서 모델링을 수행하는 디자이너에게 익숙한 스케치 방법을 고려하지 못하고 있는 실정이다. 디자이너에게 가장 익숙한 모델링 방법은 스케치북에 선으로 그림을 그리는 것이기 때문에, 모델을 변형하는 방법은 이를 벗어나지 않도록 해야 한다. 평면 스케치에서 디자이너가 그리는 선은 모델의 윤곽을 잡아주고 모델의 특징이 되는 부분을 표현하게 된다. 이러한 선의 입력을 통한 스케치를 3 차원 모델링에서 그대로 사용하기 위해서는 공간에서의 점이나 면이 아닌 선의 입력을 모델링에 적용할 수 있어야 한다.
-
본 논문에서는 사용자가 NURBS 곡면을 다양한 형태로 변형을 손쉽게 할 수 있는 수정된 유한요소법을 이용한 곡면 변형의 방법을 제시한다. 수정된 유한요소법은 NURBS 기저함수를 전통적 유한요소법의 형상함수를 대신하여 유한요소해석을 한다. 모델링된 객체는 NURBS 곡면으로 이루어져 있고, 각각의 세그먼트별로 나누어진 기저함수와 제어점으로 구성되어있기 때문에 번거롭게 요소와 형상함수를 따로 구하지 않아도 되며, 자체 보간 방식이므로 기존의 유한요소법에 비해 적은 요소와 절점으로 곡면을 해석 할 수 있다. NURBS 곡면 변형은 각각의 제어점에 의해 구역이 나눠지고 각 구역은 변형될 지점과 가장 가까운 제어점으로 구성된 구역의 제어점들을 변형시킬 지점과 각 제어점의 거리 비례에 따라서 제어점 들의 속도가 지정되어 변형을 완성한다. 제시된 변형 방법은 다른 변형들과 같이 초기 입력에 의해 변형이 한 순간에 진행되는 것이 아니라 점진적 변형이 일어나며, NURBS 의 특징인 전체 제어점 변형으로 인해 의도하지 않은 변형이 일어나는 것을 변형 중간에 각각의 제어점의 속도를 제어함으로써 사용자의 의도한 변형으로 빠른 시간에 완성할 수 있게 된다.
-
본 논문에서는 비디오에서의 특징점 추적을 통해 얻은 2D 좌표를 이용한 3D 구조를 추정하는 방법과 네 점 이상의 공통점을 이용한 융합 방법을 제안한다. 영상의 각 프레임에서 공통되는 특징점을 이용하여 형상을 추정한다. 영상의 각 프레임에 대한 특징점의 추적은 Lucas-Kanade 방법을 사용하였다. 3D 좌표 추정 방법으로 개선된 직교분해기법을 사용하였다. 개선된 직교분해기법에서는 3D 좌표를 복원함과 동시에 카메라의 위치와 방향을 계산할 수 있다. 복원된 부분 데이터들은 전체를 이루는 일부분이므로, 융합을 통해 완성된 모습을 만들 수 있다. 복원된 부분 데이터들의 서로 다른 좌표계를 기준 좌표계로 변환함으로써 융합할 수 있다. 융합은 카메라의 모션에 해당하는 카메라의 위치와 방향에 의존된다. 융합 과정은 모두 선형으로 평균 0.5초 이하의 수행 속도를 보이며 융합의 오차는 평균 0.1cm 이하의 오차를 보였다.
-
본 논문에서는 3D 파노라믹 가상 환경 생성을 위한 투영기반 메쉬 모델 생성 기법을 제안한다. 제안된 메쉬 모델 생성 기법은 멀티뷰 카메라를 이용해 다수의 시점에서 얻은 실내 환경의 3D 데이터로부터 메쉬 모델을 생성한다. 먼저 미리 보정된 카메라 파라미터를 이용해 입력된 임의의 3D점 데이터를 여러 개의 하위 점군으로 분할한다. 적응적 샘플링을 통해 각 하위 점군으로부터 중복되는 점 데이터를 없애고 새로운 점군을 생성한다. 각각의 하위 점군을 Delaunay삼각화 방법을 통해 메쉬 모델링하고, 인접한 하위 점군의 메쉬들을 통합하여 하나의 메쉬 모델을 생성한다. 제안된 메쉬 모델링 방법은 점군의 분할을 통해 각 부분의 메쉬 모델을 독립적으로 생성하므로 실내 환경과 같은 넓은 영역의 모델링에 알맞다. 또한, 적응적 샘플링을 통해 3D 데이터가 갖는 깊이 정보의 특징을 보존하면서 메쉬 데이터의 크기를 줄인다. 생성된 가상 환경 모델은 가상/증강현실 응용 어플리케이션 등에 적용이 가능하다.
-
거울은 인간이 자신의 모습을 들여다 보기 위해 오랜 세월 동안 이용했던 친숙한 도구이다. 디지털 기술의 발달로 우리는 빛과 정보를 함께 반사해 주는 거울에 대한 여러가지 접근들을 보아 왔다. 전통적인 거울은 빛의 즉각적인 반사에 의해 일어나는 자동적인 시각적 피드백 덕분에 특별한 조작이 필요하지 않으나, 빛과 정보가 함께 반사되는 디지털 거울에서는 다른 형태의, 좀더 적극적인 사용자 인터랙션을 기대할 수 있다. 본 논문에서는 사용자와 거울간의 거리에 따른 행태 조사를 중심으로 인터랙션 유형의 사례 분류 및 사용자 조사 연구를 정리하였다. 이를 바탕으로 거리에 따라 다른 사용자 요구사항을 충족하는 디지털 거울에 적합한 조작 인터페이스를 제안하고, 초기 모델로 회전식 적외선 격자를 이용한 조작, 비젼 기반의 정면 이미지 획득 및 얼굴 확인, 그리고 적외선 위치확인을 통해 사용자와 인터랙션하는 거울을 설계하였다. 본 연구에서는 거울과의 인터랙션에서 나타나는 사용자의 요구사항을 토대로 여러 비접촉식 거울 인터페이스를 설계하고 시스템에 적용한 사례를 분석한다. 아울러 결과물의 초기모델에 대한 분석을 통해 더 개선된 형태의 '거울을 응용한 시스템'의 설계 가능성을 보일 수 있다.
-
시각적인 정보전달이 어려운 상황에서의 대상인식, 혹은 시각장애인의 대상인식에 있어서 소리는 어느 정도의 역할을 할 수 있을까? 이 연구는 소리를 통해 대상의 형태정보를 전달하기 위해 진행되었다. 하나의 음(musical tone)을 음높이와 음색, 지속시간을 조정한 후, 머리전달함수(Head-Related Transfer Function: HRTF)를 이용하여 수평선, 수직선, 대각선, 곡선의 형태로 운동하는 3-D 사운드 형태소로 만들었다. 그리고 이들의 연속적인 조합을 통해 단순한 도형에서부터 복잡한 도형, 이들 2차원상의 도형을 단면으로 하는 3차원상의 도형들까지 그려내는 소리자극을 구성하였다. 성인 대학생을 대상으로 한 실험에서, 이렇게 만들어진 청각이미지(auditory image)를 듣고 표상된 형태를 여러 개의 시각적인 이미지들(visual images) 중에서 선택하는 과제를 실시하였는데, 실험 결과는 평균 78%의 정확율을 보였다. 이는 소리를 이용한 형태정보 전달의 가능성이 있음을 시사하는 것이며, 이러한 시도는 청각 인터페이스의 응용범위를 확장하는데 도움이 될 것이다.
-
본 논문에서는 특별한 스튜디오 조명이 아닌 가정용 혹은 학교용 조명 하에서 동작하는 감정 표현이 가능한 그림자 놀이 도구를 소개한다. 이 놀이는 사용자의 실사로부터 추출된 가상 그림자에 사용자의 동작에 따라 실시간으로 반응하는 가상 표정 애니메이션 캐릭터를 투영한다. 이 놀이 도구는 행위전시 등의 공연 환경뿐만 아니라 가정, 학교 등의 일상 환경에서도 동작이 가능하도록 설계되었다. 따라서 가장 일반적인 조명의 하나인 가정용 형광등과 백열등 환경을 가정하였고, 배경에 대해서는 어떤 제약도 가정하지 않았다. 사용자의 실사를 구분하는 과정에는 배경 차분화 기법을 사용하였고, 빛의 산란 및 실제 그림자의 영향 등으로 인한 잡음을 최소화하기 위해 몇 가지 잡음 제거 알고리즘을 결합하여 적용하였다. 이 도구에서 가상 그림자의 표정 애니메이션은 사용자의 손동작에 따라 변화하며, 손동작 및 머리 위치의 추적을 위해 새로이 고안한 자질 기반 추적 기법을 적용하였다. 이 도구는 공연장에서의 인터렉티브 미디어 아트 전시 또는 공연, 아동 대상의 미술 교육, 예술치료 등의 분야에 활용될 수 있을 것으로 판단된다.
-
Kim, Yong-Se;Cha, Hyun-Jin;Park, Seon-Hee;Cho, Yun-Jung;Yoon, Tae-Bok;Jung, Young-Mo;Lee, Jee-Hyong 519
Advances in information and telecommunication technology increasingly reveal the potential of computer supported education. However, most computer supported learning systems until recently did not pay much attention to different characteristics of individual learners. Intelligent learning environments adaptive to learner's preferences and tasks are desired. Each learner has different preferences and needs, so it is very crucial to provide the different styles of learners with different learning environments that are more preferred and more efficient to them. This paper reports a study of the intelligent learning environment where the learner's preferences are diagnosed using learner models, and then user interfaces are customized in an adaptive manner to accommodate the preferences. In this research, the learning user interfaces were designed based on a learning-style model by Felder & Silverman, so that different learner preferences are revealed through user interactions with the system. Then, a learning style modeling is done from learner behavior patterns using Decision Tree and Neural Network approaches. In this way, an intelligent learning system adaptive to learning styles can be built. Further research efforts are being made to accommodate various other kinds of learner characteristics such as emotion and motivation as well as learning mastery in providing adaptive learning support. -
이 논문에서는 트루타입 폰트의 글자 외곽선 데이터를 이용하여 자동으로 한자의 획을 분리하고 획 순서를 정하는 방법을 제안한다. 트루타입 폰트에는 글자의 외곽선 정보가 벡터 형식으로 저장되어 있으며, 이러한 벡터들은 일정한 규칙으로 배열되어 있다. 이와 같은 벡터들의 배치를 이용하여 한자의 획이 될 수 있는 벡터들의 집합을 조합하여 독립적인 획을 분리해 내고, 글자를 획 별로 분리하여 본래 트루타입 폰트의 저장 형식과 동일한 파일 형식으로 저장한다. 또한 분리된 모든 획에 대하여, 획 이름을 정의하고, 정의된 획들 간의 위치와 상관관계를 이용하여, 획 사이의 우선순위를 결정하여 획 순서를 부여한다. 이 작업들은 사람의 작업 없이 순수하게 자동으로 이루어지므로, 시간과 노력을 최소화 할 수 있다. 게다가, 획 별로 분리되고 순서대로 정리된 한자들은 트루타입 폰트에 저장되어 있는 모양과 특성을 그대로 가지고 있으므로, 단순히 폰트 자체로써 사용할 수도 있을 뿐만 아니라, 한자 학습 컨텐츠로도 이용이 가능하며, 각종 애니메이션 효과 등 다양한 분야에서 융통성 있게 활용될 수 있다.
-
집적 영상(Integral Imaging) 시스템은 관찰자가 특수안경의 착용 없이 육안으로 3 차원 영상을 볼 수 있는 무안경식 양안시차 디스플레이 방식 중 하나로, 수직, 수평 시차와 총천연색의 영상을 제공한다. 집적영상 시스템은 3 차원 정보를 2 차원 엘리멘탈 이미지 (Elemental image)의 형태로 저장하는데, 엘리멘탈 이미지는 조금씩 다른 방향에서 제한된 크기로 촬영된 이미지이다. 엘리멘탈 이미지는 컴퓨터 그래픽으로 만들어질 수도 있는데, 이를 이용하는 집적 영상 방식을 CG 직접 영상 시스템이라 한다. 이와 같이 컴퓨터 계산에 의해 엘리멘탈 이미지를 얻는 과정을 이미지 매핑 (Image mapping)이라 부른다. 이제까지 제안된 이미지 매핑 방식에는 점대점 (Point to Point), MVR (Multi-Viewpoint Rendering), PGR (Parallel Group Rendering) 이 있다. 그러나 이런 방식들은 계산량이 많거나 렌즈 어레이 개수의 증가에 의해 속도에 영향을 받는 단점이 있어, 아직 가상현실 같은 실시간 CG 응용 분야에 사용하기 어려운 문제가 있다. 본 논문에서는 VVR (Viewpoint Vector Rendering)이라는 기존의 방법과 비교해 향상된 새로운 이미지 매핑 방법을 제안한다. 먼저 VVR 개념을 자세히 설명한 후 VVR 을 사용한 집적 영상 시스템을 구현하여 MVR 방법과 비교 분석한 실험결과와 개선되어야 할 방향을 제시한다.
-
3차원 관상동맥을 분석하기 위해서는 혈관의 분기점, 극단점, 혈관의 계층적 구조 관계를 함축적으로 표현하는 것이 매우 중요하다. 본 논문에서는3차원 CT 혈관 조영 영상으로부터 관상동맥의 3차원 골격을 자동으로 추출하는 방법을 개발하였다. 먼저, CT혈관 조영술에 의해 획득된 슬라이스 이미지로부터 3차원 조작 및 수술 시뮬레이션 등을 위하여 혈관의 3차원 표면에 대한 메쉬 모델을 생성한다. 생성된 메쉬 모델이 임의로 변형된 후에도 자동으로 골격을 쉽게 추출할 수 있도록 메쉬 모델을 복셀화하는 단계를 거친다. 이렇게 얻어진 복셀 모델로부터 표면복셀을 결정하고 표면 복셀로부터 객체 복셀까지의 유클리드 거리값를 계산하여 유클리드 거리맵(EDM)을 계산한다. 계산된 EDM 으로부터 객체 복셀이 가지게 되는 최대 내접 구를 계산하여 Discrete Medial Surface을 생성하게 되는데 이것은 골격의 후보가 된다. 골격의 후보집합 복셀에 대하여 Dijkstra 최단 경로 결정 알고리즘을 적용하여 골격을 자동으로 추출하게 된다. 이렇게 추출된 3차원 골격은 관상동맥 수술 시뮬레이션 등의 다양한 형상 분석에 유용하게 사용될 수 있다.
-
우리 춤은 우리 고유의 정서를 담고 있는 종합예술이므로 우리 춤을 분석하고 이해하는 것은 큰 의미가 있다. 본 논문에서는 기존의 춤 동작의 정량적인 분석을 통한 감정인식 기술을 이용하여 우리 춤에 내포된 감정 패턴의 변화를 살펴본다. 먼저 한국 전통춤으로부터 무용전문가들의 정성적 분석에 기반하여 추출된 우리 춤사위를 정해진 각 감정별로 재구성하여 창작하고 창작된 우리 춤을 무용전문가가 시연한다. 이를 카메라를 이용하여 획득하고, 영상처리를 통해서 시연자의 실루엣을 뽑아낸 후, 정량적 특징량들을 추출한다. 이어 신경회로망을 이용하여 각 감정별 춤사위를 학습 시킨 후, 임의의 춤사위에 내포된 감정을 인식 한다. 본 논문에서는 정면, 좌, 우 세 시점에서 획득된 다시점 영상을 이용하여 학습시킴으로써 보다 안정적으로 동작하는 인식 시스템을 제안한다. 그리고, 시스템에 의해 인식된 감정 패턴과 변화의 정성적 의미를 이해하기 위해 무용전문가들에 의해 정립된 정성적 분석 결과와 비교, 분석한다. 이는 정성적인 분석에만 국한되던 우리 춤의 특성에 대한 이해를 객관적이고 정량화된 분석을 통한 이해의 차원으로 확장시키는 것으로, 우리 춤의 특성을 새롭게 정의하는 계기를 마련할 수 있다. 다양한 장르의 한국 전통춤 가운데 우리 춤을 대표할 수 있는 춤사위를 선정하고, 정성적/정량적으로 분석함으로써 우리 춤의 특성을 이해하기 위한 체계적인 틀을 제공하고자 한다.
-
감정을 포함하고 있는 음성은 청자로 하여금 화자의 심리상태를 파악할 수 있게 하는 요소 중에 하나이다. 음성신호에 포함되어 있는 감정을 인식하여 사람과 로봇과의 원활한 감성적 상호작용을 위하여 특징을 추출하고 감정을 분류한 방법을 제시한다. 음성신호로부터 음향정보 및 운율정보인 기본 특징들을 추출하고 이로부터 계산된 통계치를 갖는 특징벡터를 입력으로 support vector machine (SVM) 기반의 패턴분류기를 사용하여 6가지의 감정- 화남(angry), 지루함(bored), 기쁨(happy), 중립(neutral), 슬픔(sad) 그리고 놀람(surprised)으로 분류한다. SVM에 의한 인식실험을 한 경우 51.4%의 인식률을 보였고 사람의 판단에 의한 경우는 60.4%의 인식률을 보였다. 또한 화자가 판단한 감정 데이터베이스의 감정들을 다수의 청자가 판단한 감정 상태로 변경한 입력을 SVM에 의해서 감정을 분류한 결과가 51.2% 정확도로 감정인식하기 위해 사용한 기본 특징들이 유효함을 알 수 있다.
-
최근에 들어서 생체신호분석을 통하여 여러 가지 사용자 상태를 파악하려는 연구가 많이 진행되고 있다. 대표적인 것이 GSR(전기피부반응, galvanic skin response), BVP(blood volume pressure), 호흡 등의 생체신호가 사람의 흥분 정도, 정신적 부담, 감정변화에 따라 달라지는 특성을 활용하는 것이다. 본 연구에서는 디지털 TV, 혹은 IPTV 의 컨텐츠를 감상하는 환경 하에서 시청자의 생체신호의 변화 패턴을 분석하여, 그 분석 결과로부터 TV 프로그램이나 디지털 컨텐츠에 대해 시청자가 느끼는 만족도, 집중도, 흥미 여부 등을 추론하고자 하였다. 즉, 주어진 컨텐츠를 감상하는 동안 시청자로부터 얻어낸 생체신호를 분석한 시청 정보 데이터가 프로그램에 대한 선호도와 관련을 가질 수 있는지 검증한 기초 연구 결과를 제시한다. 또한 이 결과를 통해 프로그램에 대한 시청자의 반응을 객관적으로 측정하고 실시간으로 반영할 수 있도록 하는 TV 프로그램 추천 시스템의 구현 가능성을 검증한다.
-
Vocal-cord Signal Study based on Phonological Feature for Vocal-cord Signal Isolated-Word recognizer웨어러블 환경에서 가장 유용한 사용자 인터페이스는 음성이다. 그러나 현재 노이즈 제거 기술로는 웨어러블 환경과 같은 고소음 환경에서 음성 인식기의 실제적인 응용은 거의 불가능하다. 본 논문은 환경노이즈를 원천적으로 차단하는 성대 마이크를 이용한 명령어 인식기를 개발한다. 이를 위해 성대신호를 한국어 음운자질 이론을 기반으로 설명하고, 입력신호를 분석하여 이러한 접근방법의 타당성을 검증한다. 이러한 성대신호의 분석을 위해 스펙트럼과, FFT 결과를 사용하고, MFCC 알고리즘을 이용하여 주파수 영역내의 정보량이 인식에 미치는 영향을 분석한다. 그리고 분석결과를 바탕으로 성대신호 명령어 인식기를 위한 특징벡터로 유/무성음 분리에 사용되는 특징벡터가 유용함을 ZCPA 알고리즘을 이용한 성대신호 명령어 인식기를 개발하여 검증한다. 실험결과 ZCPA 를 사용한 것이 MFCC 에 비해 16%높은 인식률을 보인다.
-
음성을 통한 사용자 간의 정보 교환 방법은 추가적인 훈련 과정이나 장비가 필요하지 않고 공간 제약이 거의 없기 때문에 노약자 등 사용자의 연령대에 관계없이 사용될 수 있다. 또한 음성 정보는 시각이나 촉각 등 다른 정보 수단과의 상호 작용으로 상승 효과를 유발할 수 있기 때문에 사람과 기계 사이의 인터페이스로 활용될 경우 정보 전달력을 높이면서 사용자 친화적인 서비스를 제공할 수 있다. 그러나 동일한 상황에서 동일한 유형의 음성 정보가 사용자에게 지속적으로 제공될 경우 표현상의 단조로움으로 인해 정보 전달력이 급감할 수 있는 문제점도 지니고 있다. 따라서 음성을 통한 정보 전달의 경우 동일 상황이라 하더라도 사용자의 행동 패턴, 심리 상태, 주변 환경 등에 따라 차별화된 문장 구조 및 어휘의 선택으로 긴장감을 유지시켜 줄 수 있어야 한다. 본 논문에서는 5 세 전후의 어린이를 대상으로 그들의 행동 패턴 분석에 기반하여 개별화된 음성 합성 결과를 제공하는 시스템을 제안한다. 이를 위해 유치원이라는 물리적 공간에서 어린이들의 주된 행동 패턴을 분석하고, 현직 유치원 교사를 대상으로 동일한 정보를 전달하는 조건을 통하여 어린이의 행동 패턴과 위치 정보, 연령 및 성격에 따른 발화 문장의 문장 구조와 어휘적 특성을 파악한다. 최종적으로, 개별화된 음성 합성 결과를 위해 유치원 공간을 시뮬레이션 하고 RFID 를 이용하여 어린이의 행동 패턴 및 위치 정보를 파악한다. 그리고 각 상황에 따라 분석된 발화문의 문장 구조와 어휘 특성을 반영하여 음성으로 합성될 문장의 문장 구조 및 어휘를 재구성하여 사용자 개별화된 음성 합성 결과를 생성한다. 이러한 결과를 통해 어린이의 행동 패턴이 발화문의 문장 구조 및 어휘에 미치는 영향에 대해서 살펴보고 재구성된 결과 발화문을 평가한다.
-
모바일 환경에서 휴대폰을 사용하다 보면 무의식적으로 전화를 받지 못하는(Missing call) 상황이 빈번하게 일어난다. 휴대폰에서는 기본적으로 시각 청각 촉각의 다중양식 피드백(Multimodal feedback)을 제공하고 있음에도 불구하고, 이렇게 Missing call 이 발생하는 현상에는 여러 가지 다양한 원인이 존재할 것이다. 본 연구에서는 이러한 원인을 찾기 위해 모바일 환경 내 휴대폰 사용자 행동연구를 실시하여 일반적인 휴대패턴을 분석하고, Missing call과 관련하여 주로 설정하는 수신모드와 휴대패턴의 상호영향을 연구하고자 하였다. 본 연구결과, 모바일 환경에서 휴대폰 수신 탐지능력에는 인지심리학적(감각과 주의관련), 환경적, 행동학적 요인이 영향을 미칠 수 있는 것으로 나타났다. 또한 모바일 환경에서 주로 사용하는 수신모드인 진동모드 설정시, 휴대폰 사용자가 속한 환경에 다른 요인들이 복합적으로 존재할 경우 휴대폰 수신에 대한 탐지만족도가 감소함을 확인할 수 있었다.
-
문자메시지를 작성하는 작업 특성과 사용자의 특성간의 상호작용의 결과로, 휴대전화 사용자 집단간 통화량과 문자메시지 사용량은 다르게 나타난다. 본 연구에서는 문장 입력시간을 기준으로 청년층과 중장년층 집단 간의 운지 속도를 비교하여 노화로 인한 운지 속도의 차이를 고려한 지적활동의 시간 차이를 알아보고자 하였다. 그리고 한글 문자 입력 과제의 수행을 반복하여 청년층과 중장년층의 입력 속도 변화를 비교하였다. 즉, 사용자가 충분한 연습을 거치면 연령층에 관계없이 문장 입력 시간이 비슷해질 수 있는지를 실험을 통해 확인하였다. 휴대전화의 문자 입력 시스템에 익숙하지 않은 청년층과 중장년층 각각 8명을 선발하였으며, 50ms단위로 입력시간을 측정하였다. 실험결과, 두 집단의 연습 이후의 성취한 문장입력 수행도는 유의한 차이가 있는 것으로 나타났다 (P=0.039). 이러한 결과는 노화로 인한 인지적 기능의 저하가 문자 입력의 속도를 저해하는 주요 요인임을 보여준다.
-
웨어러블 컴퓨팅 환경에서 사용 가능한 키보드는 부담 없이 착용할 수 있어야 하며 충분히 빠른 속도로 문자를 입력할 수 있어야 한다. 또한 일반적인 사용자도 특별한 훈련과정 없이 쉽게 사용할 수 있어야 한다. 상용화된 웨어러블 컴퓨팅용 입력장치는 주로 소형화 QWERTY 키보드인데 공통적으로 키 수를 줄이는 방식을 택하고 있다. 그러나 줄이는 키 수에 대응하여 문자 입력을 위한 키 입력 수(KSPC: Key Strokes per Character)가 증가하기 때문에 입력효율이 저하되고 학습을 위한 요구되는 노력이 또한 증가한다. 그럼에도 불구하고 Halfkeyboard, WristPC keyboard, FrogPad 등 상품화된 키보드는 충분히 작은 사이즈가 아니어서 일상적으로 부담 없이 수용하기에는 물의가 있다. 본 연구는 이런 문제점을 해결하기 위해 키 간격을 줄여 극적으로 키보드를 소형화할 수 있는 원키 키보드라는 개념을 제안하였다. 전통적인 키보드의 경우 하나의 키에 하나의 문자가 할당되는데 반해 원키 키보드는 하나의 키 판 위에 10*5 배열의 QWERTY 키보드 문자배열을 표시하게 하였다. 또한 표시된 문자판에서 어떤 것을 선택하여 눌렀는지 손가락의 위치를 센싱하여 해당 문자를 입력하도록 하였다. 70mm*35mm 크기의 원키 키보드에 대한 실험결과 착용성과 사회적 수용성이 우수하였으며 5 세션의 시도를 통해 평균 18.9WPM 의 입력속도와 교정되지 않은 순수 에러율 0.87%를 기록하였다.
-
텔레매틱스 정보단말기는 가독성, 시인성, 주행 안전성의 사용성과 HMI(Human Machine Interface)를 고려하여 설계해야 한다. 텔레매틱스 정보단말기 GUI을 구성하는 요소로 Menu Type, Menu Structure, Font Size 등이 있다. 그러나 한글이라는 지역적 특성에 대한 연구가 미흡한 상태이다. 따라서 본 연구에서 국내 운전자를 대상으로 텔레매틱스 정보단말기 GUI Factor에 대해 국내의 환경에 맞는 설계를 도출하였다. 피험자는 총 30명(남자 24명과 여자6명)을 대상으로 가상 주행 시스템을 이용한 시뮬레이션 환경에 Task를 수행하도록 하여 실험을 하였다. 분석은 ANOVA, 다원배치법, T-test, Font 일반식 대입을 통해 이루어졌다. Menu Type은 가로세로 2*3 배열의 형태와 버튼간 간격을 주행안전성 및 시인성에서 고려하여 설계해야 한다. Menu Structure는 3Depth가 3Frame 보다 주행안전성 및 시인성이 5%유의수준에서 더 우수하다고 나타났다. 운전자 안구 거리에 따른 Font Size를 도출하는 일반식은 어두운 글자인 경우 0.0069radian * d = Font Size 가 되고, 밝은 글자인 경우 0.0075radian * d = Font Size 가 된다. 위와 같이 본 연구는 GUI 세가지 항목에 대하여 국내 운전자의 사용성과 텔레매틱스 정보단말기 간의 인터페이스를 고려하여 기존의 시스템에 대하여 에러를 줄이고, 수행능력을 향상 시켜 주었다.
-
3 차원 공간상에서의 상호작용이란 특정 공간내의 오브젝트를 그 위치와 좌표축에 따라 조작하는 행위를 말한다. 이러한 3 차원 공간상의 상호작용을 행할 때 발생하는 가장 큰 문제중의 하나는 사용자가 현재 조작하고 있는 커서 또는 포인터의 깊이적 위치를 알기 힘들다는 점이며 흔히 깊이 지각문제(Depth Perception Problem)으로 불리 운다. 본 논문은 깊이 지각문제를 발생시키는 기본적인 요소중의 하나를 가상환경을 표현하기 위해 인공적으로 생성된 조망 절두체라고 고려하고 이에 대해서 논의한다. 이를 위하여 3 차원 입력 장치(SensAble PHANToM(R) OmniTM)를 이용한 간단한 위치지정 작업을 다양한 FOV(Field of View)와 VD(Viewing Direction)의 환경에서 피실험자들에게 수행하게 하였다. 결과적으로, 작업환경내의 FOV 변화는 작업수행의 정확도에 영향을 끼쳤으며, VD 의 경우, 사용자가 실제로 작업환경을 보는 것과 유사한 VD 환경이 효율성의 측면에서 보다 더 높은 작업수행 결과를 보였다.
-
본 논문은 3차원 가상 환경을 탐험하는데 있어서 빠르고 효과적으로 충돌 탐지를 검출하는 방법을 제안하고자 한다. 넓은 가상 공간상에서 개체가 증가하는 것에 비례하여 충돌 탐지의 계산 비용은 기하 급수적으로 증가한다. 이를 효과적으로 처리하기 위하여 BSP-tree 분할 방식과 경계 기둥을 사용한다. BSP-tree 분할 방식은 3차원의 넓은 가상 공간을 여러 하위 공간으로 나누어 충돌 탐지가 이루어지는 공간을 축소한다. 이를 통하여 충돌 탐지 개체의 수가 증가하는 것에 따라 기하 급수적으로 증가하는 경계 기둥의 충돌 탐지 비용을 줄이는 효과를 얻을 수 있다. 경계 기둥은 축소된 하위 공간 상에서 개체간 실제 충돌 탐지가 일어날 가능성 및 충돌 여부를 빠르고 간편하게 판별하도록 한다.
-
핸드헬드 가상현실 시스템이란 멀티모달 센서와 멀티모달 디스플레이 장치가 내장되어 가상환경을 제공하는 한 손으로 들고 다닐 수 있는 핸드헬드 시스템을 의미한다. 이런 핸드헬드 가상현실 시스템에서는 일반적으로 제한된 입력수단 (예> 버튼, 터치스크린)을 제공하기 때문에 이를 사용해서 3 차원 인터랙션을 행하기가 쉽지 않다. 그래서 본 연구에서는 일반 핸드헬드 기기에 대부분 내장되어 있는 장치인 카메라를 사용해서 핸드헬드 가상환경에서 3 차원 인터랙션을 수행하는 방법을 제안하고 구현, 평가한다.
-
가상현실 시스템에서의 가장 기본적인 상호작용은 사용자가 원하는 위치와 방향으로 시야를 이동하는 네비게이션이다. 기존의 관련 연구들은 가상환경 네비게이션의 고전적인 문제인 'lost-in-cyberspace'에 대한 명확한 해결책을 제시하지 못하고 있다. 또한, 직관적이고 사용방법이 쉬운 상호작용에 대한 연구가 충분히 이루어지지 않았다. 본 논문에서는 증강현실 기반의 감각형 오브젝트를 이용한 네비게이션 인터페이스 시스템과, 사용자의 컨텍스트를 활용한 네비게이션 방법을 제안한다. 테이블의 표면에는 프로젝터를 이용한 후면 영사를 통해 가상환경의 지도와 사용자를 위한 네비게이션 정보가 보여진다. 사용자는 테이블 공간에서 카메라를 이용해 추적되는 감각형 오브젝트를 조작함으로써 가상환경을 네비게이션 할 수 있다. 또한, 사용자의 관심 지역 및 가상공간의 중요 지역 등의 컨텍스트는 사용자의 간단한 오브젝트 조작 정보와 결합되어 이동 경로 생성에 이용된다. 제안된 시스템은 본 연구실에서 제작된 Responsive Multimedia System (RMS) 의 인터페이스 시스템으로 연동되어 실험을 수행하였다. 제안된 시스템 및 네비게이션 기법은 사용자에게 전체 가상환경에 대한 인지력을 향상시키고, 직관적인 인터페이스를 제공하며, 최소한의 조작으로 만족스러운 네비게이션을 제공한다.
-
본 논문에서는 가상현실 환경에서 방위각, 고도, 거리 등의 위치 정보를 인지할 수 있는 3 차원 사운드를 생성하기 위한 구조적 머리전달함수(Head-Related Transfer Function, HRTF) 모델을 제안하고 이를 구현한다. 이를 위해 우선 기존에 연구된 방위각과 고도에 관한 head model 과 pinna model 을 근간으로 거리의 변화를 고려하도록 하는 HRTF 모델을 제안한다. 제안된 거리 변화에 따른 HRTF 모델은 거리 차이에 따른 음압의 변화 모델과 근거리에서 사람의 머리에 의해 생기는 shadowing 모델로 구성된다. 본 논문에서는 제안한 모델로 부터 mono 사운드를 방위각, 고도, 거리를 인지할 수 있는 stereo 사운드로 변환하여 생성하는 3 차원 사운드 생성기를 구현하였고, 일반인을 대상으로 거리에 대한 청취 실험을 통하여 제안한 모델의 성능을 측정하였다. 그리고 제안된 모델을 가상현실의 실감모델인 MP3 에 구현하여 그 효과를 입증하였다.
-
Jeon, Hyeon-Sig;Woo, Sung-Hyun;Park, Hyun-Ju;Cho, Sang-Do;Na, Jong-In;Kim, Ki-Hwan;Yang, Chang-Soo 638
유비쿼터스 시대가 도래함에 따라 사회적으로 실내 위치 추적 시스템에 대한 관심이 증가되었다. 하지만 기존 실내 위치 추적 시스템은 실내 환경의 빈번한 변화에 능동적으로 대응하지 못하고, 실내 환경의 NLOS 특성으로 인하여 이동 객체의 정확한 위치 측정이 어려운 문제점이 있다. 본 연구의 목적은 앞으로 유비쿼터스 시대가 도래함에 따라 다양한 사용자의 요구를 만족시키기 위한 서비스를 제공하는데 필수 요소인 실내 이동 객체의 위치를 효과적으로 파악하고, 이동 객체의 위치 정확도를 향상시킨 환경 적응형 위치 추적시스템을 제안한다. -
본 논문에서는 스마트 홈을 위한 실내 위치 추적 방법을 제안한다. 스마트 홈 환경에서 개인의 상황에 맞는 서비스를 제공하기 위해서 위치는 중요한 정보 중의 하나이며 최근에는 위치 정보를 확장하여 거주자의 행동 정보를 활용하여 거주자의 행동에 따른 서비스를 제공하는 것이 이슈가 되고 있다. 이를 위해서 제안된 적외선 기반 실내 위치 추적 시스템인 ubiTrack은 스마트 홈 내의 거주자로부터 거주자의 행동을 추론하기 위한 여러 컨텍스트 정보를 추출할 수 있다. 제안된 방법은 발신기, 수신기, 그리고 클라이언트 부분으로 나뉜다. 발신기는 천장에 부착되어 있는 적외선 발신기로부터 각각의 아이디를 가진 적외선 신호를 발생한다. 두 개의 적외선 수신 센서로 구성된 수신기는 발신기에서 발신된 아이디를 수신하여 클라언트 부분으로 보낸다. 클라이언트는 이 개별 아이디를 실제 위치정보로 전환하고 이를 활용하여 거주자의 방위와 속력 정보를 추출한다. 추출된 속력 및 방위 정보를 활용하여 거주자의 간단한 행동 정보를 추론할 수 있다. ubiTrack에서 추출된 이러한 정보는 거주자의 최종 행동 정보, 즉 거주자가 TV를 보려는지, 전등을 사용하려는지 등의 정보를 추론하는데 사용될 수 있다. 제안된 방법은 스마트 홈 테스트 베드인 ubiHome에 적용이 되었으며 몇 가지 실험을 통하여 거주자의 행동을 통하여 스마트 홈 환경에서 거주자의 행동을 통한 서비스 제공이 가능함을 보였다.
-
다중 객체 추적이란 컴퓨터 비전의 한 분야로, 주어진 비디오 시퀀스 내에서 관심 있는 객체들을 추적하는 것을 말한다. 다중 객체 추적 시스템은 감시 시스템, 사용자 행동 인식, 스포츠 중계, 비디오 회의와 같은 다양한 응용 분야에 핵심 기반 기술로 쓰이고 있어 그 중요성이 매우 크다. 본 논문은 감시 목적의 다중 객체를 추적하는 방법에 대하여 다룬다. 감시 시스템의 특성상, 객체의 외관이나 움직임 등에 대한 가정을 하기가 어렵다. 따라서 본 논문에서는 크기, 색, 형태 같은 객체의 단순하고 직관적인 외관 특성을 이용하면서도, 객체들끼리 부분적으로 혹은 완전히 겹쳐졌을 때에도 객체들의 위치를 적절히 추적할 수 있는 방법을 제안한다. 본 논문에서 제안하는 방법은 객체들의 경로에 대한 정보를 유지하는데 그래프 구조를 이용한다. 그래프를 확장하고, 제거하여 영상에 대한 정보를 추론한다. 크게 보면 객체들을 영역 레벨, 객체 레벨 두 단계에 걸쳐 추적한다. 영역 레벨에서는 각 객체들이 있을 수 있을만한 영역에 대한 가설을 세우고, 객체 레벨에서는 각 가설에 대한 검증을 한다. 제안된 방법은 직관적인 정보만을 이용하여 서로 다른 형태의 객체를 빠르게 추적할 수 있음을 보여준다. 다만 객체의 외관 정보만을 이용하였기 추적하기 때문에, 객체가 다른 객체에 의해 완전히 가려진 채 또다시 다른 객체와 겹쳐지면, 정확한 추적이 되지 않는다. 이를 해결하기 위해서는 객체가 겹쳐졌을 때, 그 관계에 대한 정보를 모아야 하는데 이는 향후 연구를 통해 해결하고자 한다.
-
본 논문에서는 유비쿼터스 컴퓨팅 구현에 있어서 중요 핵심 요소 기술인 실내에서의 사용자의 위치를 인식하면서 동시에 사용자를 식별하는 방법에 대해 제안하고자 한다. 제안된 사용자 식별 방법은 초음파 센서의 물체까지의 거리를 측정할 수 있는 특성에 기초하여 구성원의 키 높이의 다름을 주요한 식별 특성으로 이용하는 방법이다. 또한 사용자 식별을 수행하는 것과 동시에 식별된 사용자가 센서가 장착된 문을 통과하여 들어왔는지 나갔는지를 감지하는 출입 감지 방법도 제안한다. 기본적인 출입 감지 방법의 아이디어는 2개 초음파 센서의 물체 감지 순서를 이용하여 개발되었다. 제안된 방법의 성능 검증을 위해 1단계의 프로토타입을 만들었으며, 개발된 프로토타입을 이용하여 3명의 가족 구성원으로 이루어진 일반 가정집의 화장실에 장착하여 성능 실험을 실시하였다. 실험 결과 100%의 사용자 식별 성능 및 평균 98%의 출입 감지 성능을 얻었다.
-
'Multi modal 인터페이스'란 인간과 기계의 통신을 위해 음성, 키보드, 펜을 이용, 인터페이스를 하는 방법을 말한다. 최근 들어 많은 휴대용 단말기가 보급 되고, 단말기가 소형화, 지능화 되어가고, 단말기의 어플리케이션도 다양해짐에 따라 사용자가 보다 편리하고 쉽게 사용할 수 있는 입력 방법에 기대치가 높아가고 있다. 현재 휴대용 단말기에 가능한 입력장치는 단지 단말기의 버튼이나 터치 패드(PDA 경우)이다. 하지만 장애인의 경우 버튼이나 터치 패드를 사용하기 어렵고, 휴대용 단말기로 게임을 하는데 있어서도, 어려움이 많으며 새로운 게임이나 어플리케이션 개발에도 많은 장애요인이 되고 있다. 이런 문제점들은 극복하기 위하여, 본 논문에서는 휴대용 단말기의 새로운 Multi Modal 인터페이스를 제시 하였다. PDA(Personal Digital Assistants)를 이용하여 더 낳은 재미와 실감을 줄 수 있는 Multi Modal 인터페이스를 개발하였다. 센서를 이용하여 휴대용 단말기를 손목으로 제어를 가능하게 함으로서, 사용자에게 편리하고 색다른 입력 장치를 제공 하였다. 향후 음성 인식 기능이 추가 된다면, 인간과 인간 사이의 통신은 음성과 제스처를 이용하듯이 기계에서는 전통적으로 키보드 나 버튼을 사용하지 않고 인간처럼 음성과 제스처를 통해 통신할 수 있을 것이다. 또한 여기에 진동자를 이용하여 촉감을 부여함으로써, 그 동안 멀티 모달 인터페이스에 소외된 시각 장애인, 노약자들에게도 정보를 제공할 수 있다. 실제로 사람은 시각이나 청각보다 촉각에 훨씬 빠르게 반응한다. 이 시스템을 게임을 하는 사용자한테 적용한다면, 능동적으로 게임참여 함으로서 좀더 실감나는 재미를 제공할 수 있다. 특수한 상황에서는 은밀한 정보를 제공할 수 있으며, 앞으로 개발될 모바일 응용 서비스에 사용될 수 있다.
-
유비쿼터스 컴퓨팅 환경에서 상황 인지 서비스 제공을 위한 프레임워크들은 환경에 있는 응용 서비스들로 하여금 사용자 행동 패턴을 지속적으로 모니터링하며, 하나의 중앙집중식 서버에서 축적된 사용자 프로파일을 관리하도록 개발되어 왔다. 그러나, 전체 환경이 사용자 개개인의 서비스에 대한 요구 및 선호도를 파악하고 관리하는 일은 비효율적이다. 그리하여, 사용자 프로파일 관리 서버를 사용하지 않고 개인화된 서비스를 제공하기 위하여 휴대용 정보 단말기가 직접 사용자의 서비스에 대한 선호도를 인식하고 관리하는 사용자 프로파일 관리 프레임워크를 제안한다. 스마트 홈 환경의 이동형 사용자의 컨텍스트 인식을 위해서는 사용자 몸에 부착되어 있는 센서들이 사용자에 대한 정보를 휴대용 정보 단말기로 전달하며, 각 정보 단말기는 다양한 센서들로부터 획득한 정보와 정보단말기를 통해 제공되는 사용자의 직접적인 요구정보를 서비스 목적에 맞게 재해석하여 사용자 선호도에 맞는 서비스 내용을 제공하도록 하는 것이다. 제안된 프레임워크는 휴대용 정보 단말기를 통해 사용자와 환경과의 상호작용을 필요로 하는 유비쿼터스 기술이 활용 가능한 다양한 어플리케이션에 광범위하게 활용될 수 있다. 더 나아가, 사용자의 사적인 정보 보호를 보장하면서 개인화된 서비스 제공을 가능하게 할 수 있다.
-
Chang, Wook;Kim, Kee-Eung;Lee, Hyun-Jeong;Cho, Joon-Kee;Soh, Byung-Seok;Shim, Jung-Hyun;Yang, Gyung-Hye;Cho, Sung-Jung;Park, Joon-Ah 678
본 논문에서는 휴대 단말을 위한 새롭고 직관적인 응용 프로그램 구동 방식을 제안한다. 핵심 아이디어는 사용자가 휴대 단말을 사용할 때 자연스럽게 발생하는 파지 형태를 응용프로그램 구동의 근거로 활용하는 것이다. 이를 위해 정전 용량 방식 터치 센서 시스템을 제작하고 이를 휴대 단말의 케이스 하부에 장착을 해 사용자의 파지 형태를 취득한다. 획득된 파지 형태의 인식을 위해 제안한 시스템에 특화된 인식기 및 전처리와 후처리 알고리즘을 개발하였다. 제안된 사용자 인터페이스 시스템의 효용성을 검증하기 위해 인식률 테스트를 수행한다. -
Cho, Sung-Jung;Choi, Eun-Seok;Bang, Won-Chul;Yang, Jing;Cho, Joon-Kee;Ki, Eun-Kwang;Sohn, Jun-Il;Kim, Dong-Yoon;Kim, Sang-Ryong 684
As many functionalities such as cameras and MP3 players are converged to mobile phones, more intuitive and interesting interaction methods are essential. In this paper, we present applications and their enabling technologies for gesture interactive cell phones. They employ gesture recognition and real-time shake detection algorithm for supporting motion-based user interface and entertainment applications respectively. The gesture recognition algorithm classifies users' movement into one of predefined gestures by modeling basic components of acceleration signals and their relationships. The recognition performance is further enhanced by discriminating frequently confusing classes with support vector machines. The shake detection algorithm detects in real time the exact motion moment when the phone is shaken significantly by utilizing variance and mean of acceleration signals. The gesture interaction algorithms show reliable performance for commercialization; with 100 novice users, the average recognition rate was 96.9% on 11 gestures (digits 1-9, O, X) and users' movements were detected in real time. We have applied the motion understanding technologies to Samsung cell phones in Korean, American, Chinese and European markets since May 2005. -
점점 더 많은 디지털 카메라와 휴대폰이 고해상도 카메라가 장착되고 대용량의 저장공간이 제공되면서 사용자들의 사진촬영 빈도가 증대하고 있다. 조만간 휴대폰의 저장된 사진을 효과적으로 관리하고 브라우징할 수 있는 기술이 필요한 시기가 올 것이다. 본 논문은 휴대폰이나 디지털 카메라 혹은 카메라가 장착되어 사진을 찍을 수 있는 모든 형태의 휴대단말에서 촬영된 개인사진을 지리적 위치정보를 이용하여 자동으로 분류하는 시스템을 제시한다. 기존의 시간정보를 이용하여 촬영시간의 근접성을 이용해 순차적으로 자동 분류하는 시스템과는 달리 위치정보를 이용하여 촬영위치에 따라 비순차적으로 자동 분류한다. 촬영위치 근접성을 결정하기 위해 밀도기반 클러스터링 알고리즘을 사용하여 전체 사진을 대분류하고 기존의 자동사진 분류방식에서는 다루지 않았던 일상사진과 비일상사진을 분류하고, 대분류된 사진을 시간정보를 이용하여 소분류 함으로서 자동 사진분류 성능을 높이고자 한다.
-
본 논문은 회전 및 천이불변 이미지 텍스처 검색의 새로운 방식을 소개한다. 주파수 영역의 극좌표계에서 동일한 공간 주파수에서 각도 방향으로 투영을 하는 각도 투영법을 제안하며, 제안된 각도 투영법을 이용하여 주파수 영역에서 푸리에 계수이 합과 표준편차를 특징벡터로 이용한다. 각도 투영법을 쉽게 구현하기 위해 극좌표계에서 라돈변환이 수행된다. 실험 시 MPEG-7 데이터를 이용하였으며 그 결과는 여러 텍스처 이미지를 검색하는데 있어서 특징을 잘 구별해 내는 결과를 보여준다. 또한 제안된 회전 및 천이불변 특징 추출 알고리듬은 등방성 텍스처나 국부적인 방향성을 보이는 텍스처 영상 검색에도 효율적인 검색률을 보인다.
-
인터넷의 성장과 함께 인터넷 상의 비디오 스트리밍은 콘텐츠 전달에 중요한 수단이 되었다. 기존의 비디오 전송 방식은 사용자 터미널에 하나의 압축된 비디오를 스트리밍하는 것이었으나 최근 다중 뷰 비디오 코딩은 다른 시각 각도에 비디오 스트리밍 서비스를 지원하는 새로운 어플리케이션이 되었다. 따라서 단일 비디오는 다른 초점을 갖는 여러 독립된 비디오 스트림으로 구성되며 이는 더 많은 대역폭을 요구한다. 하지만 시간에 따라 네트워크의 대역폭이 변하는 경우, 계획된 비트율에 따라 콘텐츠의 비트량을 조절하여 양질의 콘텐츠 제공을 보장하기 어렵다. 따라서 트랜스코딩은 가변적인 네트워크의 대역폭에 적응하기 위한 필수적인 처리 단계가 되었다. 본 논문에서는 동시에 다중 비디오의 선택 및 트랜스코딩을 함께 고려하는 최적화 방법을 기반으로 한 스트리밍 다중 뷰 비디오의 최적 적응 프래임워크를 제안한다. 최적화된 비디오 스트림의 집합은 네트워크 대역폭, 트랜스코딩 코스트와 같은 제한을 만족하고 최적의 인지적 화질을 갖도록 선택되거나 트랜스코딩될 수 있으며 이는 MCKP로 모델링될 수 있다. 또한 트랜스코딩시 R-D 커브 상에 최적의 점을 얻기 위해 분리계획법이 적용하며 결과를 비교 분석한다.
-
Since the introduction of digital camera to the mass market, the number of digital photos owned by an individual is growing at an alarming rate. This phenomenon naturally leads to the issues of difficulties while searching and browsing in the personal digital photo archive. Traditional approach typically involves content-based image retrieval using computer vision algorithms. However, due to the performance limitations of these algorithms, at least on the casual digital photos taken by non-professional photographers, more recent approaches are centered on time-based clustering algorithms, analyzing the shot times of photos. These time-based clustering algorithms are based on the insight that when these photos are clustered according to the shot-time similarity, we have "event clusters" that will help the user browse through her photo archive. It is also reported that one of the remaining problems with the time-based approach is that people perceive events in different scales. In this paper, we present an adaptive time-based clustering algorithm that exploits the usage history of digital photos in order to infer the user's preference on the event granularity. Experiments show significant performance improvements in the clustering accuracy.
-
경제지표, 주식시세, 전자상거래 등 시각적으로 제공되는 정보 중에 정확한 숫자가 중요한 정보인 경우도 있지만 2 차 정보로서 변화의 추세나 패턴이 중요한 경우도 있다. 주식을 포함한 유가증권이나 선물거래의 경우 주로 미국식 봉차트를 사용하는데 개인투자자가 늘고 있는 우리나라 실정으로 볼때 식음을 전폐하고 전광판에 매달리는 문제점이 지적되고 있고, 전문투자자들도 시각정보를 놓치지 않기 위해 일상 업무에 소홀해지는 경우가 많다. 이러한 경우 음향정보도 함께 제공한다면 인간은 다양한 감각기관을 가지고 있기 때문에 시각정보를 주로 이용하다가도 잠시 휴식을 취하거나 다른 용무가 있을 때 청각정보를 보완적으로 사용하여 스트레스를 줄일 수 있고 명철한 판단력을 유지할 수 있으며, 경우에 따라서는 음향정보가 상황판단을 위해 더욱 효과적일 수도 있을 것으로 본다. 음향정보가 시각정보를 대체하기 보다는 2 차 정보로서 상호보완성이 목적이라면 정확한 숫자의 표현보다는 거래패턴 등을 음악적으로 표현하여 음악 감상의 기능까지 갖춘다면 시각정보와는 차별화된 음향정보의 독자성을 찾을 수 있다. 간혹 종목별 등락을 읽어주거나 중요한 매매시점에 신호음을 내는 청각적인 방법이 사용되기도 하지만 상당히 제한적이고 단순한 상태이다. 그러므로 본 연구의 진정한 개발목적은 정보성 이외에 예술적 표현을 융합하는 것이며, 시각장애인이나 네트워크 환경이 열악한 사람들도 주식투자에 있어서 평등성을 보장하여 건전한 투자문화를 형성하기 위함이다. 실시간 거래정보를 음악적으로 표현하여 업무를 보면서도 들려오는 음악을 통해 거래상황을 파악할 수 있는 연구방법으로 거래빈도는 음의 빠르기로, 거래가는 음의 높낮이, 거래량은 음의 세기, 종목은 악기의 음색으로 표현하였으며, 컴퓨터에 내장된 사운드카드를 통해 소리를 들을 수 있도록 MIDI 데이터로 변환하였다. 통계정보는 주로 한국증권선물거래소(KRX: The Korea Exchange)에서 발췌하였으며, 시뮬레이션을 위한 프로그래밍 언어로는 Cycling74 의 Max/MSP 를 사용하였다.
-
본 논문은 UPnP 기반의 홈 네트워크 환경에서 AV 서비스를 이용하는 사용자가 홈 네트워크 도메인내의 위치 이동에 따라 디바이스의 전환을 요구하는 경우 유연하게 상호연동 서비스하기 위한 UPnP AV 프레임워크를 제안한다. 사용자는 AV 서비스를 받기 위하여 이동단말기기 뿐만 아니라 데스크탑 그리고 셋탑박스 등의 다양한 형태의 UPnP 디바이스 환경을 이용할 수 있다. 하나의 디바이스에서 제공되는 컨텐츠는 미디어 랜더러와 컨트롤 포인트에 의해 다른 디바이스 환경에서 사용자의 조작 없이 미디어를 연속하여 제공 받을 수 있다. 논문에서 제안된 UPnP AV 프레임워크 서비스는 사용자의 이동에 따라 단말에서 컨텐츠 재생을 위한 미디어 랜더러와 서로 다른 디바이스의 미디어 랜더러에 서비스하기 위한 컨트롤 포인트 그리고 컨텐츠가 제공되기 위한 미디어 서버로 구성된다. UPnP 포럼에서 정의하는 표준 서비스에 UPnP 프로토콜의 특성을 이용한 SwitchingModule과 접근제어목록을 기반으로 사용자 인터렉션을 설계하여, 사용자의 디바이스 전환에 따라 AV 컨텐츠를 제공하기 위한 신뢰성있는 미디어 서비스를 지원한다.
-
유비쿼터스 컴퓨팅 환경에서 상황정보 관리자는 특정인 주변의 상황정보의 변화를 관찰하여 그 사람의 현재 상태를 추론하는 역할을 한다. 지금까지의 상황정보 관리자는 사용자의 상태를 추론하는 과정에서, 관련된 상황정보 값들의 변화를 곧바로 사용자 상태의 변화로 간주하기 때문에, 사용자의 의도와는 상관없이 빈번하게 사용자 상태가 변화되는 결과가 초래되었다. 다시 말하여, 실제 사용자가 현재의 추론된 상태를 계속 유지하고 싶은 의도를 지닌 경우에도, 주변의 특정 상황정보의 값이 규칙에서 규정한 것과는 다르게 조금이라도 변하게 되면, 현재까지 유지되던 사용자의 상태 상황정보가 새로이 추론된 사용자상태 상황정보로 대체되게 되는 것이다. 따라서 해당 사용자는 전 상태를 기반으로 받고 있던 서비스를 더 이상 제공받지 못하게 되는 문제가 생기게 된다. 본 논문에서는 실제로 지속될 필요가 있는 것과 지속될 필요가 없는 상황정보를 구분하여 사용자의 상태 상황정보를 관리하고 범용적으로 적용될 수 있는 메커니즘을 제안한다. 본 메커니즘을 적용하게 되면, 사용자의 상태 상황정보의 존립에 영향을 미치는 주변 상황정보의 값이 달라지게 되어도, 활성화되어 있던 당시의 사용자의 상태정보는 '보류'된 상태로 남아있다가 활성화시키는 이벤트가 발생하였을 때에 '재개'되어 보류되기 전까지 서비스의 상태 그대로, 사용자의 생활패턴과 의도에 부합되는 서비스를 지속적으로 제공할 수 있게 된다.
-
유비쿼터스 가정환경에서 서비스를 제공하기 위한 다양한 장치들은 각기 고유한 인터페이스를 가진다. 사용자는 이 장치들을 제어하기 위해서 각각 다른 인터페이스에 익숙해야 하며, 결국 장치 수만큼의 인터페이스를 다루어야 한다. 이와 같은 불편을 해소하기 위해서는 하나의 입력 장치로 여러 장치들을 조작하는 사용자 인터페이스가 필요하다. 특히 유비쿼터스 가정환경에서는 다양한 장치들의 상태 및 기능 등이 동적으로 변하고, 장치가 설정되는 환경도 일정하지 않기 때문에 사용자 중심의 유비쿼터스 환경을 제공하기 위해서는 다양한 인터페이스를 통합할 필요가 있다. 사용자가 비슷하게 인지하는 이종 장치들의 기능을 통합하여 사용자 인터페이스의 동일한 입력으로 매핑한다면 사용자의 부담을 줄일 수 있을 것이다. 본 논문에서는 유비쿼터스 가정환경의 다양한 장비들과 인터페이스 사이의 입출력 관계를 분석하여 시맨틱 네트워크로 모델링하는 방법을 제안한다. 각 장치의 상태와 기능을 시맨틱 네트워크로 정의하고, 노드나 엣지 사이의 유사도를 평가하여 장치와 사용자 인터페이스 사이를 자동으로 매핑한다. 제안하는 방법을 가정환경 입출력장치에 적용하고, 입출력 매핑을 시뮬레이션하는 환경을 구현하여 유용성을 검증한다.
-
Future space is currently getting a great deal of attention to apply ubiquitous computing technology. At the same time, various ubiquitous technology-based products are being developed with service scenarios in the views of diverse user groups predicted. Since these service models and scenarios need to be tested to verify effectiveness, it requires researchers to predict spatial shapes and service scenarios for future domestic environment that fulfills diverse future spatial requirements including ecological and user-oriented spaces, extended amenity getting maximum benefits from technology, etc. To support these developments, the need to make a physical test-bed, a real building model, is essential. However building a physical test-bed generally is economically expensive and even if the test-bed could be settled, it must be carefully designed before it is built In this paper, we suggest a virtual smart test-bed, called "V-PlaceLab", using virtual reality techniques. This system allows not only to inspect a scenario with the aid of computer simulation on a virtual environment, but also to design a virtual test-bed mentioned above.
-
유비쿼터스 환경에서 사용자는 언제 어디서나 주변에 편재하는 컴퓨팅 장치나 서비스를 활용하여 자신이 필요로 하는 작업을 수행할 수 있다. 이러한 컴퓨팅 장치와 서비스를 제어하기 위한 표준으로서 UPnP(Universal Plug and Play)가 각광을 받고 있다. 하지만, 기존에 개발된 UPnP 장치의 원격 제어 프로그램은 사용자의 상황 정보, 선호도 및 접근 권한에 관계없이 동일한 사용자 인터페이스를 제공하기 때문에 사용자에게 편의를 제공하는데 있어 한계가 있다. 본 논문에서는 이러한 단점을 극복하기 위하여 개발된 개인화 및 상황 인지를 지원하는UPnP 장치 원격 제어 프로그램의 설계 및 구현에 대해 기술한다. 제안된 원격 제어 프로그램은 사용자의 상황, 선호도 및 접근 권한에 따라 사용자 인터페이스(User Interface, UI)가 동적으로 생성되고 재구성된다. 또한 이러한 UI 개발의 편의성을 위하여 UPnP 장치 기술(description)에 따라 UI를 자동으로 생성하는 방법에 대해서도 기술한다.
-
햅틱인터페이스 기술을 이용하면 가상물체의 형태를 만져보고 느껴볼 수 있다. 물체마다 다른 수학적 마찰력 모델을 적용하여 실감있는 마찰력 표현도 가능하다. 그러나 각 물체에 해당하는 마찰력 모델을 선정하는 것과 적절한 마찰계수 등을 반복적 실험을 통하여 알아내는 것은 쉽지 않다. 실제 물체의 마찰력이 알려진 마찰력 모델과 다르다면 수학적 모델로 표현할 수 없는 경우도 있다. 본 논문에서는 신경회로망 학습을 이용하여 마찰력 모델의 선택이나 마찰계수 등을 정하는 과정 없이 실제 물체의 마찰력을 표현하는 방법을 제시하고 있다. 상용 햅틱인터페이스 장치인 PHANToM 2 대를 이용하여 마찰력 획득 시스템을 구성하고 고무판, 종이 등의 물체 표면에서의 속도와 물체에 작용하는 힘을 획득하여 가공한 데이터를 입력 및 출력으로 갖는 신경회로망을 통해 학습시킨 후 OpenGL로 구현한 가상물체에 적용하여 보았다. Force/Torque 센서를 사용하지 못한 일부 문제가 있었으나 예상보다 사실적인 마찰력을 표현할 수 있었다.
-
디자인 패턴의 사용은 시스템을 좀 더 유연하고, 이해하기 쉽고, 재사용 가능하게 만든다. 개발이 완료된 시스템이 명확하게 문서화가 되어 있으면, 시스템의 내부 구조를 이해하기 쉽고, 향후 유지 보수의 비용이 적게 든다. 하지만, 대부분 시스템의 경우 개발된 시스템의 문서화가 잘 되어 있지 않기 때문에, 시스템에 문제가 생겨 수정 하고자 하거나, 새로운 모듈을 추가하여 시스템의 기능을 확장하고자 할 때, 전체 소스코드를 분석하여 시스템을 이해해야 하는 어려움이 있다. 이러한 문제점을 해결하기 위해서 소스코드에서 자동적으로 디자인 패턴을 인식하여 문서화를 증진시킬 수 있다. 따라서 신뢰할 만한 디자인 패턴 인식 시스템이 중요하다. 지금까지 디자인 패턴 인식 방법은 시스템의 구조적인 특징만을 이용하여 패턴을 인식하여 왔다. 그래서 본 논문은 구조적인 특징뿐만 아니라 동적인 분석, 그리고 자동학습(machine learning)에 기반하여 소스코드로부터 디자인 패턴을 인식하는 방법을 제안하고자 한다. 그리고 전 작업에서 만든 자바로 쓰여진 에이전트 개발 툴을 대상으로 실시하여 인식한 디자인 패턴에 대한 평가를 하였다.
-
현재 많은 신경망의 하드웨어 구현은 부동 소수점 연산에 비해서 적은 면적과 빠른 수행시간을 가지는 고정소수점 연산을 많이 사용하지만, 소프트웨어에서는 일반적으로 높은 정확도를 가지는 부동소수점 연산을 사용한다. 신경망의 하드웨어 구현에서 많이 사용하는 고정소수점 연산은 부동소수점 연산에 비해서 빠른 처리속도와 적은 면적으로써 쉽게 하드웨어 구현에 용이하지만, 부동소수점 연산에 비해서 낮은 정확도와 기존의 부동소수점 연산을 사용하는 소프트웨어 신경망을 쉽게 적용할 수 없는 단점을 가진다. 본 논문에서는 부동소수점 연산을 사용하여 문자 추출 MLP의 데이터 변환 없이 적용할 수 있는 전체 파이프라이닝 설계 구조를 제안한다. 제안된 설계방법은 신경망의 전체 구조를 입력층과 은닉층을 링크 병렬화 방법과 은닉층과 출력층을 뉴런 병렬화 방법을 개선하여 쉽게 파이프라이닝 구조로 설계함으로써 신경망 처리는 은닉층 뉴런수와 동일한 주기로 처리되며, 기존의 문자추출 소프트웨어 신경망을 제안된 하드웨어 설계방법으로 구현하였을 때 11배의 빠른 성능을 나타낸다.
-
The new model proposed in this paper is the hidden Markov mesh model or the 2D HMM with the causality of top-down and left-right direction. With the addition of the causality constraint, two algorithms for the evaluation of a model and the maximum likelihood estimation of model parameters have been developed theoretically which are based on the forward-backward algorithm. It is a more natural extension of the 1D HMM than other 2D models. The proposed method will provide a useful way of modeling highly variable image patterns such as offline cursive characters.
-
HCI, 비전 기반 사용자 인터페이스 또는 제스쳐 인식과 같은 많은 분야에서 3 차원 얼굴 모션을 추정하는 것은 중요한 작업이다. 연속된 2 차원 이미지로부터 3 차원 모션을 추정하기 위한 방법으로는 크게 외형 기반 방법이나 모델을 이용하는 방법이 있다. 본 연구에서는 동영상으로부터 3 차원 실린더 모델과 Optical flow를 이용하여 실시간으로 얼굴 모션을 추정하는 방법을 제안하고자 한다. 초기 프레임으로부터 얼굴의 피부색과 템플릿 매칭을 이용하여 얼굴 영역을 검출하고 검출된 얼굴 영역에 3 차원 실린더 모델을 투영하게 된다. 연속된 프레임으로 부터 Lucas-Kanade 의 Optical flow 를 이용하여 얼굴 모션을 추정한다. 정확한 얼굴 모션 추정을 하기 위해 IRLS 방법을 이용하여 각 픽셀에 대한 가중치를 설정하게 된다. 또한, 동적 템플릿을 이용해 오랫동안 정확한 얼굴 모션 추정하는 방법을 제안한다.
-
색상 전이는 스타일 전이, 색이 바랜 사진의 복원, 색상화, 색상의 보정에 사용될 수 있는 기법이다. 본 연구에서는 기존 색상 전이의 문제점을 해결하기 위해서 영상 분할 기반의 색상전이 기법을 제시한다. 영상에서 색상의 가장 의미있는 최소 단위를 픽셀로 보고 있는 기존 연구에 반해서, 본 연구에서는 영상 조각을 영상에서 가장 의미 있는 최소 단위로 보고 색상 전이를 수행한다. 영상 분할 기반의 색상 전이를 통해서 기존 연구에서 발생할 수 있었던 픽셀간의 코헤런스 문제를 해결한다. 또한 영상 분할 기반으로 했을 때에 생길 수 있는 경계 문제를 해결하기 위한 새로운 방법을 제시한다. 제시된 기법을 이용해서 색상 전이의 응용인 스타일 전이에 적용한다.
-
회화적 렌더링의 궁극적 목적은 주어진 영상을 사람이 직접 그린듯한 회화적 느낌을 가미하는 것이다. 이러한 회화적 느낌을 표현하기 위한 중요한 요소에는 브러시의 그리는 방향과 다양한 브러시 사이즈, 그리고 캔버스 위에 브러시로 그려지는 위치 등이 있다. 본 논문에서는 브러시의 방향을 효과적으로 표현하기 위해 영상의 방향 보간을 먼저 하였다. 그리고 입력 영상과 캔버스의 최대 차이점에서 에지와의 거리를 고려하여 동적인 브러시의 사이즈를 표현 하였다. 그리고 그려진 주변의 일정 영역 안에서 다시 최대 차이점을 찾아나가는 방법으로 다음 브러시의 위치를 결정하였다. 이렇게 실제 회화를 그리는 과정을 따라감으로써 사실적인 회화적 렌더링의 결과를 얻을수 있었다.
-
최근, 컴퓨터 사이언스 분야에서 모자이크에 대한 다양한 연구들이 이뤄지고 있지만, 세부 묘사를 유지하려는 관점에서의 접근은 부족한 편이다. 본 논문은 원 영상의 세부 묘사를 유지하는 타일 모자이크 방법을 제안한다. 이 방법은 타일간의 빈 공간을 제거하기 위한 겹쳐진 타일의 사용을 통해 구현된다. 본 논문에서 제시한 방법은 다음 세 단계로 구성된다. 첫째, 에지 회피 기법이 적용된 무게중심 보로노이 다이어그램(CVD:Centroidal Voronoi Diagram)을 통해 메인 타일의 위치를 얻는다. 둘째, 메인 타일들의 위치에 딜로니 삼각형화(Delaunay Triangulation)를 적용해 서브 타일의 위치를 계산한다. 셋째, 타일간의 관계를 고려해 타일의 크기와 방향성을 구한다. 위의 과정을 통해 타일 간의 빈 공간이 최소화되어 세부 묘사가 강화된 모자이크 영상을 얻는다.
-
본 논문에서는 기존의 연구에서 여러 단계를 거쳐 복잡한 연산을 한 후에 수묵화 표현이 가능했던 것과 달리 기존에 요구되었던 채색과정을 줄임으로써 렌더링의 효율을 높인 실시간 3차원 수묵화 기법을 제안한다. 본 논문에서 제안된 기법은 모델이 보여지는 방향에 따라 다른 조명 값과 법선 벡터 값을 계산한 후 연산 값에 따라서 여러장의 텍스처를 일정 비율에 맞춰서 모델에 적용함으로써 수묵화의 특징인 농담, 발묵 효과를 한 번에 적용할 수 있게 한다. 그리고 모델의 윤곽선을 표현하는데 사용자의 입력에 따라 붓의 굵기를 조절하게 하여 보다 사실적인 수묵화 느낌을 살렸다. 또한 텍스처 매핑 이후 에도 동양화적인 느낌을 살리기 위해서 두 가지의 종이질감효과를 추가하였다. 이 2 가지의 종이질감 효과는 일종의 안개 필터로서 기존의 안개 필터와 달리 모델이 그려지는 위치에 따라서 각각 가중치가 다른 필터가 적용되게 하였다. 이렇게 필터가 적용된 렌더링의 결과는 일반적으로 채색된 3차원 모델과 느낌이 다른 자연스러운 결과를 생성할 수 있다. 본 연구는 또한 간단한 구현에 장점을 두고 있기 때문에 간단한 애니메이션이나 일반 3차원 게임 등 여러 분야에서 기존에 적용하기 어려웠던 수묵화 기법을 다양하게 활용할 수 있는 가능성을 제시한다.
-
This paper presents an image-space algorithm to real-time collision detection, which is run completely by GPU. For a single object or for multiple objects with no collision, the front and back faces appear alternately along the view direction. However, such alternation is violated when objects collide. Based on these observations, the algorithm has been devised, and the implementation utilizes the state-of-the-art functionalities of GPU such as framebuffer objects(FBO), vertex buffer object(VBO) and occlusion query. The experimental results show the feasibility of GPU-intensive collision detection and its performance gain in real-time applications such as 3D games.
-
본 연구에서는 디지털 콘텐츠와 물리적 미디어가 유기적으로 결합할 수 있는 가능성을 모색하고자, 입출력 일체화 개체인 'I/O 셀(Cell)'과 그 집합체인 '텐저블 게임 콘솔(Tangible Game Console)'을 개발하였다. I/O 셀은 여러 종류의 센서와 액츄에이터가 하나의 물리적 노드 내에 통합되어 있는 개체로, 이 I/O 셀 다수를 집적하면 다양한 크기와 용도의 엔터테인먼트 미디어를 구성하는 것이 가능하다. 그 중 하나로 개발된 텐저블 게임 콘솔은 일종의 센서-액츄에이터 집합체로 셀들 사이의 연계를 통해 다양한 물리적 정보를 인식하고 표현할 수 있다. 텐저블 게임 콘솔은 기존 게임 콘텐츠의 주요한 표현 수단이었던 이미지와 텍스트 정보 대신에 물리적 정보를 통해 게임 콘텐츠를 구성하며, 조작대상과 조작수단이 일체화되어 있고, 또한 음악, 퍼즐, 액션 등 다양한 장르의 게임 콘텐츠가 적용 가능하다는 특징을 가지고 있다. 텐저블 게임 콘솔에서는 불, 바람, 물, 생명체 등의 물리적 현상을 형상/움직임/소리/빛 등을 통해 재현하며, 사용자는 이를 때리기/바람불기/흔들기/기울이기 등의 직접적인 조작을 통해 체험할 수 있다. 또한 물리적인 상호작용 과정이 일정한 게임 규칙을 가지고 구성되어 있어 지속성 있는 놀이 경험을 제공한다. 본 연구에서는 텐저블 게임 콘솔의 콘텐츠로 음악, 액션, 대전게임 등을 개발하였으며, 이 콘텐츠들의 놀이경험을 평가함으로써, 텐저블 게임 콘솔의 발전 가능성을 확인하였다.
-
한정된 자원을 사용할 수 있는 게임 AI 분야에서는 시스템 자원을 적절하게 활용하여 현실감을 극대화 시키려는 노력이 중요한 이슈이며, 3D 게임에서 캐릭터들의 자연스러운 경로 탐색은 현실성을 높이는 중요한 척도 중 하나이다. 기존 연구에서는 주로 정적인 지형, 객체들을 적절하게 회피하는 경로에 대한 연구가 많이 진행되었다. 그러나 최근 널리 이용되고 있는 다중사용자가 접속하는 온라인 RPG 게임에서는 기존 방법을 그대로 적용하기에 많은 연산량이 필요한 문제점이 있다. 본 논문에서는 네비게이션 메시(Navigation Mesh) 기반으로 최적화된 A*, 그리고 밀개(Repulsors)의 방법을 통하여 동적인 환경에서 자연스러운 경로탐색을 수행하며 3D 게임에 적용 가능한 연산량을 충족하는 경로탐색 시스템을 제안하였다.
-
본 연구에서는 바둑을 응용하여, 모바일에서 가능한 6면체 게임으로 구현 하였다. 기존의 바둑과 같은 룰과 비슷한 내용의 게임으로서 모바일 버튼의 단순 조작만으로 가능한 게임이다. 게임에 사용되는 6면체 바둑판과 바둑돌들은 PHOSHOP을 이용하여 3차원 모양의 객체로 생성하였다. 프로그래밍은 SKT GENX기반으로 구현하였다. 기존의 바둑판은 가로 세로 교차된19줄이 평면에 그려져 있으나, 6면체 바둑판은 한 평면에 가로 세로 5줄이 주사위 모양의 6표면에 연결되어있다. 대국 시의 모바일 화면 인터페이스는 바둑판의 6면 중 3면을 동시에 보이는 입체도와 6면을 펼친 전개도가 있다. 입체도는 모바일 버튼 조작에 의해 6면을 상하좌우 회전이 가능하도록 하였다. 입체도와 전개도는 동시에 보는 것을 기본으로 하나 사용자 선택에 의해 두 그림의 크기 위치 등이 다양하게 가능하도록 제공하고 있다. 바둑돌의 착점방식은 모바일 버튼 조작에 의해 커서의 이동으로 가능하다. 게임은 네트워크를 이용한 사람과 사람이 가능하도록 약식으로 구현하였다. 게임의 내용은 6면의 입체적 상황을 고려하면서 작전을 세워야 하므로 기존의 평면바둑에 비해 좀더 고난도의 사고와 전략을 요구하는 게임이다. 그리고 6면체 바둑게임은 모바일 스크린환경에서 기존의19줄 평면바둑이 문제시 될 수 있는 가독성과, 한 게임에 사용되는 시간에 대해서 유리한 요인으로 실용화의 가능성을 제시하고자 한다.
-
3D 애니메이션 제작에서 동작의 타이밍(예를 들면 timing&spacing, slow-in, slow-out)은 연기의 의미와 느낌을 정확히 표현하기 위한 매우 중요한 요소 중의 하나이다. 따라서 이러한 타이밍의 편집은 애니메이션 작업에서 필수적이라고 할 수 있는데, 이를 기존의 3D 애니메이션 시스템에서 수행하기에는 기술적으로 많은 어려움이 있었다. 첫째로 타이밍의 편집은 시간축 자체를 변형하는 문제이기 때문에 보간 곡선에 대한 재매개변수화가 필요한데, 이러한 가능은 기존 애니메이션 시스템에서 제공되지 않는다. 둘째로 타이밍 편집에는 종종 애니메이션 감독이 직접 참여하기도 하는데, 일반적으로 3D 애니메이션 시스템의 사용에 익숙하지 않기 때문에 원하는 결과를 직접 만들어 보기가 어려웠다. 본 논문에서는 이러한 문제들을 해결한 새로운 애니메이션 타이밍 시스템을 구현하였다. 이 시스템은 렌더링된 영상파일들과 애니메이션 장면 파일을 입력 받아 사용자가 타이밍 편집을 하고, 그 결과를 애니메이션 장면 파일에 다시 기록하는 방식으로 구현된다. 타이밍 편집은 기존 셀 애니메이션 제작 방식과 유사한 방식으로 프레임을 삽입하거나 삭제하는 가능과 시간왜곡 (time-warping) 그래프를 직접 조정하여 타이밍을 조정하는 가능을 제공한다. 전자는 제작도구에 익숙하지 않은 감독이나 셀 애니메이션 작업자들이 직관적으로 사용할 수 있는 기능이고, 후자는 좀 더 세밀한 타이밍 조정을 위해 제공하는 가능이다. 사용자가 편집한 타이밍 결과는 각 동작변수의 보간곡선을 재매개변수화하여 애니메이션 파일에 기록된다. 본 논문에서 구현한 시스템은 실제 애니메이션 제작에 보편적으로 사용되는 마야 애니메이션 파일을 지원하도록 구현되었다.
-
본 논문에서는 음성에 따른 얼굴 애니메이션을 사실적으로 표현하기 위한 조음기관(혀, 성대 등)의 움직임을 시각화하는 방법을 제시한다. 이를 위해서, 음성에 따른 얼굴 애니메이션을 위한 말뭉치(Corpus)를 생성하고, 생성된 말뭉치에 대해서 음소 단위의 분석(Phoneme alignment) 처리를 한 후, 각 음소에 따른 조음기관의 움직임을 생성한다. 본 논문에서는 조음기관의 움직임 생성을 위해서 얼굴 애니메이션 처리에서 널리 사용되고 있는 기저 모델 기반 형태 혼합 보간 기법(Blend shape Interpolation)을 사용하였다. 그리고 이를 통하여 프레임/키프레임 기반 움직임 생성 사용자 인터페이스를 구축하였다. 구축된 인터페이스를 통해 언어치료사가 직접 각 음소 별 조음기관의 정확한 모션 데이터를 생성토록 한다. 획득된 모션 데이터를 기반으로 각 음소 별 조음기관의 3차원 기본 기저를 모델링하고, 새롭게 입력된 음소 시퀀스(phoneme sequence)에 대해서 동기화된 3차원 조음기관의 움직임을 생성한다. 이를 통해 자연스러운 3차원 얼굴 애니메이션에 적용하여 얼굴과 동기화된 조음 기관의 움직임을 만들어 낼 수 있다.
-
전통적으로 3차원 애니메이션에서 캐릭터의 동작에 관한 연구는 주로 동작의 사실적인 표현에 중점을 두고 있다. 그러나 이러한 사실적인 애니메이션은 전통적인 2차원 애니메이션에 익숙한 관객들이 어색함을 느끼는 원인이 되기도 한다 이로 인해 전통적인 2차원 애니메이션의 기법을 3차원 애니메이션에 적용하는 비사실적 (non photorealistic) 애니메이션 기법이 연구되고 있다. 본 논문에서는 전통적인 2차원 애니메이션기법 중 하나인 기대 효과(anticipation effect)를 3차원 애니메이션의 캐릭터 동작에 적용하는 자동화된 방법을 제시한다. 전통적인 2차원 애니메이션 기법에 따르면 기대 효과는 애니메이션을 더 설득력 있고 풍부하게 만드는 역할을 한다고 알려져 있다. 기대 효과는 주요한 동작이 일어나기 이전에 반대 방향의 동작이 이루어지는 것으로 나타난다. 3차원 애니메이션에서 캐릭터의 동작은 각 관절의 회전과 캐릭터 중심의 이동으로 표현되기 때문에, 주요한 동작에 대하여 각 관절의 회전과 캐릭터 중심의 이동에서 반대 방향의 움직임을 찾아 주요한 동작 이전에 연결하는 것으로 기대 효과의 동작을 표현할 수 있다. 모션 캡쳐나 키 프레임 방법을 통해 미리 제작된 애니메이션 파일로부터 기대효과를 생생하기 위해 동작 데이터를 분석하여, 기대 효과의 추가가 필요한 주요 동작의 각 관절별 회전을 외삽하여 반대 방향의 회전 움직임을 생생하고 무게 중심의 이동을 예측하여 주요 동작과 반대 방향의 움직임을 갖는 기대 동작을 생성한다. 이후, 생성된 기대 동작과 원래의 동작을 기대 효과의 타이밍을 고려하여 합성하는 것으로 기대효과가 포함된 자연스러운 애니메이션 동작을 얻을 수 있다.
-
Mean shift 는 데이터의 특징을 잘 살려내는 None-parametric 방법으로, 특히 영상처리분야에서 많은 각광을 받아왔다. 하지만 좋은 결과를 보장하는 뛰어난 성능에도 불구하고, 높은 메모리소요와 긴 처리시간에 기인하여, 비디오처리 등의 분야에 적용하기엔 현실적인 제약점이 있다. 상기한 제약점을 극복하기 위해, 본 시스템은 비디오를 분석하여 전경과 후경으로 나눈다. 본 논문은 전경으로 분류된 부분에 대해 각 분리된 개체를구분하고, 좌표변환(coordinate shift)을 실행하여 연산을 할 비디오의 연산의 규모를 줄이는 방법론을 제시한다. 이러한 처리로 매우 많은 처리시간이 단축됨을 실험을 통해 알 수 있었다. 다음으로, 나뉘어진 전경에 3D mean shift를 적용하여 생성된 결과물에 대하여 3D cluster data structure 를 생성하고, 이를 이동하여 인터랙티브 에디팅이 가능하도록 하였다. 후경으로 나뉜 데이터는 이미지 한 장으로 축약이 되며, 2D mean shift 기반의 interactive cartooning system 을 통하여 만화화가 된다. 본 논문은 만화 특유의 단순한 톤을 표현하기 위해, 세밀한 분할이 필요한 부분과 그렇지 않은 부분을 따로 구분하여 처리하는 레이어처리방법을 제안한다. 위의 과정을 여러 실사이미지에 적용, 실험해본 결과 기존의 연구결과에 비해 매우 짧은 시간 내에 대상의 특징이 잘 나타낸 양질의 결과물이 생성되었다. 이러한 결과물은 출판, 영상편집분야 등 여러 분야에서 요긴하고 간편하게 사용될 수 있을 것으로 생각된다.
-
HCI 연구의 주된 주제는 인간중심의 상호작용 환경의 개발이다. 이러한 개발과정에서 새로운 인터페이스 환경이 실생활에 어떠한 기능적 효용가치를 가져다 줄 것인가에 관한 문제가 중요하게 고려되어야 한다. 이를 위해 실질적인 적용사례 구축을 통해 효용성을 입증하는 것이 필요하다. 또한, 최근의 HCI는 기존의 인터페이스 수단을 대체하는 것을 목적으로 개발되어 왔으나, 보다 발전된 접근방법으로서 기존의 인터페이스가 소화할 수 없었던 상호작용의 의미론적 요소들을 다루는 것이 필요할 것이다. 이러한 맥락에서 기존 컴퓨팅 환경에서의 문제해결 프로세스의 한 예를 고찰하고 이것이 새로운 HCI환경에서 효과적인 방법으로 어떻게 구현될 수 있는가에 대한 구체적인 사례를 연구하였다. 본 논문은 문제해결의 한 예로서, '복수개의 결정사안 중 최선의 방안을 도출하는 의사결정과정'에서 HCI를 접목한 효과적인 의사결정 프로세스를 제안하고 이의 효용성을 검증한다. 이러한 의사결정 방법론으로 기존에 사용되는 AHP(Analytic Hierarchy Process)가 대표적이다. 일반적으로 AHP는 각 고려인자간 쌍대비교(pairwise comparisons)를 통해 중요도를 평가하는 과정을 포함한다. 이 과정을 통해 각각의 인자간의 쌍대비교치를 결정한 후 일련의 계산과정을 거쳐 그 결과를 도출한다. 이 작업은 통상적인 데스크탑 컴퓨터 환경에서 이루어진다. 본 논문에서는 각 인자간의 쌍대비교를 통한 우선순위를 결정하는 과정에서 새로운 인터페이스 환경의 적용을 위한 효과적인 연산 알고리즘을 제안하고 이의 효용성을 검증한다. 또한 의사결정 과정의 직관적 가시화를 위해 기본적인 프리미티므 도형으로 이루어진 그래픽 인터페이스를 구현하고, 기존의 의사결정 과정과 그 효용성을 비교한다.
-
물체의 반사(specular reflection)는 물체의 재질 및 기하학적 모양을 표현하는데 있어 매우중요한 요소이다. 사진품질의 사실적 렌더링에서는 기존의 국소 반사 모델을 사용하여 좋은 결과를 얻을 수 있지만, 사용자의 주관이 중시되는 비사실적 렌더링(non-photorealistic rendering)에서는 사용자가 원하는 반사 효과를 표현할 수 있어야 한다. 텍스처는 사용자가 직관적으로 원하는 반사 효과를 표현할 수 있는 수단이며, 이를 모델에 투영하면 원하는 반사효과를 얻을 수 있다. 이 때 사용자는 텍스처가 투영될 위치와 크기, 방향을 직접 키프레임으로 정해 줄 수 있다. 그러나 모든 반사 효과를 사용자가 직접 정해준다는 것은 번거로운 일이며, 실시간 응용분야에는 적용할 수 없다. 본 논문에서는 국소반사모델(local reflection model)과 주곡률(principal curvature) 해석을 통해 반사효과의 위치, 방향, 크기를 결정하기 위한 텍스처 투영기의 새로운 설정 방법을 제시한다. 광원과 시점 정보를 사용하여 투영기의 위치를 정하고 물체의 주방향(principal direction)과 곡률반지름(radius of curvature)을 이용하여 투영기의 방향과 투영 피라미드의 크기를 정한다 텍스처 투영기의 단순한 이동, 회전을 통하여 반사 영역의 이동, 회전 및 확대/축소가 가능하다. 본 논문에서 제시한 방법은 DirectX 9.0c와 프로그래이 가능한 셰이더 2.0을 사용하여 GeForce FX 7800 그래픽 카드에 구현되었다. 본 논문의 연구 결과는 게임과 같은 실시간 응용분야에 사용될 수 있으며, 실험 결과에 의하면 수천 개의 다면체 모델에 대한 렌더링을 실시간에 수행할 수 있다.
-
반투명 물체(Translucent Object)는 불투명한 물체와는 달리 물체 내부에서 산란이 일어난다. 반투명 물체의 한 표면(Surface)을 렌더링하기 위해서는 그 표면의 정규 벡터뿐만 아니라 그 표면의 주변 기하 정보가 필요하다. 그러나 그래픽 하드웨어 구조는 반투명 물체의 실시간 렌더링의 구현에 많은 제약을 준다. 3D 기하 정보 대신에 라디언스 맵(Radiance map)과 깊이 맵(Depth map)과 같은 투영 영상(Projected Image)을 기반으로 하는 영상 공간 접근 방법(Image Space Approach)을 사용함으로써 GPU 상에서 반투명 재질을 실시간으로 표현할 수 있다. 본 논문에서는 영상 공간 접근 방법(Image Space Approach)의 연장선에서 시점을 달리한 여러 장의 투영 영상을 이용함으로써 기존의 한 장의 투영 영상만을 이용한 방법이 가지고 있는 가시성 한계점을 해결한다. 또한 복수 투영 영상의 이용에 따른 계산량 증가에 의해서 손실된 프레임 속도(Frame Rate)에 대해 분석한다.
-
This paper describes a framework for multimodal object manipulation in virtual environments. The gist of the proposed framework is the semantic integration of multimodal input using spatial ontology and user context to integrate the interpretation results from the inputs into a single one. The spatial ontology, describing the spatial relationships between objects, is used together with the current user context to solve ambiguities coming from the user's commands. These commands are used to reposition the objects in the virtual environments. We discuss how the spatial ontology is defined and used to assist the user to perform object placements in the virtual environment as it will be in the real world.
-
Han, Cheon-Woo;Hwang, Su-Young;So, Yeon-Hee;Lee, Myung-Jin;Lim, Ka-Ram;Lee, Woo-Gul;Lee, Sun-Young;Back, Sun-Hee;Woo, Yeon-Kyoung;Yoon, Mi-Sun;Kim, Sung-Il 893
The major limitation of the traditional Intelligent Tutoring Systems (ITS) is that interface is mainly focused on the cognitive factors. However, the new direction of ITS is shifting form the cognitive perspectives to the motivational perspectives reflecting the individual differences. In this study, the specific design guidelines for motivational interface of ITS are proposed to promote learner's motivation to learn during the interaction with the ITS. First, ITS should be able to reflect individual differences in cognitive abilities, interest and motivation, and ongoing changes of the interestingness and comprehensibility during learning activities. Second, it is essential for ITS to guarantee learner controllability, diverse learning activities, curiosity, self-relevance, and challenge to enhance the level of motivation and situational interest. Third, the game-like properties are also needed to maximize the motivational effect of learning with ITS. -
We propose a scheme for more efficient navigation in a hierarchical file system. In the proposed scheme, a program running in the background computes the degree of relationship between a current file and others, and builds a list of the most related files. The current relationship metric being used by the program is a linear combination of five parameters: the name, the directory path, the type, the created time, and the last accessed time of a file. A simulated annealing algorithm is used in order to determine the weighting factors of the parameters. A set of experiments were conducted in order to access the effectiveness of the proposed scheme.
-
In the last decade, the research of the usability of mobile phones has been a newly evolving area with few established methodologies and realistic practices that ensure capturing usability in evaluation. Thus, there exists growing demand to explore appropriate evaluation methodologies that evaluate the usability of mobile phones quickly as well as comprehensively. This study aims to develop a task-based usability checklist based on heuristic evaluations in views of mobile phone UI practitioners. A hierarchical structure of UI design elements and usability principles related to mobile phones were developed and then utilized to develop the checklist. In order to demonstrate the practical effectiveness of the proposed checklist, comparative experiments were conducted on the usability checklist and usability testing. Majority of usability problems found by usability testing and additional problems were discovered by the proposed checklist. It is expected that the usability checklist proposed in this study could be used quickly and efficiently by usability practitioners to evaluate the mobile phone UI in the middle of the mobile phone development process.
-
Lee, Woo-Gul;Lee, Myung-Jin;Lim, Ka-Ram;Han, Cheon-Woo;So, Yeon-Hee;Hwang, Su-Young;Ryu, Ki-Gon;Yun, Sung-Hyun;Choi, Dong-Seong;Kim, Sung-Il 918
Recent development of teachable agent provides learners with active roles as knowledge constructors and focuses on the individualization. The aim of this adaptive agent is not only to maximize the learner's cognitive functions but also to enhance the interests and motivation to learn. In order to establish the relationships among user characteristics and response patterns and to extract the algorithm among variables, we measured the individual characteristics and analyzed logs of the teachable agent named KORI (KORea university Intelligent agent) through the student modeling. A correlation analysis was conducted to identify the relationships among individual characteristics, user responses, and learning outcomes. Among hundreds of possible relationships between numerous variables in three dimensions, nine key user responses were extracted, which were highly correlated with either individual characteristics and learning outcomes. The results suggest that certain type of learner responses or the combination of the responses would be useful indices to predict the learners' individual characteristics and ongoing learning outcome. This study proposed a new type of dynamic assessment for individual differences and ongoing cognitive/motivational learning outcomes through the computation of responses without measuring them directly. The construction of individualized student model based on the ongoing response pattern of the user that are highly correlated with the individual differences and learning outcome may be the useful methodology to understand the learner's dynamic change during learning. -
Current image retrieval techniques have shortcomings that make it difficult to search for images based on a semantic understanding of what the image is about. Since an image is normally associated with multiple contexts (e.g. when and where a picture was taken,) the knowledge of these contexts can enhance the quantity of semantic understanding of an image. In this paper, we present a context-aware image retrieval system, which uses the context information to infer a kind of metadata for the captured images as well as images in different collections and databases. Experimental results show that using these kinds of information can not only significantly increase the retrieval accuracy in conventional content-based image retrieval systems but decrease the problems arise by manual annotation in text-based image retrieval systems as well.
-
This paper presents different issues of the real-time compression algorithms without compromising the video quality in the distributed environment. The theme of this research is to manage the critical processing stages (speed, information lost, redundancy, distortion) having better encoded ratio, without the fluctuation of quantization scale by using IP configuration. In this paper, different techniques such as distortion measure with searching method cover the block phenomenon with motion estimation process while passing technique and floating measurement is configured by discrete cosine transform (DCT) to reduce computational complexity which is implemented in this video codec. While delay of bits in encoded buffer side especially in real-time state is being controlled to produce the video with high quality and maintenance a low buffering delay. Our results show the performance accuracy gain with better achievement in all the above processes in an encouraging mode.
-
Although people's anxiety about the environmental problem has been getting higher, they are not provided good quality of knowledge about the environment. Based on this situation, Ecoblog can be a new type of online community to educate the public in ecological knowledge. Especially, Ecoblog can be utilized as a method of "preventive education", and it will contribute to reduce great amounts of environmental budget to restore contaminated environment to previous condition. Ecoblog also utilizes the concept of blog which user can create and append their site with chosen themes. A weblog or a blog is a non-commercial webpage regularly updated through the use of a blogging software which allows the user to "publish" kinds of amalgamations of text and graphics to the page as posts. The technology offered in Ecoblog is utilizing the concept of 4D place and game metaphor in order to provide users the sense of participation, interaction and immersion among them and the growing community. Thus, it requires applying the CAAD technology by implementing semantically well-defined building data model as a core database to create a 4D virtual community. This research focuses on defining a 4d spatial framework suitable for developing an online ecological community. Through our study, the state-of-the-art of online community has been studied at the first step. Second, the scenario of using EcoBlog described with content, visualization and navigation are defined based on the critical features derived at the first step. Finally, a 4d spatial framework composed of semantic building data model, content and rule database is constructed to propose factors that are necessary to establish an ecological virtual community. In conclusion, our framework could enhance the comprehension and interaction between users and virtual buildings in the ecological community by integrating the concept of game design, 4D CAD and semantic data model. Such framework can be applied to any online community for an educational purpose.
-
Lim, Ka-Ram;So, Yeon-Hee;Han, Cheon-Woo;Hwang, Su-Young;Ryu, Ki-Gon;Shin, Mo-Ran;Kim, Sung-Il 945
The researchers in the field of cognitive science and learning science suggest that the teaching activity induces the elaborative and meaningful learning. Actually, lots of research findings have shown the beneficial effect of learning by teaching such as peer tutoring. But peer tutoring has some limitations in the practical learning context. To overcome some limitations, the new concept of "learning by teaching" through the agent called Teachable Agent. The teachable agent is a modified version of traditional intelligent tutoring system that assigns a role of tutor to teach the agent. The teachable agent monitors individual difference and provides a student with a chance for deep learning and motivation to learn by allowing them to play an active role in the process of learning. That is, The teaching activity induces the elaborative and meaningful learning. This study compared the effects of our teachable agent, KORI, and peer tutoring on the cognition and motivation. The field experiment was conducted to examine whether learning by teaching the teachable agent would be more effective than peer tutoring and reading condition. In the experiment, all participants took 30 minutes lesson on rock and rock cycle together to acquire the base knowledge in the domain. After the lesson, participants were randomly assigned to one of the three experimental conditions; reading condition, peer tutoring condition, and teachable agent condition. Next, participants of each condition moved into separated place and performed their own learning activity. After finishing all of the learning activities in each condition, all participants were instructed to rate the interestingness using a 5-point scale on their own learning activity and leaning material, and were given the comprehension test. The results indicated that the teachable agent condition and the peer tutoring condition showed more interests in the learning than the reading condition. It is suggested that teachable agent has more advantages in overcoming the several practical limitations of peer tutoring such as restrictions in time and place, tutor's cognitive burden, unnecessary interaction during peer tutoring. The applicability and prospects of the teachable agent as an efficient substitute for peer tutoring and traditional intelligent tutoring system were also discussed. -
Virtual Reality simulation enables immersive 3D experience of a Virtual Environment. A simulation-based VE can be used to map real world phenomena into virtual experience. This research studies on the use of Newton's physics law to demonstrate the effects of forces upon object's falling movement, and their effects towards other fallible objects. A reconfigurable simulation enables users to reconfigure the parameters of the objects involved in the simulation, so that they can see different effects from the different configurations, such as force magnitude and distance between objects. This concept is suitable for a classroom learning of physics law. Preliminary implementation is done on a PC with a joystick for 4DOF movement. The graphics is implemented by SGI OpenGL Performer. A middleware called NAVERLib that consists of Performer's modules for easy XML-based configuration is used for management of visualization, network and devices connection, and where the engine of this domino simulation is attached.
-
Privacy and security are latent problems in pervasive healthcare system. For the sake of protecting health monitoring information, it is necessary to classify and categorize the various contexts in terms of obfuscation. In this paper, we propose the physiological context categorization and specification methodology by exploiting data fusion network for automatic context alignment. In addition, we introduce the methodologies for making various level of physiological context on the context aware application model, which is wear-UCAM. This physiological context has several layers of context according to the level of abstraction such as user-friendly level or parametric level. This mechanism facilitates a user to restrict access to his/her monitoring results based on the level of details in context.
-
Interactive DMB contents are provided by MPEG-4 scene description. The abundant interactions of the user bring on the high bit rate of MPEG-4 scene description. But DMB system has low bandwidth and limited bit rate. So we need new authoring method for MPEG-4 scene description. In this paper, we proposed a seamless authoring method for the DMB environment. It can generate BIFS information tinily and dynamically. The research result can be used by DMB system for a seamless MPEG-4 contents transmission.
-
There is a tradeoff between user's privacy and utility of context-aware services in ubiquitous computing environments. Many privacy models have been proposed to support the disclosure of personal information at different levels of detail, in ubiquitous computing environments. However, most of these models do not allow for explicit criteria to assess the benefit users are likely to reap by disclosing their personal information. In this paper, we propose an automated decision making mechanism that evaluates the "benefit of disclosure" for the users based on trust relationships between users and information requesters and manages the disclosure of user's personal information accordingly. Unlike other trust models, we do not regard the reputation of an information requester as sufficient to determine his/her trustworthiness. Instead, we represent trustworthiness as a function of information requester's reputation in the eyes of the user and his/her competence in a given context. To validate our mechanism, we apply it to context-aware healthcare application that monitors physiological condition of a user.
-
수화는 청각장애인이 사용하는 시각적인 언어이다. OpenGL 기반의 가상 현실 공간에서 수화 동작을 표현하기 위해서는 수화 동작 데이터를 삽입하고 수정하는 편집 프로그램이 필요하다. 하지만, 기존의 수화 동작 편집기는 수화를 잘 이해하지 못하는 일반 사용자가 손 모양을 정확하게 편집하거나 얼굴 표정을 표현하는데 어려움이 있다. 또한, 수화 사전에 포함되는 각 수화 단어의 데이터 수가 많기 때문에 이를 효율적으로 생성하고 저장하는 프로그램이 절실히 필요하다. 본 논문에서는 사용자의 편의성을 높이기 위해 수화 동작 그래픽 편집기를 개선하는 방법을 제안한다. 이를 위해 각 손 모양에 대해 21 개의 파라마터로 구성된 데이터를 손가락 별로 분류한 후, 손가락 고유 기호로 변환하고, 손 모양 이름과 일련 번호를 부여하여 손 모양 데이터를 얻었으며, 유사한 손 모양을 그룹으로 묶은 손 모양 그룹 데이터를 구성하여 손 모양 데이터 사전을 구축하였다. 구축된 손 모양 사전을 수화 동작 편집기에 적용함으로써 사용자는 손 모양 그룹과 손 모양 이름, 일련번호를 선택하여 손의 각 관절 움직임을 쉽게 편집할 수 있으며, 이를 가상현실 공간에서 움직여 볼 수 있다. 또한, 얼굴 표정과 안색을 편집할 수 있는 기능을 추가함으로써 수화 동작 중에 얼굴 표정을 쉽게 표현할 수 있도록 하였다.
-
고전의 관현악기에서부터 현대의 각종 전자악기까지, 인류는 그 문화와 시대의 변화에 따라 다양한 형태의 악기를 개발하고 활용하였다. 최근에는 전기전자 기술의 발달로 다양한 센서와 프로그램을 활용해서 여러 가지 음색과 효과를 내는 악기가 개발되고 있다. 그 중에서 사람의 움직임을 직접 감지해서 음악적 도구로 활용하는 기술이 주목 받고 있다. 이를 위해 터치 센서(touch sensor), 비젼 센서(vision sensor), 자기장 센서(magnetic sensor), 초음파 센서(ultrasonic sensor) 등이 응용되고 있다. 그러나 지금까지의 센서 기술로는 사람의 움직임과 관련된 위치, 속도, 가속도 등에 대한 정보를 직접 추출하기가 어렵고, 구현된 시스템도 공간의 제약을 받거나 혹은 구현된 부피가 크거나 복잡한 구성형태를 지니고 있는 문제점이 있었다. 그래서 본 논문에서는 사람의 움직임과 관련된 가속도 정보를 직접 감지해서 새로운 형태의 악기로 활용될 수 있는 시스템을 연구하고 개발하였다. 이를 위해 6개의 가속도 정보를 처리하는 기술과 DSP(Digital Signal Processor) 활용 기술, Max/MSP 활용 기술이 응용 되었으며, 소형의 시스템을 개발하기 위해 시그널 컨디셔닝(signal conditioning) 회로와 DSP 보드를 자체 개발하였다. 실험을 통해 사람의 움직임과 관련된 각종 정보가 적절한 소프트웨어의 활용으로 다양한 음색의 변화는 물론 음높이, 음량의 변화까지도 제어할 수 있음을 확인하였고, 새로운 형태의 악기로써 무대 공연이나 노래방 등에 폭넓게 활용될 수 있는 가능성을 확인하였다.
-
본 논문은 PC카메라 환경에서 명암왜곡에 강인한 얼굴검출을 위한 컴포넌트 기반 얼굴검출 기법을 제시한다. 영상 내의 얼굴검출을 위해 에지(edge) 분석, 색상 분석, 형판정합(template matching), 신경망(Neural Network), PCA(Principal Component Analysis), LDA(Linear Discriminant Analysis) 등의 기법들이 사용되고 있고, 영상의 왜곡을 보정하기 위해 히스토그램 분석(평활화, 명세화), gamma correction, log transform 등의 영상 보정 방법이 사용되고 있다. 그러나 기존의 얼굴검출 방법과 영상보정 방법은 검출대상 객체의 부분적인 잡음 및 조명의 왜곡에 대처하기가 어려운 단점이 있다. 특히 PC카메라 환경에서 획득된 이미지와 같이 전면과 후면, 상하좌우에서 비추어지는 조명에 의해 검출 대상 객체의 일부분이 왜곡되는 상황이 발생될 경우 기존의 방법으로는 높은 얼굴 검출 성능을 기대할 수 없는 상황이 발생된다. 본 논문에서는 기울어진 얼굴 및 부분적으로 명암 왜곡된 얼굴을 효율적으로 검출할 수 있도록 얼굴의 좌우 대칭성을 고려한 가로방향의 대칭평균화로 얼굴검출을 위한 모델을 생성하여 얼굴검출에 사용한다. 이 방법은 부분적으로 명암왜곡된 얼굴이미지를 기존의 영상 보정기법을 적용한 것 보다 잘 표현하며, 얼굴이 아닌 후보는 비얼굴 이미지의 형상을 가지게 하는 특성이 있다.
-
본 논문은 기존의 휴대폰과 같은 모바일 환경에서의 제약적인 화면을 극복하기 위하여 가상의 스크린을 만들고 이를 사용자가 손쉽게 제어할 수 있는 인터페이스에 대해서 제안하였다. 기존의 방법은 버튼을 반복적으로 눌러 스크롤 했던 것에 반해 제안된 인터페이스는 휴대폰 카메라를 통해 입력되는 영상 신호를 기반으로 움직임 벡터 값을 추출하고 이를 통하여 사용자가 움직이는 방향대로 화면을 움직여 줌으로서 사용자에게 편리하고 직관적인 인터페이스를 제공함으로서 휴대폰의 제한적인 화면을 극복 하였다. 모바일 환경에서의 움직임 벡터 값을 추출하기 위한 알고리즘을 제안하고, 제한적인 화면으로 인하여 정보 표현에 한계가 있던 점을 극복하여 모바일 환경에서의 새로운 인터페이스를 제안하였다.
-
본 연구에서는 다양한 개념 패싯과 관계 패싯들을 수용한 범용 과학기술 시소러스 구축용 웹 기반 워크벤치 개발에 대해 기술한다. 기존 국내 시소러스 구축용 워크벤치들이 제공하는 기본적인 용어 관계구축 기능을 확장하여 개념 패싯, 범주 관계 패싯, 의미역 관계 패싯, 속성 관계 패싯 및 속성 키워드 처리 기능을 원활히 제공할 수 있는 사용자 중심적 워크벤치를 개발함으로써 시소러스 상의 개념들에 대한 효율적인 구축이 가능하도록 한다. 또한 시멘틱 웹 상의 온톨로지 영역에 보다 근접한 고도화되니 시소러스 구축을 위해 용어들을 개념화시키고, 개념간의 다양한 관계를 설정하는 프로세스 중심적 설계로 분야 적합성이 높은 정보 처리 기반을 갖춘다. 궁극적으로 여러 마이크로 시소러스들을 통합하여 운용할 수 있는 복합 모델을 구축하는 것을 목표로 하고 있다. 이러한 목적에 부합하는 시스템 구현을 위해 CBD(Component Based Development) 개발 방법론으로 MSF/CD를 이용하였으며, 분산 환경에서 이기종간의 데이터 교환을 용이하게 하기 위하여 웹 서비스 (XML Web Services)를 이용하였다. 또한 시멘틱 웹 기반 연구자 간 협업 지원 서비스 구현을 위한 확장 검색용으로서도 활용할 수 있도록 하였다. 시소러스 반출은 CSV, XML 및 RDF를 모두 지원할 수 있도록 함으로써 다양한 사용자 요구 사항에 부합할 수 있도록 하였다. 시소러스 브라우징을 시각화 기반의 3단계 구조를 가진 플래시로 구현하여 사용자가 쉽게 시소러스를 탐색하고 분석할 수 있는 기반을 제공하였다. 또한 다양한 검색 요구를 만족시키고자 기본 검색, 고급 검색, 메타 검색을 선택할 수 있도록 하며, 개념 편집 및 시소러스 브라우징과 연동시켜 효율적인 시소러스 구축이 가능하도록 하였다. 본 연구의 워크벤치를 이용하여 구축된 시소러스는 기존 시소러스들에 비해 사용자가 보다 폭넓은 의미 기반 검색을 수행할 수 있도록 함으로써 다각적인 정보를 쉽게 획득할 수 있는 기반을 마련하고 있다는 데 의의가 있으며, 다국어 시소러스 및 다중 시소러스를 수용할 수 있는 방향으로 발전시킬 계획이다.
-
인체에서 발생하는 생체신호 중에서 뇌파는 신호가 복잡하고 재현이 어려움에도 불구하고 BCI(Brain Computer Interface) 분야에서는 선진국 선두 그룹을 중심으로 획기적인 기술을 개발하고 있다. 또한 BCI 에 대한 개발의 필요성도 손발을 사용하지 못하는 중증 장애인을 중심으로 확대되고 있다. BCI2000 시스템은 이러한 노력으로 탄생하였으며 BCI 선두 그룹을 중심으로 개발 발전되고 있다. 이 시스템 내부에서는 순수 상상에 의한 방향 인식과 가상키보드 등의 작업이 가능하도록 수정 보완 작업이 계속되고 있으며 정기적인 모임을 통해 그 기술을 공유하고 있다. BCI 에서의 선진그룹과 국내 연구 결과에는 많은 기술적 차이가 있지만 본 연구에서는 BCI 에서의 기술 발전에 자극되어 좌우 방향의 이벤트에 대한 뇌파 신호 분석과 이를 통하여 모니터 상의 방향을 제어하는 실험을 실시하였고 그 방법과 결과를 논의한다.
-
멀티모달 인터페이스는 인간의 제스처, 시선, 손의 움직임, 행동의 패턴, 음성, 물리적인 위치 등 인간의 자연스러운 행동들에 대한 정보를 해석하고 부호화하는 인지기반 기술이다. 본 논문에서는 제스처와 음성, 터치를 이용한 3D 오브젝트 기반의 멀티모달 인터페이스를 설계, 구현한다. 서비스 도메인은 스마트 홈이며 사용자는 3D 오브젝트 직접조작을 통해 원격으로 가정의 오브젝트들을 모니터링하고 제어할 수 있다. 멀티모달 인터랙션 입출력 과정에서는 여러 개의 모달리티를 병렬적으로 인지하고 처리해야 하기 때문에 입출력 과정에서 각 모달리티의 조합과 부호화 방법, 입출력 형식 등이 문제시된다. 본 연구에서는 모달리티들의 특징과 인간의 인지구조 분석을 바탕으로 제스처, 음성, 터치 모달리티 간의 입력조합방식을 제시하고 멀티모달을 이용한 효율적인 3D Object 인터랙션 프로토타입을 설계한다.
-
각종 온라인 문화가 발달하는 가운데 원거리에서 의사 소통을 가능하게 하는 도구에 관한 관심도 커지게 되었다. 이러한 도구 중에서 2 차원 그림 저작을 지원하는 도구에 기인하여, 본 논문에서는 3 차원 모델을 만들어 내고 조작함으로써 원거리의 사용자와 의사 소통할 수 있는 시스템을 제안한다. 실시간에 수행되는 시스템의 특성상, 3 차원 모델링은 간편하고 직관적으로 수행될 수 있도록 하며, 병행 수행 제어를 고려하여 구현한다. 본 시스템에서의 모델링은 주어진 primitive를 이용하거나 사전에 제작된 mesh를 불러오는 것으로 수행할 수 있으며, 사용자가 직접 그려주는 간략한 외곽선 스케치를 기반으로 하여 3 차원 모델을 생성할 수도 있다. 본 시스템에서 모델의 생성, 제어 등의 모든 연산은 다양한 병행 수행 제어 전략을 이용하여 실시간에 수행된다.
-
과거에는 시스템이 돌아가기만 하면 되지 편리함이나 사용자의 취향을 고려하는 것은 모두 사치라는 생각이 있었다. 그러나 현재는 단순히 사용성에 근거한 시스템만으로는 그 시스템이 좋은 시스템이라고 평가 받기에는 부족한 면이 있다. 이제는 시스템이 HCI 관점에서 평가되며, 이때 시스템개발의 최종목적은 단순히 동작하는 시스템을 만드는 것이 아니라 사용자들에게 최적의 경험을 제공할 수 있는 시스템을 개발하는 것이다. 이러한 최적의 경험은 시스템과의 상호작용이 유용하고, 편리하며, 직관적이어야 얻을 수 있다. 일반적으로 TV 리모컨은 화면에 미리 지정된 부분들을 순차적으로 이동하는 간접 이동 방식으로 매우 간단한 인터랙션만을 제공해 준다. 본 논문에서는 사용자에게 보다 직관적인 인터페이스를 제공해주기 위해 리모컨의 기능을 확장한 프로젝터 기반의 가상 리모컨을 제안한다. 가상리모컨은 사용자가 원하는 위치에 생성될 수 있으며, 기존의 TV 리모컨과 같이 미리 지정된 메뉴 사이를 이동해서 제한된 선택을 하는 것이 아니라, 보다 직관적인 인터페이스를 통해 직접 기기를 동작시키는 가상 체험을 느끼면서 조작할 수 있도록 해 준다. 실험을 통해, 기존의 TV 리모컨이 일정한 학습을 필요로 했던 것과는 달리, 체험자들은 사전 학습없이 TV의 주요 기능을 가상리모컨을 사용함으로써 쉽고 빠르게 컨트롤할 수 있음을 확인하였다.
-
Cha, Jong-Eun;Oakley, Ian;Kim, Yeong-Mi;Kim, Jong-Phil;Lee, Beom-Chan;Seo, Yong-Won;Ryu, Je-Ha 1031
햅틱 분야는 디스플레이 되는 콘텐츠를 만질 수 있게 촉감을 제공함으로써 의학, 교육, 군사, 방송 분야 등에서 널리 연구되고 있다. 이미 의학 분야에서는 Reachin 사(社)의 복강경 수술 훈련 소프트웨어와 같이 실제 수술 할 때와 같은 힘을 느끼면서 수술 과정을 훈련할 수 있는 제품이 상용화 되어 있다. 그러나 햅틱 분야가 사용자에게 시청각 정보와 더불어 추가적인 촉감을 제공함으로써 보다 실감 있고 자연스러운 상호작용을 제공하는 장점을 가진 것에 비해 아직은 일반 사용자들에게 생소한 분야다. 그 이유 중 하나로 촉감 상호작용이 가능한 콘텐츠의 부재를 들 수 있다. 일반적으로 촉감 콘텐츠는 컴퓨터 그래픽스 모델로 이루어져 있어 일반 그래픽 모델러를 사용하여 콘텐츠를 생성하나 촉감과 관련된 정보는 콘텐츠를 생성하고 나서 파일에 수작업으로 넣어주거나 각각의 어플리케이션마다 직접 프로그램을 해주어야 한다. 이는 그래픽 모델링과 촉감 모델링이 동시에 진행되지 않기 때문에 발생하는 문제로 촉감 콘텐츠를 만드는데 시간이 많이 소요되고 촉감 정보를 추가하는 작업이 직관적이지 못하다. 그래픽 모델링의 경우 눈으로 보면서 콘텐츠를 손으로 조작할 수 있으나 촉감 모델링의 경우 손으로 촉감을 느끼면서 동시에 조작도 해야 하기 때문에 이에 따른 인터페이스가 필요하다. 본 논문에서는 촉감 상호작용이 가능한 촉감 콘텐츠를 직관적으로 생성하고 조작할 수 있게 하는 촉감 모델러를 기술한다. 촉감 모델러에서 사용자는 3 자유도 촉감 장치를 사용하여 3 차원의 콘텐츠를 실시간으로 만져보면서 생성, 조작할 수 있고 촉감 사용자 인터페이스를 통해서 콘텐츠의 표면 촉감 특성을 직관적으로 편집할 수 있다. 촉감 사용자 인터페이스는 마우스로 조작하는 기존의 2차원 그래픽 사용자 인터페이스와는 다르게 3 차원으로 구성되어 있고 촉감 장치로 조작할 수 있는 버튼, 라디오 버튼, 슬라이더, 조이스틱의 구성요소로 이루어져 있다. 사용자는 각각의 구성요소를 조작하여 콘텐츠의 표면 촉감 특성 값을 바꾸고 촉감 사용자 인터페이스의 한 부분을 만져 그 촉감을 실시간으로 느껴봄으로써 직관적으로 특성 값을 정할 수 있다. 또한, XML 기반의 파일 포맷을 제공함으로써 생성된 콘텐츠를 저장할 수 있고 저장된 콘텐츠를 불러오거나 다른 콘텐츠에 추가할 수 있다. -
본 논문에서는 유비쿼터스 컴퓨팅 오피스 환경에서 가장 직관적인 HCI 수단인 손 제스처를 사용하여 대형 스크린 상의 응용 프로그램들을 쉽게 제어할 수 있는 시스템을 제안한다. 손 제스처는 손 영역의 정보, 손 중심점의 위치 변화값과 손가락 형상을 이용하여 시스템 제어에 필요한 종류들을 미리 정의해 둔다. 먼저 효율적으로 손 영역 획득을 위해 적외선 카메라를 사용하여 연속된 영상을 획득한다. 획득된 영상 프레임으로부터 구조적 템플레이트 매칭 방법을 사용하여 손의 중심(centroid) 및 손가락끝(fingertip)을 검출한다. 인식과정에서는 양손의 Euclidean distance와 손가락 형상 정보를 이용하여 미리 정의된 제스처와 비교하여 인식을 행한다. 본 논문에서 제안한 비전 기반 hand gesture 제어 시스템은 인간과 컴퓨터의 상호작용을 이해하는데 많은 이점을 제공할 수 있다. 실험 결과를 통해 본 논문에서 제안한 방법의 효율성을 입증한다.
-
얼굴 추적은 Vision base HCI의 핵심인 얼굴인식, 표정인식 그리고 Gesture recognition등의 다른 여러 기술을 지원하는 중요한 기술이다. 이런 얼굴 추적기술에는 영상(Image)의 Color또는 Contour등의 불변하는 특징들을 사용 하거나 템플릿(template)또는 형태(appearance)를 사용하는 방법 등이 있는데 이런 방법들은 조명환경이나 주위 배경등의 외부 환경에 민감하게 반응함으로 해서 다양한 환경에 사용할 수 없을 뿐더러 얼굴영상만을 정확하게 추출하기도 쉽지 않은 실정이다. 이에 본 논문에서는 deformable한 model을 사용하여 model과 유사한 shape과 appearance를 찾아 내는 AAM(Active Appearance Model)을 사용하는 얼굴 추적 시스템을 제안하고자 한다. 제안된 시스템에는 기존의 Combined AAM이 아닌 Independent AAM을 사용하였고 또한 Fitting Algorithm에 Inverse Compositional Image Alignment를 사용하여 Fitting 속도를 향상 시켰다. AAM Model을 만들기 위한 Train set은 150장의 4가지 형태에 얼굴을 담고 있는 Gray-scale 영상을 사용 하였다. Shape Model은 각 영상마다 직접 표기한 47개의 Vertex를 Trianglize함으로서 생성되는 71개의 Triangles을 하나의 Mesh로 구성하여 생성 하였고, Appearance Model은 Shape 안쪽의 모든 픽셀을 사용해서 생성하였다. 시스템의 성능 평가는 Fitting후 Shape 좌표의 정확도를 측정 함으로서 평가 하였다.
-
최근 3D 모바일 게임이 이슈가 되고 있다. 휴대폰이 필수품인 시대가 왔고 휴대폰만 있으면 어디서든 게임을 즐길 수 있다는 점 때문에 모바일 게임 산업은 급속도로 발전하고 있다. 그리고 점차 모바일 환경이 하드웨어가 발전하고 3D 가 지원되는 게임 전용폰이 나오면서 모바일 3D 게임이 많이 개발되고 있다. 그러나 휴대폰의 기본 기능은 통화하는 것이니 만큼 PC 에서의 게임이나 플레이스테이션 같은 게임기와는 구조에 차이가 있다. 모바일 환경에서는 휴대폰 버튼만을 사용하여야 한다는 제약이 있다. 그래서 현재 출시된 여거 모바일 게임의 UI 와 기존 PC 게임의 UI 를 비교하고 휴대폰이라는 제한된 환경에서의 도시경영 3D 시뮬레이션 게임을 위한 효율적인 UI 를 만들고자 하였다. 휴대폰에서는 마우스를 사용할 수 없기 때문에 기본적인 게임 조작은 전부 버튼으로 조작할 수 있게 하였다. 그리고 도시경영시뮬레이션 게임이기 때문에 일반 아케이드 게임이나 캐주얼게임에 비해 상대적으로 메뉴가 많고 복잡하다. 그래서 사용자가 설명을 바로 보면서 메뉴를 선택할 수 있도록 메뉴선택은 전부 숫자버튼을 사용하였다. 그리고 사용자가 메뉴를 외우고 있지 않아도 사용가능 하도록 화면 위에 메뉴설명이 같이 나오게 하였다. 사용자는 메뉴별 설명을 보면서 원하는 쪽으로 선택을 하게 된다. 지역설정에서는 마우스의 드래그기능이 안되기 때문에 처음시작점과 끝부분을 선택하여 마우스를 대신하였다.
-
소니컴퓨터엔터테인먼트의 플레이스테이션(R)이나 마이크로소프트의 엑스박스(R)등의 비디오 게임기가 차지하고 있는 시장의 크기가 점점 커지고 있고, 이에 적용되는 기술도 점점 발전하고 있다. 최근에는 무선랜이나 블루투스 등의 기술을 통한 네트워크 연결을 통해 인터넷 접속이 가능해졌고, 간단한 문서 편집이나 개인 정보 관리 기능도 추가되었다. 이러한 기능들이 추가되면서 비디오 게임기에 문자를 입력하는 방법의 필요성이 일어나고 있다. 하지만 비디오 게임기의 기본 입력 장치인 아날로그 스틱을 이용하여 한국어를 입력하는 방법에 대한 연구는 부족한 상태이다. 본 논문에서는 한글의 창제원리를 이용하여 자음과 모음을 각각 아래쪽, 위쪽, 왼쪽, 오른쪽의 네 가지 기본 그룹으로 분류하고, 시계 방향 회전과 반시계 방향 회전을 이용해서 자모를 매핑하는 새로운 한국어 입력 방법인 ASK-HIM을 제안한다. ASK-HIM 은 화면 키보드와 비교를 하였을 때 좀 더 좋은 결과를 보여주었고, 단순한 방식으로 사용이 편리하다는 장점을 지니고 있다.
-
본 논문에서는 PAN에서의 빠르고 안정성 있는 서비스 탐색방법으로 그룹관리와 지역캐시를 이용한 논리적 메쉬구조 기법을 제안하고자 한다. 이 기법은 PAN 내부의 노드들을 하나의 그룹으로 관리하는데, 각 노드들은 그룹에 속한 모든 노드들의 정보를 지역캐시로 저장하고 있어 논리적인 메쉬구조를 가지게 된다. 이 지역캐시 정보는 가입과 탈퇴 방법을 통해 각 노드에게 저장되므로 탐색시 발생하는 브로드캐스팅 트래픽을 감소시킬 수 있다. 이때 논리적 메쉬구조를 사용하여 전송하므로 직접전송을 통한 빠른 전송이 가능하다. 또한 이런 논리적 메쉬구조는 특정 서비스의 탐색을 위해 중간에 다른 노드나 레지스트리 서버를 거치지 않으므로 레지스트리 의존 구조에 비해 상대적으로 안정성이 있다. 이 서비스 탐색 방법은 향후 상황정보 공유를 위한 프레임워크에 상황정보 탐색 모듈로서 반영 될 수 있을 것이며 웨어러블 컴퓨팅에도 적용 가능하다.
-
자동차/선박/정보통신기기 등의 각종 제조 산업 분야에서 신제품 개발기간과 비용단축을 위해 제품의 설계/스타일링 단계에서 디자인 및 사용자 사용성/편이성 등에 대해 가상으로 품평하는 기술에 대한 관심이 날로 증가하고 있다. 이상적인 가상 품평 기술은 사용자가 실물에 대한 품평 상황과 동일한 체험을 얻을 수 있도록 해야 한다. 이를 위해서 품평 대상물을 사실적으로 표현할 수 있도록 하는 실사 수준의 고품질 가시화 기술과 사용자가 품평 대상물을 자연스럽게 조작할 수 있는 상호작용 기술이 필요하다. 본 연구는 자동차의 내 외관 디자인 품평을 위한 가상 디자인 품평 시스템의 개발에 관한 것으로, 사실적인 자동차 가시화를 위한 환경 반사, 빛 산란, 범프 매핑등의 고품질 쉐이더 구현 및 저작 기술, 몰입환경에서 품평 작업을 위한 3D GUI 지원, 자동차 각 부품의 사용성/편이성 평가를 위한 운동성 조작 기능, 멀티프로젝션 디스플레이 시스템 및 3 차원 인간 모델, 장갑형 입력장치 지원을 통한 몰입형 가상 품평 환경 구축에 관한 기술 및 구현 방법을 제시하고자 한다.
-
본 연구에서는 영화나 게임 등에서 사용되는 인간형 관절체의 움직임을 만들어내기 위하여 동역학 시뮬레이션을 이용하는 방법을 제안한다. 동역학을 이용하여 동작을 생성하는 방법은 실제 배우가 연기하기 힘들어서 동작 포착을 활용할 수 없는 경우, 키프레임 방식에 비해 보다 사실적이고 효과적으로 동작을 만들어 내는 장점이 있다. 하지만 시간이 많이 소요되고 결과 동작을 예측하거나 제어하기 힘들기 때문에 지금까지 활용도가 낮았다. 본 연구에서 제안하는 방법은 복잡한 최적화나 컨트롤러 모델링과정 없이 동작 포착 데이터를 이용한 비례 미분 제어기를 통해서 포착된 동작과 유사한 패턴을 가지는 관절 제어기를 만들어낸다. 특히, 내부 관절 제어기뿐만 아니라 최상위 관절에 작용하는 가장제어기를 생성하여 포착된 동작의 관절 궤적을 보다 효과적으로 흉내 낼 수 있게 한다. 생성된 제어기의 매개변수를 조정함으로써 여러 가지 효과를 만들어 낼 수 있으며, 동시에 다양한 동작 패턴도 적용 가능하다. 마지막으로 제어기를 통해 시뮬레이션 되는 동작과 원래 동작 포착된 결과를 혼합하거나 보간함으로써 최종 동작을 생성한다.
-
일반적으로 프로젝터는 심도(depth of field)가 제한되어 있기 때문에 스크린이 곡면일 경우, 일부 영역에서는 초점이 맞지 않게(out-of-focus) 된다. 이런 out-of-focus 영역의 정보는 블러링(blurring)되기 때문에 사용자에게 정확한 정보를 전달할 수 없다. 여러 대의 프로젝터를 이용할 경우, 각 프로젝터는 다른 in-focus 영역을 가지기 때문에 각 프로젝터 픽셀의 in-focus/out-of-focus 판별을 통해 in-focus 픽셀만을 투사함으로써, out-of-focus 픽셀의 영향을 제거할 수 있다. 그러나 여러 대의 프로젝터의 in-focus영역이 거의 일치할 경우, out-of-focus영역은 여전히 out-of-focus상태일 수 밖에 없다. 따라서, 각 프로젝터의 초점을 유연하게 조절하면서 동시에 여러 대의 프로젝터에 의한 in-focus 영역을 최대한 크게 할 수 있는 방법이 필요하다. 본 논문에서는 각 프로젝터의 초점을 유동적으로 조절하면서 취득된 영상을 처리하여 in-focus 영역을 판별하고 각 프로젝터에 대한 in-focus 영역을 조합하여 전체in-focus 영역의 면적을 최대화하는 방법을 제안한다. 제안된 방법의 유용성을 검증하기 위해, 각 프로젝터의 in-focus 영역을 적절한 컬러를 이용해 시각적으로 표현해주고 이 정보를 참조해 각 프로젝터의 초점을 유동적으로 조절하여 전초점 영상을 만들어내는 시스템을 구현하였다.
-
Han, Sang-Heon;Yun, Chang-Ok;Park, Hyun-Woo;Kim, Jung-Hoon;Lee, Young-Bo;Lee, Dong-Hoon;Yun, Tae-Soo 1087
몰입도가 높은 가시화 기법 중 하나인 입체 영상은 차세대 미디어의 표준으로 최근 크게 주목 받고 있다. 그러나 일반 2차원 영상과는 달리 입체 영상은 3차원의 기하정보가 존재해야만 영상을 생성하는 것이 가능하다. 따라서 3차원의 기하정보가 존재하지 않는 2차원 영상을 이용한 입체 영상의 저작은 매우 어려운 문제이다. 본 논문은 영상 기반 모델링 기법을 활용하여 단안 영상으로부터 입체 영상을 생성하기 위한 입체 영상 저작 도구를 제안한다. 이를 위해 입력된 영상에서 사영 기하 정보를 사용하여 깊이 정보를 추론함으로써 3차원 환경을 구성하는 전역 깊이 정보 추출 방법과 영상 내에 존재하는 사물의 정확한 깊이 정보로 수정하기 위한 부분 깊이 정보 수정 방법을 제안한다. 또한, 추출한 깊이 정보로부터 몰입감이 높은 입체 영상의 시점을 결정하기 위한 대화식 입체 영상 미리 보기 기능을 제안한다. 본 논문에서 제안한 기법은 2차원 영상 저작 도구인 포토샵의 플러그인으로 구현함으로써 범용성을 높였다. -
VR 엔진은 일부 입력장치에 대해서만 제한적으로 지원하기 때문에, 개발자가 원하는 입력장치를 사용하지 못하는 경우가 있으며, 가격 또한 고가이기 때문에 특수한 입력장치를 사용하기 위해, 다른 VR 엔진이나 별도의 옵션을 구매하기에는 경제적인 부담이 많이 든다. 이러한 문제를 해결하기 위해 본 논문에서는 개발자가 사용하고자 하는 입력장치와 VR 엔진의 호환을 위한 랩퍼 클래스를 제안한다. 개발한 랩퍼 클래스는 VR 엔진에서 조이스틱을 제어할 수 있는 조이스틱 클래스와 USB 캠을 통하여 영상을 획득하기 위한 USB 캠 클래스이다. 조이스틱 클래스는 입력장치 클래스를 상속받은 후 DirectX 를 이용하여 입력장치를 셋업 하고, 입력장치의 데이터 값을 처리한 후 VR 엔진의 API 로 값을 넘겨주기 전에 후킹하여 조이스틱을 제어할 수 있다. USB 캠 클래스는 VFW(Video for Window)를 사용하여 캠의 영상을 획득하여 버퍼에 저장한 후 VR 엔진의 디스플레이 버퍼에 값을 넘겨서 캠의 영상을 VR 엔진에서 디스플레이 할 수 있다. 이러한 방법을 통해 조이스틱, USB 캠 같은 입력장치를 VR 엔진과 호환할 수 있으며, 다른 종류의 입력장치에 대하여서도 본 연구에서 개발한 랩퍼 클래스를 상속받아 사용할 수 있다. 본 논문에서 사용한 VR 엔진은 Vega Prime 엔진이며, Vega Prime 엔진의 API 에 개발한 랩퍼 클래스를 추가하여 드라이빙, 영상인식 시뮬레이터를 개발한 결과, 효과적이고 경제적으로 입력장치의 연동이 가능함을 확인할 수 있었다.
-
Han, Ki-Wan;Kim, Kwang-Uk;Ku, Jeong-Hun;Jang, Hee-Jeong;Park, Jun-Young;Kim, In-Young;Kim, Jae-Jin;Kim, Chan-Hyung;Kim, Sun-I. 1099
정신질환자들은 자기감정을 표현하는 능력의 결손을 보인다. 이러한 자기 감정표현기술은 정신질환자들을 위한 사회기술훈련 (Social Skill Training) 과정 중 하나로서 정상적인 사회생활로의 복귀를 위해 반드시 필요하다. 지금까지의 자기감정표현 훈련 및 평가 방법은 치료자 능력의 차이에 따른 주관적 판단이 개입될 수 있다는 문제점을 가지고 있다. 가상현실 (Virtual Reality)은 컴퓨터를 이용한 최신의 방법으로, 최근 자폐증이나 공포증 등의 정신질환 분야에도 적용되고 있다. VR 을 사용하면 상호작용을 할 수 있고, 다양한 환경과 자극을 제시할 수 있으며, 3 차원 랜더링을 통해 몰입감을 제공할 수 있다. 또한 저장된 파라미터들을 바탕으로 객관적 판단을 할 수 있는 기준을 제시할 수 있으며, 안전하고 시간과 공간적 제약이 적은 환경 내에서 과제를 수행할 수 있다. 이에 본 연구에서는 자기감정표현기술의 객관적 평가를 위한 가상현실 시스템을 개발하고 정신분열증 환자와 정상인을 대상으로 실험을 진행하였다. 가상현실은 크게 긍정적 상황과 부정적 상황으로 이루어 지는데 집, 카페, 빵집, 길거리 등 다양한 환경에서 가족, 친구, 직장동료 등의 아바타가 실험 참가자에게 말을 건네고 참가자는 적절한 시기에 자신의 감정표현을 하도록 구성하였다. 실험을 하면서 정서 (긍정적 상황 Vs. 부정적 상황)에 따른 자기감정표현에 대한 파라미터로서 아바타가 말하는 동안 참가자가 아바타의 말에 주목을 하는 정도 (아바타가 말하는 동안 참가자가 아바타의 얼굴을 쳐다보는 시간)와 자기감정을 표현을 하는 시간 (아바타의 말이 끝난 후 감정표현을 시작하는 시간과 감정표현시간)과 상대방 아바타를 주목하는 정도 (참가자가 자기감정을 표현하는 중 아바타를 쳐다보는 시간) 등을 측정하였다. 측정결과 정상인이 정신분열병 환자에 비해 아바타를 주목하는 시간이나 자기감정표현을 하는 시간이 더 긴 경향이 있었다. 또한 부정적 상황에서 정신분열병 환자와 정상인 모두가 긍정적 상황에 비해 말하는 아바타에 더 잘 주목하였고, 자기감정을 표현하는 시간도 더 긴 것을 확인 하였다. 따라서 본 연구에서 도출된 파라미터는 실험 참가자의 자기감정표현의 정도를 객관적으로 나타낼 수 있을 것으로 생각된다. 또한 정신분열병 환자의 자기 감정표현능력을 측정하는 도구로 사용될 수 있을 것으로 생각된다. -
Geometry PIG (Pipeline Inspection Gauge)는 배관 내에 삽입되어 내부를 흐르는 매체에 의해서 추진되는 장치로서 배관의 기하학적 형상을 파악하기 위해 사용된다. Geometry PIG는 여러 종류의 센서를 지니고 배관 내부를 주행 하면서 탑재된 저장장치에 빠른 샘플링 속도로 데이터를 저장하기 때문에 획득된 많은 양의 데이터를 분석하기 위한 가시화 기법이 필요하다. 본 논문에서는 데이터의 특성을 고려하여 다양한 가시화 기법들의 스키마를 정의하고, 이러한 가시화 기법들을 이용해 geometry PIG 데이터 분석을 위한 통합된 가시화 기법을 제안한다. 통합된 가시화 기법은 각 가시화 기법들을 사용자가 원하는 형태로 배치하며 사용자가 원하는 시점에서 데이터를 파악할 수 있도록 가시화 기법에 따른 동기화와 사용자 인터페이스를 지원한다.
-
본 논문에서는 광고나 포스터제작에 사용될 수 있는 이미지 모자이크 기법을 소개한다. 모자이크는 임의의 개수의 셀로 하나의 전체 이미지를 표현하는 기법이다. 이중 포토 모자이크는 사진의 조합으로 새로운 사진을 생성한다. 이는 만들고자 하는 영상을 격자를 이용해 나누고 해당 격자에 최적의 이미지를 영상 DB 로부터 찾아 격자를 채움으로써 하나의 이미지 모자이크를 생성한다. 본 논문에서는 하나의 단위 이미지(색이 할당되지 않고 형태만 갖는 영상)를 사용하여 경계로 구분된 특정 영역을 채워나감으로써 하나의 추상화된 예술적 모자이크 영상을 생성하는 알고리즘을 소개한다. 하나의 단위 이미지는 회전, 이동을 통해 다양하게 변할 수 있으며 입력영상의 그래디언트의 방향과 에지정보를 이용해 해당영역을 채우게 된다. 이를 위해서 에지를 넘어서지 않도록 단위 이미지를 변환시키며 최적의 위치를 찾게된다. 또한 입력영상의 색상이나 임의의 색상이나 특정 색상테이블을 이용해 단위 이미지에 색상을 할당함으로써 만들고자 하는 입력영상과 비슷한 모양을 갖거나 형태만을 유지한 추상화된 모자이크 영상 생성이 가능하다.
-
자연 현상에서 나타나는 물이나 바다와 같은 유체를 3 차원으로 시뮬레이션하는데 있어서 가장 중요한 요소는 실시간에 사실적으로 실행 가능하도록하는 것이다. 유체 모델은 특정 상황에 따른 다양한 방정식과 많은 파라미터값에 의해 제어되기 때문에 시뮬레이션하는데 많은 어려움이 따른다. 또한 복잡한 물리 수식을 기반으로 하기 때문에 유체 모델을 시뮬레이션하기 위해서는 많은 수행 시간이 소요된다. 본 논문에서는 실시간 유체와 강체(rigid body) 사이의 상호작용을 표현하기 위해 간략화된 유체 표면 모델(Fluid-Surface Model)을 제안하고, 개선된 계산과정을 통해 보다 빠르게 시뮬레이션하도록 한다. 또한 본 논문에서는 유체의 표면과 강체의 상호작용을 표현하는데 있어서 유체의 항력에 의해서 강체와 충돌시 발생하는 유체 표면의 움직임을 강체 모델의 제어를 통해 나타낸다. 본 논문에서 제안하는 자연스러운 유체 표면 모델은 유체역학적 방법을 사용하여 실시간에 사실적으로 표현된다. 그리고 이러한 유체 표면 모델을 PC 환경에서 사용자와 상호작용 가능하도록 재현하여, 게임이나 애니메이션에서의 유체 모델들에도 적용할 수 있다.
-
최근 멀티플렉스 극장들이 많이 생기면서 영화 관객들이 한 장소에서 다양한 영화를 선택하여 감상할 수 있게 되었다. 그러나 극장에서 제공하는 영화정보는 비치된 팜플렛과 공중파 광고홍보가 유일하며 더 자세한 정보를 얻기 위해서는 인터넷이나 다른 매체를 통해 사전에 정보를 입수해야 하는 불편함이 존재하고 있다. 본 논문에서는 증강현실 기술을 이용하여 관객이 특정 마커가 부착된 영화팜플렛을 카메라에 비추면 마커에 해당되는 동영상을 찾아 재생하고 이때 스크린에 출력되는 동영상을 통해 영화의 예고편 및 등장인물에 대한 소개 등을 실시간으로 관객에게 제공하는 시스템을 구현한다. 본 시스템을 통해 관객에게 별도의 매체나 시간의 소비 없이 해당 극장에서 다양한 영화에 대한 정보를 쉽게 얻을 수 있고 이는 영화를 선택하는데 있어서 많은 편리함을 제공할 뿐만 아니라 영화를 선택하는 과정에 있어 시각적인 재미를 함께 제공한다.
-
최근 무선디바이스의 확산과 함께 무선 네트워크 환경의 다양한 제약사항을 극복하고 항상 적절한 서비스 레벨을 유지하기 위한 'Adaptation'관련연구가 중요한 이슈가 되고 있다. 그러나 대부분의 기존 연구들은 무선디바이스의 문제에 주요 초점이 맞추어져 있으며, 실제 적응에 필요한 변환작업이 이루어지는 프록시 서버의 부하는 크게 고려되지 않고 있다. 하지만 실제로 컨텐츠의 포맷변환과 같은 작업은 많은 리소스가 소요되는 작업이며, 하나의 서버에서 이를 수행하는 경우 많은 작업부하가 집중된다. 이는 사용자가 증가함에 따라 더욱 심각해지며, 사용자의 컨텐츠 요청에 대한 응답시간을 증가시키는 결과를 초래한다. 따라서 본 논문에서는 계층적으로 구성된 주변 프록시들간에 협동작업을 통해, 적응에 필요한 작업의 부하를 분산시키고, 이를 통해 보다 빠르고 효율적인 서비스를 제공하는 새로운 프레임워크를 제안한다. 우리는 제안시스템을 평가하기 위해 프로토타입을 개발하여 Healthcare 시나리오에 적용하였으며, 작업량에 따라서 참여 프록시들에게 작업부하가 균등하게 분배되는 결과와, 이를 통해 적응 컨텐츠가 보다 빠르게 사용자에게 제공되는 결과로 시스템의 효율성을 증명하였다.
-
3D 가상공간을 협업에 효과적으로 이용하기 위해서는 3D 가상공간에서 빠르고 쉽게 의사를 표현할 수 있는 기술이 필요하다. 본 연구에서는 이런 효과적인 의사표현 방법으로 Sketch 기법을 제안한다. Sketch 기법은 간단한 2D 선들의 표현을 통해 매우 빠르게 아이디어를 표현 할 수 있으며, 의도에 따라 부분을 강조하거나 가감할 수 있기 때문에 좀 더 직관적으로 의도를 전달 할 수 있다. 그래서 이러한 Sketch 를 공간상에서 손쉽게 3D 모델의 표면이나 공간 위에 입력하고, 입력한 Sketch 를 3D 가상공간과 연동하여 보여 줌으로써 쉽게 3D 가상공간 안에 Sketch 로 의견을 표현 할 수 있게 하는 Sketch 기반 인터페이스를 연구 하였다. Sketch 기법을 3D 가상공간에 적용하기 위해서는 3D 가상공간 상에서 2D Sketch 를 입력하기 위한 방법과 입력 시 발생할 수 있는 위상차의 문제를 해결해야 한다. 이 연구에서는 2D Sketch 입력을 대상 3D 객체 중심에서 Sketch할 부분의 Sketch plain 을 선택 및 생성함으로써 입력하는 방법을 연구하였으며, 입력 시 발생하는 위상차는 View-point 및 View-Plain 의 이동 등을 통해 해결점을 찾고자 하였다. 그리고 추후 연구를 통해 Sketch 를 Annotation 으로 활용, 협업에서 필요로 하는 Sketch Annotation 으로 개발하고자 한다.
-
사용자 친화형 유저 인터페이스 구현을 위해 인간의 손 형상을 실시간으로 인식하는 연구의 중요성이 부각되고 있다. 그러나 인간의 손은 자유도가 크기 때문에 손 형상을 정확히 인식하기란 매우 어렵고 또한 피부색과 유사한 색을 가지는 복잡한 배경에서는 더욱 곤란하다. 본 논문에서는 별도의 센서를 부착하지 않고 카메라를 사용하여 피부색 정보에 의한 손 형상을 분할한 후 손가락 끝 점을 찾는다. 찾은 손가락 끝점을 이용하여 방향을 탐지하는 알고리즘에 대해 기술한다. 이 방법은 템플리트 매칭을 이용하여 손가락 끝 점을 탐색한 후 찾은 손 가락 끝 점과 손목의 중심을 이용하여 전, 후, 좌, 우 방향을 탐지한다. 제안하는 방법을 이용하여 3D가상현실 공간에서의 Navigation에 응용하였으며, 실험결과 전진, 후진 및 좌측, 우측의 방향전환도 매우 좋은 결과를 보였다. 또한 본 논문에서 제안하는 방법은 마우스, 키보드, 조이스틱 등의 조작 없이 전, 후, 좌, 우 방향전환을 사용자가 직관적으로 지시함으로써 보다 자연스러운 인간과 컴퓨터의 상호작용을 제공할 수 있을 것이다.
-
증강현실 (AR: Augmented Reality)은 카메라를 통하여 현실의 공간에 가상의 물체를 삽입하는 기술로 사용자에게 컴퓨터상에서 정보를 보강해 줌으로서 사용자가 카메라로 보이는 환경에 대한 추가적인 정보를 취득 할 수 있게 해주는 분야이다. 가상환경(Virtual Reality) 및 혼합영상(Mixed Reality)을 이용해 보다 사실감 있는 가상의 영상을 일상 생활에 접목하려는 기술들이 부각되며 활발한 연구가 이루어 지고 있는데 이러한 시도는 일상생활의 다양한 분야에 적용이 되고 있다. 본 논문에서는 카메라로 취득된 화면상에 사용자의 움직임, 즉 사용자가 대상되는 마커를 삽입하고 컨트롤할 수 있는 음악플레이어를 구현한다. 사용자가 키보드나 마우스 등의 입력장치가 아닌 카메라에서 보여지는 마커의 움직임으로 원하는 음악을 플레이 할 수 있는 방법을 제안하고자 한다. 실시간으로 입력되는 카메라상의 프레임에서 대상되는 마커의 움직임을 찾고 그 대상물체 위에 정보를 증강시켜주고, 그 음악을 화면상에 사용자의 마커 움직임을 통해서 제어하는 방법이다.
-
다양한 과학 분야와 공학 분야에서는 그들이 다루고 있는 특정한 주제의 정보를 좀 더 신속하고, 명확하게 사용자에게 전달하기 위해서 여러 가지 정보 가시화(information visualization) 기법을 사용한다. 정보를 가시화 할 때는 기본적으로 세 가지 과정을 거치는데, 원천 데이터(raw data)로부터 데이터 모델(data model)로 변환하고, 변환된 데이터 모델을 가시화 구조상(visual structure)에 매핑(mapping)시킨 후 정보화 모델(information model)로 변환하게 된다. 본 논문에서는 특정 행사가 진행되고 있는 건물내부에서 발생하는 시간, 공간적인 정보를 정리한 도표 메타포(table metaphor)를 토대로, 해당 데이터 모델로부터 추출한 다양한 정보를 3 차원 지도로 구성된 정보화 모델 상에 반영하기 위한 방법을 제안하였다. 또한, 정보를 단순히 공간상에 반영하기 보다는 사용자의 관심영역(interest area)에 따른 정보의 공간적 의미에 중점을 두어 3차원 공간상에 표현하였다.
-
본 논문에서는 구조, 행위, 리소스, 환경의 여러 관점을 적용한 다양한 모델들을 이용하는 적응 프레임워크를 제안한다. 또한, 대상 시스템에 대해 앞에서 언급한 4 가지 모델을 위한 모델링 방법론과 각 모델링 요소들에 대한 효과적인 표기법을 제시하였다. 다양한 모델들을 통해 시스템의 구성 요소들 간의 관계 구조와 시스템의 계층적 상태와 행위 정보, 실행 환경을 구성하는 시스템 의존적인 요소 및 독립적인 요소까지의 정보들이 표현된다. 이들 모델간의 유기적인 상호 운용으로 통합적인 추론과 보다 정확한 평가가 가능하다. 이를 통해 시스템은 예상치 못한 변화에 대해 통합된 관점의 더욱 정확한 진단과 반영할 수 있다. 이를 기반으로 다양한 수준에서 적응 동작의 조절을 수행함으로써 하이브리드하고 보다 확장된 적응이 가능해진다. 논문에서 정의한 모델과 제안 프레임워크는 다른 도메인으로 재사용이 가능하다. 제안 시스템은 평가를 위해 프로토타입을 구현하여 원격 화상 회의 시스템에 적용하였으며, 그 기능과 유효성을 확인하였다.
-
본 논문에서는 실감형 Networked Virtual Environment (NVE)의 사실성 증진을 위한 Non Player Character (NPC)의 지능적 제어 프레임워크를 제안한다. 이 프레임워크는 반응의 다양성, 실시간성 그리고 NPC의 능동성면에서 기존 게임에서 사용되는 NPC 구현 기법과 차이가 있다. 기존 NPC 제어구조의 경우, 휴먼 사용자의 행동에 따른 NPC의 반응이 일정 스크립트나 규칙에 따르기 때문에 정형적이며, 또한 NPC의 반응시간에 대한 실시간성을 고려하지 않고 있다. 또한 NPC는 휴먼 사용자의 액션에 반응하는 종속적이고 수동적인 역할만을 담당한다. 제안하는 프레임워크에서는 NPC는 각자의 취향을 가지고 있어 다양한 반응과 행동양식을 보일 수 있으며, NPC의 행동 결정 시간에 어느 정도 실시간성을 부여할 수 있으며, 또한 NPC의 역할이 수동적 형태에서 벗어나 능동적으로 계획하여 행동을 실행할 수 있다. 프레임워크의 구현을 위해 SWI-Prolog의 Rule based 추론엔진과 유전자 알고리즘을 사용하였다.
-
본 논문에서는 모바일 그리드 컴퓨팅 환경에서, 작업분배에 대한 보다 효율적인 계획을 스스로 결정하고, 이를 지속적으로 개선하는 'Self-Growing Engine' 기반 적응시스템을 제안한다. 최근, 모바일 컴퓨팅 환경에서의 다양한 제약사항을 극복하기 위해, 주변의 여러 컴퓨팅 단말기들의 유휴자원을 공유하여 하나의 작업을 처리하는 그리드 컴퓨팅 개념을 무선환경에 적용하려는 연구가 이슈로 등장하고 있다. 이때, 대부분의 기존 연구들은 그리드 컴퓨팅에 참여하는 단말기들의 리소스 상태만 고려하여 작업을 할당하는 방식을 취하고 있다. 따라서 상대적으로 작업효율이 낮은 단말기에서 작업이 할당되는 경우도 생기게 된다. 제안 시스템에서는 보다 효율적인 작업분배 결정을 위해, 다양한 사항을 고려하여 적절한 단말기를 선택하며, 각 작업수행결과를 history로 저장하며, 이후에 같은 요청이 있을 때 이를 분석하여 보다 적절한 단말기를 선택하도록 스스로 진화하는 특성을 갖는다. 우리는 제안 시스템의 평가를 위해, 데스크 탑에서 프로토타입을 구현하여 시뮬레이션을 수행하였으며, 그 결과를 통해 제안시스템의 효율성을 증명하였다.
-
본 논문은 필립스의 오디오 핑거프린트 추출 방식을 기반으로 기존의 방식이 주파수 영역을 너무 조밀하게 분석하는 특징을 지적하고 개선 방안으로 양자화를 통해 필터 뱅크의 에너지 변화율을 오디오 핑거프린트 추출시 반영하는 방법을 제안하였다. 또한 제안된 알고리즘을 사용하여 PDA 로 실제 어플리케이션을 구현하는 것을 목적으로 하고 있다. 제안된 방식은 필립스 방식과 동일한 메모리 크기를 유지하기 위하여 필터 뱅크의 개수를 33 개에서 17 개로 줄이고 필터 뱅크의 변화량을 2 비트로 할당하는 방식을 사용하였다. 변화량을 비트에 할당하기 위하여 음악 데이터 베이스로부터 추출된 각 밴드의 pmf를 통해 음악의 고유성을 최대로 증진 시킬 수 있는 임계치를 찾아내고 이것을 바탕으로 필터 뱅크의 변화량을 2 비트로 할당하였다. 이 같이 추출된 오디오 핑거프린트를 기반으로 PDA 와 음악 검색기 서버와의 통신을 이용하여 사용자가 요청한 쿼리 음악에 관련된 정보를 제공하는 시스템을 구현했다. 제안된 방식은 다양한 주변 잡음 환경에서 평가되어 기존의 필립스 방식 보다 성능 향상 물론 검색 속도 또한 개선되는 특징을 확인할 수 있었다.
-
본 논문에서는 동적 객체의 3 차원 정보를 표현하는 깊이 영상의 노이즈 필터링 방법을 제안한다. 실제 객체의 동적인 3 차원 정보는 적외선 깊이 센서가 장착된 깊이 비디오 카메라를 이용하여 실시간으로 획득되며, 일련의 깊이 영상, 즉 깊이 비디오(depth video)로 표현될 수 있다. 하지만 측정환경의 조명조건, 객체의 반사속성, 카메라의 시스템 오차 등으로 인해 깊이 영상에는 고주파 성분의 노이즈가 발생하게 된다. 이를 효과적으로 제거하기 위해 깊이 영상기반의 모델링 기법(depth image-based modeling)을 이용한 3 차원 메쉬 모델링을 수행한다. 생성된 3 차원 메쉬 모델은 깊이 영상의 노이즈로 인해 경계 영역과 형상 내부 영역에 심각한 형상 오차를 가진다. 경계 영역의 오차를 제거하기 위해 깊이 영상으로부터 경계 영역을 추출하고, 가까운 순서로 정렬한 후 angular deviation 을 이용하여 불필요하게 중복된 점들을 제거한다. 그리고 나서 2 차원 가우시안 스무딩 기법을 적용하여 부드러운 경계영역을 생성한다. 형상 내부에 대해서는 경계영역에 제약조건을 주고 3 차원 가우시안 스무딩 기법을 적용하여 전체적으로 부드러운 형상을 생성한다. 최종적으로 스무딩된 3 차원 메쉬모델을 렌더링할 때, 깊이 버퍼에 있는 정규화된 깊이 값들을 추출하여 원래 깊이 영상과 동일한 깊이 영역을 가지도록 저장함으로서 전역적으로 연속적이면서 부드러운 깊이 영상을 생성할 수 있다. 제안된 방법에 의해 노이즈가 제거된 깊이 영상을 이용하여 고품질의 영상기반 렌더링이나 깊이 비디오 기반의 햅틱 렌더링에 적용할 수 있다.
-
사용자-제품 상호작용(User-product interaction)의 관점에서 사용자의 만족도는 제품의 사용편의성(Usability)과 감성품질에 의해서 결정된다. 특히, 물리적으로 사용자와 제품의 기능을 연결하는 PUI(Physical User Interface)의 감성품질은 시각뿐 아니라 촉감, 동작감, 청감 등의 사용자의 다양한 감성의 조합으로 이루어져 있다. 문헌조사에 의하면, 사용자의 감성 만족도를 향상시키기 위한 제품의 시각적 감성품질에 관련된 연구는 활발하게 진행되고 있으나, 촉감, 동작감, 청감 등의 감성품질에 관련된 연구는 상대적으로 미흡한 실정이다. 이러한 관점에서 제품의 전체적인 감성품질을 평가하기 위해서는 제품과 사용자가 상호작용하는 PUI의 전반에 대한 사용자 만족도(User Satisfaction)의 정량적인 평가가 필수적이며, PUI의 감성품질을 구성하는 시각에 대한 고려뿐만 아니라, 예를 들어 조작장치를 잡는 느낌, 조작장치가 움직일 때의 동작감, 조작장치 작동 시의 청감 등 사용자와 조작장치 간에 일어나는 상호작용 전반에 관한 연구가 이루어져야 한다. 본 연구에서는 PUI의 구성요소 중 동적인 조작장치의 촉감, 동작감, 청감에 대하여 문헌 조사를 통해 조작 장치의 감성을 구성하는 요소들을 체계적으로 파악하였고, 감성의 요소를 중복 설명하지 않는 상호독립적인 의미를 가진 감성 형용사를 수집하고 분류한 후, 추출한 형용사를 기초로 설문지를 작성하였으며, 사용자들의 설문을 통하여 자료를 수집하였다. 구조방정식 기법을 사용하여, 조작장치의 전체적인 사용자 만족도와 촉감, 동작감, 청감 간의 상관관계 모형을 수립하였다. 또한 구조방정식의 결과를 바탕으로 인간공학 전문가와 제품설계 전문가로 이루어진 FGI(Focus Group Interview)를 실시하여 잡는 느낌, 동작감, 청감과 관련된 조작장치의 적절한 설계 변수를 결정한 후 설계값을 측정하였으며 감성 만족도와 측정치 간의 상관관계를 분석하여 감성품질 요소의 정량화를 수행하였다. 본 연구결과는 실제 산업현장에서 제품개발자들이 사용자 만족도에 영향을 미치는 제품 설계요소들의 상대적인 중요도를 평가하고, 감성품질을 결정하는 설계특성값을 구체적으로 파악하는데 실질적인 도움을 줄 것으로 기대된다.
-
데이터 압축 기술은 대용량의 데이터를 효율적으로 저장할 수 있게 해주는 기술로, 여러 분야에서 생성되는 데이터의 용량이 커지고 네트워크를 통한 데이터 전송에 대한 필요성이 증가함에 따라 그 중요도가 점점 더 커지고 있는 추세다. 특히 다양한 과학 분야에서 시뮬레이션의 결과로 산출되는 볼륨 데이터는 컴퓨팅 기술의 발전에 힘입어 점점 더 용량이 방대해지고 있는 추세이기 때문에 볼륨 데이터 압축에 대한 요구는 계속 커지고 있다. 본 논문에서는 Daubechies의 D4 기저함수를 이용한 웨이블릿 필터 변환과 zerobit 인코딩 기법을 응용한 유닛 기반의 볼륨 데이터 압축 기법을 제안한다. 유닛 기반 인코딩 기법은 복원 데이터의 손실율이 낮기 때문에 적은 웨이블릿 변환 계수로 화질이 좋은 이미지를 얻을 수 있다. 따라서 정밀한 영상을 요구하는 대용량 데이터의 압축 및 렌더링에 유용하게 사용할 수 있을 것이다.
-
오늘날 모바일 기기가 갖는 역할이 다양해짐과 동시에 모바일 플랫폼에서의 사용자 인터페이스(User Interface, UI)에 대한 연구 또한 활발히 이루어지고 있다. 이는 전통적인 데스크탑 플랫폼에서의 정보에 대한 일반적인 접근 방법이 모바일 기기에 적용하기에는 적절하지 않기 때문이며, 이는 모바일 기기의 제한된 스크린 크기, 부자연스러운 상호작용 방식, 그리고 기기와 관련된 기술적인 다른 요인들과 관련된다고 할 수 있다. 본 연구에서는 휴대폰, PDA, 스마트폰과 같이 작은 화면을 가진 모바일 기기에서 제시되는 메뉴를 탐색할 때 효과적인 메뉴 형식과 페이징 형식이 무엇인지 알아보고자 하였다. 메뉴 형식은 모바일 기기에서 일반적으로 많이 사용되는 열거형(list) 메뉴와 격자형(grid) 메뉴의 두 가지로 제시하였고, 페이징 형식은 한 번에 한 줄씩 화면 하단에서 위로 이동하는 스크롤(scrolling) 방식과 한 번에 한 화면 전체가 위로 이동하는 페이지 간(page-to-page) 이동 방식의 두 가지로 제시하였다. 실험 1 에서는 한 수준의 깊이를 가진 메뉴에서 메뉴 형식과 페이징 형식에 따른 탐색 과제 수행을 측정한 결과, 열거형 메뉴보다 격자형 메뉴에서 사용자들의 메뉴 탐색 수행이 유의미하게 빠르며, 사용자의 만족도 또한 높은 것으로 나타났다. 그러나 페이징 형식에 따른 메뉴 탐색 수행 시간과 선호도에는 유의미한 차이점이 없었고, 메뉴 형식과 페이징 형식간의 상호작용 또한 나타나지 않았다. 실험 2 의 결과, 두 수준의 깊이를 가진 메뉴에서는 페이징 방식이 메뉴 탐색 정확도에 미치는 유의미한 주효과가 있었다. 메뉴 탐색 수행 시간과 주관적 만족도는 실험 1 과 같게 나타났다. 이는 메뉴 형식과 페이징 방법에 따라 사용자의 수행과 선호도가 차이가 있음을 시사한다.
-
최근 비실사렌더링의 여러 가지 기술들이 발전하고 있다. 특히 회화적 느낌을 지닌 많은 연구들이 이루어지고 있으며, 그로 인해 2차원과 3차원 양쪽에서 여러 가지 방법을 통해서 좀더 스타일리스틱하며 아티스틱한 비실사렌더링이 연구되고 있다. 본 논문은 아티스트가 직접 그린 이미지에서 회화적 정보를 얻어와 스타일리스틱한 결과를 내는 새로운 방법을 제시한다. 본 논문에서 제시한 방법으로 이루어진 비실사렌더링의 결과는 단순히 모델이나 사진에 종속적인 색감에서 벋어나 아티스트가 원하는 색과 느낌을 가질 수 있게 된다. 그러므로 아티스트 개인의 예술적 표현을 비실사렌더링에 적용할 수 있게 된다.
-
본 연구의 목적은 객체의 형상정보(3D mesh)와 색/질감정보(image)를 이용하여 텍스쳐 맵핑된 고품질의 가상모델을 생성하는데 있다. 3 차원 형상정보에 대응하는 이미지 상의 텍스쳐 좌표 관계를 구하기 위해 오브젝트 좌표계와 카메라 좌표계 사이의 변환행렬, 카메라의 초점거리, 카메라 CCD 와 프레임상의 이미지 사이의 aspect ratio 를 파라미터로 하는 3D-2D 정합을 수행한다. 이러한 3D-2D 정합을 효율적으로 수행하기 위하여, 카메라 내부파라미터 검정단계, 신뢰도가 높은 초기해 설정단계, 비선형 최적화(Newton method) 단계로 접근한다. 또한, 색/질감정보로 이용되는 객체의 이미지는 촬영조건에 의해 스펙큘러(specular)나 이미지 픽셀값의 포화상태(saturation) 등의 결점을 포함한다. 영상내의 스펙큘러 좌표와 3D-2D 정합의 결과를 이용하여 촬영 당시의 광원을 추정하고, 근사화된 빛반사도 함수(BRDF)를 이용하여, 텍스쳐의 픽셀값 변조를 통해 이미지 촬영 당시의 광원효과가 제거된 디퓨즈 텍스쳐를 획득한다. 본 연구에서는 퐁(Phong)의 모델을 근사화한 빛 반사도 함수 모델로 사용하였다.
-
적응순항제어시스템은 선행차량과의 거리와 속도를 자동적으로 안전하게 유지하여 운전의 안전성과 편의성을 향상시키는 시스템이다. 본 연구에서는 적응순항제어시스템의 안전성을 향상시키기 위한 연구를 수행하였다. 적응순항제어시스템의 작동 상태 및 주변 차량 정보를 운전자에게 제공해 주기 위한 시각 및 음성정보 전달장치를 설계 및 제작하였다. 시각정보 전달장치를 통해 선행차량과의 차간거리, 속도, 가감속 상태 등을 운전자에게 전달하였고, 음성정보 전달장치를 이용하여 선행차량과의 근접거리 경보 등의 메시지를 전달하도록 하였다. 이러한 조건에서 운전자가 적응순항제어시스템을 사용하여 운전하는 경우, 시각 및 음성정보 전달장치의 유무에 따른 차량 조작과 차량 운전 성향 및 특성의 변화를 살펴봄으로써 정보전달장치를 통한 안전성 향상에 관한 영향을 연구하였다. 연구 결과, 운전자에게 정보 전달장치를 통해 정보가 제공되었을 경우, 운전자는 차량의 운전 및 적응순항제어시스템 사용에 있어 편안함을 느낄 수 있었고, 선행차량과의 차간거리를 보다 넓게 설정하여 주행 안전성을 향상시키는 것을 확인할 수 있었다. 또한 정보전달장치를 통한 정보 수집이 차량 운행에 저해 요인으로 작용하지 않음을 확인할 수 있었다. 이러한 결과는 정보전달장치를 통한 정보전달은 운전자에게 적응순항제어시스템에 대한 편의성 및 효율성, 안전성을 더욱 향상 시킬 수 있음을 보인다.
-
신속하고 정확한 교통정보 서비스의 제공은 원활한 교통소통을 위하여 필수적인 요소이다. 특히, 교통사고, 도로보수 그리고 자연재해와 같은 유고가 발생할 경우, 운전자에게 즉시 통보해주어 우회할 수 있도록 조치하는 것이 필요하다. 이를 위하여 다양한 교통정보 수집기에서 수집된 교통정보를 바탕으로 실시간으로 유고상황을 판별하는 연구가 많이 진행되고 있다. 유고상황 분석은 다양한 환경요인으로 인해 판별이 어렵고, 최근에 활용되고 있는 인공지능 기법은 검지에 드는 시간 비용이 많다는 문제를 가지고 있다. 본 연구에서는 과거에 발생한 각종 돌발 상황을 분석하여 실시간으로 유고상황을 검지하는 것이 목적이다. 유고검지를 위해 GPS를 탑재한 probe car에서 수집된 차량속도와 온라인으로 제보된 유고정보를 ANFIS를 이용하여 분석 후 유고상태를 판별한다. 본 연구를 통해 실시간 도로 이용자들이 유고 발생 지역의 정보를 제공받고 그 상황에 신속하게 대처하게 함으로써 교통 혼잡 완화에 기여할 것으로 기대한다.
-
한국어 문장을 구조 분석할 때에 모호성을 발생시키는 유형 중의 하나가 나열 및 병렬형이다. 문장 구조 복잡도를 증가시키는 나열 및 병렬형을 구조 분석 전에 미리 하나의 단위로 묶어서 처리하는 것이 문장 구조 분석의 정확도를 높이는데 중요하다. 본 연구에서는 형태소 태그를 이용한 기본 규칙으로 문장을 청크 단위로 분할하고 분할된 청크 중에서 나열형을 인식하여 해당되는 청크들을 하나의 나열 청크로 통합하여 청크의 개수를 줄인다. 병렬형에 대해서는 반복되는 병렬 청크의 범위와 생략된 용언을 복원한다. 이러한 인식은 첫 단계로 기호(symbol)를 중심으로 구축된 간단한 규칙으로 인식을 하고 이러한 규칙에 해당되지 않는 형태의 나열 및 병렬형은 Maximum Entropy 모델을 이용하여 적용한다. ME모델은 어휘자질, 형태소 품사 자질, 거리 자질, 의미자질, 구 단위 태그 자질(NP:명사구, VP:동사구, AP:형용사구), BIO 태그(Begin, Inside, Outside) 자질에 대한 ME(Maximum Entropy) 모델을 이용하여 구축되었다.
-
본 연구에서는 영역 분할 알고리즘과 3차 스플라인 보간법을 이용하여 스테인드 글라스 렌더링을 위한 개선된 유리 타일 생성 알고리즘을 제안하였다. 먼저 유리 타일의 초기 형태를 추출하기 위하여 입력 영상에 Mean shift 분할 알고리즘을 적용하였다. Mean shift 분할 알고리즘은 영상의 각 픽셀(pixel)에서의 지역 밀도 최대 점(local density maximum)을 찾아 클러스터링(clustering)하는 알고리즘으로 영상을 효과적으로 분할할 수 있다. 그리고 분할된 영역에서 영역을 사용자 입력으로 병합하고, 영역에서 부적절한 형태를 없애기 위해 본 연구에서는 형태론적 연산(morphological operation)을 이용하였다. 추출된 영역으로부터 유리 타일의 형태로 만들기 위하여 추출된 각각의 영역에 3차 스플라인 보간법(cubic spline interpolation)을 적용하여 경계가 완화된 영역과 납틀(leading)의 형태를 얻는다. 그 다음 영역을 스플라인 곡선(spline curve)을 이용하여 재분할하고, 각 영역에 변환(transformation)된 색상을 적용하여 최종적인 유리 타일을 만들어낸다. 본 연구에서는 3차 스플라인 보간법을 이용하여 실제 스테인드 글라스에서 생길 수 있는 부드러운 경계를 갖는 유리 타일의 형태를 만들어 이를 스테인드 글라스 렌더링에 이용하였다. 이 방법은 기존의 영역 분할 알고리즘에 형태론적 연산만을 적용하여 유리 타일의 형태를 생성하는 것보다 효과적으로 유리 타일의 형태를 생성할 수 있다. 또한, 생성된 영역에 재분할 과정을 거쳐서 작은 유리 타일이 모여서 이루는 조형적인 형태를 이룰 수 있도록 하였다.
-
Lee, Chang-Ki;Hur, Jeong;Wang, Ji-Hyun;Lee, Chung-Hee;Oh, Hyo-Jung;Jang, Myung-Gil;Lee, Young-Jik 1252
본 논문은 정보검색, 정보추출, 번역, 자연어처리 등의 작업을 위한 통계적 방법론에서 필요한 학습 데이터 구축을 효율적으로 하기 위한 학습 데이터 반자동 구축 장치 및 그 방법에 대하여 기술한다. 본 논문에서는 학습 데이터 구축양을 줄이기 위해서 능동 학습을 이용한다. 또한 최근 각광 받고 있는 Conditional Random Fields(CRF)를 능동학습에 이용하기 위해서 CRF를 이용한 Confidence measure를 정의한다. -
본 논문은 스토리에 기반하여 여러 편의 드라마 동영상 파일 중에서 사용자가 찾고자 하는 파일을 찾아주는 검색 시스템의 설계 및 구현에 대하여 기술한다. 기존의 동영상 검색 방식은 제목 및 주연 배우와 같이 제한적인 검색어에 의한 검색을 제공하고 있으나, 대부분의 드라마 파일은 영화 또는 다른 동영상 파일과 달리 여러 회로 나누어져 있기 때문에 기존의 주연 배우나 제목과 같은 정보만을 가지고 사용자가 원하는 파일을 검색하기 어렵다. 본 논문에서는 드라마의 제작사에서 제공하는 각 회당 스토리를 기본적인 불리안 모델과 결합시켜 사용자가 원하는 회차를 검색하는데 유용한 시스템을 설계 및 구현하였다. 본 논문에서 제시한 방식의 유용성을 보이기 위하여 실제 서비스 되고 있는 드라마를 대상으로 실험을 하였으며, 실험결과 높은 검색 능력을 보이고 있다.
-
사실적인 물 애니메이션을 위한 격자 기반 시뮬레이션 기법은 자연스러운 물의 움직임뿐만 아니라 부드러운 물의 표면을 잘 표현해주는 장점이 있다. 이러한 격자 기반 방법과 함께 상대적으로 적은 계산으로 안정적인 결과를 산출해주는 입자 기반의 액체 시뮬레이션 기법이 최근 애니메이션 분야에 적용되기 시작했고, 그로 인하여 입자로 이루어진 시뮬레이션 데이터에 특화된 효과적인 렌더링 기술의 개발이 요구되고 있다. 본 논문에서는 주로 3차원 스캔 데이터와 같이 물체 표면을 샘플링 하여 얻어진 점 집합에 대한 렌더링 기법을 확장하여, 위상 변화가 크고 점 집합에 의해 내부까지 표현되는 물 데이터의 특성에 적합한 렌더링 기법을 제안한다. 본 기법에서는 시뮬레이션을 통하여 얻은 입자 데이터로부터 물의 표면을 표현해주는 새로운 점 집합을 생성하고, 시뮬레이션 된 데이터의 특성을 잘 반영하도록 각 점에 대한 법선 벡터와 반지름을 결정한다. 특히 가공된 점 집합 데이터에 대하여 확장된 점 집합 렌더링 기법을 적용함으로써 입자 데이터가 표현해주는 세밀한 부분들을 보존하면서, 부드러운 물의 표면을 가시화할 수 있도록 하였다.
-
DMB 데이터 표준화 위원회는 기존의 방송과 차별화 된 서비스를 제공하기 위하여 MPEG-4 BIFS Core 2D @ Level 1 을 지상파 DMB 데이터 표준으로 선택하였다. 그러나 MPEG-4 BIFS Core 2D @ Level 1 은 비디오 객체 위에 간단한 2D 도형을 오버레이하는 정도의 기능만을 제공하고 있어서, 아직은 DMB 데이터 표준에 3D 데이터 표현에 대한 내용을 포함하고 있지 않다. 따라서 본 논문에서는 향후 DMB 용 데이터 콘텐츠에서 3D 그래픽스를 활용한 멀티미디어 콘텐츠 개발이 가능하도록 3D 그래픽스 표현을 위한 프로파일을 제시하고자 한다. 방송의 새로운 영역인 모바일 환경에서의 BIFS 활용을 위하여 본 연구에서는 MPEG-4 BIFS 의 3D 노드들을 기반으로 모바일 환경에 적합한 노드들을 추려서 프로파일을 구성하였다. 이를 위해 콘텐츠 제작 시 노드 사용 빈도 및 각 노드별 리소스 사용 정도를 조사하였고, 모바일에서 그래픽스 객체 표현을 위한 언어인 OpenGL|ES, JSR184, Mobile Direct3D 등의 표준과 BIFS 표준을 비교 분석하였다. 이러한 조사 내용을 바탕으로 BIFS 3D 노드들 중에서 DMB 용 3D 콘텐츠 구현에 적합한 노드들을 분석하였으며 프로파일 검증을 위한 테스트 콘텐츠를 작성하였다. 향후 멀티미디어 콘텐츠는 다양한 3D 그래픽스 기술의 활용이 예상되므로 이와 같은 연구를 통해 DMB 환경에서도 3D 그래픽스를 객체를 표현이 가능하게 된다면, 다양한 데이터 콘텐츠 개발을 위한 발판이 되어 향후 데이터 방송 활성화에 기여할 수 있을 것이라 기대된다.
-
본 논문에서는 배경과 오브젝트 합성 시 사실적인 그림자 효과를 표현하기 위해 HDR 영상을 기반으로 한 소수의 방향성 광원을 추정하는 기법을 제안한다. 실 세계 정보를 모두 포함하는HDR 영상을 가시화 하기 위해 톤 맵핑(tone mapping)하여 그 영상으로부터 광원의 위치가 되는 밝은 영역들을 찾아내고 그 위치들로부터 방향성 광원을 추정한다. 카메라의 노출시간을 짧게 하여 촬영한 영상에서 나타나는 부분을 실제 광원이 위치하는 부분으로 볼 수 있으므로 톤 맵핑한 영상을 이미지 프로세싱을 거쳐 노출 시간을 짧게 하여 촬영한 영상과 비슷한 결과를 얻을 수 있도록 한 후 밝은 영역만 표현 되도록 한다. 전 처리를 거친 영상을 기반으로 밝은 영역을 추정하기 때문에 보다 정확한 광원의 위치 추정이 가능하며, 추정된 밝은 영역과 일치하는 HDR 영상의 데이터를 사용하기 때문에 정확한 광원의 위치와 데이터를 얻을 수 있다. 또한 추정된 광원은 실제 렌더링에 곧바로 사용이 가능하며, 이를 통해 사실적인 shadowing 효과를 얻을 수 있다.
-
실감모델링(Immersive modeling)이란 모델링하는 사람이 물체의 특성을 고려하여 오감을 활용하여 모델링하는 것을 의미한다. 실감모델링을 위한 오감 중에서 시각은 모델링하는 사람에게 가장 영향을 많이 주기 때문에 실제와 같은 색상과 형상을 생성하는 것이 중요하다. 그러나 가상현실을 위한 데이터를 실시간으로 다루기 위해 많은 데이터를 사용할 수 없고 처리 과정이 단순해야 하기 때문에 시각데이터를 획득하는 과정에도 이를 고려해야 한다. 그 중에서 반짝이는 특성을 가진 물체의 색을 정확히 표현하기 위한 방법으로 색상선(color line)을 사용한다. 색상선은 반짝이는 특성의 표면의 색을 이색성반사 모델(dichromatic reflection model)로 간주하면 색 특성을 표현하는 선이 생성되게 된다. 본 연구는 반짝이는 물체로부터 색상선을 추출하기 위한 방법으로 노출 시간이 다른 여러 장의 이미지로부터 색상을 추출하는 방법을 제안한다. 노출 시간이 다른 이미지를 사용함으로써 한 장에 의해 분류하기 어려운 색상도 분류 가능하고 하이라이트가 발생하여 색상이 왜곡된 경우도 본래 색이 어떤 색상인지 추정되기 때문에 정확한 색상 추출이 된다. 본 연구에서는 3차원 측정 장비를 이용하여 3차원 형상과 색상이 동시 추출된 모델을 이용하여 렌더링된 결과와 제안된 방법으로 추출된 색상을 적용하여 렌더링된 결과를 비교할 것이다.
-
모든 곳에 존재하는 네트워크 환경을 의미하는 '유비쿼터스' 시대와 최신 기술로 구현되어 인간을 도와주는 '지능형 로봇'의 시대가 도래하고 있다. 기술의 흐름은, 이제 우리에게 공장과 공원 등의 공공 장소뿐 만이 아니라, 생활의 기본이 되는 가정 안에서의 로봇을 받아들일 준비를 요구하고 있다. 로봇과 사용자는 실제 생활 속에서 많은 상호 작용을 하게 되며, 필연적으로 여러 가지의 불확실성을 내포하게 되는데, 각각의 요청들과 상황들은, 미리 정해진 규칙에 의거해 처리하기에는 너무 다양하다. 그 어려움을 극복하는 방법으로, 어떤 상황에 적응하는 방법으로 기억을 사용 하는 인간과 마찬가지로, 로봇은 새로운 요청을 처리하기 위해 과거의 기록을 사용할 수 있다. 여러 가지 과거의 기록들을 잘 정리해서 분류하여 저장해둔 후, 현재의 요청에 대한 답으로, 가장 가능성 있는 과거의 기록을 찾아내는 것이다. 본 논문에서는 사용자와 로봇 사이에서 상호 작용에서 발생할 수 있는 불확실성을 과거기록의 탐색을 통해 해결하고자 하였다. 과거 기록은 시간, 장소, 대상 물건, 행동 유형으로 구분되어 저장하였으며, 각각의 유사 가능성(Possibility)들의 합을 기준으로, 전체 기록을 K-Means 알고리즘을 통하여 군집화하고 협력 필터링을 기반으로 현재의 요청이 담고 있는 불확실성에 대한 가능성 있는 값을 추천해 주었다. 제한된 공간과 제한된 자료의 수에 의한 실험 결과로서의 한계를 가지고 있지만, 실제 가정용 로봇에서의 적용 가능성을 보여주었다.
-
공급체인관리(Supply Chain Management)는 단순히 물질의 흐름관리뿐만 아니라 제품의 생산, 공급, 유통 등 다양하고 복잡한 활동들의 물질 및 정보 흐름의 통합이라고 할 수 있다. 그러므로 각 구성원간의 긴밀한 협력과 공동작업을 위해서는 원활한 정보 수집 및 응답이 요구된다. 하지만 기존 시스템은 비이동성 에이전트 개념으로 네트워크의 오버헤드나 혹은 접속 단절 상황에서 작업 수행이 불가능하여 구성원간의 정보 수집과 응답이 실제 업무 처리에 지연이 발생되므로 생산에서 판매까지의 리드타임이 길어지게 되고 채찍효과(Bullwhip Effect)가 더욱 크게 나타난다. 따라서 본 논문에서는 구성원간 협력과 공동작업을 위해 효율적으로 처리되어야 할 정보 수집 및 응답을 대상으로 하는 효율적 다중 응답을 위한 이동 에이전트 시스템을 설계한다. 제안시스템은 기존 시스템의 문제 해결을 위해 이동 에이전트와 객체 복제 메커니즘을 제시하며, 또한 각 구성원 시스템의 투명성을 위해 네이밍 서비스의 구성 방법과 등록된 구성원 시스템 객체의 객체 참조자 정보에 따라 복제된 이동 에이전트가 각 구성원 시스템으로 이주하는 이주 방식과 이주 후, 개별적인 작업 수행 결과를 해당 각 구성원 시스템에 제공하는 다중 응답 시나리오를 제시한다.
-
최근 들어 휴대성을 강조한 휴대폰이나 PDA 같은 다양한 모바일 기기의 등장으로 언제 어디서나 원하는 정보를 탐색할 수 있게 되었으나 기기는 점점 작아지는 반면, 기능은 증가하고, 많은 기기들이 데스크톱 인터페이스를 그대로 차용하여 작은 모바일 기기에는 적합하지 않은 결과를 낳고 있다. 따라서 본 연구는 청각 피드백을 이용한 공간정보 단서를 제공하여 작은 기기의 사용성을 높이는데 초점을 두고 있다. 이를 위하여, 실험 1에서는 두 가지 메뉴 구조에서 세 가지 청각 피드백의 영향을 조사하였는데, 격자메뉴와 한 줄 메뉴에서 각 청각피드백이 미치는 영향과 사용자의 선호도를 조사하였다. 실험 결과, 격자메뉴에서 수행이 좋았으나, 청각 피드백 유형별 수행 차이는 나타나지 않았고, 각 피드백에 대한 선호도에서도 차이가 나타나지 않았다. 실험 2에서는 실험 1에서 사용된 정보를 제공하는 청각적 피드백을 음 높이와 음의 개수 속성으로 세분화하여 PDA에서 메뉴 탐색 수행을 4블록으로 나누어 조사하도록 설계하였다. 실험 결과, 음 높이 속성만 갖는 피드백은 블록이 진행되면서 반응 시간에 있어서 피로도가 나타난 반면, 음 개수 속성만 갖는 피드백은 블록이 진행되어도 피로도가 나타나지 않았다. 한편, 두 속성을 모두 갖는 피드백은 블록이 진행되면서 보행 속도가 유의미하게 줄어드는 것을 발견하였다. 본 연구의 결과는 앞으로 유비쿼터스 환경에서 사용자에게 효율적인 청각 피드백을 통해 공간 정보를 제공함으로써 휴대기기의 사용성을 높일 수 있는 한 가지 가능성을 제시한다는 데 의의가 있다.
-
게임이 생활의 일부분과 산업구조상 핵심산업으로 자리하면서 그 사용빈도가 점점 증가하고 있으나 그 주 사용층이 젊은층이고 온라인 형태의 게임컨텐츠가 주를 이루면서 사용자들의 체력저하 및 개인화, 그리고 그들 가족간의 대화시간이 줄어들고 있다. 본 논문에서는 개인화되는 온라인 게임을 탈피하여 게임의 장르를 가족형 게임 (Family Game), 아웃도어 (Outdoor) 그리고 협력(Cooperation)의 개념으로 설정하고, 게임 소재를 사회적 문제점으로 떠오르고 있는 다이어트로 함으로써 새로운 시각에서 가족 구성원 모두가 게임에 참여할 수 있는 다수 참여형 인터렉티브 게임, 펀치 펀치 다이어트 (Punch Punch Diet)를 구현하였다. 본 논문에서 구현한 펀치펀치다이어트 게임은 대형스크린을 기반으로 한 가족형 게임에 관한 것으로, 컴퓨터 비전을 이용하여 게임참여자의 특정색상 및 패턴검출을 함으로써 기존의 마우스와 조이스틱등이 가지고 있던 정적인 입력인터페이스 방식을 탈피하여 게임 참여자 모두가 몸의 위치를 입력으로 이용하는 직관적 사용자 입력 인터페이스를 사용하였다. 펀치펀치 다이어트 게임은 기존 게임이 가지고 있던 "사람-(물리적 입력장치)-게임"의 관계를 "사람-(비접촉 입력장치)-게임"의 관계로 매핑한 게임으로 게임에 참여하는 사용자가 특별한 컴퓨터 입력장치 조작에 관련된 지식없이도 능동적으로 게임에 참여할 수 있도록 하였다.
-
최근 다양한 분야(건축, 디자인, 영화관)에서 활용되는 디스플레이 기술들은 대체로 평면에 투영하는 프로젝션 기술을 사용하고 있다. 예외적으로 평면이 아닌 곡면에 투영하는 경우도 있었으나, 기술적인 제약으로 왜곡된 영상을 보정하여 사용하는 경우는 드문 상태이다. 그리고 상호작용의 경우는 기계적 장치에 의존한 초보적 형태가 주류를 이루고 있다. 본 논문에서는 프로젝션 기술 중에서 원통형 곡면상으로의 투영 기법과 모션인식을 반영한 상호작용 기법에 대해서 논하고자 한다. 3D 영상을 곡면에 왜곡 없이 투영하기 위하여, 본 논문에서는 '2-pass 렌더링' 기법을 이용하였다. 이 기법에서는 현재 렌더링 된 영상을 텍스쳐로 저장한 다음 원통형 물체에 매핑시켜 곡면에 적합한 영상으로 보정한다. 그리고 기계적 장치에 의존하지 않는 상호작용을 위해, 카메라를 통하여 실시간으로 사용자 정보(위치, 방향 값)를 입력 받아 원통형 스크린과 매칭되는 좌표 값을 계산한다. 위와 같은 기법들을 구현하기 위한 실험으로 미디어 아트 작품을 제작하였으며, 투영과 상호작용에 관한 알고리즘을 작품에 적용하였다. 이 작품은 하나의 프로젝터를 사용하여 1/4 원통형 곡면으로의 투영과 상호작용을 수행하였다. 본 연구의 결과는 미디어 아트 작품의 프로젝션 모듈로 사용 될 수 있으며, 공연장 건축, 실내디자인, 체감형 인터랙티브 게임, 가상현실 영화관 등 다양한 분야에 적용 될 수 있다.
-
유비쿼터스 켬퓨팅 환경에서는 디지털 멀티미디어 컨텐츠를 사용자가 언제 어디서나 컨텐츠를 소비할 수 있도록 다양한 환경에 맞게 능동적으로 적응변환 시켜주는 기술이 필요하다. 본 논문에서는 유비쿼터스 컴퓨팅 환경이 가능하도록 구성된 가정에서 여러 종류의 디스플레이에 색각인 사용자에게 필요한 서비스와 정보를 제공해 주는 시스템을 제안한다. 단순히 세션 정보를 이용하여서 다양한 위치의 디스플레이에 정보를 제공해주는 기능에 '사용자의 취향과 색각 유무에 따라 변형되어진 정보' 를 제공해주게 되는 시스템을 설계하였다. 제안한 시스템은 크게 사람의 위치 정보를 인지하는 센서 입력부, LCD 모니터나 TV 브라운관과 같이 영상 정보를 출력해 줄 수 있는 출력부, 사용자에 대한 세션 정보 관리와 스트리밍 서비스를 제공해주는 서버 부분으로 구성되어 있다. 사용자의 위치에 대한 정보는 유비쿼터스 컴퓨팅 환경으로 구성된 테스트 베드 내부 센서를 통해 각 디스플레이의 해당 서비스 지역에 사용자가 들어가게 되면 사용자를 인지하도록 하였다. 제공되는 영상은 인지된 사용자 정보를 통해, 색각자인 경우, 색각자를 위해서 변환 되어진 영상을 사용하며, 또한 미리 설정되어진 사용자의 취향에 관련되어진 장르로 구성되어진 메뉴를 통해서 제공된다. 제안한 시스템은 가정에서 유비쿼터스 컴퓨팅이 가능하도록 한 구성한 Active Home상에 구현하였다. Active Home에서는 서버에서부터 실시간으로 사용자의 위치 정보를 제공 받으며, 사용자의 색각 유무에 따라 색각자를 위해 변환된 영상 또는 원본 영상을 보여준다. Active Home에서의 실험을 통해, 제안한 시스템은 유비쿼터스 컴퓨터 환경에서 사용자의 취향에 따라 자연스러운 인터렉션과 세션 정보를 Seamless하게 제공해주는 도구로 사용 가능함을 보였다.
-
동영상에서의 움직임 추적은 이전 프레임에서 얻어낸 정보를 이용할 수 있다는 점에서 프레임간의 연결 관계에 기반한 움직임 추적이 가능하다. 그러나 사람의 신체는 고정된 형태를 가지고 있지 않기 때문에 프레임 간의 단순한 연결 관계만으로 사람의 자세를 추정하고 움직임을 추적하는 것은 매우 어려운 문제이다. 본 논문에서는 구성요소에 기반한 인체 모델을 이용하여 이전 프레임에서 찾은 블랍들을 연속된 프레임에서 찾은 블랍들로 연결함으로써, 동영상에서 사람의 자세를 추적하는 방법을 제안한다. 주어진 모델에 따라 이전 블랍은 대응되거나, 여러 블랍으로 나뉘거나, 다른 블랍들과 결합되어 사라지거나, 새로 생성되는 등의 4 가지 경우로 나뉘어 질 수 있는데, 각 경우에 대한 처리 방안을 제안하였다. 제안된 방법은 인체들과 블랍들의 리스트 처리를 간단하게 할 뿐만 아니라, 추적의 전처리 과정으로 블랍화를 옳게 수행해야 하는 부담을 덜어주어 과도한 블랍화와 부족한 블랍화 등의 문제를 해결할 수 있다.
-
본 논문에서는 사용자의 상호작용에 대해서 끊김없이 재생하는 멀티미디어 스트리밍 기법을 제안한다. 제안하는 멀티미디어 스트리밍 기법은 기존 디코딩 버퍼와 스트림 버퍼 외에 스트림 백업 버퍼를 추가로 사용한다. 추가된 스트림 백업 버퍼는 사용자의 상호작용에 효율적으로 지원할 수 있도록 현재 재생 위치를 중심으로 기존 스트림 버퍼의 2배 크기만큼 미리 버퍼링하여 효율적인 탐색과 빠른 재생을 지원한다. 사용자가 요구하는 대부분의 탐색작용은 현재 재생 위치 근처에서 일어날 확률이 높으므로, 제안한 멀티미디어 스트리밍 기법을 이용하여 사용자 상호작용에서 거의 지연 없이 효율적으로 재생한다. 본 논문에서는 구현 환경으로 멀티미디어 스트리밍을 지원하기 위한 MS사의 MMS서버를 이용하여 멀티미디어 스트리밍을 송수신하고 기존 재생기들과 제시한 멀티미디어 스트리밍 기법을 적용한 재생기와의 성능을 비교 평가하였다. 제안한 스트리밍 기법의 적용 예로서는 원격 강의 및 네트워크 게임 등이 있다.
-
기존의 모바일 게임의 경우에는 간단한 스토리를 갖는 2D 게임이 주종을 이루었다. 그러나 이 논문에서는 PC 에서만 가능하다고 여겨지던 3D 경영 시뮬레이션 게임을 모바일에 접목해 보고자 하였다. 시공간의 제약이 없으며 간편성과 이동성을 가진 모바일 게임의 장점을 살리며 3D 게임의 현실감, 시뮬레이션 게임의 재미를 모두 가질 수 있는 게임을 제작하고자 하였다. 게임의 기본적인 줄거리에는 고구려의 역사적 사건을 넣어서 게임을 하면서 고구려의 역사를 직접 느껴보도록 하였다. 세금의 단위나 정책에 관한 내용은 고구려의 실제 역사적 내용을 따랐으며 게임의 중간 중간에 시행되는 고구려의 정책 결정 과정을 통하여 고구려 왕의 생각과 흐름을 느끼도록 하였다. 게이머는 왕을 보조하는 입장에서 고구려의 정책을 간언할 수 있으며 왕의 정책을 지지할 수도, 반대할 수도 있다. 시간의 변화에 따라 왕도 변화하며 왕족의 계도도 고구려의 수순을 따르며, 왕의 역사적인 주요 정책도 게임을 통하여 자연스럽게 적용된다. 이로써 단순한 도시 경영이 주 테마가 아닌 고구려의 역사적 배경을 자연스럽게 삽입한 게임을 제작함으로써 게임의 사실성을 높였으며 한국적인 그래픽과 음악을 삽입하여 통적인 감각을 살렸다. 전본 논문에서는 3D 경영 시뮬레이션 게임 [한고을]의 전체적인 구성과 본 게임의 알고리즘을 소개하고 있다. 본 게임 개발의 가장 큰 목적은 모바일 기반의 3D게임 개발을 통한 사실적인 게임을 제작하고 탄탄한 스토리를 가진 게임 제작이다. 그러나 역사적인 내용을 사용함으로써 부가적으로 교육적인 효과도 있었다. 이 게임개발을 계기로 하여 급속하게 성장하고 있는 모바일 컨텐츠 시장에서도 컨텐츠의 수가 아닌 질적인 증가가 이루어 졌으면 하는 바램을 가진다.
-
본 논문은 3 차원 게임 제어를 위한 인간의 동작인식에 대하여 기술하고 있다. 사용자의 편의성을 위하여 게임에 직관적으로 적용할 수 있는 인간의 동작들을 마커프리 모션 캡쳐 장비를 이용하여 취득하고, 이를 실시간으로 인식하는 동작 인식 시스템을 개발하였다. 또한, 개발된 동작인식기를 이용한 3차원 게임으로의 응용시스템의 접근 방식에 대하여 기술하고 있다. 개발된 동작 인식기는 LDA 방식에 기반을 둔 확률적 접근 방식으로 실시간으로 빠르고 정확하게 응용 시스템에 필요한 인간의 동작을 구별할 수 있도록 설계되었다. 개발된 시스템에서는 인식된 결과를 실시간으로 실제 어플리케이션에 전달하여 그 결과를 직접 사용자가 판단하여 다음 동작을 수행 할 수 있도록 되어 있다. 본 논문은, 이러한 실제 시스템의 개발을 통하여, 3 차원 인간 동작의 간단하고 유용한 활용 방법에 대한 해법을 제시하고 있다.
-
최근 놀라운 성장을 거듭하고 있는 지능형 로봇(Intelligent Robot) 기술은 기존의 주요 활용 분야였던 산업현장이나 연구실과 같은 전문가적 영역을 넘어서 지능형 엔터테인먼트(Entertainment)로봇이나 청소기 로봇의 예에서 볼 수 있듯이 인간의 주요 일상 생활 공간인 가정이나 공공기관의 서비스 분야로 점차 그 활용 영역을 넓혀가고 있다. 학습 보조 교사 도우미 로봇의 개발은 초등학교 교육 현장이 당면하고있는 각종 현안들을 로봇의 활용을 통해서 해결하고자하는 실용적인 목적에서 출발 했다. 이러한 관점에서 볼때 로봇 디자이너의 역할은 전체 개발 프로세스의 말단부에서 로봇 시스템의 외장(Appearance)을 마무리하는 역할을 넘어서 구체적 로봇시스템의 개발에 선행하여 학습보조 교사 도우미 로봇의 잠재적 활용 주체인 학생, 교사, 학부모의 입장에서 각 주체들의 내재적, 외재적 욕구를 효과적으로 만족 시킬 수있는 활용 시나리오(Application Scenario)를 도출, 개발 프로세스 전반에 걸쳐 각 개발 주체들에게 일관된 비젼(vision)과 이미지(image)를 제시하는것이라고 생각되었다. 본연구에서는 학습보조 교사 도우미 로봇 디자인 과제에 있어서 사용자 관찰(User Observation), 유저 다이어리(User Diary), 포커스그룹 인터뷰(F.G.I)등을 바탕으로 로봇의 역할 모델중심, 서비스 영역 중심, 초등학교 교육이념 구현 중심 등 3가지의 서로 다른 컨셉의 로봇 활용 시나리오(Application Scenario)를 제안하였다. 본 연구 결과는 현재 초기 단계에 있는 로봇 디자인 분야의 현실을 감안할때 전체 로봇 개발 프로세스내에서의 향후 산업 디자인이 수행해야 할 역할을 명확하게 보여준다는 점에서 그 의의가 있으며 관련 분야의 연구 활성화에 기여할 것으로 기대된다.
-
본 논문에서는 제약되지 않은 카메라에서 얻어진 회전과 크기 변화를 가진 영상들을 특징 기반의 보로노이 거리 매칭 방법을 이용하여 고속으로 합성 하는 기법에 관해 기술한다. 기존의 특징점 기반 매칭 기법들이 사람의 개입에 의해 영상을 정합하거나, 크기나 회전 변화를 고려하지 않은 형태의 영상들을 처리하는 것과 달리 회전이나 크기변화요소가 포함된 입력영상들을 사람의 개입이 없이 자동으로 정확한 중첩영역을 빠르게 검색하는 방법을 제안한다. 제안된 방법은 우선 영상내의 특징 점들의 위상 정보와 특징 점들 사이의 거리 정보를 가지는 보로노이 거리 정합법을 통해 대응점을 구하고, 찾아진 대응 쌍들을 이용하여 2차원 투영의 초기 변환행렬을 구한다. 다음으로 비선형 이승오차 최적화 알고리즘을 이용하여 최적의 변환 행렬을 구한 후, 마지막으로 구해진 변환 행렬을 이용하여 영상을 합성한다. 실험결과를 통해 본 논문에서 제안한 방법의 효율성을 보인다.
-
건물의 평면 디자인이나 도로의 디자인과 같은, 보행자를 고려해야 하는 디자인 혹은 그와 유사한 문제의 최적화를 위해서 군중 시뮬레이션이 필요한 경우가 있다. 이때 보행자 에이전트에 대한 모델이 필요하며 에이전트 디자인을 얼마나 신중하게 하느냐가 군중시뮬레이션의 결과에 많은 영향을 미친다. 기존의 보행자 모델은 에이전트로 하여금 이성적 행동을 하도록 하는 데에 초점이 맞추어져 있었다. 하지만 사람은 심리경향을 갖고 있으며, 이를 고려한 보행자 모델은 좀 더 현실과 가까운 군중 시뮬레이션이 가능하도록 해 준다. 본 논문에서는 MBTI(Myers-Briggs Type Indicator)의 척도 중 하나인 외향과 내향 척도를 기존의 보행자 모델에 적용시켰다. 외향과 내향을 하나의 변수로 보고 그에 따른 행동 패턴의 결정에 대한 함수를 만들었다. 그리고 이 모델을 사용하여 2 차원의 군중시뮬레이션을 해 보았다. 이 시뮬레이션은 출구를 가지고 있는 평면구조를 사용하여 위급한 상황일 때를 가정하여 에이전트들이 출구로 빠져나가도록 하는 것이다.
-
대용량의 네트워크 인프라가 확대되고, 네트워크를 통한 DV, HD 급의 고화질 비디오 전송이 보편화 되면서, 고화질의 비디오에 몰입감, 현실감을 증진시키기 위한 스테레오 HD 비디오 전송이 가능하게 되었다. 본 논문은 IP 네트워크를 통해서 스테레오 HD 비디오 전송을 가능하게 해주는 소프트웨어 기반의 HD 비디오 전송 시스템에서 효과적으로 몰입감과 입체감을 제공하기 위해 충족되어야 하는 좌우 영상의 동기화에 필요한 요소들을 다룬다. 제안된 동기화 기법은 수신 측에서 최종적으로 동기화된 좌우 영상을 통해 스테레오 HD 비디오를 얻기 위해서 좌우 카메라로부터 영상의 획득 시, 획득된 영상의 네트워크 전송 시, 또 수신된 영상의 재생 시 좌우 영상의 동기화한다. 결과적으로 동기화 된 좌우 영상을 통하여 몰입감과 현실감을 가지는 스트레오 HD 비디오를 실시간으로 감상할 수 있다.
-
전자우편이나 문자 메세지를 이용할 때 겪는 불편함 중 하나는 상대방이나 기계에 정서 정보를 전달하기 어렵다는 점이다. 정서 정보를 메시지에 싣기 위해서는 컴퓨터나 디지털 기기가 정서를 인식하거나 사용자가 정서를 입력해야 한다. 기존의 정서 인식 방법은 생리적, 신체적 측정치를 이용하는 것인데, 이 경우 측정을 위한 별도의 장비가 필요하고 현재 자신의 정서 상태와 다른 정서를 표현할 수 없다는 단점이 있다. 특히 소형 모바일 기기를 이용할 때 다른 측정 장치를 사용하는 것은 더욱 어렵다. 이런 문제를 해결하기 위해 모바일 기기를 사용하는 환경에서 사용자가 원하는 정서를 기계에 입력하기 위해 동작을 이용하려는 연구가 진행되었다(Fargerberg, Stahl, & Hook, 2003). 본 연구에서는 Laban Movement Analysis에서 동작을 구성하는 다섯 요소 중 노력(effort)과 모양(shape) 요소를 재구성하여, 방향성 차원, 무게감 차원, 시간감 차원으로 동작을 구분하고 총 20개의 동작을 선정하였다. 또한 한덕웅과 강혜자(2000)가 수집한 834개 정서 어휘를 평정하여 동작을 통해 표현하고 전달되기 쉬운 정서 어휘 50개를 선택하였다. 최종 실험에서 참가자들은 20개의 동작에 대해 50개의 정서 어휘를 평정하고 데이터는 범주형 주성분분석을 이용하여 분석하였다. 분석 결과 Russell(1980)의 이차원 정서 구조 모형에서 각성 수준 차원은 동작의 무게감과 시간감 차원과 관련이 있는 것으로 나타났다. 강하고 빠른 동작일수록 각성 수준이 높은 정서가 나타났다. 또한 동작의 방향성 차원은 정서의 종류와 관련이 있는 것으로 드러났다. 직선 움직임은 높은 각성 수준의 부정적 정서와, 흔듦 움직임은 불안 및 초조와, 원형 움직임은 즐거운 정서와 관련이 있는 것으로 나타났다. 이는 동작을 통하여 정서 정보를 효과적으로 전달할 수 있음을 보여주었고, 동작과 정서를 연관 짓기 위해 방향성 차원과 무게감 차원 그리고 시간감 차원을 고려할 필요가 있음을 시사한다.
-
본 논문에서는 SVM (Support Vector Machine)을 기반으로 하여 인체의 뇌 하부구조인 해마에 대한 지능적 형상분석 방법을 제공한다. 일반적으로 의료 영상으로부터 해마의 형상 분석을 하기 위해서는 충분한 임상 데이터를 필요로 한다. 하지만 현실적으로 많은 양의 표본들을 얻는 것이 쉽지 않기 때문에 전문가의 지식을 기반으로 한 작업이 수반되어야 한다. 결국 이러한 요소들이 분석 작업을 어렵게 한다. 의학 기술이 복잡해 지면서 최근의 형상 분석 연구는 점차 통계적 모델을 기반으로 진행되고 있다. 본 연구에서는 해마로부터 고해상도의 매개변수형 모델을 만들어 형상 표현으로 이용하고, 집단간 분류 작업에 SVM 알고리즘을 적용하는 지능적 분석 방법을 구현한다. 우선 메쉬 데이터로부터 물리변형모델 기반의 매개변수 모델을 구축하고, PDM (point distribution model) 방법을 적용하여 두 집단을 대표하는 평균 모델을 생성한다. 마지막으로 SVM 기반의 이진 분류기를 구축하여 집단간 분류 작업을 수행한다. 구현한 모델링 방법과 분류기의 성능을 평가하기 위하여 본 연구에서는 네 가지 커널 함수 (linear, radial basis function, polynomial, sigmoid)들을 적용한다. 본 논문에서 제시한 매개변수형 모델은 다양한 형태의 의료 데이터로부터 보편적인 3차원 모델을 생성하고, 또한 모델의 전역적, 국부적인 특징들을 복합적으로 표현할 수 있기 때문에 통계적 형상분석에 적합하다. 그리고 SVM 기반의 분류기는 적은 수의 학습 데이터로부터 정상인 해마 집단과 간질 환자 집단간의 정확한 분류를 가능하게 한다.
-
정서를 측정하고 나타내는 기술이 발전에 따라 문화적 보편성을 가진 얼굴표정 연구의 필요성이 증가하고 있다. 그리고 지금까지의 많은 얼굴 표정 연구들은 정적인 얼굴사진 위주로 이루어졌다. 그러나 실제 사람들은 단적인 얼굴표정만으로 정서를 인식하기 보다는 미묘한 표정의 변화나 얼굴근육의 움직임 등을 통해 정서상태를 추론한다. 본 연구는 동적인 얼굴표정이 정적인 얼굴표정 보다 정서상태 전달에서 더 큰 효과를 가짐을 밝히고, 동적인 얼굴 표정에서의 눈과 입의 정서인식 효과를 비교해 보고자 하였다. 이에 따라 15 개의 형용사 어휘에 맞는 얼굴 표정을 얼굴전체, 눈, 입의 세 수준으로 나누어 동영상과 스틸사진으로 제시하였다. 정서 판단의 정확성을 측정한 결과, 세 수준 모두에서 동영상의 정서인식 효과가 스틸사진 보다 유의미하게 높게 나타나 동적인 얼굴 표정이 더 많은 내적정보를 보여주는 것을 알 수 있었다. 또한 얼굴전체-눈-입 순서로 정서인식 효과의 차이가 유의미하게 나타났으며, 부정적 정서는 눈에서 더 잘 나타나고 긍정적 정서는 입에서 더 잘 나타났다. 따라서 눈과 입에 따른 정서인식이 정서의 긍정성-부정성 차원에 따라 달라짐을 볼 수 있었다.