• 제목/요약/키워드: 사람 데모

검색결과 12건 처리시간 0.027초

휴먼형 로봇 손의 사물 조작 수행을 이용한 사람 데모 결합 강화학습 정책 성능 평가 (Evaluation of Human Demonstration Augmented Deep Reinforcement Learning Policies via Object Manipulation with an Anthropomorphic Robot Hand)

  • 박나현;오지헌;류가현;;;김태성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권5호
    • /
    • pp.179-186
    • /
    • 2021
  • 로봇이 사람과 같이 다양하고 복잡한 사물 조작을 하기 위해서는 휴먼형 로봇 손의 사물 파지 작업이 필수적이다. 자유도 (Degree of Freedom, DoF)가 높은 휴먼형(anthropomorphic) 로봇 손을 학습시키기 위하여 사람 데모(human demonstration)가 결합한 강화학습 최적화 방법이 제안되었다. 본 연구에서는 강화학습 최적화 방법에 사람 데모가 결합한 Demonstration Augmented Natural Policy Gradient (DA-NPG)와 NPG의 성능 비교를 통하여 행동 복제의 효율성을 확인하고, DA-NPG, DA-Trust Region Policy Optimization (DA-TRPO), DA-Proximal Policy Optimization (DA-PPO)의 최적화 방법의 성능 평가를 위하여 6 종의 물체에 대한 휴먼형 로봇 손의 사물 조작 작업을 수행한다. 학습 후 DA-NPG와 NPG를 비교한 결과, NPG의 물체 파지 성공률은 평균 60%, DA-NPG는 평균 99.33%로, 휴먼형 로봇 손의 사물 조작 강화학습에 행동 복제가 효율적임을 증명하였다. 또한, DA-NPG는 DA-TRPO와 유사한 성능을 보이면서 모든 물체에 대한 사물 파지에 성공하였고 가장 안정적이었다. 반면, DA-TRPO와 DA-PPO는 사물 조작에 실패한 물체가 존재하여 불안정한 성능을 보였다. 본 연구에서 제안하는 방법은 향후 실제 휴먼형 로봇에 적용하여 휴먼형 로봇 손의 사물 조작 지능 개발에 유용할 것으로 전망된다.

Picircle - 새로운 이미지뷰어인터페이스디자인 제안 (Picircle - New Image Viewer Interface Design)

  • 한윤정
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.83-88
    • /
    • 2006
  • 우리가 사용하는 이미지뷰어프로그램은 정보전달에만 치중되어 있고 감성적인 부분이 차지하는 바가 적다. 또한 사람들에게 디지털카메라로 찍은 사진들을 보는 것은 많은 과정을 필요로 하고 큰 노력을 요한다. 게다가 다른 사용자들과 즉각적으로 공유하기도 힘들다. 이 같은 문제점들을 해결하는 새로운 이미지뷰어인터페이스를 제안해본다. 기존의 이미지뷰어프로그램들을 분석하고 그에 대한 결과와 문제점을 찾은 후 새로운 디자인 키워드를 제시하였다. 단순함(Simplicity), 즉각성(Instancy), 공유(Sharing), 감성(Sensitivity) 이렇게 네 가지 키워드이다. 사진(Picture)은 이미 지나간 과거이다. 이러한 사진의 시간개념을 Timeline 에 적용하고, 이를 원(Circle)이라는 모양으로 나타내어 사진을 볼 수 있게 하였다. 원이라는 새로운 형태의 인터페이스는 사진을 보다 쉽고 즉각적으로 공유할 수 있다. 데모버젼으로서 매크로미디어 플래시 액션스크립트로 프로그램을 하고 파워메이트(Powermate)를 장치(Device)로 사용하여 시연하였다. 이 인터페이스는 사람들이 쉽게 접할 수 있는 장소면 아무 곳이나 설치가 가능하다. 카페나 회의장소에서 가장 적합하게 어울릴 것이다. 사용자는 다른 이들과 함께 즉각적으로 간단한 방법으로 함께 감성을 나눌 수 있다. 새로운 인터페이스디자인이 사람들에게 쉽게 인지되어, 보다 편리하게 이미지를 확인할 수 있는 가능성을 제시한다.

  • PDF

휴먼형 로봇 손의 사물 조작 수행을 이용한 인간 행동 복제 강화학습 정책 최적화 방법 성능 평가 (Evaluation of Human Demonstration Augmented Deep Reinforcement Learning Policy Optimization Methods Using Object Manipulation with an Anthropomorphic Robot Hand)

  • 박나현;오지헌;류가현;;;원다슬;정진균;장윤정;김태성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.858-861
    • /
    • 2020
  • 로봇이 사람과 같이 다양하고 복잡한 사물 조작을 하기 위해서 휴먼형 로봇손의 사물 파지 작업이 필수적이다. 자유도 (Degree of Freedom, DoF)가 높은 휴먼형(anthropomorphic) 로봇손을 학습시키기 위하여 사람 데모(human demonstration)가 결합된 강화학습 최적화 방법이 제안되었다. 본 연구에서는 강화학습 최적화 방법에 사람 데모가 결합된 Demonstration Augmented Natural Policy Gradient(DA-NPG)와 NPG 의 성능 비교를 통하여 행동 복제의 효율성을 확인하고, DA-NPG, DA-Trust Region Policy Optimization (DA-TRPO), DA-Proximal Policy Optimization (DA-PPO)의 최적화 방법의 성능 평가를 위하여 6 종의 물체에 대한 휴먼형 로봇손의 사물 조작 작업을 수행한다. 그 결과, DA-NPG 와 NPG를 비교한 결과를 통해 휴먼형 로봇손의 사물 조작 강화학습에 행동 복제가 효율적임을 증명하였다. 또한, DA-NPG 는 DA-TRPO 와 유사한 성능을 보이면서 모든 물체에 대한 사물 파지에 성공하여 가장 안정적이었다. 반면, DA-TRPO 와 DA-PPO 는 사물 조작에 실패한 물체가 존재하여 불안정한 성능을 보였다. 본 연구에서 제안하는 방법은 향후 실제 휴먼형 로봇에 적용하여 휴먼형 로봇 손의 사물조작 지능 개발에 유용할 것으로 전망된다.

산업경쟁력을 위한 드론과의 쉬운 상호작용 기술

  • 조광수
    • 광학세계
    • /
    • 통권158호
    • /
    • pp.55-57
    • /
    • 2015
  • 여기저기서 드론이 뜨고 있다. 아마존이 날아오른 드론으로 고객의 문 앞까지 배달하는 모습은 일대 장관이었다. 이제 웬만한 방송에서 하늘 높이 오른 드론으로 내려다본 모습을 전송하는 것은 그저 일상일 뿐이다. 뿐만 아니라, 사람이 직접 닿을 수 없는 곳에서 드론으로 사람을 찾는다거나, 드론을 통해 고층건물의 안전도를 검사한다거나, 정찰을 하는 등 다양한 활용도가 돋보인다. 라스베가스의 세계가전전시회(CES)에서 바르셀로나의 모바일월드콩그레스(MWC)에서 그리고 뉴욕의 장난감전시회 에서도 드론은 스타로 부상했다. 이제 드론은 대중화와 상업적 성공의 기로에 서 있다. 이를 위해서는 기계적 성능이상으로 중요한 것이 드론과 사용자간의 상호작용을 통해 이루어내는 사용자 경험이다. 즉 드론을 얼마나 쉽고 편하고 정확하고 안전하게 조종할 수 있도록 만드는가가 차별화와 경쟁력의 시작이다. 만약 드론이 지금처럼 조종하기 어렵고 심지어 인명과 재산을 위협한다고 인식되면 산업적 잠재성은 그저 한여름 밤의 꿈으로 사그러들 수밖에 없다. 몇 가지 사례를 보자. 지난 2월 미국 Fox TV 생방송에서 Popular Science 잡지 편집장 Dave Mosher는 드론의 안전성에 관해서 말하고 있었다. 그 때 데모를 위해 날던 드론이 갑자기 균형을 잃으면서 추락하였다. 이 사고로 인해 드론이 안전하지 않을 수 있다는 인식이 퍼지게 되었다. 경미한 사고지만 심각한 위협감을 일으키기도 한다. 레이더에 탐지되지 않던 드론이 미국 백악관 앞마당에 추락한 것이 그런 예이다. 어떤 사용자는 재미삼아 드론을 구름 위까지 날려 보냈다. 그러더니 드론이 제어력을 상실하였고, 결국 추락하고 말았다. 다행히도 누군가의 머리 위로 떨어지지는 않았다.

  • PDF

다국어 대화체 음성언어번역 시스템을 위한 IF(interchange format )와 IF 태깅 (IF(interchange format) and IF tagging for the Multilingual Spoken Language Translation System)

  • 최운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.409-412
    • /
    • 1998
  • 미국의 카네기 메론 대학과 일본의 ATR 및 한국의 전자통신연구원 등이 가입한 CSTAR 에서는 99년 국제간 음성언어번역 시스템 데모를 위해 IF를 이용하여 데이터를 주고 받기로 합의하였다. IF는 크게는 인터넷을 통해 다른 나라의 음성언어번역 시스템과 연결하여 데이터를 주고 받는데 사용되고, 작게는 음성언어 번역 시스템 내의 해석 시스템과 생성 시스템 사이에 데이터를 주고 받는데 사용된다. IF는 중간언어 표현의 한 가지 방법으로 간단하면서도 단순한 표현으로 특정 영역 내에 나타나는 이미를 표현할 수 있도록 정의되었다. 대상으로 하는 영역은 여행 안내로 호텔 예약, 비행기 예약, 여행지 안내 및예약 등을 포함하고 있다. IF의 가장 큰 특징은 표현방법의 단순화에 있다. 즉, 의미를 가장 잘 나타낼 수 있는 표현을 골라, IF를 정의하여 언어 종속적인 요소를 가능한 배제하였다. IF 태깅은 발화에 대해 적절한 IF를 붙여 주는 일로 태깅을 수행하는 사람은 IF 태깅 요령에 따라 태깅을 수행하여야 한다. 현재 ETRI에서는 200대화 이상의 한국어 데이터에 대해 IF 태깅을 완료하였으며 해석 시스템과 생성 시스템 개발을 계속하고 있다.

  • PDF

기계 독해를 이용한 웹 기반 오픈 도메인 한국어 질의응답 (Web-Scale Open Domain Korean Question Answering with Machine Reading Comprehension)

  • 최동현;김응균;신동렬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.87-92
    • /
    • 2019
  • 본 논문에서는 기계 독해를 이용한 웹 기반 오픈 도메인 한국어 질의응답 시스템에 대하여 서술한다. 하나의 사용자 질의에 대하여, 본 논문에서 제안된 시스템은 기 존재하는 검색 엔진을 이용하여 실시간으로 최대 1,500 개의 문서를 기계 독해 방식으로 분석하고, 각 문서별로 얻어진 답을 종합함으로써 최종 답변을 도출한다. 실험 결과, 제안된 시스템은 평균적으로 2초 이내의 실행 시간을 보였으며, 사람과 비교하여 86%의 성능을 나타내었다. 본 논문에서 제안된 시스템의 데모는 http://nlp-api.kakao.com에서 확인 가능하다.

  • PDF

HMD 기반 중강현실 응용을 위한 인터페이스 (Interface for HMD based AR Applications)

  • 안상철;이경준;김형곤
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제13권2호
    • /
    • pp.39-46
    • /
    • 2007
  • 본 논문에서는 HMD 기반의 증강현실(Augmented Reality) 응용을 위한 인터페이스로 핸드폰이나 PDA 등의 모바일 장치를 사용하는 것을 제안한다. 최근 모바일 장치는 사람들 대부분이 가지고 있고, 이를 가지고 영화를 보고 인터넷을 하는 등 생활의 필수품으로 자리 잡아 가고 있어서 사용자에게 익숙한 인터페이스 기기이다. 또한, 기술의 발전으로 모바일 장치의 성능이 높아지고 있으며 프로그래밍도 가능하여 사용자에게 익숙한 인터페이스 장치로 사용하기에 적합하다. 더욱이 모바일 장치의 화면은 다양한 마커의 디스플레이를 통하여 가변 마커의 효과를 낼 수 있기 때문에 다양한 증강현실이 가능하여 모바일 장치는 사용자에게 익숙한 증강현실 인터페이스로 적합하다. 본 논문에서는 모바일 장치를 HMD 기반의 증강현실 인터페이스로 구성하는 방법을 제안하고 데모를 통해 이의 효용성을 보인다.

  • PDF

저해상도 손 제스처 영상 인식에 대한 연구 (A Study on Hand Gesture Recognition with Low-Resolution Hand Images)

  • 안정호
    • 한국위성정보통신학회논문지
    • /
    • 제9권1호
    • /
    • pp.57-64
    • /
    • 2014
  • 최근 물리적 디바이스의 도움 없이 사람이 시스템과 인터랙션 할 수 있는 인간 친화적인 인간-기계 인터페이스가 많이 연구되고 있다. 이중 대표적인 것이 본 논문의 주제인 비전기반 제스처인식이다. 본 논문에서 우리는 설정된 가상세계의 객체와의 인터랙션을 위한 손 제스처들을 정의하고 이들을 인식할 수 있는 효과적인 방법론을 제안한다. 먼저, 웹캠으로 촬영된 저해상도 영상에서 사용자의 양손을 검출 및 추적하고, 손 영역을 분할하여 손 실루엣을 추출한다. 우리는 손 검출을 위해, RGB 공간에서 명암에 따라 두개의 타원형 모델을 이용하여 피부색을 모델링하였으며, 블랍매칭(blob matching) 방법을 이용하여 손 추적을 수행하였다. 우리는 플러드필(floodfill) 알고리즘을 이용해 얻은 손 실루엣의 행/열 모드 검출 및 분석을 통해 Thumb-Up, Palm, Cross 등 세 개의 손모양을 인식하였다. 그리고 인식된 손 모양과 손 움직임의 콘텍스트를 분석해서 다섯 가지 제스처를 인식할 수 있었다. 제안하는 제스처인식 방법론은 정확한 손 검출을 위해 카메라 앞에 주요 사용자가 한 명 등장한다는 가정을 하고 있으며 많은 실시간 데모를 통해 효율성 및 정확성이 입증되었다.

LINK 블록체인을 적용한 차량용 블랙박스 시스템 (Vehicle black box system with LINK blockchain)

  • 안규황;원태연;박상민;장경배;서화정
    • 한국정보통신학회논문지
    • /
    • 제23권8호
    • /
    • pp.1018-1023
    • /
    • 2019
  • 2010년도를 기점으로 차량용 블랙박스는 많은 사람들에게 보급되었음에도 불구하고 차량 사고 현장 기록물이 존재 하지 않거나 가해자가 고의적으로 영상 데이터를 삭제할 경우 피해자가 속출한다. 블록체인의 가장 큰 장점은 데이터 분산 저장으로 데이터 수정 및 삭제가 불가능하다는 점이며, 가장 큰 단점은 민감한 데이터 역시 분산 저장 된다는 점이다. 본 논문은 해당 장점을 이용해 블랙박스에 블록체인을 도입하여 공유 된 영상 데이터로 사고를 입증하며, 블록체인과 private 서버를 연동하여 기존에 블록체인에 저장되는 민감 정보를 private 서버에 저장하여 블록체인의 단점인 개인정보유출 문제를 해결하고자 한다. 또한 LINK 블록체인과 private 서버를 연동하는 코드(깃허브)와 데모영상(유튜브)을 본 논문에 첨부하였다.

박물관 넘어 도망친 화가들 (Painters who Climbed Out the Museum and Disappeared)

  • 김현지;송지언;여화선;강제원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.358-360
    • /
    • 2020
  • 본 팀은 웹캠으로 촬영한 영상에서 원하는 물체를 선택하여 텍스처를 선택한 이미지의 스타일로 변환하는 프로젝트를 수행했다. 영상을 세그멘테이션하고 원하는 물체만을 원하는 텍스처로 변환하여 최종 아웃풋을 얻는다. 제안하는 네트워크는 물체를 다양한 스타일로 바꾸는 것이 가능한데, 이 중에서 이미지에 명화의 화풍을 입히는 것을 중점으로 하여 데모를 구현했다. 빠른 속도로 네트워크를 실행하기 위해 기존 연구들에 비디오 처리의 관점을 접목했다. 여러 프레임을 묶어 옵티컬 플로우를 생성하고, 첫 번째 프레임을 인스턴스 세그멘테이션한 후 마스크를 추출했다. 이후 마스크 영역만 뽑아낸 이미지를 새로운 입력으로 하여 스타일 트랜스퍼를 거치고, 이 첫번째 프레임과 나머지 프레임들의 옵티컬 플로우로 나머지 프레임들의 세그멘테이션과 스타일 트랜스퍼를 예측하여 다시 비디오 프레임으로 만들어 주었다. 본 알고리즘은 옵티컬 플로우 설정으로 네트워크의 계산량을 줄이며 속도를 개선했다. 빠른 데이터 처리로 사용자가 원하는 물체의 텍스쳐가 바뀔 수 있게 되었고, 이는 현실 세계가 실제로 바뀐 듯한 느낌을 들게 한다. 또한, 컴퓨터 비전에서 활발하게 연구되었던 분야를 AR로 끌어와 두 분야의 융합 가능성을 열었다. 현재 코로나의 영향으로 집에서 취미생활을 즐기는 인구가 많아졌다. 본 연구를 통해 많은 사람에게 집에서 쉽게 명화의 감성을 즐기고 느낄 수 있는 양질의 콘텐츠를 제공해주려 한다. 또한, 박물관과 미술관 등의 기관에서도 이 기술이 활용될 수 있다. 명화를 느낄 수 있는 다양한 콘텐츠를 이용하여 박물관이나 미술관의 홍보 효과도 기대할 수 있다.

  • PDF