• Title/Summary/Keyword: 사람 데모

Search Result 12, Processing Time 0.032 seconds

Evaluation of Human Demonstration Augmented Deep Reinforcement Learning Policies via Object Manipulation with an Anthropomorphic Robot Hand (휴먼형 로봇 손의 사물 조작 수행을 이용한 사람 데모 결합 강화학습 정책 성능 평가)

  • Park, Na Hyeon;Oh, Ji Heon;Ryu, Ga Hyun;Lopez, Patricio Rivera;Anazco, Edwin Valarezo;Kim, Tae Seong
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.10 no.5
    • /
    • pp.179-186
    • /
    • 2021
  • Manipulation of complex objects with an anthropomorphic robot hand like a human hand is a challenge in the human-centric environment. In order to train the anthropomorphic robot hand which has a high degree of freedom (DoF), human demonstration augmented deep reinforcement learning policy optimization methods have been proposed. In this work, we first demonstrate augmentation of human demonstration in deep reinforcement learning (DRL) is effective for object manipulation by comparing the performance of the augmentation-free Natural Policy Gradient (NPG) and Demonstration Augmented NPG (DA-NPG). Then three DRL policy optimization methods, namely NPG, Trust Region Policy Optimization (TRPO), and Proximal Policy Optimization (PPO), have been evaluated with DA (i.e., DA-NPG, DA-TRPO, and DA-PPO) and without DA by manipulating six objects such as apple, banana, bottle, light bulb, camera, and hammer. The results show that DA-NPG achieved the average success rate of 99.33% whereas NPG only achieved 60%. In addition, DA-NPG succeeded grasping all six objects while DA-TRPO and DA-PPO failed to grasp some objects and showed unstable performances.

Picircle - New Image Viewer Interface Design (Picircle - 새로운 이미지뷰어인터페이스디자인 제안)

  • Han, Yoon-Jeong
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02b
    • /
    • pp.83-88
    • /
    • 2006
  • 우리가 사용하는 이미지뷰어프로그램은 정보전달에만 치중되어 있고 감성적인 부분이 차지하는 바가 적다. 또한 사람들에게 디지털카메라로 찍은 사진들을 보는 것은 많은 과정을 필요로 하고 큰 노력을 요한다. 게다가 다른 사용자들과 즉각적으로 공유하기도 힘들다. 이 같은 문제점들을 해결하는 새로운 이미지뷰어인터페이스를 제안해본다. 기존의 이미지뷰어프로그램들을 분석하고 그에 대한 결과와 문제점을 찾은 후 새로운 디자인 키워드를 제시하였다. 단순함(Simplicity), 즉각성(Instancy), 공유(Sharing), 감성(Sensitivity) 이렇게 네 가지 키워드이다. 사진(Picture)은 이미 지나간 과거이다. 이러한 사진의 시간개념을 Timeline 에 적용하고, 이를 원(Circle)이라는 모양으로 나타내어 사진을 볼 수 있게 하였다. 원이라는 새로운 형태의 인터페이스는 사진을 보다 쉽고 즉각적으로 공유할 수 있다. 데모버젼으로서 매크로미디어 플래시 액션스크립트로 프로그램을 하고 파워메이트(Powermate)를 장치(Device)로 사용하여 시연하였다. 이 인터페이스는 사람들이 쉽게 접할 수 있는 장소면 아무 곳이나 설치가 가능하다. 카페나 회의장소에서 가장 적합하게 어울릴 것이다. 사용자는 다른 이들과 함께 즉각적으로 간단한 방법으로 함께 감성을 나눌 수 있다. 새로운 인터페이스디자인이 사람들에게 쉽게 인지되어, 보다 편리하게 이미지를 확인할 수 있는 가능성을 제시한다.

  • PDF

Evaluation of Human Demonstration Augmented Deep Reinforcement Learning Policy Optimization Methods Using Object Manipulation with an Anthropomorphic Robot Hand (휴먼형 로봇 손의 사물 조작 수행을 이용한 인간 행동 복제 강화학습 정책 최적화 방법 성능 평가)

  • Park, Na Hyeon;Oh, Ji Heon;Ryu, Ga Hyun;Anazco, Edwin Valarezo;Lopez, Patricio Rivera;Won, Da Seul;Jeong, Jin Gyun;Chang, Yun Jung;Kim, Tae-Seong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.858-861
    • /
    • 2020
  • 로봇이 사람과 같이 다양하고 복잡한 사물 조작을 하기 위해서 휴먼형 로봇손의 사물 파지 작업이 필수적이다. 자유도 (Degree of Freedom, DoF)가 높은 휴먼형(anthropomorphic) 로봇손을 학습시키기 위하여 사람 데모(human demonstration)가 결합된 강화학습 최적화 방법이 제안되었다. 본 연구에서는 강화학습 최적화 방법에 사람 데모가 결합된 Demonstration Augmented Natural Policy Gradient(DA-NPG)와 NPG 의 성능 비교를 통하여 행동 복제의 효율성을 확인하고, DA-NPG, DA-Trust Region Policy Optimization (DA-TRPO), DA-Proximal Policy Optimization (DA-PPO)의 최적화 방법의 성능 평가를 위하여 6 종의 물체에 대한 휴먼형 로봇손의 사물 조작 작업을 수행한다. 그 결과, DA-NPG 와 NPG를 비교한 결과를 통해 휴먼형 로봇손의 사물 조작 강화학습에 행동 복제가 효율적임을 증명하였다. 또한, DA-NPG 는 DA-TRPO 와 유사한 성능을 보이면서 모든 물체에 대한 사물 파지에 성공하여 가장 안정적이었다. 반면, DA-TRPO 와 DA-PPO 는 사물 조작에 실패한 물체가 존재하여 불안정한 성능을 보였다. 본 연구에서 제안하는 방법은 향후 실제 휴먼형 로봇에 적용하여 휴먼형 로봇 손의 사물조작 지능 개발에 유용할 것으로 전망된다.

산업경쟁력을 위한 드론과의 쉬운 상호작용 기술

  • Jo, Gwang-Su
    • The Optical Journal
    • /
    • s.158
    • /
    • pp.55-57
    • /
    • 2015
  • 여기저기서 드론이 뜨고 있다. 아마존이 날아오른 드론으로 고객의 문 앞까지 배달하는 모습은 일대 장관이었다. 이제 웬만한 방송에서 하늘 높이 오른 드론으로 내려다본 모습을 전송하는 것은 그저 일상일 뿐이다. 뿐만 아니라, 사람이 직접 닿을 수 없는 곳에서 드론으로 사람을 찾는다거나, 드론을 통해 고층건물의 안전도를 검사한다거나, 정찰을 하는 등 다양한 활용도가 돋보인다. 라스베가스의 세계가전전시회(CES)에서 바르셀로나의 모바일월드콩그레스(MWC)에서 그리고 뉴욕의 장난감전시회 에서도 드론은 스타로 부상했다. 이제 드론은 대중화와 상업적 성공의 기로에 서 있다. 이를 위해서는 기계적 성능이상으로 중요한 것이 드론과 사용자간의 상호작용을 통해 이루어내는 사용자 경험이다. 즉 드론을 얼마나 쉽고 편하고 정확하고 안전하게 조종할 수 있도록 만드는가가 차별화와 경쟁력의 시작이다. 만약 드론이 지금처럼 조종하기 어렵고 심지어 인명과 재산을 위협한다고 인식되면 산업적 잠재성은 그저 한여름 밤의 꿈으로 사그러들 수밖에 없다. 몇 가지 사례를 보자. 지난 2월 미국 Fox TV 생방송에서 Popular Science 잡지 편집장 Dave Mosher는 드론의 안전성에 관해서 말하고 있었다. 그 때 데모를 위해 날던 드론이 갑자기 균형을 잃으면서 추락하였다. 이 사고로 인해 드론이 안전하지 않을 수 있다는 인식이 퍼지게 되었다. 경미한 사고지만 심각한 위협감을 일으키기도 한다. 레이더에 탐지되지 않던 드론이 미국 백악관 앞마당에 추락한 것이 그런 예이다. 어떤 사용자는 재미삼아 드론을 구름 위까지 날려 보냈다. 그러더니 드론이 제어력을 상실하였고, 결국 추락하고 말았다. 다행히도 누군가의 머리 위로 떨어지지는 않았다.

  • PDF

IF(interchange format) and IF tagging for the Multilingual Spoken Language Translation System (다국어 대화체 음성언어번역 시스템을 위한 IF(interchange format )와 IF 태깅)

  • 최운천
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.409-412
    • /
    • 1998
  • 미국의 카네기 메론 대학과 일본의 ATR 및 한국의 전자통신연구원 등이 가입한 CSTAR 에서는 99년 국제간 음성언어번역 시스템 데모를 위해 IF를 이용하여 데이터를 주고 받기로 합의하였다. IF는 크게는 인터넷을 통해 다른 나라의 음성언어번역 시스템과 연결하여 데이터를 주고 받는데 사용되고, 작게는 음성언어 번역 시스템 내의 해석 시스템과 생성 시스템 사이에 데이터를 주고 받는데 사용된다. IF는 중간언어 표현의 한 가지 방법으로 간단하면서도 단순한 표현으로 특정 영역 내에 나타나는 이미를 표현할 수 있도록 정의되었다. 대상으로 하는 영역은 여행 안내로 호텔 예약, 비행기 예약, 여행지 안내 및예약 등을 포함하고 있다. IF의 가장 큰 특징은 표현방법의 단순화에 있다. 즉, 의미를 가장 잘 나타낼 수 있는 표현을 골라, IF를 정의하여 언어 종속적인 요소를 가능한 배제하였다. IF 태깅은 발화에 대해 적절한 IF를 붙여 주는 일로 태깅을 수행하는 사람은 IF 태깅 요령에 따라 태깅을 수행하여야 한다. 현재 ETRI에서는 200대화 이상의 한국어 데이터에 대해 IF 태깅을 완료하였으며 해석 시스템과 생성 시스템 개발을 계속하고 있다.

  • PDF

Web-Scale Open Domain Korean Question Answering with Machine Reading Comprehension (기계 독해를 이용한 웹 기반 오픈 도메인 한국어 질의응답)

  • Choi, DongHyun;Kim, EungGyun;Shin, Dong Ryeol
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.87-92
    • /
    • 2019
  • 본 논문에서는 기계 독해를 이용한 웹 기반 오픈 도메인 한국어 질의응답 시스템에 대하여 서술한다. 하나의 사용자 질의에 대하여, 본 논문에서 제안된 시스템은 기 존재하는 검색 엔진을 이용하여 실시간으로 최대 1,500 개의 문서를 기계 독해 방식으로 분석하고, 각 문서별로 얻어진 답을 종합함으로써 최종 답변을 도출한다. 실험 결과, 제안된 시스템은 평균적으로 2초 이내의 실행 시간을 보였으며, 사람과 비교하여 86%의 성능을 나타내었다. 본 논문에서 제안된 시스템의 데모는 http://nlp-api.kakao.com에서 확인 가능하다.

  • PDF

Interface for HMD based AR Applications (HMD 기반 중강현실 응용을 위한 인터페이스)

  • Ahn, Sang-Chul;Lee, Kyong-Joon;Kim, Hyoung-Gon
    • Journal of the Korea Computer Graphics Society
    • /
    • v.13 no.2
    • /
    • pp.39-46
    • /
    • 2007
  • In this paper, we propose that we can use our mobile devices as an effective interface for HMD-based augmented reality(AR) applications. Recently most People have mobile devices, with which they usually watch movies and connect internet So, people get accustomed to the mobile devices. In addition, the mobile devices can show various markers on their displays so that we can implement various AR applications. So, the mobile devices are quite good interface for AR applications. In the paper, we show how we can use the mobile devices as Interface for AR applications by implementing some AR experiments.

  • PDF

A Study on Hand Gesture Recognition with Low-Resolution Hand Images (저해상도 손 제스처 영상 인식에 대한 연구)

  • Ahn, Jung-Ho
    • Journal of Satellite, Information and Communications
    • /
    • v.9 no.1
    • /
    • pp.57-64
    • /
    • 2014
  • Recently, many human-friendly communication methods have been studied for human-machine interface(HMI) without using any physical devices. One of them is the vision-based gesture recognition that this paper deals with. In this paper, we define some gestures for interaction with objects in a predefined virtual world, and propose an efficient method to recognize them. For preprocessing, we detect and track the both hands, and extract their silhouettes from the low-resolution hand images captured by a webcam. We modeled skin color by two Gaussian distributions in RGB color space and use blob-matching method to detect and track the hands. Applying the foodfill algorithm we extracted hand silhouettes and recognize the hand shapes of Thumb-Up, Palm and Cross by detecting and analyzing their modes. Then, with analyzing the context of hand movement, we recognized five predefined one-hand or both-hand gestures. Assuming that one main user shows up for accurate hand detection, the proposed gesture recognition method has been proved its efficiency and accuracy in many real-time demos.

Vehicle black box system with LINK blockchain (LINK 블록체인을 적용한 차량용 블랙박스 시스템)

  • An, Kyuhwang;Won, Taeyeon;Park, Sangmin;Jang, Kyoungbae;Seo, Hwajeong
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.23 no.8
    • /
    • pp.1018-1023
    • /
    • 2019
  • Since 2010, vehicle black boxes have become popular with many people, if there is no record of the vehicle accident scene, or if the offender deliberately deletes the image data, the victim succeeds. The biggest advantage of blockchain is that it is impossible to modify and delete data by data distribution storage. The biggest disadvantage is that sensitive data is also distributed. In this paper, we propose a blockchain method for the black box by using the advantage of shared block data and we intend to solve the problem of personal information leakage which is a disadvantage of blockchain by storing sensitive information stored in a blockchain in a private server by LINK blockchain with a private server. We also attached code(Github) and demonstration video(Youtube) linking LINK blockchain with the private server in this paper.

Painters who Climbed Out the Museum and Disappeared (박물관 넘어 도망친 화가들)

  • Kim, Hyeonji;Song, Jiuhn;Yeo, Hwaseon;Kang, Je-won
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.358-360
    • /
    • 2020
  • 본 팀은 웹캠으로 촬영한 영상에서 원하는 물체를 선택하여 텍스처를 선택한 이미지의 스타일로 변환하는 프로젝트를 수행했다. 영상을 세그멘테이션하고 원하는 물체만을 원하는 텍스처로 변환하여 최종 아웃풋을 얻는다. 제안하는 네트워크는 물체를 다양한 스타일로 바꾸는 것이 가능한데, 이 중에서 이미지에 명화의 화풍을 입히는 것을 중점으로 하여 데모를 구현했다. 빠른 속도로 네트워크를 실행하기 위해 기존 연구들에 비디오 처리의 관점을 접목했다. 여러 프레임을 묶어 옵티컬 플로우를 생성하고, 첫 번째 프레임을 인스턴스 세그멘테이션한 후 마스크를 추출했다. 이후 마스크 영역만 뽑아낸 이미지를 새로운 입력으로 하여 스타일 트랜스퍼를 거치고, 이 첫번째 프레임과 나머지 프레임들의 옵티컬 플로우로 나머지 프레임들의 세그멘테이션과 스타일 트랜스퍼를 예측하여 다시 비디오 프레임으로 만들어 주었다. 본 알고리즘은 옵티컬 플로우 설정으로 네트워크의 계산량을 줄이며 속도를 개선했다. 빠른 데이터 처리로 사용자가 원하는 물체의 텍스쳐가 바뀔 수 있게 되었고, 이는 현실 세계가 실제로 바뀐 듯한 느낌을 들게 한다. 또한, 컴퓨터 비전에서 활발하게 연구되었던 분야를 AR로 끌어와 두 분야의 융합 가능성을 열었다. 현재 코로나의 영향으로 집에서 취미생활을 즐기는 인구가 많아졌다. 본 연구를 통해 많은 사람에게 집에서 쉽게 명화의 감성을 즐기고 느낄 수 있는 양질의 콘텐츠를 제공해주려 한다. 또한, 박물관과 미술관 등의 기관에서도 이 기술이 활용될 수 있다. 명화를 느낄 수 있는 다양한 콘텐츠를 이용하여 박물관이나 미술관의 홍보 효과도 기대할 수 있다.

  • PDF