• 제목/요약/키워드: 3차원 데이터 융합

검색결과 154건 처리시간 0.028초

원격 로봇용 시각 가이드 시스템 연구 (A Study on Visual Guidance for Remote Robot)

  • 신동인;김동엽;김승훈;황정훈;김영욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1497-1498
    • /
    • 2015
  • 원격 로봇을 위해 지역 환경을 모델링하기 위하여, 3차원 영상을 생성하는 기술을 제안한다. 이를 위하여, 카메라와 거리 센서를 보정하는 방법에 대해서 제안한다. 그리고 카메라 영상과 거리 정보를 융합하여 점군 데이터를 생성하는 방법에 대해서 기술한다.

포인트 클라우드를 이용한 블록체인 기반 설명 가능한 인공지능 연구 (Explanable Artificial Intelligence Study based on Blockchain Using Point Cloud)

  • 홍성혁
    • 융합정보논문지
    • /
    • 제11권8호
    • /
    • pp.36-41
    • /
    • 2021
  • 인공지능을 이용하여 예측이나 분석하는 기술은 지속적으로 발전하고 있지만, 의사결정 과정을 명확히 해석하지 못하는 블랙박스 문제가 존재한다. 따라서 인공지능 모델의 의사결정 과정에서 사용자의 입장에서 해석이 불가능하여 결과를 신뢰할 수 없는 문제가 발생한다. 본 연구에서는 인공지능의 문제점과 이를 해결하기 위한 블록체인을 활용한 설명 가능한 인공지능에 대해 연구를 진행하였다. 블록체인을 이용해서 설명 가능한 인공지능 모델의 의사결정 과정에서의 데이터를 타임스탬프 등을 이용하여 부분별로 블록체인에 저장한다. 블록체인을 이용하여 저장된 데이터의 위변조 방지를 제공하고 블록체인의 특성상 사용자는 블록에 저장된 의사결정 과정등의 데이터를 자유롭게 접근할 수 있다. 설명 가능한 인공지능 모델의 구축이 힘든 것은 기존 모델의 복잡성이 큰 부분을 차지한다. 따라서 포인트 클라우드를 활용해서 3차원 데이터 처리와 가공과정의 효율성을 높여서 의사결정 과정을 단축해 설명 가능한 인공지능 모델의 구축을 원활하게 한다. 블록체인에 데이터 저장과정에서 데이터 위변조가 발생할 수 있는 오라클 문제를 해결하기 위해 저장과정에 중간자를 거치는 블록체인 기반의 설명 가능한 인공지능 모델을 제안하여 인공지능의 블랙박스 문제를 해결하였다.

3차원 거리정보와 DSM의 정사윤곽선 영상 정합을 이용한 무인이동로봇의 위치인식 (Localization of Unmanned Ground Vehicle based on Matching of Ortho-edge Images of 3D Range Data and DSM)

  • 박순용;최성인
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권1호
    • /
    • pp.43-54
    • /
    • 2012
  • 본 논문에서는 야지 환경에서 동작하는 무인이동로봇에서 획득한 3차원 LIDAR (Light Detection and Ranging) 센서 정보와 로봇이 이동하는 지형의 3차원 DSM (Digital Surface Map)에서 정사윤곽선(Ortho-edge) 특징영상을 생성하고 정합하여 로봇의 현재 위치를 추정하는 기술을 제안한다. 최근의 무인이동로봇의 위치 인식에 대한연구는 GPS (Global Positioning System), IMU (Inertial Measurement Unit), LIDAR 등의 위치인식 센서를 융합하는 경우가 많아지고 있다. 특히 LIDAR에서 획득한 거리정보를 ICP(Iterative Closest Point) 기반의 기하정합으로 로봇의 위치를 추정하는 기술이 개발되고 있다. 그러나 이동로봇에서 획득한 센서 정보는 DSM의 센싱 방향과 큰 차이차이가 있어 기존의 기하정합 기술을 사용하는데 어려움이 있다. 본 논문에서는 서로 다른 센싱 방향에서 획득한 3차원 LIDAR 거리정보와 DSM에서 정사윤곽선이라는 특징 영상을 생성하고 이들을 정합하여 로봇의 위치를 추정하는 새로운 기술을 제안한다. DSM으로부터 현재 시점의 정사윤곽선 영상을 생성하는 방법, 전방향 LIDAR 거리센서에서 정사윤곽선 영상을 생성하는 방법, 그리고 정사윤곽선 영상의 정합 기술을 설명하였다. 실험에서는 다양한 주행 경로에 대한 위치 추정의 오차를 분석하고 제안 기술의 성능의 우수성을 보였다.

입체 영상 재현을 위한 Dual Stream MPEG-4 인코더 분석 및 설계 (Analysis and Design of Dual Stream MPEG-4 Encoder for Stereo Image)

  • 나인순;민수흥;조동섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.205-208
    • /
    • 2002
  • 출판, 영화, 방송, 인터넷 등 멀티미디어 정보통신 분야에서는 새로운 영상 매체인 3차원 입체 영상 및 가상현실을 차세대 영상정보의 현실감 부여와 정보전달의 리얼리티를 제공하기 위해 다양한 기술들이 활발히 연구되고 있다. 또한 현대의 정보 통신 분야는 방송, 통신 및 컴퓨터가 통합되고, 무선과 유선이 융합되는 새로운 정보 통신 기술로 진화하고 있다. 이러한 변화의 영향으로 영상 서비스에 대한 기술 개발 경향도 영상 정보의 효율적인 전달 및 저장이라는 기존의 동영상 압축 표준이 갖는 기능 이외에, 보다 더 향상된 기능을 제공하는 방향으로 나아가고 있다. MPEG-4는 현재 각광받고 있는 인터넷 등의 멀티미디어 서비스에 있어서 필수적인 핵심기술이다. 본 논문에서는 MPEG-4 표준을 기반으로 하여, Dual 스트림이 입력되는 멀티미디어 데이터 즉, 입체 영상 재현을 위한 데이터를 효율적으로 인코딩하는 방식을 제안하고, 이에 대한 인코더를 분석, 설계하였다. 제안하는 방식은 MPEG-4를 이용한 입체영상 관련 응용에 적용될 수 있다.

  • PDF

3차원 시점 변화를 활용한 이미지 외곽라인 검색 제안 (The Search of Image Outline Using 3D Viewpoint Change)

  • 김성곤
    • 문화기술의 융합
    • /
    • 제5권3호
    • /
    • pp.283-288
    • /
    • 2019
  • 이미지 외곽라인과 시점으로 유사이미지를 검색하는 방법을 제안한다. 첫 번째 테스트에서, 움직임을 통제할 수 없는 3차원 형태의 이미지는 정적인 평면형태 이미지보다 검색 정확도가 낮았다. 원인분석을 위해, 특정 6종류 열대어 데이터를 선별 제작하였다. 종류별 열대어 삼차원 그래픽을 제작하고 상하좌우 12단계 시점으로 144개의 이미지 외곽라인을 제작했다. 종류별 열대어를 수집하고 유사 검색을 통하여 144개의 시점으로 분류 나열했다. 연구 결과, 열대어 종류별로 많이 표현되는 고유 시점이 있음을 증명했다. 검색의 정확도를 높이기 위해, 사용자 시점을 선택하는 사용자 인터페이스를 제작했다. 이미지의 시점을 사용자가 선택하면, 관련 시점의 범위를 고려해 검색 결과를 보여주는 방법을 제안한다.

상담 챗봇의 다차원 감정 인식 모델 (Multi-Dimensional Emotion Recognition Model of Counseling Chatbot)

  • 임명진;이명호;신주현
    • 스마트미디어저널
    • /
    • 제10권4호
    • /
    • pp.21-27
    • /
    • 2021
  • 최근 COVID-19로 인한 코로나 블루로 상담의 중요성이 높아지고 있다. 또한 비대면 서비스의 증가로 상담 매체에 변화를 준 챗봇에 관한 연구들이 활발하게 진행되고 있다. 챗봇을 통한 비대면 상담에서는 내담자의 감정을 정확하게 파악하는 것이 가장 중요하다. 하지만 내담자가 작성한 문장만으로 감정을 인식하는 데는 한계가 있으므로 더 정확한 감정 인식을 위해서는 문장에 내제되어있는 차원 감정을 인식하는 것이 필요하다. 따라서 본 논문에서는 상담 챗봇의 감정 인식 개선을 위해 원본 데이터를 데이터의 특성에 맞게 보정한 후 Word2Vec 모델을 학습하여 생성된 벡터와 문장 VAD(Valence, Arousal, Dominance)를 딥러닝 알고리즘으로 학습한 다차원 감정 인식 모델을 제안한다. 제안한 모델의 유용성 검증 방법으로 3가지 딥러닝 모델을 비교 실험한 결과로 Attention 모델을 사용했을 때 R-squared가 0.8484로 가장 좋은 성능을 보인다.

Big data를 이용한 실시간 SOC 구조물 거동분석 시스템 연구 (A Study on Real-Time SOC Structure Behavior Evaluation System using Big Data)

  • 최정열;한재민;안대희;정지승
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.691-695
    • /
    • 2023
  • 현재 자동화계측 시스템의 계측 결과 활용도는 매우 낮고 단편적인 측정결과 만을 제공하는 수준이다. 본 연구에서는 실시간으로 측정된 방대한 데이터값을 클라우드로 전송하여 빅데이터를 구축하고 파이썬 기반의 알고리즘을 이용하여 획득한 자동화계측 데이터를 고정밀-신뢰도를 갖는 구조물 거동 분석 3D Display 시스템을 연구하고자 한다. 연구결과, 실시간으로 관리자에게 구조물의 거동을 평가할 수 있는 시스템으로서 계측 데이터의 종류 및 센서의 종류와 무관하게 큰 제약 없이 실시간으로 분석데이터를 제공하고 3D Display로 도출하였다. 또한 관리자가 구조물의 거동 그래프를 실시간으로 파악하고 데이터 분석을 통해 구조물의 취약부 도출을 보다 쉽게 파악할 수 있을 것으로 분석되었다. 향후 과거와 현재 데이터를 이용하여 구조물의 거동을 3차원으로 분석함으로써 현실성 있는 구조물의 보수, 보강 및 유지 관리 측면에서 보다 실효성 있는 측정 결과를 확보할 수 있을 것으로 분석되었다.

지능형 굴삭 시스템을 위한 모바일 3D 이미징 시스템 및 자동 정합 알고리즘의 개발 (Development of the 3D Imaging System and Automatic Registration Algorithm for the Intelligent Excavation System (IES))

  • 채명진;이규원;김정렬;박재우;유현석;조문영
    • 한국건설관리학회논문집
    • /
    • 제10권1호
    • /
    • pp.136-145
    • /
    • 2009
  • '지능형 굴삭시스템 개발'은 센서기술, 로봇기술들을 융합하여 토공 작업환경을 인식하고 작업 계획을 수립하며 굴삭기를 자동 조정하여 토공작업을 자동화 하는 것을 목표로 한다. 본 연구는 지능형 굴삭시스템 개발을 위한 요소기술로서, 광대역 3D 레이저 스캐너를 이용하여 실제 토공 작업환경을 가상의 3차원 공간으로 재현할 수 있는 수학적 모델을 만드는 것이다. 이 연구에서는 광대역 3D 레이저 스캐너를 구동하기 위한 사용자 소프트웨어 및 사용자 인터페이스를 개발하였으며, 3D 레이저 스캐너의 차량 탑재 및 스캐닝 작업의 최적화를 위하여 모바일 3D 이미징 시스템을 개발하였다. 또한 실제 토공 작업환경을 대상으로 스캐닝 실험을 실시하여 스캔 데이터를 획득하였고, 이를 기반으로 각 스캔 데이터들 간의 자동 정합 알고리즘을 설계하였다. 본 연구에서 개발된 시스템은 향후 지능형 굴삭 로봇의 완전 자동화 시스템의 구현을 위하여 널리 활용될 수 있을 것으로 기대된다.

무인항공영상을 이용한 교량 상판의 텍스처 매핑 (Texture Mapping of a Bridge Deck Using UAV Images)

  • ;한동엽
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권6호
    • /
    • pp.1041-1047
    • /
    • 2017
  • 도로의 상태를 관측하는 많은 방법의 하나로 무인항공기 영상이 사용된다. 무인항공기 영상 파일이 너무 크고, 불필요한 정보가 많을 때, 특징적 정보를 압축한 텍스처 추출 기법이 사용된다. 특히 무인항공기 영상을 이용한 3차원 시뮬레이션에서 많은 양의 데이터가 입력되기 때문에 텍스처 추출이 중요하다. 본 논문에서는 교량의 고해상 영상을 얻기 위하여 무인항공기 영상으로부터 텍스처 추출 방법을 제시한다. 제안된 방법은 3단계로 이루어진다. 첫째, 브이월드 데이터베이스에서 3차원 교량 모델을 취득한다. 둘째, 기하보정 정보를 가진 무인항공기 영상에서 텍스처를 추출한다. 셋째, 개별 영상에서 추출된 텍스처를 융합한다. 본 연구 결과는 브이월드 텍스처를 고해상 영상으로 갱신하는 데 사용될 수 있다.

수어 번역을 위한 3차원 컨볼루션 비전 트랜스포머 (Three-Dimensional Convolutional Vision Transformer for Sign Language Translation)

  • 성호렬;조현중
    • 정보처리학회 논문지
    • /
    • 제13권3호
    • /
    • pp.140-147
    • /
    • 2024
  • 한국에서 청각장애인은 지체장애인에 이어 두 번째로 많은 등록 장애인 그룹이다. 하지만 수어 기계 번역은 시장 성장성이 작고, 엄밀하게 주석처리가 된 데이터 세트가 부족해 발전 속도가 더디다. 한편, 최근 컴퓨터 비전과 패턴 인식 분야에서 트랜스포머를 사용한 모델이 많이 제안되고 있는데, 트랜스포머를 이용한 모델은 동작 인식, 비디오 분류 등의 분야에서 높은 성능을 보여오고 있다. 이에 따라 수어 기계 번역 분야에서도 트랜스포머를 도입하여 성능을 개선하려는 시도들이 제안되고 있다. 본 논문에서는 수어 번역을 위한 인식 부분을 트랜스포머와 3D-CNN을 융합한 3D-CvT를 제안한다. 또, PHOENIX-Wether-2014T [1]를 이용한 실험을 통해 제안 모델은 기존 모델보다 적은 연산량으로도 비슷한 번역 성능을 보이는 효율적인 모델임을 실험적으로 증명하였다.