• 제목/요약/키워드: point dataset

검색결과 195건 처리시간 0.022초

멀티모달 맥락정보 융합에 기초한 다중 물체 목표 시각적 탐색 이동 (Multi-Object Goal Visual Navigation Based on Multimodal Context Fusion)

  • 최정현;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.407-418
    • /
    • 2023
  • MultiOn(Multi-Object Goal Visual Navigation)은 에이전트가 미지의 실내 환경 내 임의의 위치에 놓인 다수의 목표 물체들을 미리 정해준 일정한 순서에 따라 찾아가야 하는 매우 어려운 시각적 탐색 이동 작업이다. MultiOn 작업을 위한 기존의 모델들은 행동 선택을 위해 시각적 외관 지도나 목표 지도와 같은 단일 맥락 지도만을 이용할 뿐, 다양한 멀티모달 맥락정보에 관한 종합적인 관점을 활용할 수 없다는 한계성을 가지고 있다. 이와 같은 한계성을 극복하기 위해, 본 논문에서는 MultiOn 작업을 위한 새로운 심층 신경망 기반의 에이전트 모델인 MCFMO(Multimodal Context Fusion for MultiOn tasks)를 제안한다. 제안 모델에서는 입력 영상의 시각적 외관 특징외에 환경 물체의 의미적 특징, 목표 물체 특징도 함께 포함한 멀티모달 맥락 지도를 행동 선택에 이용한다. 또한, 제안 모델은 점-단위 합성곱 신경망 모듈을 이용하여 3가지 서로 이질적인 맥락 특징들을 효과적으로 융합한다. 이 밖에도 제안 모델은 효율적인 이동 정책 학습을 유도하기 위해, 목표 물체의 관측 여부와 방향, 그리고 거리를 예측하는 보조 작업 학습 모듈을 추가로 채용한다. 본 논문에서는 Habitat-Matterport3D 시뮬레이션 환경과 장면 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 모델의 우수성을 확인하였다.

지진동모델 파라미터 동시역산을 이용한 지진관측소 분류 (Classification of Seismic Stations Based on the Simultaneous Inversion Result of the Ground-motion Model Parameters)

  • 연관희;서정희
    • 지구물리와물리탐사
    • /
    • 제10권3호
    • /
    • pp.183-190
    • /
    • 2007
  • 지진기록의 수평성분 S파 푸리에스펙트럼을 이용한 추계학적 지진동모델(stochastic point-source ground-motion model; Boore, 2003) 파라미터 역산결과를 기반으로 지진공학적으로 활용될 수 있는 지진관측소 분류를 시도하였다. 추계학적 지진동모델에서 부지효과는 고주파감쇠상수인 $K_0$ (Anderson and Hough, 1984)와 지층의 탄성임피던스의 차이에 의해 발생하는 부지증폭함수(A(f))의 조합으로 표현된다. 본 연구에서는 A(f)를 지진파 스펙트럼의 수평/수직성분비(H/V)와, 이를 초기값으로 하여 얻어진 역산결과에 의한 관측소별 로그오차평균을 합산하여 계산하였다. 지진관측소는 $1{\sim}10$ Hz 범위의 부지증폭함수의 상용로그 최대값($logA_{1-10}^{max}$(f))에 의해 다섯 등급(A: $logA_{1-10}^{max}$(f) < 0.2, B: 0.2 $\leq$ $logA_{1-10}^{max}$(f) < 0.4, C: 0.4 $\leq$ $logA_{1-10}^{max}$(f) < 0.6, D: 0.6 $\leq$ log < 0.8, E: 0.8 $\leq$ $logA_{1-10}^{max}$(f))으로 분류하였다. 분류된 진관측소의 평균적인 부지증폭함수는 A에서 E 등급으로 변함에 따라 지반의 고유진동수가 저주파로 이동하는 의미 있는 결과를 나타내었으며, 최근에 설치장소를 이전한 기상청 일부 관측소에 대해 이설 전후의 등급변화 및 최근 발생한 중규모 지진관측자료와 지진동 거리감쇠식과의 비교분석을 통해 관측소 분류결과의 타당성을 입증할 수 있었다.

저화질 안면 이미지의 화질 개선를 통한 안면 특징점 검출 모델의 성능 향상 (Enhancing the performance of the facial keypoint detection model by improving the quality of low-resolution facial images)

  • 이경욱;이예진;박종혁
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.171-187
    • /
    • 2023
  • 저화소의 감시카메라와 같은 촬영 장비를 통해 사람의 얼굴을 인식할 경우, 화질이 낮아 얼굴을 포착하기 어렵다는 문제점이 있다. 이렇게, 사람의 얼굴을 인식하기 어렵다면 범죄용의자나 실종자를 특정해내지 못하는 등의 문제가 발생할 수 있다. 기존 이미지 속 안면 인식에 관한 연구들에서는 정제된 데이터셋을 사용하였기 때문에 다양한 환경에서의 성능을 가늠하기 어렵다는 한계가 존재한다. 이에, 본 논문에서는 저화질 이미지에서 안면 인식 성능이 떨어지는 문제를 해결하기 위해 다양한 환경을 고려한 저화질 안면 이미지에 대해 화질 개선을 수행하여 고화질 이미지를 생성한 뒤, 안면 특징점 검출의 성능 향상시키는 방법을 제안한다. 제안 방법의 현실 적용 가능성을 확인하기 위해 전체 이미지에서 사람이 상대적으로 작게 나타나는 데이터셋을 선정하여 실험을 수행하였다. 또한 마스크 착용 상황을 고려한 안면 이미지 데이터셋을 선정하여, 현실 문제로의 확장 가능성을 탐구하였다. 안면 이미지의 화질을 개선하여 특징점 검출 모델의 성능을 측정한 결과, 개선 후 안면의 검출 여부는 마스크를 착용하지 않은 이미지의 경우 평균 3.47배, 마스크를 착용한 경우 평균 9.92배로 성능 향상을 확인할 수 있었다. 안면 특징점에 대한 RMSE는 마스크를 착용한 이미지의 경우 평균 8.49배 감소, 마스크를 착용하지 않은 경우 평균 2.02배 감소한 것을 확인할 수 있었다. 이에, 화질 개선을 통해 저화질로 포착된 안면 이미지에 대한 인식률을 높여 제안 방법의 활용 가능성을 확인할 수 있었다.

지각 구조 연구에서 광각 탄성파 자료를 위한 대화식 분석 방법들 (Interactive analysis tools for the wide-angle seismic data for crustal structure study (Technical Report))

  • 등강강;립원순삼;촌뢰규;망월공광;김전의행
    • 지구물리와물리탐사
    • /
    • 제11권1호
    • /
    • pp.26-33
    • /
    • 2008
  • 큰 입사각을 가진 탄성파 반사법과 굴절법 자료의 분석은 지각 규모의 구조 연구에서 중요한 역할을 한다. 그러나, 관측된 자료로부터 적합한 속도 구조 모델을 바로 얻는 것은 상당히 어려운 일이며, 지각 구조 분석은 본질적으로 비선형 문제이기 때문에 구조 모델을 단계적으로 향상 시켜야만 한다. 광각 지각 구조 모델링에는 위상식별과 시행착오 전진 모델링과 같은 몇 가지 주관적인 과정들이 있다. 광각 자료 분석에서 이러한 주관적인 과정들은 결과 모델들의 유일성과 신뢰성을 감소시키기 때문에, 분석절차에서 주관성을 감소시키는 것이 중요하다. 이러한 관점에서, 우리는 지각 구조 모델의 개발에 사용될 PASTEUP과 MODELING이라는 2개의 소프트웨어를 설명하고 있다. PASETUP은 기록 단면도의 도시, 광각 탄성파 자료 분석 그리고 위상 피킹을 쉽게 해주는 대화식 응용프로그램이다. PASETUP은 신호대잡음 비를 향상시키고 위상식별을 도와주는 분석 기능과 다양한 필터를 갖추고 있다. MODELLING은 속도모델의 편집과 파선 모델링을 위한 대화식 응용프로그램이다. MODELING에 의해 계산된 주행시간은 PASTEUP에서 관찰된 파형과 바로 비교될 수 있다. 이것은 지각구조 분석에서 가장 주관적인 과정 중 하나인 주행시간 피킹이 필요 없기 때문에 지각 구조 모델링에서 주관성을 감소시킨다. MODELING은 편집 가능한 층서구조 모델을 다중 채널 탄성파(MCS) 반사파 자료의 시간 단면도와 비교할 수 있는 왕복 주시로 변환할 수 있다. 반사파 자료와 광각 자료의 구조 모델 사이의 직접 비교는 모델에 좀 더 신뢰성을 부여한다. 게다가 PASTEUP과 MODELING 둘다 큰 자료를 다루기에 효과적인 도구이다. 이 소프트웨어들은 광각 탄성파 자료를 이용한 좀 더 그럴듯한 지각-규모의 구조 모델을 개발하는데 도움을 준다.

전문성 이식을 통한 딥러닝 기반 전문 이미지 해석 방법론 (Deep Learning-based Professional Image Interpretation Using Expertise Transplant)

  • 김태진;김남규
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.79-104
    • /
    • 2020
  • 최근 텍스트와 이미지 딥러닝 기술의 괄목할만한 발전에 힘입어, 두 분야의 접점에 해당하는 이미지 캡셔닝에 대한 관심이 급증하고 있다. 이미지 캡셔닝은 주어진 이미지에 대한 캡션을 자동으로 생성하는 기술로, 이미지 이해와 텍스트 생성을 동시에 다룬다. 다양한 활용 가능성 덕분에 인공지능의 핵심 연구 분야 중 하나로 자리매김하고 있으며, 성능을 다양한 측면에서 향상시키고자 하는 시도가 꾸준히 이루어지고 있다. 하지만 이처럼 이미지 캡셔닝의 성능을 고도화하기 위한 최근의 많은 노력에도 불구하고, 이미지를 일반인이 아닌 분야별 전문가의 시각에서 해석하기 위한 연구는 찾아보기 어렵다. 동일한 이미지에 대해서도 이미지를 접한 사람의 전문 분야에 따라 관심을 갖고 주목하는 부분이 상이할 뿐 아니라, 전문성의 수준에 따라 이를 해석하고 표현하는 방식도 다르다. 이에 본 연구에서는 전문가의 전문성을 활용하여 이미지에 대해 해당 분야에 특화된 캡션을 생성하기 위한 방안을 제안한다. 구체적으로 제안 방법론은 방대한 양의 일반 데이터에 대해 사전 학습을 수행한 후, 소량의 전문 데이터에 대한 전이 학습을 통해 해당 분야의 전문성을 이식한다. 또한 본 연구에서는 이 과정에서 발생하게 되는 관찰간 간섭 문제를 해결하기 위해 '특성 독립 전이 학습' 방안을 제안한다. 제안 방법론의 실현 가능성을 파악하기 위해 MSCOCO의 이미지-캡션 데이터 셋을 활용하여 사전 학습을 수행하고, 미술 치료사의 자문을 토대로 생성한 '이미지-전문 캡션' 데이터를 활용하여 전문성을 이식하는 실험을 수행하였다. 실험 결과 일반 데이터에 대한 학습을 통해 생성된 캡션은 전문적 해석과 무관한 내용을 다수 포함하는 것과 달리, 제안 방법론에 따라 생성된 캡션은 이식된 전문성 관점에서의 캡션을 생성함을 확인하였다. 본 연구는 전문 이미지 해석이라는 새로운 연구 목표를 제안하였고, 이를 위해 전이 학습의 새로운 활용 방안과 특정 도메인에 특화된 캡션을 생성하는 방법을 제시하였다.