• 제목/요약/키워드: 시각적 모델

검색결과 1,221건 처리시간 0.03초

GPS 시각 전송에서의 대류층 천정지연 모델과 매핑 함수에 따른 시각오프셋 비교 (Comparison of Time Offsets by Tropospheric Zenith Path delay models and Mapping Functions in GPS Time Transfer)

  • 유동희
    • 한국정보통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1317-1322
    • /
    • 2014
  • 본 논문은 GPS 시각 전송 기법 중 GPS 신호가 전달되면서 발생하는 대류층 지연이 시각오프셋 결정에 미치는 영향 정도를 분석하기 위한 연구이다. GPS 시각 전송은 CGGTTS 국제표준을 따르고 있다. 일반적인 측지용 GPS 수신기의 경우, CGGTTS 형태의 시각 전송 값을 출력하지 않고 RINEX 형태의 값을 출력하는데, ROB에서 RINEX 형태의 값을 CGGTTS 형태로 변환하는 r2cggtts 라는 프로그램을 공급하고 있다. 전 세계 표준 시각을 결정하기 위해 TAI link에 참여하는 시각 실험실들은 모두 이 프로그램을 사용하여 주기적으로 CGGTTS 값을 BIPM에 전송한다. r2cggtts 프로그램의 대류층 지연모델은 Chao mapping function과 NATO 천정지연모델이 구현되어 있다. 현재 대표적 대류층 지연 모델은 Niell mapping function과 Saastamoinen 천정지연모델이 사용되고 있는 바, 이 모델들을 r2cggtts 프로그램에 적용하여 시각 오프셋 결정을 위한 두 모델의 지연 결과 값들의 영향을 비교하고 분석한다.

움직임 분석 기반의 시각인지 모델을 이용한 비디오 코딩 방법 (Video Coding Method Using Visual Perception Model based on Motion Analysis)

  • 오형석;김원하
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.223-236
    • /
    • 2012
  • 본 논문에서는 인간 인지 기반 비디오 코딩을 위한 비디오 처리 방법을 개발한다. 제안하는 방법은 율-왜곡(rate-distortion) 최적화의 영향뿐만 아니라 제한적인 시, 공간 해상도, 지역적인 움직임 이력(history), visual saliency에 의한 인간 시각 인지를 고려한다. 이러한 인간의 인지적인 효과들을 고려하기 위하여 본 논문에서는 움직임 패턴을 모델링하고 Hedge 알고리듬을 사용하여 움직임 패턴을 결정하는 기법을 개발한다. 그 다음, 제안한 움직임 패턴과 기존의 visual saliency와의 결합을 통하여 인간 시각 인지 모델을 수립한다. 제안된 인간 시각 인지 모델을 구현하기 위하여 기존의 foveation filtering 방법을 확장한다. 시각적 자극이 덜한 지역만을 부드럽게(smoothing)하는 기존의 foveation filtering 기법과 비교하여 제안하는 foveation filtering 기법은 인간 시각 인지 모델에 따라 지역적으로 부드럽게 또는 지역적 특성을 향상시킴으로써, 시각적 자극이 덜한 지역에서 줄여진 대역폭을 효과적으로 시각적 자극이 큰 지역에서 사용하도록 이동 시킬 수 있는 장점이 있다. 제안된 방법의 성능은 전반적인 비디오 화질을 만족할 뿐만 아니라 인간이 인지하는 화질의 품질을 12%~44% 향상시킨다.

볼륨 변형과 실시간 햅틱 시뮬레이션을 위한 하이브리드 탄성체 모델 (Hybrid Elastic Model for Volumetric Deformation and Real-time Haptic Simulation)

  • 조재환;김석;박진아
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.68-73
    • /
    • 2009
  • 최근 다양한 햅틱 알고리즘과 햅틱 장비가 개발되면서 햅틱을 이용한 컴퓨터 시뮬레이션이 증가하고 있다. 햅틱 시뮬레이션은 기본적으로 1000Hz 정도의 비교적 고속 리프레쉬를 요구한다. 기존 햅틱 시뮬레이션은 대상 모델을 간략화 해서 고속 리프레쉬 요구사항을 만족 시켰다. 하지만, 유연체 가변형 모델 시뮬레이션은 시각적 변형요소가 중요하기 때문에 모델을 간략화 할 경우에 시각적으로 좋지 않은 결과를 초래한다. 햅틱 렌더링만 담당하는 모델을 따로 분리하여 병렬처리를 통해 햅틱과 변형 시뮬레이션을 모두 하는 경우도 있지만 두 모델간의 관계가 명백하지 않아 문제가 발생하기도 한다. 이 논문에서는 유연체 시뮬레이션을 위한 볼륨 변형 모델과 햅틱 렌더링 모델을 정의하고 두 모델간의 관계를 정의한다. 또한, 충돌처리등 사용자 인터랙션에 필요한 알고리즘을 제안하고 수술시뮬레이션 등에 적용해보고자 한다.

  • PDF

적응적인 Saliency map 모델 구현을 통한 얼굴 검출 (Face Detection through Implementation of adaptive Saliency map)

  • 김기중;한영준;한현수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2007년도 춘계학술대회 학술발표 논문집 제17권 제1호
    • /
    • pp.153-156
    • /
    • 2007
  • 인간의 시각 시스템은 선택적 주의 집중에 의해 시각 수용체로 도달되는 많은 물체들 중에서 필요한 정보만을 추출하여 원하는 작업을 수행한다. Itti와 Koch는 시각적 주의를 제어할 수 있는, 신경계를 모방한 계산적 모델을 제안하였으나 조명환경에 고정적인 saliency map을 구성하였다. 따라서, 본 논문에서는 영상에서 ROI(region of interest)을 탐지하기 위한 조명환경에 적응적인 saliency map 모델을 구성하는 기법을 제시한다. 변화하는 환경에서 원하는 특징을 부각시키기 위하여 상황에 적응적인 동적 가중치를 부여한다. 동적 가중치는 conspicuity map에 S.K. Chang이 제안한 PIM(Picture Information Measure)을 적용시켜 정보량을 측정한 후, 이에 따라 정규화된 값을 부여함으로써 구현한다. 제안하는 조명환경에 강인한 적응적인 saliency map 모델 구현의 성능을 얼굴검출 실험을 통하여 검증하였다.

  • PDF

심층 신경망을 이용한 자연어 지시의 실시간 시각적 접지 (Real-Time Visual Grounding for Natural Language Instructions with Deep Neural Network)

  • 황지수;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.487-490
    • /
    • 2019
  • 시각과 언어 기반의 이동(VLN)은 3차원 실내 환경에서 실시간 입력 영상과 자연어 지시들을 이해함으로써, 에이전트 스스로 목적지까지 이동해야 하는 인공지능 문제이다. 이 문제는 에이전트의 영상 및 자연어 이해 능력뿐만 아니라, 상황 추론과 행동 계획 능력도 함께 요구하는 복합 지능 문제이다. 본 논문에서는 시각과 언어 기반의 이동(VLN) 작업을 위한 새로운 심층 신경망 모델을 제안한다. 제안모델에서는 입력 영상에서 합성곱 신경망을 통해 추출하는 시각적 특징과 자연어 지시에서 순환 신경망을 통해 추출하는 언어적 특징 외에, 자연어 지시에서 언급하는 장소와 랜드마크 물체들을 영상에서 별도로 탐지해내고 이들을 추가적으로 행동 선택을 위한 특징들로 이용한다. 다양한 3차원 실내 환경들을 제공하는 Matterport3D 시뮬레이터와 Room-to-Room(R2R) 벤치마크 데이터 집합을 이용한 실험들을 통해, 본 논문에서 제안하는 모델의 높은 성능과 효과를 확인할 수 있었다.

3차원 포인트 클라우드의 의미적 분할을 위한 멀티-모달 교차 주의집중 (Multi-Modal Cross Attention for 3D Point Cloud Semantic Segmentation)

  • 배혜림;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.660-662
    • /
    • 2023
  • 3차원 포인트 클라우드의 의미적 분할은 환경을 구성하는 물체 단위로 포인트 클라우드를 분할하는 작업으로서, 환경의 3차원적 구성을 이해하고 환경과 상호작용에 필수적인 시각 지능을 요구한다. 본 논문에서는 포인트 클라우드에서 추출하는 3차원 기하학적 특징과 함께 멀티-뷰 영상에서 추출하는 2차원 시각적 특징들도 활용하는 새로운 3차원 포인트 클라우드 의미적 분할 모델 MFNet을 제안한다. 제안 모델은 서로 이질적인 2차원 시각적 특징과 3차원 기하학적 특징의 효과적인 융합을 위해, 새로운 중기 융합 전략과 멀티-모달 교차 주의집중을 이용한다. 본 논문에서는 ScanNetV2 벤치마크 데이터 집합을 이용한 다양한 실험들을 통해, 제안 모델 MFNet의 우수성을 입증한다.

한국, 싱가포르, 미국, 일본의 초등학교 교과서에 제시된 덧셈과 뺄셈 도입에 대한 비교분석 (A Comparative Analysis of Introducing Addition and Subtraction in the Korean, Singaporean, American, and Japanese Elementary Textbooks)

  • 방정숙;김리나;김소현
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제36권2호
    • /
    • pp.229-252
    • /
    • 2022
  • 본 연구는 한국, 싱가포르, 미국, 일본의 초등학교 교과서에 제시된 모으기와 가르기, 덧셈 및 뺄셈의 도입 단원을 비교하고 분석한 것이다. 분석의 초점은 시각적 모델 및 제시된 문제 상황과의 연결성, 언어적 표현 및 시각적 모델과의 연결성, 관계적 이해 및 추가 활동이다. 분석 결과, 교과서에 따라 문제 상황, 시각적 모델, 언어적 표현이 다르게 구현됨에 따라 연결성도 다르게 나타났다. 각 교과서는 문제 상황의 제시 방법과 순서에서 차이가 있었고, 시각적 모델 측면에서도 하나의 모델을 지속적으로 사용하는 경우와 다양한 모델을 사용하는 경우가 있었다. 언어적 표현 측면에서는 각 교과서 마다 다른 특징이 있었으며, 관계적 이해 측면에서는 모든 교과서가 등호 양변의 값이 같다는 것을 강조하는 활동을 제시하였다. 이와 같은 연구 결과를 바탕으로 덧셈과 뺄셈 도입과 관련된 문제 상황, 시각적 모델의 활용, 언어적 표현 방안 등 후속 교과서의 단원 개발과 관련한 시사점을 논의하였다.

GPS 시각 전송에서의 대류층 지연 모델 영향 비교 (Effects of Tropospheric Delay Models for GPS Time Transfer)

  • 유동희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.139-141
    • /
    • 2014
  • 본 논문은 GPS 시각 전송 기법 중 GPS 신호가 전달되면서 발생하는 대류층 지연에 관한 연구로써, 대류층 지연에 적용하는 지연 모델에 따른 지연 값의 형태를 비교한다. GPS 시각 전송은 CGGTTS 국제표준을 따르고 있다. 일반적인 측지용 GPS 수신기의 경우, CGGTTS 형태의 시각 전송값을 출력하지 않고 RINEX 형태의 값을 출력하는데, ROB에서 RINEX 형태의 값을 CGGTTS 형태로 변환하는 r2cggtts 라는 프로그램을 공급하고 있다. 전세계 표준 시각을 결정하기 위해 TAI link에 참여하는 시각 실험실들은 모두 이 프로그램을 사용하여 주기적으로 CGGTTS 값을 BIPM에 전송한다. r2cggtts 프로그램의 대류층 지연모델은 CHAO mapping function과 NATO 천정지연모델이 구현되어 있다. 현재 대표적 대류층 지연 모델은 Niell mapping funcgion과 Saastamoinen 천정지연모델이 사용되고 있는 바, 이 모델들을 r2cggtts 프로그램에 적용하여 시각 오프셋 결정을 위한 두 모델의 지연 결과값을 영향을 비교하고 분석한다.

  • PDF

상호 관계 기반 자동 이미지 주석 생성 (Correlation-based Automatic Image Captioning)

  • Hyungjeong, Yang;Pinar, Duygulu;Christos, Falout
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1386-1399
    • /
    • 2004
  • 본 논문에서는 상호 관계에 기반한 자동 이미지 주석 생성 방법을 보인다 새로운 실험 이미지를 위한 자동 주석의 생성은 훈련 데이타 내의 주석과 함께 주어진 이미지들을 이용하여 이미지의 시각적 속성과 텍스트 속성의 상호 관계를 발견해 냄으로 수행된다. 본 논문에서 제시하는 상호 관계 기반 자동주석 생성 모델은 1) 시각적 속성의 적절한 군집화, 2) 시각적 속성과 텍스트 속성의 가중치 부여, 3) 노이즈 제거를 위한 차원 축소 등의 요소를 고려하여 설계된다. 실험은 680 MB의 Corel 이미지 데이터를 이용하여 각 10개의 데이타 집합에 대해 수행되었으며, 실험 결과, 시각적 속성과 텍스트 속성에 대한 가중치 부여와 시각적 속성의 적절한 군집화가 모델의 성능을 향상시키며, 본 논문에서 제시한 상호 관계기반 모델이 기존의 EM을 이용한 자동 주석 생성 모델에 비해 45%의 상대적 성능 향상을 보인다.

Water Marking을 내장한 JPEG 압축을 위한 DCT의 VHDL 모델 구현에 관한 연구 (Study of Water Marking Embedded in DCT for JPEG VHDL model Implementation)

  • 김남우;허창우;박종운
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.908-911
    • /
    • 2002
  • 본 논문에서는 영상의 불법적인 복사를 방지하기 위해 사용되는 워터마킹을 내장한 JPEG 압축용 DCT의 VHDL 모델을 제시한다. 워터마킹 방법은 사람의 시각 시스템을 이용하여 주파수 영역에서 영상의 시각적인 특성에 적응하는 워터마크를 내장한다. 영상 압축시에 주파수 영역으로 변환해주는 DCT와 함께 화질저하에 대한감소와 공격에 강한 water marking을 구현함으로서 손실 압축에서도 방지 기능을 유지하면서 시스템의 효율적인 구성을 얻을 수 있다. 구현된 DCT의 VHDL 모델을 사용한 시뮬레이션 결과 고주파 성분이 많은 복잡한 영상과 저주파 성분이 많은 단순한 영상에 적용하여 워터마크가 시각적으로 보이지 않고 JPEG 손실압축과 잡음에도 견고함을 가지며, 기능을 추가하여도 기존에 비해 면적을 적게 차지하여 빠른 속도를 얻을 수 있어, 소형 시스템에 솔루션에 적용이 적합하다.

  • PDF