• Title/Summary/Keyword: 시각적 모델

Search Result 1,212, Processing Time 0.025 seconds

Real-time active vision system using log-polar transform (다해상도 변환을 이용한 실시간 능동 시각 시스템)

  • 이상웅;최형철;강성훈;유명현;이성환
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.25-30
    • /
    • 2000
  • KUeyes(Korea University's eyes)는 인간의 시각 정보처리 과정을 모델로 하여 고려대학교 인공시각연구센터에서 개발된, 스테레오 컬러 영상을 실시간으로 처리할 수 있는 능동시각 시스템이다. 실시간 처리를 위하여 KUeyes는 병렬 처리가 가능하도록 개발된 영상 획득 및 영상 처리 모듈을 가지고 있으며, 다해상도 영상 변환 기법을 사용하여 입력 영상의 처리속도를 증진시키고 있다. 이 시스템은 외형적으로는 처리된 영상에 따라 반응하여 움직이는 10-자유도의 헤드 아이 시스템으로 구성되어 있다. 본 연구에서는 영상의 칼라 정보와 움직임 정보 등을 실시간으로 분석하여 지능적이고 빠르게 개체를 탐지하고 추적하는 인간의 시각 반응 및 인식 모델을 KUeyes에 탑재하여 구현하고 실험하였다. 실험에서 얻어진 결과는 KUeyes가 인간의 시각, 인식시스템을 적절히 모델링하고 있음을 보여 주었다. 이는 KUeyes의 작동 방식과 거기에 탑재된 영상 처리 기법들이 인간의 시각 정보처리 과정을 이해하는데 매우 적합한 것임을 시사한다.

  • PDF

A Survey on Visual Interference Elements Improvement Techniques to Improve Camera Performance (카메라의 성능 향상을 위한 시각적 방해 요소 개선 기법 조사)

  • Park, Hyunkook;Ji, Hyunseo;Choi, Heesu;Lee, Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.605-607
    • /
    • 2019
  • 최적의 사진을 얻기 위해 시각적 방해요소들을 개선할 수 있는 기술들을 조사했다. CNN 모델을 활용한 HDR 이미지 재구성, 방해물과 원하는 피사체와의 깊이 차이에서 생기는 시차를 이용한 이미지 처리를 사용해서 시각적 방해요소를 개선하는 알고리즘을 기술했다.

A Safety Score Prediction Model in Urban Environment Using Convolutional Neural Network (컨볼루션 신경망을 이용한 도시 환경에서의 안전도 점수 예측 모델 연구)

  • Kang, Hyeon-Woo;Kang, Hang-Bong
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.8
    • /
    • pp.393-400
    • /
    • 2016
  • Recently, there have been various researches on efficient and automatic analysis on urban environment methods that utilize the computer vision and machine learning technology. Among many new analyses, urban safety analysis has received a major attention. In order to predict more accurately on safety score and reflect the human visual perception, it is necessary to consider the generic and local information that are most important to human perception. In this paper, we use Double-column Convolutional Neural network consisting of generic and local columns for the prediction of urban safety. The input of generic and local column used re-sized and random cropped images from original images, respectively. In addition, a new learning method is proposed to solve the problem of over-fitting in a particular column in the learning process. For the performance comparison of our Double-column Convolutional Neural Network, we compare two Support Vector Regression and three Convolutional Neural Network models using Root Mean Square Error and correlation analysis. Our experimental results demonstrate that our Double-column Convolutional Neural Network model show the best performance with Root Mean Square Error of 0.7432 and Pearson/Spearman correlation coefficient of 0.853/0.840.

Representation of Spatio-Temporal Relations for Understanding Object Motion in Video (비디오의 객체 움직임 이해를 위한 시공간 관계 표현)

  • Choi, Jun-Ho;Cho, Mi-Young;Kim, Pan-Koo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.883-885
    • /
    • 2005
  • 비디오 데이터에서 의미적 인식을 위해 활용되는 요소 중 하나가 객체에 대한 움직임 정보로 이는 비디오 데이터에 대한 색인과 내용 기반 검색을 수행하는데 중요한 역할을 한다. 본 논문에서는 효율적인 객체기반 비디오 검색과 비디오의 움직임 해석을 위한 시공간 관계 표현 방법을 제시한다. 비디오의 객체표현 방법은 Polygon-based Bounding Volume의 3차원 Mesh 모델을 생성한 후 이를 이용하여 비디오 내 개체의 구조적 내용을 저차원적 속성과 움직임에 대한 기본 구조로 활용하였다. 또한, 움직임 객체에 대해 시공간적 특성과 시각적 특성을 동시에 고려하여 표현되도록 하였다. 각 Vertex는 시각적 특징 중 일부분이고, 비디오 내 개체의 공간적 특성과 개체의 움직임은 Volume Trajectory로 모델링되고, 개체와 개체간의 시공간적 관계를 표현하기 위한 Operation을 정의한다.

  • PDF

Development of a Visual Simulation Tool for Object Behavior Chart based on LOTOS Formalism (객체행위챠트를 위한 LOTOS 정형기법 기반 시각적 시뮬레이션 도구의 개발)

  • Lee, Gwang-Yong;O, Yeong-Bae
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.5 no.5
    • /
    • pp.595-610
    • /
    • 1999
  • This paper presents a visual simulation tool for verification and validation(V&V) of design implications of the Object Behavior Chart developed in accordance with the existing real-time object's behavior design method. This tool can simulates the dynamic interactions using the executable simulation machine, that is EFSM(Extended Finite State Machine) and can detect various logical and temporal errors in the visual object behavior charts before a concrete implementation is made. For this, a LOTOS prototype specification is automatically generated from the visual Object Behavior Chart, and is translated into an EFSM. This system is implemented in Visual C++ version 4.2 and currently runs on PC Windows 95 environment. For simulation purpose, LOTOS was chosen because of it's excellence in specifying communication protocols. Our research contributes to the support tools for seamlessly integrating methodology-based graphical models and formal-based simulation techniques, and also contributes to the automated V&V of the Visual Models.

소프트웨어 테스트 정지시각 결정 방법에 대한 연구

  • 최규식;장원석;김종기
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2001.06a
    • /
    • pp.485-488
    • /
    • 2001
  • 소프트웨어의 신뢰도모델을 적용하는 중요한 일 중의 하나는 소프트웨어 발행시각을 결정하는 일이다. 이 문제에 대해서 여러 연구자들이 그동안 많은 연구논문을 발표하였다. 본 논문에서는 최적발행시각을 결정하는 문제를 심도있게 다루고자 하였다. 특정한 발행시각을 결정하는데 있어서 신뢰도 요건 및 비용 모델 모두를 고려하여 고찰한다. 신뢰도 목표로서 허용치 이내의 고장강도를 사용해야 하며, 최적 발행방책은 순차적인 접근법에 근거하여 검토

  • PDF

Shape Comparison for Human Organ Models Using Multi-resolution Silhouette Images (다해상도 실루엣 영상을 이용한 인체 장기 모델에 대한 형상 비교)

  • 김정식;최수미
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.688-690
    • /
    • 2003
  • 본 논문에서는 다해상도 2차원 실루엣 영상들을 이용하여 3차원 모델간의 형상 유사성을 비교하기 위한 방법을 제안한다. 제안 시스템은 포즈 정규화 모듈, 유사성 계산 모듈, 3차원 시각화 모듈로 구성된다. 형상 비교를 위해서 먼저, 3차원 인체 장기 모델을 입력으로 받아서 정규화를 수행하고, 다해상도 깊이맵을 획득한다. 이어서 유사성 비교를 위해 실루엣 영상을 추출한 후, 유사도 측정을 위해 시그니쳐를 측도로 사용한다. 최종적으로 계산된 결과들은 3차원 글리프 및 컬러 코딩을 이용하여 시각화된다. 본 논문에서 제시한 3차원 형상 비교 시스템은 전처리 단계에서의 정규화 수행을 통하여 스케일 및 회전 변환에 불변하는 특성을 보인다. 그리고 다양한 레벨의 깊이맵을 형상 비교에 사용하여 다해상도 기반의 유사성 평가를 지원하며, 평가 계산 속도와 정확성간의 유연성을 제공한다. 또한 3차원 히스토그램. 3차윈 글리프. 컬러 코딩 시각화 기법들과 2차원 실루엣 피킹 인터페이스를 통하여 인체 장기 모델간의 정량적 형상 차이를 사용자가 직관적으로 평가할 수 있도록 한다. 본 시스템은 차후 데이터베이스를 이용한 원격 진료 시스템에서의 질병 진단, 추적 관찰. 치료계획 등에 활용될 수 있을 것이다.

  • PDF

LVLN : A Landmark-Based Deep Neural Network Model for Vision-and-Language Navigation (LVLN: 시각-언어 이동을 위한 랜드마크 기반의 심층 신경망 모델)

  • Hwang, Jisu;Kim, Incheol
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.9
    • /
    • pp.379-390
    • /
    • 2019
  • In this paper, we propose a novel deep neural network model for Vision-and-Language Navigation (VLN) named LVLN (Landmark-based VLN). In addition to both visual features extracted from input images and linguistic features extracted from the natural language instructions, this model makes use of information about places and landmark objects detected from images. The model also applies a context-based attention mechanism in order to associate each entity mentioned in the instruction, the corresponding region of interest (ROI) in the image, and the corresponding place and landmark object detected from the image with each other. Moreover, in order to improve the success rate of arriving the target goal, the model adopts a progress monitor module for checking substantial approach to the target goal. Conducting experiments with the Matterport3D simulator and the Room-to-Room (R2R) benchmark dataset, we demonstrate high performance of the proposed model.

로버스트 축차 확률비 검정의 설계 및 구현

  • Choe, In-Hun;Park, No-Jin
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.91-95
    • /
    • 2003
  • 본 논문에서는 정보 전달 능력이 향상된 변형된 축차확률비검정을 소개한다. 새로운 검정은기존의 검정과 수학적인 면에서 공동된 점들을 갖고 있으나, 이상치의 영향을 덜 받고 더욱이 그 존재에 대하여 시각적으로 보여주며, 또한 자료의 변화에 보다 민감하게 반응하는 특성이 있다. 새롭게 제안된 로버스트 축차확률비검정 시스템을 Microsoft사의 Visual Basic 6.0 언어로 구현하여 본 연구에서 제안한 모델과 기존의 검정모델을 비교한 결과 제안된 검정 모델의 우수성과 실용가능성을 실증적으로 확인하였다.

  • PDF

Workbench for building Task based Dialog System (태스크 기반 대화 시스템 구축 도구)

  • Park, Eun-Jin;Kwon, Oh-Woog;Kim, Young-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.209-211
    • /
    • 2012
  • 본 논문의 대화시스템 구축도구는 태스크 기반 대화 시스템을 구축하는데 필요한 대화 시나리오 지식과 이를 처리하는 태스크 그래프, 슬롯 체계, 대화 라이브러리 등을 생성하고 관리할 수 있는 웹기반 대화 시스템 구축 도구이다. 이 도구는 태스크 그래프를 시각적으로 대화 모델 설계자에게 표시하고, 대화 모델 설계자는 시각적으로 표시된 태스크 그래프를 보며 태스크의 흐름을 한눈에 파악하고 대화 시스템의 시나리오 흐름을 생성하고 편집할 수 있도록 한 것이 특징이다. 또한 대화 모델 설계자와 시나리오 태깅 작업자들 모두는 자신이 구축한 지식이나 대화 태스크를 시스템에 직접 반영하고 실시간으로 대화 시스템에 적용해 봄으로써 대화 시스템의 이해를 높이고 고품질의 대화 시스템을 구축할 수 있다.

  • PDF