• 제목/요약/키워드: Visual Algorithm

검색결과 1,404건 처리시간 0.029초

웹 환경 하에서의 제약 만족 기법에 의한 공간 계획 시스템 (A Web-based Spatial Layout Planning System with Constraint Satisfaction Problems)

  • 정재은;전승범;조근식
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권2호
    • /
    • pp.216-224
    • /
    • 2000
  • 공간 계획 시스템(Spatial Layout Planning System)은 사용자의 요구에 따라 사각의 자원을 일정 공간 안에 할당하고 사용자의 만족도를 최대화함으로써 공간 효율성을 최적화하는 시스템이다. 공간 계획 문제는 방대한 범위의 공간을 탐색해야 하므로 시간과 공간적 측면에서 높은 복잡도(Complexity)를 갖는 문제이다. 또한 특정 영역의 수정 요구나 재설계 요구와 같은 사용자의 동적인 요구 사항들을 수용할 수도 있어야 한다. 본 논문에서는 CSP(Constraint Satisfaction Problems) 해결 기법 기반의 자원 할당법을 이용함으로써 효과적으로 공간 계획 문제를 해결할 수 있도록 하였으며 사용자의 요구에 따라 변화되는 제약조건은 지능형 사용자 인터페이스 모델을 통해 좀 더 향상된 결과가 도출될 수 있도록 설계 및 구현하였다. 또한, 2차원 도면에서의 수정 요구에 대한 편이성과 시각적 검증을 위해 웹 환경 하에서의 VRML(Virtual Reality Modeling Language)을 이용한 3차원 도면을 보여준다.

  • PDF

히스토그램 변형을 이용한 HDR 영상 렌더링을 위한 인지기반 톤 맵핑 기법 (Perception-Based Tone Mapping Technique for Rendering HDR Image Using Histogram Modification)

  • 김원균;하창우;정제창
    • 한국통신학회논문지
    • /
    • 제38A권11호
    • /
    • pp.919-927
    • /
    • 2013
  • 본 논문에서는 HDR (high dynamic range) 영상 렌더링을 위한 히스토그램 변형 기법을 이용한 인지기반 톤 맵핑(tone mapping) 기법을 제안한다. HDR 톤 맵핑 알고리듬은 넓은 동적 영역을 갖는 영상을 LDR (low dynamic range) 영상 장치에 표현하기 위해 사용된다. 인간의 시각특성을 이용한 톤 맵핑 알고리듬은 상당히 효과적이지만 고정된 형태의 맵핑 함수를 사용하기 때문에 모든 영상에서 동일한 성능을 얻지 못한다. 제안하는 방법은 인지기반 톤 맵핑 함수와 히스토그램 변형기법을 적용하여 HDR 영상의 동적 영역을 압축한다. 인지기반 톤 맵핑 함수를 이용해서 원 영상의 히스토그램을 제한하고 보상과정을 통해서 적응적인 톤 맵핑 함수를 얻을 수 있다. 이는 화소값에 따라 서로 다른 제약조건들을 사용함으로써 contrast를 향상시킬 뿐만 아니라 원 영상의 디테일도 보존한다. 또한, 히스토그램 변형기법을 사용함으로써 과도한 히스토그램 평활화로 인한 왜곡을 개선할 수 있고, 더욱이 제어파라미터를 이용하여 영상의 contrast를 조정할 수 있다. 시뮬레이션 및 실험을 통해 주관적 및 객관적 성능을 비교하고 기존 방법에 비해 제안한 방법이 우수함을 입증한다.

GuessWhat?! 문제에 대한 분석과 파훼 (Analyzing and Solving GuessWhat?!)

  • 이상우;한철호;허유정;강우영;전재현;장병탁
    • 정보과학회 논문지
    • /
    • 제45권1호
    • /
    • pp.30-35
    • /
    • 2018
  • GuessWhat?!은 질문자와 답변자로 구성된 두 플레이어가 이미지를 보고 질문자에게 비밀로 감추어진 정답 물체에 대해 예/아니오/잘 모르겠음 셋 중 하나로 묻고 답하며, 정답 물체를 추려 나가는 문제이다. GuessWhat?!은 최근 컴퓨터 비전과 인공지능 대화 시스템의 테스트베드로서 컴퓨터 비전과 인공지능 학계의 많은 관심을 받았다. 본 논문에서, 우리는 GuessWhat?! 게임 프레임워크가 가지는 특성에 대해 논의한다. 더 나아가, 우리는 제안된 틀을 기반으로 GuessWhat?!의 간단한 solution을 제안한다. 사람이 평균 4~5개 정도의 질문을 통하여 맞추는 이 문제에 대하여, 우리가 제안한 방법은 2개의 질문만으로 기존 딥러닝 기반 기술의 성능을 상회하는 성능을 보이며, 5개의 질문이 허용되면 인간 수준의 성능을 능가한다.

A Hybrid Proposed Framework for Object Detection and Classification

  • Aamir, Muhammad;Pu, Yi-Fei;Rahman, Ziaur;Abro, Waheed Ahmed;Naeem, Hamad;Ullah, Farhan;Badr, Aymen Mudheher
    • Journal of Information Processing Systems
    • /
    • 제14권5호
    • /
    • pp.1176-1194
    • /
    • 2018
  • The object classification using the images' contents is a big challenge in computer vision. The superpixels' information can be used to detect and classify objects in an image based on locations. In this paper, we proposed a methodology to detect and classify the image's pixels' locations using enhanced bag of words (BOW). It calculates the initial positions of each segment of an image using superpixels and then ranks it according to the region score. Further, this information is used to extract local and global features using a hybrid approach of Scale Invariant Feature Transform (SIFT) and GIST, respectively. To enhance the classification accuracy, the feature fusion technique is applied to combine local and global features vectors through weight parameter. The support vector machine classifier is a supervised algorithm is used for classification in order to analyze the proposed methodology. The Pascal Visual Object Classes Challenge 2007 (VOC2007) dataset is used in the experiment to test the results. The proposed approach gave the results in high-quality class for independent objects' locations with a mean average best overlap (MABO) of 0.833 at 1,500 locations resulting in a better detection rate. The results are compared with previous approaches and it is proved that it gave the better classification results for the non-rigid classes.

MPEG-4 FGS 비디오를 위한 사각영역 기반의 선택적 향상기법 (Rectangular Region-based Selective Enhancement (RSE) for MPEG-4 FGS Video)

  • 서광덕;신창호;김재균
    • 한국통신학회논문지
    • /
    • 제28권6C호
    • /
    • pp.634-647
    • /
    • 2003
  • 본 논문에서는 MPEG-4 FGS (fine granular scalability) 영상부호화 기법 중에서, 수신측의 주관적 화질을 향상시키기 위한 기법인 선택적 향상 (SE: selective enhancement) 기법이 갖는 추가 비트율의 증가 문제를 효과적으로 해결하는 방법을 제안한다. 본 논문에서 제안하는 RSE기법은 기존의 FGS SE기법의 향상계층에서 발생하는 비트량 증가 문제를 효과적으로 해결하기 위해서 다음과 같은 새로운 알고리즘에 기반 한다. 첫째, 매크로블록 기즌으로 선택하는 기존의 SE기법을 사각영역 (rectangular region) 기준으로 선택하는 SE기법 (RSE)으로 변경한다. 이렇게 함으로써 SE기법의 적용대상의 표현이 화면별로 간편하게 서술되어 비트율을 줄일 수 있다. 둘째, 비트평면 (bit-plane)부호화의 대상을 제한하는 제한형 비트평면 주사 (CBS. constrained bit-plane scanning) 기법을 적용한다. 이렇게 함으로써 SE기법에서 발생하는 비트평면의 개수 증가 및 ALL-ZERO 심볼의 증가로 인한 비트율 증가 문제를 해결할 수 있다. 모의실험을 통해, 기존의 표준 SE기법에 비해 제안된 RSE기법의 부호화 효율과 수신측 영상의 화질이 향상됨을 확인한다.

Verification of the Reliability and Validity of the Short Form 36 Scale in Indonesian Middle-aged and Older Adults

  • Arovah, Novita Intan;Heesch, Kristiann C.
    • Journal of Preventive Medicine and Public Health
    • /
    • 제53권3호
    • /
    • pp.180-188
    • /
    • 2020
  • Objectives: The Short Form 36 (SF-36) questionnaire is increasingly being used to measure health-related quality of life (HRQoL) in Indonesia. However, evidence that it is valid for use in Indonesian adults is lacking. This study assessed the validity and reliability of the SF-36 in Indonesian middle-aged and older adults. Methods: Adults aged 46-81 years (n=206) in Yogyakarta, Indonesia completed the SF-36, another measure of HRQoL (the EuroQoL visual analogue scale [EQ-VAS]), and measures assessing their demographic characteristics. Fifty-four percent (n=121) completed the SF-36 measure again 1 week later. Confirmatory factor analysis was conducted to confirm the factor structure of the SF-36. Internal consistency reliability was estimated using Cronbach's alpha, and test-retest reliability was assessed using intraclass correlations. Convergent and discriminant validity were assessed by computing correlations among SF-36 subscales, between subscales and the 2 component scores, and between component scores and EQ-VAS scores. Results: Most scaling assumptions were met. The hypothetical factor structure fit the data poorly (root mean square error of approximation [RMSEA]=0.108) and modification was required for a good fit (RMSEA=0.060). Scores on all subscales demonstrated acceptable internal consistency (α>0.70) and test-retest reliability (r>0.70). Divergent validity was supported by weak to moderate interscale correlations (r=0.19 to 0.64). As expected, the 2 summary scores were moderately to strongly correlated with the EQ-VAS (r>0.60). Conclusions: The findings adequately support the use of SF-36 in Indonesian middle-aged and older adults, although the optimal algorithm for computing component scores in Indonesia warrants further investigation.

Fast Depth Video Coding with Intra Prediction on VVC

  • Wei, Hongan;Zhou, Binqian;Fang, Ying;Xu, Yiwen;Zhao, Tiesong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권7호
    • /
    • pp.3018-3038
    • /
    • 2020
  • In the stereoscopic or multiview display, the depth video illustrates visual distances between objects and camera. To promote the computational efficiency of depth video encoder, we exploit the intra prediction of depth videos under Versatile Video Coding (VVC) and observe a diverse distribution of intra prediction modes with different coding unit sizes. We propose a hybrid scheme to further boost fast depth video coding. In the first stage, we adaptively predict the HADamard (HAD) costs of intra prediction modes and initialize a candidate list according to the HAD costs. Then, the candidate list is further improved by considering the probability distribution of candidate modes with different CU sizes. Finally, early termination of CU splitting is performed at each CU depth level based on the Bayesian theorem. Our proposed method is incorporated into VVC intra prediction for fast coding of depth videos. Experiments with 7 standard sequences and 4 Quantization parameters (Qps) validate the efficiency of our method.

웹 지도서비스를 위한 다축척 지도 데이터셋 자동생성 기법 연구 (Automated Generation of Multi-Scale Map Database for Web Map Services)

  • 박우진;방윤식;유기윤
    • 한국측량학회지
    • /
    • 제30권5호
    • /
    • pp.435-444
    • /
    • 2012
  • 웹 환경에서의 지도서비스 및 위치기반서비스를 제공하기 위해서는 다축척 지도 데이터베이스를 구축하여야 하나, 제작과정이 아직까지 수동편집에 의존하는 경우가 많았다. 본 연구에서는 기본 지도 자료로부터 다축척 지도 데이터베이스를 자동으로 구축하기 위한 지도 일반화 기법을 제안하고 이를 실제 지도 데이터에 적용하여 프로토타입의 다축척 지도 데이터셋을 생성하고자 한다. 지도 일반화 기법으로는 선택 및 삭제, 단순화, 병합 등의 연산자를 조합하여 적용하였으며, 각각 연산자의 알고리듬과 파라미터들은 T$\ddot{o}$pfer's radical law, 지도의 최소도화 기준, 시각적 표현정도 등을 종합적으로 고려하여 실험적으로 결정하였다. 목표 축척수준은 1:1,000, 1:5,000, 1:25,000, 1:100,000, 1:500,000 의 5단계로 설정하였으며, 대상이 되는 기본 지도 자료는 도로명주소 전자지도와 수치지형도를 사용하였다.

GCST 기반 디지털 영상 워터마킹 방법 (A GCST-based Digital Image Watermarking Scheme)

  • 이적식
    • 융합신호처리학회논문지
    • /
    • 제13권3호
    • /
    • pp.142-149
    • /
    • 2012
  • 여러 영상 변환들은 영상을 압축하고, 영상 속에 존재하는 잡음을 제거하고, 유용한 특징을 추출하기 위해서 사용될 수 있다. DCT와 DWT 변환은 멀티미디어의 확산으로 워터마킹 기법에 많이 연구되고 있다. 본 논문에서는 인간시각필터로 고려되는 Gabor 코사인과 사인 함수를 이용한 변환을 디지털 영상의 워터마크 삽입과 추출에 사용하였다. 15가지 공격에 대해서 제안한 변환 방법을 워터마킹에 적용한다. 삽입한 워터마크는 무작위 정규분포 잡음이고, 삽입한 워터마크와 추출한 워터마크 사이의 유사성을 측정하기 위하여 상관값을 계산하였으며, 기존의 DCT 방법과 성능을 비교하였다. 추출된 워터마크는 무작위 정규분포 시퀀스와 상관값을 계산하여 가장 큰 값을 갖는 시퀀스를 삽입된 워터마크로 선언하였다. 주파수 성분을 여러 대역으로 구분하여, 저주파와 중간 주파수 대역에서 실험한 결과는 제안한 방법이 좋은 워터마킹 방법으로 사용할 수 있음을 나타내며, 아울러 DCT보다 더 좋은 성능을 보여준다.

컴퓨터 시각(視覺)에 의거한 측정기술(測定技術) 및 측정오차(測定誤差)의 분석(分析)과 보정(補正) (Computer Vision Based Measurement, Error Analysis and Calibration)

  • 황헌;이충호
    • Journal of Biosystems Engineering
    • /
    • 제17권1호
    • /
    • pp.65-78
    • /
    • 1992
  • When using a computer vision system for a measurement, the geometrically distorted input image usually restricts the site and size of the measuring window. A geometrically distorted image caused by the image sensing and processing hardware degrades the accuracy of the visual measurement and prohibits the arbitrary selection of the measuring scope. Therefore, an image calibration is inevitable to improve the measuring accuracy. A calibration process is usually done via four steps such as measurement, modeling, parameter estimation, and compensation. In this paper, the efficient error calibration technique of a geometrically distorted input image was developed using a neural network. After calibrating a unit pixel, the distorted image was compensated by training CMLAN(Cerebellar Model Linear Associator Network) without modeling the behavior of any system element. The input/output training pairs for the network was obtained by processing the image of the devised sampled pattern. The generalization property of the network successfully compensates the distortion errors of the untrained arbitrary pixel points on the image space. The error convergence of the trained network with respect to the network control parameters were also presented. The compensated image through the network was then post processed using a simple DDA(Digital Differential Analyzer) to avoid the pixel disconnectivity. The compensation effect was verified using known sized geometric primitives. A way to extract directly a real scaled geometric quantity of the object from the 8-directional chain coding was also devised and coded. Since the developed calibration algorithm does not require any knowledge of modeling system elements and estimating parameters, it can be applied simply to any image processing system. Furthermore, it efficiently enhances the measurement accuracy and allows the arbitrary sizing and locating of the measuring window. The applied and developed algorithms were coded as a menu driven way using MS-C language Ver. 6.0, PC VISION PLUS library functions, and VGA graphic functions.

  • PDF