• 제목/요약/키워드: Arbitrary feature

검색결과 81건 처리시간 0.025초

임의의 위치에 인쇄된 우정업무용 폭 및 높이 변조형 바코드의 인식 (Recognition of width and height modulated barcode printed at arbitrary position for postal service)

  • 김현수;이강희;유중돈
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.805-814
    • /
    • 1998
  • 우편물의 정보처리를 위하여 임의의 위치에 인쇄된 높이 변조 및 폭 변조 바코드를 인식할 수 있는 효율적인 화상 처리 알고리즘을 제안하였다. 바코드를 인식하기 위하여 주소와 바코드 등이 포함된 화상으로부터 바코드 영역을 분리시켜 추출하여야 한다, 본 연구에서는 Sobel 연산자로 계산한 바코드의 기울기 정보를 이용하여 임의의 각도로 회전된 바코드의 영역을 추출하였고, 추출된 바코드 영역을 이치화하여 폭과 높이 변조형 바코드를 해독 하였다. 제안한 화상처리 알고리즘은 다양한 조건하에서 4 state 및 폭 변조 바코드에 적용하였으며, 1통의 우편물을 처리하는데 0.86초가 소요되었고 98%이상의 인식률을 얻었다. 제안한 알고리즘은 폭과 높이 변조형 바코드의 인식에 함께 적용 가능하므로 향후 우정업무의 정보치리에 활용될 것으로 기대된다.

  • PDF

Generative Adversarial Networks for single image with high quality image

  • Zhao, Liquan;Zhang, Yupeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권12호
    • /
    • pp.4326-4344
    • /
    • 2021
  • The SinGAN is one of generative adversarial networks that can be trained on a single nature image. It has poor ability to learn more global features from nature image, and losses much local detail information when it generates arbitrary size image sample. To solve the problem, a non-linear function is firstly proposed to control downsampling ratio that is ratio between the size of current image and the size of next downsampled image, to increase the ratio with increase of the number of downsampling. This makes the low-resolution images obtained by downsampling have higher proportion in all downsampled images. The low-resolution images usually contain much global information. Therefore, it can help the model to learn more global feature information from downsampled images. Secondly, the attention mechanism is introduced to the generative network to increase the weight of effective image information. This can make the network learn more local details. Besides, in order to make the output image more natural, the TVLoss function is introduced to the loss function of SinGAN, to reduce the difference between adjacent pixels and smear phenomenon for the output image. A large number of experimental results show that our proposed model has better performance than other methods in generating random samples with fixed size and arbitrary size, image harmonization and editing.

딥러닝 기반 임의적 스케일 초해상도 모듈을 이용한 Mask-RCNN 성능 향상 (Improvement of Mask-RCNN Performance Using Deep-Learning-Based Arbitrary-Scale Super-Resolution Module)

  • 안영필;박현준
    • 한국정보통신학회논문지
    • /
    • 제26권3호
    • /
    • pp.381-388
    • /
    • 2022
  • 인스턴스 분할에서 Mask-RCNN은 베이스 모델로 자주 사용된다. Mask-RCNN의 성능을 높이는 것은 파생된 모델에 영향을 미치기에 의미가 있다. Mask-RCNN에는 입력 이미지 크기를 배치 크기로 통일시키는 변환 모듈(transform module)이 있다. 이 논문에서는 Mask-RCNN의 성능 향상을 위해 변환 모듈의 크기 조정 부분에 딥러닝 기반 ASSR(Arbitrary-Scale Super-Resolution)을 적용하고, 스케일 정보를 모델의 IM(Integration Module)을 이용하여 주입한다. 제안하는 방법을 COCO 데이터세트에 적용하였을 때 인스턴스 분할 성능이 Mask-RCNN 성능보다 2.5 AP 높았다. 그리고 제안하는 IM 위치 최적화를 위한 실험에서는 FPN(Feature Pyramid Network)과 백본(backbone)이 결합하기 전의 'Top' 위치에 배치했을 때 가장 좋은 성능을 보였다. 따라서 제안하는 방법은 Mask-RCNN을 베이스 모델로 사용하는 모델들의 성능을 향상시킬 수 있다.

Three Degrees of Freedom Global Calibration Method for Measurement Systems with Binocular Vision

  • Xu, Guan;Zhang, Xinyuan;Li, Xiaotao;Su, Jian;Lu, Xue;Liu, Huanping;Hao, Zhaobing
    • Journal of the Optical Society of Korea
    • /
    • 제20권1호
    • /
    • pp.107-117
    • /
    • 2016
  • We develop a new method to globally calibrate the feature points that are derived from the binocular systems at different positions. A three-DOF (degree of freedom) global calibration system is established to move and rotate the 3D calibration board to an arbitrary position. A three-DOF global calibration model is constructed for the binocular systems at different positions. The three-DOF calibration model unifies the 3D coordinates of the feature points from different binocular systems into a unique world coordinate system that is determined by the initial position of the calibration board. Experiments are conducted on the binocular systems at the coaxial and diagonal positions. The experimental root-mean-square errors between the true and reconstructed 3D coordinates of the feature points are 0.573 mm, 0.520 mm and 0.528 mm at the coaxial positions. The experimental root-mean-square errors between the true and reconstructed 3D coordinates of the feature points are 0.495 mm, 0.556 mm and 0.627 mm at the diagonal positions. This method provides a global and accurate calibration to unity the measurement points of different binocular vision systems into the same world coordinate system.

셀룰러 토폴로지를 이용한 프로그레시브 솔리드 모델 생성 및 전송 (Generation and Transmission of Progressive Solid Models U sing Cellular Topology)

  • 이재열;이주행;김현;김형선
    • 한국CDE학회논문집
    • /
    • 제9권2호
    • /
    • pp.122-132
    • /
    • 2004
  • Progressive mesh representation and generation have become one of the most important issues in network-based computer graphics. However, current researches are mostly focused on triangular mesh models. On the other hand, solid models are widely used in industry and are applied to advanced applications such as product design and virtual assembly. Moreover, as the demand to share and transmit these solid models over the network is emerging, the generation and the transmission of progressive solid models depending on specific engineering needs and purpose are essential. In this paper, we present a Cellular Topology-based approach to generating and transmitting progressive solid models from a feature-based solid model for internet-based design and collaboration. The proposed approach introduces a new scheme for storing and transmitting solid models over the network. The Cellular Topology (CT) approach makes it possible to effectively generate progressive solid models and to efficiently transmit the models over the network with compact model size. Thus, an arbitrary solid model SM designed by a set of design features is stored as a much coarser solid model SM/sup 0/ together with a sequence of n detail records that indicate how to incrementally refine SM/sup 0/ exactly back into the original solid model SM = SM/sup 0/.

CNN 기반의 와일드 환경에 강인한 고속 얼굴 검출 방법 (Fast and Robust Face Detection based on CNN in Wild Environment)

  • 송주남;김형일;노용만
    • 한국멀티미디어학회논문지
    • /
    • 제19권8호
    • /
    • pp.1310-1319
    • /
    • 2016
  • Face detection is the first step in a wide range of face applications. However, detecting faces in the wild is still a challenging task due to the wide range of variations in pose, scale, and occlusions. Recently, many deep learning methods have been proposed for face detection. However, further improvements are required in the wild. Another important issue to be considered in the face detection is the computational complexity. Current state-of-the-art deep learning methods require a large number of patches to deal with varying scales and the arbitrary image sizes, which result in an increased computational complexity. To reduce the complexity while achieving better detection accuracy, we propose a fully convolutional network-based face detection that can take arbitrarily-sized input and produce feature maps (heat maps) corresponding to the input image size. To deal with the various face scales, a multi-scale network architecture that utilizes the facial components when learning the feature maps is proposed. On top of it, we design multi-task learning technique to improve detection performance. Extensive experiments have been conducted on the FDDB dataset. The experimental results show that the proposed method outperforms state-of-the-art methods with the accuracy of 82.33% at 517 false alarms, while improving computational efficiency significantly.

통합된 시스템에서의 얼굴검출과 인식기법 (An Integrated Face Detection and Recognition System)

  • 박동희;이규봉;이유홍;나상동;배철수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.165-170
    • /
    • 2003
  • 본 논문에서는 임의의 장면에도 얼굴 인식에 영향을 받지 않는 통합된 얼굴 인식 방법을 제안한다. 크기 정규화는 피부 색 분할과 log-poler 매핑 절차의 새로운 조합을 통하여 얻어지고, 주요 얼굴 구성 요소 분석은 자세 변화들을 처리하기 위하여 제안된 멀티 뷰 접근을 통해 이루어진다. 주어진 컬러 입력 이미지로부터 검출기는 얼굴을 원형 경계 안에 둘러싸고 코의 위치를 표시하며 다음 인식을 위해, 원형 경계 내에 배치하는 방사형 격자는 특징 벡터 코 중심에 두었다. 컬러로 분할된 영역의 폭으로서 얼굴의 크기를 평가하고, 추출된 특징 벡터는 평가된 크기에 의하여 정규화된 크기이다. 특징 벡터는 얼굴 인식을 위해 훈련된 신경망 분류자에게 입력된다. 시스템은 서로 다른 복합적인 배경에서 다양한 크기와 자세를 가진 20명의 얼굴 데이터 베이스를 사용하여 실험한 결과 얼굴 인식기의 수행능력은 매우 작은 크기의 얼굴 이미지 외에는 87%에서 92%의 평균 인식율을 얻을 수 있었다.

  • PDF

통합된 시스템에서의 얼굴검출과 인식기법 (An Integrated Face Detection and Recognition System)

  • 박동희;배철수
    • 한국정보통신학회논문지
    • /
    • 제7권6호
    • /
    • pp.1312-1317
    • /
    • 2003
  • 본 논문에서는 임의의 장면에도 얼굴 인식에 영향을 받지 않는 통합된 얼굴 인식 방법을 제안한다. 크기 정규화는 피부 색 분할과 log-polar 매핑 절차의 새로운 조합을 통하여 얻어지고, 주요 얼굴 구성 요소 분석은 자세 변화들을 처리하기 위하여 제안된 멀티 뷰 접근을 통해 이루어진다. 주어진 컬러 입력 이미지로부터 검출기는 얼굴을 원형 경계 안에 둘러싸고 코의 위치를 표시하며 다음 인식을 위해, 원형 경계 내에 배치하는 방사형 격자는 특징 벡터 코 중심에 두었다. 컬러로 분할된 영역의 폭으로서 얼굴의 크기를 평가하고, 추출된 특정 벡터는 평가된 크기에 의하여 정규화 된 크기이다. 특징 벡터는 얼굴 인식을 위해 훈련된 신경망 분류자에게 입력된다. 시스템은 서로 다른 복합적인 배경에서 다양한 크기와 자세를 가진 20 명의 얼굴 데이터 베이스를 사용하여 실험한 결과 얼굴 인식기의 수행능력은 매우 작은 크기의 얼굴 이미지 외에는 87%에서 92%의 평균 인식율을 얻을 수 있었다.

자기 정규화를 통한 도메인 불변 특징 학습 (Learning Domain Invariant Representation via Self-Rugularization)

  • 현재국;이찬용;김호성;유현정;고은진
    • 한국군사과학기술학회지
    • /
    • 제24권4호
    • /
    • pp.382-391
    • /
    • 2021
  • Unsupervised domain adaptation often gives impressive solutions to handle domain shift of data. Most of current approaches assume that unlabeled target data to train is abundant. This assumption is not always true in practices. To tackle this issue, we propose a general solution to solve the domain gap minimization problem without any target data. Our method consists of two regularization steps. The first step is a pixel regularization by arbitrary style transfer. Recently, some methods bring style transfer algorithms to domain adaptation and domain generalization process. They use style transfer algorithms to remove texture bias in source domain data. We also use style transfer algorithms for removing texture bias, but our method depends on neither domain adaptation nor domain generalization paradigm. The second regularization step is a feature regularization by feature alignment. Adding a feature alignment loss term to the model loss, the model learns domain invariant representation more efficiently. We evaluate our regularization methods from several experiments both on small dataset and large dataset. From the experiments, we show that our model can learn domain invariant representation as much as unsupervised domain adaptation methods.

An Implementation of Pipelined Prallel Processing System for Multi-Access Memory System

  • Lee, Hyung;Cho, Hyeon-Koo;You, Dae-Sang;Park, Jong-Won
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.149-151
    • /
    • 2002
  • We had been developing the variety of parallel processing systems in order to improve the processing speed of visual media applications. These systems were using multi-access memory system(MAMS) as a parallel memory system, which provides the capability of the simultaneous accesses of image points in a line-segment with an arbitrary degree, which is required in many low-level image processing operations such as edge or line detection in a particular direction, and so on. But, the performance of these systems did not give a faithful speed because of asynchronous feature between MAMS and processing elements. To improve the processing speed of these systems, we have been investigated a pipelined parallel processing system using MAMS. Although the system is considered as being the single instruction multiple data(SIMD) type like the early developed systems, the performance of the system yielded about 2.5 times faster speed.

  • PDF