• 제목/요약/키워드: Multi-objects transformation

검색결과 21건 처리시간 0.031초

Label Restoration Using Biquadratic Transformation

  • Le, Huy Phat;Nguyen, Toan Dinh;Lee, Guee-Sang
    • International Journal of Contents
    • /
    • 제6권1호
    • /
    • pp.6-11
    • /
    • 2010
  • Recently, there has been research to use portable digital camera to recognize objects in natural scene images, including labels or marks on a cylindrical surface. In many cases, text or logo in a label can be distorted by a structural movement of the object on which the label resides. Since the distortion in the label can degrade the performance of object recognition, the label should be rectified or restored from deformations. In this paper, a new method for label detection and restoration in digital images is presented. In the detection phase, the Hough transform is employed to detect two vertical boundaries of the label, and a horizontal edge profile is analyzed to detect upper-side and lower-side boundaries of the label. Then, the biquadratic transformation is used to restore the rectangular shape of the label. The proposed algorithm performs restoration of 3D objects in a 2D space, and it requires neither an auxiliary hardware such as 3D camera to construct 3D models nor a multi-camera to capture objects in different views. Experimental results demonstrate the effectiveness of the proposed method.

개선된 터치점 검출과 제스쳐 인식에 의한 DI 멀티터치 디스플레이 구현 (Implementation of a DI Multi-Touch Display Using an Improved Touch-Points Detection and Gesture Recognition)

  • 이우범
    • 융합신호처리학회논문지
    • /
    • 제11권1호
    • /
    • pp.13-18
    • /
    • 2010
  • 멀티터치 관련 연구는 전반사 장애 현상(FTIR: Frustrated Total Internal Reflection)의 원리를 기반으로 기존 방법을 이용하여 단지 구현하는 것이 대부분이다. 또한 멀티 터치점(Blob-Points) 검출이나 사용자 제스쳐 인식에 있어서 성능 향상을 위한 소프트웨어적 해법에 관한 연구는 드문 실정이다. 따라서 본 논문에서는 확산 투광(DI: Diffused Illumination) 방식을 기반으로 개선된 터치점 검출과 사용자 제스쳐 인식에 의한 멀티터치 테이블-탑 디스플레이를 구현한다. 제안된 방법은 실행 중인 어플리케이션 내의 객체들을 위한 동시 변형 멀티터치 명령을 지원하며, 제안한 사전 테스팅(Pre-Testing) 방법에 의해서 멀티 터치점 검출 과정에서 시스템 지연 시간의 감소가 가능하다. 구현된 멀티터치 테이블-탑 디스플레이 장치는 OSC(Open Sound Control) 프로토콜을 기반으로 하는 TUIO(Tangib1e User Interface Object) 환경에서 Flash AS3 어플리케이션을 제작하여 시뮬레이션 한 결과 최대 37% 시스템 지연 시간의 감소와 멀티터치 제스쳐 인식에서 성공적인 결과를 보였다.

루빅스 큐브를 활용한 다 종류 3차원 객체 증강 시스템 (A Multi 3D Objects Augmentation System Using Rubik's Cube)

  • 이상준;김수빈;황성수
    • 한국멀티미디어학회논문지
    • /
    • 제20권8호
    • /
    • pp.1224-1235
    • /
    • 2017
  • Recently, augmented reality technology has received much attention in many fields. This paper presents an augmented reality system using Rubiks' Cube which can augment various 3D objects depending on patterns of a Rubiks' cube. The system first detects a cube from an image using partitional clustering and strongly connected graph. Thereafter, the system detects the top side of the cube and finds a proper pattern to determine which object should be augmented. An object corresponding to the pattern is finally augmented according to the camera viewpoint. Experimental results show that the proposed system successfully augments various virtual objects in real time.

다중축척 공간 데이터베이스의 축소연산자를 위한 위상관계 일관성 평가 (The Consistency Assessment of Topological Relationships For a Collapse Operator in Multi-Scale Spatial Databases)

  • 강혜경;이기준
    • 정보처리학회논문지D
    • /
    • 제12D권6호
    • /
    • pp.837-848
    • /
    • 2005
  • 다중축척 공간데이터베이스란 동일한 현실 공간을 여러 축척으로 저장한 것으로, 기존에 구축된 원시 공간 데이터베이스로부터 유도될 수 있다. 이 유도과정에서 원시 데이터베이스에 있던 기하 및 위상관계는 변형이 되고, 이 관계 변형은 유도된 데이터베이스의 무결성을 보장하지 못하는 원인이 되므로, 유도과정이 수행된 후에는 반드시 유도된 데이터베이스와 원시 데이터베이스의 관계 일관성을 조사해야한다. 이 논문에서는 원시 데이터베이스와 유도된 다중축척 데이터베이스간의 위상 관계 일관성을 평가하는 방법을 제시하겠다. 특히, 2차원 공간객체가 1차원으로 축소되었을 때 위상관계의 일관성을 평가하는 방법을 제한할 것이며, 이 평가 방법들의 구현에 대해서 기술하고, 사례를 이용하여 구현결과를 기술하겠다.

Deep Learning: High-quality Imaging through Multicore Fiber

  • Wu, Liqing;Zhao, Jun;Zhang, Minghai;Zhang, Yanzhu;Wang, Xiaoyan;Chen, Ziyang;Pu, Jixiong
    • Current Optics and Photonics
    • /
    • 제4권4호
    • /
    • pp.286-292
    • /
    • 2020
  • Imaging through multicore fiber (MCF) is of great significance in the biomedical domain. Although several techniques have been developed to image an object from a signal passing through MCF, these methods are strongly dependent on the surroundings, such as vibration and the temperature fluctuation of the fiber's environment. In this paper, we apply a new, strong technique called deep learning to reconstruct the phase image through a MCF in which each core is multimode. To evaluate the network, we employ the binary cross-entropy as the loss function of a convolutional neural network (CNN) with improved U-net structure. The high-quality reconstruction of input objects upon spatial light modulation (SLM) can be realized from the speckle patterns of intensity that contain the information about the objects. Moreover, we study the effect of MCF length on image recovery. It is shown that the shorter the fiber, the better the imaging quality. Based on our findings, MCF may have applications in fields such as endoscopic imaging and optical communication.

공간 순서화 곡선을 이용한 다차원 영역 질의 처리 (A Multi-dimensional Range Query Processing using Space Filling Curves)

  • 백현;원정임;윤지희
    • 한국공간정보시스템학회 논문지
    • /
    • 제8권2호
    • /
    • pp.13-38
    • /
    • 2006
  • 다차원 공간 객체를 위한 영역 질의는 다차원 공간상에서 질의 영역과 교차 또는 포함되는 객체들을 검색하는 가장 기본적인 공간 연산이다. 영역 질의 처리를 위한 인덱스 기법으로서 공간 순서화 곡선을 이용하여 다차원 공간 객체의 MBR 정보를 1차원 값으로 변환하여 저장하는 DOT(DOuble Transformation) 인덱스 기법이 알려져 있다. 이 기법은 데이터베이스 시스템의 주색인 기법을 그대로 적용할 수 있는 장점을 갖으나, 중간 공간에 설정된 다차원 질의 영역을 최종 공간상의 1차원 값의 집합으로 변환하는 공간 변환 연산에 대한 오버헤드가 매우 크다는 문제점이 있으며, 원 공간을 2차원 이상으로 확장하여 적용할 수 있는 구체적인 영역 질의 방법이 연구된 바 없다. 본 논문에서는 다차원 공간 질의 영역 상의 공간 순서화 곡선의 규칙성을 분석함으로써 공간 변환 연산의 횟수를 대폭 감소시킨 효율적인 다차원 공간 영역 질의 처리 기법을 제안한다. 제안된 기법에서는 공간 변환 연산의 비용을 감소시키기 위하여 질의 영역을 공간 순서화 곡선이 연속 운행되는 최대 크기의 쿼터로 분할하는 쿼터 분할 기법을 사용한다. 제안된 기법에 의한 다차원 영역 질의 처리 과정을 시각적으로 확인할 수 있는 시뮬레이터를 구현하였으며, 이를 이용한 성능평가 결과를 보였다.

  • PDF

모멘트 특성을 이용한 다중 객체 이미지 검색 시스템 구현 (Implementation of System Retrieving Multi-Object Image Using Property of Moments)

  • 안광일;안재형
    • 한국멀티미디어학회논문지
    • /
    • 제3권5호
    • /
    • pp.454-460
    • /
    • 2000
  • 영상과 같은 다양하고 복잡한 데이터 검색은 기존의 키워드를 이용한 검색이 아닌 내용 기반 검색 방법이 요구된다. 본 논문에서는 물체의 위치 이동이나 회전, 크기 변화 등과 같은 각종 변환에 민감하지 않은 불변모멘트(invariant moments)값의 특성을 이용하여 사용자 질의로서 입력된 객체를 효율적으로 검색할 수 있는 시스템을 구현하였다. 영상내의 단일 객체뿐만 아니라 다중 객체들도 효과적으로 검출하기 위해 레이블링(labeling) 알고리즘을 적용해 각각의 객체를 따로 분리하여 불변모멘트를 적용하는 방법을 이용했다. 또한, 검색 시간 단축 및 영상의 효율적인 인덱싱(indexing)을 위해 해싱을 응용한 기법을 적용하였다. 실험결과, precision 85%, recall 23%의 높은 검색효율을 보였고 기존의 전체 영상의 특징을 가지고는 정확히 표현할 수 없는 객체들의 모양을 정확히 표현해 줌으로써 보다 정화한 검색 결과를 얻을 수 있었다.

  • PDF

영상처리와 센서융합을 활용한 지능형 6족 이동 로봇 (Intelligent Hexapod Mobile Robot using Image Processing and Sensor Fusion)

  • 이상무;김상훈
    • 제어로봇시스템학회논문지
    • /
    • 제15권4호
    • /
    • pp.365-371
    • /
    • 2009
  • A intelligent mobile hexapod robot with various types of sensors and wireless camera is introduced. We show this mobile robot can detect objects well by combining the results of active sensors and image processing algorithm. First, to detect objects, active sensors such as infrared rays sensors and supersonic waves sensors are employed together and calculates the distance in real time between the object and the robot using sensor's output. The difference between the measured value and calculated value is less than 5%. This paper suggests effective visual detecting system for moving objects with specified color and motion information. The proposed method includes the object extraction and definition process which uses color transformation and AWUPC computation to decide the existence of moving object. We add weighing values to each results from sensors and the camera. Final results are combined to only one value which represents the probability of an object in the limited distance. Sensor fusion technique improves the detection rate at least 7% higher than the technique using individual sensor.

PCA 기반 변환을 통한 다해상도 피처 맵 압축 방법 (A Feature Map Compression Method for Multi-resolution Feature Map with PCA-based Transformation)

  • 박승진;이민훈;최한솔;김민섭;오승준;김연희;도지훈;정세윤;심동규
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.56-68
    • /
    • 2022
  • 본 논문에서는 VCM을 위한 다해상도 피처 맵에 대한 압축 방법을 제안한다. 제안하는 압축 방법은 PCA 기반의 변환을 통해 다해상도 피처 맵의 채널 및 해상도 계층 간 중복성을 제거하며 변환에 사용된 기저 벡터와 평균 벡터 그리고 변환을 통해 얻어진 변환 계수를 각각의 특성에 따라 VVC 기반 부호화기와 DeepCABAC을 통하여 압축한다. 제안하는 방법의 성능을 측정하기 위하여 OpenImageV6와 COCO 2017 validation set에 대하여 객체 검출 성능을 평가하며, MPEG-VCM 앵커 및 본 논문에서 제안하는 피처 맵 압축 앵커 대비 bpp와 mAP를 BD-rate 관점에서 비교한다. 실험 결과, 제안하는 방법은 OpenImageV6에서 피처 맵 압축 앵커 대비 25.71%의 BD-rate 성능 향상을 보이며, 특히 COCO 2017 validation set의 크기가 큰 객체들에 대해서 MPEG-VCM 앵커 대비 최대 43.72%의 BD-rate 성능이 향상됨을 보인다.

다중센서데이터를 이용한 캠퍼스 3차원 모델의 구축 (Generation of 3D Campus Models using Multi-Sensor Data)

  • 최경아;강문권;신효성;이임평
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2006년도 춘계학술발표회 논문집
    • /
    • pp.205-210
    • /
    • 2006
  • With the development of recent technology such as telematics, LBS, and ubiquitous, the applications of 3D GIS are rapidly increased. As 3D GIS is mainly based on urban models consisting of the realistic digital models of the objects existing in an urban area, demands for urban models and its continuous update is expected to be drastically increased. The purpose of this study is thus to propose more efficient and precise methods to construct urban models with its experimental verification. Applying the proposed methods, the terrain and sophisticated building models are constructed for the area of $270,600m^2$ with 23 buildings in the University of Seoul. For the terrain models, airborne imagery and LIDAR data is used, while the ground imagery is mainly used for the building models. It is found that the generated models reflect the correct geometry of the buildings and terrain surface. The textures of building surfaces, generated automatically using the projective transformation however, are not well-constructed because of being blotted out and shaded by objects such as trees, near buildings, and other obstacles. Consequently, the algorithms on the texture extraction should be improved to construct more realistic 3D models. Furthermore, the inside of buildings should be modeled for various potential applications in the future.

  • PDF