• 제목/요약/키워드: Image Dictionary

검색결과 78건 처리시간 0.024초

검색 속도와 메모리 효율 최적화를 위한 메타데이터 기반 데이터 구조 분석 (Metadata-Based Data Structure Analysis to Optimize Search Speed and Memory Efficiency)

  • 김세연;임영훈
    • 정보처리학회 논문지
    • /
    • 제13권7호
    • /
    • pp.311-318
    • /
    • 2024
  • 인공지능과 인터넷의 발전으로 인한 데이터의 증가로 데이터 관리의 중요성이 부각되고 있는 상황에서, 데이터 검색과 메모리 공간의 효율적 활용이 매우 중요한 시대가 도래하였다. 본 연구에서는 메타데이터를 기반으로 데이터 구조를 분석하여 검색 속도와 메모리 효율을 최적화하는 방안을 연구한다. 연구방법으로는 사진 이미지의 메타데이터를 활용하여 배열, 연결리스트, 딕셔너리, 이진 트리, 그래프의 데이터 구조에 대한 성능을 시간적, 공간적 복잡도를 중심으로 비교하고 분석하였다. 실험을 통해 대규모의 이미지 데이터를 다루는 상황에서 딕셔너리 구조는 수집속도에서, 그래프 구조는 검색 속도에서 가장 우수한 성능을 보여주는 것을 확인할 수 있었다. 본 논문의 결과는 이미지 데이터 검색 속도와 메모리 효율을 최적화하기 위한 데이터 구조를 선택하는데 실용적인 가이드라인을 제시할 것으로 기대한다.

적외선 영상 선명도 개선을 위한 ADRC 기반 초고해상도 기법 및 가시광 영상과의 융합 기법 (Infrared Image Sharpness Enhancement Method Using Super-resolution Based on Adaptive Dynamic Range Coding and Fusion with Visible Image)

  • 김용준;송병철
    • 전자공학회논문지
    • /
    • 제53권11호
    • /
    • pp.73-81
    • /
    • 2016
  • 일반적으로 적외선 열화상 영상은 가시광선 영상보다 약한 선명도를 가지며, 디테일 정보도 거의 없다. 그래서 종래 영상확대 알고리즘 방법으로 적외선 영상을 확대할 경우 가시광 영상에 비해 효과적이지 않다. 이런 문제점을 해결하기 위해 본 논문은 입력 적외선 영상을 ADRC 기반 초고해상도 기법으로 일차적으로 확대하고, 대응하는 가시광선 영상과 융합하는 방법을 제안한다. 제안하는 알고리즘은 크게 확대 과정과 융합 과정으로 나뉜다. 먼저 입력된 적외선 영상을 ADRC 기반의 초고해상도 알고리즘으로 확대한다. 사전의 학습과정에서 고해상도 영상들에 소위 pre-emphasis를 적용한 후 학습을 함으로써 선명도 향상을 꾀했다. 융합 과정에서는 먼저 입력 IR영상과 대응하는 가시광선 영상에서 고주파 정보를 추출하고, IR영상의 복잡도에 따라 적응적으로 상기 추출된 고주파 정보를 합성하는 방식으로 최종적인 확대 적외선 영상이 얻어진다. 모의 실험 결과 제안 알고리즘은 최신 SR기법 중 하나인 A+기법보다 JNB수치가 평균 0.2184만큼 높은 우수한 정량적 결과를 보인다. 뿐만 아니라 주관적 화질에서도 상당한 우위를 보인다.

Adaptive Hyperspectral Image Classification Method Based on Spectral Scale Optimization

  • Zhou, Bing;Bingxuan, Li;He, Xuan;Liu, Hexiong
    • Current Optics and Photonics
    • /
    • 제5권3호
    • /
    • pp.270-277
    • /
    • 2021
  • The adaptive sparse representation (ASR) can effectively combine the structure information of a sample dictionary and the sparsity of coding coefficients. This algorithm can effectively consider the correlation between training samples and convert between sparse representation-based classifier (SRC) and collaborative representation classification (CRC) under different training samples. Unlike SRC and CRC which use fixed norm constraints, ASR can adaptively adjust the constraints based on the correlation between different training samples, seeking a balance between l1 and l2 norm, greatly strengthening the robustness and adaptability of the classification algorithm. The correlation coefficients (CC) can better identify the pixels with strong correlation. Therefore, this article proposes a hyperspectral image classification method called correlation coefficients and adaptive sparse representation (CCASR), based on ASR and CC. This method is divided into three steps. In the first step, we determine the pixel to be measured and calculate the CC value between the pixel to be tested and various training samples. Then we represent the pixel using ASR and calculate the reconstruction error corresponding to each category. Finally, the target pixels are classified according to the reconstruction error and the CC value. In this article, a new hyperspectral image classification method is proposed by fusing CC and ASR. The method in this paper is verified through two sets of experimental data. In the hyperspectral image (Indian Pines), the overall accuracy of CCASR has reached 0.9596. In the hyperspectral images taken by HIS-300, the classification results show that the classification accuracy of the proposed method achieves 0.9354, which is better than other commonly used methods.

언어장애인의 언어학습을 위한 이미지 전자사전의 구축 (Implementation of Image electronic Dictionary to Study Language for Speech Disorders)

  • 조진경;류제;한광록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.669-672
    • /
    • 2005
  • 단어가 지니는 의미를 이미지로 처리하면 그 단어의 이미지가 단순화되면서 높은 인식률을 가질 수 있다는 장점을 지닌다. 이러한 장점을 이용하여 언어장애인들을 위한 유용한 보완대체 의사소통 학습도구에 하나로 이미지 전자 사전을 구축하고자 한다. 우선 동사와 조합되는 용어들의 패턴들을 면밀히 조사하여 그 패턴들을 영역과 자질의 카테고리로 분류하고, 그 카테고리에 속하는 기본 데이터들을 정리하여 분류된 데이터를 하위범주화 방식을 통해 검색을 보다 용이하게 하였다. 더욱이 언어장애인들이 많이 쓰이는 단어를 조사하고, 그 단어를 중심으로 한 모듈을 이용하여, 각각에게 해당되는 이미지를 수집함으로 단어들의 의미를 표현하고 인식할 수 있도록 하는 인터페이스를 구축하는데 중점을 두었다. 또한 언어장애인이 직접 명사와 동사를 조합하여 그 완성여부를 검토할 수 있는 학습기능을 추가함으로 인해 보다 실생활에 유용하고 교육적인 이미지 전자 사전을 구축하였다.

  • PDF

Correction for Misrecognition of Korean Texts in Signboard Images using Improved Levenshtein Metric

  • Lee, Myung-Hun;Kim, Soo-Hyung;Lee, Guee-Sang;Kim, Sun-Hee;Yang, Hyung-Jeong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권2호
    • /
    • pp.722-733
    • /
    • 2012
  • Recently various studies on various applications using images taken by mobile phone cameras have been actively conducted. This study proposes a correction method for misrecognition of Korean Texts in signboard images using improved Levenshtein metric. The proposed method calculates distances of five recognized candidates and detects the best match texts from signboard text database. For verifying the efficiency of the proposed method, a database dictionary is built using 1.3 million words of nationwide signboard through removing duplicated words. We compared the proposed method to Levenshtein Metric which is one of representative text string comparison algorithms. As a result, the proposed method based on improved Levenshtein metric represents an improvement in recognition rates 31.5% on average compared to that of conventional methods.

Multi-feature local sparse representation for infrared pedestrian tracking

  • Wang, Xin;Xu, Lingling;Ning, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권3호
    • /
    • pp.1464-1480
    • /
    • 2019
  • Robust tracking of infrared (IR) pedestrian targets with various backgrounds, e.g. appearance changes, illumination variations, and background disturbances, is a great challenge in the infrared image processing field. In the paper, we address a new tracking method for IR pedestrian targets via multi-feature local sparse representation (SR), which consists of three important modules. In the first module, a multi-feature local SR model is constructed. Considering the characterization of infrared pedestrian targets, the gray and edge features are first extracted from all target templates, and then fused into the model learning process. In the second module, an effective tracker is proposed via the learned model. To improve the computational efficiency, a sliding window mechanism with multiple scales is first used to scan the current frame to sample the target candidates. Then, the candidates are recognized via sparse reconstruction residual analysis. In the third module, an adaptive dictionary update approach is designed to further improve the tracking performance. The results demonstrate that our method outperforms several classical methods for infrared pedestrian tracking.

A study on the Symbol Mark Design in Fashion Accessory Brands - Focused on Jewelry brand -

  • Shin, Hae-Kyung
    • 패션비즈니스
    • /
    • 제15권6호
    • /
    • pp.163-175
    • /
    • 2011
  • This study tried to improve the design of the symbol mark for the fashion industry and effectively publicize the brand image of a small fashion accessory company through a powerful visual communication strategy. For this purpose, this study performed research and an analysis of the features of existing fashion accessory companies as well as the current status and features of their utilization of symbol marks for the enhancement of the brand's image. Total 48 fashion accessory brands focued on jewerly were selected from the Dictionary of Fashion Brand and the types of symbol analyzed the concepts and formative aesthetics of the symbol mark design in each brand. Based on the data, this study designed the fashion accessory company's logo and a new symbol mark design. It makes full use of the characteristics of the logos and the symbol mark that reflect the most critical issues of fashion accessory design so as to promote the consumers' level of product recognition as well as the product symbol characteristics. In the case of combining characters with concrete objects, they were found generally to use objects that give elegance, cute and feminine images, such as rings, hearts and small pets. Moreover, colors in the series of black/grey seemed to be used to convey the concept of accessory brands that pursue modern, sophisticate, and practical images. As these design plans, enhancement of the consumers' level of recognition of the brand is attempted as well as the execution of an effective publicity of the feature of the product through the use of the logo and symbol marks reflecting the features of the fashion accessory, instead of simply introducing the brand or product. The result of this study indicates that methods to design brand symbol marks for clothing should be incessantly sought in a way to build brand power as an important component to represent concepts and reinforce brand image.

선택적 sparse coding 기반 측면주사 소나 영상의 고속 초해상도 복원 알고리즘 (A selective sparse coding based fast super-resolution method for a side-scan sonar image)

  • 박재현;양철종;구본화;이승호;김성일;고한석
    • 한국음향학회지
    • /
    • 제37권1호
    • /
    • pp.12-20
    • /
    • 2018
  • 측면주사 소나 영상 획득의 효율성을 향상시키고자 저해상도의 수중 영상을 복원 기법을 이용하여 고화질 영상으로 개선시키는 연구가 시도되고 있다. 측면주사 소나 영상은 광학 영상과 같은 2차원 신호를 사용한다는 측면에서 기존 광학 영상 복원에 적용된 기법의 응용을 고려할 수 있다. 광학 영상에 대한 가장 대표적인 복원 방법 중 하나는 스파스 코딩이며, 수중 영상의 희소성을 분석하여 스파스 코딩 기법을 수중 영상에 적용할 수 있음을 증명하는 연구가 진행되었다. 스파스 코딩은 입력 신호에 대하여 사전과 스파스 계수의 선형 결합으로 복원 신호를 얻는 방식이다. 하지만 스파스 계수의 값을 정확히 추정하기 위해서는 많은 연산량을 필요로 한다. 본 연구에서는 스파스 코딩 기반의 수중 영상 초해상도 복원을 수행하되, 수중 영상 내 객체 영역에 한해서 선택적으로 복원 기법을 적용하는 방법을 제안함으로써 전체 연산 시간을 단축시킨다. 이를 위하여 수중 영상에서 경계를 검출하고 그 분포에 따라 객체 영역과 비객체 영역을 구분하는 방법을 제안하고, 이를 스파스 코딩 기반의 초해상도 복원 기법과 접목시킨다. 실험을 통해 제안하는 방법이 기존 방식과 동일 수준의 PSNR(Peak Signal-to-Noise Ratio) 수치를 유지하며, 영상 복원에 필요한 시간은 32 % 만큼 단축시킴을 확인함으로써 제안 방법의 유효성을 증명하였다.

고등학교 공통과학 학습을 위한 멀티미디어 자료 구축 (Developing Learning Materials of Multimedia for General Science Instruction of High School)

  • 김재현;이희복;김현섭;김희수;박종욱;박현주
    • 대한화학회지
    • /
    • 제44권3호
    • /
    • pp.249-257
    • /
    • 2000
  • 본 연구는 고등학교 공통과학 학습을 위한 멀티미디어 자료를 구축하는데그 목적을 두었다.공통과학 교육과정을 기초로 하여 문자 자료, 도표, 그림, 사진, 애니메이션, 동영상 및 음성 자료 등을 HTML 사용하여 멀티미디어 학습 자료를 개발하였다. 멀티미디어 학습 자료의 구성은 내용, 용어사전, 과학이야기, 영상자료, 그리고 질문의 다섯 분야로 나뉜다. 개발된 멀티미디어 자료는 공주대학교 과학교육연구소 홈페이지 (http://science.kongju.ac.kr)에 올려놓았으며, 또한 CR-ROM으로 제공된다.

  • PDF

Vision- Based Finger Spelling Recognition for Korean Sign Language

  • Park Jun;Lee Dae-hyun
    • 한국멀티미디어학회논문지
    • /
    • 제8권6호
    • /
    • pp.768-775
    • /
    • 2005
  • For sign languages are main communication means among hearing-impaired people, there are communication difficulties between speaking-oriented people and sign-language-oriented people. Automated sign-language recognition may resolve these communication problems. In sign languages, finger spelling is used to spell names and words that are not listed in the dictionary. There have been research activities for gesture and posture recognition using glove-based devices. However, these devices are often expensive, cumbersome, and inadequate for recognizing elaborate finger spelling. Use of colored patches or gloves also cause uneasiness. In this paper, a vision-based finger spelling recognition system is introduced. In our method, captured hand region images were separated from the background using a skin detection algorithm assuming that there are no skin-colored objects in the background. Then, hand postures were recognized using a two-dimensional grid analysis method. Our recognition system is not sensitive to the size or the rotation of the input posture images. By optimizing the weights of the posture features using a genetic algorithm, our system achieved high accuracy that matches other systems using devices or colored gloves. We applied our posture recognition system for detecting Korean Sign Language, achieving better than $93\%$ accuracy.

  • PDF