• Title/Summary/Keyword: 성능력 인식

Search Result 143, Processing Time 0.024 seconds

A Person Re-identification Scheme Using Multiple Input images and Cross-Input Neighborhood Differences (다중 입력 영상과 Cross-Input Neighborhood Differences를 이용한 사람 재인식 기법)

  • Kim, Hyeonwoo;Kim, Hyungjoon;Im, Dong-Hyuck;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.1045-1048
    • /
    • 2019
  • 최근 CCTV 사용이 보편화되면서 방범 목적으로 서비스 시설이나 공공시설에 설치되는 CCTV의 수가 급격하게 증가하고 있다. 그에 따라 CCTV를 감시하는 노동력이 부족해지는 문제가 발생하여 이를 대체하기 위해 카메라 영상을 통하여 한번 인식한 사람을 다른 시간이나 장소에서 촬영된 영상에서 다시 인식하는 사람 재인식 기술이 주목받고 있다. 또한, 이러한 사람 재인식 기술은 보안 분야뿐만 아니라 영화나 드라마와 같은 영상 컨텐츠에 적용되어 불법 복제물을 찾는 일에 사용될 수도 있다. 기존의 사람 재인식에는 이미지의 유사도를 계산하는 방법이 사용되었지만, 조명이나 카메라 각도가 달라지면 성능이 급격하게 떨어지는 문제가 있었다. 최근에는 딥러닝 기술이 발달하면서 전반적인 영상처리 분야의 성능이 향상되었고, 사람 재인식 분야 역시 딥러닝을 활용하면서 성능이 향상되었다. 하지만 딥러닝을 활용한 방법의 경우 보통 두 개의 이미지를 입력으로 사용하여 같은지 다른지를 판단하게 되므로 각 이미지의 공통점이나 차이점을 동시에 고려하기는 어려운 점이 있다. 본 논문에서는 이러한 점을 해결하기 위해 세 개의 사람 이미지를 입력으로 사용하여 특징을 추출하고, 특징 맵을 재구성하여 각 이미지의 차이점과 공통점을 동시에 고려하며 학습할 수 있는 모델을 제안한다.

Cepstral Distance and Log-Energy Based Silence Feature Normalization for Robust Speech Recognition (강인한 음성인식을 위한 켑스트럼 거리와 로그 에너지 기반 묵음 특징 정규화)

  • Shen, Guang-Hu;Chung, Hyun-Yeol
    • The Journal of the Acoustical Society of Korea
    • /
    • v.29 no.4
    • /
    • pp.278-285
    • /
    • 2010
  • The difference between training and test environments is one of the major performance degradation factors in noisy speech recognition and many silence feature normalization methods were proposed to solve this inconsistency. Conventional silence feature normalization method represents higher classification performance in higher SNR, but it has a problem of performance degradation in low SNR due to the low accuracy of speech/silence classification. On the other hand, cepstral distance represents well the characteristic distribution of speech/silence (or noise) in low SNR. In this paper, we propose a Cepstral distance and Log-energy based Silence Feature Normalization (CLSFN) method which uses both log-energy and cepstral euclidean distance to classify speech/silence for better performance. Because the proposed method reflects both the merit of log energy being less affected with noise in high SNR and the merit of cepstral distance having high discrimination accuracy for speech/silence classification in low SNR, the classification accuracy will be considered to be improved. The experimental results showed that our proposed CLSFN presented the improved recognition performances comparing with the conventional SFN-I/II and CSFN methods in all kinds of noisy environments.

Non-linear Normalization for Pair-wise Discrimination Based On Local Contribution Measure (유사 문자쌍 구분을 위한 지역적 공헌도 기반 비선형 정규화)

  • Ryu, Sang-Jun;Kim, In-Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.393-396
    • /
    • 2010
  • 지금까지 필기 변이를 완화하기 위한 다양한 비선형 정규화 방법들이 제안되었으며 실제 인식 시스템에서 상당한 인식률 개선 효과를 나타내었다. 그러나, 필기 한글 인식에 있어서는 필기 변이 외에도 문자간의 높은 유사도로 인해 높은 인식률을 얻는데 어려움을 겪고 있다. 한글과 같이 문자간 유사도가 높은 언어를 효과적으로 인식하기 위해서는 필기 변이를 흡수하는 것뿐 아니라, 유사 문자간의 차이를 정확히 찾아내어 그 차이점을 부각시키는 것이 요구된다. 본 논문에서는 유사 문자간의 차이점을 부각시킬 수 있는 비선형 정규화 방법을 제안한다. 기존의 비선형 정규화 방법들이 영상의 지역적 복잡도를 균일화 함으로써 정규화를 수행했던 것에 반해, 제안하는 방법에서는 유사 문자쌍의 구분에 있어 지역적 공헌도에 기반하여 영상을 정규화한다. 즉, 유사 문자쌍 구분에 공헌도가 높은 지역은 확대하고 그렇지 않은 지역은 축소한다. 그 결과, 문자간에 서로 상이한 지역을 강조 함으로써 유사 문자쌍에 대한 구분력을 높인다. 실험 결과, 제안하는 방법으로 정규화된 영상에서는 유사 문자쌍의 차이점이 확대되었으며, 문자쌍의 구분 성능 또한 향상되었다.

산업경쟁력을 위한 드론과의 쉬운 상호작용 기술

  • Jo, Gwang-Su
    • The Optical Journal
    • /
    • s.158
    • /
    • pp.55-57
    • /
    • 2015
  • 여기저기서 드론이 뜨고 있다. 아마존이 날아오른 드론으로 고객의 문 앞까지 배달하는 모습은 일대 장관이었다. 이제 웬만한 방송에서 하늘 높이 오른 드론으로 내려다본 모습을 전송하는 것은 그저 일상일 뿐이다. 뿐만 아니라, 사람이 직접 닿을 수 없는 곳에서 드론으로 사람을 찾는다거나, 드론을 통해 고층건물의 안전도를 검사한다거나, 정찰을 하는 등 다양한 활용도가 돋보인다. 라스베가스의 세계가전전시회(CES)에서 바르셀로나의 모바일월드콩그레스(MWC)에서 그리고 뉴욕의 장난감전시회 에서도 드론은 스타로 부상했다. 이제 드론은 대중화와 상업적 성공의 기로에 서 있다. 이를 위해서는 기계적 성능이상으로 중요한 것이 드론과 사용자간의 상호작용을 통해 이루어내는 사용자 경험이다. 즉 드론을 얼마나 쉽고 편하고 정확하고 안전하게 조종할 수 있도록 만드는가가 차별화와 경쟁력의 시작이다. 만약 드론이 지금처럼 조종하기 어렵고 심지어 인명과 재산을 위협한다고 인식되면 산업적 잠재성은 그저 한여름 밤의 꿈으로 사그러들 수밖에 없다. 몇 가지 사례를 보자. 지난 2월 미국 Fox TV 생방송에서 Popular Science 잡지 편집장 Dave Mosher는 드론의 안전성에 관해서 말하고 있었다. 그 때 데모를 위해 날던 드론이 갑자기 균형을 잃으면서 추락하였다. 이 사고로 인해 드론이 안전하지 않을 수 있다는 인식이 퍼지게 되었다. 경미한 사고지만 심각한 위협감을 일으키기도 한다. 레이더에 탐지되지 않던 드론이 미국 백악관 앞마당에 추락한 것이 그런 예이다. 어떤 사용자는 재미삼아 드론을 구름 위까지 날려 보냈다. 그러더니 드론이 제어력을 상실하였고, 결국 추락하고 말았다. 다행히도 누군가의 머리 위로 떨어지지는 않았다.

  • PDF

Tracking and Recognition of vehicle and pedestrian for intelligent multi-visual surveillance systems (지능형 다중 화상감시시스템을 위한 움직이는 물체 추적 및 보행자/차량 인식 방법)

  • Lee, Saac;Cho, Jae-Soo
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.19 no.2
    • /
    • pp.435-442
    • /
    • 2015
  • In this paper, we propose a tracking and recognition of pedestrian/vehicle for intelligent multi-visual surveillance system. The intelligent multi-visual surveillance system consists of several fixed cameras and one calibrated PTZ camera, which automatically tracks and recognizes the detected moving objects. The fixed wide-angle cameras are used to monitor large open areas, but the moving objects on the images are too small to view in detail. But, the PTZ camera is capable of increasing the monitoring area and enhancing the image quality by tracking and zooming in on a target. The proposed system is able to determine whether the detected moving objects are pedestrian/vehicle or not using the SVM. In order to reduce the tracking error, an improved camera calibration algorithm between the fixed cameras and the PTZ camera is proposed. Various experimental results show the effectiveness of the proposed system.

A Study on the Integration of Information Extraction Technology for Detecting Scientific Core Entities based on Large Resources (대용량 자원 기반 과학기술 핵심개체 탐지를 위한 정보추출기술 통합에 관한 연구)

  • Choi, Yun-Soo;Cheong, Chang-Hoo;Choi, Sung-Pil;You, Beom-Jong;Kim, Jae-Hoon
    • Journal of Information Management
    • /
    • v.40 no.4
    • /
    • pp.1-22
    • /
    • 2009
  • Large-scaled information extraction plays an important role in advanced information retrieval as well as question answering and summarization. Information extraction can be defined as a process of converting unstructured documents into formalized, tabular information, which consists of named-entity recognition, terminology extraction, coreference resolution and relation extraction. Since all the elementary technologies have been studied independently so far, it is not trivial to integrate all the necessary processes of information extraction due to the diversity of their input/output formation approaches and operating environments. As a result, it is difficult to handle scientific documents to extract both named-entities and technical terms at once. In this study, we define scientific as a set of 10 types of named entities and technical terminologies in a biomedical domain. in order to automatically extract these entities from scientific documents at once, we develop a framework for scientific core entity extraction which embraces all the pivotal language processors, named-entity recognizer, co-reference resolver and terminology extractor. Each module of the integrated system has been evaluated with various corpus as well as KEEC 2009. The system will be utilized for various information service areas such as information retrieval, question-answering(Q&A), document indexing, dictionary construction, and so on.

A New Morphological Analysis for the Spoken Language Translation System (음성언어 번역 시스템을 위한 새로운 형태소 분석)

  • 양승원;김재훈
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.4
    • /
    • pp.17-22
    • /
    • 1999
  • It is difficult to integrate the speech processing systems and machine translation system in the spoken language translation system by reason that each system uses its own data and basic processing unit. So, we need a common I/O unit which is used in the whole system. In this paper, we propose a Pscudo-Morpheme as the interface between speech processing systems and language translation system. We implement a morphological analysis system for Pseudo-morpheme. The speech processing system using this pseudo-morpheme can get better result than other systems using the phrase or the general morpheme. So, the quality of the whole spoken language translation system can be improved. The analysis-ratio of our implemented system is 98.9%. This is similar to the common morphological analysis systems.

  • PDF

Fingerprint Image Quality Assessment for On-line Fingerprint Recognition (온라인 지문 인식 시스템을 위한 지문 품질 측정)

  • Lee, Sang-Hoon
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.47 no.2
    • /
    • pp.77-85
    • /
    • 2010
  • Fingerprint image quality checking is one of the most important issues in on-line fingerprint recognition because the recognition performance is largely affected by the quality of fingerprint images. In the past, many related fingerprint quality checking methods have typically considered the local quality of fingerprint. However, It is necessary to estimate the global quality of fingerprint to judge whether the fingerprint can be used or not in on-line recognition systems. Therefore, in this paper, we propose both local and global-based methods to calculate the fingerprint quality. Local fingerprint quality checking algorithm considers both the condition of the input fingerprints and orientation estimation errors. The 2D gradients of the fingerprint images were first separated into two sets of 1D gradients. Then,the shapes of the PDFs(Probability Density Functions) of these gradients were measured in order to determine fingerprint quality. And global fingerprint quality checking method uses neural network to estimate the global fingerprint quality based on local quality values. We also analyze the matching performance using FVC2002 database. Experimental results showed that proposed quality check method has better matching performance than NFIQ(NIST Fingerprint Image Quality) method.

A Morphology Technique-Based Boundary Detection in a Two-Dimensional QR Code (2차원 QR코드에서 모폴로지 기반의 경계선 검출 방법)

  • Park, Kwang Wook;Lee, Jong Yun
    • Journal of Digital Convergence
    • /
    • v.13 no.2
    • /
    • pp.159-175
    • /
    • 2015
  • The two-dimensional QR code has advantages such as directional nature, enough data storage capacity, ability of error correction, and ability of data restoration. There are two major issues like speed and correctiveness of recognition in the two-dimensional QR code. Therefore, this paper proposes a morphology-based algorithm of detecting the interest region of a barcode. Our research contents can be summarized as follows. First, the interest region of a barcode image was detected by close operations in morphology. Second, after that, the boundary of the barcode are detected by intersecting four cross line outside in a code. Three, the projected image is then rectified into a two-dimensional barcode in a square shape by the reverse-perspective transform. In result, it shows that our detection and recognition rates for the barcode image is also 97.20% and 94.80%, respectively and that outperforms than previous methods in various illumination and distorted image environments.

An Improved Asterias Amurensis Recognition Method Based on Morphological Characteristics Analysis Techniques (형태적 특징 분석 기법을 이용한 아무르불가사리의 개선된 인식 방법)

  • Shin, Hyun-Deok;Jeon, Young-Cheol
    • Journal of the Korea Society of Computer and Information
    • /
    • v.17 no.10
    • /
    • pp.61-69
    • /
    • 2012
  • The population of highly prolific, predatory Asterias amurensis is growing sharply from year to year along the coastline of Korea, a nation surrounded by water on three sides. To make matters worse, the fact that Asterias amurensis devours living fish and shellfish has caused a heavy loss for fishermen involved in the aquaculture industry. What it all boils down to is the significance of technologies allowing one to recognize Asterias amurensis individuals using underwater images for the purpose of exterminating Asterias amurensis or identifying a change in the population of Asterias amurensis or the migration route of Asterias amurensis. An improved Asterias amurensis recognition method based on the morphological characteristics of Asterias amurensis was proposed in this paper. The proposed recognition method aimed at cases marked by the lack of extraction information on concaveness and convexity, which are the morphological characteristics of Asterias amurensis. Extracting all the characteristics of Asterias amurensis from images taken underwater is very difficult. In this respect, the proposed recognition is effective in terms of recognizing individuals in a diversity of Asterias amurensis images. As a result of the experiment, Our proposed method has achieved superior performance with 92.5% than other method.