• Title/Summary/Keyword: 전처리 기법

Search Result 972, Processing Time 0.033 seconds

Integrated Sentence Preprocessing System for Web Indexing (웹 인덱싱을 위한 통합 전처리 시스템의 개발)

  • Shim, Jun-Hyuk;Cha, Jong-Won;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.216-223
    • /
    • 2000
  • 웹 문서는 일반 문서들과 달리 자유로운 형식으로 기술되어 있고, 원문에 태그나 코드 등 불필요한 내용들을 많이 포함하고 있어 언어 처리에 바로 사용하기에 적합하지 못하다. 본 논문은 인덱싱 대상 문서로 사용되는 웹 문서를 자동으로 수집하여, 문장 단위로 정렬된 문서로 제작, 관리하는 통합 전처리 시스템인 Web Tagger의 구조와 전처리 방법을 소개한다. Web Tagger는 문서 정제, 문장 분할, 띄어쓰기의 과정을 거쳐 웹 문서에서 표준화된 정보를 추출하고, 형태소 분석기를 포함한 응용 시스템의 목적에 맞게 XML 형식의 원문 코퍼스를 자동으로 생성하고 관리한다. '정규문법(Regexp)', '휴리스틱', '품사 인덱스 참조', 'C4.5를 사용한 학습 규칙' 등의 다양한 전처리 기법은 형태소 분석 정확도 향상과 시스템 안정성 보장에 기여한다.

  • PDF

Iris Recognition using the Effective Preprocessing technique (효율적 전처리 기법을 이용한 홍채인식)

  • Park, Su-Young;Choi, Kwang-Mi;Jung, Choi-Yeoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.759-762
    • /
    • 2002
  • 생체 특징에 기초한 개인적인 및 인증 방법의 하나인 홍채의 패턴 인식에 있어서 전처리 기술은 사용자의 홍채 정보 손실로 인한 오인식을 최소로 하여야한다. 본 논문에서 전처리 기술 중 프리위트(Prewitt) 필터와 sobel 필터를 이용한 홍채의 인식률을 비교하고 전처리된 영상으로부터 추출된 특징값에 대해 저용량을 유지하면서 손실된 정보가 없고 실시간 처리가 요구되는 정보 보호를 위한 특징추출 방법 중 고차 국소 자동상관함수를 이용한 특징추출 방법을 제시하여 인식률을 향상시키는 방법을 제시하고자 한다.

  • PDF

Automatic Registration between Multiple IR Images Using Simple Pre-processing Method and Modified Local Features Extraction Algorithm (단순 전처리 방법과 수정된 지역적 피쳐 추출기법을 이용한 다중 적외선영상 자동 기하보정)

  • Kim, Dae Sung
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.35 no.6
    • /
    • pp.485-494
    • /
    • 2017
  • This study focuses on automatic image registration between multiple IR images using simple preprocessing method and modified local feature extraction algorithm. The input images were preprocessed by using the median and absolute value after histogram equalization, and it could be effectively applied to reduce the brightness difference value between images by applying the similarity of extracted features to the concept of angle instead of distance. The results were evaluated using visual and inverse RMSE methods. The features that could not be achieved by the existing local feature extraction technique showed high image matching reliability and application convenience. It is expected that this method can be used as one of the automatic registration methods between multi-sensor images under specific conditions.

A Comparison of Ensemble Methods Combining Resampling Techniques for Class Imbalanced Data (데이터 전처리와 앙상블 기법을 통한 불균형 데이터의 분류모형 비교 연구)

  • Leea, Hee-Jae;Lee, Sungim
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.3
    • /
    • pp.357-371
    • /
    • 2014
  • There are many studies related to imbalanced data in which the class distribution is highly skewed. To address the problem of imbalanced data, previous studies deal with resampling techniques which correct the skewness of the class distribution in each sampled subset by using under-sampling, over-sampling or hybrid-sampling such as SMOTE. Ensemble methods have also alleviated the problem of class imbalanced data. In this paper, we compare around a dozen algorithms that combine the ensemble methods and resampling techniques based on simulated data sets generated by the Backbone model, which can handle the imbalance rate. The results on various real imbalanced data sets are also presented to compare the effectiveness of algorithms. As a result, we highly recommend the resampling technique combining ensemble methods for imbalanced data in which the proportion of the minority class is less than 10%. We also find that each ensemble method has a well-matched sampling technique. The algorithms which combine bagging or random forest ensembles with random undersampling tend to perform well; however, the boosting ensemble appears to perform better with over-sampling. All ensemble methods combined with SMOTE outperform in most situations.

An Efficient Facial Expression Recognition by Measuring Histogram Distance Based on Preprocessing (전처리 기반 히스토그램 거리측정에 의한 효율적인 표정인식)

  • Cho, Yong-Hyun
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.19 no.5
    • /
    • pp.667-673
    • /
    • 2009
  • This paper presents an efficient facial expression recognition method by measuring the histogram distance based on preprocessing. The preprocessing that uses both centroid shift and histogram equalization is applied to improve the recognition performance, The distance measurement is also applied to estimate the similarity between the facial expressions. The centroid shift based on the first moment balance technique is applied not only to obtain the robust recognition with respect to position or size variations but also to reduce the distance measurement load by excluding the background in the recognition. Histogram equalization is used for robustly recognizing the poor contrast of the images due to light intensity. The proposed method has been applied for recognizing 72 facial expression images(4 persons * 18 scenes) of 320*243 pixels. Three distances such as city-block, Euclidean, and ordinal are used as a similarity measure between histograms. The experimental results show that the proposed method has superior recognition performances compared with the method without preprocessing. The ordinal distance shows superior recognition performances over city-block and Euclidean distances, respectively.

A Study on INS's initial attitude error reducing methods at navigation mode entry in vibration environment (진동 환경에서 관성항법장치 항법진입 자세오차 감소기법 연구)

  • Lee, Youn-Seon;Lee, Sang-Jeong
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.37 no.6
    • /
    • pp.545-550
    • /
    • 2009
  • Generally, the smoothing pre-filter of sensor's raw measurement(accelerometer and gyroscope) is used for INS's fast alignment. When the pre-filter is abruptly removed at Navigation-mode entry in vibration environment, INS's initial attitude error can be largely generated. So that we propose initial attitude error reducing methods(monotone increasing of cutoff-frequency, real-time attitude estimation), these are proved by simulation.

A Study on Preprocessing Technique for Face Recognition Using Watershed Algorithm (워터쉐이드 알고리즘을 이용한 얼굴인식을 위한 전처리기법에 관한 연구)

  • 채덕재;최영규;이상범
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.2008-2011
    • /
    • 2003
  • 얼굴인식의 전처리 단계는 주위의 배경으로부터 얼굴 영상을 분리하여 분석해야 한다. 이러한 전처리 단계는 환경적 요인으로 인해 많은 어려움을 가지고 있다. 또한, 개인별 특징의 차이, 얼굴의 기울어짐과 회전각도 및 영상내의 얼굴 크기 등으로 인해 어려움이 존재한다. 원영상을 입력받아 피부색을 통해 얼굴영역을 검출해 내어 사람의 표정변화에 가장 강인한 코 부분을 추출하여 워터쉐이드 변환을 하여 각 개인마다 다르게 가지고 있는 코의 패턴의 데이터를 저장하여 얼굴 인식에 이용할 수 있는 인자 값으로 이용한다. 따라서, 본 논문에서는 얼굴인식의 특징값을 코의 패턴을 이용하여 인식함으로써 다른 논문에서 제시하고 있는 눈의 특징이나 얼굴 각의 특징의 단점을 극복하여 보다 정화한 얼굴 인식을 할 수 있는 전처리 방법을 제시한다.

  • PDF

Ontology based Preprocessing Scheme for Mining Data Streams from Sensor Networks (센서 네트워크의 데이터 스트림 마이닝을 위한 온톨로지 기반의 전처리 기법)

  • Jung, Jason J.
    • Journal of Intelligence and Information Systems
    • /
    • v.15 no.3
    • /
    • pp.67-80
    • /
    • 2009
  • By a number of sensors and sensor networks, we can collect environmental information from a certain sensor space. To discover more useful information and knowledge, we want to employ data mining methodologies to sensor data stream from such sensor spaces. In this paper, we present a novel data preprocessing scheme to improve the performances of the data mining algorithms. Especially, ontologies are applied to represent meanings of the sensor data. For evaluating the proposed method, we have collected sensor streams for about 30 days, and simulated them to compare with other approaches.

  • PDF

Principal Component Analysis as a Preprocessing Method for Protein Structure Comparison (단백질 구조 비교를 위한 전처리 기법으로서의 주성분 분석)

  • Park Sung Hee;Park Chan Yong;Kim Dae Hee;Park Soo-Jun;Park Seon Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.805-808
    • /
    • 2004
  • 본 논문에서는 두 단백질의 구조적 유사성을 기반으로 한 단백질 비교를 위해서 전처리 기법으로서의 주성분분석기법을 소개한다. 기존의 백본 및 알파탄소 간의 거리행렬(distance matrix), 2차 구조 비교기법, 구역(segment)단위의 비교 기법과 같은 단백질 비교 기법들은 위치이동(translation)와 회전(rotation)에 불변한(invariant) 차이를 구하기 위하여 거리행렬을 이용하였다. 그리고, 난 다음 이들의 최적화 과정을 거쳤다. 그러나, 본 논문에서 제시하는 전처리 기법으로서의 주성분분석기법은 단백질 구조를 전체적인 구조 관점에서 위치를 정렬시킨 후에 단백질 간의 구조를 비교하는 방식이다. 단백질의 구조의 방향성(Orientation)을 맞춘 다음에는 다양한 단백질 표현으로 구를 비교할 수 있다. 본 논문에서는 두 단백질의 구조의 유사성을 측정하기 위한 간결한 단백질 표현(representation)으로 3 차원 에지 히스토그램을 사용하였다. 이 기법은 방향성을 정렬하기 위하여 기존의 방법에서 사용되었던 반복적인 거리계산을 통한 최적화하는 과정을 없앰으로써 단백질 구조 비교 시간을 단축할 수 있는 새로운 단백질 구조 비교 패러다임을 가능하게 한다. 따라서, 이 패러다임을 통하여 적절한 단백질 구조 방향성 정렬과 단백질 구조 표현을 이용한 단백질 구조 비교 검색 시스템은 많은 양의 단백질 구조 정보로부터 원하는 형태의 단백질 구조를 빠른 시간에 검색할 수 있는 장점을 가질 수 있다.

  • PDF

Liquid-phase Microextraction Pretreatment Techniques for Analysis of Chemical Warfare Agents and Their Degradation Byproducts in Environmental Aqueous Samples (환경샘플 내 화학작용제 및 분해물질 분석을 위한 Liquid Phase Microextraction (LPME) 전처리 기법)

  • Kim, Dongwook;Chung, Wooyoung;Kye, Youngsik
    • Applied Chemistry for Engineering
    • /
    • v.26 no.1
    • /
    • pp.17-22
    • /
    • 2015
  • International interests in chemical warfare agents (CWAs) have been increased recently because of the use of sarin (GB) in Syrian civil war which caused around 1,300 casualties in 2013. After exposing to natural environments, CWAs undergo hydrolysis or photodegrade to non-toxic degradation byproducts. Generally, CWAs and their degradation byproducts are present at very low concentration (e.g. several ppb), thus pretreatment processes including separation, extraction and concentration are required prior to any analyses. Liquid-liquid extraction and solid-phase extraction (SPE) are common techniques to pretreat environmental samples. Recently, a novel pretreatment method, liquid phase miecoextraction (LPME), has been applied to CWAs analysis, which could reduce amounts of solvent used but promote analytical efficiencies. Fundamental backgrounds of LPME and its application to CWAs analysis were reviewed.