• 제목/요약/키워드: filtering database

검색결과 181건 처리시간 0.024초

노각나무(Stewartia koreana Nakai)의 cDNA library 제작 및 EST 분석 (Construction of a Full-length cDNA Library from Korean Stewartia (Stewartia koreana Nakai) and Characterization of EST Dataset)

  • 임수빈;김준기;최영인;최선희;권혜진;송호경;임용표
    • 원예과학기술지
    • /
    • 제29권2호
    • /
    • pp.116-122
    • /
    • 2011
  • 본 연구에서는 지리산에서 자생하는 한국 특산종인 노각나무(Stewartia koreana Nakai)의 EST library를 제작하고 서열을 분석하였다. 노각나무의 유엽을 재료로 cDNA library 만들었고 1,392개의 cDNA에 대한 부분 서열 분석을 진행하였다. EST와 unigene 서열의 분석은 컴퓨터를 기반으로한 filtering과 수작업 그리고 NCBI의 BLAST 분석을 통해 수행하였다. 벡터 서열과 100bp 이하의 서열을 제거한 후 1,301개의 EST를 분석하였다. 전체 150개의 contig와 743개의 singleton을 분리하여 총 893개의 unigene을 분리해냈으며 서열 분석을 통해 95개의 microsatellite를 확인하였다. NCBI 데이터베이스의 BLASTX로 상동성을 검색한 결과 EST의 65%는 기능을 알고 있는 유전자와 11.6%의 EST는 아직까지 기능이 보고되지 않은 유전자와 높은 상동성을 보였다. 남아 있는 23.2%의 EST는 기존에 데이터베이스에 보고된 유전자와 상동성을 보이지 않는 유전자로 밝혀졌다. 다양한 데이터베이스를 기반으로 한 유사성 기반 기능 분석은 노각나무의 EST가 포도나무와 포플러와 높은 유사성을 보인 것을 확인하였다. 기능에 따른 분류에 있어 molecular function은 nucleotide binding, biological process는 transport, cellular component는 plastid가 가장 높은 비율로 나왔다. 본 연구를 통해 얻어진 EST 자료는 노각나무의 새로운 유전자원에 대한 연구의 기본 자료로 유용하게 활용될 것이다.

데이터베이스를 활용한 센서 데이터 관리 (Sensor Data Management using Database)

  • 권대곤;최신형
    • 한국산학기술학회논문지
    • /
    • 제10권7호
    • /
    • pp.1608-1613
    • /
    • 2009
  • 임베디드 분야에 대한 발전으로 임베디드 시스템을 이용한 각종 장비가 개발되고, 실제 생활에 많은 부분에서 활용되고 있다. 또한, 무선센서네트워크를 통해 각종 센서로부터 데이터를 수집할 수 있으며, 호스트를 거치지 않더라도 임베디드 시스템만으로도 수집된 데이터를 실시간으로 보여줄 수 있다. 본 논문에서는 센서 노드로부터 무선으로 전송되는 센싱 데이터 관리를 위해 임베디드 시스템에 임베디드 데이터베이스를 설치하여 게이트웨이 역할만을 하는 임베디드 시스템의 기능을 개선한 방안을 제시한다. 즉, 임베디드 시스템에 임베디드 데이터베이스를 설치한 다음 센싱 데이터를 저장 및 관리함으로써 센싱 데이터가 전송될 때마다 게이트웨이를 통한 호스트와 통신하는 전송횟수를 줄일 수 있으며, 임베디드 시스템에서 필터링 프로그램을 수행하여 보다 정확하고 유효한 데이터만을 호스트에 전송함으로써 수집된 센싱 데이터에 기반한 분석결과의 신뢰성을 높일 수 있다.

WUDAPT 절차를 활용한 창원시의 국지기후대 제작과 필터링 반경에 따른 비교 연구 (A Comparative Study on Mapping and Filtering Radii of Local Climate Zone in Changwon city using WUDAPT Protocol)

  • 김태경;박경훈;송봉근;김성현;정다은;박건웅
    • 한국지리정보학회지
    • /
    • 제27권2호
    • /
    • pp.78-95
    • /
    • 2024
  • 기후변화와 도시 문제를 고려해 다양한 영역에 걸친 환경계획의 수립과 비교를 위해서는 일관된 기준으로 분류된 지역 규모 수준의 공간자료 구축이 중요하다. 본 연구는 World Urban Database and Access Portal Tools(WUDAPT)에서 제시한 절차를 사용하여 기후 및 환경 연구가 활발히 이루어지고 있는 창원시의 Local Climate Zone(LCZ)를 분류하였다. 또한, 동질적인 기후 특성을 가진 지역일지라도 일부 격자가 다른 기후 특성으로 분류되는 파편화 문제를 개선하기 위해 필터링 기법을 적용하고 필터링 반경에 따른 LCZ 분류 특성을 비교하였다. 위성영상과 지상참조자료, 감독분류 머신러닝 기법인 Random Forest를 활용하여 필터링하지 않은 분류지도와 필터링 반경이 1, 2, 3인 분류지도를 제작하여 정확도를 비교하였다. 또한, 도시지역의 건물 유형에 따른 LCZ 분류특성을 비교하기 위해 GIS를 활용한 분류방법론에서 사용되는 도시형태지수를 제작하여 선행 연구에서 제시한 범위와 비교하였다. 그 결과, 전체 정확도는 필터링 반경이 1일 때 가장 높은 값을 보였다. 도시형태지수를 비교하였을 때 LCZ 유형별 차이는 적었고 대부분 선행연구의 범위를 만족하는 것을 확인하였다. 그러나 연구 결과를 통해 건물의 높이 정보를 반영하지 못하는 한계를 확인하였고, 이를 보완할 수 있는 데이터를 추가하여 분류한다면 더 높은 정확도의 결과물을 획득할 수 있을 것이라 판단된다. 연구 결과는 국내 도시기후 관련 환경 연구분야의 기초 공간자료 제작하기 위한 참고자료로 활용될 수 있을 것이다.

Wavelet Thresholding Techniques to Support Multi-Scale Decomposition for Financial Forecasting Systems

  • Shin, Taeksoo;Han, Ingoo
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.175-186
    • /
    • 1999
  • Detecting the features of significant patterns from their own historical data is so much crucial to good performance specially in time-series forecasting. Recently, a new data filtering method (or multi-scale decomposition) such as wavelet analysis is considered more useful for handling the time-series that contain strong quasi-cyclical components than other methods. The reason is that wavelet analysis theoretically makes much better local information according to different time intervals from the filtered data. Wavelets can process information effectively at different scales. This implies inherent support fer multiresolution analysis, which correlates with time series that exhibit self-similar behavior across different time scales. The specific local properties of wavelets can for example be particularly useful to describe signals with sharp spiky, discontinuous or fractal structure in financial markets based on chaos theory and also allows the removal of noise-dependent high frequencies, while conserving the signal bearing high frequency terms of the signal. To date, the existing studies related to wavelet analysis are increasingly being applied to many different fields. In this study, we focus on several wavelet thresholding criteria or techniques to support multi-signal decomposition methods for financial time series forecasting and apply to forecast Korean Won / U.S. Dollar currency market as a case study. One of the most important problems that has to be solved with the application of the filtering is the correct choice of the filter types and the filter parameters. If the threshold is too small or too large then the wavelet shrinkage estimator will tend to overfit or underfit the data. It is often selected arbitrarily or by adopting a certain theoretical or statistical criteria. Recently, new and versatile techniques have been introduced related to that problem. Our study is to analyze thresholding or filtering methods based on wavelet analysis that use multi-signal decomposition algorithms within the neural network architectures specially in complex financial markets. Secondly, through the comparison with different filtering techniques' results we introduce the present different filtering criteria of wavelet analysis to support the neural network learning optimization and analyze the critical issues related to the optimal filter design problems in wavelet analysis. That is, those issues include finding the optimal filter parameter to extract significant input features for the forecasting model. Finally, from existing theory or experimental viewpoint concerning the criteria of wavelets thresholding parameters we propose the design of the optimal wavelet for representing a given signal useful in forecasting models, specially a well known neural network models.

  • PDF

개인화 추천 시스템에서 연관 관계 군집에 의한 아이템 기반의 협력적 필터링 기술 (An Item-based Collaborative Filtering Technique by Associative Relation Clustering in Personalized Recommender Systems)

  • 정경용;김진현;정헌만;이정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.467-477
    • /
    • 2004
  • 추천 시스템은 예전에는 몇몇 혁신적인 전자상거래(E-commerce) 사이트에서만 사용되어 왔으나 현재는 전자상거래를 새롭게 재구성하는 필수적인 비즈니스 도구가 되어가고 있다. 그리고 협력적 필터링은 이론과 실무 분야 모두에서 가장 성공적으로 평가받은 추천 기법 중 하나이다. 그러나 개인화 추천 시스템을 구축하기 위해서는 두 가지 문제를 동시에 고려해야 한다. 즉 초기 평가 문제와 희박성 문제이다. 본 논문에서는 연관 관계 군집과 연관 규칙의 향상도를 이용하여 이러한 문제를 해결하고자 한다. 사용자의 평가 데이타를 사용하여 아이템간의 향상도를 산출하고, a-cut에 의한 임계값을 아이템들간의 연관성에 적용한다. 연관 관계 군집의 효율성을 높이기 위해서 기존의 Hypergraph Clique Clustering 알고리즘과 본 연구에서 제안하는 Split Cluster Method를 이용하였다. 군집이 완성되면, 각 군집 내부에서 아이템간의 유사도를 산출하고 빠른 액세스를 위해 인덱스를 데이터베이스에 저장한다. 새로운 아이템들의 선호도 예측 시에 생성한 인덱스를 적용시킨다. 성능을 평가하기 위해서 기존의 협력적 필터링 기술과 비교 평가하였다. 그 결과 기존의 협력적 필터링 기술의 문제점을 해결하여 예측의 정확도를 높이는데 효과적임을 확인하였다.

선호도 재계산을 위한 연관 사용자 군집 분석과 Representative Attribute -Neighborhood를 이용한 협력적 필터링 시스템의 성능향상 (Performance Improvement of Collaborative Filtering System Using Associative User′s Clustering Analysis for the Recalculation of Preference and Representative Attribute-Neighborhood)

  • 정경용;김진수;김태용;이정현
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.287-296
    • /
    • 2003
  • 추천 시스템에 있어서 협력적 필터링 기술은 많은 연구가 되고 있다. 그러나 협력적 필터링 기술을 이용한 추천 시스템은 초기 평가 문제와 희박성 문제가 발생한다. 이를 해결하기 위해서 본 논문에서는 선호도 재 계산을 위한 연관 사용자 군집과 베이지안 추정치를 이용한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서 아이템의 속성을 고려하지 않는 단점을 보완하기 위해서 선호도에 가장 크게 영향을 미치는 대표 장르를 추출하여 유사한 이웃을 찾아 낼 때 예측에 이용하는 Representative Attribute-Neighborhood 방법을 사용한다. 협력적 필터링의 알고리즘에 군집 아이템 백터 내의 특정 아이템의 선호도를 재계산 하기 위한 연관 사용자 군집 분석을 적용하여 성능 향상을 하였다. 또 초기 평가 문제와 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집한다. 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게하여 예측의 정확도를 높일 수 있다. 제안된 방법은 기존의 방법보다 높은 성능을 나타냄을 보인다.

MPEG-7 시각 정보 기술자의 특성을 반영한 효율적인 멀티미디어 데이타 비트맵 인덱싱 방법 (An Efficient Bitmap Indexing Method for Multimedia Data Reflecting the Characteristics of MPEG-7 Visual Descriptors)

  • 정진국;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권1호
    • /
    • pp.9-20
    • /
    • 2005
  • 최근 멀티미디어 정보를 기술하기 위한 표준인 MPEG-7이 제안되어 이미지/동영상 검색 시스템과 간은 응용분야에서 사용되기 시작하였다. 그러나 MPEG-7 시각 정보 기술자들은 대부분 고차원으로 표현이 되고, 고차원에서 발생되는 문제인 "Curse of dimensionality" 때문에 기존의 인덱싱 방법(예를 들면 트리 구조를 이용하는 다차원 인덱싱 방법, 차원을 줄이는 방법, 양자화 등의 압축 기법을 이용하는 방법 등)으로는 효율적인 검색을 할 수 없다. 본 논문에서는 MPEG-7 시각 정보 기술자들의 특징을 반영한 효율적인 인덱싱 방법을 제안한다. 제안된 방법에서는 기술자를 속성 히스토그램으로 변형하고 히스토그램의 자 빈 값을 이진 형태로 표현하여 비트열을 생성하며, 이러한 비트열들을 이용하여 비트맵 인덱스를 구성한다. 질의 오브젝트가 입력되면 비트맵 인덱스를 이용하여 결과에 포함될 가능성이 있는 후보 오브젝트 리스트를 생성하게 되는데 즉, 각 오브젝트의 인덱스와 질의 오브젝트의 비트열에 대한 XOR(Exclusive OR) 연산을 수행하여서 후보 오브젝트 리스트를 생성한다. 그리고 이 리스트에 있는 오브젝트들에 대해서만 L1-norm과 같은, 기술자를 위해 사용되는 비교 연산식을 수행하여 최종 결과 오브젝트들을 사용자에게 보여주게 된다. 본 논문에서 제안하는 알고리즘은 단순한 비트 연산을 통해 검색 결과에 포함될 가능성이 있는 오브젝트들을 추출해낼 수 있기 때문에 빠른 시간 내에 검색을 마칠 수 있도록 해준다. 실험에 의하면 제안한 방법을 이용하는 경우, 90% 이상의 정확도를 유지하면서 검색 시간에서는 순차 검색에 비해 15배 이상의 속도 향상을 보임을 알 수 있었다.

고차원 멀티미디어 데이터 검색을 위한 벡터 근사 비트맵 색인 방법 (Vector Approximation Bitmap Indexing Method for High Dimensional Multimedia Database)

  • 박주현;손대온;낭종호;주복규
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.455-462
    • /
    • 2006
  • 고차원 데이터 공간에서의 효과적인 검색을 위해 최근 VA-file[1], LPC-file[2] 등과 같이 벡터 근사에 기반을 둔 필터링 색인 방법들이 연구되었다. 필터링 색인 방법은 벡터를 근사한 작은 크기의 색인 정보를 사용하여 근사 거리를 계산하고, 이를 사용하여 질의 벡터와 유사하지 않은 대부분의 벡터들을 빠른 시간 안에 검색 대상에서 제외한다. 즉, 실제 벡터 대신 근사 벡터를 읽어 디스크 I/O 시간을 줄여 전체 검색 속도를 향상시키는 것이다. 하지만 VA-file 이나 LPC-file은 근사 거리를 구하는 방법이 순차 검색과 같거나 복잡하기 때문에 검색 속도 향상 효과가 그리 크지 않다는 문제점을 가지고 있다. 본 논문은 이러한 근사 거리 계산 시간을 줄이기 위하여 새로운 비트맵 색인 구조를 제안한다. 근사 거리 계산속도의 향상을 위하여, 각 객체의 값을 특성 벡터 공간상의 위치를 나타내는 비트 패턴으로 저장하고, 객체 사이의 거리를 구하는 연산은 실제 벡터 값의 연산보다 속도가 훨씬 빠른 XOR 비트 연산으로 대체한다. 실험에 의하면 본 논문이 제안하는 방법은 기존 벡터 근사 접근 방법들과 비교하여 데이터 읽기시간은 더 크지만, 계산 시간을 크게 줄임으로써 전체 검색 속도는 순차 검색의 약 4배, 기존의 방법들보다는 최대 2배의 성능이 향상되었다. 결과적으로, 데이터베이스의 속도가 충분히 빠른 경우 기존의 벡터 근사 접근법의 필터링을 위한 계산 시간을 줄임으로써 더욱 검색 성능을 향상 시킬 수 있음을 확인할 수 있다.

Cross-talk Cancellation Algorithm for 3D Sound Reproduction

  • Kim, Hyoun-Suk;Kim, Poong-Min;Kim, Hyun-Bin
    • ETRI Journal
    • /
    • 제22권2호
    • /
    • pp.11-19
    • /
    • 2000
  • If the right and left signals of a binaural sound recording are reproduced through loudspeakers instead of a headphone, they are inevitably mixed during their transmission to the ears of the listener. This degrades the desired realism in the sound reproduction system, which is commonly called 'cross-talk.' A 'cross-talk canceler' that filters binaural signals before they are sent to the sound sources is needed to prevent cross-talk. A cross-talk canceler equalizes the resulting sound around the listener's ears as if the original binaural signal sound is reproduced next to the ears of listener. A cross-talk canceler is also a solution to the problem-how binaural sound is distributed to more than 2 channels that drive sound sources. This paper presents an effective way of building a cross-talk canceler in which geometric information, including locations of the listener and multiple loudspeakers, is divided into angular information and distance information. The presented method makes a database in an off-line way using an adaptive filtering technique and Head Related Transfer Functions. Though the database is mainly concerned about the situation where loudspeakers are located on a standard radius from the listener, it can be used for general radius cases after a distance compensation process, which requires a small amount of computation. Issues related to inverting a system to build a cross-talk canceler are discussed and numerical results explaining the preferred configuration of a sound reproduction system for stereo loudspeakers are presented.

  • PDF

A Study on Improving Forecasting Accuracy for Expenditures of Residential Building Projects through Selecting Similar Cases

  • 이준성
    • 한국건설관리학회논문집
    • /
    • 제4권4호
    • /
    • pp.114-122
    • /
    • 2003
  • Dynamic and fragmented characteristics are two of the most significant factors that distinguish the construction industry from other industries. Previous forecasting techniques have failed to solve the problems derived from the above characteristics, and do not provide considerable support This paper deals with providing a more precise forecasting by applying Case-based Reasoning (CBR). The newly developed model in this study enables project managers to forecast monthly expenditures with less time and effort by retrieving and referring only projects of a similar nature, while filtering out irrelevant cases included in database. For the purpose of accurate forecasting, the choice of the numbers of referring projects was investigated. It is concluded that selecting similar projects at $5{\~}6{\%}$ out of the whole database will produce a more precise forecasting. The new forecasting model, which suggests the predicted values based on previous projects, is more than just a forecasting methodology; it provides a bridge that enables current data collection techniques to be used within the context of the accumulated information. This will eventually help all the participants in the construction industry to build up the knowledge derived from invaluable experience.