• 제목/요약/키워드: space-time clustering

검색결과 139건 처리시간 0.029초

Identification of Fuzzy Inference System Based on Information Granulation

  • Huang, Wei;Ding, Lixin;Oh, Sung-Kwun;Jeong, Chang-Won;Joo, Su-Chong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제4권4호
    • /
    • pp.575-594
    • /
    • 2010
  • In this study, we propose a space search algorithm (SSA) and then introduce a hybrid optimization of fuzzy inference systems based on SSA and information granulation (IG). In comparison with "conventional" evolutionary algorithms (such as PSO), SSA leads no.t only to better search performance to find global optimization but is also more computationally effective when dealing with the optimization of the fuzzy models. In the hybrid optimization of fuzzy inference system, SSA is exploited to carry out the parametric optimization of the fuzzy model as well as to realize its structural optimization. IG realized with the aid of C-Means clustering helps determine the initial values of the apex parameters of the membership function of fuzzy model. The overall hybrid identification of fuzzy inference systems comes in the form of two optimization mechanisms: structure identification (such as the number of input variables to be used, a specific subset of input variables, the number of membership functions, and polyno.mial type) and parameter identification (viz. the apexes of membership function). The structure identification is developed by SSA and C-Means while the parameter estimation is realized via SSA and a standard least square method. The evaluation of the performance of the proposed model was carried out by using four representative numerical examples such as No.n-linear function, gas furnace, NO.x emission process data, and Mackey-Glass time series. A comparative study of SSA and PSO demonstrates that SSA leads to improved performance both in terms of the quality of the model and the computing time required. The proposed model is also contrasted with the quality of some "conventional" fuzzy models already encountered in the literature.

대용량 텍스트 데이터베이스를 위한 효율적인 2단계 합성 요약 화일 방법 (An Effcient Two-Level Hybrid Signature File Method for Large Text Databases)

  • 유재수;강형일
    • 한국정보처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.923-932
    • /
    • 1997
  • 본 논문은 대용량의 텍스트 문서를 효율적으로 처리하기 위해 단어 분별도(trrm discrimination)개념을 이용한 2단계 합성 요약화일 방법(THM)을 제안한다. 또한 보다 더 나은 검색성능을 위해 2단계 합성 요약 화일 방법에 고분별력 단어들의 유사성에 의해 유사한 요약들은 함께 결집하는 Yoo가 제안한 요약결집 방법을 적용한다. 검색 시간, 부가 저장 공간 측면에서 제안된 2단계 합성 요약화일(THM)의 성능 분석 모델을 제공하고 기존의 방법들 즉, 비트 슬라이스 방법(BM), 2단계 요약화일 방법(TM) 합성 방법(HM)들과 성능 평가를 수행한다. 성능 비교결과 일치하는 레코드 수가 160이하일때 100,000개의 대용량 데이터베이스에서 제안된 THM이 검색 성능면에 있어서 가장 좋은 성능을 보인다.

  • PDF

텍스트 마이닝을 이용한 암반공학분야 SCI논문의 주제어 분석 (Keyword Analysis of Two SCI Journals on Rock Engineering by using Text Mining)

  • 정용복;박의섭
    • 터널과지하공간
    • /
    • 제25권4호
    • /
    • pp.303-319
    • /
    • 2015
  • 텍스트 형태의 자료에서 유용한 정보를 추출하는 텍스트 마이닝 기법은 데이터 마이닝의 한 분야이다. 본 연구에서는 암반공학 분야의 대표적인 국제 학술지인 IJRMMS과 RMRE에 2001년 이후 게재된 논문의 제목과 주요어를 대상으로 텍스트 마이닝 기법을 적용하여 주요 연구 동향과 시계열 트렌드, 연구 분야 상관관계 등을 파악하였으며 이를 이해하기 쉽도록 가시화하였다. 분석 결과 주요 연구 분야는 두 학술지 모두 유사하였으나 연관관계 분석 결과 IJRMMS의 경우 'rock'을 기반으로 1개의 큰 그룹과 소규모 그룹이 형성된 반면 RMRE는 중규모의 그룹이 형성되고 이 그룹 간에 연결이 형성되는 구조가 나타났다. 또한 시계열 자료로 변환하여 군집 분석과 각 주제어의 기울기 자료로 분석한 결과 일부 하강 주제어들이 있었으나 양적인 측면에서 차이가 있을 뿐 대부분 논문 수가 증가하는 것으로 나타났다.

굴곡 기반 형태 그래프를 이용한 모양 검색 (Shape Retrieval using Curvature-based Morphological Graphs)

  • 방난효;엄기현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.498-508
    • /
    • 2005
  • 모양 데이타는 이미지가 나타내는 의미를 가장 잘 반영하는 데이타로서 이미지 검색에 중요한 정보로 사용된다 특히 구조적으로 표현된 모양 특징은 모양이 갖는 기초적 특성과 그들간의 관계 정보를 잘 나타내므로 폭넓게 연구되고 있다. 그러나 대개의 구조적 모양 특징들은 그래프나 트리와 같은 구조로 표현되므로 모양 데이타 검색에서 효율적인 검색 시간을 보장할 수 없는 문제를 지니고 있다. 이러한 문제를 해결하기 위하여 본 논문에서는 모양의 윤곽선 정보를 기반으로한 굴곡 기반 형태 그래프를 생성하고 이를 일반화한 구조로부터 모양을 클러스터링할 수 있는 키를 설계한다. 제안한 굴곡 기반 형태 그래프는 모양이 가지고 있는 윤곽선 특성과 영역의 형태적 특성을 모두 가지고 있다. 모양 검색은 단계적으로 이루어진다. 클러스터링을 통해 검색 공간을 축소하고 외부 굴곡 특징을 이용한 굴곡의 패턴 매칭을 통해 종합적인 유사도가 결정된다. 다양한 실험을 통해 굴곡 기반 형태 그래프와 클러스터링을 통해 검색 공간과 비용이 줄어드는 것을 보여준다.

컴뮤트 타임 기반의 다양체 임베딩을 이용한 파형 신호 인식에 관한 연구 (A Study on Classification of Waveforms Using Manifold Embedding Based on Commute Time)

  • 한희일
    • 전자공학회논문지
    • /
    • 제51권2호
    • /
    • pp.148-155
    • /
    • 2014
  • 본 논문에서는 파형 신호에서 패치를 추출하고 이를 패치 그래프로 구성한 다음, 이로부터 대표적인 다양체 임베딩 방식인 컴뮤트 타임 임베딩 기법을 구현하고, 이의 특성을 분석한다. 특히 음성 신호나 악기 음 등, 시간에 따라 스펙트럼이 가변적인 신호를 임베딩하면 스펙트럼의 변화에도 불구하고 그 신호 고유의 기하 구조를 생섬함을 실험으로 확인한다. 다양체 임베딩은 비선형 공간에 놓여 있는 고차원 데이터를 저차원 공간으로의 효율적인 맵을 가능하게 하지만 그래프 구성에 이용된 데이터에 대한 정보만 알 수 있고 그렇지 않은 데이터(out-of-sample data)에 대해서는 정보를 얻기 어렵다. 따라서 다양체 임베딩은 데이터 클러스터링에 적절히 적용 가능하지만, 훈련 과정을 통해 얻은 정보를 기초로 유추 기능이 요구되는 인식 등에는 응용하기 어려운 제약이 따른다. 이를 해결하기 위하여 본 논문에서는 다양체 임베딩이 인식 분야에도 적용 가능하도록 새로운 알고리즘을 제안하고 악기 음 분류 실험을 통하여 그 특성을 분석한다.

EPR : 지리 정보 시스템을 위한 향상된 병렬 R-tree 색인 기법 (EPR : Enhanced Parallel R-tree Indexing Method for Geographic Information System)

  • 이춘근;김정원;김영주;정기동
    • 한국정보처리학회논문지
    • /
    • 제6권9호
    • /
    • pp.2294-2304
    • /
    • 1999
  • 본 논문은 병렬 입출력과 효율적인 디스크 접근을 이용하여 입출력 성능을 높임으로써 지리 정보 시스템의 질의 처리 성능을 향상시키는 것을 목적으로 한다. 동시에 접근할 가능성이 높은 인접한 공간 데이터를 디스크의 논리적 블록 단위로 패킹하여 하나 또는 연속적인 논리적 블록으로 클러스터링 하면 한번의 디스크 접근으로 많은 공간 데이터를 읽을 수 있어 질의 처리에 따른 디스크 접근 횟수와 디스크 접근 오버 헤드를 줄임으로써 입출력 시간을 줄일 수 있다. 본 논문에서는 기존 Parallel R-tree 기법의 병렬 입출력 기법과 패킹 기반 클러스터링 기법을 결합하여 효율적인 입출력을 지원하는 EPR(Enhanced Parallel R-tree) 색인 기법을 제안한다. EPR 기법의 주요 특징은 다음과 같다. 첫째, 공간 데이터를 Hilbert space filling curve를 이용하여 인접도에 따라 정렬하여 패킹함으로써 상향식으로 R-tree를 생성한다. 둘째, 정렬된 공간 데이터를 패킹하여 하나 또는 연속적인 논리적 블록에 저장하는 패킹 기반 클러스터링을 통해 공간 데이터 클러스터를 구성한다. 셋째, 색인 기법 및 공간 데이터 클러스터를 round-robin 스트라이핑 방식을 통해 다중 디스크에 분산 배치한다. EPR 기법과 기존 PR 기법의 성능을 비교한 결과, 공간 질의 처리 속도가 30% 이상 향상되었으며, 특히 논리적 블록의 크기가 클수록, 공간 데이터의 크기가 작을수록 질의 처리 성능이 향상되는 결과를 보였다.

  • PDF

MLPPI Wizard: An Automated Multi-level Partitioning Tool on Analytical Workloads

  • Suh, Young-Kyoon;Crolotte, Alain;Kostamaa, Pekka
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권4호
    • /
    • pp.1693-1713
    • /
    • 2018
  • An important technique used by database administrators (DBAs) is to improve performance in decision-support workloads associated with a Star schema is multi-level partitioning. Queries will then benefit from performance improvements via partition elimination, due to constraints on queries expressed on the dimension tables. As the task of multi-level partitioning can be overwhelming for a DBA we are proposing a wizard that facilitates the task by calculating a partitioning scheme for a particular workload. The system resides completely on a client and interacts with the costing estimation subsystem of the query optimizer via an API over the network, thereby eliminating any need to make changes to the optimizer. In addition, since only cost estimates are needed the wizard overhead is very low. By using a greedy algorithm for search space enumeration over the query predicates in the workload the wizard is efficient with worst-case polynomial complexity. The technology proposed can be applied to any clustering or partitioning scheme in any database management system that provides an interface to the query optimizer. Applied to the Teradata database the technology provides recommendations that outperform a human expert's solution as measured by the total execution time of the workload. We also demonstrate the scalability of our approach when the fact table (and workload) size increases.

Property-based Design of Ion-Channel-Targeted Library

  • Ahn, Ji-Young;Nam, Ky-Youb;Chang, Byung-Ha;Yoon, Jeong-Hyeok;Cho, Seung-Joo;Koh, Hun-Yeong;No, Kyoung-Tai
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.134-138
    • /
    • 2005
  • The design of ion channel targeted library is a valuable methodology that can aid in the selection and prioritization of potential ion channel-likeness for ion-channel-targeted bio-screening from large commercial available chemical pool. The differences of property profiling between the 93 ion-channel active compounds from MDDR and CMC database and the ACDSC compounds were classified by suitable descriptors calculated with preADME software. Through the PCA, clustering, and similarity analysis, the compounds capable of ion channel activity were defined in ACDSC compounds pool. The designed library showed a tendency to follow the property profile of ion-channel active compounds and can be implemented with great time and economical efficiencies of ligand-based drug design or virtual high throughput screening from an enormous small molecule space.

  • PDF

차세대 객차용 청정시스템 개발 (Development of Air Cleaning System for Railroad Vehicles)

  • 박덕신;조영민;권순박;박은영;김세영;정미영
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2008년도 춘계학술대회 논문집
    • /
    • pp.2109-2113
    • /
    • 2008
  • As the standard of living is higher, the passengers using public transportations desire better qualities of environment as well as more comfortable indoor environment. In case of train, the passengers' comfort in passenger cabin is one of the most important elements to be competitive with other transport systems. The indoor air quality of the cabin should be managed properly, because many passengers travel for a long time in the small space of $144\;m^3$. For proper management of the air quality, the heating, ventilation and air conditioning (HVAC) system is required for the ventilation of the compartment. To maintain comfortable environment in the compartment, the automatic ventilation system is needed to exchange the indoor air with fresh air or clean indoor air. In this study, we investigated the indoor air quality (PM-10, $CO_2$, and VOCs) in the compartment of train. In addition, type and pattern of PM-10 has been analyzed through the clustering analysis. Based on the analysis, we could found that the fine particulate matters in the compartment can be a serious hazard to human. To control the concentration of PM-10 and $CO_2$ air cleaners were developed. Through this study, it is expected that people who take a train will be in a more comfortable environment.

  • PDF

Robust Segmentation for Low Quality Cell Images from Blood and Bone Marrow

  • Pan Chen;Fang Yi;Yan Xiang-Guo;Zheng Chong-Xun
    • International Journal of Control, Automation, and Systems
    • /
    • 제4권5호
    • /
    • pp.637-644
    • /
    • 2006
  • Biomedical image is often complex. An applied image analysis system should deal with the images which are of quite low quality and are challenging to segment. This paper presents a framework for color cell image segmentation by learning and classification online. It is a robust two-stage scheme using kernel method and watershed transform. In first stage, a two-class SVM is employed to discriminate the pixels of object from background; where the SVM is trained on the data which has been analyzed using the mean shift procedure. A real-time training strategy is also developed for SVM. In second stage, as the post-processing, local watershed transform is used to separate clustering cells. Comparison with the SSF (Scale space filter) and classical watershed-based algorithm (those are often employed for cell image segmentation) is given. Experimental results demonstrate that the new method is more accurate and robust than compared methods.