• 제목/요약/키워드: Sequence Mining

검색결과 163건 처리시간 0.024초

U-Health에서 이벤트 상태 변화를 고려한 시간 마이닝 기법 개발 (The Development of Temporal Mining Technique Considering the Event Change of State in U-Health)

  • 김재인;김대인;황부현
    • 정보처리학회논문지D
    • /
    • 제18D권4호
    • /
    • pp.215-224
    • /
    • 2011
  • U-Health는 다양한 종류의 센서로 환자 정보를 수집하며, 스트림 데이터는 시작 시점과 종료 시점을 갖는 인터벌 이벤트로 요약 가능하다. 그러나 대부분의 시간 데이터 마이닝 기법들은 이벤트 발생 시점만을 고려하며 스트림 데이터의 상태 변화는 간과하는 문제가 있다. 이 논문은 U-Health에서 이벤트 상태 변화를 고려한 시간 마이닝 기법을 제안한다. 제안 방법은 U-Health에서 관심이 있는 이벤트만을 센서에서 서버로 전송함으로써 환경의 제약 사항들을 극복하고 스트림 데이터에 대한 네 가지 이벤트 상태를 정의하여 상태 변화를 고려한 시간 마이닝을 수행한다. 최종적으로, 제안 방법은 이벤트들 사이에 존재하는 인과 관계를 시간 관계 시퀀스로 기술하여 탐사 규칙의 모호함을 제거한다.

Finite element modelling and design of partially encased composite columns

  • Chicoine, Thierry;Tremblay, Robert;Massicotte, Bruno
    • Steel and Composite Structures
    • /
    • 제2권3호
    • /
    • pp.171-194
    • /
    • 2002
  • In this paper, the behaviour of axially loaded partially encased composite columns made with light welded H steel shapes is examined using ABAQUS finite element modelling. The results of the numerical simulations are compared to the response observed in previous experimental studies on that column system. The steel shape of the specimens has transverse links attached to the flanges to improve its local buckling capacity and concrete is poured between the flanges only. The test specimens included 14 stubcolumns with a square cross section ranging from 300 mm to 600 mm in depth. The transverse link spacing varied from 0.5 to 1 times the depth and the width-to-thickness ratio of the flanges ranged from 23 to 35. The numerical model accounted for nonlinear stress-strain behaviour of materials, residual stresses in the steel shape, initial local imperfections of the flanges, and allowed for large rotations in the solution. A Riks displacement controlled strategy was used to carry out the analysis. Plastic analyses on the composite models reproduced accurately the capacity of the specimens, the failure mode, the axial strain at peak load, the transverse stresses in the web, and the axial stresses in the transverse links. The influence of applying a typical construction loading sequence could also be reproduced numerically. A design equation is proposed to determine the axial capacity of this type of column.

A Novel Phase Locked Loop for Grid-Connected Converters under Non-Ideal Grid Conditions

  • Yang, Long-Yue;Wang, Chong-Lin;Liu, Jian-Hua;Jia, Chen-Xi
    • Journal of Power Electronics
    • /
    • 제15권1호
    • /
    • pp.216-226
    • /
    • 2015
  • Grid synchronization is one of the key techniques for the grid-connected power converters used in distributed power generation systems. In order to achieve fast and accurate grid synchronization, a new phase locked loop (PLL) is proposed on the basis of the complex filter matrixes (CFM) orthogonal signal generator (OSG) crossing-decoupling method. By combining first-order complex filters with relation matrixes of positive and negative sequence voltage components, the OSG is designed to extract specific frequency orthogonal signals. Then, the OSG mathematical model is built in the frequency-domain and time-domain to analyze the spectral characteristics. Moreover, a crossing-decoupling method is suggested to decouple the fundamental voltage. From the eigenvalue analysis point of view, the stability and dynamic performance of the new PLL method is evaluated. Meanwhile, the digital implementation method is also provided. Finally, the effectiveness of the proposed method is verified by experiments under unbalanced and distorted grid voltage conditions.

A Survey of Transfer and Multitask Learning in Bioinformatics

  • Xu, Qian;Yang, Qiang
    • Journal of Computing Science and Engineering
    • /
    • 제5권3호
    • /
    • pp.257-268
    • /
    • 2011
  • Machine learning and data mining have found many applications in biological domains, where we look to build predictive models based on labeled training data. However, in practice, high quality labeled data is scarce, and to label new data incurs high costs. Transfer and multitask learning offer an attractive alternative, by allowing useful knowledge to be extracted and transferred from data in auxiliary domains helps counter the lack of data problem in the target domain. In this article, we survey recent advances in transfer and multitask learning for bioinformatics applications. In particular, we survey several key bioinformatics application areas, including sequence classification, gene expression data analysis, biological network reconstruction and biomedical applications.

Comparison and Analysis of P2P Botnet Detection Schemes

  • Cho, Kyungsan;Ye, Wujian
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권3호
    • /
    • pp.69-79
    • /
    • 2017
  • In this paper, we propose our four-phase life cycle of P2P botnet with corresponding detection methods and the future direction for more effective P2P botnet detection. Our proposals are based on the intensive analysis that compares existing P2P botnet detection schemes in different points of view such as life cycle of P2P botnet, machine learning methods for data mining based detection, composition of data sets, and performance matrix. Our proposed life cycle model composed of linear sequence stages suggests to utilize features in the vulnerable phase rather than the entire life cycle. In addition, we suggest the hybrid detection scheme with data mining based method and our proposed life cycle, and present the improved composition of experimental data sets through analysing the limitations of previous works.

7-Nitroso-8-Hydroxyquinoline-5-Sulfonic Acid의 금속킬레이트 안정도 상수 (Stability of Metal Chelates of 7-Nitroso-8-Hydroxyquinoline-5-Sulfonate)

  • 최규원;이동형;오준석;이광우
    • 대한화학회지
    • /
    • 제12권3호
    • /
    • pp.81-84
    • /
    • 1968
  • Stabilities of chelates of 7-nitroso-8-hydroxyquinoline-5-sulfonate have been determined for divalent transition metal ions, Mn(Ⅱ), Fe(Ⅱ), Co(Ⅱ), Ni(Ⅱ), Cu(Ⅱ), and Zn(Ⅱ) by means of the Calvin-Bjerrum technique. Comparison of these stability constants with those obtained for 8-hydroxyquinoline, and 8-hydroxyquinoline-5-sulfonate shows that the observed differences are essentially the results of the lower basicity of the sulfonated group and different metal-ligand bond. The divalent metal chelate stability sequence is not in agreement with the reported metal orders for other chelating agents. The stabilities were found to follow the order Mn(Ⅱ) < Fe(Ⅱ) ${\approx}$ Co(Ⅱ) > Ni(Ⅱ) < Cu(Ⅱ) > Zn(Ⅱ).

  • PDF

Application of Self-Organizing Map and Association Rule Mining for Personalization of Product Recommendations

  • Cho, Yeong-Bin;Cho, Yoon-Ho;Kim, Soung-Hie
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2004년도 추계학술대회
    • /
    • pp.331-339
    • /
    • 2004
  • The preferences of customers change over time. However, existing collaborative filtering (CF) systems are static, since they only incorporate information regarding whether a customer buys a product during a certain period and do not make use of the purchase sequences of customers. Therefore, the quality of the recommendations of the typical CF could be improved through the use of information on such sequences. In this paper, we propose a new methodology for enhancing the quality of CF recommendation that uses customer purchase sequences. The proposed methodology is applied to a large department store in Korea and compared to existing CF techniques. Various experiments using real-world data demonstrate that the proposed methodology provides higher quality recommendations than do typical CF techniques, with better performance, especially with regard to heavy users.

  • PDF

유사 시퀀스 매칭을 위한 하이브리드 저차원 변환 (Hybrid Lower-Dimensional Transformation for Similar Sequence Matching)

  • 문양세;김진호
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.31-40
    • /
    • 2008
  • 유사 시퀀스 매칭에서는 고차원인 시퀀스를 저차원의 점으로 변환하기 위하여 저차원 변환을 사용한다. 그런데, 이러한 저차원 변환은 시계열 데이터의 종류에 따라 인덱싱 성능에 있어서 큰 차이를 나타낸다. 즉, 어떤 저차원 변환을 선택하느냐가 유사 시퀀스 매칭의 인덱싱 성능에 큰 영향을 주게 된다. 이 문제를 해결하기 위하여, 본 논문에서는 하나의 인덱스에서 두 개 이상의 저차원 변환을 통합하여 사용하는 하이브리드 접근법을 제안한다. 먼저, 하나의 시퀀스에 두 개 이상의 저차원 변환을 적용하는 하이브리드 저차원 변환의 개념을 제안하고, 변환된 시퀀스간의 거리를 계산하는 하이브리드 거리를 정의한다. 다음으로, 이러한 하이브리드 접근법 사용하면 유사 시퀀스 매칭을 정확하게 수행할 수 있음을 정형적으로 증명한다. 또한, 제안한 하이브리드 접근법을 사용하는 인덱스 구성 및 유사 시퀀스 매칭 알고리즘을 제시한다. 다양한 시계열 데이터에 대한 실험 결과, 제안한 하이브리드 접근법은 단일 저차원 변환을 사용하는 경우에 비해서 우수한 성능을 보이는 것으로 나타났다. 이 같은 결과를 볼 때, 제안한 하이브리드 접근법은 다양한 특성을 지닌 다양한 시계열 데이터에 두루 적용될 수 있는 우수한 방법이라 사료된다.

이동 시퀀스의 빈발도를 이용한 최적 이동 패턴 탐사 기법 (A Method for Optimal Moving Pattern Mining using Frequency of Moving Sequence)

  • 이연식;고현
    • 정보처리학회논문지D
    • /
    • 제16D권1호
    • /
    • pp.113-122
    • /
    • 2009
  • 기존의 패턴 탐사 기법들은 제한된 시간 및 공간영역에서 발생하는 다양한 이동 패턴들 중 단순히 사용자 요구에 적합할 것으로 추정되는 불특정한 빈발 이동 패턴만을 탐사하기 때문에 특정지점들 간의 최적 이동 경로나 정해진 시간 내의 스케줄링 경로 탐색과 같은 복합적인 시간 및 공간 제약 조건을 갖는 최적 이동 패턴을 탐사하는 문제에는 적용하기 어렵다. 이에 본 논문에서는 방대한 이동 객체의 이력 데이터 집합으로부터 복합적인 시간 및 공간 제약을 갖는 최적 이동 패턴을 탐사하는 문제를 보이고, 적용 가능한 위치 기반 서비스로서 최적 이동 경로에 해당하는 패턴을 탐색하기 위한 새로운 패턴 탐사 기법인 STOMP-F를 제안한다. 제안된 기법은 특정한 지점들 사이를 이동한 객체의 패턴들 중 객체가 가장 빈번하게 이동한 경로를 탐색하여 최적 경로로 결정하는 패턴 빈발도를 이용한 탐색 방법으로, 최적 이동 패턴 탐사 과정의 이동 시퀀스 생성 단계에서 객체의 위치 값과 공간영역 간의 위상 관계를 고려하여 이동 객체의 위치 속성에 대한 최하위 수준에서의 공간 일반화를 통해 보다 효율적으로 패턴 탐사를 수행할 수 있다. 제안 방법을 Dijkstra 알고리즘과 $A^*$ 알고리즘을 대상으로 실험 평가한 결과 $A^*$ 알고리즘의 휴리스틱 가중치에 따라 차이는 있으나 연산 처리 시간을 기준으로 타 알고리즘들 보다 효과적임을 알 수 있다.

Mining and analysis of microsatellites in human coronavirus genomes using the in-house built Java pipeline

  • Umang, Umang;Bharti, Pawan Kumar;Husain, Akhtar
    • Genomics & Informatics
    • /
    • 제20권3호
    • /
    • pp.35.1-35.9
    • /
    • 2022
  • Microsatellites or simple sequence repeats are motifs of 1 to 6 nucleotides in length present in both coding and non-coding regions of DNA. These are found widely distributed in the whole genome of prokaryotes, eukaryotes, bacteria, and viruses and are used as molecular markers in studying DNA variations, gene regulation, genetic diversity and evolutionary studies, etc. However, in vitro microsatellite identification proves to be time-consuming and expensive. Therefore, the present research has been focused on using an in-house built java pipeline to identify, analyse, design primers and find related statistics of perfect and compound microsatellites in the seven complete genome sequences of coronavirus, including the genome of coronavirus disease 2019, where the host is Homo sapiens. Based on search criteria among seven genomic sequences, it was revealed that the total number of perfect simple sequence repeats (SSRs) found to be in the range of 76 to 118 and compound SSRs from 01 to10, thus reflecting the low conversion of perfect simple sequence to compound repeats. Furthermore, the incidence of SSRs was insignificant but positively correlated with genome size (R2 = 0.45, p > 0.05), with simple sequence repeats relative abundance (R2 = 0.18, p > 0.05) and relative density (R2 = 0.23, p > 0.05). Dinucleotide repeats were the most abundant in the coding region of the genome, followed by tri, mono, and tetra. This comparative study would help us understand the evolutionary relationship, genetic diversity, and hypervariability in minimal time and cost.