• 제목/요약/키워드: Data Sequence

검색결과 3,094건 처리시간 0.03초

시퀀스 유틸리티 리스트를 사용하여 높은 유틸리티 순차 패턴 탐사 기법 (Mining High Utility Sequential Patterns Using Sequence Utility Lists)

  • 박종수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권2호
    • /
    • pp.51-62
    • /
    • 2018
  • 높은 유틸리티 순차 패턴 탐사는 데이터 마이닝에서 중요한 연구 주제로 간주되고 있다. 이 주제에 대해 몇 개의 알고리즘들이 제안되었지만, 그것들은 높은 유틸리티 순차 패턴 탐사의 탐색 공간이 커지는 문제에 부딪히게 된다. 한 시퀀스의 더 엄격한 유틸리티 상한 값은 탐색 공간에서 초기에 유망하지 않은 패턴들을 더 가지치기할 수 있다. 본 논문에서 새로운 유틸리티 상한 값을 제안하는데, 그것은 한 시퀀스와 그 자손 시퀀스들의 최대 예상 유틸리티인 sequence expected utility (SEU)이다. 높은 유틸리티 순차 패턴들을 탐사하는데 필수적인 정보를 유지하기 위해 각 패턴에 대한 시퀀스 유틸리티 리스트를 새로운 자료구조로 사용한다. SEU를 활용하여 높은 유틸리티 순차 패턴들을 찾아내는 알고리즘인 High Sequence Utility List-Span (HSUL-Span)을 제안한다. 서로 다른 영역의 합성 데이터세트와 실제 데이터세트에 대한 실험 결과는 HSUL-Span이 상당히 적은 수의 후보 패턴들을 생성하고 실행 시간 면에서 다른 알고리즘들보다 우수한 것을 보여준다.

스트림 데이터 학습을 위한 예측적 컨볼루션 신경망 (Predictive Convolutional Networks for Learning Stream Data)

  • 허민오;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권11호
    • /
    • pp.614-618
    • /
    • 2016
  • 인터넷 상 데이터와 스마트 디바이스가 증가함에 따라 순차적으로 유입되는 스트림 형식의 데이터가 늘어나고 있다. 잠재적인 빅데이터인 스트림 데이터를 다루기 위해서는 온라인 학습이 가능해야 한다. 이에 본 고에서는 스트림 데이터 학습을 위한 새로운 모델인 예측적 컨볼루션 신경망과 온라인 학습방법을 제안한다. 이 모델은 탐지와 풀링을 반복하는 컨볼루션 연산을 통해 탐지 패턴을 계층화하여 상위 계층이 될수록 긴 길이의 패턴의 정보를 다루도록 한다. 본 모델의 기초적 검증을 위해 스마트폰으로 2달간 수집한 GPS 데이터를 이산화하여 관측데이터로 삼았다. 이를 제안모델을 통해 학습하여 계층을 따라 추상화된 정보로부터 복원한 데이터와 관측데이터를 비교하여, 긴 시간의 패턴을 다루면서도 관측 수준의 데이터를 복원하는 것을 확인하였다.

자료흐름도를 사용한 테이블 설계순서 추출기의 설계 및 구현 (Design & Implementation of Extractor for Design Sequence of DB tables using Data Flow Diagrams)

  • 임은기
    • 한국산업정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.43-49
    • /
    • 2012
  • 현재 운용되고 있는 리가시 시스템에 대한 요구명세서는 대부분 자료흐름도를 사용하고 있어, 시스템의 유지 보수를 위해서는 자료흐름도로부터 획득한 정보에 의존하지 않을 수 없다. 본 논문에서는 자료흐름도로부터 데이터베이스 테이블 설계순서를 추출하는 추출기를 설계, 구현하였다. 추출기는 자료흐름도를 입력 받아 저장하고, 이를 방향그래프로 변환하여 데이터베이스 테이블 설계순서를 추출하여 제시한다. 구현된 추출기는 실제 운용 중인 소프트웨어 시스템에 적용함으로써 실제 적용가능성을 보였다.

복셀화를 통한 디자인 데이타로부터의 조립순서 결정 (Assembly Sequence Determination from Design Data Using Voxelization)

  • 이창호;조현보;정무영
    • 한국정밀공학회지
    • /
    • 제13권6호
    • /
    • pp.90-101
    • /
    • 1996
  • Determination of assembly sequence of components is a key issue in assembly operation. Although a number of articles dealing with assembly sequence determination have appeared, an efficient and general methodology for complex products has yet to appear. The objective of this paper is to present the problems and models used to generate assembly sequence from design data. An essential idea of this research is to acquire a finite number of voxels from any complex geometric entity, such as 3D planar polygons, hollow spheres, cylinders. cones, tori, etc. In order to find a feasible assembly sequence, the following four steps are needed: (1) The components composing of an assembly product are identified and then the geometric entities of each component are extracted. (2) The geometric entities extracted in the first step are translated into a number of voxels. (3) All the mating or coupling relations between components are found by considering relations between voxels. (4) The components to be disassembled are determined using CCGs (Component Coupling Graph).

  • PDF

DNA 데이터 저장을 위한 DNA 정보 은닉 기법 (DNA Information Hiding Method for DNA Data Storage)

  • 이석환;권기룡
    • 전자공학회논문지
    • /
    • 제51권10호
    • /
    • pp.118-127
    • /
    • 2014
  • DNA 데이터 저장(Data storage)은 DNA의 염기 서열에 대용량의 디지털 데이터를 저장하는 방법으로, 차세대 정보 저장 매개물로 인식되고 있다. 본 논문에서는 DNA 스테가노그라픽 기반으로 비부호 DNA 서열(Noncoding DNA sequence)에 정보를 저장하는 방법을 제안한다. 제안한 방법은 암호화된 데이터들을 정수 변화표에 의하여 데이터 염기 서열로 변환한 후, 시드 정보, 및 섹터 길이로 구성된 은닉 키에 의하여 비부호 염기 서열에 은닉한다. 따라서 단백질의 유전 기능이 유지되고, 원 DNA 서열없이 정보가 검출되며, 변이에 의하여 발생되는 오류가 검출된다. 기존 방법과의 비교 실험을 통하여 제안한 방법이 높은 bpn를 가지는 저장 효율을 가지며, 패리티 염기에 의하여 은닉된 정보의 오류 위치를 검출할 수 있음을 확인하였다.

VDM의 자료구조인 set, sequency, map의 프로그래밍 언어 자료구조인 linked list로의 변환 (The Conversion of a Set, a Sequence, and a Map in VDM to a Linked List in a Programming Language)

  • 유문성
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.421-426
    • /
    • 2001
  • 정형적 개발 방법론은 소프트웨어를 정확하고 체계적으로 개발하기 위하여 사용되며 시스템을 정형 명세 언어를 사용하여 맹세하고 이를 구현할 때까지 점진적으로 시스템을 구체화하는 방법으로 개발한다. VDM은 정형 명세 언어의 하나로서 set, sequence, map의 수학적 추상적 자료구조를 사용하여 시스템을 명세하는데 대부분의 프로그래밍 언어는 이런 자료구조를 가지고 있지 않다. 그러므로 이들 자료구조들의 변환이 필요하며 VDM의 수학적 자료구조들은 프로그래밍 언어의 자료구조인 연결 리스트로 변환 할 수 있다. 본 논문에서는 VDM의 set, sequence, map의 자료구조를 프로그래밍 언어의 자료구조인 연결 리스트로 변환하는 방법과 그 변환의 타당성을 수학적으로 증명하였다.

  • PDF

Building an Integrated Protein Data Management System Using the XPath Query Process

  • Cha Hyo Soung;Jung Kwang Su;Jung Young Jin;Ryu Keun Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.99-102
    • /
    • 2004
  • Recently according to developing of bioinformatics techniques, there are a lot of researches about large amount of biological data. And a variety of files and databases are being used to manage these data efficiently. However, because of the deficiency of standardization there are a lot of problems to manage the data and transform one into the other among heterogeneous formats. We are interested in integrating. saving, and managing gene and protein sequence data generated through sequencing. Accordingly, in this paper the goal of our research is to implement the system to manage sequence data and transform a sequence file format into other format. To satisfy these requirements, we adopt BSML (Bioinformatics Sequence Markup Language) as the standard to manage the bioinformatics data. And then we integrate and store the heterogeneous 리at file formats using BSML schema based DTD. And we developed the system to apply the characteristics of object-oriented database and to process XPath query, one of the efficient structural query. that saves and manages XML documents easily.

  • PDF

다차원 데이타 공간에서 시뭔스 데이타 세트를 위한 클러스터링 기법 (Clustering Technique for Sequence Data Sets in Multidimensional Data Space)

  • 이석룡;임동혁;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.655-664
    • /
    • 2001
  • 비디오 스트림이나 음성 아날로그 신호와 같은 연속된 데이타는 특징 공간(feature space)에서 다차원 데이타 시퀀스(multidimensional data sequence)로 모델링될 수 있다. 본 논문에서는 이러한 다차원 데 이타 시퀀스의 효과적인 클러스터링 기법에 대하여 연구한다. 각 시퀀스는 차후의 저장 및 유사성 검색 (similarity search)을 효율적으로 실행하기 위하여 소수 개의 하이퍼 사각형 (hyper-rectangle) 형태의 클러스터로 표현된다. 본 논문에서는 사전에 정의된 수준의 클러스터링 품질을 보장하는 선형 복잡도를 갖는 클러스터링 알고리즘을 제시하고, 다양한 비디오 데이타에 관한 실험을 통하여 알고리즘의 적합성을 보여준다.

  • PDF

A Novel Hitting Frequency Point Collision Avoidance Method for Wireless Dual-Channel Networks

  • Quan, Hou-De;Du, Chuan-Bao;Cui, Pei-Zhang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권3호
    • /
    • pp.941-955
    • /
    • 2015
  • In dual-channel networks (DCNs), all frequency hopping (FH) sequences used for data channels are chosen from the original FH sequence used for the control channel by shifting different initial phases. As the number of data channels increases, the hitting frequency point problem becomes considerably serious because DCNs is non-orthogonal synchronization network and FH sequences are non-orthogonal. The increasing severity of the hitting frequency point problem consequently reduces the resource utilization efficiency. To solve this problem, we propose a novel hitting frequency point collision avoidance method, which consists of a sequence-selection strategy called sliding correlation (SC) and a collision avoidance strategy called keeping silent on hitting frequency point (KSHF). SC is used to find the optimal phase-shifted FH sequence with the minimum number of hitting frequency points for a new data channel. The hitting frequency points and their locations in this optimal sequence are also derived for KSHF according to SC strategy. In KSHF, the transceivers transmit or receive symbol information not on the hitting frequency point, but on the next frequency point during the next FH period. Analytical and simulation results demonstrate that unlike the traditional method, the proposed method can effectively reduce the number of hitting frequency points and improve the efficiency of the code resource utilization.

Applied Computational Tools for Crop Genome Research

  • Love Christopher G;Batley Jacqueline;Edwards David
    • Journal of Plant Biotechnology
    • /
    • 제5권4호
    • /
    • pp.193-195
    • /
    • 2003
  • A major goal of agricultural biotechnology is the discovery of genes or genetic loci which are associated with characteristics beneficial to crop production. This knowledge of genetic loci may then be applied to improve crop breeding. Agriculturally important genes may also benefit crop production through transgenic technologies. Recent years have seen an application of high throughput technologies to agricultural biotechnology leading to the production of large amounts of genomic data. The challenge today is the effective structuring of this data to permit researchers to search, filter and importantly, make robust associations within a wide variety of datasets. At the Plant Biotechnology Centre, Primary Industries Research Victoria in Melbourne, Australia, we have developed a series of tools and computational pipelines to assist in the processing and structuring of genomic data to aid its application to agricultural biotechnology resear-ch. These tools include a sequence database, ASTRA, for the processing and annotation of expressed sequence tag data. Tools have also been developed for the discovery of simple sequence repeat (SSR) and single nucleotide polymorphism (SNP) molecular markers from large sequence datasets. Application of these tools to Brassica research has assisted in the production of genetic and comparative physical maps as well as candidate gene discovery for a range of agronomically important traits.