• Title/Summary/Keyword: 순차적 처리

Search Result 702, Processing Time 0.024 seconds

Mining Approximate Sequential Patterns in a Large Sequence Database (대용량 순차 데이터베이스에서 근사 순차패턴 탐색)

  • Kum Hye-Chung;Chang Joong-Hyuk
    • The KIPS Transactions:PartD
    • /
    • v.13D no.2 s.105
    • /
    • pp.199-206
    • /
    • 2006
  • Sequential pattern mining is an important data mining task with broad applications. However, conventional methods may meet inherent difficulties in mining databases with long sequences and noise. They may generate a huge number of short and trivial patterns but fail to find interesting patterns shared by many sequences. In this paper, to overcome these problems, we propose the theme of approximate sequential pattern mining roughly defined as identifying patterns approximately shared by many sequences. The proposed method works in two steps: one is to cluster target sequences by their similarities and the other is to find consensus patterns that ire similar to the sequences in each cluster directly through multiple alignment. For this purpose, a novel structure called weighted sequence is presented to compress the alignment result, and the longest consensus pattern that represents each cluster is generated from its weighted sequence. Finally, the effectiveness of the proposed method is verified by a set of experiments.

A Sequential Pattern Mining based on Dynamic Weight in Data Stream (스트림 데이터에서 동적 가중치를 이용한 순차 패턴 탐사 기법)

  • Choi, Pilsun;Kim, Hwan;Kim, Daein;Hwang, Buhyun
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.2 no.2
    • /
    • pp.137-144
    • /
    • 2013
  • A sequential pattern mining is finding out frequent patterns from the data set in time order. In this field, a dynamic weighted sequential pattern mining is applied to a computing environment that changes depending on the time and it can be utilized in a variety of environments applying changes of dynamic weight. In this paper, we propose a new sequence data mining method to explore the stream data by applying the dynamic weight. This method reduces the candidate patterns that must be navigated by using the dynamic weight according to the relative time sequence, and it can find out frequent sequence patterns quickly as the data input and output using a hash structure. Using this method reduces the memory usage and processing time more than applying the existing methods. We show the importance of dynamic weighted mining through the comparison of different weighting sequential pattern mining techniques.

Multi-class Classification System Based on Multi-loss Linear Combination for Word Spacing and Sentence Boundary Detection (띄어쓰기 및 문장 경계 인식을 위한 다중 손실 선형 결합 기반의 다중 클래스 분류 시스템)

  • Kim, GiHwan;Seo, Jisu;Lee, Kyungyeol;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.185-188
    • /
    • 2018
  • 띄어쓰기와 문장 경계 인식은 그 성능에 따라 자연어 분석 단계에서 오류를 크게 전파하기 때문에 굉장히 중요한 문제로 인식되고 있지만 각각 서로 다른 자질을 사용하는 문제 때문에 각각 다른 모델을 사용해 순차적으로 해결하였다. 그러나 띄어쓰기와 문장 경계 인식은 완전히 다른 문제라고는 볼 수 없으며 두 모델의 순차적 수행은 앞선 모델의 오류가 다음 모델에 전파될 뿐만 아니라 시간 복잡도가 높아진다는 문제점이 있다. 본 논문에서는 띄어쓰기와 문장 경계 인식을 하나의 문제로 보고 한 번에 처리하는 다중 클래스 분류 시스템을 통해 시간 복잡도 문제를 해결하고 다중 손실 선형 결합을 사용하여 띄어쓰기와 문장 경계 인식이 서로 다른 자질을 사용하는 문제를 해결했다. 최종 모델은 띄어쓰기와 문장 경계 인식 기본 모델보다 각각 3.98%p, 0.34%p 증가한 성능을 보였다. 시간 복잡도 면에서도 단일 모델의 순차적 수행 시간보다 38.7% 감소한 수행 시간을 보였다.

  • PDF

Design and Algorithm Implementation of a Distributed Information Retrieval System using Sequential Transferring Method(STM) (순차적 전달방식(STM)을 이용한 분산정보검색시스템의 설계 및 알고리즘 구현)

  • Yoon, Hee-Byung;Kim, Yong-Han;Kim, Hwa-Soo
    • The KIPS Transactions:PartB
    • /
    • v.11B no.5
    • /
    • pp.603-610
    • /
    • 2004
  • The distributed Information Retrieval System centrally controlled by mediator or meta search engine result in congestion of heavy traffic and int he problem of increment of cost for the reason of the design of complicated algorithm for central control and installation of hardware. So to figure out this problem, the way is needed that has independent retrieval functionality and can cooperate each other without dependency. In this paper, we overview a few works involved in distributed information retrieval system, then, implement algorithm and design the frame-work of distributed information retrieval system using sequential transferring method(STM) including multiple information retrieval system separated from central control. For this first of all, we present a web partition policy which devide and manage web logically and we present the sequential query processing way by means of illustration through changing numbered information retrieval system. Then, we also present 3-layered structure of framework and function and module of each layer suitable for information retrieval system. Last of ail, for effective implementation of STM algorithm we analysis module structure and present description of pseudocode of this, and show that the proposed STM algorithm works smoothly by demonstration of sequential query transfer process between servers.

Development of a Method Dynamic Invocation Component for Network Program (네트워크 프로그램용 메소드 동적 호출 컴포넌트 개발)

  • 신봉준;정문상;홍순구
    • Proceedings of the Korea Association of Information Systems Conference
    • /
    • 2004.11a
    • /
    • pp.29-36
    • /
    • 2004
  • 많은 기능을 수행하는 네트워크 프로그램은 그 기능 만큼의 명령어들과 명령어 인자들을 주고 받게 되다. 수신된 명령어에 대한 처리는 $"IF\~ELSE"$ 같은 순차적인 비교구문을 사용하거나 자바 RMI같은 원격 메소드 호출방식을 사용하고 있다. 그러나 많은 명령어들을 매번 순차적인 방식으로 비교하는 것과 원격 메소드를 설계하는 방식은 그 구현 및 유지보수에 많은 어려움을 유발하고 있다. 본 논문의 목적은 명령어 수신부와 실행부에 대한 컴포넌트를 개발하여 프로그램 개발 및 유지보수에 들어가는 노력을 줄이고 프로그램의 수행성능을 향상시키기 위한 컴포넌트 개발에 있다.

  • PDF

고성능 병렬처리 컴퓨터 KAICUBE-860

  • 박규호
    • The Magazine of the IEIE
    • /
    • v.20 no.7
    • /
    • pp.104-114
    • /
    • 1993
  • 본 연구 개발에서는 계속적으로 그 필요가 증가하는 대규모 계산을 위한 슈퍼급의 성능을 가지는 병렬처리 시스템의 구현, 구축을 목표로 하고 있다. 우리는 슈퍼급의 컴퓨터 시스템을 개발하기 위해 최신의 i860 프로세서를 사용한 단위컴퓨터를 설계, 제작하여 최대 40 MFLOPB의 성능을 가지는 단위 컴퓨터를 구현하였고, 8개의 단위컴퓨터를 연결하여 320MFLOPS컴퓨터를 개발하였다. 최종 목표는 128개의 단위 컴퓨터를 연결하여 5 GFLOPS 최대 계산능력을 갖는 7차원 하이퍼큐브 컴퓨터 시스템 KAICUBE-860을 구성하고자 한다. 대부분의 사람들은 그 생각방식이나 행동형태가 순차적인 구조를 가지고 있기 때문에 병렬적인 프로그램의 개발이 쉽지가 않고 때문에 사용자로 하여금 보다 쉽게 병렬시스템에 접근할 수 있도록 사용자 환경을 적절히 구축하여야만 한다. 따라서 우리의 최종 목표는 슈퍼급 성능의 병렬 처리 시스템이고 그 사용 방법은 보통순차적 컴퓨터를 사용하듯이 간단한 사용자 환경을 제공하는 시스템이다. 이를 위해 시스템 소프트웨어와 사용자 환경을 계속 개발 중에 있다.

  • PDF

Sequence Pattern Mining Using Meaning-based Transaction Structure for USN system (USN 환경에서 의미 기반 트랜잭션 구조를 이용한 순차 패턴 탐사 기법)

  • Choi, Pilsun;Kang, Donghyun;Kim, Hwan;Kim, Daein;Hwang, Buhyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.1105-1108
    • /
    • 2012
  • 순차 패턴 탐사 기법은 순서를 갖는 패턴들의 집합 중에 빈발하게 발생하는 패턴을 찾아내는 기법이다. USN 환경에서 발생하는 스트림 데이터는 시간 속성을 갖는 이벤트들의 집합으로 표현할 수 있으며 순차 패턴 탐사 기법을 이용하여 유용한 정보를 탐사할 수 있다. 그러나 스트림 데이터 환경에서는 데이터가 무한하고 연속적으로 발생하기 때문에 모든 데이터를 저장하여 패턴을 탐사하는 기법을 적용하는 데는 문제가 있다. 이 논문에서는 향상된 데이터 처리방식을 사용하여 순차패턴을 탐사하는 스트림 데이터 마이닝 기법에 대하여 제안한다. 제안하는 기법은 의미 단위의 가변적 윈도우를 사용하여 스트림 데이터로부터 트랜잭션을 생성하고 이 트랜잭션들의 집합을 해시와 슬라이딩 윈도우를 사용하여 스트림 데이터의 순차 패턴을 탐사한다. 이를 이용한 제안 기법은 실시간 시스템에 적합하게 데이터 저장 공간 사용의 효율성을 높이고 신속하게 유용한 패턴을 탐사할 수 있다.

Extracting Korean-English Parallel Sentences based on Measure of Sentences Similarity Using Sequential Matching of Heterogeneous Language Resources (이질적인 언어 자원의 순차적 매칭을 이용한 문장 유사도 계산 기반의 위키피디아 한국어-영어 병렬 문장 추출 방법)

  • Cheon, Juryong;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.127-132
    • /
    • 2014
  • 본 논문은 위키피디아로부터 한국어-영어 간 병렬 문장을 추출하기 위해 이질적 언어 자원의 순차적 매칭을 적용한 유사도 계산 방법을 제안한다. 선행 연구에서는 병렬 문장 추출을 위해 언어 자원별로 유사도를 계산하여 선형 결합하였고, 토픽모델을 이용해 추정한 단어의 토픽 분포를 유사도 계산에 추가로 이용함으로써 병렬 문장 추출 성능을 향상시켰다. 하지만, 이는 언어 자원들이 독립적으로 사용되어 각 언어자원이 가지는 오류가 문장 간 유사도 계산에 반영되는 문제와 관련이 적은 단어 간의 분포가 유사도 계산에 반영되는 문제가 있다. 본 논문에서는 이질적인 언어 자원들을 이용해 순차적으로 단어를 매칭함으로써 언어 자원들의 독립적인 사용으로 각 자원의 오류가 유사도에 반영되는 문제를 해결하였고, 관련이 높은 단어의 분포만을 유사도 계산에 이용함으로써 관련이 적은 단어의 분포가 반영되는 문제를 해결하였다. 실험을 통해, 언어 자원들을 이용해 순차적으로 매칭한 유사도 계산 방법은 선행 연구에 비해 F1-score 48.4%에서 51.3%로 향상된 성능을 보였고, 관련이 높은 단어의 분포만을 유사도 계산에 이용한 방법은 약 10%에서 34.1%로 향상된 성능을 얻었다. 마지막으로, 제안한 유사도 방법들을 결합함으로써 선행연구의 51.6%에서 2.7%가 향상된 54.3%의 성능을 얻었다.

  • PDF

Optimization of Proteolytic Enzyme Treatment for the Production of Spirulina Extract (단백질 분해 효소를 이용한 스피루리나 추출물 제조 공정 최적화)

  • In, Man-Jin
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.9 no.2
    • /
    • pp.550-555
    • /
    • 2008
  • An efficient production method of spirulina extract was developed by enzymatic treatment using proteolytic enzymes. The suitable dosage of Tunicase, a cell lytic enzyme, was used to be 2.0% (w/w). To maximize solid recovery and spirulina extraction (SE) index, which indicates nucleic acid-related substances content, the dosage of Alcalase, commercially available pretense, was found to be 1.0% (w/w). By simultaneous treatments using optimal dosages of Tunicase and Alcalase, the highest SE index and solid recovery were obtained. The SE index and solid recovery of simultaneous treatments were notably enhanced by 100% ($11.4%\;{\rightarrow}\;22.8%$) and 56% ($45.2%\;{\rightarrow}\;70.7%$), respectively, than those of the non-treated extracts.

Web Standard Extensible Technical for Rich Internet Application (리치 인터넷 어플리케이션 응용을 위한 웹 표준 확장 기술)

  • Kim, SangWoo;Kim, Woosaeng
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.833-836
    • /
    • 2010
  • RIA(Rich Internet Application)는 기존의 웹 애플리케이션 기술이 가진 평면적인 표현과 순차적인 프로세스를 다이나믹한 사용자 인터페이스와 데이터베이스의 연동을 통해 저렴한 비용으로 하나의 인터페이스에서 모든 프로세스가 처리 가능하도록 해주는 기술을 의미한다. 본 논문에서는 웹 표준(HTML/CSS)을 RIA로 확장한 문법을 해석 할 수 있는 RIA Generator를 제안한다. RIA Generator는 크게 두 부분으로 나뉘는데, 한 부분은 기존 HTML 및 CSS 소스와 확장된 RIA 문법을 파싱하는 부분이고, 나머지 한 부분은 파싱한 것을 의미에 따라 화면에 적절히 출력하는 부분이다.