• 제목/요약/키워드: Data Sequence

검색결과 3,094건 처리시간 0.03초

다중채널 탄성파 탐사자료의 전산처리(I) - 해양반사파 자료처리 - (Digital Processing for Multichannel Seismic Data(I) -Marine Reflection Data Processing-)

  • 김기영;홍종국;주형태
    • 지질공학
    • /
    • 제1권1호
    • /
    • pp.85-108
    • /
    • 1991
  • 해양 탄성파탐사 자료처리는 자료의 양이 많고, 처리과정이 여러 개의 전문적인 단계로 이루어져 있으며, 각 단계별로 많은 처리변수를 결정해야 하는 특성이 있다. 따라서 전체 자료를 대표할 만한 표본 자료를 대상으로 주요 처리변수를 결정하게 되고, 그 결과를 전체 자료에 적용시키는 것이 일반적이다. 본 연구에서는 국내 대륙붕 지역에 적합한 처리단계 및 단계별 최적 처리변수들을 결정하기 위하여 실제자료를 대상으로 시험처리를 실시하였다. 이 시험처리에서 구한 처리순서 및 처리변수들을 사용하여 양호한 탄성파 구조보정단면도를 작성하였다.

  • PDF

Efficient Implementation of a Pseudorandom Sequence Generator for High-Speed Data Communications

  • Hwang, Soo-Yun;Park, Gi-Yoon;Kim, Dae-Ho;Jhang, Kyoung-Son
    • ETRI Journal
    • /
    • 제32권2호
    • /
    • pp.222-229
    • /
    • 2010
  • A conventional pseudorandom sequence generator creates only 1 bit of data per clock cycle. Therefore, it may cause a delay in data communications. In this paper, we propose an efficient implementation method for a pseudorandom sequence generator with parallel outputs. By virtue of the simple matrix multiplications, we derive a well-organized recursive formula and realize a pseudorandom sequence generator with multiple outputs. Experimental results show that, although the total area of the proposed scheme is 3% to 13% larger than that of the existing scheme, our parallel architecture improves the throughput by 2, 4, and 6 times compared with the existing scheme based on a single output. In addition, we apply our approach to a $2{\times}2$ multiple input/multiple output (MIMO) detector targeting the 3rd Generation Partnership Project Long Term Evolution (3GPP LTE) system. Therefore, the throughput of the MIMO detector is significantly enhanced by parallel processing of data communications.

A Pattern Summary System Using BLAST for Sequence Analysis

  • Choi, Han-Suk;Kim, Dong-Wook;Ryu, Tae-W.
    • Genomics & Informatics
    • /
    • 제4권4호
    • /
    • pp.173-181
    • /
    • 2006
  • Pattern finding is one of the important tasks in a protein or DNA sequence analysis. Alignment is the widely used technique for finding patterns in sequence analysis. BLAST (Basic Local Alignment Search Tool) is one of the most popularly used tools in bio-informatics to explore available DNA or protein sequence databases. BLAST may generate a huge output for a large sequence data that contains various sequence patterns. However, BLAST does not provide a tool to summarize and analyze the patterns or matched alignments in the BLAST output file. BLAST lacks of general and robust parsing tools to extract the essential information out from its output. This paper presents a pattern summary system which is a powerful and comprehensive tool for discovering pattern structures in huge amount of sequence data in the BLAST. The pattern summary system can identify clusters of patterns, extract the cluster pattern sequences from the subject database of BLAST, and display the clusters graphically to show the distribution of clusters in the subject database.

시계열 스트림 데이터 상에서 핸드헬드 디바이스를 위한 효율적인 스트림 시퀀스 매칭 알고리즘 (Efficient Stream Sequence Matching Algorithms for Handheld Devices over Time-Series Stream Data)

  • 문양세;노웅기
    • 한국통신학회논문지
    • /
    • 제31권8B호
    • /
    • pp.736-744
    • /
    • 2006
  • 핸드헬드 디바이스의 경우, 반복 작업에 대한 CPU 연산 최소화가 성능에 중요한 요소이다. 본 논문에서는 주식 데이터, 네트워크 트래픽, 센서 데이터 등의 시계열 스트림 데이터 상에서 유사 시퀀스를 효율적으로 찾아내는 핸드헬드 디바이스용 알고리즘을 제시한다. 이를 위하여, 우선 시계열 스트림 데이터 상에서 유사 시퀀스를 찾아내는 문제를 스트림 시퀀스 매칭(stream sequence matching)으로 정형적으로 정의한다. 다음으로, 기존의 서브시퀀스 매칭에서 사용했던 윈도우 구성법을 적용하여, 스트림 시퀀스 매칭을 효율적으로 처리하는 윈도우 기반 접근법을 제안한다. 그리고 이러한 윈도우 기반 접근법을 가능하게 하는 윈도우 MBR(window MBR) 개념을 제시하고, 이 개념을 사용하면 스트림 시퀀스 매칭을 정확하게 수행할 수 있음을 증명한다. 또한, 윈도우 기반 접근법에 기반한 두 가지 스트림 시퀀스 매칭 알고리즘을 제안한다. 마지막으로, 분석과 실험을 통해 제안한 알고리즘이 단순 접근법에 비해 CPU 연산을 크게 줄이고 성능을 향상시킴을 보인다. 이 같은 결과를 볼 때, 제안한 방법은 CPU 연산 능력이 부족한 핸드헬드 디바이스의 내장형 알고리즘으로 매우 적합하다고 사료된다.

주의집중 및 복사 작용을 가진 Sequence-to-Sequence 순환신경망을 이용한 제목 생성 모델 (Title Generation Model for which Sequence-to-Sequence RNNs with Attention and Copying Mechanisms are used)

  • 이현구;김학수
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.674-679
    • /
    • 2017
  • 대용량의 텍스트 문서가 매일 만들어지는 빅데이터 환경에서 제목은 문서의 핵심 아이디어를 빠르게 집어내는데 매우 중요한 단서가 된다. 그러나 블로그 기사나 소셜 미디어 메시지와 같은 많은 종류의 문서들은 제목을 갖고 있지 않다. 본 논문에서는 주의집중 및 복사 작용을 가진 sequence-to-sequence 순환신경망을 사용한 제목 생성 모델을 제안한다. 제안 모델은 양방향 GRU(Gated Recurrent Unit) 네트워크에 기반 하여 입력 문장을 인코딩(encoding)하고, 입력 문장에서 자동 선별된 키워드와 함께 인코딩된 문장을 디코딩함으로써 제목 단어들을 생성한다. 93,631문서의 학습 데이터와 500문서의 평가 데이터를 가진 실험에서 주의집중 작용방법이 복사 작용방법보다 높은 어휘 일치율(ROUGE-1: 0.1935, ROUGE-2: 0.0364, ROUGE-L: 0.1555)을 보였고 사람이 정성평가한 지표는 복사 작용방법이 높은 성능을 보였다.

A New Galaxy Classification Scheme in the WISE Color-Luminosity Diagram

  • Lee, Gwang-Ho;Sohn, Jubee;Lee, Myung Gyoon
    • 천문학회보
    • /
    • 제38권2호
    • /
    • pp.49.1-49.1
    • /
    • 2013
  • We present a new galaxy classification scheme in the Wide-field Infrared Survey Explorer (WISE) [$3.4{\mu}m$]-[$12{\mu}m$] color versus $12{\mu}m$ luminosity diagram. In this diagram, galaxies can be classified into three groups in different evolutionary stages. Late-type galaxies are distributed linearly along "MIR star-forming sequence" identified by Hwang et al. (2012). Some early-type galaxies show another sequence at [3.4]-[12] $(AB){\simeq}-2.0$, and we call this 'MIR blue sequence'. They are quiescent systems with old stellar population older than 10 Gyr. Between the MIR star-forming sequence and the MIR blue sequence, some early- and late-type galaxies are sparsely distributed, and we call these galaxies 'MIR green cloud galaxies'. Interestingly, both MIR blue sequence galaxies and MIR green cloud ones lie on the red sequence in the optical color-magnitude diagram. However, MIR green cloud galaxies have lower stellar masses and younger stellar populations (smaller $D_n4000$) than MIR blue sequence galaxies, suggesting that MIR green cloud galaxies are in the transition stage from MIR star-forming sequence galaxies to MIR blue sequence ones. We present differences in various galaxy properties between the three MIR classes using a multi-wavelength data, combined with the WISE and Sloan Digital Sky Survey Data Release 10, of local (0.03 < z < 0.07) galaxies.

  • PDF

DEVELOPMENT OF XML BASED PERSONALIZED DATAASE MANAGEMENT SYTEM FOR BIOLOGISTS

  • Cho Kyung Hwan;Jung Kwang Su;Kim Sun Shin;Ryu Keun Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.770-773
    • /
    • 2005
  • In most biological laboratory, sequences from sequence machine are stored into file disks as simple files. It will be hard work to store and manage the sequence data with consistency and integrity such as storing redundant files. It is required needed to develop a system which integrated and managed genome data with consistency and integrity for accurate sequence analysis. There fore, in this paper, we not only store gene and protein sequence data through sequencing but also manage them. We also make a integrate schema for transforming the file formats and design database system using it. As integrated schema is designed as a BSML, it is possible to apply a style language of XSL. From this, we can transfer among heterogeneous sequence formats.

  • PDF

대화형 통신 순서열 패턴의 마이닝을 위한 효율적인 알고리즘 (An Efficient Algorithm for Mining Interactive Communication Sequence Patterns)

  • 함덕민;송지환;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.169-179
    • /
    • 2009
  • 통신 기록 데이타는 이메일이나 인스턴스 메시지를 주고 받거나, 웹사이트에 접속하는 것과 같은 통신 이벤트들로 구성된다. 미국과 유럽연합을 포함한 여러 나라에서는 인터넷을 사용한 범죄의 조사와 발견을 위해서 통신 서비스 제공자에게 이런 데이타를 보관하도록 규정하고 있다. 보관되는 통신 기록 데이타의 크기가 매우 크기 때문에 치안당국이 이 데이타를 사용하기 위해서는 필요한 정보만을 효과적으로 추출해내는 방법이 필요하다. 본 논문에서는 발신자, 수신자, 통신발생시각의 세 가지 정보만 포함하는 통신 이벤트가 주어질 때, 의미 있는 정보 중 하나인 대화형 통신 순서열 패턴과 이러한 패턴의 마이닝 문제를 정의하고 것을 해결하기 위해 Fast Discovering Interactive Communication Sequence Patterns (FDICSP)라 불리는 알고리즘을 제안한다. FDICSP는 길이가 짧은 대화형 통신 순서열을 조합하여 길이가 긴 대화형 통신 순서열을 생성 해나가는데, 대화형 통신 순서열의 특성에 초점을 맞춘 작업을 통해 효율적으로 대화형 통신 순서열 패턴을 찾는다.

OFDM 통신시스템의 PAPR 저감을 위한 더미 시퀀스 삽입 (Dummy Sequence Insertion for PAPR Reduction of OFDM Communication System)

  • 이재은;유흥균;정영호;함영권
    • 한국전자파학회논문지
    • /
    • 제14권12호
    • /
    • pp.1239-1247
    • /
    • 2003
  • OFDM(orthogonal frequency division multiplexing) 통신 방식은 무선 고속 데이터 전송에 적합한 방식이다. 하지만 높은 PAPR(peak-to-average power ratio)의 발생으로 HPA(high power amplifier)에서 비선형 왜곡된다. 따라서 본 논문에서는 일정량의 부반송파를 PAPR 저감을 위해 사용하지만 별도의 부가정보 전송이 필요하지 않는 DSI(dummy sequence insertion) OFDM을 제안한다. DSI 방식은 기존 PTS(partial transmit sequence)나 SLM(selected mapping) 방식에서의 부가 정보와 달리 단지 PAPR 감소에만 사용되는 특정한 더미 데이터 시퀀스(dummy data sequence)를 전송한다. 더미 시퀀스로 상보 시퀀스(complementary sequence)와 상관 시퀀스(correlation sequence)를 사용하고 좀더 효과적 인 PAPR 저감을 위해 플리핑(flipping) 방법을 사용한다. 또한 DSI 방식은 기존의 블록코딩 방식보다 나은 전송 효율(spectral efficiency)을 갖는다. 그리고 DSI 방식은 처리시간 및 계산량을 줄이기 위해 threshold 기법을 적용한다. 하지만 PAPR 저감 성능은 기존 방식보다 떨어진다. 하지만 제안한 DSI 방식의 중요한 장점은 더미 데이터 시퀀스의 손상에 의해 BER특성이 영향을 받지 않는다는 것이다. 결론적으로 DSI 방식은 OFDM 보다 낮은 PAPR을 갖고 기존의 PIS나 SLM에 비해 처리시간을 감소시키고 BER성능 개선이 이루어진다.

한국인 화자의 영어 발음 오류에 관한 음향적 분석 - 비음화와 설측음화를 중심으로 - (Acoustic Analysis of Koreans' Production Errors in English - with reference to nasalization and lateralization)

  • 김미혜;강선미;김기호
    • 음성과학
    • /
    • 제15권3호
    • /
    • pp.53-63
    • /
    • 2008
  • This paper examined the acoustic differences in English speech production between English native speakers and Korean learners. Korean speakers seem to produce errors by over-applying the Korean phonological rules(nasalization and lateralization) to English speech under the conditions comparable to those of Korean which contain nasal+lateral or lateral+nasal sequences. Being based on this prediction, the experimental data is grouped into three sets, [n]+[l] sequence, [l]+[n]sequence, and [m]+[l] sequence. The result shows that, Korean speakers usually nasalize or lateralize the target words or phrases in every three categories while English natives don't. In set A([n]+[l] sequence), both nasalization and lateralization were found in [n]+[l] sequence, the same circumstances where both nasalization and lateralization can be placed as in Korean. In the case of set B([l]+[n] sequence), only lateralization is observed. It is because the nasalization never occurs in the sequence of l-n in Korean. There is no lateralization in set C([m]+[l] sequence), because only nasalization occurs in the sequence of m-l in Korean. This results reconfirmed that the nasalization and lateralization rules in Korean deeply influence on the English production data. Korean speakers need to be taught not to over-apply Korean phonological rule to English production for accurate pronunciation.

  • PDF