• 제목/요약/키워드: Sequence Search

검색결과 656건 처리시간 0.032초

Copy Mechanism과 Input Feeding을 이용한 End-to-End 한국어 문서요약 (End-to-end Document Summarization using Copy Mechanism and Input Feeding)

  • 최경호;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.56-61
    • /
    • 2016
  • 본 논문에서는 Sequence-to-sequence 모델을 생성요약의 방법으로 한국어 문서요약에 적용하였으며, copy mechanism과 input feeding을 적용한 RNN search 모델을 사용하여 시스템의 성능을 높였다. 인터넷 신문기사를 수집하여 구축한 한국어 문서요약 데이터 셋(train set 30291 문서, development set 3786 문서, test set 3705문서)으로 실험한 결과, input feeding과 copy mechanism을 포함한 모델이 형태소 기준으로 ROUGE-1 35.92, ROUGE-2 15.37, ROUGE-L 29.45로 가장 높은 성능을 보였다.

  • PDF

유전자 알고리즘을 이용한 프로모터 영역의 전사인자 결합부위 패턴 탐색 ((Pattern Search for Transcription Factor Binding Sites in a Promoter Region using Genetic Algorithm))

  • 김기봉;공은배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.487-496
    • /
    • 2003
  • 유전자 발현에 매우 중요한 신호역할을 하는 프로모터 영역은 여러 전사인자들이 결합하는 특정 부위들을 갖고 있다. 전사인자의 결합부위는 프로모터의 다양한 부위에 위치하며, 진화론적으로 잘 보존된 Consensus 형태의 염기서열 패턴을 띠고 있다. 본 논문은 이러한 최적의 패턴들을 탐색하기 위해 유전자 알고리즘을 기반으로 하면서, 동시에 MEME 알고리즘의 N-occurrence-per-dataset 모델의 가정과 패턴의 길이를 결정할 수 있는 Wataru 방법의 장점을 따르는 새로운 방법을 제시하고 있다. 이러한 탐색 방법은 유전체 연구자들이 임의의 DNA 염기서열 상에서 프로모터 영역을 예측하거나 특정 전사인자의 결합부위를 탐색하는데 적극 활용할 수 있다.

Structure function relationships amongst the purple acid phosphatase family of binuclear metal-containing enzymes

  • Hamilton, Susan
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.5-5
    • /
    • 2003
  • The purple acid phosphatases comprise a family of binuclear metal-containing enzymes. The metal centre contains one ferric ion and one divalent metal ion. Spectroscopic studies of the monomeric, ${\sim}$36 kDa mammalian purple acid phosphatases reveal the presence of an Fe(III)Fe(II) centre in which the metals are weakly antiferromagnetically coupled, whereas the dimeric, ${\sim}$110 000 kDa plant enzymes contain either Fe(III)Zn(II) or Fe(III)Mn(II). The three dimensional structures of the red kidney bean and pig enzymes show very similar arrangements of the metal ligands but some significant differences beyond the immediate vicinity of the metals. In addition to the catalytic domain, the plant enzyme contains a second domain of unknown function. A search of sequence databases was undertaken using a sequence pattern which includes the conserved metal-binding residues in the plant and animal enzymes. The search revealed the presence in plants of a 'mammalian-type' low molecular weight purple acid phosphatase, a high molecular weight form in some fungi, and a homologue in some bacteria. The catalytic mechanism of the enzyme has been investigated with a view to understanding the marked difference in specificity between the Fe-Mn sweet potato enzyme, which exhibits highly efficient catalysis towards both activated and unactivated phosphate esters, and other PAPs, which hydrolyse only activated esters. Comparison of the active site structures of the enzymes reveal some interesting differences between them which may account for the difference. The implications fur understanding the physiological functions of the enzymes will be discussed.

  • PDF

고밀도 DVD시스템을 위한 저 복잡도 검출 기법 (Low-Complexity Detection Techniques for High-Density DVD Systems)

  • 조한규;우중재;주만식;강창언;홍대식
    • 한국통신학회논문지
    • /
    • 제27권10A호
    • /
    • pp.1000-1010
    • /
    • 2002
  • Partial response maximum likelihood (PRML)과 fixed-delay tree search with decision feedback (FDTS/DF)은 기록 재생 시스템에서 준최적 성능을 보이는 정보열 검출 기법 (sequence detection)으로 알려져 있다. 그러나, 정보열 검출 기법 고유의 metric 연산은 심각한 하드웨어 복잡도를 유발한다. 본 논문은 정보열 검출 기법의 복잡도 문제를 극복하기 위한 대안을 제시한다. 제안된 저 복잡도 기법들은 검출 과정에서 덧셈 및 곱셈의 수를 최소화하여 고속 프로세스 및 저 복잡도 하드웨어 구현에 적합하다. 결정 궤환 드화 깁버 (decision feedback equalization; DFE)을 결합하여 ${\tau}$=2 FDTS/DF와 동일한 성능을 보이며, 기록 밀도 S>5.6에서 PR(1111)ML의 성능을 능가함이 모의 실험을 통해 보여진다.

An Efficient Feature Point Extraction and Comparison Method through Distorted Region Correction in 360-degree Realistic Contents

  • Park, Byeong-Chan;Kim, Jin-Sung;Won, Yu-Hyeon;Kim, Young-Mo;Kim, Seok-Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권1호
    • /
    • pp.93-100
    • /
    • 2019
  • One of critical issues in dealing with 360-degree realistic contents is the performance degradation in searching and recognition process since they support up to 4K UHD quality and have all image angles including the front, back, left, right, top, and bottom parts of a screen. To solve this problem, in this paper, we propose an efficient search and comparison method for 360-degree realistic contents. The proposed method first corrects the distortion at the less distorted regions such as front, left and right parts of the image excluding severely distorted regions such as upper and lower parts, and then it extracts feature points at the corrected region and selects the representative images through sequence classification. When the query image is inputted, the search results are provided through feature points comparison. The experimental results of the proposed method shows that it can solve the problem of performance deterioration when 360-degree realistic contents are recognized comparing with traditional 2D contents.

시퀀스 데이타베이스에서 타임 워핑을 지원하는 효과적인 유살 검색 기법 (An Effective Similarity Search Technique supporting Time Warping in Sequence Databases)

  • 김상욱;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.643-654
    • /
    • 2001
  • 본 논문에서는 대형 시퀀스 데이타베이스에서 타임 워핑을 지원하는 유사 검색을 효과적으로 처리하는 방안에 관하여 논의한다 타임 워핑은 시퀀스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해 준다. 타임 워핑 거리는 삼각형 부등식 성질을 만족하지 못하므로 기존의 기법들은 착오 기각(false dismissal) 없이 다차원인덱스를 사용할 수 없었다. 이러한 기법들은 전체 데이타베이스를 스캔해야 하므로 대형 데이타베이스에서는 심각한 성능 저하의 문제를 가진다. 서픽스 트리를 사용하는 또 다른 기법은 큰 트리로 인한 성능상의 문제를 갖는다 본 논문에서는 타임 워핑을 지원하는 효과적인 유사 검색 기법을 제안한다. 제안된 기법의 주요 목표는 착오 기각 없이 대형 데이타베이스에서도 좋은 검색 성능을 보장하는 것이다. 이러한 목표를 위하여 본 연구에서는 삼각형 부등식을 만족하는 타임 워핑 거리의 새로운 하한 거리 함수 $D_{tw-Ib}를 고안한다. D_{tw-Ib}$는 각 시퀀스로부터 타임 워핑과 무관한 4-터플 특성 벡터를 추출한 다. 제안된 기법에서는 이러한 4-터플 특성 벡터를 인덱싱 애트리뷰트로 사용하는 다차원 인덱스를 기반으로 유사 검색을 효율적으로 처리한다. 본 논문에서는 제안된 기법에서 착오 기각이 발생하지 않음을 증명한다. 또한, 제안된 기법의 우수성을 규명하기 위하여 다양한 실험을 수행한다. 실험 결과에 의하면 제안된 기법은 기존의 기법들과 비교하여 실제 S&P 500 주식 데이타에 대하여 43배, 대형 생성 데이타에 대하여 720배가지 의 성능 개선 효과를 가지는 것으로 나타났다.

  • PDF

탐색 창을 갖는 이중드웰 직렬 동기획득 방식에 대한 수학적 모델링 및 성능분석 (Mathematical modeling and performance analysis for the double-dwell serial search algorithm with a search window)

  • 이성주;김재석
    • 전자공학회논문지S
    • /
    • 제36S권9호
    • /
    • pp.9-17
    • /
    • 1999
  • 본 논문에서는 파일롯 채널(pilot chanel)이 존재하는 직접확산 코드분할 다중접속 방식(DS-CDMA)에서 탐색 창을 갖는 이중도웰 직렬 동기획득 방식에 대한 수학적 모델을 제시하고, 이에 대한 성능을 분석하였다. 성능 분석을 위한 유도된 수학적 모델들은 부호 검출 함수, 오보 함수, 부호 miss함수, 그리고 평균 동기 획득 시간 등이었다. 또한 유도된 식을 IS-95 순방향 링크에 적용하여 수학적 모델에 의한 평균 동기획득 시간을 계산하였고, 이것을 기존의 동기획득 알고리듬과 비교하였다. 그리고 탐색 창을 갖는 이중드웰 직렬 동기 획득 방식에 대하여, 적분 시간과 탐색 창의 크기가 평균 동기획득 시간에 미치는 영향도 분석하였다. 성능분석을 위해 사용된 채널 모델은 북미의 PCS 채널 모델인 JTC 채널로 설정하였다. 성능 분석 결과, 탐색 창을 갖는 이중드웰 직렬 동기획득 방식이 평균 동기획득 시간에서 기존의 동기획득 알고리듬보다 약 17%~25% 정도 단축됨을 보였다.

  • PDF

개선된 크로스-납작한 육각 탐색 패턴을 이용한 고속 블록 정합 움직임 예측 알고리즘 (A Fast Block Matching Motion Estimation Algorithm by using an Enhanced Cross-Flat Hexagon Search Pattern)

  • 남현우
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권7호
    • /
    • pp.99-108
    • /
    • 2008
  • 동영상 압축을 위해서, 탐색 속도와 부호화된 비디오 화질이라는 두 가지 성능이 고려되어야 한다. 본 논문에서는, 동영상의 공간적 상관성과움직임 벡터(MV)의 중심지향적인 특성을 이용하여 개선된 고속블록정합 알고리즘을 제안한다. 제안된 알고리즘은 현재 프레임의 인접 매크로 블록으로부터 초기 움직임 벡터를 예측하고 크로스 패턴과 납작한 육각 탐색 패턴을 이용하여 정확한 움직임 벡터를 결정한다. 성능 평가를 통해, 제안된 알고리즘은 탐색 속도와 부호화된 비디오 화질 측면 모두에서 비교대상인 육각 패턴 탐색 알고리즘(HEXBS)과 크로스-육각 패턴 탐색 알고리즘(CHS)에 비해 뛰어난 성능을 나타냄을 알 수 있었다. 제안된 알고리즘을 이용하여 탐색 속도 측면에서는 약 31%의 성능 향상을 보였고, PSNR 측면에서도 약 0.5dB 향상되어 비디오 화질의 성능 향상을 나타내었다.

  • PDF

시델니코프 수열을 활용한 인지통신의 Rendezvous를 위한 채널 탐색 수열 (Channel Searching Sequence for Rendezvous in CR Using Sidel'nikov Sequence)

  • 장지웅
    • 한국정보통신학회논문지
    • /
    • 제25권11호
    • /
    • pp.1566-1573
    • /
    • 2021
  • Rendezvous는 인지통신에서 사용자간의 탐색을 지원하는 프로세스이다. 공통채널을 알 수 없고 채널의 숫자만 알려진 인지통신 환경에서 통신을 원하는 두 사용자가 상대방을 인식하는 것은 매우 중요한 과정이다. 본 논문에서는 시델니코프 수열을 채널 탐색 수열로 활용하여 두 사용자가 가용채널을 탐색하고 서로를 인지하는 방안을 제시하고 분석하였다. 또한, Rendezvous까지 소요시간의 기댓값을 수학적으로 분석하였다. 또한, 2명의 사용자 환경 하에서 모의실험을 통하여 기존의 알고리듬인 JS알고리듬과 GOS알고리듬과의 성능을 비교하여 새로 제안된 수열의 Rendezvous 성능을 TTR 관점에서 검증하였다. 새로 제안된 수열의 성능은 GOS 알고리듬보다 우수하고 JS 알고리듬과 비슷하였다. 그러나 M이 p보다 많이 작은 경우에 대해서는 새로 제안된 수열의 성능이 JS알고리듬보다 우수하였다.

인삼 모상근 프로테옴 데이터 분석 : 인삼 EST database와의 통합 분석에 의한 단백질 동정 (Proteome Data Analysis of Hairy Root of Panax ginseng : Use of Expressed Sequence Tag Data of Ginseng for the Protein Identification)

  • 권경훈;김승일;김경욱;김은아;조건;김진영;김영환;양덕춘;허철구;유종신;박영목
    • Journal of Plant Biotechnology
    • /
    • 제29권3호
    • /
    • pp.161-170
    • /
    • 2002
  • 인삼 모상근의 프로테옴 분석에 의해 얻은 질량분석 스펙트럼 데이터는 MALDI/TOF/MS에서 얻는 질량 스펙트럼과 ESI/Q-TOF/MS에서 얻는 탄뎀 질량 스펙트럼으로 구분된다. 질량 스펙트럼은 단백질이 효소에 의해 분해된 펩타이드들의 분자량 정보를 제공하며, 탄뎀 질량 스펙트럼에서는 아미노산 단위로 분해된 절편 단백질의 분자량으로부터 아미노산 서열을 결과로 얻는다. 펩타이드의 아미노산 서열을 BLAST로 검색하면 유사한 단백질을 GenBank에서 검색할 수 있다. 이러한 단백질 동정 방법은 완전한 유전체 서열이 알려진 생물체의 경우 높은 정확도로 단백질을 동정할 수 있으나, 그렇지 않은 경우는 유사한 단백질이 데이터베이스에 존재하지 않아 분석이 용이하지 않다. 본 연구에서는 질량 스펙트럼 및 절편 단백질의 아미노산 서열을 EST (expressed sequence tag) 서열과 비교하여 프로테옴 데이터와 일치하는 EST 서열을 찾아내고 이를 BLAST검색에 의해 단백질 동정에 활용하였다. ESI/Q-TOF/MS 에서 얻은 아미노산 서열은 길이는 짧지만 데이터의 신뢰도가 높으므로 EST 서열과의 연관 관계를 밝힘으로써 단백질에 대한 정보를 보완할 수 있었다. ESI/Q-TOF/MS에서 얻은 펩타이드의 아미노산 서열을 EST 서열과 비교한 결과 90%의 아미노산 서열이 EST DB에서 발견되었다. NCBI의 nr 데이터베이스에서 아미노산 서열을 검색하여 찾은 단백질이 68%임에 비하여, 인삼 EST 서열에 의한 검색이 22% 더 많은 결과를 얻었다. MALDI/TOF/MS의 질량 스펙트럼에서 nr 데이터베이스로 검색한 결과와 인삼 EST 데이터베이스를 검색한 결과가 일치하는 경우는 47개 중 9개인 19%에 불과하여, 탄뎀 질량 분석으로 아미노산 서열을 얻지 않고, 단지 질량 스펙트럼으로부터 단백질을 동정하는 방법으로는 단백질 동정의 정확한 결과를 기대하기 어려움을 확인하였다.