• 제목/요약/키워드: sequence information

검색결과 4,003건 처리시간 0.028초

Cloning and Characterization of a Novel Laccase Gene, fvlac7, Based on the Genomic Sequence of Flammulina velutipes

  • Kim, Jong-Kun;Lim, Seon-Hwa;Kang, Hee-Wan
    • Mycobiology
    • /
    • 제41권1호
    • /
    • pp.37-41
    • /
    • 2013
  • Laccases (EC 1.10.3.2) are copper-containing polyphenol oxidases found in white-rot fungi. Here, we report the cloning and analysis of the nucleotide sequence of a new laccase gene, fvlac7, based on the genomic sequence of Flammulina velutipes. A primer set was designed from the putative mRNA that was aligned to the genomic DNA of F. velutipes. A cDNA fragment approximately 1.6-kb long was then amplified by reverse transcriptase-PCR using total RNA, which was subsequently cloned and sequenced. The cDNA sequence of fvlac7 was then compared to that of the genomic DNA, and 16 introns were found in the genomic DNA sequence. The fvlac7 protein, which consists of 538 amino acids, showed only 42~51% identity with 12 different mushroom species containing two laccases of F. velutipes, suggesting the fvlac7 is a novel laccase gene. The first 25 amino acids of Fvlac7 correspond to a predicted signal sequence, four copper-binding sites, and four N-glycosylation sites. Fvlac7 cDNA was heterologously overexpressed in an Escherichia coli system with an approximate expected molecular weight of 60 kDa.

Sequence-to-sequence 모델을 이용한 한국어 구구조 구문 분석 (Korean phrase structure parsing using sequence-to-sequence learning)

  • 황현선;이창기
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.20-24
    • /
    • 2016
  • Sequence-to-sequence 모델은 입력열을 길이가 다른 출력열로 변환하는 모델로, 단일 신경망 구조만을 사용하는 End-to-end 방식의 모델이다. 본 논문에서는 Sequence-to-sequence 모델을 한국어 구구조 구문 분석에 적용한다. 이를 위해 구구조 구문 트리를 괄호와 구문 태그 및 어절로 이루어진 출력열의 형태로 만들고 어절들을 단일 기호 'XX'로 치환하여 출력 단어 사전의 수를 줄였다. 그리고 최근 기계번역의 성능을 높이기 위해 연구된 Attention mechanism과 Input-feeding을 적용하였다. 실험 결과, 세종말뭉치의 구구조 구문 분석 데이터에 대해 기존의 연구보다 높은 F1 89.03%의 성능을 보였다.

  • PDF

Multi-task sequence-to-sequence learning을 이용한 한국어 형태소 분석과 구구조 구문 분석 (Korean morphological analysis and phrase structure parsing using multi-task sequence-to-sequence learning)

  • 황현선;이창기
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.103-107
    • /
    • 2017
  • 한국어 형태소 분석 및 구구조 구문 분석은 한국어 자연어처리에서 난이도가 높은 작업들로서 최근에는 해당 문제들을 출력열 생성 문제로 바꾸어 sequence-to-sequence 모델을 이용한 end-to-end 방식의 접근법들이 연구되었다. 한국어 형태소 분석 및 구구조 구문 분석을 출력열 생성 문제로 바꿀 시 해당 출력 결과는 하나의 열로서 합쳐질 수가 있다. 본 논문에서는 sequence-to-sequence 모델을 이용하여 한국어 형태소 분석 및 구구조 구문 분석을 동시에 처리하는 모델을 제안한다. 실험 결과 한국어 형태소 분석과 구구조 구문 분석을 동시에 처리할 시 형태소 분석이 구구조 구문 분석에 영향을 주는 것을 확인 하였으며, 구구조 구문 분석 또한 형태소 분석에 영향을 주어 서로 영향을 줄 수 있음을 확인하였다.

  • PDF

기계가독형사전과 코퍼스에서 추출한 의미정보를 이용한 명사열의 의미해석 (Interpretation of Noun Sequence using Semantic Information Extracted from Machine Readable Dictionary and Corpus)

  • 이경순;김도완;김길창;최기선
    • 인지과학
    • /
    • 제12권1_2호
    • /
    • pp.11-24
    • /
    • 2001
  • 명사열의 의미해석은 명사들 사이의 의미적인 관계를 찾는 것으로, 한국어에서 명사열의 출현은 보편적인 현상이며, 그 생성 또한 비교적 자유롭다. 본 논문에서는 기계가독형사전과 코퍼스로부터 명사 사이의 <목적>, <물건-재료>, <원인>등과 같은 의미관계 정보를 자동으로 추출한다. 추출한 의미관계정보에 기반하여 의미망을 구축하고. 의미 정보와 서술성 명사의 하위 범주 정보를 이용하여 명사열을 해석하는 방법을 제안하였다. 본 논문에서는 명사열의의미 해석 대상을 한국어 명사열의 대부분의 차지하는 수싲 명사+핵심명사 형태로 한정하였다. 기계가독형사전과 코퍼스로부터 추출한 의미정보와 하위 범주를 이용한 명사열의미 해석은 기존의 기계가독형사전 기반 의미 해석보다 정확률 +40.30%,적용률+12.73%의 성능 향상을 나나태었다.

  • PDF

k-convex hull을 이용한 DNA 염기 배열의 가시화 (DNA Sequence Visualization with k-convex Hull)

  • 김민아;이은정;조환규
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제2권2호
    • /
    • pp.61-68
    • /
    • 1996
  • 본 논문에서는 대용량의 DNA 염기 배열의 정성 정보를 특징짓기 위한 새로운 가시화 방법을 제안한다. DNA 배열은 배열 자체가 방대한 양의 정보를 포함하고 있기 때문에 분석에 많은 어려움이 있다. 우리는 DNA 염기 배열들사이의 상사성 비교를 위해 DNA 염기 배열을 하나의 이미지 도메인으로 변환한다. 프로그램은 random walk plot으로 DNA 염기 배열을 가시화한 후에 k-convex hull로 단순화 시킨다. Random Walk plot은 염기배열을 평면상에 하나의 커브로 표현한다. k-convex hull은 walk plot으로부터 무의미한 부분을 제거함으로서 walk plot을 단순화한다. 이러한 방법은 유전공학자들에게 쉽게 DNA 배열의 특징을 인식하고 분류할 수 있는 직관을 제공한다. 실제 게놈 데이터로 실험한 결과는 논문에서 제안하는 방법이 긴 DNA 염기배열들 사이의 유사성 분석을 위해 좋은 가시화 도구임을 보여준다.

  • PDF

서열 정렬 기법을 이용한 악성코드 유사도 분석의 성능 개선 (Improvement of Performance of Malware Similarity Analysis by the Sequence Alignment Technique)

  • 조인겸;임을규
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권3호
    • /
    • pp.263-268
    • /
    • 2015
  • 변종 악성코드는 그 기능에 있어 차이가 없으나 구조적인 차이가 존재하는 악성코드로, 같은 그룹으로 분류하여 처리하는 것이 유용하다. 변종 악성코드 분석을 위해 본 논문에서는 바이오인포매틱스 분야에서 사용하는 서열 정렬 기법을 사용하여 악성코드들의 API 호출 정보 간의 공통부분을 찾고자 하였다. 서열 정렬 기법은 API 호출 정보의 길이에 대해 의존적인 성능을 가지며, API 호출 정보의 길이가 커짐에 따라 성능이 매우 떨어진다. 따라서 본 논문에서는 서열 정렬 기법 적용 이전에 API 호출 정보에서 발견되는 반복 패턴을 제거하는 방법을 적용함으로써 성능이 보장될 수 있도록 하였다. 최종적으로 서열 정렬 기법을 통한 악성코드 간의 유사도를 구하는 방법에 대하여 논하였다. 또한 실제 악성코드 샘플에 대한 실험 결과를 제시하였다.

표준 부호 디지트 코딩을 이용한 비가청 이진 랜덤 신호 발생에 관한 연구 (Study on the Generation of Inaudible Binary Random Number Using Canonical Signed Digit Coding)

  • 남명우;이영석
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권4호
    • /
    • pp.263-269
    • /
    • 2015
  • 디지털 워터마킹은 인간의 감각으로 감지할 수 없고 통계적인 방법에 의하여 검출되지 않는 정보를 디지털 데이터에 삽입하는 기술이다. 일반적으로 디지털 음향 신호에 대한 워터마킹은 의미 있는 정보를 갖는 이진 시퀀스를 원래의 디지털 음향 신호에 삽입하여 구현한다. 그러나 삽입된 이진 정보는 원래의 디지털 음향 신호의 관점에서는 잡음으로 작용하여 원래의 음향 신호를 왜곡 시키거나 열화 시키는 원인으로 작용한다. 본 논문에서는 인간의 가청 주파수 영역에서 이진 정보의 삽입으로 인한 원 음향 정보의 왜곡을 최소화시킬 수 있는 이진 정보 발생 방법을 제안하였다. 제안한 방법은 표준부호 디지트 코딩을 이용한 방법으로서 인접한 데이터간의 주파수 간섭을 최소화 하여 인간의 가청 주파수 영역에서의 이진 정보 시퀀스의 영향을 최소화 하도록 구현하였다. 제안한 방법은 일반적인 이진 정보발생 방법과 주파수 분석 비교를 통하여 성능을 평가하였다.

낮은 상호 상관관계를 갖는 비선형 확장 이진 수열 (Non-linear Extended Binary Sequence with Low Cross-Correlation)

  • 최언숙;조성진;권숙희
    • 한국정보통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.730-736
    • /
    • 2012
  • 의사난수열은 코드 분할 다중접속과 같은 무선통신에서 중요한 역할을 한다. 여러 사용자가 동시에 시스템에 접속할 때 충돌이 발생 할 수 있는데, 의사난수열의 낮은 상관관계는 그런 통신시스템에서 다중 접속 간섭을 최소화 할 수 있다. 본 논문에서는 Welch bound의 관점에서 최적의 상호 상관관계 함숫값을 갖는 $m$-수열, GMW 수열, Kasami 수열, No 수열 등을 모두 포함하는 낮은 상호 상관관계를 갖는 비선형 확장 이진 수열군을 제안한다. 그리고 제안한 수열의 상호상관관계를 분석한다.

완전표준성을 만족하는 선행검증 시험열 생성방법에 관한 연구 (The preverified test sequence generation method satisfying the completeness criteria)

  • 박진호;양대헌;송주석;임상용
    • 한국통신학회논문지
    • /
    • 제23권9A호
    • /
    • pp.2383-2390
    • /
    • 1998
  • As network provides diverse functionalities recently, many rpotocol standards have become complex and many implementations have appeared. Such trends require us to test th econformance of implementations, called the conformance testing. Many researches have been performed on generating test sequence and on fualt masking base don T,U,D,W methods. At this jpoint, te new problem is suggeste dwhich is calle dthe completenes s criteria. The test sequences for the conformance testing have come up with this problem as well as fault masking. In this paper, we suggest the method of generating the preverified test sequence which can avoid the completeness criteria problem. The preverified test sequence is much more reliable than others by using the preverified edge. For the reliability of conformance testing, we define the immunity of the test sequence and provide the clue for the analysis of the test results using the immunity. The analysis of the results makes it possible for us to test the implementation again with more reliability. Also, the preverified test sequence is flexible so that it is combined with the fault-tolerant sequence for fault masking.

  • PDF

복수적분 시구간 직렬탐색 시스템에서 부분 상관기를 이용한 Kronecker 부호의 특성 분석 (Analysis of Kronecker Sequence with Partial-Period Correlation in a Multiple-dwell Serical Serarch System)

  • 임연주;박상규
    • 한국통신학회논문지
    • /
    • 제25권8B호
    • /
    • pp.1333-1340
    • /
    • 2000
  • 본 논문에서는 고속의 초기동기가 가능한 Kronecker 부호를 DS/CDMA 시스템의 확산부호로 하여 패킷 무선 데이터 통신에서의 사용을 위한 타당성을 보인다 먼저 Kronecker 부호의 생성방법 상관특성을 보여 대체적인 부호의 특성을 밝히고 부분 상관기를 이용할 수 있음을 보인다 더 나아가 PN 부호와 같은 평균 초기동기획득 시간을 가질 때의 Kronecker 부호의 오경보 확률과 실패 확률을 구하여 Kronecker 부호가 PN 부호보다 더 높은 동기 확률을 가짐을 보임으로써 패킷 통신에서 Kronecker 부호를 사용할 수 있는 가능성을 확인한다.

  • PDF