• 제목/요약/키워드: Data Sequence

검색결과 3,095건 처리시간 0.027초

단백질의 세포내 소 기관별 분포 예측을 위한 서열 기반의 특징 추출 방법 (Sequence driven features for prediction of subcellular localization of proteins)

  • 김종경;최승진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.226-228
    • /
    • 2005
  • Predicting the cellular location of an unknown protein gives valuable information for inferring the possible function of the protein. For more accurate Prediction system, we need a good feature extraction method that transforms the raw sequence data into the numerical feature vector, minimizing information loss. In this paper we propose new methods of extracting underlying features only from the sequence data by computing pairwise sequence alignment scores. In addition, we use composition based features to improve prediction accuracy. To construct an SVM ensemble from separately trained SVM classifiers, we propose specificity based weighted majority voting . The overall prediction accuracy evaluated by the 5-fold cross-validation reached $88.53\%$ for the eukaryotic animal data set. By comparing the prediction accuracy of various feature extraction methods, we could get the biological insight on the location of targeting information. Our numerical experiments confirm that our new feature extraction methods are very useful forpredicting subcellular localization of proteins.

  • PDF

OFDM 시스템에서 부분 데이터 추가정보를 이용한 데이터 공간 감소를 갖는 최대 전력 대 평균 전력 비 최소화 시퀀스 사상 기법 (PAPR-minimized Sequence Mapping with Data Space Reduction by Partial Data Side Information in OFDM System)

  • 김기우;류관웅;박용완
    • 한국통신학회논문지
    • /
    • 제29권12A호
    • /
    • pp.1340-1348
    • /
    • 2004
  • 본 논문에서는 OFDM 시스템에서 최대전력 대 평균전력(Peak-to -average Power Ratio : PAPR) 및 계산량(computation)을 최소화하는 PAPR-최소화하는 시퀀스 매핑 기법을 제안한다. PAPR을 줄이기 위해, 낮은 신호 전력의 블락 지수(block index)와 심벌 패턴들에 관한 정보를 이용하여 사상(mapping table)을 작성한다. 입력 데이터 시퀀스는 목(quotient)과 나머지(remainder)을 찾기위해 블락 지수로 나눈다. 낮은 신호 전력의 심벌 패턴은 사상 표에서 음에 따른 블락 지수의 항으로 찾게되고, 수신기에서 최초의 데이터 시퀀스를 구별하고 복원하기 위한 추가정보처럼 나머지와 함께 전송된다. 본 논문에서는 두가지 방식의 사상(mapping) 기법을 제안한다. 하나는 OFDM 신호를 복원하기위해 송신기와 수신기 양쪽 다 사상 표를 갖는 기법이고, 다른 하나는 이동국(mobile) 시스템에서 부하와 복잡성을 줄이기 위해 단지 송신기만 사상 표를 사용하는 기법이다. 이들 알고리즘은 다중 캐리어 시스템에서 PAPR 경감, 단순 처리, 그리고 적은 계산량을 확인할 수 있었다.

집합 유사 시퀀스 매칭의 성능 향상을 위한 인덱스 기반 검색 방법 (An Index-Based Search Method for Performance Improvement of Set-Based Similar Sequence Matching)

  • 이주원;임효상
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.507-520
    • /
    • 2017
  • 집합 유사 시퀀스 매칭 방법은 유사한 정도를 나타내는 척도로 교집합을 기반으로 한 유사도를 사용한다. 그러나 교집합 크기를 계산하는 과정에 시간이 오래 걸릴 뿐만 아니라, 유사한 시퀀스를 찾기 위해서 수많은 집합 간 교집합 크기를 구해야 하므로 수행 시간이 오래 걸리는 성능상의 문제가 있다. 본 논문에서는 이러한 성능상의 문제를 해결하기 위해 인덱스 기반의 검색 방법을 사용하여 집합 기반 유사 시퀀스 매칭을 빠르게 수행하는 방법을 제안한다. 제안하는 방법은 크게 두가지로 구분된다. 첫 번째로 집합 시퀀스 유사도 문제를 교집합의 크기 비교 문제로 정형적으로 변환하고, 교집합의 크기를 빠르게 찾을 수 있는 인덱스 구조를 제안한다. 두 번째로 제안한 인덱스 구조를 사용하여 집합 기반 유사 시퀀스 매칭을 효율적으로 수행할 수 있는 방법을 제안한다. 성능 평가 결과, 제안하는 방법이 기존 방법에 비해 최대 30배에서 50배의 수행 시간 단축이 있음을 보인다. 또한 데이터 시퀀스의 개수가 증가할수록 수행시간의 차이가 점점 커지므로, 대용량 데이터 처리에 적절함을 보인다.

수중음향통신에서 PN 성능 기반의 효율적인 수신 구조 (An Efficient Receiver Structure Based on PN Performance in Underwater Acoustic Communications)

  • 백창욱;정지원
    • 한국항해항만학회지
    • /
    • 제41권4호
    • /
    • pp.173-180
    • /
    • 2017
  • 수중음향통신은 다중경로로 인한 신호간의 간섭으로 성능이 열악하므로 채널 부호화의 적용은 필수적이다. 수중 통신에서 데이터를 전송하기 위한 패킷의 구조는 동기 획득을 위해 데이터 전송 전에 PN 시퀀스를 데이터의 헤드 부분에 첨가하여 전송한다. PN 시퀀스는 송 수신 간에 서로 알고 있는 데이터를 이용하여 동기를 획득하는 기능을 하고 있으므로 PN 시퀀스는 채널 부호화를 하지 않고 전송된다. 이러한 비부호화 된 PN 시퀀스는 대부분의 연구에서는 동기 획득을 위해 활용되지만 본 논문에서는 동기 획득 뿐 아니라 PN 시퀀스의 성능을 이용하여 데이터 필드의 성능 또한 예측할 수 있어 데이터 필드의 복호부에 정보를 제공할 수 있다. 본 논문에서는 다중 경로 전달 환경인 수중음향통신에서 원활한 통신과 함께 수신 신호의 성능을 향상시키기 위하여 낮은 SNR에서도 우수한 성능을 보이는 컨볼루션 부호화 기법과 BCJR 복호 방식을 이용하여 다양한 부호화 율에서 비 부호화 된 PN 시퀀스의 오류율과 부호화 된 데이터 필드의 오류율의 상관관계를 시뮬레이션 및 실제 수중 실험을 통해 분석하여 효율적인 수신 구조를 제시하였다.

부분방전 해석 방법으로 PSA(Pulse Sequence Analysis)의 문제점에 대한 고찰 (Some Considerations on the Problems of PSA(Pulse Sequence Analysis) as a Partial Discharge Analysis Method)

  • 김정태;이호근
    • 한국전기전자재료학회:학술대회논문집
    • /
    • 한국전기전자재료학회 2004년도 추계학술대회 논문집 Vol.17
    • /
    • pp.327-330
    • /
    • 2004
  • Because of its effectiveness for the PD(partial discharge) pattern recognition, PSA(Pulse Sequence Analysis) has been considered as a new analytic method instead of conventional PRPDA(Phase Resolved Partial Discharge Analysis). However, PSA has a big problem that can misanalyze patterns in case of data missing resulting from poor sensitivity because it analyses the correlation between sequential pulses, which leads to hesitate to apply it to on-site. Therefore, in this paper, the problems of PSA such as data missing and noise adding cases were investigated. For the purpose, PD data obtained from various defects including noise adding data were used and analysed, The result showed that both cases can cause fatal errors in recognizing PD patterns. In case of the data missing, the error depends on the kinds of defect and the degree of degradation. Also, it could be noticed that the error due to adding noises was larger than that due to some data missing.

  • PDF

부분방전 해석 방법으로 PSA(Pulse Sequence Analysis)의 현장 적용성에 대한 고찰 (Some Considerations on the On-site Applicability of PSA(Pulse Sequence Analysis) as a Partial Discharge Analysis Method)

  • 김정태;이호근
    • 한국전기전자재료학회논문지
    • /
    • 제18권5호
    • /
    • pp.484-489
    • /
    • 2005
  • Because of its effectiveness for the PD(Partial Discharge) pattern recognition, PSA(Pulse Sequence Analysis) has been considered as a new analytic method instead of conventional PRPDA(Phase Resolved Partial Discharge Analysis). However, it is generally thought that PSA has some possibility to misjudge patterns in case of data-missing resulting from poor sensitivity because it analyses the correlation between sequential pulses, which leads to hesitate to apply it to on-site. Therefore, in this paper, the problems of PSA such as data-missing and noise-adding cases were investigated. for the purpose, PD data obtained from various defects including noise-adding data were used and analyzed. As a result, it was shown that both cases could cause fatal errors in recognizing PD patterns. In case of the data missing, the error was dependant on the kinds of defect and the degree of degradation Also, it could be noticed that the error due to adding noises was larger than that due to some data missing.

A Pattern Matching Extended Compression Algorithm for DNA Sequences

  • Murugan., A;Punitha., K
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.196-202
    • /
    • 2021
  • DNA sequencing provides fundamental data in genomics, bioinformatics, biology and many other research areas. With the emergent evolution in DNA sequencing technology, a massive amount of genomic data is produced every day, mainly DNA sequences, craving for more storage and bandwidth. Unfortunately, managing, analyzing and specifically storing these large amounts of data become a major scientific challenge for bioinformatics. Those large volumes of data also require a fast transmission, effective storage, superior functionality and provision of quick access to any record. Data storage costs have a considerable proportion of total cost in the formation and analysis of DNA sequences. In particular, there is a need of highly control of disk storage capacity of DNA sequences but the standard compression techniques unsuccessful to compress these sequences. Several specialized techniques were introduced for this purpose. Therefore, to overcome all these above challenges, lossless compression techniques have become necessary. In this paper, it is described a new DNA compression mechanism of pattern matching extended Compression algorithm that read the input sequence as segments and find the matching pattern and store it in a permanent or temporary table based on number of bases. The remaining unmatched sequence is been converted into the binary form and then it is been grouped into binary bits i.e. of seven bits and gain these bits are been converted into an ASCII form. Finally, the proposed algorithm dynamically calculates the compression ratio. Thus the results show that pattern matching extended Compression algorithm outperforms cutting-edge compressors and proves its efficiency in terms of compression ratio regardless of the file size of the data.

Transposition of IntAs into the Conserved Regions of IS3 Family Elements

  • Han, Chang-Gyun
    • Journal of Microbiology
    • /
    • 제42권1호
    • /
    • pp.56-59
    • /
    • 2004
  • Together with the previous reports, my computer survey revealed that several bacteria contain six copies of the type group II intron IntA. The sequence analysis of IntAs showed the high level of homology in the nucleotide sequence (91.9-99.8%). The consensus sequence, 2,270 base pair long, was derived from the nucleotide sequences of all IntA members. The size of the open reading frame intA was 502 amino acids long, that is homologous to reverse transcriptase-like proteins encoded within the group II introns. It was reported that EPEC.IntA and Sf.IntA were inserted into IS911 and IS629, respectively. The sequence of the flanking region IntA was analyzed here. The data show the insertion of EC.IntA into IS629, the insertion of EHEC.IntA into IS3, the insertion of Yp.IntA into IS904-like sequence, and the insertion of EK12.IntA into IS911. Interestingly, these IS elements nested by IntAs were the members of IS3 family elements. The sequences of the IS3 members correspond to the OrfB with the DDE motif conserved in retroviral integrases. Alignment of the flanking sequences of IntAs revealed that the flanking regions -25 to + 10 of insertion sites, that are generally believed to be required for the retrohoming, were not strongly conserved. The data presented here suggests that the retrohoming pathway of IntA seems to differ from those of other group II introns.

OFDM 시스템에서의 GD방식과 Radix-2 DIF IFFT를 이용한 효과적인 PAPR 감소 방식 (A New PAPR Reduction Method in the OFDM System using GD and Radix-2 DIF IFFT)

  • 이선호;이해기;김성수
    • 한국콘텐츠학회논문지
    • /
    • 제8권3호
    • /
    • pp.41-46
    • /
    • 2008
  • PAPR을 극복하기 위해서 SLM, PTS, SPW와 GD 같은 많은 연구들이 진행되었다. 본 논문에서는 PAPR을 줄이고 늘어난 계산량을 GD방식과 Radix-2 DIF IFFT 과정을 통하여 성능을 향상시키는 방법을 제시한다. 그리고 특정값을 설정하여 일정한 특정값을 만족하는 경우에는 제안된 방식의 일부분만으로 특정값을 만족하는 데이터 시퀀스를 선택하여 전송할 수 있고, 그렇지 못한 경우는 성능 향상을 위해 남은 부분을 수행하여 가장 적은 PAPR을 갖는 데이터 시퀀스를 선택하여 전송하는 방식이다.

초음파를 이용한 수중 영상 버스트 전송 시스템을 위한 새로운 프레임 동기 방안 (A New Frame Synchronization Scheme for Underwater Ultrasonic Image Burst Transmission System)

  • 김승근;최영철;박종원;김시문;임용곤;김상태
    • 한국해양공학회:학술대회논문집
    • /
    • 한국해양공학회 2003년도 춘계학술대회 논문집
    • /
    • pp.336-340
    • /
    • 2003
  • The frame synchronization should be acquired before performing other data-aided receiving algorithms, such as data-aided channel equalizing, beam-forming and phase, symbol timing, and frequency synchronizing, since all of them are using preamble or training sequence to estimate the amount of error from the received signal. In this paper, we present a new frame synchronization scheme for underwater ultrasonic image burst transmission system, which computes the correlation between received symbol sequence and one CAZAC sequence, composed of the latter half of the first CAZAC sequence of preamble and the first half of the second CAZAC sequence of preamble and then compares a threshold value. If the correlation value is bigger than the threshold value, the frame detector determines that the frame synchronization is achieved at that sample.

  • PDF