단백질 이름 추출을 위한 패턴 매칭 오토마타

Pattern Matching Automata for the Extraction of Protein Names

  • 박준형 (서강대학교 컴퓨터학과 데이터마이닝 연구실) ;
  • 홍기호 (LS산전(주) / 중앙연구소) ;
  • 양지훈 (서강대학교 컴퓨터학과 데이터마이닝 연구실)
  • Park Jun-Hyung (Datamining Laboratory, Department of Computer Science, Sogang University) ;
  • Hong Ki-Ho (IT Agent Research Lab, LSIS R&D Center) ;
  • Yang Ji-Hoon (Datamining Laboratory, Department of Computer Science, Sogang University)
  • 발행 : 2006.06.01

초록

텍스트마이닝(text mining) 기법을 통해 생물학 문헌으로부터 단백질 이름과 그들 간의 상호 관계를 추출하는 시스템이 제안된 바 있다[1]. 이 시스템에서 단백질 이름을 추출하는 과정을 패턴 일치 오토마타(PMA: Pattern Matching Automata)라는 방법을 이용하여 좀 더 유연하고 높은 성능을 가지도록 개선할 수 있었다. 본 논문은 예제를 통해 PMA의 학습, 테스트 과정과 결과를 설명함으로써 단백질 이름 추출작업에서의 PMA의 가능성과 성능 향상을 위한 앞으로의 방안을 제시한다.

키워드