• 제목/요약/키워드: PAM 행렬

검색결과 2건 처리시간 0.015초

Kogs데이타베이스로부터 얻은 계통학적인 아미노산 치환행렬 (A phylogenetic amino acid substitution matrix from Kogs database)

  • 안희성;김상수
    • Bioinformatics and Biosystems
    • /
    • 제2권1호
    • /
    • pp.7-11
    • /
    • 2007
  • 하나의 아미노산이 다른 아미노산으로 바뀌는 가능성을 계통학적인 나무를 이용해서 치환행렬로 만들었다. PFMT(Phylogenetic Focused Mutaion Tendency)행렬은 기존의 PAM160이나 BLOSUM62와 다르게 공통조상으로부터 상위 종으로 치환되는 가능성을 점수화 하였다. COGs의 데이터베이스에 있는 152KOGs를 뽑아서 아미노산의 치환횟수를 점수화하였다. PFMT 행렬은 어떤 서열보다 더 상위 종의 서열을 비교할 때 유용하게 쓰일 수 있으며 2개의 아미노산간의 치환 관계를 더 자세하게 볼 수 있게 한다.

  • PDF

PAM 행렬 모델을 이용한 음소 간 유사도 자동 계산 기법 (Automatic Inter-Phoneme Similarity Calculation Method Using PAM Matrix Model)

  • 김성환;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제12권3호
    • /
    • pp.34-43
    • /
    • 2012
  • 두 문자열 간의 유사도를 계산하는 문제는 정보 검색, 오타 교정, 스팸 필터링 등 다양한 분야에 응용될 수 있다. 동적 계획법 기반의 유사도 계산 방법을 통하여 한글 문자열의 유사도 계산을 위해서는 우선 음소간의 유사도에 대한 정의가 필요하다. 그러나 기존의 방법들은 수동적 설정에 의한 유사도 점수를 사용하고 있다는 한계점이 있다. 본 논문에서는 PAM(Point Accepted Mutation) 행렬과 유사한 확률 모델을 이용하여 변형 단어 집합으로부터 음소 간의 유사도를 자동적으로 계산하는 기법을 제안한다. 제안 기법은 주어진 변형 단어의 집합 내 유사한 단어 쌍을 찾아 문자열 정렬(Text Alignment)을 수행함으로써 음소 변형 규칙을 도출하고, 이로부터 각 음소 쌍의 상호 변형 빈도에 따른 유사도 점수를 계산한다. 실험 결과 특이도(Specificity) 77.2~80.4% 수준에서 불일치 여부에 따른 단순 점수 부여 방식에 비해서는 10.4~14.1%, 수동으로 음소 간 유사도를 직접 설정하는 방식에 비해서는 8.1~11.8%의 민감도(Sensitivity) 향상이 있음을 확인하였다.