• 제목/요약/키워드: 정렬문제

검색결과 294건 처리시간 0.025초

자율 학습을 이용한 선형 정렬 말뭉치 구축 (Construction of Linearly Aliened Corpus Using Unsupervised Learning)

  • 이공주;김재훈
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.387-394
    • /
    • 2004
  • 본 논문에서는 자을 선형 정렬 알고리즘을 이용하여 선형 정렬 말뭉치를 구축하는 방법을 제안한다. 기존의 자율 선형 정렬 알고리즘을 이용하여 선형 정렬 말뭉치를 구축할 경우, 두 문자열의 길이가 서로 다르면 정렬된 두 문자열(입력열과 출력열)에 모두 공백문자가 나타난다. 이 방법을 그대로 사용하면 정렬 말뭉치의 구축은 용이하나 정렬된 말뭉치를 이용하는 응용 시스템에서는 탐색 공간이 기하급수적으로 늘어날 뿐 아니라 구축된 정렬 말뭉치는 다양한 기계학습 방법에 두루 사용될 수 없다는 문제가 있다. 본 논문에서는 이들 문제를 최소화하기 위해서 입력열에는 공백문자가 나타나지 않도록 기존의 자을 선형 정렬 알고리즘을 수정하였다. 이 알고리즘을 이용해서 한영 음차 표기 및 복원, 영어 단어의 발음 생성, 영어 발음의 단어 생성, 한국어 형태소 분리 및 복원을 위한 정렬 말뭉치를 구축하였으며, 간단한 실험을 통해, 그들의 실용성을 입증해 보였다.

복수 서열 정렬을 위한 시스템 개발에 관한 연구 (A study of system development for multiple sequence alignment)

  • 김동회;김진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.1027-1030
    • /
    • 2003
  • 유전체 서열결정이 폭발적으로 증가해 가고 있다. 인간 유전체사업(Human genome project)의 궁극적인 목적은 인간 염색체에 있는 30억개의 뉴클레오티드와 10만개의 유전자를 밝혀내는 것이고 생의학에서 새로운 발견이나 옹용을 위한 정보로 이용하는 것이다. 이 사업은 1980년대 후반에 시작되었고 현재 서열의 결정이 완료된 상태이다. 본 논문에서는 인간 유전체 사업에서 파생된 가장 중요한 문제 중의 하나인 복수 염기서열 정렬 문제와 복수 염기서열 정렬 시스템의 구현에 대하여 논한다.

  • PDF

정렬 오류 누적에 강인한 실시간 파노라마 합성 방법 (Real-time panoramic stitching algorithm robust to alignment error accumulation)

  • 김범수;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.381-384
    • /
    • 2012
  • 모바일 기기에서 연속적으로 입력되는 영상을 파노라마 합성을 하여 사용자에게 실시간으로 결과를 보여주는 기존의 실시간 파노라마 기법은 트래킹을 기반으로 하고 이미 채워진 영역은 재투영 하지 않기 때문에, 정렬 오류가 누적되고 누적된 정렬 오류가 결과 영상에 그대로 반영되는 문제가 있다. 이를 해결하기 위하여 본 논문에서는 실시간으로 합성된 파노라마 결과에서 정렬 오류가 존재하는 부분과 장면에서 움직이는 물체가 투영된 부분을 판별하고 이 부분만을 다시 투영하는 방법을 제안한다. 정렬 오류가 발생한 부분을 판별하기 위하여, 시간차가 존재하는 여러 장의 영상을 정렬한 후 같은 위치의 픽셀에 속하는 컬러 값을 큐에 저장한다. 정렬 오류가 발생하거나, 움직이는 물체가 존재하는 경우 큐에 저장된 컬러 값의 차이가 커지게 되고 이러한 부분은 다시 투영하여 파노라마 결과 영상에서 오류를 보정하게 된다. 또한 정렬 오류를 최대한 보정하기 위하여 두 단계로 이루어진 블렌딩 방법을 제안한다. 제안하는 방법은 실시간으로 동작하연서 정렬 오류가 발생한 부분을 효과적으로 판별하여 기존의 방법에 비하여 정렬 오류가 줄어듦을 확인하였다.

  • PDF

호박고누놀이와 정렬문제

  • 강병련
    • 한국수학교육학회:학술대회논문집
    • /
    • 한국수학교육학회 2006년도 제37회 전국수학교육연구대회 프로시딩
    • /
    • pp.129-145
    • /
    • 2006
  • PDF

영-한 조어단위 대역쌍 추출을 위한 조어단위 정렬 모델 (An Alignment Model for Extracting English-Korean Translations of Term Constituents)

  • 오종훈;황금하;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권4호
    • /
    • pp.300-311
    • /
    • 2005
  • 전문용어는 전문분야의 개념을 표현하는 언어적 표현이다. 전문용어의 조어단위는 전문용어를 구성하는 최소의 형태적 단위이다. 따라서 조어단위는 전문용어의 의미를 파악하는데 중요한 요소이다. 하지만 조어단위를 이용한 전문용어의 의미파악은 ‘조어단위와 개념단위의 불일치 문제’, 조어 단위의 ‘동형이의어’, ‘동의어’문제 둥으로 인한 어려움이 있다. 이러한 문제를 해결하기 위해서는 하나의 개념을 나타내는 조어단위의 덩어리인 개념단위를 파악하는 작업이 선행되어야 한다. 본 논문에서는 영어의 조어단위를 하나의 개념단위로 정의하고 개념단위에 대응되는 한국어 조어단위의 집합을 개념단위로 인식한다. 개념단위의 파악과정은 영한 대역 전문용어사전에 대한 영어-한국어 조어단위 정렬문제로 해결하고자 한다. 본 논문의 기법은 물리, 화학, 생물 분야에 대한 조어정렬 실험을 수행하였으며, 평균 약 $93\%$의 정확률로 조어단위 간의 정렬을 수행하였다

하다마드 복원 알고리즘을 적용한 64채널 광섬유 능동정렬용 검출기 연구 (Research of a detector for the active alignment of 64channel optical fiber using Hadamard algorithm)

  • 조남원;곽기석;윤태성;박진배
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 B
    • /
    • pp.472-475
    • /
    • 2003
  • 현재 광 정렬 시스템에 채용하고 있는 다채널 광 파워미터는 측정 채널의 수가 증가하는 상황이다. 그러나 기존 시스템 제어를 통한 각 채널의 정밀한 정렬은 다 채널 광 파워미터 기술에 적합하지 않은 방식이다. 그러므로 본 논문에서는 기존 방식을 채택한 광 정렬 방식을 개선하기 위해 하다마스 변환 복원 알고리즘을 이용한 광 능동 정렬 검출 방법을 제안한다. 다채널 광학 정렬 시스템에서 가장 중요한 문제는 채널의 증가에 따라 채널별 정렬의 정밀도가 떨어진다. 기존 정렬 시스템에서 채용하고 있는 다채널 광 파워미터의 기술 수준은 약 4채널까지 동시 측정이 가능하였다. 이 방법은 채널 양쪽에 검출기를 설치하여 광량의 최대 지점을 최적 정렬 위치로 결정한다. 그러나 시스템 채널이 증가할 수록 안쪽에 위치한 광소자를 정렬을 무시하기 때문에 정확한 정렬에 적합하지 않다. 그리고 고속, 대용량의 데이터 처리요구에 맞추기 위한 64채널 광소자 생산을 위해서는 16개의 4채널 광 파워미터를 사용하는 방법이 있으나 이는 신뢰할 만한 수준의 측정치를 제공하지 못한다. 따라서 새로운 개념을 적용한 다채널 동시측정을 위한 광소자 측정 기술 및 광 파워미터의 개발이 절실히 요구되고 있는 실정이다. 하다마드 변환 복원 알고리즘을 이용한 광 능동 정렬 검출 시스템은 이러한 요구를 충족시킬 수 있다. 그러므로 본 논문은 하다마드 변환 복원 알고리즘을 이용한 광 능동 정렬 검출 시스템이 기존의 시스템보다 우수한 알고리즘과 성능을 가지고 있음을 실험을 통해 입증한다.

  • PDF

의미거리측정방법을 활용한 분산 온톨로지 간 자동 정렬 방법 연구 (A Study on an Automatic Alignment Method of Distributed Ontology by Using Semantic Distance Measure Method)

  • 황상규;변영태
    • 정보관리학회지
    • /
    • 제26권4호
    • /
    • pp.319-336
    • /
    • 2009
  • 시멘틱 웹은 현재의 월드와이드웹의 진화된 모습으로 컴퓨터와 인간이 서로 협업할 수 있도록 컴퓨터가 이해할 수 있는 지식데이터베이스인 온톨로지 기술을 활용한다. 그러나, 온톨로지를 활용하여 정보의 의미를 이해하고 처리 가능하도록 데이터의 표현형식이 표준화 되더라도, 각기 다른 개발자가 서로 다른 개념하에 구축한 온톨로지를 기반으로 작성된 데이터는 상호 불일치 문제를 유발할 수 있다. 따라서, 서로 다른 개념 하에 구축된 온톨로지 간에는 상호 서로 다른 온톨로지 간 정렬작업이 필요하다. 서로 다른 온톨로지 개념노드 간 자동화 처리된 의미정렬 시 인간전문가가 참으로 판단한 사실을 거짓으로 잘못 판단하는 문제상황(false negative)에 의해 정렬오류문제가 발생하게 되는데, 본 연구에서는 서로 다른 온톨로지 개념노드 간 의미정렬과정에서 발생하는 false negative 오류를 최소화 할 수 있는 알고리즘을 새롭게 개발, 제시하였다.

클러스터링 기반 다중 서열 정렬 알고리즘 (Algorithm of Clustering-based Multiple Sequence Alignment)

  • 이병일;이종연;정순기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.27-30
    • /
    • 2005
  • 3개 이상의 DNA 혹은 단백질의 염기서열을 정렬하는 다중 서열 정렬(multiple sequence alignment, MSA)은 서열들 사이의 진화관계, 단백질의 구조와 기능에 관한 연구에 필수적인 도구이다. 최적화된 다중서열 정렬을 얻기 위해 사용되는 가장 유용한 방법은 동적 프로그래밍이다. 그러나 동적프로그래밍은 정렬하고자 하는 서열의 수가 증가함에 따라 시간도 지수함수($O(n^k)$)로 증가하기 때문에 다중 서열 정렬에는 효율적이지 못하다. 따라서, 본 논문에서는 최적의 MSA 문제를 해결하기 위해 클러스터링 기반의 새로운 다중 서열 정렬 (Clustering-based Multiple Sequence Alignment, CMSA) 알고리즘을 제안한다. 결과적으로 제안한 CMSA 알고리즘의 기여도는 다중 서열 정렬의 질적 향상과 처리 시간 단축($O(n^3L^2)$)이 기대된다.

  • PDF

다중 지역 정렬을 위한 알고리즘 (An Algorithm for multiple local alignment)

  • 장석봉;이계성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.2337-2340
    • /
    • 2002
  • 본 연구는 생물정보학(Bioinformatics)의 가장 기초적인 분야중 하나인, 새롭게 밝혀진 유전자 서열과 이미 밝혀진 유전자 서열 사이의 유사성(similarity)이나 상동성(homology)을 찾기 위한 방법에 대한 연구 중 지역 서열정렬로 사용하는 알고리즘인 Smith-Waterman 알고리즘이 갖고 있는 문제를 파악한다. 긴 서열에 대한 선호를 막고 대신 부분적인 지역 정렬을 다수 개 찾아 정렬시키는 알고리즘을 제안하기로 한다.

  • PDF

호박고누놀이와 정렬문제 (Ho-bak-go-nu and Game of Alignment)

  • 강병련
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제45권4호
    • /
    • pp.507-518
    • /
    • 2006
  • There is a great need to find new topics which are good to evaluate and to encourage the mathematical creativity of gifted students, For the purpose to find such a topic, we study Ho-bak-go-nu game that is one of Korean traditional games and a typical alignment game. By analyzing patterns of possible alignment, the author gives a complete solution to win or not to lose according to the rules chosen by players. The author also poses several class-models including a test for the class of gifted students based on the analysis of real classes on Ho-bak-go-nu game.

  • PDF