• 제목/요약/키워드: 문자열 유사도

검색결과 69건 처리시간 0.036초

카오스 이론을 이용한 고정도 문자 인식 시스템 (High Precision Character Recognition System using The Chaos Theory)

  • 손영우
    • 한국멀티미디어학회논문지
    • /
    • 제4권6호
    • /
    • pp.518-523
    • /
    • 2001
  • 미세한 차이를 고감도 식별하는 카오스 이론의 프랙탈 차원과 에농 시스템에서 발생하는 이상한 끌개(Strange Attractor)를 이용하여 문자 특징을 추출, 문자 인식에 적용하는 새로운 방법을 제안함으로써 일반문자 뿐만 아니라, 문자들의 유사성에 의해 오인식되는 혼동 문자를 프랙탈 차원 해석에 의해 해소하는 고정도 문자 인식 시스템을 구현한다. 먼저, 문자 영상으로부터 문자의 고유 성질을 나타내는 망 특징 및 투영 특징, 교차거리 특징 등을 1차 구한 후, 이들 특징을 시계열 데이터로 변환한 다음, 이를 본 논문에서 제안한 수정된 에농 시스템을 이용하여, KS C 5601 표준 한글 2,350자에 대 한 각각의 문자 어트랙터를 재구성한다. 다음 단계에서는 개별 문자 어트랙터의 혼돈도를 분석하기 위해 각각의 문자에 대하여, 프랙탈 차원을 나타내는 정보 차원값(Box-counting Dimension, Natural Measure, Information Bit, Information Dimension)을 계산하여 문자 영상의 최종 특징을 구한다. 실험결과 한글 2,350자에 대하여 99.49%은 분류율을 나타내어 제안된 방법의 유효성을 보였다.

  • PDF

PSAML과 Topology String 데이터베이스를 이용한 웹 기반 단백질 구조 비교 시스템 (A Web-Based Protein Comparison System Using PSAML and Topology String Databases)

  • 김진홍;안건태;변상희;이수현;이명준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.271-273
    • /
    • 2004
  • 단백질의 기능은 단백질의 구조에 따라 결정되며, 새로운 단백질의 기능을 파악하기 위하여 이미 밝혀진 단백질의 기능과 구조를 비교하는 방법이 사용되고 있다. 단백질 구조를 비교하는 방법은 단백질 구조를 표현하는 방법에 따라 다양하게 개발되고 있으며, 보다 효과적으로 관련된 연구자들이 자신의 연구에 활용하기 위해서는 빠르고 쉽게 활용할 수 있는 인터페이스를 제공하는 도구가 필요하다. 본 논문에서는 PDB 데이터베이스에서 제공하는 단백질 정보를 이용하여 PSAML 및 Topology String 데이터베이스를 구축하고 이를 바탕으로 웹 기반에서 단백질 구조 비교를 보다 빠르고 효과적으로 수행하는 시스템에 대하여 기술한다. PSAML 데이터베이스는 단백질 구조를 단백질 이차구조 및 그들 사이의 관계를 포함하는 PSAML 데이터를 제공하며, Topology String 데이터베이스는 단백질 구조를 단백질 이차구조를 하나의 문자로 기술하여 아미노산 순서와 위상학적(공간적) 정보를 포함하는 문자열로 단백질 구조정보를 제공한다. 이를 이용하여 구축된 웹 기반 단백질 구조 비교 시스템은 Topology String 정렬 방법을 통하여 보다 빠르게 유사성이 높은 부분 구조를 찾는 방법을 제공한다.

  • PDF

선율의 음높이와 리듬 정보를 이용한 음악의 유사도 계산 알고리즘 (A Similarity Computation Algorithm Based on the Pitch and Rhythm of Music Melody)

  • 모종식;김소영;구경이;한창호;김유성
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3762-3774
    • /
    • 2000
  • 컴퓨터 하드웨어 및 멀티미디어 정보 처리 기술의 발달로 인하여 멀티미디어 정보 검색 시스템에 대한 요구가 증대되고 있다. 멀티미디어 정보 검색 시스템은 텍스트와 이미지 위주로 발전하였으나 비디오와 오디오 정보, 특히 음악 정보를 위한 멀티미디어 정보 검색 시스템에 대한 요구가 점차 증대되고 있다. 최근의 음악 정보 검색 시스템에서는 해당 음악 정보의 작곡가, 곡명 등과 같은 메타 정보만을 이용한 메타 정보 기반의 검색뿐만 아니라 음악의 내용을 기반으로 하는 내용 기반 검색까지도 가능하다. 음악의 내용 기반 검색에서는 메타 정보 기반 검색에서 흔히 볼 수 있는 문자열에 대한 패턴 매칭보다는 멀티미디어 데이타간의 유사도를 기반으로 검색한다. 본 논문에서는 음악을 일정한 선율에 따른 음들의 배합으로 정의하고, 선율을 구성하는 음의 높이와 음의 길이 정보를 복합적으로 이용하여 두 음악 정보간의 유사도를 계산하는 알고리즘을 제안한다. 또한, 본 논문에서는 제안된 유사도 계산 알고리즘의 검증을 위해 동요를 대상으로 실험을 하였다. 실험 결과에 따르면 제안된 유사도 계산 알고리즘이 기존에 제안된 내용기반 음악 정보 검색 시스템과 비교하여 음악의 선율 정보를 기준으로 음악들간의 유사도를 보다 정확하게 효과적으로 계산하였다.

  • PDF

내용기반 웹 서비스 검색 엔진의 개발

  • 손승범;이규철
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2006년도 춘계학술대회
    • /
    • pp.656-699
    • /
    • 2006
  • 웹 서비스는 사용자가 다양한 인터페이스 정의와 교환 메시지 형식을 가지는 서비스를 개발하는데 있어 보다 효과적이고 단일화된 방법을 제공한다. 웹 서비스에서 인터페이스 정의와 교환 메시지 형식은 WSDL 통해 정의되며, 이 WSDL 문서를 통해 이용할 서비스의 인터페이스와 교환 메시지 형식을 파악하여 빠르게 해당 서비스를 이용할 수 있도록 한다. 이러한 웹 서비스의 등록과 검색을 위해서는 레지스트리 방식을 이용한다. 개발된 서비스에 관한 설명 정보는 서비스 제공자에 의해 작성되어 레지스트리에 등록되며, 서비스 요청자는 레지스트리로부터 필요한 서비스를 검색하여 이용한다. UDDI는 웹 서비스를 위한 분산 레지스트리 표준으로 웹 서비스를 위한 등록과 검색 메커니즘을 제공한다. UDDI에서 지원하는 검색 메커니즘은 크게 키워드 검색과 비즈니스와 서비스에 대한 카테고리별 검색으로 구분된다. 키워드 기반 검색은 SQL LIKE 연산을 통해 비즈니스와 서비스의 이름에 대하여 부분 문자열이 일치하는지 검사하는 방식으로 이루어진다. 이러한 UDDI 의 키워드 기반 검색은 등록된 서비스의 이름 이외의 내용 정보에 대한 검색을 지원하지 못하므로 효과적인 검색을 지원하지 못하는 단점을 가진다. 또한 UDDI는 WSDL 문서의 내용에 대한 검색은 지원하지 못하는 단점을 가진다. 이에 따라 현대의 서비스 검색은 서비스의 이름에 대한 검색만을 지원한다. 이러한 현재의 웹 서비스 검색에서의 문제점을 해결하기 위해서는 UDDI 에 등록된 설명 정보와 WSDL 문서 모두에 대한 내용 기반의 검색을 지원하고 검색 결과를 순위화 (ranking)하여 제시할 수 있는 검색 엔진이 요구된다. 이 논문은 이러한 문제점들을 해결할 수 있도록 내용 기반 검색을 지원할 수 있는 웹 서비스를 위 한 검색 엔진을 제안한다. 제안한 검색 엔진은 UDDI 등록 정보에 대하여 내용 기반 검색을 수행할 수 있도록 벡터 공간 모델을 활용한 유사도 비교 방법을 이용한다. 또한 UDDI 등록 정보 외에 실질 적인 서비스의 인터페이스와 교환 메시지 형식에 대한 비교의 수행을 위하여 WSDL 문서에 대한 유사도 비교를 수행한다. 유사도 측정시 UDDI 등록 정보와 WSDL 문서와 같은 계층적인 문서 구조를 검색 결과에 반영할 수 있는 방법을 지원한다. 지원하는 검색 방법은 두 가지로 키워드 검색과 함께 텀플릿 검색을 지원한다. 템플릿 검색은 서비스의 등록 정보 외에 인터페이스 정의가 얼마나 일치하는지를 비교하기 위해 WSDL 문서에 대한 유사도를 비교할 수 있도록 한다. 이러한 검색의 지원을 통해 제안한 웹 서비스를 위한 검색 엔진은 기존의 레지스트리를 이용한 검 색 방법보다 정확한 검색 결과를 제공한다.

  • PDF

한국어 음소열 기반 워드 임베딩 기술 (Korean Phoneme Sequence based Word Embedding)

  • 정의석;송화전;이성주;박전규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.225-227
    • /
    • 2017
  • 본 논문은 한국어 서브워드 기반 워드 임베딩 기술을 다룬다. 미등록어 문제를 가진 기존 워드 임베딩 기술을 대체할 수 있는 새로운 워드 임베딩 기술을 한국어에 적용하기 위해, 음소열 기반 서브워드 자질 검증을 진행한다. 기존 서브워드 자질은 문자 n-gram을 사용한다. 한국어의 경우 특정 단음절 발음은 단어에 따라 달라진다. 여기서 음소열 n-gram은 특정 서브워드 자질의 변별력을 확보할 수 있다는 장점이 있다. 본 논문은 서브워드 임베딩 기술을 재구현하여, 영어 환경에서 기존 워드 임베딩 사례와 비교하여 성능 우위를 확보한다. 또한, 한국어 음소열 자질을 활용한 실험 결과에서 의미적으로 보다 유사한 어휘를 벡터 공간상에 근접시키는 결과를 보여 준다.

  • PDF

한국어 음소열 기반 워드 임베딩 기술 (Korean Phoneme Sequence based Word Embedding)

  • 정의석;송화전;이성주;박전규
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.225-227
    • /
    • 2017
  • 본 논문은 한국어 서브워드 기반 워드 임베딩 기술을 다룬다. 미등록어 문제를 가진 기존 워드 임베딩 기술을 대체할 수 있는 새로운 워드 임베딩 기술을 한국어에 적용하기 위해, 음소열 기반 서브워드 자질 검증을 진행한다. 기존 서브워드 자질은 문자 n-gram을 사용한다. 한국어의 경우 특정 단음절 발음은 단어에 따라 달라진다. 여기서 음소열 n-gram은 특정 서브워드 자질의 변별력을 확보할 수 있다는 장점이 있다. 본 논문은 서브워드 임베딩 기술을 재구현하여, 영어 환경에서 기존 워드 임베딩 사례와 비교하여 성능 우위를 확보한다. 또한, 한국어 음소열 자질을 활용한 실험 결과에서 의미적으로 보다 유사한 어휘를 벡터 공간상에 근접시키는 결과를 보여 준다.

  • PDF

MCML 기반 모션캡처 데이터 저장 및 퍼지 기반 모션 검색 기법 (Storing and Retrieving Motion Capture Data based on Motion Capture Markup Language and Fuzzy Search)

  • 이성주;정현숙
    • 한국지능시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.270-275
    • /
    • 2007
  • 모션 캡처 기술은 현실감 있는 캐릭터 동작을 얻기 위해 많이 사용되고 있지만, 모션 캡처 데이터의 상이한 포맷들로 인하여 효율적인 모션 데이터의 저장과 검색이 어려운 문제점을 가지고 있다. 본 논문에서는 상이한 형식의 모션 캡처 데이터를 통합하고 효과적으로 저장 및 검객하기 위한 프레임워크를 제안한다. 상이한 모션 캡처 데이터 포맷들을 통합하기 위한 XML 기반의 표준 포맷을 MCML(Motion Capture Markup Language)로 정의하고 있으며 서로 다른 포맷의 모션 캡처 데이터 파일을 하나의 단일화된 MCML 파일로 변환하여 관계형 데이터베이스 또는 XML 데이베이스에 저장함으로써 동일 데이터의 중복 저장 및 공유 문제를 해결한다. 모션캡처 데이터의 검색은 퍼지 문자열 검색(Fuzzy string searching) 기법에 의한 유사어 검색으로 특정 키워드를 포함하는 MCML 문서들을 찾거나 특정 위치의 시작 프레임에서 일련의 프레임들을 선택적으로 추출할 수 있는 모션클립(motion clips) 검색이 가능하도록 하였다.

Ad-Hoc 무선 환경의 발행/구독 시스템을 위한 구독주제 유사도 기반의 이벤트 라우팅 알고리즘 (Topic Similarity-based Event Routing Algorithm for Wireless Ad-Hoc Publish/Subscribe Systems)

  • 웬중휴;오상윤
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.11-22
    • /
    • 2009
  • 동적이고 자원 제한적인 무선 애드혹 네트워크 환경에서, 발행/구독을 위한 이벤트 라우팅 알고리즘은 네트워크의 성능을 결정하는 중요한 역할을 한다. 지금까지는 노드간의 거리 정보를 이용하여 네트워크 오버헤드를 최소화하려는 이벤트 라우팅 알고리즘이 대표적으로 사용되어 왔다. 본 논문에서는 네트워크 오버헤드 중심의 이벤트 라우팅 알고리즘을 기반으로, 구독되는 주제의 유사도를 추가적으로 고려하여 발행/구독 트리에서의 노드 부모를 결정하는 새로운 알고리즘, TopSim을 제안한다. 본 제안 알고리즘은 기반이 되는 ShopParent 알고리즘을 이용하여 네트워크 오버헤드를 계산하고, 이를 기반으로 부모 후보 집합을 만든 후 새로 가입하는 노드와 부모 후보 노드들의 구독주제의 유사도를 계산하여 이를 기반으로 부모를 결정한다. 그럼으로써 노드들이 다수의 구독 주제를 가지는 경우에 보다 효과적으로 네트워크 오버헤드를 줄이도록 하였다. 성능평가를 통해 기존의 네트워크 오버헤드기반의 알고리즘에 비해 제안 알고리즘이 네트워크 성능을 향상시키는 것을 확인하였다.

순간 노출되는 표적의 식별과 부적 반복효과에 지각부하가 미치는 영향 (The Influence of perceptual load on target identification and negative repetition effect in post-cueing forced choice task)

  • 김인익;박창호
    • 인지과학
    • /
    • 제33권1호
    • /
    • pp.1-22
    • /
    • 2022
  • 지각부하 이론(Lavie, 1995)에 따르면 지각부하가 높을수록 방해자극의 영향이 감소한다. 지각부하를 다룬 연구들은 문자열에서 표적 문자의 탐지에 걸린 반응시간을 측정하는 Eriksen과 Eriksen(1974)의 측면자극 과제(flanker task)를 주로 사용하였다. 한편, 순간 노출되고 사라진 문자열 중 보고해야 할 표적이 후단서로 지시되는 후단서 강제선택 과제에서는 부적 반복효과(negative repetition effect; NRE)가 관찰된다. 이 효과는 나란히 제시된 두 문자가 서로 다른 경우보다 동일할 때, 표적의 식별률이 더 떨어지는 것을 말한다. 후단서 강제선택 과제는 정보처리의 초기지각 단계와 관련한 처리 과정을 잘 보여준다. 본 연구는 지각부하가 후단서 강제선택 과제에서 표적의 정확 식별률과 NRE에 어떤 영향을 미치는지를 검토하고자 하였다. 지각부하는 후단서에 의한 강제선택 대상인 두 문자(표적 후보) 사이에 삽입되는 제3의 문자의 유사성(실험 1; 'ㄹ', 'ㅅ', '·')과 개수(실험 2; 0개, 2개-왼쪽 대각선 배치와 오른쪽 대각선 배치, 4개, 실험3; 2개, 4개)로 조작했다. 실험 1에서 NRE의 경향성이 관찰되었으나 지각부하의 효과는 관찰되지 않았다. 실험 2에서는 NRE가 유의하였으며, 지각부하는 유의하였으나, NRE와의 상호작용은 관찰되지 않았다. 실험 3은 부하자극의 위치 변동성을 도입하여 강화된 지각부하의 수준에 따라 NRE가 변화할 것인지를 다시 확인하였는데, 지각부하의 효과가 관찰되지 않았다. 본 연구의 결과는 순간 노출된 표적에 대한 분리주의과정으로 인해 지각부하가 지각 정보처리의 초기 단계에 영향을 미치지 못하였을 가능성이 있음을 시사한다.

사용자 인터페이스의 직관적인 인식 및 일관성 부여를 위한 인터페이스 매핑 및 생성 기법 (Interface Mapping and Generation Methods for Intuitive User Interface and Consistency Provision)

  • 윤효석;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.135-139
    • /
    • 2009
  • 본 논문에서는 대상기기 및 서비스의 물리적 인터페이스 영상에 기반을 둔 인터페이스인 INCUI (Intuitively Natural and Consistent User Interface)를 제시한다. 물리적 인터페이스의 영상과 XML 형식으로 기술 되는 INCUI의 개념을 소개하고, 정의된 INCUI 템플릿을 통해 사용자 인터페이스 요소간 일관성 있는 매핑을 수행하는 방법을 설명한다. 또한 INCUI 형태의 사용자 인터페이스간 매핑을 위해 도메인 크기, 소스 및 타겟 인터페이스의 유형에 따라 선택적으로 세부 매핑 알고리즘을 선택하는 새로운 매핑 구조를 제안한다. 특히 기존 문자열 기반의 LCS (Longest Common Subsequence) 알고리즘의 단점을 보완하여 접두사/접미사/동의어 정보를 활용하는 확장된 유사도 계산 알고리즘을 적용하였다.

  • PDF