• 제목/요약/키워드: 어휘데이터베이스

검색결과 79건 처리시간 0.02초

채팅 시스템 구현을 위한 3단계 문장 검색 방법 (A three-step sentence searching method for implementing a chatting system)

  • 전원표;송영길;김학수
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제37권2호
    • /
    • pp.205-212
    • /
    • 2013
  • 기존 채팅 시스템은 일반적으로 사용자 입력 문장과 데이터베이스 내 목표 문장들 사이의 어휘 일치도에 기반을 둔 방법을 사용한다. 그러나 이러한 방법은 어휘 불일치 문제를 자주 일으킨다. 이러한 문제를 해결하기 위해 순차적으로 적용되는 3단계 문장 검색 방법을 제안한다. 첫 번째 단계는 어휘 수준에서 사용자 입력 문장과 목표 문장들 사이의 공통 키워드 열을 비교하는 것이다. 두 번째 단계는 의미 수준에서 사용자 입력 문장과 데이터베이스 내 문장들 사이의 문장 유형과 의미 표지를 비교하는 것이다. 마지막 단계는 미리 정의된 어휘-구문 패턴을 사용자 입력 문장과 매칭하는 것이다. 실험에서 제안된 방법은 단순 키워드 매칭 방법 보다 더 나은 응답 정확도와 사용자 만족도를 보였다.

어휘정보구축을 위한 사전텍스트의 구조분석 및 변환 (A Structural Analysis of Dictionary Text for the Construction of Lexical Data Base)

  • 최병진
    • 한국언어정보학회지:언어와정보
    • /
    • 제6권2호
    • /
    • pp.33-55
    • /
    • 2002
  • This research aims at transforming the definition tort of an English-English-Korean Dictionary (EEKD) which is encoded in EST files for the purpose of publishing into a structured format for Lexical Data Base (LDB). The construction of LDB is very time-consuming and expensive work. In order to save time and efforts in building new lexical information, the present study tries to extract useful linguistic information from an existing printed dictionary. In this paper, the process of extraction and structuring of lexical information from a printed dictionary (EEKD) as a lexical resource is described. The extracted information is represented in XML format, which can be transformed into another representation for different application requirements.

  • PDF

CD 롬 리뷰 - 이것이 영어다

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 5호통권48호
    • /
    • pp.87-87
    • /
    • 1997
  • 솔빛(대표 박현제)에서 개발한 '이것이 여행영어다'는 해외 여행을 즐겁게 하기 위해 필요한 여행관련 어휘들로 구성되어 있다. 즉 외국 생활에서 터득한 살아있는 미국영어 가운데 해외 여행자를 위해 꼭 필요한 내용만을 뽑아 재구성한 실용적인 영어학습 타이틀로서 본격적인 애니메이션 영어회화 타이틀로 획기적인 인기를 끌고 있는 '이것이 미국영어다' 시리즈 중 하나이다.

  • PDF

이미지 데이터베이스 구축을 위한 데이터항목 속성 연구 (A Study of Image Attributes for Image Database)

  • 곽철완;이은철
    • 한국문헌정보학회지
    • /
    • 제32권2호
    • /
    • pp.169-187
    • /
    • 1998
  • 본 연구의 목적은 이미지데이터베이스 구축에 필요한 데이터항목 속성을 파악하기 위해 이미지정보에 대해 이용자가 사용하는 어휘는 무엇이며, 어떻게 구분되며. 그 사이에 어떠한 관련성이 존재하는가를 파악하는 것이다. 22명의 대학생을 대상으로 5종류의 이미지을 가지고 실험을 한 결과, 이미지가 포함하고 있는 내용, 이미지의 크기 등이 사용하는 어휘의 수를 결정하는데 많은 영향을 미치고 있었다. 그리고, 이미지 내용을 설명하는데 필요한 데이터항목 속성은 실제의미, 내적의미, 시간 혹은 지리적 공간, 그리고 각 범주의 관련성이 중요한 것으로 나타났다.

  • PDF

Sub-word 단위 HMM을 이용한 한국어 대용량 어휘 인식 (Large Vocabulary Speech Recognition Using Sub-word Unit HMM)

  • 김홍수;이상운;이건웅;홍재근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.167-170
    • /
    • 2000
  • 일반적인 한국어 대용량 어휘인식에 사용되는 triphone 모델은 한국어의 특성을 잘 표현한다는 장점이 있으나 인식시간이 길어지게 된다. 이러한 triphone 모델의 단점을 극복하기 위해 음절단위 HMM 모델을 사용하는 방법이 있는데 이 모델은 인식시간을 줄일 수 있으나 triphone 모델에 비해서 인식률이 낮다. 본 논문에서는 음성 인식시간을 단축시키고 조음현상을 고려하기 위하여 초성과 종성 자음은 각각의 biphones으로 나타내고 중성 모음은 1개의 monophone으로 나타내는 모델을 제안하였다. PBW445 음성 데이터베이스에 대한 실험결과, 제안한 인식모델이 triphone 모델에 가까운 인식률을 나타내었으며, 인식시간을 크게 단축하였다.

  • PDF

쿼드 어휘 트리를 이용한 장소 인식 방법 (Place Recognition Method Using Quad Vocabulary Tree)

  • 박서영;홍현기
    • 방송공학회논문지
    • /
    • 제21권4호
    • /
    • pp.569-577
    • /
    • 2016
  • 위치 기반 서비스(LBS; Location Based Service)를 위한 장소 인식 기술은 사용자 중심의 서비스를 위한 중요 기술 중 하나이다. 이미지 특징을 이용한 장소 인식 방법 중에서 FLANN(Fast Library for performing Approximate Nearest Neighbor)의 이미지 어휘 트리를 이용하면 처리 속도가 빠르지만 가려짐 등으로 인해 인식의 정확도가 높지 않다. 본 논문에서는 SURF(Speeded Up Robust Features)를 사용한 쿼드(quad) 어휘 트리 기반의 장소 인식 방법을 제안한다. 학습 단계에서 데이터베이스 이미지를 세 단계의 공간 피라미드로 표현하고 각 영역에 대한 어휘 트리를 구성한다. 질의 이미지도 세 단계의 공간 피라미드로 표현하고 각 단계별로 어휘 트리 기반 인식을 수행한다. 또한 매칭된 특징 간의 호모그래피(homography) 관계를 측정하고 이를 만족하는 영역의 개수를 고려함으로써 최종 인식의 성능을 향상시켰다.

의미적 연결 관계에 기반한 전자 카탈로그에서의 확장된 어휘 인덱스 구축 및 이를 이용한 검색 성능 향상 기법 (Construct ion of Keyword Index and Improved Search Methods for e-Catalogs Eased on Semantic Relationship)

  • 이동주;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.67-69
    • /
    • 2005
  • 본 논문에서는 기 구축된 전자 카탈로그를 의미적 연결 관계에 기초한 확장된 전자 카탈로그로 변환하는 방법을 제안한다. 이를 통해 구축된 확장된 전자 카탈로그에서 의미적 태깅에 의한 확장된 어휘 인덱스 구축 방안과, 이를 이용한 검색 성능 향상 기법을 제안한다. 기존의 전자 카탈로그는 상품 정보가 분류별로 생성된 테이블에 저장되고 저장된 테이블로부터 생성된 키워드 인덱스로부터 검색이 이루어 졌다. 이러한 검색은 상품이 가지는 정보를 데이터베이스에 구축된 테이블에만 한정하게 되어 전자 카탈로그에 포함된 상품이나 분류간의 의미적 연결 관계들을 충분히 이용하지 못하였다 전자 카탈로그에 내재된 의미적 요소를 충분히 활용하기 위해서는 전자 카탈로그를 의미적 연결 관계에 기초한 모델로 구성할 필요가 있다. 본 논문에서는 의미적 모델 기반 전자 카탈로그 시스템으로의 전환 과정을 XML형태의 명세를 이용해 반자동적으로 전환할 수 있는 툴을 구현하며, 단순 키워드 어휘 인덱스 구축이 아닌, 어휘 인덱스의 의미적 확장을 제안하고, 이를 위한 태그 요소로써 어휘에 대한 형태소 분석 결과, 수치 환산 및 확장 요소, 속성간의 도메인 정보 등을 제시하였다. 이를 기반으로 최적의 검색 결과를 얻어 내도록 하는 인접도 평가 함수에 적용하는 방법을 제시한다.

  • PDF

지능형 홈네트워크 시스템을 위한 가변어휘 연속음성인식시스템에 관한 연구 (A Study on Vocabulary-Independent Continuous Speech Recognition System for Intelligent Home Network System)

  • 이호웅;정희석
    • 한국ITS학회 논문지
    • /
    • 제7권2호
    • /
    • pp.37-42
    • /
    • 2008
  • 본 논문에서는 지능형 홈네트워크의 음성제어를 위한 가변어휘 연속음성인식시스템을 개발하였다. 또한 자연스런 음성명령에 대한 인식을 위해 핵심어 기반의 자연스런 연속어휘에 대한 대화형 시나리오를 작성하였고, 핵심어기반의 인식 엔진 및 데이터베이스를 구축하여 인식엔진의 성능을 최적화하였다.

  • PDF

한국어 워드넷의 구축 (Construction of Korean WordNet)

  • 임성신;이은령;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.106-111
    • /
    • 2004
  • 사람의 언어를 이해하는 자연언어처리 시스템을 개발하기 위해서는 의미처리를 위한 지식 베이스(knowledge base)가 필요하다. 지금까지 사람이 가진 지식 베이스를 컴퓨터에 도입하려는 많은 노력을 기울이고 있고 그 결과물로 온톨로지(ontology)와 시소러스(thesaurus)가 만들어지고 있다. 외국에서는 지식 베이스의 중요성을 알고 많은 연구를 수행하고 있으며 그 대표적인 사례들에는 Roget's Thesaurus, WordNet, EDR 개념사전, CYC, Euro WordNet 등이 있다. 이 중에서 가장 대표적이며 많은 활용을 보이는 것이 Princeton 대학의 WordNet이다. WordNet은 인간의 어휘지식에 대한 심리 언어학적인 연구의 결과물로써 심리학자와 언어학자들에 의해 10여 년 동안 구축되고 있는 영어에 대한 어휘데이터베이스이다. 본 논문에서는 WordNet을 기반으로 명사에 대해서 영한사전과 국어사전을 이용하여 구축한 한국어 워드넷을 소개하구 구축시 고려한 기본지침을 소개하도록 하겠다.

  • PDF

어휘 인식 시스템에서 학습 모델 분류를 위한 결정 트리 학습 알고리즘 (Decision Tree Learning Algorithms for Learning Model Classification in the Vocabulary Recognition System)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.153-158
    • /
    • 2013
  • 인식 대상 학습 모델이 분류되어 있지 않거나 명확하게 분류되지 않은 경우 어휘 인식을 결정하지 못하여 인식률이 저하되며 학습 모델 분류 형태가 변경되거나 새로운 학습 모델이 추가되면 인식 모델의 결정 트리 구조가 변경되어야 하는 구조적 문제가 발생한다. 이러한 문제점을 해결하기 위하여 학습 모델 분류를 위한 결정 트리 학습 알고리즘을 제안한다. 음운 현상이 충분히 반영된 음성 데이터베이스를 구성하고 학습 효과를 확보하기 위하여 학습 모델 분류를 위한 결정 트리 방법을 사용하였다. 본 연구에서는 실내 환경에 대하여 어휘 종속 인식과 어휘 독립 인식 실험을 수행한 결과 실내 환경의 어휘 종속 실험에서는 98.3%의 인식 성능을 보였고, 어휘 독립 실험에서 98.4%의 인식 성능을 보였다.