• 제목/요약/키워드: 검색테이블

검색결과 295건 처리시간 0.025초

보조 자료와 음성 전사를 사용한 강의 검색 시스템 (A LECTURE SEARCH SYSTEM USING RELEVANT INFORMATION AND SPEECH TRANSCRIPTION)

  • 이동현;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.140-144
    • /
    • 2008
  • 음성 오디오 검색 시스템을 구축하기 위해서는 몇 가지 과정이 필요하다. 첫 번째 과정이 음성 인식기를 이용하여 음성 오디오를 텍스트 형태로 표현하는 것이다. 하지만, 음성 인식기에서 수반되는 음성 인식 오류를 피할 수는 없다. 음성 인식 오류를 최소화하기 위해서 음성 인식 출력의 lattice를 색인(index)해야 하는데, 보다 효과적인 처리를 위하여 압축된 형태를 사용한다. 본 연구에서는 특별히 한국어 강의를 대상으로 검색 시스템을 구축했다. 강의에서는 특별히 관련된 자료를 쉽게 구할 수 있는 데, 이런 자료를 언어 모델에 이용하여 음성 인식 성능을 향상 시킬 수 있다. 또한, 강의 자료를 이용한 추가 색인 테이블(index table)을 생성하여 검색 성능 향상에 도움을 준다. 실험에서 고등학교 과정 수학 강의 동영상을 이용하여 자동화된 강의 검색 시스템을 구축하고, 보조 자료를 이용해 성능을 향상 시키는 것을 보인다.

  • PDF

데이타마이닝을 이용한 전문 검색엔진의 설계 및 구현 (A Design and Implementation of Expert Search Engine Using DataMining)

  • 황보윤;김병찬;김영지;문현정;우용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.43-46
    • /
    • 2001
  • 본 논문에서는 데이타마이닝 기법을 이용하여 지능형 전문 검색엔진을 설계하고 사용자 인터페이스를 구현하였다. 먼저, 컴퓨터 분야의 전문 용어에 대하여 연관 규칙 탐사 알고리즘을 이용하여 의미적으로 연관된 용어들끼리 클러스터로 구성하였다. 전문 용어별로 구성된 클러스터는 본 논문에서 제안한 지식베이스 테이블에 저장하여 의미적으로 연관된 용어를 포함하는 웹 문서를 검색하는 과정에서 이용하였다. 검색과정에서는 사용자가 제시한 키워드와 관련된 전문 용어들간의 연관정도를 가중치로 부여하여 연관 정도가 높은 웹 문서순으로 출력하였다. 제안된 방법을 통하여 사용자가 제시한 키워드와 의미적으로 연관된 웹 문서를 효과적으로 검색할 수 있었다.

  • PDF

유용성 수치를 이용한 동영상 메타데이터 저장 (Storage scheme of video metadata using usefulness value)

  • 이영석;윤성대
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.152-154
    • /
    • 2009
  • 본 논문에서는 다양하고 효율적인 활용을 위한 동영상 저장 방법을 제안한다. 메타데이터에 포함된 단어와 검색어의 일치성을 중요시하는 기존의 저장 및 검색과 달리, 동영상 자료의 메타데이터에서 구간을 나타내는 태그에 그 구간이 사용자의 요구에 부합되는 정도에 따라 유용성 수치를 부여하여 데이터베이스에 저장함으로써, 검색시에 유용성 수치를 이용하여 원하는 구간에 접근 할 수 있고 사용자의 목적에 일치하는 정도에 따라 범위 검색이 가능하고 히스토리 테이블을 추가, 다차원 큐브 생성을 가능케 하여 동영상 자료의 폭넓은 활용과 효율적인 검색이 가능하다.

무선 ATM에서 Crossover Switch 탐색 알고리즘의 성능 향상에 관한 연구 (Performance Improvement of Crossover Switch Discovery Algorithm for Wireless ATM)

  • 고성범;정재일
    • 한국통신학회논문지
    • /
    • 제26권8A호
    • /
    • pp.1388-1397
    • /
    • 2001
  • 무선 ATM에서 핸드오프 시의 경로 재설정 과정에서 필요한 COS 선택 알고리즘에 관하여 기존의 알고리즘과는 다른 새로운 알고리즘을 제안한다. 제안하는 Short search COS 선택 알고리즘은 매 핸드오프 시마다 COS를 검색하지 않고 이전에 검색된 COS 노드를 최대한 활용하여 핸드오프 지연 성능을 저하시키지 않으면서 전체적인 망 이용 효율성은 향상시키는 결과를 나타낸다. 알고리즘의 개선된 성능을 시뮬레이션을 통해 검증되고 그래프 및 결과 테이블을 통해 보여진다.

  • PDF

컴포넌트 검색을 지원하는 퍼지 기반 시소러스 구축 (Fuzzy based Thesaurus Construction Supporting Component Retrieval)

  • 김귀정;한정수;송영재
    • 정보처리학회논문지D
    • /
    • 제10D권5호
    • /
    • pp.753-762
    • /
    • 2003
  • 컴포넌트 검색을 위한 많은 방법론이 제시되고 있고 그 중 유사 컴포넌트 검색을 위한 시소러스 개념이 도입되고 있다. 본 논문은 컴포넌트의 효율적인 검색을 위하여 컴포넌트를 구성하는 클래스들을 상속관계에 따라 개념적으로 분류하였고, 시소러스 방법에 퍼지 논리를 적용하여 객체지향 시소러스를 구축하였다. 제안한 방법은 개념들 사이의 범주를 자동으로 표현할 수 있으며, 각 클래스와 범주에 대한 매칭도와 비매칭도를 비교함으로서 클래스 사이의 퍼지 정도를 계산하여 시소러스를 구축하였다. 컴포넌트 검색은 컴포넌트를 구성하는 클래스들을 이용하여 유의어 테이블을 기반으로 후보 컴포넌트들을 검색한 후 퍼지 유사도 측정 방법을 이용하여 우선순위로 검색한다. 또한 시뮬레이션을 통하여 최적의 질의 확장 임계치를 설정함으로서 검색 성능을 크게 향상시켰다.

시멘틱 웹 데이터를 위한 키워드 인덱싱 기법 (Indexing Scheme for keyword-based Query Processing on Semantic Web)

  • 신혜연;김연희;정균락;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.51-55
    • /
    • 2006
  • 시맨틱 웹은 현재 웹의 확장된 개념으로 사람뿐만 아니라 컴퓨터 스스로가 데이터를 이해하고 처리할 수 있도록 정보에 의미를 부여하는 것이다. 시맨틱 웹 데이터를 기술하는 RDF를 통해 메타데이터를 표현하고 의미론적 추론이 가능하게 되었다. 따라서 기존에 일반 사용자가 쉽게 사용할 수 있는 키워드 검색 방법을 시맨틱 웹 데이터인 RDF/RDF 스키마에 적용함으로써 차세대 웹으로 인식되고 있는 시맨틱 웹을 일반 사용자도 쉽게 활용할 수 있도록 한다. 본 논문에서는 RDF 문서의 효율적인 검색을 위해 RDF 인스턴스와 RDF 스키마 정보를 저장하고, 키워드, 속성, 클래스 타입의 복합 조건 검색을 만족시키는 키워드 인덱스와 스키마 테이블 구조를 제안한다. 본 논문에서 제안한 구조는 다양한 조건들을 만족하는 리소스 정보의 빠르고 정확한 검색이 가능하도록 한다.

  • PDF

트라이 인덱스를 이용한 DNA 시퀀스 검색 (DNA Sequence Searching Using a Trie Index)

  • 원정임;박용일;윤지희;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.4-6
    • /
    • 2003
  • 본 논문에서는 대규모 DNA 시퀀스를 위한 트라이 인덱싱 기법을 기반으로 하는 효율적인 부분 시퀀스 검색 기법을 제시한다. 제안된 인덱싱 방안에서는 저장 공간 감소를 위하여 시퀀스의 각 문자를 최소 비트 정보로 표현하며, 저장 구조로서 포인터를 사용하지 않는 디스크 기반의 이진 접미어 트라이 구조를 사용한다. 질의 처리 방안에서는 포인터가 없는 이진 트라이 구조 상에서 질의 시퀀스를 검색하기 위하여 이진 정보 기반의 연산과정을 필요로 하며, 또한 단말 정보를 효율적으로 검색하기 위하여 별도의 단말정보 테이블과 인덱스 구조를 사용한다. 실험 결과에 의하면 제안된 방식은 기존의 접미어 트리 인덱싱 방식에 비하여 약 30~50%의 저장 공간 감소 효과를 가질 뿐 아니라, 평균 질의 처리 시간에 있어 약 20배까지의 성능 개선 효과를 갖는 것으로 나타났다.

  • PDF

고정된 패턴 리스트를 사용한 단백질 2차 구조의 검색 (Searching Secondary Structure of Protein Using Fixed Pattern List)

  • 나상준;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.304-306
    • /
    • 2004
  • 단백질의 1차 구조를 통하여 생성되는 단백질 2차 구조는 3가지 타입 E, H, L을 가지고 있다. 단백질 2차 구조는 선형적인 단백질 1차 구조를 공간적으로 형성한 것이며 단백질 2차 구조에 관한 연구는 단백질 기능 예측에 중요한 부분이다. 단백질 2차 구조는 3가지 타입이 각각 그룹을 이루어 나타나는 특징이 있다. 단백질 2차 구조의 이러한 특징을 이용하면 효과적인 검색이 가능하다. 기존의 연구에서는 시퀀스 전체와 질의를 스트링 기반으로 비교하는 방법과 단백질 2차 구조의 세그먼트 테이블을 이용하는 방법을 사용하였다. 하지만 이러한 방법은 검색 비용이 많이 드는 단점이 있다. 본 논문에서는 효과적인 단백질 2차 구조의 검색을 위하여 고정된 패턴을 정 의하고 고정된 패턴을 사용하는 방안을 제시한다.

  • PDF

적응적인 복수 해슁과 프리픽스그룹화를 이용한 고속 IP 주소 검색 구조 (A High-speed IP Address Lookup Architecture using Adaptive Multiple Hashing and Prefix Grouping)

  • 박현태;문병인;강성호
    • 대한전자공학회논문지TC
    • /
    • 제43권5호
    • /
    • pp.137-146
    • /
    • 2006
  • IP 주소 검색 구조는 라우터 시스템에서 고속 네트워크 기술의 중요한 이슈가 되고 있으며 패킷 전달의 성능을 좌우하는 주요한 문제 요소로 지적되고 있다. 본 논문에서는 복수 해슁의 적응적인 적용과 프리픽스 그룹화를 이용하여 효율적인 고속 IP 주소 검색 구조를 제안한다. 여러 라우팅 데이터의 엔트리 분포를 분석하여 프리픽스를 그룹화하고 그룹별로 적용되는 해쉬함수의 개수를 적응적으로 적용하여 해슁에 의한 충돌(collision)을 줄일 수 있었으며 이를 통해 테이블의 수를 최적화하고 메모리 효율을 높일 수 있었다. 또한 제안하는 구조는 단 한 번의 메모리 접근만으로 포워딩 테이블의 구성 및 검색 과정을 수행할 수 있는 고속 구조이다.

시맨틱 검색을 위한 이기종 데이터간의 매칭방법 (Matching Method between Heterogeneous Data for Semantic Search)

  • 이기정;황보택근
    • 한국콘텐츠학회논문지
    • /
    • 제6권10호
    • /
    • pp.25-33
    • /
    • 2006
  • 시맨틱 환경에서의 시맨틱 검색을 위해서는 분산된 자원의 관리와 처리가 중요한 요소이다. 분산된 자원의 효율적인 검색을 위해서는 온톨로지의 사용이 필수적이지만, 모든 자원에 대한 통합적인 온톨로지를 구축하는 것은 현실적으로 매우 어려운 일이다. 본 논문에서는 웹 환경에서의 대부분의 자원은 관계형 데이터베이스 형태로 저장되어져 있다고 가정하고, 시맨틱 검색을 위하여 분산된 관계형 데이터베이스 테이블과 도메인 온톨로지간의 매칭을 위한 방법을 제안한다. 기존의 관계형 데이터베이스와 도메인 온톨로지간의 매칭에 관한 연구들은 관계형 데이터베이스에서 로컬 온톨로지를 추출하여 도메인 온톨로지와의 매칭을 수행하였다. 그러나, 로컬 온톨로지를 추출하는 과정에서 도메인 온톨로지와의 상관관계를 이용하지 않음으로 인하여 도메인 정보가 손실되는 문제점을 가지고 있다. 이에 대한 해결책으로 관계형 데이터베이스의 인스턴스들과 도메인 온톨로지의 인스턴스간의 유사도 측정을 통한 정보 손실을 방지하였으며, 관계형 데이터베이스내의 테이블들간의 관계와 온톨로지에서의 클래스들간의 관계 정보를 이용하여 보다 효율적인 매칭이 가능하도록 하였다.

  • PDF