• Title/Summary/Keyword: 키워드-기반 시스템

검색결과 519건 처리시간 0.027초

오픈도메인 질의문 자동 분류를 위한 주석 말뭉치 구축 연구 (A study on the Construction of Annotated corpora for the Automatic Classification of Open Domain Queries)

  • 안애림;이서진;최동현;김응균;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.309-314
    • /
    • 2019
  • 본 연구는 오픈도메인 자연어 질의문 유형을 '질문 초점(Question Focus)'에 따라 분류하고, 기계학습 기반 질의문 유형 분류기의 성능 향상을 위한 주석 말뭉치 구축을 목표로 한다. 오픈도메인 질의문 분석을 통해 의문사 등의 키워드 기반 질의문 유형 분류의 한계를 설명하고, 질의문 내의 비명시적인 의미자질을 고려한 질문 초점 기반 질의문 유형 분류 기준을 정의하였다. 이 기준에 따라 구축된 112,856 문장의 주석 말뭉치를 기계학습(CNN) 기반 문장 분류 시스템의 학습 데이터로 사용하여 실험한 결과 F1-Score 97.72%성능을 보였다. 또한 이를 카카오 오픈도메인 질의응답시스템에 적용하여 질의문 확장을 위한 의미 자질로 사용하였고 그 결과 전체 시스템 성능을 1.6%p 향상시켰다.

  • PDF

웹 서비스 검색을 위한 시맨틱 매칭 엔진 (Semantic Matching Engine for Searching Web Services)

  • 양승훈;이대욱;권준호;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.267-272
    • /
    • 2006
  • 인터넷망의 지속적인 발달과 함께 웹 애플리케이션 개발 방법으로 XML 기반의 웹 서비스가 부각되면서 많은 웹 서비스들이 개발되었고, 점차 더 많은 웹 서비스들이 개발될 것으로 예상된다. 이처럼 급격하게 늘어나는 웹 서비스들 중에서 사용자가 원하는 웹 서비스 찾는 것이 중요한 이슈로 부각되고 있다. 그러나 현재의 웹 서비스 검색 표준인 UDDI 레지스트리는 키워드 기반이기 때문에 검색 성능의 한계점을 갖고 있다. 최근에 이러한 한계를 극복하고자 하는 많은 연구가 진행되고 있지만 아직은 많이 부족한 상황이다. 따라서 본 논문에서는 비록 키워드가 일치하지 않더라도 사용자가 원하는 웹 서비스를 찾을 수 있도록 웹 서비스 표준인 UDDI 레지스트리에 시맨틱 매칭 엔진(semantic matching engine)이라는 추가적인 시맨틱 레이어를 추가하여 재현율(recall)과 정확률(precision)을 모두 향상 시킬 수 있는 시스템을 제안한다.

  • PDF

방사선 의료영상 검색 시스템에 관한 연구 (A Study on Radiological Image Retrieval System)

  • 박병래;신용원
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제28권1호
    • /
    • pp.19-24
    • /
    • 2005
  • 방사선사를 위한 교육 및 영상 정보에 대한 정확한 판단에 유용한 주석-기반 방사선 의료영상 검색 시스템을 설계 및 구현하고, 방사선 의료영상에 대한 단순 속성정보, 부가적인 정보인 텍스트 설명정보로부터 추출한 중요 키워드에 대한 효율적인 검색을 위해 $B^+$-트리와 역화일 기법을 이용한 색인기법을 제안하고자 한다. 윈도우즈 XP에서 Delphi를 이용하여 구현하였으며, 방사선사는 방사선 의료영상에 대한 속성 정보, 부가적인 설명정보, 이미지 정보를 저장하도록 하고, 구축된 영상 데이터베이스로부터 속성정보와 텍스트 키워드 정보를 이용하여 검색 가능하도록 하였다. 임상방사선사가 단순속성정보 및 텍스트 설명정보를 찾아냄으로써 임상현장에서의 체계적인 교육뿐 만 아니라 지식을 구조화함으로써 교육시간의 단축과 방사선 의료영상에 대해 정확한 판단을 내릴 수 있다. 구현되어진 방사선 의료영상검색 시스템은 차후에 일반촬영, 특수조영영상을 포함한 통합화상시스템으로의 확장이 요구되며, 아울러 웹을 통한 서비스를 구축함으로써 의사결정시스템으로 발전 할 수 있는 기반기술로 기대된다.

  • PDF

형태소 분석기를 이용한 키워드 검색 기반 한국어 텍스트 명령 시스템 (Keyword Retrieval-Based Korean Text Command System Using Morphological Analyzer)

  • 박대근;이완복
    • 한국융합학회논문지
    • /
    • 제10권2호
    • /
    • pp.159-165
    • /
    • 2019
  • 딥러닝을 기반으로 한 음성 인식 기술이 상용 제품에 적용되기 시작했지만, 음성 인식으로 분석된 텍스트를 효율적으로 처리할 방법이 없기 때문에 VR 컨텐츠에서 그 적용 예를 찾아 보기는 쉽지 않다. 본 논문은 문장의 형태소를 분석하는 형태소 분석기와 챗봇 개발에 주로 이용되는 검색 기반 모델(Retrieval-Based Model)을 활용하여 명령어를 효율적으로 인식하고 대응할 수 있는 한국어 텍스트 명령 시스템을 제안하는 것을 목적으로 한다. 실험 결과 제안한 시스템은 문자열 비교 방식과 같은 동작을 하기 위해 16%의 명령어만 필요했으며, Google Cloud Speech와 연동하였을 때 60.1%의 성공률을 보였다. 실험 결과를 통해 제안한 시스템이 문자열 비교 방식보다 효율적이라는 것을 알 수 있다.

서버에서 효율적인 메모리 사용량을 제공하는 공개키 기반 검색 암호 시스템 (Memory-efficient Public Key Encryption with Keyword Search in Server)

  • 권은정;서재우;이필중;박영만;이해규;김영헌;정학진
    • 정보보호학회논문지
    • /
    • 제18권4호
    • /
    • pp.3-15
    • /
    • 2008
  • 검색 가능 암호 시스템 (Searchable Encryption)은 암호화된 데이터에서 키워드를 검색하는 문제를 해결하기 위하여 2000년에 Song 등에 의해서 처음으로 제안되었다. 지금까지 대칭키 암호화 방식과 공개키 암호화 방식에 기반하는 여러 가지 검색 가능 암호 시스템이 제안되었으나, 공개키 암호화 방식에 기반한 기존의 기법들은 암호화 된 문서의 검색을 위해 서버에서 저장해야 하는 인덱스들의 크기가 키워드 개수에 비례하여 선형적으로 증가하는 단점을 가진다. 본 논문에서는 공개키 기반 검색 가능 암호 시스템에서 서버에서 저장하는 인덱스의 길이를 줄이기 위해 Bloom Filter를 적용하는 방법을 제안하고, Boneh 등이 제안한 PEKS(Public key Encryption with Keyword Search)에 제안한 방법을 적용하여, 메모리 측면에서 그 효율성을 분석한다.

무선 멀티미디어 데이터 검색 시스템 (A Wireless Multimedia Data Retrieval System)

  • 최진성
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.302-304
    • /
    • 2010
  • 본 논문에서는 유아의 환경 교육을 위한 비디오 검색을 위해 의미 가중치와 의존 가중치를 이용하여 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 의미기반 멀티미디어 데이터베이스 시스템을 제안한다. 환경 교육에 대한 멀티미디어 데이터를 사용자가 키워드 입력을 통해 검색을 하면 제안 시스템의 모바일 에이전트에 의해 의미 가중치를 계산하고 그 정보를 키 프레임의 주석정보로 이용하여 더욱 정확한 데이터가 검색되게 한다. 제안하는 시스템의 프로토타입을 구현하여 테스트 한 결과 약 96.5%의 높은 정확도(precision)를 얻었다.

  • PDF

질감과 칼라 정보를 이용한 지능적 웹 이미지 검색 시스템 설계 (A Design of Intelligent Web Image Retrival System using Texture and Color Information)

  • 홍성용;나연묵
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.61-63
    • /
    • 2001
  • 최근들어, 인터넷상의 E-business나 쇼핑몰사이트와 같은 웹 사이트에서 멀티미디어 정보를 많이 사용하고 있다. 멀티미디어 정보 중에서도 이미지 정보가 가장 많이 사용되고 있으며, 이는 사용자들이 가장 많이 접하는 정보이다. 기존의 이미지 검색 기법은 내용 기반 검색이나 키워드를 이용한 검색 방법을 지원하지만, 사용자의 의도를 적용하지는 못하고 있다. 본 논문에서는 웹에서 사용자가 이미지를 검색하고 접근하는 패턴을 이미지의 칼라와 질감을 특징으로 한 벡터를 기반으로 시스템에 학습 시키고 사용자의 검색 성향을 분석하여 시스템에 적용한다. 이미지 검색의 효율을 높이기 위하여 질감을 기반으로 비트 벡터 인덱스(bit vector index) 기법을 적용하며, 인덱스에 의한 이미지 자동 분류 기법을 제안한다. 또한 이미지 칼라의 정보를 영역별로 추출하여 칼라 부분매칭 검색을 가능하게 한다. 이러한 이미지 검색 시스템을 사용하는 사용자의 정보를 시스템에 학습시키고 학습된 결과를 이용해서 사용자가 검색 하고자 하는 이미지 정보에 편리성을 제공하고 검색의 효율성을 증대시킨다.

  • PDF

Tesseract OCR 기반 인쇄 서적의 키워드 모니터링 시스템 설계 (Design of keyword monitoring system of printing paper based on Tesseract OCR)

  • 이주찬;김무중;유윤섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.606-607
    • /
    • 2017
  • 디지털 정보 처리 및 습득 속도에 대한 관심이 높아지면서 이와 관련된 많은 연구가 수행되고 있지만 아날로그 정보에 대한 연구는 많이 부족하다. 따라서 본 논문에서는 자동으로 책을 넘기고 각 페이지의 시잔을 촬영하여 컴퓨터로 전송한 후에 Tesserac-OCR을 이용하여 이를 디지털화 하여 저장하고 사용자가 원하는 키워드가 존재하는 페이지를 찾아 출력하는 시스템을 설계 및 구현한다.

온톨로지를 이용한 맞춤형 여행정보 시스템 (The System of customized Travel Information based on Ontology)

  • 조미영;최창;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2006
  • 본 논문에서는 지능형 여행 정보 제공을 위해 제주여행 온톨로지를 구축하여 사용자별 맞춤형 여행정보 제공 및 검색을 위한 시스템을 제안하고자 한다. 기존의 일반 검색이 제한된 정보에 대한 키워드 매칭이 라면, 온톨로지 기반 검색은 키워드 검색, 사전에 의한 확장 검색, 지식입력에 의한 검색이 모두 가능하여 좀 더 지능적 검색이라 할 수 있겠다. 이러한 온톨로지 검색의 장정으로는 속성값, 분류, 메타 정보 등 관련된 여행정보를 모두 활용할 수 있다는 것과. 유사어 활용이 가능하다는 것이다. 또한 검색 어휘의 역할에 따른 차등적인 가중치값 등을 적용하여 Many-Answers-Problem 해결할 수 있다. 즉, 가장 관련 있는 정보를 상위에 랭크시켜 사용자의 체감 정확률을 향상시킬 수 있다.

  • PDF

챗봇 프레임워크 성능 향상을 위한 점진적 학습 기법 (Incremental Learning for Performance Enhancement of Chatbot Framework)

  • 박상현;박진욱;조수헌;현제혁;황진성
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.283-284
    • /
    • 2019
  • 규칙 기반의 챗봇(Chatbot)은 개발자가 미리 지정한 키워드와 패턴을 통해 사용자의 의도(Intent)를 파악하기 때문에, 챗봇을 응용한 어플리케이션에서는 제한적인 활용도를 보인다. 본 논문에서는 위 문제를 해결하기 위해, 프레임워크 기반의 한글 자연어 처리 챗봇 성능 향상을 위한 점진 학습(Incremental Learning)을 제안한다. DialogFlow는 규칙 기반의 챗봇 프레임워크로서, 사용자 질의 패턴에 대한 사전 학습이 치명적이다. 제안하는 점진 학습 기법은 사용자 질의가 미리 학습되어 있지 않은 경우에도, 유사도 기반으로 질의의 의도를 결정할 수 있다. 이때 entity 조합과 기존에 학습된 질의들과의 유사도를 통해 의도를 결정하여, 프레임워크를 점진적으로 학습한다. 이를 적용하여 연세대학교 정보들을 제공하는 챗봇을 개발하고, 실험을 통해 제안된 점진 학습 기법은 기존 시스템보다 다양한 종류의 질의 처리가 가능하고, 더욱 빠른 응답 속도를 나타내는 것을 확인하였다. 또한 사용자가 증가함에 따라 점진 학습을 통해 성능이 더욱 증가하는 자가 학습 모형으로서의 우수함을 확인하였다.

  • PDF