• 제목/요약/키워드: 키워드-기반 시스템

검색결과 519건 처리시간 0.028초

문서 말뭉치 기반 질의응답 시스템 (Text Corpus-based Question Answering System)

  • 김한준;김민경;장재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권3호
    • /
    • pp.375-383
    • /
    • 2010
  • 질의응답시스템을 구축하는데 있어서 사용자 질의로 입력된 자연어 문장을 문법적 또는 의미적으로 완벽하게 분석하는 작업과 그 질의에 대한 정확한 답변을 찾아내는 작업은 쉬운 일이 아니다. 본 논문에서는 질의응답시스템 구축의 난제를 극복하기 위해, 문서 말뭉치에 기반하여 질의문을 자동 생성, 저장하여 이를 키워드로 검색하는 새로운 방식의 시스템을 제안한다. 질의문 생성을 위한 기본 아이디어는 수집 문서의 주요 문장에 대해 고유명사인식 기술을 활용하여 사람, 사물, 장소, 시간 등의 고유명사를 인식한 후, 각 고유명사에 해당하는 자연어 질의문을 생성하는 것이다. 질의문은 두가지 유형인 단순형 및 문장구조유지형 질의문으로 구분한다. 시스템은 이렇게 준비된 질의문 데이터베이스를 가지고 입력된 검색 키워드에 대하여 관련 질의문과 답변을 쉽게 얻을 수 있다. 본 연구의 관건은 생성된 질의문이 명확한 해답을 도출할 수 있는 의미있는 질의문을 생성하는 것이다. 이를 위해 본 연구에서는 질의문의 원천이 되는 평서문장을 선별하는 원칙과 선별된 평서문으로부터 의미있는 질의문을 생성하는 방법론을 제시한다.

스마트 단말에서의 통역용 단기기억력 향상 훈련 시스템 (Smart device based short-term memory training system for interpretation)

  • 표지혜;안동혁
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권3호
    • /
    • pp.747-756
    • /
    • 2019
  • 통역을 학습하는 학생들은 수업 외에도 추가적인 학습 및 훈련을 수행한다. 동시통역 및 순차통역에서 두 언어의 구조가 다르기 때문에 통역가는 발표 내용을 빠르게 기억해야 한다. 단기 기억 향상을 위해서 통역을 학습하는 학생들은 메모리 훈련을 수행한다. 메모리 훈련은 파트너가 필요하기 때문에 학습 효율성이 저하되고 자가 학습이 불가능하다. 이를 해결하기 위해서 컴퓨터 기반의 단기 기억 훈련 시스템이 제안되었다. 지문 내 단어를 특수문자로 변경함으로써 학생들이 파트너 없이도 자가 학습이 가능하다. 하지만 컴퓨터는 휴대성이 떨어지기 때문에 외부에서는 학습 능률이 저하된다. 제거되는 단어보다 키워드로 제공하는 단어의 수가 더 많아서 학습 난이도가 저하된다. 이를 해결하기 위해서, 본 논문에서는 스마트 단말 기반의 문장구역 훈련 시스템을 제안하였다. 스마트 단말은 휴대성이 높아 학습의 제한이 없어 효율이 증가한다. 제안하는 훈련 시스템에서는 삭제되는 단어수가 키워드보다 더 많도록 하여 학습 난이도가 증가한다. 제안한 훈련 시스템을 구현하고 기능을 검증하였다.

개념지도 기반 P2P 콘텐츠 공유 시스템 (Concept Map based P2P contents sharing system)

  • 나고운;차재혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.223-225
    • /
    • 2004
  • 현재의 P2P 시스템은 특정한 분야에서는 성공을 거두고 있지만 지식과 정보 공유의 목적으로서는 활용되지 못하고 있다. 사용자가 웹에서 수집한 자료와 새로 생성한 지식 및 정보 콘텐츠들은 기존의 P2P시스템으로는 공유하기 힘든 몇 가지 이유가 있다. 그 이유 중 하나는 대부분의 P2P시스템은 사용자가 콘텐츠 각각에 대한 메타데이터를 작성하도록 하거나 키워드가 나타나도록 파일명을 수정하도록 요구하기 때문이다. 본 논문에서 제안하는 CONCEPT P2P는 P2P 환경에서 콘텐츠를 공유하는데 개념지도를 사용한다. 개념지도는 시간 소모적인 메타데이터 작성 작업에 대한 대안이 될 수 있기 때문이다 CONCEPT P2P는 로컬 파일 시스템에 수집하고 있는 관심 콘텐츠의 공유를 목적으로 한다. 사용자의 개념지도를 추출하여 개념지도로부터 콘텐츠 묶음을 검색하므로 무리한 수작업이 없이도 다양한 분야의 콘텐츠를 효과적으로 공유할 수 있도록 설계하였다. 또한 다른 사용자와 개념 네트워크를 형성하여 관심 개념에 의해서 클러스터링 되고 있는 복수개의 콘텐츠를 지속적으로 수집하고 배포하는 접근을 취하였다. 개념 지도를 기술하고 검색하는 부분에서는 RDF 기반의 시맨틱 웹 언어와 RDF 질의 언어인 QEL을 사용하였다.

  • PDF

위치 인식 기반 태깅 기술을 이용한 모바일 버스 안내 시스템 설계 및 구현 (Design and Implementation of Location-Aware Smart Bus Guide System using Social Tagging)

  • 신현정;윤혜진;창병모
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 춘계학술대회
    • /
    • pp.483-486
    • /
    • 2009
  • 본 연구의 목적은 사용자에 의한 정보를 이용하여 버스 정보 안내를 효율적으로 하는 시스템을 개발하는 것이다. 본 연구에서는 이를 위해 PDA를 사용하여 태깅 기술을 이용한 모바일 버스 안내 시스템을 개발하였다. 이 시스템은 관광객들에게 현재 위치를 기반으로 하여 버스 정류장을 안내하고 해당 정류장에 사용자 생산 정보를 태그로 등록하며, 등록된 정보를 이용하여 사용자에게 목적지까지의 경로를 안내한다. 사업자의 자세한 정보 등록이 가능하며, 사용자에게는 등록 정보 검색 시 간단한 키워드 만으로 해당 목적지에 대한 정보 안내 및 경로를 검색할 수 있도록 한다.

  • PDF

확장 불리언 질의에 대한 비용 기반 최적화 (Cost-based Optimization of Extended Boolean Queries)

  • 박병권
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.29-40
    • /
    • 2001
  • 본 논문에서는 역색인 파일을 미용하여 학장 불리언 질의를 처리할 때 최소 비용의 질의 처리 방법을 구해 주는 질의 최적화 알고리즘을 제시한다. 확장 불리언 질의를 처리하는 방법은 질의를 구성하는 키위드의 처리 순서에 따라 여러 가지가 있을 수 있으므로 확장 불리언 질의 최적화 문제는 결국 최적 키워드 처리 순서를 구하는 문제로 귀결된다. 본 논문에서는 이 문제가 데이터베이스 질의 최적화에서 최적 조인 순서를 구하는 문제와 구조적으로 유사함을 보이고 이 분야의 연구 결과를 이용하여 문제를 해결한다. 즉, 확장 불리언 질의 처리에 대한 비용 모델을 수립하고 키워드 선택률과 역색인 파일 접근 비용을 이용하여 키워드 순위 개념을 도입한 후 이를 이용하여 최적 키워드 처리 순서를 구하는 알고리즘을 도출한다. 그리고 도출한 질의 최적화 알고리즘의 최적성을 증명하고. 실험을 통하여 실제로 최소비용의 질의 처리 방법을 구함을 보이고, 질의 최적화를 하지 않을 경우와 비교하였을 때 그 성능이 월등히 우수함을 보인다. 본 논문에서 제시한 질의 최적화 알고리즘은 정보검색시스템의 질의 처리 성능 향상에 큰 기여를 하리라 믿는다.

  • PDF

키워드를 활용한 온톨로지 인스턴스 생성에 관한 연구 (A Study on Ontology Instance Generation Using Keywords)

  • 한광록;강현민;손석원
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권5호
    • /
    • pp.1-11
    • /
    • 2010
  • 시맨틱 웹의 성공 여부는 온톨로지 구축과 생성을 위해서 지식을 체계화하는 시맨틱 어노테이션에 달려있다. 그러므로 각 분야의 많은 지식 표현을 변환하여 온톨로지 인스턴스로 생성하기 위해서 시맨틱 어노테이션의 효율성이 중요하다. 본 논문에서는 기존 웹에서 시맨틱 어노테이션 작업을 통하여 온톨로지 인스턴스를 정확하고 효율적으로 생성하는 규칙기반 온톨로지 인스턴스 생성 시스템을 제안한다. 기존연구에서는 사용자가 관련 정보를 찾아서 온톨로지와 대조하여 정보를 입력하는 수동적인 과정이 필요하였다. 그러나 제안한 방식에서는 추출할 정보들에 관한 키워드 데이터와 규칙정보를 분할해서 관리한다. 따라서 소수의 키워드와 규칙정보들을 추가함으로써 다양한 웹문서의 효율적 정보 추출이 가능하다. 이것은 여러 사이트에서 규칙과 키워드를 재사용할 수 있는 온톨로지 인스턴스 생성이 가능하다는 것을 보여준다.

Interactive Morphological Analysis to Improve Accuracy of Keyword Extraction Based on Cohesion Scoring

  • Yu, Yang Woo;Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.145-153
    • /
    • 2020
  • 최근 소셜 빅데이터를 대상으로 한 키워드 분석은 고객 관점의 의견이나 불만 사항을 추출하기 위한 목적으로 광범위하게 활용되고 있다. 이와 관련하여, 이전 연구에서는 키워드 분석의 정확도를 높이기 위해 응집도 점수를 활용한 방법을 제안하였으나, 리뷰의 수가 적을 경우 오류율이 증가하는 문제가 있었다. 본 논문에서는 응집도 점수 기반 알고리즘으로부터 추출된 키워드에 대해 간소화된 형태소 분석 단계를 후처리 형태로 적용함으로써 키워드 추출의 정확도를 개선하고자 하였다. 제안 방법은 입력 데이터가 주어질 때마다 필요한 형태소 분석 규칙을 점증적으로 추가할 수 있도록 지원함으로써, 사전의 크기를 최소화하고 분석의 효율을 높이고자 하였다. 또한 대화형 규칙 입력 시스템을 제공하여 분석 규칙 추가에 드는 노력을 최소화하고자 하였다. 제안 방법을 검증하기 위해 온라인에서 수집된 실제 리뷰를 대상으로 실험을 수행하였으며, 제안 방법을 적용할 경우 오류율이 기존 10%에서 1%로 개선되는 동시에, 5,000개의 리뷰 처리에 450ms가 소요되어 실시간 처리가 가능한 수준임을 확인하였다.

시멘틱 검색시스템 구축을 위한 요구사항 분석 및 설계에 관한 연구 (A Study on Analysis of Requirements and Design of IR System for Semantic-based Information Retrieval)

  • 김용
    • 한국비블리아학회지
    • /
    • 제23권1호
    • /
    • pp.91-111
    • /
    • 2012
  • 웹 정보의 폭발적인 성장과 함께, 단순히 한 두 개의 키워드의 입력에 따른 검색은 너무 많은 검색결과를 가져오게 되기 때문에 전통적인 정보검색기법은 이용자들에게 있어서 만족할 수 없는 결과를 제공하고 있다. 본 연구에서는 정보에 대한 의미를 기반으로 정보검색의 질적 향상을 위한 기술의 개발을 목표로 하고 있다. 이를 위하여 시멘틱 웹 기술에서 요구되는 시멘틱 기반 검색에 대한 최근의 연구동향 및 기술을 분석하여 시멘틱 기반 검색시스템에서 요구사항을 파악하고, 지능형 검색시스템의 아키텍처, 시멘틱 검색 서비스 개발 과정과 핵심기술 등을 살펴보았다. 분석결과와 함께, 시멘틱 기반 정보검색 시스템의 전체적인 아키텍처에 대한 설계 및 요구사항을 제안하였다.

장면전환검출과 사용자 프로파일을 이용한 비디오 학습 평가 시스템 (Video Evaluation System Using Scene Change Detection and User Profile)

  • 신성윤
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.95-104
    • /
    • 2004
  • 본 논문에서는 사용자 프로파일을 기반으로 한 정보 필터링을 사용하여 학생 개인의 특성에 맞는 효율적인 원격 비디오 학습 평가 시스템을 제안한다. 비디오를 이용한 문제 출제를 위하여 위치, 크기, 그리고 컬러 정보를 기반으로 키 프레임을 추출하고 그레이 레벨 히스토그램 차이와 시간 윈도우를 이용하여 문제 출제 추간을 추출한다. 또한 효율적인 평가를 위하여 카테고리 기반 시스템과 키워드 기반 시스템을 합성하여 문제를 출제하도록 한다. 따라서 학생들은 부족한 영역을 보충하고 관심 있는 영역을 유지하면서 학업 성취도를 향상시킬 수 있다.

심층적 의미 매칭을 이용한 cQA 시스템 질문 검색 (Question Retrieval using Deep Semantic Matching for Community Question Answering)

  • 김선훈;장헌석;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.116-121
    • /
    • 2017
  • cQA(Community-based Question Answering) 시스템은 온라인 커뮤니티를 통해 사용자들이 질문을 남기고 답변을 작성할 수 있도록 만들어진 시스템이다. 신규 질문이 인입되면, 기존에 축적된 cQA 저장소에서 해당 질문과 가장 유사한 질문을 검색하고, 그 질문에 대한 답변을 신규 질문에 대한 답변으로 대체할 수 있다. 하지만, 키워드 매칭을 사용하는 전통적인 검색 방식으로는 문장에 내재된 의미들을 이용할 수 없다는 한계가 있다. 이를 극복하기 위해서는 의미적으로 동일한 문장들로 학습이 되어야 하지만, 이러한 데이터를 대량으로 확보하기에는 어려움이 있다. 본 논문에서는 질문이 제목과 내용으로 분리되어 있는 대량의 cQA 셋에서, 질문 제목과 내용을 의미 벡터 공간으로 사상하고 두 벡터의 상대적 거리가 가깝게 되도록 학습함으로써 의사(pseudo) 유사 의미의 성질을 내재화 하였다. 또한, 질문 제목과 내용의 의미 벡터 표현(representation)을 위하여, semi-training word embedding과 CNN(Convolutional Neural Network)을 이용한 딥러닝 기법을 제안하였다. 유사 질문 검색 실험 결과, 제안 모델을 이용한 검색이 키워드 매칭 기반 검색보다 좋은 성능을 보였다.

  • PDF