• 제목/요약/키워드: 키워드-기반 시스템

검색결과 517건 처리시간 0.037초

Webtoon Search utilizing Genre Similarity with Word2Vec (Word2Vec 기반 장르 유사성을 활용한 웹툰 검색)

  • Lee, ChangMin;Ahn, JeJeong;Kang, DongYeon;Lee, Hyunah
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.503-505
    • /
    • 2019
  • 본 논문에서는 기존 웹툰 장르 검색 시스템의 단점을 보완하기 위해 키워드 기반 유사 장르 검색 시스템을 제안한다. 기존 웹툰의 장르와 키워드를 분석하여 44개의 장르를 설정하고 해당 장르에 적합한 웹툰을 수집한다. 나무위키와 위키피디아 문서로 학습된 Word2Vec모델에 기반하여 계산한 사용자 입력 키워드와 44개의 장르간 유사도로 사용자 입력에 가장 유사한 장르를 찾는다. 유사 장르에 포함되는 웹툰을 결과로 출력하여 사용자가 선호하는 장르의 웹툰을 제시한다. 실험 결과에서는 나무위키에서 '장르'로 검색하여 얻는 작은 크기의 문서 집합에서 Word2Vec을 학습한 모델에서 가장 높은 검색 성능을 보였다.

  • PDF

Implementation of Web Based Video Learning Evaluation System Using User Profiles (사용자 프로파일을 이용한 웹 기반 비디오 학습 평가 시스템의 구현)

  • Shin Seong-Yoon;Kang Il-Ko;Lee Yang-Won
    • Journal of the Korea Society of Computer and Information
    • /
    • 제10권6호
    • /
    • pp.137-152
    • /
    • 2005
  • In this Paper, we Propose an efficient web-based video learning evaluation system that is tailored to individual student's characteristics through the use of user profile-based information filtering. As a means of giving video-based questions, keyframes are extracted based on the location, size, and color information, and question-making intervals are extracted by means of differences in gray-level histograms as well as time windows. In addition, through a combination of the category-based system and the keyword-based system, questions for examination are given in order to ensure efficient evaluation. Therefore, students can enhance school achievement by making up for weak areas while continuing to identify their areas of interest.

  • PDF

Keyword Extraction Using Syntactic Information of Question (질의문의 구문정보를 이용한 키워드 추출)

  • 양수정;서영훈
    • Proceedings of the Korea Contents Association Conference
    • /
    • 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
    • /
    • pp.190-194
    • /
    • 2003
  • 자연언어 질의문에서 추출된 키워드들은 정답추출에 미치는 비중이 다른 경우가 많지만 키워드들에 대해 상대적인 가중치를 부여하기가 어렵다. 본 논문에서는 이러한 문제점을 해결하기 위하여 질의 문장의 구문 정보를 이용하여 중심키워드와 일반키워드들로 구분하였으며 이를 기반으로 키워드들 간의 가중치 부여 방법을 제안한다. 질의문 코퍼스로부터 질문 유형을 분석하여 구문을 추출하고 추출된 구문정보를 이용하여 질의문에서 키워드들을 추출한다. 이렇게 얻어진 키워드들을 이용하여 다량의 문서들 속에서 중심키워드와 일반키워드들 간의 불린 검색을 통해 질의문의 정답이 포함되었을 가능성이 큰 단락을 추출하고, 질의문과 추출된 단락간의 유사도 측정을 통해 단락을 순위화 한다. 본 논문에서 제안하는 시스템은 질의문의 정답이 포함된 단락추출에 대한 정확도를 향상시킬 것으로 기대된다.

  • PDF

Contextual Advertisement System based on Document Clustering (문서 클러스터링을 이용한 문맥 광고 시스템)

  • Lee, Dong-Kwang;Kang, In-Ho;An, Dong-Un
    • The KIPS Transactions:PartB
    • /
    • 제15B권1호
    • /
    • pp.73-80
    • /
    • 2008
  • In this paper, an advertisement-keyword finding method using document clustering is proposed to solve problems by ambiguous words and incorrect identification of main keywords. News articles that have similar contents and the same advertisement-keywords are clustered to construct the contextual information of advertisement-keywords. In addition to news articles, the web page and summary of a product are also used to construct the contextual information. The given document is classified as one of the news article clusters, and then cluster-relevant advertisement-keywords are used to identify keywords in the document. We could achieve 21% precision improvement by our proposed method.

A Query-aware Dialog Model for Open-domain Dialog (입력 발화의 키워드를 반영하는 응답을 생성하는 대화 모델)

  • Lim, Yeon-Soo;Kim, So-Eon;Kim, Bong-Min;Jung, Heejae;Park, Seong-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.274-279
    • /
    • 2020
  • 대화 시스템은 사용자의 입력 발화에 대해 적절하고 의미 있는 응답을 생성하는 시스템으로 seq2seq 구조를 갖는 대화 모델이 주로 연구되고 있다. 그러나 seq2seq 기반 대화 모델은 입력 발화와 관련성이 떨어지는 응답을 생성하거나 모든 입력 발화와 어울리지만 무미건조한 응답을 생성하는 문제가 있다. 본 논문에서는 이를 해결하기 위해 입력 발화에서 고려해야 하는 키워드를 찾고 그 키워드를 반영하는 응답을 생성하는 모델을 제안한다. 제안 모델은 주어진 입력 발화에서 self-attention을 사용해 각 토큰에 대한 키워드 점수를 구한다. 키워드 점수가 가장 높은 토큰을 대화의 주제 또는 핵심 내용을 포함하는 키워드로 정의하고 응답 생성 과정에서 키워드와 관련된 응답을 생성하도록 한다. 본 논문에서 제안한 대화 모델의 실험 결과 문법과 입력 발화와 생성한 응답의 관련성 측면에서 성능이 향상되었음을 알 수 있었다. 특히 관련성 점수는 본 논문에서 제안한 모델이 비교 모델보다 약 0.25점 상승했다. 실험 결과를 통해 본 논문이 제안한 모델의 우수성을 확인하였다.

  • PDF

Design and Implementation of a Content-Based Multimedia Information Retrieval System for Cyber Museums (사이버 박물관을 위한 내용 기반 멀티키디어 정보검색 시스템의 설계 및 구현)

  • Sim, Chun-Bo;Song, Gwang-Taek;Jang, Jae-U
    • Journal of KIISE:Computing Practices and Letters
    • /
    • 제5권1호
    • /
    • pp.88-98
    • /
    • 1999
  • 사이버 박물관과 같은 응용 분야에서는 기존의 단순 속성, 텍스트 키워드 검색 이외에 색상, 형태, 질감과 같은 이미지 특징을 기반으로 하는 효율적인 내용-기반 검색이 요구된다. 본 논문에서는 사이버 박물관을위한 내용-기반 멀티미디어 정보검색 시스템을 설계 및 구현한다. 이를 위해, 박물관 문화재중에서 특히 도자기 이미지 객체에 대해 색상과 형태에 기반한 효율적인 이미지 특징벡터 추출방법을 제안한다. 아울러, 단순 속성 검색에대해서는 B+-트리, 텍스트 키워드 검색에 대해서는 역화일 기법, 그리고 이미지 특징 검색에 대해서는 TV-트리(Telescopic Vector)를 지원하는 통합 검색 기법을 제안한다. 그리고 UNIX OS와 X11R5 라이브러리 환경에서 표준 C 언어를 사용하여 내용 -기반 멀티미디어 정보검색 시스템을 구현한다.

Content-based Image Retrieval Using Region Color and Keyword (영역 색상과 키워드를 이용한 내용기반 영상검색)

  • 김지영;정성호;황병곤
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 한국산업정보학회 1999년도 춘계학술대회 발표논문집
    • /
    • pp.68-74
    • /
    • 1999
  • 본 논문에서는 영상의 내용을 나타내는 키워드를 이용하는 기존의 텍스트 기반 영상 검색과 영역 색상 정보를 이용한 내용 기반 영상 검색을 결합한 시스템을 구현함으로서, 보다 효과적인 영상 검색을 할 수 있도록 하였다. 영상의 크기는 입력된 원 영상을 사용하였으며, 색상 정보 추출에 있어 HSI 공간으로 변환하여 256개의 칼라로 양자화하였다. 보통의 정지 영상의 경우 대부분의 객체가 중앙에 있을 경우를 고려하여, 영상을 중앙 영역과 배경 영역으로 구분하고, 각각의 영역에서 두 개의 히스토그램을 생성한다. 중앙 영역과 배경영역의 히스토그램 인터섹션을 이용한 검색을 실험하였고, 영역색상과 기존의 키워드를 결합한 검색도 또한 실험하였다. 기존의 히스토그램 인터섹션의 경우 Precision/Recall이 0.34/0.60인데 비해 영역 색상 히스토그램을 인터섹션한 경우의 Precision/Recall은 0.69/0.76이고 키워드를 결합한 경우의 Precision/Recall은 0.92/0.80를 얻음으로써, 제안된 방식의 검색이 비교적 효율적임을 보였다.

  • PDF

A Study on Keywords Extraction based on Semantic Analysis of Document (문서의 의미론적 분석에 기반한 키워드 추출에 관한 연구)

  • Song, Min-Kyu;Bae, Il-Ju;Lee, Soo-Hong;Park, Ji-Hyung
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 한국지능정보시스템학회 2007년도 추계학술대회
    • /
    • pp.586-591
    • /
    • 2007
  • 지식 관리 시스템, 정보 검색 시스템, 그리고 전자 도서관 시스템 등의 문서를 다루는 시스템에서는 문서의 구조화 및 문서의 저장이 필요하다. 문서에 담겨있는 정보를 추출하기 위해 가장 우선시되어야 하는 것은 키워드의 선별이다. 기존 연구에서 가장 널리 사용된 알고리즘은 단어의 사용 빈도를 체크하는 TF(Term Frequency)와 IDF(Inverted Document Frequency)를 활용하는 TF-IDF 방법이다. 그러나 TF-IDF 방법은 문서의 의미를 반영하지 못하는 한계가 존재한다. 이를 보완하기 위하여 본 연구에서는 세 가지 방법을 활용한다. 첫 번째는 문헌 속에서의 단어의 위치 및 서론, 결론 등의 특정 부분에 사용된 단어의 활용도를 체크하는 문헌구조적 기법이고, 두 번째는 강조 표현, 비교 표현 등의 특정 사용 문구를 통제 어휘로 지정하여 활용하는 방법이다. 마지막으로 어휘의 사전적 의미를 분석하여 이를 메타데이터로 활용하는 방법인 언어학적 기법이 해당된다. 이를 통하여 키워드 추출 과정에서 문서의 의미 분석도 수행하여 키워드 추출의 효율을 높일 수 있다.

  • PDF

Design and Evaluation of an Individual Instance-based Ontology Retrieval System for Archival Records of the "Saemaul Movement" (새마을운동 기록물의 개체기반 온톨로지 검색시스템 설계 및 평가)

  • Lee, Byung Gil;Kim, Heesop
    • Journal of Korean Society of Archives and Records Management
    • /
    • 제13권3호
    • /
    • pp.67-97
    • /
    • 2013
  • The purpose of this study is to design and evaluate an individual instance-based ontology retrieval system for archival records of the "Saemaul Movement". We used Protege editor 4.1 to design an individual instance-based ontology. To evaluate the proposed ontology retrieval system, five short queries and ten narrative queries were used and compared their precision and recall against the NARA keyword-based retrieval system. The performance results showed that the individual-based ontology retrieval system outperformed the keyword-based retrieval system in terms of the measurement of precision and recall.

Music Recommendation System Based on User Preference Analysis Using Hidden Markov Model (은닉 마코프 모델을 이용한 사용자 선호도 분석 기반의 음악 추천 시스템)

  • Kim, Geon-Su;Lee, Dong-Hun;Yun, Tae-Bok;Lee, Ji-Hyeong
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.56-59
    • /
    • 2008
  • 현재의 음악 서비스들의 대부분은 음악을 가수 이름이나 장르와 같은 키워드들로 구분하여 사용자에게 제공한다. 하지만 음악의 장르가 다양해지고, 장르별로 음악의 유형도 다양해짐에 따라 키워드 기반은 음악 제공 방법만으로는 사용자가 원하는 음악을 제공하는데 한계가 있다. 이런 한계점을 극복하기 위하여 음악 자체의 성질을 기반으로 음악을 분석하는 컨텐츠 기반의 음악 분석 방법이 필요하다. 또한 사용자가 원하는 음악을 제공 받을 수 있도록 사용자의 음악 선호도를 분석하여 그에 맞는 음악을 제공하는 방법도 필요하다. 본 논문에서는 음악의 시퀀스 정보와 특징을 추출하여 음악 모델을 구축하고, 이를 사용하여 사용자의 음악 선호도를 분석하는 방법을 제안하고, 사용자의 선호도에 맞는 음악을 제공하기 위하여 선호도 분석 방법을 통해 음악을 추천해주는 시스템을 제안한다.

  • PDF