• Title/Summary/Keyword: 주제 기반

Search Result 1,743, Processing Time 0.038 seconds

A Topic Classification System in cQA Services Based on Semi-Automatic Learning Using Wikipedia (위키피디아를 이용한 반자동 학습 기반의 cQA 서비스 주제 분류 시스템)

  • Kim, Taehyun
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.139-141
    • /
    • 2015
  • 본 논문은 커뮤니티 기반의 질의-응답 서비스에서 사용자 질의의 주제를 분류하는 시스템을 소개한다. 커뮤니티 기반의 질의-응답 서비스는 분야에 따라 다양한 주제를 가질 수 있으며 오늘 날 사용자 질의의 주제 분류에는 통계 기반의 분류 방법이 많이 이용되고 있다. 통계 기반의 분류 방법으로 사용자 질의를 분류하기 위해서는 주제에 적합한 대량의 학습 말뭉치가 필요하다. 주제에 적합한 대량의 학습 말뭉치를 사람이 직접 구축하는 것은 많은 시간과 비용이 든다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 위키피디아 문서를 Supervised K-means Clustering 기법으로 주제별로 분류함으로써 학습 말뭉치를 반자동으로 구축하는 방법을 제안한다. 그 다음, 생성된 학습 말뭉치로 지지 벡터 기계를 학습하여 사용자 질의의 주제를 분류하게 된다. 위키피디아 문서와 사용자 질의는 다른 도메인의 문서임에도 불구하고 본 논문의 시스템으로 사용자 질의의 주제를 분류한 결과 77.33%의 정확도를 보였다.

  • PDF

Application Plans of Thematic Overlap Function in Electronic Cultural Atlas (전자문화지도에서의 주제별 중첩 기능 활용 방안)

  • Lee, Dong-yul;Kang, Ji-hoon;Moon, Sang-ho
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2014.10a
    • /
    • pp.445-447
    • /
    • 2014
  • 최근에 전자문화지도에 대한 관심이 늘어나면서 다양한 주제를 기반으로 한 전자문화지도들이 연구 및 개발되고 있는 추세이다. 그러나 기존의 전자문화지도들은 대부분 단일 주제로 제작되므로 주제들 간의 연관성 분석이 어렵고, 전자문화지도들이 서로 연계되어 있지 않아 다양한 관점을 기반으로 한 활용이 미흡한 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 하나의 전자문화지도에 레이어 기능을 활용하여 다양한 주제들을 표현하는 방안을 제시한다. 또한, 이를 기반으로 전자문화지도에서의 주제별 중첩 기능을 활용하여 주제들 간의 연계 관계를 효율적으로 파악하고 다양한 주제들의 연관 관계를 통해 새로운 지식을 도출해 낼 수 있는 활용 방안을 제시하고자 한다.

  • PDF

Korean Generative Chatbot using Topic Embedding (주제 임베딩을 활용한 한국어 생성 기반 챗봇)

  • Oh, Shinhyeok;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.524-528
    • /
    • 2020
  • 챗봇은 발화에 대해 컴퓨터가 자동으로 응답하는 시스템이다. 현재 챗봇은 전체 주제에 대한 잡담(chit-chat)보다는 특정 주제에 관한 대화를 목적으로 많이 개발되고 있다. 하지만 개개인이 필요로 하는 챗봇 용도에 적합한 학습 데이터는 부족하다. 이러한 상황에서 챗봇 학습을 위해 필요한 주제의 말뭉치를 대량으로 구축하는 것은 시간과 비용이 많이 소모되어 현실적으로 어렵다. 따라서 학습에 필요한 소량의 말뭉치만 사용하더라도 주제에 적합한 응답을 할 수 있는 챗봇이 필요하다. 이에 본 논문은 챗봇의 목적과 관련 없는 대량의 말뭉치와 소량의 주제 기반 말뭉치를 이용하여 높은 성능을 끌어낼 수 있는 주제 임베딩 방법을 제안한다.

  • PDF

Analysis of Word Based Classification of U.S. Public Libraries and its Implications (주제어 기반 분류에 관한 연구 - 미국 공공도서관의 사례를 중심으로 -)

  • Baek, Ji-Won
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.44 no.4
    • /
    • pp.179-201
    • /
    • 2010
  • This study aims to analyze the word based classification used in U.S. public libraries and their implications for Korean libraries. For this purpose, eleven U.S. public libraries using the word based classification system were selected and the specific classification types, their motivation, collection size, methods used in the conversion from DDC, and pros and cons were examined. The result of the analysis shows that the word based classification system may be categorized into the two types: Dewey-free or Dewey-lite and its application methods are different case by case. As a result, the positive impacts and implied problems of the word based classification system for library use and library operation were examined. In addition, the new system's implications on the Korean libraries were also discussed.

Subject Based Classification: Conceptualization and the Development Plan as a Classificatory System (주제어기반 분류의 분류론적 개념 정립 및 발전 방안 - 발전과정 및 기능 분석을 통하여 -)

  • Baek, Ji-Won
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.23 no.4
    • /
    • pp.5-24
    • /
    • 2012
  • The aim of this study is 1) to analyse the historical development and current condition of the subject based classification(SBC), 2) to clarify the function and to categorize the specific kind of SBC, for its conceptualization and the development plan. For this purpose, almost 30 cases, for the period 1937 through now, were analyzed concerning their terms used in the names and the specific kinds as SBC. In addition, the analysis was made regarding how the SBC fulfill the selected main functions as a classificatory scheme and how SBC is inter-related with the other knowledge organization systems(KOS) such as classification and subject heading. Based on the above analysis, the conclusion addressed that SBC could be defined in consideration of the detailed function, type, information environment, and interconnection among the KOS, and suggested the future development plan of SBC as a classification scheme.

Design of Web-based Project Learning Models in Computer Education (컴퓨터 교육을 위한 웹 기반 프로젝트 학습 설계 모형 탐색)

  • Jang, Young-Jin;Lee, Mi-Wha
    • 한국정보교육학회:학술대회논문집
    • /
    • 2006.01a
    • /
    • pp.249-254
    • /
    • 2006
  • 본 연구는 초등학교 컴퓨터 교과의 제재를 주제로 한 웹 기반 프로젝트 학습을 설계하는데 목적이 있다. 이에 따라 본 연구에서는 프로젝트 학습과 웹 기반 프로젝트 학습에 대한 제이론을 고찰하고 이를 바탕으로 웹 기반 프로젝트 학습 모형을 설계하여 초등학교 컴퓨터 교과의 주제를 중심으로 웹 기반 프로젝트 학습을 설계하였다. 설계 단원은 초등학교 6학년 컴퓨터 교과(재량교과)의 '정보의 이해와 윤리', '컴퓨터 기초', '소프트웨어의 활용' 영역을 예비 학습으로 학습하고, 주제별로 그룹별 프로젝트 활동을 함으로써 학습자 중심의 학습이 가능하도록 하였다.

  • PDF

LSTM based Language Model for Topic-focused Sentence Generation (문서 주제에 따른 문장 생성을 위한 LSTM 기반 언어 학습 모델)

  • Kim, Dahae;Lee, Jee-Hyong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.07a
    • /
    • pp.17-20
    • /
    • 2016
  • 딥러닝 기법이 발달함에 따라 텍스트에 내재된 의미 및 구문을 어떠한 벡터 공간 상에 표현하기 위한 언어 모델이 활발히 연구되어 왔다. 이를 통해 자연어 처리를 기반으로 하는 감성 분석 및 문서 분류, 기계 번역 등의 분야가 진보되었다. 그러나 대부분의 언어 모델들은 텍스트에 나타나는 단어들의 일반적인 패턴을 학습하는 것을 기반으로 하기 때문에, 문서 요약이나 스토리텔링, 의역된 문장 판별 등과 같이 보다 고도화된 자연어의 이해를 필요로 하는 연구들의 경우 주어진 텍스트의 주제 및 의미를 고려하기에 한계점이 있다. 이와 같은 한계점을 고려하기 위하여, 본 연구에서는 기존의 LSTM 모델을 변형하여 문서 주제와 해당 주제에서 단어가 가지는 문맥적인 의미를 단어 벡터 표현에 반영할 수 있는 새로운 언어 학습 모델을 제안하고, 본 제안 모델이 문서의 주제를 고려하여 문장을 자동으로 생성할 수 있음을 보이고자 한다.

  • PDF

Topic Keyword Common Representation Model Based on Ontology for Semantic Web Services (시맨틱 웹 서비스를 위한 온톨로지 기반 주제어 공통 표현 모델)

  • Jung, Hanmin;Kim, Pyung;Lee, MI-Kyoung;Sung, Won-Kyung
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.103-108
    • /
    • 2008
  • 주제어는 정보 서비스를 비롯한 여러 응용 분야들에서 유용하게 사용되는 지식이지만, 주제어 간 관계가 다양할 뿐만 아니라 목적에 맞도록 개별적으로 설계됨으로써 주제어 관계 속성 유형과 무관하게 공유가 가능한 주제어 공통 표현 모델이 제시되지 못하였다. 본 연구는 응용 분야, 온톨로지 종류와 무관하게 적용될 수 있으며 시맨틱 웹 서비스 간 공유가 가능한 주제어 공통 표현 모델을 제시하고자 한다. 이를 위해, 주제어 관계를 범용 클래스로 정의하고, 주제어 관계 속성 유형을 데이터타입 속성 (Datatype Property)으로 선언하였다. 또한, 주제어 역시 그 속성 유형을 데이터타입 속성으로 선언하였는데, 결국 다양한 유형의 관계들을 용이하게 표현할 수 있도록 하기 위한 것이다. 실험을 위해 주제어 간 관계수가 70,804,233개이며 주제어 관계 속성 유형이 4가지인 과학 기술 기반 정보 온톨로지와 주제어 간 관계수가 44,147개이며 주제어 관계 속성 유형이 13가지인 표준 정보 온톨로지를 대상으로 본 연구에서 제안한 주제어 공통 표현 모델을 적용하였으며 총 284,744,802개의 RDF(Resource Description Framework) Triple을 생성하였다.

  • PDF

A Study on the Role Model of Subject Specialization in Academic Libraries (지식기반시대 대학도서관의 주제전문화 역할 방향에 관한 연구)

  • Jeong, Dong-Youl
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.36 no.3
    • /
    • pp.5-23
    • /
    • 2002
  • With the rapid change of information environment, this study suggests role models and strategies for the university library in Korea based on the subject specialization. By analyzing the current situation and problems of university library, this research presents various directions for the subject specialization. Major research issues are (1) university library's subject specialization directions, models, and factors, (2) subject specialized librarian' s role and education system, (3) basic framework for customized information service and user education, (4) enhancement of subject specialization through subject gateway, (5) academic information sharing system.

A Topic Classification System Based on Clue Expressions for Person-Related Questions and Passages (단서표현 기반의 인물관련 질의-응답문 문장 주제 분류 시스템)

  • Lee, Gyoung Ho;Lee, Kong Joo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.4 no.12
    • /
    • pp.577-584
    • /
    • 2015
  • In general, Q&A system retrieves passages by matching terms of a question in order to find an answer to the question. However it is difficult for Q&A system to find a correct answer because too many passages are retrieved and matching using terms is not enough to rank them according to their relevancy to a question. To alleviate this problem, we introduce a topic for a sentence, and adopt it for ranking in Q&A system. We define a set of person-related topic class and a clue expression which can indicate a topic of a sentence. A topic classification system proposed in this paper can determine a target topic for an input sentence by using clue expressions, which are manually collected from a corpus. We explain an architecture of the topic classification system and evaluate the performance of the components of this system.