• Title/Summary/Keyword: 주제문

Search Result 190, Processing Time 0.025 seconds

Keyword Network Visualization for Text Summarization and Comparative Analysis (문서 요약 및 비교분석을 위한 주제어 네트워크 가시화)

  • Kim, Kyeong-rim;Lee, Da-yeong;Cho, Hwan-Gue
    • Journal of KIISE
    • /
    • v.44 no.2
    • /
    • pp.139-147
    • /
    • 2017
  • Most of the information prevailing in the Internet space consists of textual information. So one of the main topics regarding the huge document analyses that are required in the "big data" era is the development of an automated understanding system for textual data; accordingly, the automation of the keyword extraction for text summarization and abstraction is a typical research problem. But the simple listing of a few keywords is insufficient to reveal the complex semantic structures of the general texts. In this paper, a text-visualization method that constructs a graph by computing the related degrees from the selected keywords of the target text is developed; therefore, two construction models that provide the edge relation are proposed for the computing of the relation degree among keywords, as follows: influence-interval model and word- distance model. The finally visualized graph from the keyword-derived edge relation is more flexible and useful for the display of the meaning structure of the target text; furthermore, this abstract graph enables a fast and easy understanding of the target text. The authors' experiment showed that the proposed abstract-graph model is superior to the keyword list for the attainment of a semantic and comparitive understanding of text.

A Comparative Analysis of Subject Headings Related to Korea in the CCT and NDLSH (『중국분류주제사표(中国分类主题词表)』와 『국립국회도서관건명표목표(国立国会図書館件名標目表)』에 나타난 한국 관련 주제명표목에 대한 비교 분석)

  • Moon, Ji-Hyun
    • Journal of Korean Library and Information Science Society
    • /
    • v.43 no.3
    • /
    • pp.121-141
    • /
    • 2012
  • This study compares and analyzes the numbers and characteristics of Korea-related subjects included in the 2008 Japanese edition of the National Diet Library Subject Headings (NDLSH) and the $2^{nd}$ edition of the Chinese Classified Thesaurus(CCT). The analysis results show that 258 subjects, approximately twice as many as 137 subjects in CCT, were found in NDLSH. There are more pure subjects that exclude the references in CCT than in NDLSH. On the other hand, much more subjects are found in NDLSH in the event that personal names, corporate headings, and subjects combined with detailed headings are included. Meanwhile, more subjects are relatively engaged in the fields of politics, diplomacy, and military in CCT because CCT is characterized by socialism and by being a pro-North Korea. Moreover, the considerable numbers of subjects reflecting North Korea's viewpoint are included in CCT. NDLSH changed only recently the names of both South and North Korea into the "Republic of Korea" and the "Democratic People's Republic of Korea", respectively. On the other hand, CCT more frequently uses "Joseon" than "Korea", and the distinction between the names is unclear. CCT thoroughly supports the stance of the developed country, directly involved in the disputable subjects between two countries such as "Dokdo", "the East Sea", "Dumangang", and "Baekdusan". Both heading lists consider "Balhae" as part of Chinese history in CCT, which has ignored the position of Korea.

A Study on the Connecting Method of Query and Legal Cases Using Doc2Vec Document Embedding (Doc2Vec 문서 임베딩을 이용한 질의문과 판례 자동 연결 방안 연구)

  • Kang, Ye-Jee;Kang, Hye-Rin;Park, Seo-Yoon;Jang, Yeon-Ji;Kim, Han-Saem
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.76-81
    • /
    • 2020
  • 법률 전문 지식이 없는 사람들이 법률 정보 검색을 성공적으로 하기 위해서는 일반 용어를 검색하더라도 전문 용어가 사용된 법령정보가 검색되어야 한다. 하지만 현 판례 검색 시스템은 사용자 선호도 검색이 불가능하며, 일반 용어를 사용하여 검색하면 사용자가 원하는 전문 자료를 도출하는 데 어려움이 있다. 이에 본 논문에서는 일반용어가 사용된 질의문과 전문용어가 사용된 판례를 자동으로 연결해 주고자 하였다. 질의문과 연관된 판례를 자동으로 연결해 주기 위해 전문용어가 사용된 전문가 답변을 바탕으로 문서분류에 높은 성능을 보이는 Doc2Vec을 이용한다. Doc2Vec 문서 임베딩 기법을 이용하여 전문용어가 사용된 전문가 답변과 유사한 답변을 제안하여 비슷한 주제의 답변들끼리 분류하였다. 또한 전문가 답변과 유사도가 높은 판례를 제안하여 질의문에 해당하는 판례를 자동으로 연결하였다.

  • PDF

Similar Question Search System for online Q&A for the Korean Language Based on Topic Classification (온라인가나다를 위한 주제 분류 기반 유사 질문 검색 시스템)

  • Mun, Jung-Min;Song, Yeong-Ho;Jin, Ji-Hwan;Lee, Hyun-Seob;Lee, Hyun Ah
    • Korean Journal of Cognitive Science
    • /
    • v.26 no.3
    • /
    • pp.263-278
    • /
    • 2015
  • Online Q&A for the National Institute of the Korean Language provides expert's answers for questions about the Korean language, in which many similar questions are repeatedly posted like other Q&A boards. So, if a system automatically finds questions that are similar to a user's question, it can immediately provide users with recommendable answers to their question and prevent experts from wasting time to answer to similar questions repeatedly. In this paper, we set 5 classes of questions based on its topic which are frequently asked, and propose to classify questions to those classes. Our system searches similar questions by combining topic similarity, vector similarity and sequence similarity. Experiment shows that our method improves search correctness with topic classification. In experiment, Mean Reciprocal Rank(MRR) of our system is 0.756, and precision for the first result is 68.31% and precision for top five results is 87.32%.

An Automatic Classification of Discourse Relations in the Arguing Structure of Korean Texts (한국어 텍스트의 논증 구조 내 담화 관계의 자동 분류 연구)

  • Lee, Sana;Shin, Hyopil
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.59-64
    • /
    • 2015
  • 최근 온라인 텍스트 자료를 이용하여 대중의 의견을 분석하는 작업이 활발히 이루어지고 있다. 이러한 작업에는 주관적 방향성을 갖는 텍스트의 논증 구조와 중요 내용을 파악하는 과정이 필요하며, 자료의 양과 다양성이 급격히 증가하면서 그 과정의 자동화가 불가피해지고 있다. 본 연구에서는 정책에 대한 찬반 의견으로 구성된 한국어 텍스트 자료를 직접 구축하고, 글을 구성하는 기본 단위들 사이의 담화 관계를 정의하였다. 각 단위들 사이의 관계는 기계학습과 규칙 기반 방식을 이용하여 예측되고, 그 결과는 합성되어 하나의 글에 대응되는 트리 구조를 이룬다. 또한 텍스트의 구조상에서 주제문을 직접적으로 뒷받침하는 문장 혹은 절을 추출하여 글의 중요 내용을 얻고자 하였다.

  • PDF

Text Summarization with Abductive Rules and Sentence Abstraction (개연성 규칙과 문장추상화를 활용한 문서요약)

  • Kim, Gon;Bae, Jae-Hak
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.359-362
    • /
    • 2002
  • 본 논문에서는 문장추상화와 문장간 개연적 연결상황을 활용한 문단 기준의 문서요약을 생각하였다. 구상한 문단기준 문서요약 방법론은 다음과 같은 절차로 구성되어 있다: (1) 문단의 문장들을 추상화시킨다, (2) 문장구성성분들의 문장간 개연적 연결상황을 확인한다, (3) 연결집중도가 상대적으로 높은 문장을 문단의 화제를 담고 있는 것으로 인정한다. 본 논문에서는 이 과정에서 문장추상화에 필요한 구문분석기와 온톨로지를 구체화하였고, 문장추상기로 설화문장 추상화를 하였다. 그 후 개연성 규칙을 적용하여 문단의 주제문을 선별하였다.

  • PDF

Automatic Query Answering System Using The UNITEX for Robots Domain (UNITEX를 이용한 로봇 주제의 자동 질의응답 시스템)

  • Jung, Byung-Ho;Park, Choong-Shik;Woo, Young-Woon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.10a
    • /
    • pp.310-313
    • /
    • 2009
  • 기존의 자동 질의응답 시스템은 복잡한 구문처리와 의미분석으로 인하여 그 구현에 많은 어려움이 있다. 본 논문에서는 대화의 주제를 특정 분야로 제한할 경우 구문구(syntactic phrases)와 동의구(synonymous phrases)를 용이하게 처리하는 UNITEX를 사용해 문법을 처리하는 자동응답시스템을 제안한다. 자동응답시스템의 지식표현과 추론, 응답문 생성은 자체 개발한 지식처리시스템인 NEO를 사용한다.

  • PDF

Analyzing user reactions to how game companies respond to issues: Focusing on Topic Modeling Analysis (게임사들의 이슈 대응 방식에 대한 사용자들의 반응 분석: 토픽모델링 분석을 중심으로)

  • Kim, Yu-hyeon;Kim, Yu-Seop
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.727-729
    • /
    • 2022
  • 본 연구는 2021 게임업계 연쇄 파동을 통해 게임사 이슈 대응에 대한 사용자들의 인식이 바뀐 것에 주목하여 메이플스토리 확률 조작 사건에서 나타난 사용자들의 반응을 토픽모델링으로 분석하였다. 이를 위해 사건의 발단이 된 메이플스토리 테스트 월드 업데이트 내용이 업로드된 2021년 2월 18일 17시를 기점으로 국내 온라인 게임 커뮤니티 중 하나인 인벤의 자유게시판에서 총 10만 개의 게시물을 수집하고 토픽모델링 분석을 실시하였다. 이후 도출된 주제별 주요 단어를 10개씩 확인하여 주제를 정의했다. 각 토픽을 비교하며 관련성을 확인했고 이를 통해 사용자들의 반응을 분석한 결과 확률 조작으로 인한 보상으로 환불을 원하고 있다는 것과 아이템의 확률을 조작했다는 것에 대한 사용자들의 분노, 디렉터 본인의 직접적인 사과문과 사용자와의 소통 요구, 또 다른 게임으로의 이탈을 확인할 수 있었다.

An Analysis on Perception of Mothers about Career for Elementary Science-Gifted Children (초등과학영재 어머니들의 자녀 진로에 대한 인식 분석)

  • Kwon, Yoon-Ah;Kim, Hyo-Nam
    • Journal of The Korean Association For Science Education
    • /
    • v.37 no.4
    • /
    • pp.577-586
    • /
    • 2017
  • The purpose of this study is to try to structuralize the perception of the mothers of science-gifted elementary students using the concept mapping approach. The mothers who participated in this research had children who were 5th and 6th graders selected as science-gifted by a regional education office, a science high school and two national universities in a city. One of the authors interviewed 26 mothers, and extracted 50 general statements of their perceptions about the career path of their children. Ten mothers who participated in interviews sorted a shuffled pack of statement cards. The categorization of the statements into the dissimilarity matrix was carried out by SPSS multidimensional scaling analysis and hierarchical cluster analysis to generate a conceptual diagram. After that 140 mothers rated each statement using a Likert-type response scale from one to five. The result showed six clusters of parental views such as were 'Burden of private education, grades and going to the next grade,' 'Thinking about career guidance in gifted education and school,' 'Parental roles in child career education,' 'Difficulties in career guidance at home,' 'Demand for strengthening the parental capacity for career guidance,' and 'Demand for social support.' 'Demand for social support' obtained the highest sympathy from mothers of elementary science gifted.

Denoising Response Generation for Learning Korean Conversational Model (한국어 대화 모델 학습을 위한 디노이징 응답 생성)

  • Kim, Tae-Hyeong;Noh, Yunseok;Park, Seong-Bae;Park, Se-Yeong
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.29-34
    • /
    • 2017
  • 챗봇 혹은 대화 시스템은 특정 질문이나 발화에 대해 적절한 응답을 해주는 시스템으로 자연어처리 분야에서 활발히 연구되고 있는 주제 중 하나이다. 최근에는 대화 모델 학습에 딥러닝 방식의 시퀀스-투-시퀀스 프레임워크가 많이 이용되고 있다. 하지만 해당 방식을 적용한 모델의 경우 학습 데이터에 나타나지 않은 다양한 형태의 질의문에 대해 응답을 잘 못해주는 문제가 있다. 이 논문에서는 이러한 문제점을 해결하기 위하여 디노이징 응답 생성 모델을 제안한다. 제안하는 방법은 다양한 형태의 노이즈가 임의로 가미된 질의문을 모델 학습 시에 경험시킴으로써 강건한 응답 생성이 가능한 모델을 얻을 수 있게 한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 질의-응답 쌍으로 구성된 한국어 대화 데이터에 대해 실험을 수행하였다. 실험 결과 제안하는 방법이 비교 모델에 비해 정량 평가인 ROUGE 점수와 사람이 직접 평가한 정성 평가 모두에서 더 우수한 결과를 보이는 것을 확인할 수 있었다.

  • PDF