• Title/Summary/Keyword: 용어사전

Search Result 398, Processing Time 0.027 seconds

A Study on Hangul Qualifier for Homographic Descriptors (동형이의어의 구별을 위한 한글한정어 사용에 관한 연구)

  • 김태수;최석두
    • Journal of the Korean Society for information Management
    • /
    • v.14 no.1
    • /
    • pp.107-124
    • /
    • 1997
  • It is our main aim in this study to discriminate the conceptual relationship between homographic descriptors. The roles of qualifier and the problems of the recent usage of qualifier such as Hangul, Hanja and foreign languages, which is based largely on the dictionaries, subject heading lists and thesauri, re analyzed within the framework of the our test thesaurus developed as a macro-the-saurus. Finally, we proposed some new ideas must be integrated into the Hangul qualifier in order to make it generally applicable within the field of dictionary, and the method of representing, selection principles and priority of Hangul qualifiers.

  • PDF

An Experimental Approach of Keyword Extraction in Korean-Chinese Text (국한문 혼용 텍스트 색인어 추출기법 연구 『시사총보』를 중심으로)

  • Jeong, Yoo Kyung;Ban, Jae-yu
    • Journal of the Korean Society for information Management
    • /
    • v.36 no.4
    • /
    • pp.7-19
    • /
    • 2019
  • The aim of this study is to develop a technique for keyword extraction in Korean-Chinese text in the modern period. We considered a Korean morphological analyzer and a particle in classical Chinese as a possible method for this study. We applied our method to the journal "Sisachongbo," employing proper-noun dictionaries and a list of stop words to extract index terms. The results show that our system achieved better performance than a Chinese morphological analyzer in terms of recall and precision. This study is the first research to develop an automatic indexing system in the traditional Korean-Chinese mixed text.

A Design of Knowledge Base for the Service of Collaboration Support between Researchers (연구자 간 협업 지원 서비스를 위한 지식 베이스 설계)

  • Jung, Han-Min;Sung, Won-Kyung;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.173-178
    • /
    • 2005
  • 지식 베이스는 대량의 인적 물적 자원을 투입하고 철저한 설계에 기반하여 구축하여야 하는 부담이 큰 자원이다. 그렇지만, 지식 베이스 없이 다양한 응용 분야와 서비스를 만족시키는 시스템을 구축할 수 없기 때문에 그 중요성을 인정하지 않을 수 없다. 기존의 지식베이스 구축에 있어서 간과했던 것들의 하나는 응용 분야와 서비스를 명확히 하고, 해당분야에 안는 지식 베이스를 선택해야 한다는 것이다. 어휘의미망을 포함하여 시소러스를 범용 또는 여러 분야에서 구축하고 있으나 이들이 어떤 서비스에 도움이 되는지를 확실히 분석하지 못함으로 인해 응용 시스템에서 제 기능을 다하지 못하고 있으며, 온톨로지 또한 근본적으로 분야와 활용 목적에 의존적이어서 이를 고려하여 설계를 하지만 시소러스나 용어 사전과 같은 기본적인 지식 베이스와의 연계를 통한 효율성 재고라는 측면에서 약점을 보여왔다. 본 연구에서는 사용자 질의와 실 데이터간의 어휘 불일치 해소를 위해 시소러스를 설계 구축하고 온톨로지의 사례화 결과인 인스턴스와 연동시킴으로써 연구자 간 협업 지원 서비스를 제공할 수 있는 기반 자원으로서의 지식 베이스 구축에 초점을 둔다.

  • PDF

A stemming algorithm for a korean language free-text retrieval system (자연어검색시스템을 위한 스태밍알고리즘의 설계 및 구현)

  • 이효숙
    • Journal of the Korean Society for information Management
    • /
    • v.14 no.2
    • /
    • pp.213-234
    • /
    • 1997
  • A stemming algorithm for the Korean language free-text retrieval system has been designed and implemented. The algorithm contains three major parts and it operates iteratively ; firstly, stop-words are removed with a use of a stop-word list ; secondly, a basic removing procedure proceeds with a rule table 1, which contains the suffixes, the postpositional particles, and the optionally adopted symbols specifying an each stemming action ; thirdly, an extended stemming and rewriting procedures continue with a rule table 2, which are composed of th suffixes and the optionally combined symbols representing various actions depending upon the context-sensitive rules. A test was carried out to obtain an indication of how successful the algorithm was and to identify any minor changes in the algorithm for an enhanced one. As a result of it, 21.4 % compression is achieved and an error rate is 15.9%.

  • PDF

Understanding 《Jiuzhang suanshu 九章算術》 through 《Kujang sulhae 九章術解》 -Focusing on the Meaning of the Terms and Phrases in the First Half of Chapter One pangjeon 方田章, and Paying Attention to the Development of Concepts- (《구장술해》를 통한 《구장산술》의 이해 -방전장(方田章) 전반부의 용어와 어구의 의미를 중심으로 개념의 발달 과정에 주의하여-)

  • KANG, Min Jeong
    • Journal for History of Mathematics
    • /
    • v.28 no.5
    • /
    • pp.207-231
    • /
    • 2015
  • We discuss several issues relating to the meaning of the terms and phrases in the first half of Chapter One fang tian 方田章 of ${\ll}$Jiuzhang suanshu九章算術${\gg}$. I understood those issues more clearly in the course of the translation of ${\ll}$Kujang sulhae 九章術解${\gg}$. Those are '今有' in the beginning of each problem, '積' and '冪' in the method of square field 方田術, '齊' in the method of reduction to a common denominator 齊同術, '經' and '有分者通之重有分者同而通之' in the method of dividing fraction 經分術, '實如法而一' in the calculation using the rods, '兩邪' in the method of trapezium field with a perpendicular side 邪田術. We may find out the value of ${\ll}$Kujang sulhae 九章術解${\gg}$ through our discussion.

Extended Query Search Performance Evaluations for Vector Model and Probabilistic Model of Information System (정보검색시스템의 확률 및 벡터모델에 대한 질의 확장 검색 성능 평가)

  • 전유정;변동률;박순철
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.9 no.1
    • /
    • pp.36-42
    • /
    • 2004
  • In this paper, we compare the vector model performance with the probabilistic model of information system. We use LSI(Latent Semantic Indexing) model for vector model, while Condor information search system that is ready to sell on business is used as a probabilistic model. Each model produces the search results from the original queries and the queries extended by a dictionary definition. We compare those results between two models and find out the vector model is much better than the probabilistic model for the most queries.

  • PDF

Online Reputation Analysis of Dietary Supplements based on Sentiment Analysis (감성 분석을 이용한 다이어트 보조 식품에 대한 온라인 평판분석)

  • Lee, So-Hee;Lee, Jin-Yeong;Kim, Hyon Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.306-308
    • /
    • 2018
  • 본 연구에서는 체중 감량을 위해 무분별한 다이어트 식품의 남용을 막고, 다이어트 보조 식품에 대한 정보를 제공하기 위해서 감성 분석을 활용하여 다이어트 보조 식품에 대한 온라인 후기를 분석하였다. 먼저, 다이어트 보조 식품을 그 특성에 따라 네 가지 종류로 분류하고 각 카테고리 별로 긍정 및 부정 점수를 계산하였다. 이를 위해 체중 감량에 대한 감성 사전을 다이어트 식품에 대한 후기를 텍스트 마이닝하여 구축하였다. 특히 부작용이 있는 식품에 대한 부정 점수에 가중치를 두기 위해서 WHO-ART 에서 정의한 부작용 용어에는 가중치를 두어 처리하였다. 분석 결과 단백질 보충 식품군이 긍정 점수가 가장 높게 나타났고, 이는 다이어트를 위한 목적 이외에도 운동을 전문적으로 하는 사람들에게 오랜기간 사용되어 왔기 때문인 것으로 해석된다. 또한 식욕 억제제 식품군이 긍정점수는 가장 낮고 부정 점수는 가장 높게 나타났는데, 이는 식욕억제제의 주성분인 펜타민에 의한 가능성이 클 것이라고 예측된다.

Development of Special Documents Classification System using Deep Learning (딥러닝을 이용한 전문분야 문서 분류 시스템 개발)

  • Jin, Sang-Hyeon;Hwang, Sang-Ho;Kang, Won-Seok;Son, Chang-Sik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.589-591
    • /
    • 2019
  • 본 논문에서는 고도장비의 운용 및 정비를 위한 교육훈련 시스템 개발을 위해 자연어 처리와 딥러닝 기술을 이용하여 항공정비와 관련된 전문분야의 문서 분류가 가능한 방법을 제안하고자 한다. 문서 분류 모델의 개발을 위해 항공정비 교범을 텍스트 파일로 변환하여 총 4917개의 문서를 생성하였으며, 정비사 개인별 정비능력 관리(IMQC)를 기준으로 12개의 범주로 구분하였다. 수집된 문서는 전문분야의 문서인 점을 고려하여 전문용어 사전을 추가하였으며, KoNLPy를 이용하여 전처리를 수행하였다. 전문분야의 문서는 범주에 상관없이 문서 내용의 유사도가 매우 높은 특징을 가지고 있어, 특정 범주내에서 중요한 정도를 잘 표현 할 수 있는 TF-ICF를 이용하여 특징 추출을 하였다. 이후 합성곱 신경망(CNN)을 이용하여 특징 맵을 생성한 후 완전 결합 계층을 통하여 분류하였으며, 테스트 문서 983건을 분류한 결과 평균 73.6%의 분류성능을 보여주었다.

The Conceptual System on Compiling Operations for the Dictionary of South & North Korea IT Terminology (남북 IT용어 사전집 발간을 위한 표준체계 연구)

  • Choi, Sung;Kim, Hyun-Sook;Jin, YongOk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1702-1705
    • /
    • 2012
  • North-South Korean information technology(IT) terminologies are going to be gradually changed differently as the time is flowed. In accordance with the age of advanced information science and technology, the IT terminologies should be mutually identified and confirmed on the basis of ISO2382 Korean standardization being set up for the international IT terminologies made by the scholars both Republic of Korea(ROK) and Democratic Peoples' Republic of Korea(DPRK). In the present study, the results of mutual efforts on IT standardization since 1994 has been firstly analyzed systematically for the advanced North-South Korean IT terminology. Secondly, the differences of the IT terminologies used currently in both ROK and DPRK have been also analyzed and classified in the three categories. Thirdly, the current IT terminologies used in both ROK and DPRK have been summarized on the basis of "Encyclopedia of 21 Century Computer Terminology." Fourth, it has been finally set up the construction scheme of conceptual system on compiling operations for the dictionary of North-South Korean IT terminologies.

Asynchronous Web Crawling Algorithm (링크 분석을 통한 비동기 웹 페이지 크롤링 알고리즘)

  • Won, Dong-Hyun;Park, Hyuk-Gyu;Kang, Yun-Jeong;Lee, Min-Hye
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.10a
    • /
    • pp.364-366
    • /
    • 2022
  • The web uses an asynchronous web method to provide various information having different processing speeds together. The asynchronous method has the advantage of being able to respond to other events even before the task is completed, but a typical crawler has difficulty collecting information provided asynchronously by collecting point-of-visit information on a web page. In addition, asynchronous web pages often do not change their web address even if the page content is changed, making it difficult to crawl. In this paper, we propose a web crawling algorithm considering asynchronous page movement by analyzing links in the web. With the proposed algorithm, it was possible to collect dictionary information on TTA terms that provide information asynchronously.

  • PDF