• Title/Summary/Keyword: 의미분석

Search Result 12,909, Processing Time 0.04 seconds

International Patent Classificaton Using Latent Semantic Indexing (잠재 의미 색인 기법을 이용한 국제 특허 분류)

  • Jin, Hoon-Tae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1294-1297
    • /
    • 2013
  • 본 논문은 기계학습을 통하여 특허문서를 국제 특허 분류(IPC) 기준에 따라 자동으로 분류하는 시스템에 관한 연구로 잠재 의미 색인 기법을 이용하여 분류의 성능을 높일 수 있는 방법을 제안하기 위한 연구이다. 종래 특허문서에 관한 IPC 자동 분류에 관한 연구가 단어 매칭 방식의 색인 기법에 의존해서 이루어진바가 있으나, 현대 기술용어의 발생 속도와 다양성 등을 고려할 때 특허문서들 간의 관련성을 분석하는데 있어서는 단어 자체의 빈도 보다는 용어의 개념에 의한 접근이 보다 효과적일 것이라 판단하여 잠재 의미 색인(LSI) 기법에 의한 분류에 관한 연구를 하게 된 것이다. 실험은 단어 매칭 방식의 색인 기법의 대표적인 자질선택 방법인 정보획득량(IG)과 카이제곱 통계량(CHI)을 이용했을 때의 성능과 잠재 의미 색인 방법을 이용했을 때의 성능을 SVM, kNN 및 Naive Bayes 분류기를 사용하여 분석하고, 그중 가장 성능이 우수하게 나오는 SVM을 사용하여 잠재 의미 색인에서 명사가 해당 용어의 개념적 의미 구조를 구축하는데 기여하는 정도가 어느 정도인지 평가함과 아울러, LSI 기법 이용시 최적의 성능을 나타내는 특이값의 범위를 실험을 통해 비교 분석 하였다. 분석결과 LSI 기법이 단어 매칭 기법(IG, CHI)에 비해 우수한 성능을 보였으며, SVM, Naive Bayes 분류기는 단어 매칭 기법에서는 비슷한 수준을 보였으나, LSI 기법에서는 SVM의 성능이 월등이 우수한 것으로 나왔다. 또한, SVM은 LSI 기법에서 약 3%의 성능 향상을 보였지만 Naive Bayes는 오히려 20%의 성능 저하를 보였다. LSI 기법에서 명사가 잠재적 의미 구조에 미치는 영향은 모든 단어들을 내용어로 한 경우 보다 약 10% 더 향상된 결과를 보여주었고, 특이값의 범위에 따른 성능 분석에 있어서는 30% 수준에 Rank 되는 범위에서 가장 높은 성능의 결과가 나왔다.

Significance and Limitations of Record Continuum in Electronic Record Environment: Focusing on Meaning and Nature of Records (전자기록 환경에서 레코드 컨티뉴엄의 의의와 한계: 기록의 의미 및 속성을 중심으로)

  • Kim, Myoung-hun
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.21 no.3
    • /
    • pp.1-16
    • /
    • 2021
  • Record continuum is a theory providing the basis for archival science in the paradigm shift to the electronic record environment. However, critical analysis of it has been hardly performed so far, as it is still in development, and its core is a new perspective on records different from the life cycle model. Therefore, for further understanding of the significance and limitations of record continuum in the electronic record environment and performance of more in-depth theoretical development, an analysis of the meaning and nature of records contained in record continuum logic is essential. Given that record continuum does not define a record separately, the meaning and nature of records it contains in the recent electronic record environment are examined through the analysis of axis and dimension in a record continuum model.

A Korean Product Review Analysis System Using a Semi-Automatically Constructed Semantic Dictionary (반자동으로 구축된 의미 사전을 이용한 한국어 상품평 분석 시스템)

  • Myung, Jaeseok;Lee, Dongjoo;Lee, Sang-Goo
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.68-75
    • /
    • 2007
  • 웹 2.0 시대에 사용자가 작성한 리뷰는 다양한 활용성을 갖는 가치있는 데이터이다. 특히 온라인 쇼핑몰에서의 상품평은 사용자의 구매 결정에 직접적인 영향을 미치는 중요한 정보이다. 본 논문에서는 실제 쇼핑몰 사이트에 있는 상품평을 분석하여 각 상품의 특징과 이에 대한 사용자의 의견을 요약하는 상품평 분석 시스템을 설계하고 구현하였다. 각 상품평을 분석하는 과정에서는 자연언어처리 기법과 의미 사전을 사용한다. 의미 사전에는 상품의 특징을 표현하는 어휘와 각 어휘들의 극성(Polarity) 정보들을 반자동으로 정의할 수 있도록 구현하였다. 이에 더하여 문맥에 따라 다른 의미를 갖는 어휘에 대한 처리 방법에 대해서도 논의한다. 실험은 2개 상품 분류의 63개 실제 리뷰를 대상으로 수행하였으며 결과로 평균 88.94%의 정확률, 47.92%의 재현율을 나타냈다.

  • PDF

A Study on UCCA for Korean Semantic Analysis (Universal conceptual cognitive annotation(UCCA) 주석 체계의 한국어 적용 연구)

  • Oh, Tae-Hwan;Han, Ji-Yoon;Choe, Hyon-Su;Park, Seok-Won;Kim, Han-Saem
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.353-356
    • /
    • 2019
  • 본 논문은 Universal conceptual cognitive annotation(보편 개념 인지 주석, 이하 UCCA)를 한국어에 적용하는 방안에 대해 제시하였다. 우선 기존의 한국어 의미 분석 체계들의 장단점을 살펴본 뒤, UCCA가 가지고 있는 상대적인 장점들을 소개하였다. UCCA는 모든 언어에 대하여 일관적인 기술을 하려는 Meaning representation framework의 하나로, 보편언어적인 의미 분석 체계를 가지고 있다. 본고는 주석 단위와 문법적 요소의 관점에서 한국어의 특성을 반영하여 UCCA를 한국어에 적용하는 방안을 검토하였다.

  • PDF

The Information Model Based on Semantic Structures (의미구조를 기반으로 한 정보모델)

  • 강윤희;조성호;이원규
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1994.12a
    • /
    • pp.29-32
    • /
    • 1994
  • 과거 실세계 정보를 처리하기 위한 방법으로는 관계형데이타베이스, 객체지향데이타베이스. 지식베이스시스템 등이 연구되었다. 이들 방법은 제한된 정보표현 및 정보의 운영 및 접근방법 등의 문제점을 갖는다. 정보의 구조화는 정보의 의미를 분석하고 정보의 특성에 적합한 융통성 있는 정보모델을 필요로 한다. 본 논문에서는 방대한 양의 정보처리 및 다양한 형태의 표현, 동적 변환 등의 정보특성을 효율적으로 처리하기 위한 정보모델로 의미구조그래프를 사용하여 기존 시스템의 문제점을 해결하기 위한 방법을 제안한다. 의미구조그래프를 사용한 정보구조화는 정보의미를 분석할 수 있으며, 정보의 표현의 융통성을 제공한다. 의미구조그래프는 노드와 링크를 갖는 확장된 하이퍼그래프를 사용하였으며, 정보구조화를 위한 대상데이타로 문화예술 분야의 관련 정보를 실험하였다.

  • PDF

Text Classification using Cloze Question based on KorBERT (KorBERT 기반 빈칸채우기 문제를 이용한 텍스트 분류)

  • Heo, Jeong;Lee, Hyung-Jik;Lim, Joon-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.486-489
    • /
    • 2021
  • 본 논문에서는 KorBERT 한국어 언어모델에 기반하여 텍스트 분류문제를 빈칸채우기 문제로 변환하고 빈칸에 적합한 어휘를 예측하는 방식의 프롬프트기반 분류모델에 대해서 소개한다. [CLS] 토큰을 이용한 헤드기반 분류와 프롬프트기반 분류는 사전학습의 NSP모델과 MLM모델의 특성을 반영한 것으로, 텍스트의 의미/구조적 분석과 의미적 추론으로 구분되는 텍스트 분류 태스크에서의 성능을 비교 평가하였다. 의미/구조적 분석 실험을 위해 KLUE의 의미유사도와 토픽분류 데이터셋을 이용하였고, 의미적 추론 실험을 위해서 KLUE의 자연어추론 데이터셋을 이용하였다. 실험을 통해, MLM모델의 특성을 반영한 프롬프트기반 텍스트 분류에서는 의미유사도와 토픽분류 태스크에서 우수한 성능을 보였고, NSP모델의 특성을 반영한 헤드기반 텍스트 분류에서는 자연어추론 태스크에서 우수한 성능을 보였다.

  • PDF

Social perception of the Arduino lecture as seen in big data (빅데이터 분석을 통한 아두이노 강의에 대한 사회적 인식)

  • Lee, Eunsang
    • Journal of The Korean Association of Information Education
    • /
    • v.25 no.6
    • /
    • pp.935-945
    • /
    • 2021
  • The purpose of this study is to analyze the social perception of Arduino lecture using big data analysis method. For this purpose, data from January 2012 to May 2021 were collected using the Textom website as a keyword searched for 'arduino + lecture' in blogs, cafes, and news channels of NAVER website. The collected data was refined using the Textom website, and text mining analysis and semantic network analysis were performed by opening the Textom website, Ucinet 6, and Netdraw programs. As a result of text mining analysis such as frequency analysis, TF-IDF analysis, and degree centrality it was confirmed that 'education' and 'coding' were the top keywords. As a result of CONCOR analysis for semantic network analysis, four clusters can be identified: 'Arduino-related education', 'Physical computing-related lecture', 'Arduino special lecture', and 'GUI programming'. Through this study, it was possible to confirm various meaningful social perceptions of the general public in relation to Arduino lecture on the Internet. The results of this study will be used as data that provides meaningful implications for instructors preparing for Arduino lectures, researchers studying the subject, and policy makers who establish software education or coding education and related policies.

A Study of Korean Semantic Role Labeling using Word Sense (의미 정보를 이용한 한국어 의미역 인식 연구)

  • Lim, Soojong;Kim, Hyunki
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.18-22
    • /
    • 2015
  • 기계학습 기반의 의미역 인식에서 주로 어휘, 구문 정보가 자질로 주로 쓰이지만, 의미 정보를 분석하는 의미역 인식은 단어의 의미 정보 또한 매우 주요한 정보이다. 그러나, 기존 연구에서는 의미 정보를 활용할 수 있는 방법이 제한되어 있기 때문에, 소수의 연구만 진행되었다. 본 논문에서는 동형이의어 수준의 의미 애매성 해소 기술, 고유 명사에 대한 개체명 인식 기술, 의미 정보에 기반한 필터링, 유의어 사전을 이용한 클러스터 및 기존 프레임 정보를 확장하는 방법을 제안한다. 제안하는 방법은 기존 연구 대비 뉴스 도메인인 Korean Propbank는 3.14, 위키피디아 문서 기반의 WiseQA 평가셋인 GS 3.0에서는 6.57의 성능 향상을 보였다.

  • PDF

초등학교 6학년 학생들의 분수와 소수연산에 나타나는 오류 유형 분석

  • 권오남;김진숙;이경아
    • Education of Primary School Mathematics
    • /
    • v.1 no.1
    • /
    • pp.45-58
    • /
    • 1997
  • 초등학교 아동은 교육과정을 이수하면서 수 영역에서 자연수, 정수, 그리고 양의 유리수까지 학습하게 되어 있다(교육부, 1992). 초등학교에서의 유리수는 분수ㆍ소수를 의미하는 소박한 의미의 유리수를 의미한다. 여기서 유리수는 자연수와 정수를 포괄하는 수 체계적 의미로서 포함관계가 강조되지는 않는다.(중략)

  • PDF

The Analysis of Usage of the '心' letter in 『HwangJeNaeGyeogYoungChu』 (『황제내경영추(黃帝內經靈樞)』에서 사용된 '심(心)'자(字)의 용례 분석)

  • Bak, Jae-Yong
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.10
    • /
    • pp.774-787
    • /
    • 2021
  • This thesis is a follow-up study on HwangJeNaeGyeogSoMun(SoMun). Its purpose is the usage of '心' letter used in HwangjenaegyeogYoungChu(YoungChu). The original manuscript of this study was the Hu's Gulin Sanctum of YoungChu. It was conducted by a literature review. Typically, the word '心' means a tangible heart and an intangible mind in the same form. Therefore, in order to understand the contents of the YoungChu, which provides the basis for the basic ideology related to health care, meditation, GiGong training, yoga, practice and oriental medicine, it is necessary to understand the meaning of the word '心' letter. The results of this study are as follows. First, it means human heart. Second, it means the human chest. Third, it means mind such as angry, joy sad, fear and so on. Fourth, it means the transcendent concept like spiritual enlightenment. Fifth, it means the pericardium. Sixth, it means logical thinking. Seventh, it means center or core, Eighth, it means the name of the constellation in the eastern sky of ancient Asia. Ninth, it can be classified into the inside. It can be used as a basic data to understand the contents of YoungChu related to various categories. The limitation of it is that the classification of the '心' letter may be different from the researchers' perspective.