• Title/Summary/Keyword: 어휘적 유사성

Search Result 86, Processing Time 0.029 seconds

A Comparison Study between Human and Computation Model on Language Phenomena of in Korean Lexical Decision Task (한국어 어휘판단과제와 관련된 언어현상의 인간과 계산주의 모델의 비교)

  • Park, Ki-Nam;Lim, Heui-Seok
    • Proceedings of the KAIS Fall Conference
    • /
    • 2006.05a
    • /
    • pp.391-393
    • /
    • 2006
  • 본 논문은 어휘판단과제(LDT: Lexical Decision Task)시 나타나는 여러 언어현상 중 단어빈도효과(word frequency effect)와 단어유사성효과(word similarity effect)를 한국어에 적용시켜 인간과 계산 주의적 모델을 통해 실험하고, 결과를 비교하였다. 실험결과 인간과 계산주의적 모델 각각 한국어에 대해 단어빈도효과와 단어 유사성효과를 보였으며, 인간의 실험결과와 계산주의적 모델의 결과가 유의미한 유사성을 나타내었다.

  • PDF

A New Similarity Measure for e-Catalog Retrieval Based on Semantic Relationship (의미적 연결 관계에 기반한 전자 카탈로그 검색용 유사도 척도)

  • Seo, Kwang-Hun;Lee, Sang-Goo
    • Journal of KIISE:Databases
    • /
    • v.34 no.6
    • /
    • pp.554-563
    • /
    • 2007
  • The e-Marketplace is growing rapidly and providing a more complex relationship between providers and consumers. In recent years, e-Marketplace integration or cooperation issues have become an important issue in e-Business. The e-Catalog is a key factor in e-Business, which means an e-Catalog System needs to contain more large data and requires a more efficient retrieval system. This paper focuses on designing an efficient retrieval system for very large e-Catalogs of large e-Marketplaces. For this reason, a new similarity measure for e-Catalog retrieval based on semantic relationships was proposed. Our achievement is this: first, a new e-Catalog data model based on semantic relationships was designed. Second, the model was extended by considering lexical features (Especially, focus on Korean). Third, the factors affecting similarity with the model was defined. Fourth, from the factors, we finally defined a new similarity measure, realized the system and verified it through experimentation.

Category-based dimensional model of affective words (우리말 감성 어휘의 범주-차원 모형 - 직물 디자인의 시각적 요소와 관련하여 -)

  • 박수진;정찬섭
    • Science of Emotion and Sensibility
    • /
    • v.2 no.1
    • /
    • pp.77-94
    • /
    • 1999
  • 직물 및 직물 관련 제품에서 주로 사용되는 감성 어휘들의 관계 및 구조를 분석하기 위해 잡지 및 설문 조사 과정을 통해 어휘를 수집하였다. 수집된 어휘의 빈도를 조사하고, 어휘 적절성을 평가하여 감성어라고 생각될 수 있는 어휘들만을 정리하였다. 여기서 추출된 372개의 어휘는 직물 및 직물 관련 상황에서의 감성어로 사용될 수 있을 분만 아니라 유사 분야의 감성어 모형에 대한 기본 자료로 활용될 수 있을 것이다. 어휘들 간 관계구조에 대한 분석은 몇 가지 면에서 이뤄졌다. 자유연상 과제를 실시하여 어휘들 간 관계의 연결망(network)을 확인할 수 있었다. 어휘들이 내포하고 있는 의미의 여러 측면에서 어휘들 간 관계를 파악할 수 있도록 어휘들에 대해 다차원 분석을 실시한 결과 어휘 간 관계는 3차원이면 충분히 설명될 수 있는 것으로 나타났다. 두 개의 주차원을 중심으로 어휘들의 공간 분포를 그리고 이들 어휘를 범주로 분류한 결과 대략 11개의 범주로 어휘들을 나눠볼 수 있었다.

  • PDF

User's Emotional Preference on PC OS GUI - Though Semantic Differential Method (PC OS GUI 의 사용자 감성에 관한 연구 - 의미분별 척도법을 활용한 사용자 감성 선호도 분석)

  • Moon, Hyun-Jung;Lee, Jung-Yeun
    • 한국HCI학회:학술대회논문집
    • /
    • 2008.02b
    • /
    • pp.30-35
    • /
    • 2008
  • The purpose of this study is to analyze and define user's emotional satisfaction factors to the PC OS GUI image. The study is to investigate the relationship between PC OS GUI Image and Sensitive Vocabula교 based on user's emotional preference. 47 user preferred sensitive words are collected by the initial survey. Through the similarity test, 47 words are narrowed down to 20 comprehend words. The semantic differential methods is used in the final survey with 5 step questionnaire. From this process, user preferred the GUI design that is vocabularized as Clear, Easy, Safety, Stability. Additionally, the result shows that the image of Clear is related to Safety and the image of Easy is related to Stability. The result of the study could be used in design PC OS GUI as base data.

  • PDF

A Study on the Extraction of Emotional Words for Media Facade (내용분석 및 자유연상을 통한 미디어 파사드의 감성어휘 추출)

  • Lee, Seung-min;Bang, Kee-chun
    • Journal of Digital Contents Society
    • /
    • v.16 no.5
    • /
    • pp.741-748
    • /
    • 2015
  • The aim of this paper is to select a distinct vocabulary for understanding the media facade of user and to lay the foundation for a media facade emotional scale. Firstly, we assembled a set of emotional words that were sufficient to represent a general overview of korean emotions, collected from various literature studies. Secondly, we found emotional words from collecting user opinion on the Youtube website. Finally the emotional words were collected from phrase by using non-structural survey. The collected words were integrated according to standards and they were organized 39 pieces that can be used in the survey. As a result, we extracted 21 emotional words for measuring user's emotions expressed while watching media facade, such as 'novel', 'cool', 'awesome', 'gorgeous', 'exciting', 'amazing', 'wonderful,', 'showy', 'great,', 'intense', 'good', 'grand', 'colorful', 'unique', 'variety', 'new', 'fun', 'beautiful', 'luxurious,', 'mysterious', 'satisfactory'. And we categorized the 21 words to form 5 elements by using factor analysis such as 'surprise', 'attention', 'variety', 'aesthetics', 'interest'.

Improving Clustered Sense Labels for Word Sense Disambiguation (단어 의미 모호성 해소를 위한 군집화된 의미 어휘의 품질 향상)

  • Jeongyeon Park;Hyeong Jin Shin;Jae Sung Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.268-271
    • /
    • 2022
  • 단어 의미 모호성 해소는 동형이의어의 의미를 문맥에 맞게 결정하는 일이다. 최근 연구에서는 희소 데이터 처리를 위해 시소러스를 사용해 의미 어휘를 압축하고 사용하는 방법이 좋은 성능을 보였다[1]. 본 연구에서는 시소러스 없이 군집화 알고리즘으로 의미 어휘를 압축하는 방법의 성능 향상을 위해 두 가지 방법을 제안한다. 첫째, 의미적으로 유사한 의미 어휘 집합인 범주(category) 정보를 군집화를 위한 초기 군집 생성에 사용한다. 둘째, 다양하고 많은 문맥 정보를 학습해 만들어진 품질 좋은 벡터를 군집화에 사용한다. 영어데이터인 SemCor 데이터를 학습하고 Senseval, Semeval 5개 데이터로 평가한 결과, 제안한 방법의 평균 성능이 기존 연구보다 1.5%p 높은 F1 70.6%를 달성했다.

  • PDF

English visual word recognition of Korean: lexical access and word length effect (한국인의 영어단어 재인과정:어휘접근과 단어길이효과)

  • 이윤형;최원일;정유진;남기춘
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.279-284
    • /
    • 2000
  • 시각적으로 제시된 영어 단어 재인시에 주로 단어빈도와 단어길이가 영향을 준다고 알려져 있다. 그러나, 단어빈도와 관련된 연구는 체계적으로 이루어져 왔지만 단어길이와 관련된 연구는 체계적으로 이루어지지 않은 편이다. 또한, 단어빈도와 단이길이에 따라 단어가 성 어휘집(mental lexicon)에 어떻게 표상되어 있으며, 상호간에 어떠한 관계가 있는 것인지에 대해서는 아직 구체적으로 알려져 있지 않다. 본 연구의 목적은 첫째, 단어길이와 빈도가 시각적으로 제시된 영어단어 어휘접근에 어떠한 영향을 미치는지 알아보아 단어길이효과가 어휘접근단계에서 영향을 미치는지 알아보고자 하며 둘째, 단어길이와 빈도가 미국인과 한국인의 어휘접근시 어떤 차이를 보이는지 알아보아 한국인과 미국인의 영어단어 정보처리의 차이를 살펴보고자 하는 것이다. 단어 명명과제와 어휘판단과제를 사용한 실험결과 한국인과 미국인에게 모두 단어 길이와 빈도가 어휘접근에 영향을 주었다. 그러나, 한국인의 경우는 상대적으로 어휘판단과제에서 보다는 단어명명과제에서 어려움을 겪는다는 결과를 보여주었다. 이와 같은 결과를 볼 때 한국인이 영어단어 어휘에 접근할 때에도 미국인과 유사한 방식으로 처리를 하는 것으로 보인다. 그러나, 한국인의 경우는 미국인보다 조음과정에 상대적으로 더 어려움을 느끼는 것으로 보이며, 이것은 영어교육시 단순한 어휘암기보다 음운부호를 산출하고 단어를 말하는 능력을 향상시키는 방법을 좀 더 강조해야 한다는 것을 시사한다.

  • PDF

A Study on the Identification and Classification of Relation Between Biotechnology Terms Using Semantic Parse Tree Kernel (시맨틱 구문 트리 커널을 이용한 생명공학 분야 전문용어간 관계 식별 및 분류 연구)

  • Choi, Sung-Pil;Jeong, Chang-Hoo;Chun, Hong-Woo;Cho, Hyun-Yang
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.45 no.2
    • /
    • pp.251-275
    • /
    • 2011
  • In this paper, we propose a novel kernel called a semantic parse tree kernel that extends the parse tree kernel previously studied to extract protein-protein interactions(PPIs) and shown prominent results. Among the drawbacks of the existing parse tree kernel is that it could degenerate the overall performance of PPI extraction because the kernel function may produce lower kernel values of two sentences than the actual analogy between them due to the simple comparison mechanisms handling only the superficial aspects of the constituting words. The new kernel can compute the lexical semantic similarity as well as the syntactic analogy between two parse trees of target sentences. In order to calculate the lexical semantic similarity, it incorporates context-based word sense disambiguation producing synsets in WordNet as its outputs, which, in turn, can be transformed into more general ones. In experiments, we introduced two new parameters: tree kernel decay factors, and degrees of abstracting lexical concepts which can accelerate the optimization of PPI extraction performance in addition to the conventional SVM's regularization factor. Through these multi-strategic experiments, we confirmed the pivotal role of the newly applied parameters. Additionally, the experimental results showed that semantic parse tree kernel is superior to the conventional kernels especially in the PPI classification tasks.

Decision Tree for Likely phoneme model schema support (유사 음소 모델 스키마 지원을 위한 결정 트리)

  • Oh, Sang-Yeob
    • Journal of Digital Convergence
    • /
    • v.11 no.10
    • /
    • pp.367-372
    • /
    • 2013
  • In Speech recognition system, there is a problem with phoneme in the model training and it cause a stored mode regeneration process which come into being appear time and more costs. In this paper, we propose the methode of likely phoneme model schema using decision tree clustering. Proposed system has a robust and correct sound model which system apply the decision tree clustering methode form generate model, therefore this system reduce the regeneration process and provide a retrieve the phoneme unit in probability model. Also, this proposed system provide a additional likely phoneme model and configured robust correct sound model. System performance as a result of represent vocabulary dependence recognition rate of 98.3%, vocabulary independence recognition rate of 98.4%.

Linking OntoCloud to WordNet (OntoCloud와 워드넷 연결)

  • Park, Kwang-Hee;Kim, Eun-Kyung;Choi, DongHyun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.172-176
    • /
    • 2010
  • 본 논문에서는 위키피디아의 '틀(temp late)'을 기조로 하여 작성된 온톨로지인 OntoCloud의 신뢰도를 보장하고 공유 및 재사용을 가능하게 하기 위하여 또 다른 어휘집합체인 워드넷(WordNet)과의 매핑을 한다. 온톨로지 매핑 기술은 온톨로지 개발 기술의 한 방법으로, 서로 비슷한 도메인을 대상으로 이미 구축되어진 서로 다른 다수의 온롤로지를 연결시킴으로서 하나의 풍부한 정보를 가지고 있는 연결망을 구축하는 방법이다. 본 논문에서는 OntoCloud와 워드넷을 두개의 온톨로지로 정의하고 각 온톨로지의 개념에 대한 정의문 비교 방법을 통해서 두개의 온톨로지에 존재하는 유사한 개념을 연결한다. 이렇게 매핑된 정보들은 OntoCloud 개념을 워드넷 어휘로 연결함으로써 개념에 대한 직관적인 이해를 돕고, 워드넷에 연결된 다른 시소러스 (예: SUMO, CoreNet 등)와 간접적으로 연결할 수 있는 틀을 마련한다. 또한 온톨로지의 상하위 계층정보를 자동으로 보강하는 등의 OntoCloud 유지보수에 활용될 수 있다. 본 논문의 실험에서는 두개의 서로 다른 온톨로지의 정의문에 사용된 어휘의 겹침 정도로 두개의 개념의 유사성을 판별하는 방법을 보인다. 본 논문에서 제시한 방법으로 약 73%의 개념 매핑에 성공하였으나, 추후 매핑 프로세스의 전처리 과정(약자 처리 및 복합명사 대응 모듈)을 추가하고 온톨로지의 구조적 특성을 활용하여 유사 개념 자동 매핑 기술을 향상시키고자 한다.

  • PDF