• 제목/요약/키워드: 기본어휘

Search Result 136, Processing Time 0.026 seconds

A New Similarity Measure for e-Catalog Retrieval Based on Semantic Relationship (의미적 연결 관계에 기반한 전자 카탈로그 검색용 유사도 척도)

  • Seo, Kwang-Hun;Lee, Sang-Goo
    • Journal of KIISE:Databases
    • /
    • v.34 no.6
    • /
    • pp.554-563
    • /
    • 2007
  • The e-Marketplace is growing rapidly and providing a more complex relationship between providers and consumers. In recent years, e-Marketplace integration or cooperation issues have become an important issue in e-Business. The e-Catalog is a key factor in e-Business, which means an e-Catalog System needs to contain more large data and requires a more efficient retrieval system. This paper focuses on designing an efficient retrieval system for very large e-Catalogs of large e-Marketplaces. For this reason, a new similarity measure for e-Catalog retrieval based on semantic relationships was proposed. Our achievement is this: first, a new e-Catalog data model based on semantic relationships was designed. Second, the model was extended by considering lexical features (Especially, focus on Korean). Third, the factors affecting similarity with the model was defined. Fourth, from the factors, we finally defined a new similarity measure, realized the system and verified it through experimentation.

A Study on interaction factor in intuitive gesture (직관적 제스쳐 인터랙션 요소 추출에 관한 연구)

  • Kim, Yong-U;Hwang, Min-Cheol;Kim, Jong-Hwa;U, Jin-Cheol;Kim, Chi-Jung;Kim, Ji-Hye
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2009.11a
    • /
    • pp.66-69
    • /
    • 2009
  • 본 연구는 사용자에게 편리하고 자연스러운 인터페이스를 제공하는 직관적 제스쳐 인터랙션의 요소 추출에 대해 분석하였다. 대학생 30명을 대상으로 마우스와 키보드의 8가지 기본 인터랙션 요소를 제시하여 그 요소와 적합한 의미의 어휘를 선택하도록 설문을 실시하였다. 다음으로 선택한 어휘가 가지는 의미를 표현한 제스쳐를 빈도수에 따라 최종 선정한 후 검증을 실시하였다. 첫 번째 설문시 마우스의 상하좌우 이동과 ESC의 의미는 30명 전원이 상하좌우 이동과 취소라는 동일한 의미를 선택하였다. 마우스의 좌클릭은 30명 중 28명이 선택, 우클릭은 26명이 설정 탐색, 키보드 엔터의 경우 25명이 실행이라는 의미를 선택하였다. 최종 선정된 제스쳐의 검증 결과 상하좌우 이동과 취소 요소로 제시했던 손전체 상하좌우 이동과 손전체X는 70~100%의 높은 결과가 도출되었으며, 선택 요소로 제시했던 정지상태 검지손 아래는 60%의 결과가 도출되었다. 설정 탐색을 위해 제시되었던 손전체 회전과 중지손 클릭 중 손전체 회전이 60%의 결과를 도출하였으며, 중지손 클릭은 선택과 하단 이동이 73%로 설정 탐색의 요소로는 적합하지 않은 것으로 도출되었다. 실행 요소로 제시했던 손전체 두번 클릭은 27%의 낮은 검증 결과가 도출되어 적합하지 않은 것으로 제시되었다.

  • PDF

Noun Sense Disambiguation Based-on Corpus and Conceptual Information (말뭉치와 개념정보를 이용한 명사 중의성 해소 방법)

  • 이휘봉;허남원;문경희;이종혁
    • Korean Journal of Cognitive Science
    • /
    • v.10 no.2
    • /
    • pp.1-10
    • /
    • 1999
  • This paper proposes a noun sense disambiguation method based-on corpus and conceptual information. Previous research has restricted the use of linguistic knowledge to the lexical level. Since knowledge extracted from corpus is stored in words themselves, the methods requires a large amount of space for the knowledge with low recall rate. On the contrary, we resolve noun sense ambiguity by using concept co-occurrence information extracted from an automatically sense-tagged corpus. In one experimental evaluation it achieved, on average, a precision of 82.4%, which is an improvement of the baseline by 14.6%. considering that the test corpus is completely irrelevant to the learning corpus, this is a promising result.

  • PDF

A Design of Knowledge Base for the Service of Collaboration Support between Researchers (연구자 간 협업 지원 서비스를 위한 지식 베이스 설계)

  • Jung, Han-Min;Sung, Won-Kyung;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.173-178
    • /
    • 2005
  • 지식 베이스는 대량의 인적 물적 자원을 투입하고 철저한 설계에 기반하여 구축하여야 하는 부담이 큰 자원이다. 그렇지만, 지식 베이스 없이 다양한 응용 분야와 서비스를 만족시키는 시스템을 구축할 수 없기 때문에 그 중요성을 인정하지 않을 수 없다. 기존의 지식베이스 구축에 있어서 간과했던 것들의 하나는 응용 분야와 서비스를 명확히 하고, 해당분야에 안는 지식 베이스를 선택해야 한다는 것이다. 어휘의미망을 포함하여 시소러스를 범용 또는 여러 분야에서 구축하고 있으나 이들이 어떤 서비스에 도움이 되는지를 확실히 분석하지 못함으로 인해 응용 시스템에서 제 기능을 다하지 못하고 있으며, 온톨로지 또한 근본적으로 분야와 활용 목적에 의존적이어서 이를 고려하여 설계를 하지만 시소러스나 용어 사전과 같은 기본적인 지식 베이스와의 연계를 통한 효율성 재고라는 측면에서 약점을 보여왔다. 본 연구에서는 사용자 질의와 실 데이터간의 어휘 불일치 해소를 위해 시소러스를 설계 구축하고 온톨로지의 사례화 결과인 인스턴스와 연동시킴으로써 연구자 간 협업 지원 서비스를 제공할 수 있는 기반 자원으로서의 지식 베이스 구축에 초점을 둔다.

  • PDF

Improving The Performance of Triple Generation Based on Distant Supervision By Using Semantic Similarity (의미 유사도를 활용한 Distant Supervision 기반의 트리플 생성 성능 향상)

  • Yoon, Hee-Geun;Choi, Su Jeong;Park, Seong-Bae;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.23-28
    • /
    • 2015
  • 본 논문에서는 한국어 트리플 생성 시스템의 정확도를 향상시키기 위한 distant supervision 기반의 신뢰도 측정 방법을 제안한다. 기존의 많은 패턴 기반의 트리플 생성 시스템에는 distant supervision의 기본 가정으로 인해 다수의 오류 패턴이 발생할 여지가 크다. 기존의 연구에서는 오류 패턴을 제거하기 위하여 발생 빈도, 공기 횟수 등의 통계에 기반하여 간접적으로 신뢰도를 측정하였다. 본 논문에서는 한국어 패턴과 영어 프로퍼티 사이의 의미 유사도를 측정함으로써 통계에 기반한 방법보다 더 정확한 신뢰도 측정 방법을 제안한다. 비지도 학습 방법인 워드임베딩을 활용하여 어휘의 의미를 학습하고, 이들 사이의 유사도를 측정한다. 한국어 패턴과 영어 프로퍼티의 어휘 불일치 문제를 해결하기 위하여 정준상관분석을 활용하였다. 실험 결과에 따르면 본 논문에서 제안한 패턴 신뢰도 측정 방법은 통계 기반의 방법에 비해 정확률이 9%나 더 높은 트리플 집합을 생성함을 보여주어, 의미 유사도를 반영한 신뢰도 측정이 기존의 통계 기반 신뢰도 측정보다 고품질 트리플 생성에 더 적합함을 확인하였다.

  • PDF

Automatic Text Summarization using Noun-Verb Cooccurrence Pattern (명사-동사 공기패턴을 이용한 문서 자동 요약)

  • Nam, Ki-Jong;Lee, Chang-Beom;Kang, Dae-Wook;Park, Hyuk-Ro
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.611-614
    • /
    • 2002
  • 문서 자동 요약은 입력된 문서에 대해 컴퓨터가 자동으로 요약을 생성하는 과정을 의미한다. 즉, 컴퓨터가 문서의 기본적인 내용을 유지하면서 문서의 복잡도 즉 문서의 길이를 줄이는 작업이다. 효율적인 정보 접근을 제공함과 동시에 정보 과적재를 해결하기 위한 하나의 방법으로 문서 자동요약에 관한 연구가 활발히 진행되고 있다. 본 논문의 목적은 어휘 연관성 정보를 이용하여 한국어 문서를 자동으로 요약하는 효율적이며 효과적인 모형을 개발하는 것이다. 제안한 방법에서는 신문기사와 같은 특정 부류에 국한되는 단어간의 어휘연관성을 이용하여 명사-명사 공기패턴과 명사-동사 공기패턴을 구축하여 문서요약에 이용한다. 크게 불용어 처리 단계, 공기패턴 구축 단계, 문장 중요도 계산 단계, 요약 생성단계의 네 단계로 나누어 요약을 생성한다. 30% 중요문장 추출된 신문기사를 대상으로 평가한 결과 명사-명사 공기패턴과 빈도만을 이용한 방법보다 명사-동사 공기패턴을 이용한 방법이 좋은 결과를 가져 왔다.

  • PDF

A Study on the Color Grouping System to Fashion (섬유컬러 그루핑 체계에 관한 연구)

  • 이재정;정재우
    • Archives of design research
    • /
    • v.17 no.3
    • /
    • pp.27-38
    • /
    • 2004
  • It is important for designers to be supported with their decision-making on colours which is often based on personal distinction rather than logical dialogue that may lead to confusion within communicating with others. To help these problems and to gain productivity, we would like to propose a way to define colour grouping method. In other words, the purpose of this study is to help to improve the communication and productivity within the design and designers. The grouping was based and inspired by from the studies of Kobayashi, Hideaki Chijiawa, Allis Westgate and Martha Gill. The study of grouping is based on the "tones" of each group, as they seem to reflect a designer s sentimentalism of chosen colours the best. Each of these groups will be named Bright , Pastel ,Deep and Neutral The general concept of each groups are: - Bright: high quality of pixels of primary colour - Pastel: primary colour with white - - Deep: Primary colour with gray or black - Neutral: colours that does not include any of above Each of the colour group has been allocated into Si-Hwa Jung's colour charts and colour prism to visualize the relationships between the colour groups. These four groups and the colours included in them will be broken down to smaller groups in order to make colour palette. This would break the barrier and result in using colours in groups as well as crossover coordination. This study would result in new ways of using colurs for designers designers

  • PDF

A Study on Developing Sensibility Model for Visual Display (시각 디스플레이에서의 감성 모형 개발 -움직임과 색을 중심으로-)

  • 임은영;조경자;한광희
    • Korean Journal of Cognitive Science
    • /
    • v.15 no.2
    • /
    • pp.1-15
    • /
    • 2004
  • The structure of sensibility from motion was developed for the purpose of understanding relationship between sensibilities and physical factors to apply it to dynamic visual display. Seventy adjectives were collected by assessing adequacy to express sensibilities from motion and reporting sensibilities recalled from dynamic displays with achromatic color. Various motion displays with a moving single dot were rated according to the degree of sensibility corresponding to each adjective, on the basis of the Semantic Differential (SD) method. The results of assessment were analyzed by means of the factor analysis to reduce 70 words into 19 fundamental sensibilities from motion. The Multidimensional Scaling (MDS) technique constructed the sensibility space in motion, in which 19 sensibilities were scattered with two dimensions, active-passive and bright-dark Motion types systemically varied in kinematic factors were placed on the two-dimensional space of motion sensibility, in order to analyze important variables affecting sensibility from motion. Patterns of placement indicate that speed and both of cycle and amplitude in trajectories tend to partially determine sensibility. Although color and motion affected sensibility according to the in dimensions, it seemed that combination of motion and color made each have dominant effect individually in a certain sensibility dimension, motion to active-passive and color to bright-dark.

  • PDF

Construction of Korean Verb Wordnet Using Preexisting Noun Wordnet and Monolingual Dictionary (명사 워드넷과 단일어 사전을 이용한 한국어 동사 워드넷 구축)

  • Lee, Ju-Ho;Bae, Hee-Suk;Kim, Eun-Hye;Kim, Hye-Kyong;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.92-97
    • /
    • 2002
  • 의미기반 정보 검색, 자연어 질의 응답, 지식 자동 습득, 담화 처리 등 높은 수준의 자연언어처리 시스템에서 의미처리를 위한 대용량의 지식 베이스가 필요하다. 이러한 지식 베이스 중에서 가장 기본적인 것이 워드넷이다. 이러한 워드넷을 이용함으로써 여러 의미 사이의 의미 유사도를 구할 수 있고, 속성을 물려받을 수 있기 때문에 비슷한 속성을 가진 의미들을 한꺼번에 다루는 데 유용하다. 본 논문에서는 기본 어휘를 바탕으로 기존의 명사 워드넷과 단일어 사전을 이용하여 한국어 동사 워드넷을 구축하는 방법을 제시한다. 본 논문에서 1차 작업을 통하여 구축한 동사 워드넷에는 동사 1,757개에 대한 4,717개의 의미(중복을 포함하면 모두 5,235개의 의미)를 포함하고 있으며 특별히 의미가 많이 편중된 14개의 개념에 속한 571개의 의미를 53개의 세부 개념으로 재분류하여 최종적으로 모두 767개의 계층적 개념으로 구성된 동사 워드넷이 만들어 졌다.

  • PDF

KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon (Bi-LSTM 기반의 한국어 감성사전 구축 방안)

  • Park, Sang-Min;Na, Chul-Won;Choi, Min-Seong;Lee, Da-Hee;On, Byung-Won
    • Journal of Intelligence and Information Systems
    • /
    • v.24 no.4
    • /
    • pp.219-240
    • /
    • 2018
  • Sentiment analysis, which is one of the text mining techniques, is a method for extracting subjective content embedded in text documents. Recently, the sentiment analysis methods have been widely used in many fields. As good examples, data-driven surveys are based on analyzing the subjectivity of text data posted by users and market researches are conducted by analyzing users' review posts to quantify users' reputation on a target product. The basic method of sentiment analysis is to use sentiment dictionary (or lexicon), a list of sentiment vocabularies with positive, neutral, or negative semantics. In general, the meaning of many sentiment words is likely to be different across domains. For example, a sentiment word, 'sad' indicates negative meaning in many fields but a movie. In order to perform accurate sentiment analysis, we need to build the sentiment dictionary for a given domain. However, such a method of building the sentiment lexicon is time-consuming and various sentiment vocabularies are not included without the use of general-purpose sentiment lexicon. In order to address this problem, several studies have been carried out to construct the sentiment lexicon suitable for a specific domain based on 'OPEN HANGUL' and 'SentiWordNet', which are general-purpose sentiment lexicons. However, OPEN HANGUL is no longer being serviced and SentiWordNet does not work well because of language difference in the process of converting Korean word into English word. There are restrictions on the use of such general-purpose sentiment lexicons as seed data for building the sentiment lexicon for a specific domain. In this article, we construct 'KNU Korean Sentiment Lexicon (KNU-KSL)', a new general-purpose Korean sentiment dictionary that is more advanced than existing general-purpose lexicons. The proposed dictionary, which is a list of domain-independent sentiment words such as 'thank you', 'worthy', and 'impressed', is built to quickly construct the sentiment dictionary for a target domain. Especially, it constructs sentiment vocabularies by analyzing the glosses contained in Standard Korean Language Dictionary (SKLD) by the following procedures: First, we propose a sentiment classification model based on Bidirectional Long Short-Term Memory (Bi-LSTM). Second, the proposed deep learning model automatically classifies each of glosses to either positive or negative meaning. Third, positive words and phrases are extracted from the glosses classified as positive meaning, while negative words and phrases are extracted from the glosses classified as negative meaning. Our experimental results show that the average accuracy of the proposed sentiment classification model is up to 89.45%. In addition, the sentiment dictionary is more extended using various external sources including SentiWordNet, SenticNet, Emotional Verbs, and Sentiment Lexicon 0603. Furthermore, we add sentiment information about frequently used coined words and emoticons that are used mainly on the Web. The KNU-KSL contains a total of 14,843 sentiment vocabularies, each of which is one of 1-grams, 2-grams, phrases, and sentence patterns. Unlike existing sentiment dictionaries, it is composed of words that are not affected by particular domains. The recent trend on sentiment analysis is to use deep learning technique without sentiment dictionaries. The importance of developing sentiment dictionaries is declined gradually. However, one of recent studies shows that the words in the sentiment dictionary can be used as features of deep learning models, resulting in the sentiment analysis performed with higher accuracy (Teng, Z., 2016). This result indicates that the sentiment dictionary is used not only for sentiment analysis but also as features of deep learning models for improving accuracy. The proposed dictionary can be used as a basic data for constructing the sentiment lexicon of a particular domain and as features of deep learning models. It is also useful to automatically and quickly build large training sets for deep learning models.