• 제목/요약/키워드: Semantic structure

검색결과 592건 처리시간 0.031초

Hierarchical Structure in Semantic Networks of Japanese Word Associations

  • Miyake, Maki;Joyce, Terry;Jung, Jae-Young;Akama, Hiroyuki
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.321-329
    • /
    • 2007
  • This paper reports on the application of network analysis approaches to investigate the characteristics of graph representations of Japanese word associations. Two semantic networks are constructed from two separate Japanese word association databases. The basic statistical features of the networks indicate that they have scale-free and small-world properties and that they exhibit hierarchical organization. A graph clustering method is also applied to the networks with the objective of generating hierarchical structures within the semantic networks. The method is shown to be an efficient tool for analyzing large-scale structures within corpora. As a utilization of the network clustering results, we briefly introduce two web-based applications: the first is a search system that highlights various possible relations between words according to association type, while the second is to present the hierarchical architecture of a semantic network. The systems realize dynamic representations of network structures based on the relationships between words and concepts.

  • PDF

현대 독일어 제2형 분사의 형용사 전환에 대한 제약 (Constraints on the Conversion of the Participle II in German)

  • 류병래
    • 한국언어정보학회지:언어와정보
    • /
    • 제6권1호
    • /
    • pp.41-69
    • /
    • 2002
  • This paper addresses the issue of constraints on the conversion of the participle II in German, proposing a constraint-based lexical semantic approach. I argue against the widely accepted syntactic view which is based on the dichotomous distinction of intransitive verbs, which has been advanced by the Unaccusative Hypothesis [Perlmutter (1978)]. Several arguments are also given against the semantic view which is based on some aspectual notions such as 'telicity', 'transformativity' or 'terminativity'. The crucial constraints on the conversion of the participle II in German, it is argued, is instead two lexical semantic entailments, movement with a definite change of location and affectedness. These and other lexical semantic entailments in the sense of Dowty (1991) are encoded into the multiple inheritance type hierarchy of qfpsoa. The proposal made in this paper is based on the multiple inheritance hierarchy which is envisaged in a recent framework of head-driven Phrase Structure Grammar.

  • PDF

이중주격구문의 의미구조 (Semantic Structure of Double Nominative Constructions)

  • 김경환
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.338-343
    • /
    • 2020
  • 언어의 통사, 의미, 형태 등 여러 다른 영역들을 동시에 그리고 독립적으로 생성되는 모듈로 보는 자율어휘문법을 기반으로 이중주격에 대한 의미론적 분석을 제시하는 것이 본 논문의 목적이다. 과거의 통사중심주의적 이론에서는 이중주격에 대한 분석방식으로 소유자인상, 예외적 격부여, 병합 등이 제시되었다. 통사중심주의적 이론과 달리 본 논문에서는 내적소유와 외적소유에 대한 기능-논항구조를 밝혀 이중주격에 대한 의미론적 분석을 제시한다. 이중주격에 사용되는 소유대상은 관계명사로 기능-논항구조에서 소유자를 논항으로 취하는 것으로 본다. 소유자에 해당되는 이 논항이 바로 관계명사와 결합하면 내적소유구문이 생성된다. 반면에 소유자가 공백상태인 경우 소유자와 공지시관계인 논항이 최종적으로 술어와 결합하여 그 결과 소유자가 주격으로 표현되는 외적소유구문이 생성된다. 외적소유의 기능-논항구조는 해당 문장이 내적소유와 달리 주격으로 표현된 소유자에 대해 서술하고 있음을 구조적으로 보여준다.

접사 구조 분석과 기계 학습에 기반한 한국어 의미 역 결정 (Korean Semantic Role Labeling Based on Suffix Structure Analysis and Machine Learning)

  • 석미란;김유섭
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.555-562
    • /
    • 2016
  • 의미 역 결정은 한 문장에서 술어와 그것의 논항간의 의미 관계를 결정해주는 것을 말한다. 한편 한국어 의미 역 결정은 영어와는 다른 한국어 고유의 특이한 언어 구조 때문에 많은 어려움을 가지고 있는데, 이러한 어려움 때문에 지금까지 제안된 다양한 방법들을 곧바로 적용하기에 어려움이 있었다. 다시 말하자면, 지금까지 제안된 방법들은 영어나 중국어에 적용했을 때에 비해서 한국어에 적용하면 낮은 성능을 보여주었던 것이다. 이러한 어려움을 해결하기 위하여 본 연구에서는 조사나 어미와 같은 접사구조를 분석하는 것에 초점을 맞추었다. 한국어는 일본어와 같은 교착어의 하나인데, 이들 교착어에서는 매우 잘 정리되어 있는 접사구조가 어휘에 반영되어 있다. 교착어는 바로 이들 잘 정의된 접사 구조 때문에 매우 자유로운 어순이 가능하다. 또한 본 연구에서는 단일 형태소로 이루어진 논항은 기초 통계량을 기준으로 의미 역 결정을 하였다. 또한 지지 벡터 기계(Support Vector Machine: SVM)과 조건부 무작위장(Conditional Random Fields: CRFs)와 갗은 기계 학습 알고리즘을 사용하여 앞에서 결정되지 못한 논항들의 의미 역을 결정하였다. 본 논문에서 제시된 방법은 기계 학습 접근 방식이 처리해야 하는 논항의 범위를 줄여주는 역할을 하는데, 이는 기계 학습 접근은 상대적으로 불확실하고 부정확한 의미 역 결정을 하기 때문이다. 실험에서는 본 연구는 15,224 논항을 사용하였는데, 약 83.24%의 f1 점수를 얻을 수 있었는데, 이는 한국어 의미 역 결정 연구에 있어서 해외에서 발표된 연구 중 가장 높은 성능으로 알려진 것에 비해 약 4.85%의 향상을 보여준 것이다.

비음수행렬분해와 위키피디아를 이용한 사용자기반의 문서요약 (User-based Document Summarization using Non-negative Matrix Factorization and Wikipedia)

  • 박선;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.53-60
    • /
    • 2012
  • 본 논문은 위키피디아의 외부지식을 이용하여 사용자의 질의를 확장하고, 확장된 질의와 문서집합의 내부구조를 표현하는 의미특징을 이용하여 문서를 요약하는 새로운 방법을 제안한다. 제안된 방법은 사용자의 초기 질의에 위키피디아 기반의 연관 피드백을 적용하여 사용자가 요구하는 요약문장을 추출할 수 있도록 질의를 확장하며, 비음수 분해된 문서의 의미특징을 이용함으로써 문서의 내부 구조를 잘 표현 할 수 있다. 확장된 질의와 의미특징을 이용하여 의미 있는 문장을 추출함으로써 사용자의 요구사항과 제안방법의 요약결과 사이의 의미적 차이를 감소시킨다. 실험결과 제안방법이 기존방법에 비해서 문서요약에 대해 더 좋은 성능을 보인다.

XML 데이터의 제약조건 보존을 위한 변환 기법 (A Transformation Technique for Constraints-preserving of XML Data)

  • 조정길;금영욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.1-9
    • /
    • 2009
  • XML 데이터를 효율적으로 저장하고 질의하기 위하며 많은 기법들이 제안되었다. 이러한 목표를 위한 한 가지 방법은 XML 데이터를 관계형 형식으로 변환하여 관계형 데이터베이스를 사용하는 것이다. 그러나 대부분의 연구가 XML의 내용과 구조만 변환하고 숨겨진 의미적 제약조건을 간과하거나 일부만 적용하였다. 따라서 이 논문에서는 XML Schema로부터 의미적 제약조건의 체계적인 추출 방법과 추출된 의미적 제약조건을 관계형 스키마로 변환할 때에 보존하는 방법을 제안한다. 변환 알고리즘은 XML Schema로부터 의미적 제약조건을 추출하고 보존하는데 이용되며, 추출된 의미적 정보들을 스키마표기법에 따라 재작성하여 어떻게 의미적 제약조건을 보존하는지를 보여준다. 또한 변환하는 동안에 올바른 관계형 스키마를 보증하기 위하여 제약조건 확인에 필요한 의미적 지식을 제공한다. 이 방법에서는 내용, 구조와 함께 무결성 제약조건들은 동시에 유지되며, 또한 저장 중복성을 줄일 수 있다.

의미기반 전자 카탈로그 이미지 검색을 위한 XML 데이타베이스 시스템 구현 (An Implementation of XML Database System for Semantic-Based E-Catalog Image Retrieval)

  • 홍성용;나연묵
    • 한국멀티미디어학회논문지
    • /
    • 제7권9호
    • /
    • pp.1219-1232
    • /
    • 2004
  • 최근 e-비즈니스나 인터넷 쇼핑몰 사이트에서 는 많은 양의 상품 이미지 정보와 컨텐츠를 취급하고 있으며 ,이로 인하여 이미지에 대한 효율적인 의미기반 검색의 필요성이 대두되고 있다. 본 논문에서는 XML과 퍼지기술을 이용하여 웹상의 상품 이미지를 의미적으로 검색할 수 있는 시스템에 대해 설명한다. 상품 카탈로그와 같은 다중 객체를 보유하고 있는 이미지에 대하여 의미 기반 검색을 수행할 수 있도록 상품 정보나 의미등의 메타데이타를 표현하는 다계층 메타데이타 구조를 사용한다. 이미지에 대한 의미기반 검색을 수행할 수 있도록 하기 위해 메타데이타를 저장하기 위한 XML 데이타베이스를 설계하고 퍼지 데이타를 적용할 수 있는 방법을 연구하였다. 본 논문에서 제시한 시스템은 이미지에 대한 메타데이타를 이용하여 퍼지 데이터를 자동 생성하고, 생성된 퍼지 데이타를 의미기반 이미지 검색에 사용한다. 따라서 의미기반 상품 이미지 검색에 대하여 사용자의 검색질의에 대한 정확성과 만족도를 증대 시킬 수 있다.

  • PDF

시맨틱 웹 자원의 랭킹을 위한 알고리즘: 클래스중심 접근방법 (A Ranking Algorithm for Semantic Web Resources: A Class-oriented Approach)

  • 노상규;박현정;박진수
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.31-59
    • /
    • 2007
  • We frequently use search engines to find relevant information in the Web but still end up with too much information. In order to solve this problem of information overload, ranking algorithms have been applied to various domains. As more information will be available in the future, effectively and efficiently ranking search results will become more critical. In this paper, we propose a ranking algorithm for the Semantic Web resources, specifically RDF resources. Traditionally, the importance of a particular Web page is estimated based on the number of key words found in the page, which is subject to manipulation. In contrast, link analysis methods such as Google's PageRank capitalize on the information which is inherent in the link structure of the Web graph. PageRank considers a certain page highly important if it is referred to by many other pages. The degree of the importance also increases if the importance of the referring pages is high. Kleinberg's algorithm is another link-structure based ranking algorithm for Web pages. Unlike PageRank, Kleinberg's algorithm utilizes two kinds of scores: the authority score and the hub score. If a page has a high authority score, it is an authority on a given topic and many pages refer to it. A page with a high hub score links to many authoritative pages. As mentioned above, the link-structure based ranking method has been playing an essential role in World Wide Web(WWW), and nowadays, many people recognize the effectiveness and efficiency of it. On the other hand, as Resource Description Framework(RDF) data model forms the foundation of the Semantic Web, any information in the Semantic Web can be expressed with RDF graph, making the ranking algorithm for RDF knowledge bases greatly important. The RDF graph consists of nodes and directional links similar to the Web graph. As a result, the link-structure based ranking method seems to be highly applicable to ranking the Semantic Web resources. However, the information space of the Semantic Web is more complex than that of WWW. For instance, WWW can be considered as one huge class, i.e., a collection of Web pages, which has only a recursive property, i.e., a 'refers to' property corresponding to the hyperlinks. However, the Semantic Web encompasses various kinds of classes and properties, and consequently, ranking methods used in WWW should be modified to reflect the complexity of the information space in the Semantic Web. Previous research addressed the ranking problem of query results retrieved from RDF knowledge bases. Mukherjea and Bamba modified Kleinberg's algorithm in order to apply their algorithm to rank the Semantic Web resources. They defined the objectivity score and the subjectivity score of a resource, which correspond to the authority score and the hub score of Kleinberg's, respectively. They concentrated on the diversity of properties and introduced property weights to control the influence of a resource on another resource depending on the characteristic of the property linking the two resources. A node with a high objectivity score becomes the object of many RDF triples, and a node with a high subjectivity score becomes the subject of many RDF triples. They developed several kinds of Semantic Web systems in order to validate their technique and showed some experimental results verifying the applicability of their method to the Semantic Web. Despite their efforts, however, there remained some limitations which they reported in their paper. First, their algorithm is useful only when a Semantic Web system represents most of the knowledge pertaining to a certain domain. In other words, the ratio of links to nodes should be high, or overall resources should be described in detail, to a certain degree for their algorithm to properly work. Second, a Tightly-Knit Community(TKC) effect, the phenomenon that pages which are less important but yet densely connected have higher scores than the ones that are more important but sparsely connected, remains as problematic. Third, a resource may have a high score, not because it is actually important, but simply because it is very common and as a consequence it has many links pointing to it. In this paper, we examine such ranking problems from a novel perspective and propose a new algorithm which can solve the problems under the previous studies. Our proposed method is based on a class-oriented approach. In contrast to the predicate-oriented approach entertained by the previous research, a user, under our approach, determines the weights of a property by comparing its relative significance to the other properties when evaluating the importance of resources in a specific class. This approach stems from the idea that most queries are supposed to find resources belonging to the same class in the Semantic Web, which consists of many heterogeneous classes in RDF Schema. This approach closely reflects the way that people, in the real world, evaluate something, and will turn out to be superior to the predicate-oriented approach for the Semantic Web. Our proposed algorithm can resolve the TKC(Tightly Knit Community) effect, and further can shed lights on other limitations posed by the previous research. In addition, we propose two ways to incorporate data-type properties which have not been employed even in the case when they have some significance on the resource importance. We designed an experiment to show the effectiveness of our proposed algorithm and the validity of ranking results, which was not tried ever in previous research. We also conducted a comprehensive mathematical analysis, which was overlooked in previous research. The mathematical analysis enabled us to simplify the calculation procedure. Finally, we summarize our experimental results and discuss further research issues.

의미적 의존 링크 토픽 모델을 이용한 생물학 약어 중의성 해소 (Semantic Dependency Link Topic Model for Biomedical Acronym Disambiguation)

  • 김선호;윤준태;서정연
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.652-665
    • /
    • 2014
  • 생물학 도메인은 약어 표현이 빈번하며, 실제로 문서에서 중요한 의미를 지니는 개체명들이 약어로 표현되는 경우가 많다. 본 연구에서는 토픽과 링크 정보를 이용하여 약어 중의성을 해결하고 동일한 의미를 가지는 다양한 형태의 약어 원형들(variant forms)에 대한 그룹핑을 시도한다. 이를 위하여 LDA(latent Dirichlet allocation) 기반 의미적 의존 링크 토픽 모델(semantic dependency topic model)을 제안한다. 해당 모델은 생성 모델(generative model)의 일종으로 문서 집합의 각 문서에 등장하는 단어들은 문서에서 발생하는 토픽 분포와 토픽 당 단어 분포에 의해 생성되어 있는 것으로 가정하고, 관측 가능한 문서 집합의 단어들로부터 문서에 내재된 숨어있는 토픽 구조를 추론하여 단어 생성과 토픽 파라미터를 연결시킨다. 본 연구에서는 토픽 정보 외에 단어들 사이에 존재하는 의미적 의존성(semantic dependency)을 링크로 정의하고, 단어 간에 존재하는 링크 정보, 특히 원형과 문장에서 공기하는 단어들 사이의 링크를 파라미터화하여 중의성 해결에 이용하였다. 결과적으로 주어진 문서에 등장하는 약어에 대해 가장 가능성 있는 원형은 해당 모델을 이용하여 추론된 단어-토픽, 문서-토픽, 단어-링크 확률에 의해서 결정된다. 제안하는 모델은 MEDLINE 초록으로부터 Entrez 인터페이스를 이용해 22개의 약어 집합과 186개의 가능한 약어 원형을 이용하여 질의를 생성하고, 이를 이용해 검색된 문서들을 대상으로 학습과 테스트에 이용하였다. 실험은, 주어진 문서에 등장하는 해당 약어에 대한 원형이 무엇인지 예측하는 방식으로 98.3%의 정확률의 높은 성능을 보였다.

에러 분석을 통한 사용자 중심의 메뉴 기반 인터페이스 설계 (Design of Menu Driven Interface using Error Analysis)

  • 한상윤;명노해
    • 대한인간공학회지
    • /
    • 제23권4호
    • /
    • pp.9-21
    • /
    • 2004
  • As menu structure of household appliance is complicated, user's cognitive workload frequently occurs errors. In existing studies, errors didn't present that interpretation for cognitive factors and alternatives, but are only considered as statistical frequency. Therefore, error classification and analysis in tasks is inevitable in usability evaluation. This study classified human error throughout information process model and navigation behavior. Human error is defined as incorrect decision and behavior reducing performance. And navigation is defined as unrelated behavior with target item searching. We searched and analyzed human errors and its causes as a case study, using mobile phone which could control appliances in near future. In this study, semantic problems in menu structure were elicited by SAT. Scenarios were constructed by those. Error analysis tests were performed twice to search and analyze errors. In 1st prototype test, we searched errors occurred in process of each scenario. Menu structure was revised to be based on results of error analysis. Henceforth, 2nd Prototype test was performed to compare with 1st. Error analysis method could detect not only mistakes, problems occurred by semantic structure, but also slips by physical structure. These results can be applied to analyze cognitive causes of human errors and to solve their problems in menu structure of electronic products.