• Title/Summary/Keyword: 집합관계 모델

Search Result 146, Processing Time 0.054 seconds

Correlation-based Automatic Image Captioning (상호 관계 기반 자동 이미지 주석 생성)

  • Hyungjeong, Yang;Pinar, Duygulu;Christos, Falout
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.10
    • /
    • pp.1386-1399
    • /
    • 2004
  • This paper presents correlation-based automatic image captioning. Given a training set of annotated images, we want to discover correlations between visual features and textual features, so that we can automatically generate descriptive textual features for a new unseen image. We develop models with multiple design alternatives such as 1) adaptively clustering visual features, 2) weighting visual features and textual features, and 3) reducing dimensionality for noise sup-Pression. We experiment thoroughly on 10 data sets of various content styles from the Corel image database, about 680MB. The major contributions of this work are: (a) we show that careful weighting visual and textual features, as well as clustering visual features adaptively leads to consistent performance improvements, and (b) our proposed methods achieve a relative improvement of up to 45% on annotation accuracy over the state-of-the-art, EM approach.

An Object-Oriented Retrieval Mechanism for Unstructed Image Repositories (비구조화된 이미지 저장소를 위한 객체지향 검색체계)

  • Cha, Gwang-Ho;Jeong, Jin-Wan
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.5 no.2
    • /
    • pp.263-272
    • /
    • 1999
  • 본 논문은 비구조화된 이미지 저장소로부터 효과적인 이미지검색을 위한 객체 지향 검색 체계를 제시한다. 본 검색 체계에서는 이미지의 내용을 정량적 특성을 갖는 시각 정보, 비정량적 특성을 나타내는 의미 정보, 그리고 가장 추상적인 정보를 포함하는 키워드의 세 종류로 규정한다. 시각 정보와 키워드는 특별한 구조없이 집합의 형태로 저장하고, 의미 정보는 상속과 군집 관계를 갖는 계층구조로 저장하는 것이 자연스럽다. 본 논문에서는 객체지향 모델을 사용하여 비구조화된 이미지 저장소를 위한 통일된 검색 체게를 제시한다. 제안된 검색 체계의 효과를 검증하기 위해 많은 이미지 집합에 대한 실험을 수행하였다.

Thesaurus Model based on Fuzzy Linguistic Relation Degree (퍼지 언어적 관련도에 근거한 시소러스 모델)

  • 최명복;김민구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.72-74
    • /
    • 1998
  • 정보검색 시스템에서 시소러스는 정보항목에 대한 용어들간의 관계를 계층적 구조로 나타낸다. 따라서 정보검색 시스템에서 시소러스의 사용은 이용자의 질의에 있는 탐색어와 관련된 정보항목들을 검색할 수 있기 때문에 정보검색 시스템의 검색효율을 크게 증가시킬 수 있다. 그러나 기존의 시소러스 모델들은 용어들간의 관련 정도를 무시하거나 정량적인 수치값으로 부여하기 때문에 인간의 주관성과 부정확성을 다루는데 적합하지 않다. 용어들간 의미의 밀접한 정도(Degree of Closeness)는 모호하고 부정확한 판단에 근거하는 인간의 정성적인 측정 단위이다. 그러므로 관련정도를 정량적으로 표현하는 것은 정성적 개념을 정확한 숫자 값으로 변환하는 것이기 때문에 인간의 정성적 측정 단위를 정확하고 용이하게 정량적으로 측도하여 반영한다는 것은 어렵다. 따라서 본 논문에서는 용어들간의 관련도를 정성적으로 부여한 시소러스 모델을 제안한다. 이 시소러스 모델에서는 색인어간의 관련도를 정성적으로 표현하기 위해 퍼지 집합 이론에 근거한 언어적 설명자들을 정의한다. 언어적 설명자들은 존재론적 문제가 고려되고 다분히 인식론적인 표현에 근거한다.

  • PDF

Design Editor for UML 2.0 Diagram Interchange Specification (UML 2.0 Diagram Interchange Specification 지원 메타 에디터 프로토타입 개발)

  • Jeong Yangejae;Shin Gusang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.417-420
    • /
    • 2004
  • UML은 1997년 버전 1.0이 나온 이후로 여러 변화를 거치면서 산업계의 표준으로 자리잡았다. UML 을 위한 다양한 툴이 개발되고 툴 사이의 모델 교환을 위해 UML XMI 이 개발 되었다. UML 2.0에서는 모델 교환뿐 아니라 다이어그램 정보와 노테이션에 대한 정보도 교환하기 위해 다이어그램 교환을 위한 스펙을 발표했다. 다이어그램은 노테이션의 집합으로 이루어지고 노테이션은 다시 여러 하위 노테이션으로 구성된다. Diagram Interchange Specification은 이런 관계를 XMI로 표현한다. 다이어그램 정보 교환을 지원하는 편집기는 XMI 를 주고받을 수 있는 부분과 다이어그램 구조에 따라 다이어그램과 노테이션을 생성할 수 있는 기능이 필요하다. 본 논문에서는 다이어그램 메타 모델을 이용하여 모델 중심의 메타편집기 프로토타입을 보여준다.

  • PDF

Hierarchical Learning for Semantic Role Labeling with Syntax Information (계층형 문장 구조 인코더를 이용한 한국어 의미역 결정)

  • Kim, Bong-Su;Kim, Jungwook;Whang, Taesun;Lee, Saebyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.199-202
    • /
    • 2021
  • 의미역 결정은 입력된 문장 내 어절간의 의미 관계를 예측하기 위한 자연어처리 태스크이며, 핵심 서술어에 따라 상이한 의미역 집합들이 존재한다. 기존의 연구는 문장 내의 서술어의 개수만큼 입력 문장을 확장해 순차 태깅 문제로 접근한다. 본 연구에서는 확장된 입력 문장에 대해 구문 분석을 수행 후 추출된 문장 구조 정보를 의미역 결정 모델의 자질로 사용한다. 이를 위해 기존에 학습된 구문 분석 모델의 파라미터를 전이하여 논항의 위치를 예측한 후 파이프라인을 통해 의미역 결정 모델을 학습시킨다. ALBERT 사전학습 모델을 통해 입력 토큰의 표현을 얻은 후, 논항의 위치에 대응되는 표현을 따로 추상화하기 위한 계층형 트랜스포머 인코더 레이어 구조를 추가했다. 실험결과 Korean Propbank 데이터에 대해 F1 85.59의 성능을 보였다.

  • PDF

The Study of UCC and 'Power law of Participation' for Web 2.0 Environment (웹 2.0 환경에서 UCC와 참여의 멱함수 법칙에 관한 연구)

  • Kang, Jang-Mook;Moon, Song-Chul
    • Journal of Digital Contents Society
    • /
    • v.9 no.2
    • /
    • pp.325-330
    • /
    • 2008
  • Production and distributon of UCC prepared User of UCC. Power law of participation is available tool for analysis of UCC user. We can devide collective intelligence and collaborative intelligence through power law of participation. We can analyze relation of paticipant and departmentalize type of participation, Power law of participation is available tool for platform design of production and distribution.

  • PDF

Semantic Dependency Link Topic Model for Biomedical Acronym Disambiguation (의미적 의존 링크 토픽 모델을 이용한 생물학 약어 중의성 해소)

  • Kim, Seonho;Yoon, Juntae;Seo, Jungyun
    • Journal of KIISE
    • /
    • v.41 no.9
    • /
    • pp.652-665
    • /
    • 2014
  • Many important terminologies in biomedical text are expressed as abbreviations or acronyms. We newly suggest a semantic link topic model based on the concepts of topic and dependency link to disambiguate biomedical abbreviations and cluster long form variants of abbreviations which refer to the same senses. This model is a generative model inspired by the latent Dirichlet allocation (LDA) topic model, in which each document is viewed as a mixture of topics, with each topic characterized by a distribution over words. Thus, words of a document are generated from a hidden topic structure of a document and the topic structure is inferred from observable word sequences of document collections. In this study, we allow two distinct word generation to incorporate semantic dependencies between words, particularly between expansions (long forms) of abbreviations and their sentential co-occurring words. Besides topic information, the semantic dependency between words is defined as a link and a new random parameter for the link presence is assigned to each word. As a result, the most probable expansions with respect to abbreviations of a given abstract are decided by word-topic distribution, document-topic distribution, and word-link distribution estimated from document collection though the semantic dependency link topic model. The abstracts retrieved from the MEDLINE Entrez interface by the query relating 22 abbreviations and their 186 expansions were used as a data set. The link topic model correctly predicted expansions of abbreviations with the accuracy of 98.30%.

Competency Theory and Practice for Developing a Extension Competency Model (농촌지도 역량모델 개발을 위한 이론과 실제)

  • Shim, Mi-Ok
    • Journal of Agricultural Extension & Community Development
    • /
    • v.15 no.1
    • /
    • pp.75-111
    • /
    • 2008
  • 본 연구는 국내 농촌지도인력 역량모델 개발을 위한 기초 연구로서 역량의 정의, 역량모델 개발방법, 인적자원개발을 위한 역량모델 활용 현황에 대한 문헌을 고찰하였다. 역량은 사용되는 상황이나 맥락에 따라서 다양하게 정의되고 있어 사전적인정의와 다양한 연구자들의 역량의 정의에 대한 이론, 특정한 조직이나 직업군에서 사용되고 있는 역량의 정의를 비교 분석하였으며, 결과적으로 역량은 개인의 역할 수행과 직무성과와 상관관계가 있으며 훈련과 개발을 통하여 개선되어질 수 있는 관련된 지식, 기술, 태도의 집합체로 정의하였다. 역량모델을 개발하는 방법도 다양한데, 초기단계에서는 탁월한 직원과 일반직원의 특정한 업무추진사례를 인터뷰와 관찰을 통하여 분석하여 이들 간에 차이를 가져오는 특성이나 행동을 추출하는 직무역량진단법이 주로 활용되었다. 이 방법에는 많은 비용과 시간이 소모되어 이를 간소화한 여러 가지 방법이 개발되었다. 또한 기존 직원 특성 분석보다 다양한 정보원과 미래에 대한 가정을 활용하여 바람직한 직무 결과와 역량, 역할을 추출하는 방법도 개발되었으며 직업이 빠르게 변화하는 시대적인 특성상 이런 방법의 활용이 확대되고 있다. 이런 다양한 방법 중 역량 모델을 활용할 직무나 조직의 특성에 맞는 방법을 선택하여 적용하여야 한다. 역량모델을 활용한 인적자원개발을 통하여 기업뿐만 아니라 정부조직에서도 효율적인 직원 역량 개발, 개인과 조직의 성과 향상 등의 효과가 나타나고 있으며, 앞으로 농촌지도조직에서도 지도인력 역량 개발과 지도사업의 효율성을 향상을 위하여 역량모델을 개발 활용할 필요성이 있다.

  • PDF

ORMN: A Deep Neural Network Model for Referring Expression Comprehension (ORMN: 참조 표현 이해를 위한 심층 신경망 모델)

  • Shin, Donghyeop;Kim, Incheol
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.7 no.2
    • /
    • pp.69-76
    • /
    • 2018
  • Referring expressions are natural language constructions used to identify particular objects within a scene. In this paper, we propose a new deep neural network model for referring expression comprehension. The proposed model finds out the region of the referred object in the given image by making use of the rich information about the referred object itself, the context object, and the relationship with the context object mentioned in the referring expression. In the proposed model, the object matching score and the relationship matching score are combined to compute the fitness score of each candidate region according to the structure of the referring expression sentence. Therefore, the proposed model consists of four different sub-networks: Language Representation Network(LRN), Object Matching Network (OMN), Relationship Matching Network(RMN), and Weighted Composition Network(WCN). We demonstrate that our model achieves state-of-the-art results for comprehension on three referring expression datasets.

A Semantic Text Model with Wikipedia-based Concept Space (위키피디어 기반 개념 공간을 가지는 시멘틱 텍스트 모델)

  • Kim, Han-Joon;Chang, Jae-Young
    • The Journal of Society for e-Business Studies
    • /
    • v.19 no.3
    • /
    • pp.107-123
    • /
    • 2014
  • Current text mining techniques suffer from the problem that the conventional text representation models cannot express the semantic or conceptual information for the textual documents written with natural languages. The conventional text models represent the textual documents as bag of words, which include vector space model, Boolean model, statistical model, and tensor space model. These models express documents only with the term literals for indexing and the frequency-based weights for their corresponding terms; that is, they ignore semantical information, sequential order information, and structural information of terms. Most of the text mining techniques have been developed assuming that the given documents are represented as 'bag-of-words' based text models. However, currently, confronting the big data era, a new paradigm of text representation model is required which can analyse huge amounts of textual documents more precisely. Our text model regards the 'concept' as an independent space equated with the 'term' and 'document' spaces used in the vector space model, and it expresses the relatedness among the three spaces. To develop the concept space, we use Wikipedia data, each of which defines a single concept. Consequently, a document collection is represented as a 3-order tensor with semantic information, and then the proposed model is called text cuboid model in our paper. Through experiments using the popular 20NewsGroup document corpus, we prove the superiority of the proposed text model in terms of document clustering and concept clustering.