• 제목/요약/키워드: 집합관계 모델

검색결과 146건 처리시간 0.027초

상호 관계 기반 자동 이미지 주석 생성 (Correlation-based Automatic Image Captioning)

  • Hyungjeong, Yang;Pinar, Duygulu;Christos, Falout
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1386-1399
    • /
    • 2004
  • 본 논문에서는 상호 관계에 기반한 자동 이미지 주석 생성 방법을 보인다 새로운 실험 이미지를 위한 자동 주석의 생성은 훈련 데이타 내의 주석과 함께 주어진 이미지들을 이용하여 이미지의 시각적 속성과 텍스트 속성의 상호 관계를 발견해 냄으로 수행된다. 본 논문에서 제시하는 상호 관계 기반 자동주석 생성 모델은 1) 시각적 속성의 적절한 군집화, 2) 시각적 속성과 텍스트 속성의 가중치 부여, 3) 노이즈 제거를 위한 차원 축소 등의 요소를 고려하여 설계된다. 실험은 680 MB의 Corel 이미지 데이터를 이용하여 각 10개의 데이타 집합에 대해 수행되었으며, 실험 결과, 시각적 속성과 텍스트 속성에 대한 가중치 부여와 시각적 속성의 적절한 군집화가 모델의 성능을 향상시키며, 본 논문에서 제시한 상호 관계기반 모델이 기존의 EM을 이용한 자동 주석 생성 모델에 비해 45%의 상대적 성능 향상을 보인다.

비구조화된 이미지 저장소를 위한 객체지향 검색체계 (An Object-Oriented Retrieval Mechanism for Unstructed Image Repositories)

  • 차광호;정진완
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권2호
    • /
    • pp.263-272
    • /
    • 1999
  • 본 논문은 비구조화된 이미지 저장소로부터 효과적인 이미지검색을 위한 객체 지향 검색 체계를 제시한다. 본 검색 체계에서는 이미지의 내용을 정량적 특성을 갖는 시각 정보, 비정량적 특성을 나타내는 의미 정보, 그리고 가장 추상적인 정보를 포함하는 키워드의 세 종류로 규정한다. 시각 정보와 키워드는 특별한 구조없이 집합의 형태로 저장하고, 의미 정보는 상속과 군집 관계를 갖는 계층구조로 저장하는 것이 자연스럽다. 본 논문에서는 객체지향 모델을 사용하여 비구조화된 이미지 저장소를 위한 통일된 검색 체게를 제시한다. 제안된 검색 체계의 효과를 검증하기 위해 많은 이미지 집합에 대한 실험을 수행하였다.

퍼지 언어적 관련도에 근거한 시소러스 모델 (Thesaurus Model based on Fuzzy Linguistic Relation Degree)

  • 최명복;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.72-74
    • /
    • 1998
  • 정보검색 시스템에서 시소러스는 정보항목에 대한 용어들간의 관계를 계층적 구조로 나타낸다. 따라서 정보검색 시스템에서 시소러스의 사용은 이용자의 질의에 있는 탐색어와 관련된 정보항목들을 검색할 수 있기 때문에 정보검색 시스템의 검색효율을 크게 증가시킬 수 있다. 그러나 기존의 시소러스 모델들은 용어들간의 관련 정도를 무시하거나 정량적인 수치값으로 부여하기 때문에 인간의 주관성과 부정확성을 다루는데 적합하지 않다. 용어들간 의미의 밀접한 정도(Degree of Closeness)는 모호하고 부정확한 판단에 근거하는 인간의 정성적인 측정 단위이다. 그러므로 관련정도를 정량적으로 표현하는 것은 정성적 개념을 정확한 숫자 값으로 변환하는 것이기 때문에 인간의 정성적 측정 단위를 정확하고 용이하게 정량적으로 측도하여 반영한다는 것은 어렵다. 따라서 본 논문에서는 용어들간의 관련도를 정성적으로 부여한 시소러스 모델을 제안한다. 이 시소러스 모델에서는 색인어간의 관련도를 정성적으로 표현하기 위해 퍼지 집합 이론에 근거한 언어적 설명자들을 정의한다. 언어적 설명자들은 존재론적 문제가 고려되고 다분히 인식론적인 표현에 근거한다.

  • PDF

UML 2.0 Diagram Interchange Specification 지원 메타 에디터 프로토타입 개발 (Design Editor for UML 2.0 Diagram Interchange Specification)

  • 정양재;신규상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.417-420
    • /
    • 2004
  • UML은 1997년 버전 1.0이 나온 이후로 여러 변화를 거치면서 산업계의 표준으로 자리잡았다. UML 을 위한 다양한 툴이 개발되고 툴 사이의 모델 교환을 위해 UML XMI 이 개발 되었다. UML 2.0에서는 모델 교환뿐 아니라 다이어그램 정보와 노테이션에 대한 정보도 교환하기 위해 다이어그램 교환을 위한 스펙을 발표했다. 다이어그램은 노테이션의 집합으로 이루어지고 노테이션은 다시 여러 하위 노테이션으로 구성된다. Diagram Interchange Specification은 이런 관계를 XMI로 표현한다. 다이어그램 정보 교환을 지원하는 편집기는 XMI 를 주고받을 수 있는 부분과 다이어그램 구조에 따라 다이어그램과 노테이션을 생성할 수 있는 기능이 필요하다. 본 논문에서는 다이어그램 메타 모델을 이용하여 모델 중심의 메타편집기 프로토타입을 보여준다.

  • PDF

계층형 문장 구조 인코더를 이용한 한국어 의미역 결정 (Hierarchical Learning for Semantic Role Labeling with Syntax Information)

  • 김봉수;김정욱;황태선;이새벽
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.199-202
    • /
    • 2021
  • 의미역 결정은 입력된 문장 내 어절간의 의미 관계를 예측하기 위한 자연어처리 태스크이며, 핵심 서술어에 따라 상이한 의미역 집합들이 존재한다. 기존의 연구는 문장 내의 서술어의 개수만큼 입력 문장을 확장해 순차 태깅 문제로 접근한다. 본 연구에서는 확장된 입력 문장에 대해 구문 분석을 수행 후 추출된 문장 구조 정보를 의미역 결정 모델의 자질로 사용한다. 이를 위해 기존에 학습된 구문 분석 모델의 파라미터를 전이하여 논항의 위치를 예측한 후 파이프라인을 통해 의미역 결정 모델을 학습시킨다. ALBERT 사전학습 모델을 통해 입력 토큰의 표현을 얻은 후, 논항의 위치에 대응되는 표현을 따로 추상화하기 위한 계층형 트랜스포머 인코더 레이어 구조를 추가했다. 실험결과 Korean Propbank 데이터에 대해 F1 85.59의 성능을 보였다.

  • PDF

웹 2.0 환경에서 UCC와 참여의 멱함수 법칙에 관한 연구 (The Study of UCC and 'Power law of Participation' for Web 2.0 Environment)

  • 강장묵;문송철
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권2호
    • /
    • pp.325-330
    • /
    • 2008
  • UCC가 개인들의 독특한 경험에 근거한 콘텐츠인만큼 그 실태와 유형 그리고 제작하는 동기 등이 다양하다. 다양한 유형과 동기로 활용되는 UCC를 분석할 수 있는 과학적인 도구는 어떤 것이 필요하며, 이런 현상들을 귀납적으로 수렴하여 하나의 이론적 틀로 담아낼 수는 없는지 연구하고, 이를 위해 소개된 국내, 국외 이론들과 연구 모델은 없는지 고찰하였다. 참여의 멱함수 법칙을 통해 UCC를 참여하는 스펙트럼을 이론적으로 분석하였다. 익명성을 통한 자유로운 의견 표출이 가능한 낮은 문턱의 참여(집합적 지성, Collective intelligence)와 책임성을 통한 높은 문턱의 참여(협력적 지성, Collaborative intelligence)로 나누었다. 낮은 참여 문턱에서의 집합적 지성과 높은 참여 문턱에서의 협력적 지성을 구분하는 잣대는 사용자들 사이의 연결의 정도라는 점을 알 수 있었다. 상호 연결성을 높이고 UCC 생산자, 배포자, 소비자 간의 연결의 접점을 넓혀 새로운 관계 구축을 지향하게 된다. UCC의 사용이 늘어날수록 UCC가 사용되는 플랫폼이 증가할수록 분석하는 과학적 준거의 틀을 찾기 힘든 현실에서 유용한 사례가 될 것이다.

  • PDF

의미적 의존 링크 토픽 모델을 이용한 생물학 약어 중의성 해소 (Semantic Dependency Link Topic Model for Biomedical Acronym Disambiguation)

  • 김선호;윤준태;서정연
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.652-665
    • /
    • 2014
  • 생물학 도메인은 약어 표현이 빈번하며, 실제로 문서에서 중요한 의미를 지니는 개체명들이 약어로 표현되는 경우가 많다. 본 연구에서는 토픽과 링크 정보를 이용하여 약어 중의성을 해결하고 동일한 의미를 가지는 다양한 형태의 약어 원형들(variant forms)에 대한 그룹핑을 시도한다. 이를 위하여 LDA(latent Dirichlet allocation) 기반 의미적 의존 링크 토픽 모델(semantic dependency topic model)을 제안한다. 해당 모델은 생성 모델(generative model)의 일종으로 문서 집합의 각 문서에 등장하는 단어들은 문서에서 발생하는 토픽 분포와 토픽 당 단어 분포에 의해 생성되어 있는 것으로 가정하고, 관측 가능한 문서 집합의 단어들로부터 문서에 내재된 숨어있는 토픽 구조를 추론하여 단어 생성과 토픽 파라미터를 연결시킨다. 본 연구에서는 토픽 정보 외에 단어들 사이에 존재하는 의미적 의존성(semantic dependency)을 링크로 정의하고, 단어 간에 존재하는 링크 정보, 특히 원형과 문장에서 공기하는 단어들 사이의 링크를 파라미터화하여 중의성 해결에 이용하였다. 결과적으로 주어진 문서에 등장하는 약어에 대해 가장 가능성 있는 원형은 해당 모델을 이용하여 추론된 단어-토픽, 문서-토픽, 단어-링크 확률에 의해서 결정된다. 제안하는 모델은 MEDLINE 초록으로부터 Entrez 인터페이스를 이용해 22개의 약어 집합과 186개의 가능한 약어 원형을 이용하여 질의를 생성하고, 이를 이용해 검색된 문서들을 대상으로 학습과 테스트에 이용하였다. 실험은, 주어진 문서에 등장하는 해당 약어에 대한 원형이 무엇인지 예측하는 방식으로 98.3%의 정확률의 높은 성능을 보였다.

농촌지도 역량모델 개발을 위한 이론과 실제 (Competency Theory and Practice for Developing a Extension Competency Model)

  • 심미옥
    • 농촌지도와개발
    • /
    • 제15권1호
    • /
    • pp.75-111
    • /
    • 2008
  • 본 연구는 국내 농촌지도인력 역량모델 개발을 위한 기초 연구로서 역량의 정의, 역량모델 개발방법, 인적자원개발을 위한 역량모델 활용 현황에 대한 문헌을 고찰하였다. 역량은 사용되는 상황이나 맥락에 따라서 다양하게 정의되고 있어 사전적인정의와 다양한 연구자들의 역량의 정의에 대한 이론, 특정한 조직이나 직업군에서 사용되고 있는 역량의 정의를 비교 분석하였으며, 결과적으로 역량은 개인의 역할 수행과 직무성과와 상관관계가 있으며 훈련과 개발을 통하여 개선되어질 수 있는 관련된 지식, 기술, 태도의 집합체로 정의하였다. 역량모델을 개발하는 방법도 다양한데, 초기단계에서는 탁월한 직원과 일반직원의 특정한 업무추진사례를 인터뷰와 관찰을 통하여 분석하여 이들 간에 차이를 가져오는 특성이나 행동을 추출하는 직무역량진단법이 주로 활용되었다. 이 방법에는 많은 비용과 시간이 소모되어 이를 간소화한 여러 가지 방법이 개발되었다. 또한 기존 직원 특성 분석보다 다양한 정보원과 미래에 대한 가정을 활용하여 바람직한 직무 결과와 역량, 역할을 추출하는 방법도 개발되었으며 직업이 빠르게 변화하는 시대적인 특성상 이런 방법의 활용이 확대되고 있다. 이런 다양한 방법 중 역량 모델을 활용할 직무나 조직의 특성에 맞는 방법을 선택하여 적용하여야 한다. 역량모델을 활용한 인적자원개발을 통하여 기업뿐만 아니라 정부조직에서도 효율적인 직원 역량 개발, 개인과 조직의 성과 향상 등의 효과가 나타나고 있으며, 앞으로 농촌지도조직에서도 지도인력 역량 개발과 지도사업의 효율성을 향상을 위하여 역량모델을 개발 활용할 필요성이 있다.

  • PDF

ORMN: 참조 표현 이해를 위한 심층 신경망 모델 (ORMN: A Deep Neural Network Model for Referring Expression Comprehension)

  • 신동협;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권2호
    • /
    • pp.69-76
    • /
    • 2018
  • 참조 표현이란 장면 영상 내의 특정 물체를 가리키는 자연어 문장들을 의미한다. 본 논문에서는 참조 표현 이해를 위한 새로운 심층 신경망 모델을 제안한다. 본 논문에서 제안하는 모델은 장면 영상 내 대상 물체의 영역을 찾아내기 위해, 참조 표현에서 언급하는 대상 물체뿐만 아니라 보조 물체, 그리고 대상 물체와 보조 물체 사이의 관계까지 풍부한 정보를 활용한다. 또한 제안 모델에서는 영상 내 각 후보 영역의 적합도 계산을 위해 물체 적합도와 관계 적합도를 참조 표현의 문장 구조에 따라 결합한다. 따라서, 본 모델은 크게 총 네 가지 서브 네트워크들로 구성된다: 언어 표현 네트워크(LRN), 물체 정합 네트워크(OMN), 관계 정합 네트워크(RMN), 그리고 가중 결합 네트워크(WCN). 본 논문에서는 세 가지 서로 다른 참조 표현 데이터집합들을 이용한 실험을 통해, 제안 모델이 현존 최고 수준의 참조 표현 이해 성능을 보인다는 것을 입증하였다.

위키피디어 기반 개념 공간을 가지는 시멘틱 텍스트 모델 (A Semantic Text Model with Wikipedia-based Concept Space)

  • 김한준;장재영
    • 한국전자거래학회지
    • /
    • 제19권3호
    • /
    • pp.107-123
    • /
    • 2014
  • 텍스트마이닝 연구의 기본적인 난제는 기존 텍스트 표현모델이 자연어 문장으로 기술된 텍스트 데이터로부터 의미 또는 개념 정보를 표현하지 않는데 기인한다. 기존 텍스트 표현모델인 벡터공간 모델(vector space model), 불리언 모델(Boolean model), 통계 모델(statistical model), 텐서공간 모델(tensor space model) 등은 'Bag-of-Words' 방식에 바탕을 두고 있다. 이러한 텍스트 모델들은 텍스트에 포함된 단어와 그것의 출현 횟수만으로 텍스트를 표현하므로, 단어의 함축 의미, 단어의 순서 및 텍스트의 구조를 전혀 표현하지 못한다. 대부분의 텍스트 마이닝 기술은 대상 문서를 'Bag-of-Words' 방식의 텍스트 모델로 표현함을 전제로 하여 발전하여 왔다. 하지만 오늘날 빅데이터 시대를 맞이하여 방대한 규모의 텍스트 데이터를 보다 정밀하게 분석할 수 있는 새로운 패러다임의 표현모델을 요구하고 있다. 본 논문에서 제안하는 텍스트 표현모델은 개념공간을 문서 및 단어와 동등한 매핑 공간으로 상정하여, 그 세 가지 공간에 대한 연관 관계를 모두 표현한다. 개념공간의 구성을 위해서 위키피디어 데이터를 활용하며, 하나의 개념은 하나의 위키피디어 페이지로부터 정의된다. 결과적으로 주어진 텍스트 문서집합을 의미적으로 해석이 가능한 3차 텐서(3-order tensor)로 표현하게 되며, 따라서 제안 모델을 텍스트 큐보이드 모델이라 명명한다. 20Newsgroup 문서집합을 사용하여 문서 및 개념 수준의 클러스터링 정확도를 평가함으로써, 제안 모델이 'Bag-of-Word' 방식의 대표적 모델인 벡터공간 모델에 비해 우수함을 보인다.