• 제목/요약/키워드: 시소러스 구축 방안

검색결과 35건 처리시간 0.026초

역사용어 온톨로지 모형 적용 방안 연구 - 한국근현대사 인물을 중심으로 - (A Study on the Model of History Ontology: A Focus on Korean Modern Historical Person)

  • 이혜원;윤소영
    • 한국비블리아학회지
    • /
    • 제22권1호
    • /
    • pp.263-280
    • /
    • 2011
  • 본 연구에서는 역사인물 중심의 온톨로지를 구축하기 위해 기존의 한국역사용어시소러스의 문제점을 분석하는 동시에 한국역사용어시소러스 및 국편의 다양한 정보검색 시스템을 활용하는 전문가들의 인터뷰를 실시하였다. 한국역사용어시소러스의 개념 표현 기준과 전문가들이 작성한 마인드맵을 분석하여 현재 시스템과 전문가간의 정보 표현의 차이를 확인하였다. 이를 바탕으로 역사정보 이용자들의 정보요구에 부합하고 잠재력 있는 정보검색시스템에 적용할 역사용어 온톨로지 모형을 설계하였다. 본 연구에서는 먼저 클래스, 속성을 정의하고, 인스턴스 입력시 고려해야 할 점들을 나열함으로써, 역사정보가 갖는 고유한 특성들을 정리하였다. 또한 온톨로지의 장점인 개념 확장을 활용하여 역사정보의 다양한 특성들을 조합하고 이를 통해 새로운 정보를 제공할 수 있는 가능성을 제시하였다.

국내 인물데이터베이스의 구축과 서비스에 관한 비교 분석 (A Comparative Study about Construction and the Service of the Domestic Biographical Database)

  • 한상길
    • 한국도서관정보학회지
    • /
    • 제39권4호
    • /
    • pp.331-352
    • /
    • 2008
  • 인물데이터베이스는 우리나라에서 제작되어 서비스 되고 있는 데이터베이스 중 유료화가 가장 먼저 이루어졌고, 현재 활발히 서비스 되고 있는 데이터베이스이다. 본 연구에서는 국내 인물데이터베이스의 구축 및 서비스 현황을 살펴보고, 인물데이터베이스 구축과정에 대한 문제점과 검색항목 및 검색 방법을 비교분석한다. 이를 토대로 인물데이터베이스의 문제점을 분석하고, 이를 해결할 수 있는 방안을 제시한다. 그 대표적인 방안 중의 하나가 인물데이터베이스 구축에서 시소러스를 이용한 용어관계와 인물 속성데이터를 이용하는 것이다.

  • PDF

연구.학술정보 효율적 검색을 위한 온톨로지 기반의 주제 색인어 구조화 방안 연구 (A Study on Ontology-based Keywords Structuring for Efficient Information Retrieval)

  • 송인석
    • 정보관리연구
    • /
    • 제39권4호
    • /
    • pp.121-154
    • /
    • 2008
  • 본 연구에서는 정보검색도구 관점에서 지식조직체계로서 기존 시소러스 구축방안의 특성과 한계점을 검토하고, 대상 정보의 지식구조의 반영 및 정보 간의 의미관계 추론을 지원하는 온톨로지 기반의 주제 색인어 구조화 방안을 제시한다. 기존의 용어 중심의 시소러스와 달리, 단계별 연구프로세스 과정에서 수행되는 연구자의 정보행위 및 수요 분석에 때라 주제색인어의 개념을 식별 범주화하고, 인문사회과학 분야 학술논문의 지식체계를 구성하는 그 개념들 간의 유기적 관계정의를 통해 주제 색인어 집합의 의미구조를 정형화하였다. 이를 기반으로 각각의 온톨로지 기반 주제 색인어 집합은 구조화된 의미 색인으로서 대상 문서의 지식체계를 표현한다. 정보수요에 따라 정의된 공리나 추론규칙을 활용하여 이용자는 문제 해결에 적합한 정보를 대상 정보의 의미관계로 구성된 주제 도메인의 학술커뮤니케이션 네트워크상에서 분석적 정보탐색을 통해 효율적으로 검색 할 수 있다.

시맨틱 웹 응용 서비스에서의 텍스트 처리 기술 적용 (Use of Text Processing Technologies in a Semantic Web Application)

  • 정한민;강인수;구희관;이승우;김평;성원경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-196
    • /
    • 2006
  • 본 논문은 시맨틱 웹 응용 서비스를 구현함에 있어 필수적으로 요구되는 온톨로지 인스턴스 구축을 효율적으로 처리하는 데 있어 텍스트 처리 기술이 어떤 역할을 수행할 수 있는 가를 $OntoFrame-K^{(R)}$라는 시맨틱 웹 기반 정보 유통 체계에의 적용 사례를 통해 살펴본다. 본 논문에서 소개하는 텍스트 처리 기술은 개체 확인물 통한 개념 사례화, 주제 분야 할당을 통한 메타데이터 확장에, 그리고 인용 정보 추출 및 인용 관계 구축을 통한 객체 관계속성 구축에 적용된다. 개체 확인에서는 메타데이터 비교 잊 병합을 사용하였으며 이를 기반으로 한 수작업 구축을 통해 8,543명의 인력 URI를 확보하였다. 주제 및 분야 할당에서는 색인어와 분야분류명이 매핑된 시소러스 개념어의 매칭을 통해 색인어 별 TF (Term Frequency), 색인어와 매칭된 개념어 별 TF, 색인어와 매칭된 개념어 별 시소러스에서의 깊이, 색인어와 매칭된 개념어 별 개념 패싯, 색인어와 매칭된 각 개념어에 부착된 분야분류명 목록 등 할당을 위한 다양한 자질을 확보 적용하였다. 인용 정보 추출과 인용 관계 구축에서는 객체 URI와 인력 URI를 기반으로 하여 자동 추출된 인용 정보를 반영하는 방식으로 7,237개 문헌으로부터 총 135개의 인용 네트워크 그룹을 자동으로 확보하였다. 본 연구를 통해 제시된 텍스트 처리 기술의 활용 방안이 향후 시맨틱 웹 응용 서비스 및 인프라 구현에서 다각적으로 활용될 수 있기를 기대한다.

  • PDF

온톨러지 재사용을 위한 범주 재분류 (Category Reorganization for Ontology Reuse)

  • 양재군;이종혁;배재학;배재학
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.69-80
    • /
    • 2005
  • 본 논문에서는 기존 온톨러지를 가공하여 용도에 맞게 변환하는 방안을 모색하였다. 변환방법으로서는 범주정보 단순화와 구체화를 고안하였다. 이 각각은 다시 범주표제와 기저범주를 이용한 방법으로 나누어 생각하였다. 또한 상이한 범주집합들 사이의 관계를 밝히는 방법도 도출하였다. 정립한 변환 방법론을 활용하여, (1) Roget 시소러스로부터 7개의 범주로 구성된 '이야기 분석용 온톨러지'[32]의 원형을 구축하였고, (2) 이미 알려진 22가지 멀티미디어 게임 흡인요소를 바탕으로 세분화된 흡인요소 207가지를 발견할 수 있었으며[35], 그리고 (3) 10개의 심소와 22가지 멀티미디어 게임 흡인요소 사이의 관계를 밝혀낼 수 있었다[36].

WordNet상에서 컬러기반 감성어 관계 생성에 관한 연구 (A Study on Creation of Kansei-Vocabulary Relation associated with color in WordNet)

  • 백선경;조미영;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.568-570
    • /
    • 2004
  • 기존의 컬러 기반 감성시소러스 구축에서는 감성 어휘 관계 생성을 위해 IRI에서 개발한 단색이미지 스케일을 사용하여 컬러를 표현하였다. 그리고 컬러에 따라 연상되는 형용사를 단색 이미지 스케일에 배치하여 형용사 이미지 스케일의 공간관계를 생성하였다 즉, 컬러를 보고 연상되는 이미지를 형용사로 표현하고 색의 고유한 관계를 공간상에 배치하여 컬러 값에 따른 형용사를 매핑하였다. 이는 단순히 컬러의 관계만을 이용한 설정으로 의미적 감성어 표현에는 한계가 있었다. 이에 본 논문에서는 HP사의 'The Meaning of Color'표를 이용하여 컬러에 따른 감성 이미지를 정의하고, 정의된 어휘간의 의미적 표현을 위해 유의어, 동의어 관계 등을 포함한 WordNet 구조를 기반으로 새로운 감성어 관계 생성 방안을 제안한다. 방안을 제안한다.

  • PDF

귀금속.보석 상품정보 온톨로지 구축에 관한 연구 (A Study on the Development of Ontology based on the Jewelry Brand Information)

  • 이기영
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권7호
    • /
    • pp.247-256
    • /
    • 2008
  • 본 연구에서는 웹 문서에서의 단순 키워드 매칭으로 검색하는 전자상거래시스템의 문제점을 해결하기 위한 방안으로 도메인 온톨로지를 자동으로 생성하고 이를 기반으로 지능형 에이전트기술을 접목함으로서 의사소통이 단일화된 상품검색시스템을 개발한다. 온톨로지 개발은 국제상품분류코드(UNSPSC)와 귀금속 보석 사이트들의 분류정보를 기반으로 대표용어를 추출하고 유사관계 시소러스 적용하여 표준화된 온톨로지를 구축하며 지능형에이전트 기술을 검색 단계에서 접목시켜 사용자에게 정보수집의 효율성을 지원하도록 시맨틱 웹을 지원하는 상거래 시스템을 설계하고 구현한다. 또한 개인화된 검색 환경을 지원하기 위해 사용자 프로파일을 설계하고, 개인화 검색 에이전트와 추론기능을 이용한 검색 환경을 제공함으로서 정보수집의 신속성과 정확한 정보검색이 가능하도록 지원한다.

  • PDF

동형이의어의 구별을 위한 한글한정어 사용에 관한 연구 (A Study on Hangul Qualifier for Homographic Descriptors)

  • 김태수;최석두
    • 정보관리학회지
    • /
    • 제14권1호
    • /
    • pp.107-124
    • /
    • 1997
  • 다의성이 있는 용어를 색인어로 사용하게 되면 탐색자의 요구와 관계없는 주제가 검색되므로 잡음률이 높아지게 된다. 이를 방지하기 위하여 거의 모든 통제어휘시스템에서 색인어로 사용될 기입어가 다의성을 가질 때 한글, 한자, 외국어 등을 이용하여 동형이의어와 세부분야을 한정하고 있다. 그러나 여러 학문분야에 걸친 대단위 어휘사전을 구축하려고 할 때 이들을 이용하여 다의성을 해소하는 데는 미흡한 점이 많으며, 흔히 사용하고 있는 한자한정어도 많은 문제점을 안고 있다. 본 고에서는 색인어로 사용될 기입어가 다의성이 있을 때 한글 한정어를 부기하여 이들을 구별할 것을 제안한다. 한글한정어의 타당성, 사용범위, 사용원칙등에 대하여 시소러스를 중심으로 논하고 이 개념의 확대적용방안에 대하여 언급한다.

  • PDF

조선총독부 기록물을 위한 기능분류체계 개발 연구 (Function-Based Classification System for Public Records of Government-General of Chosun)

  • 설문원
    • 정보관리학회지
    • /
    • 제20권1호
    • /
    • pp.457-488
    • /
    • 2003
  • 조선총독부 공문서는 근대사 연구의 가장 핵심적인 정보원이다. 이 연구의 목적은 조선총독부 공문서를 원활히 활용할 수 있도록 지원하는 기능분류체계를 개발하기 위한 원칙과 단계를 제시하는 것이다. 우선, 기능적 분류체계를 위한 이론적 근거를 마련하기 위해 기록물 분류의 개념과 역할 분류 원칙에 대해 살펴보고, '기능적 출처' 개념 도입의 필요성을 제시하였다. 또한 조선총독부 공문서 분류에 왜 기능분류가 적합한지를 살펴보았고, 기능분류 사례와 그 시사점도 살펴보았다. 이러한 이론적 연구와 조선총독부 조직 및 기능 분석 결과를 토대로 조선총독부 기록물을 위한 분류체계 개발을 위한 원칙을 설정하였다. 아울러 개념화, 용어화, 기호화를 고려한 개발모형을 도출하였으며, 분류표와 함께 시소러스를 연계 구축할 수 있는 방안도 제시하였다.

단어클러스터링 시스템을 이용한 어휘의미망의 활용평가 방안 (The Method of the Evaluation of Verbal Lexical-Semantic Network Using the Automatic Word Clustering System)

  • 김혜경;송미영
    • 한국한의학연구원논문집
    • /
    • 제12권3호통권18호
    • /
    • pp.1-15
    • /
    • 2006
  • 최근 수년간 한국어를 위한 어휘의미망에 대한 관심은 꾸준히 높아지고 있지만, 그 결과물을 어떻게 평가하고 활용할 것인가에 대한 방안은 이루어지지 않고 있다. 본 논문에서는 단어클러스터링 시스템 개발을 통하여, 어휘의미망에 의해 확장되기 전후의 클러스터링을 수행하여 데이터를 서로 비교하였다. 단어클러스터링 시스템 개발을 위해 사용된 학습 데이터는 신문 말뭉치 기사로 총 68,455,856 어절 규모이며, 특성벡터와 벡터공간모델을 이용하여 시스템A를 완성하였다. 시스템B는 구축된 '[-하]동사류' 3,656개의 어휘의미를 포함하는 동사 어휘의미망을 활용하여 확장된 것으로 확장대상정보를 선택하여 특성벡터를 재구성한다. 대상이 되는 실험 데이터는 '다국어 어휘의미망-코어넷'으로 클러스터링 결과 나타난 어휘의 세 번째 층위까지의 노드 동일성 여부로 정확률을 검수하였다. 같은 환경에서 시스템A와 시스템B를 비교한 결과 단어클러스터링의 정확률이 45.3%에서 46.6%로의 향상을 보였다. 향후 연구는 어휘의미망을 활용하여 좀 더 다양한 시스템에 체계적이고 폭넓은 평가를 통해 전산시스템의 향상은 물론, 연구되고 있는 많은 어휘의미망에 의미 있는 평가 방안을 확대시켜 나가야 할 것이다.

  • PDF