• 제목/요약/키워드: Thesaurus Integration

검색결과 8건 처리시간 0.027초

ERD시소러스를 이용한 뷰 통합 방법론 (A Methodology for View Integration Using ERD Thesaurus)

  • 이원조;고재진;장길상
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.553-562
    • /
    • 2004
  • 본 논문에서는 데이터베이스 설계시 중요한 과정인 개념설계 단계에서 개체관계도(Entity Relationship Diagram)의 정보를 저장하는 ERD시소러스(Thesaurus)를 구축하고, 이러한 ERD시소러스를 기반으로 하는 뷰 통합 방법론을 제시하고자 한다. 제시된 방법론의 유용성을 입증하기 위하여, 적용사례에 대한 뷰 통합지원시스템의 프로토타입을 구축하였다. 적용결과, ERD시소러스 기반의 방법론이 기존의 뷰 통합 방법론보다 친밀도 분석, 의미충돌 해결, 유 통합과정에서 더 효과적임을 확인할 수 있었다. 따라서 이 방법론이 기존의 단편화된 스키마의 통합이나 대규모 데이터베이스 통합 설계시 유용하게 활용될 수 있을 것으로 기대된다.

시소러스 통합을 위한 개념기반 패싯 프레임워크 구축 (Construction of the Concept-Based Faceted Framework for Thesaurus Integration)

  • 이승민
    • 한국도서관정보학회지
    • /
    • 제41권3호
    • /
    • pp.269-290
    • /
    • 2010
  • 각각의 시소러스가 지닌 고유한 특성 및 상이한 구축목적으로 인해서, 하나의 시소러스를 이용하여 특정 도메인의 정보를 조직하고 검색하는데 여러 가지 문제가 나타나고 있다. 시소러스의 통합은 이러한 문제를 해결하기 위한 한 가지 방법이 될 수 있다. 본 연구에서는 물리학 분야에서 널리 사용되고 있는 시소러스인 PACS와 PIRA를 선정하여 이들 시소러스를 개념적으로 통합할 수 있는 패싯 프레임워크를 구축하였다. 이들 두 시소러스를 연결하기 위해 물리학 분야 전체를 다룰 수 있는 계층구조를 구축하였고, 이 계층구조에 패싯분석을 적용함으로써 각각의 주제 사이의 관계를 설정할 수 있는 하나의 지식기반을 제공하고 있다. 또한, 이 개념기반 패싯 프레임워크를 통해 보다 효율적으로 정보를 조직하고 검색할 수 있는 접근방법을 제안하고 있다.

  • PDF

스키마 통합을 위한 시소러스의 활용 방안 (Utilization of Thesaurus for Schema Integration)

  • 이원조;이단영;권순덕;고재진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.668-670
    • /
    • 2003
  • 최근 정보기술의 급속한 발달로 기존 정보시스템의 확장을 위한 데이터베이스 재설계에 대한 사용자들의 요구에 직면해 있다. 그러나 기존 데이터베이스 시스템은 다중 서버에 분산되어 있거나, 규모가 방대하여 확장을 위한 재설계에 많은 비용을 지불하고 있다. 따라서 기존 데이터베이스에서 서브스키마들의 정보를 추출하고, 이들간의 유사성 분석을 통하여 의미충돌을 해결하는 통합 방법을 적용하고 있는데, 본 연구에서는 이를 지원하기 위한 서브스키마의 유사성 분석을 위한 시소러스의 활용 방안을 제시한다.

  • PDF

XML을 이용한 데이터베이스 통합방안에 관한 연구 (A Study on the Database Integration Methodology using XML)

  • 오세웅;이홍걸;이철영;박종민;서상현
    • 한국항해항만학회지
    • /
    • 제29권10호
    • /
    • pp.883-890
    • /
    • 2005
  • 물류환경에 있어서 데이터베이스 통합의 문제는 중요 과제로 인식되어 스키마 통합 시 발생하는 스키마 충돌을 이론적인 측면에서의 해결 방법이 제시되었으나 실제 시스템 구현 측면에서의 연구는 부족한 실정이다. 본 연구는 실제적인 DB 통합법과 관련하여 XML 기술을 이용한 통합법을 제시하고 통합 알고리즘으로 개체 및 속성간의 유사도 측정에 기반한 계량화된 충돌 식별법을 사용하였다. 구체적으로 DB 스키마를 XML 스키마로 변환시켜 개체명과 속성명을 추출한 다음, DB 통합 시 빈번히 발생하는 의미적 충돌(Semantic Conflict) 현상인 이른바 이름 충돌 식별을 위한 하나의 해결법으로서 시소러스(Thesaurus) 사전과 형태소 분석을 통해 개체 및 속성 간 종합적인 유사도 측정하는 계량화된 식별방안을 사용하였다.

XML을 이용한 데이터베이스 통합방안에 관한 연구 (A Study on the Database Integration Methodology using XML)

  • 오세웅;이홍걸;이철영;박종민;서상현
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2005년도 추계학술대회 논문집
    • /
    • pp.353-360
    • /
    • 2005
  • 물류환경에 있어서 데이터베이스 통합의 문제는 중요한 과제로 인식되어 왔으나, 기존 연구들은 스키마 통합 시 발생하는 스키마 충돌을 이론적인 측면에서의 해결 방법만 제시하고 실제 시스템 구현 측면에서의 연구는 부족한 실정이다. 본 연구는 실제적인 DB 통합법과 관련하여 XML 기술을 이용한 통합법을 제시하고 통합 알고리즘으로 개체 및 속성간의 유사도 측정에 기반을 둔 계량화된 충돌 식별법을 사용한다. 구체적으로 DB 스키마를 XML 스키마로 변환시켜 개체명과 속성명을 추출한 다음, DB 통합 시 빈번히 발생하는 의미적 충돌(Semantic Conflict) 현상인 이른바 "Name Conflict"의 식별을 위한 하나의 해결법으로서 시소러스(Thesaurus) 사전과 형태소 분석을 통해, 개체 및 속성 간 종합적인 유사도 측정하는 계량화된 식별방안을 사용하였다

  • PDF

통합의학언어 시스템(UMLS)의 구성 및 적용에 대한 고찰 (A Review of Structure and Application of Unified Medical Language System(UMLS))

  • 김혜선
    • 정보관리연구
    • /
    • 제32권2호
    • /
    • pp.26-39
    • /
    • 2001
  • 효과적인 정보검색 도구로 활용되는 시소러스, 분류표 등의 통제어휘집들은 동일한 개념이나 의미를 표현하는데 서로 다른 어휘를 사용하고 있다. 이러한 동일 개념에 대한 용어 표현차이로 인한 정보의 검색 및 통합문제를 해결하기 위하여 미국국립의학도서관은 통합의학언어시스템(Unified Medical Language System : 이하 UMLS)을 개발하였다. UMLS 개발은 1986년부터 시작된 장기 프로젝트로서 2001년판 UMLS는 메타시소러스, 의미망, 전문가 사전의 세가지 요소로 구성되어 있다. 본고는 UMLS의 개발배경과 구성요소 및 PubMed, NLM Gateway에서의 적용사례에 대해 고찰하였다.

  • PDF

데이터베이스의 효과적인 통합방안에 관한 연구 - Name Conflict의 식별을 중심으로- (A Study on the Effective Database Integration Methodology - The Identification of Name Conflict -)

  • 이홍걸;비가방언;부사천효지
    • 한국항해항만학회지
    • /
    • 제29권5호
    • /
    • pp.457-464
    • /
    • 2005
  • 물류환경에 있어서, 데이터베이스의 연계와 데이터베이스 통합의 문제는 매우 중요한 과제로 인식되어 왔다. 그러나, 여기에 대한 빈번한 문제제기에 비해 합리적인 데이터베이스 통합방안에 관한 학술적 측면의 연구는 아직까지 매우 미흡한 실정이다. 본 연구는 효과적인 DB통합법과 관련하여 개체 및 속성 간의 유사도 측정에 기반을 둔 계량화된 충돌 식별법을 제안하는 것을 연구의 목적으로 한다. 구체적으로, DB 통합 시 빈번히 발생하는 의미적 충돌(Semantic Conflict)현상인 이른바 "Name Conflict"의 식별을 위한 하나의 해결법으로서 개체 및 속성 간 종합적인 유사도를 측정하는 계량화된 식별법을 제안하고자 한다. 그리고, 간단한 예제를 통해 제안한 방안의 유효성과 식별방안을 가늠해 보고자 한다.

GSN 기반 DB통합 모델에서의 data value 이질성 해결 기법 (A Data Value Heterogeneity Solving Method In A GSN Based DataBase Integration Model)

  • 홍종하;박성공;이종옥;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.331-333
    • /
    • 2001
  • 분산되고 이질적인 환경에서의 정보 소스들을 통합하려는 노력은 끊임 없이 계속되어 왔다. 이질적인 다중 정보소스로부터 추출된 정보를 통합하는 도구를 개발하는 것은 인터넷 기반에서 다양한 정보들을 실시간으로 사용할 수 있다는 측면에서 아주 흥미로운 일이다. 이러한 도구를 개발하는데 있어서의 주된 문제점은 서로 다른 정보소스에 존재하지만 실제적으로는 같은 실세계의 개념을 가지고 있는 정보를 어떻게 효과적으로 표현할 것인가 하는 것이다. 이러한 의미적 이질성을 해결하기 위해서 WordNet이나 Common Thesaurus 등을 이용한 개념 기반의 접근방법이 많이 제안되었다. 하지만 이들은 스키마 이질성을 해결하는 방법을 제시 할 뿐, 데이터의 이질성을 해결 하는 방법은 보여주지 않는다. 본 논문에서는 GSN(Global Semantic Network)을 이용해서 스키마 이질성을 해결해야 데이터베이스 시스템에서 발생하는 데이터 이질성의 예를 제시하고 이러한 데이터 이질성을 해결할 수 있는 기법을 제안한다.

  • PDF