• 제목/요약/키워드: 시소러스 병합

검색결과 3건 처리시간 0.022초

토픽맵을 이용한 시소러스의 구조화 연구 (A Study on the Thesaurus Construction Using the Topic Map)

  • 남영준
    • 정보관리학회지
    • /
    • 제22권3호
    • /
    • pp.37-53
    • /
    • 2005
  • 시소러스의 효율성을 유지하기 위해서는 지속적인 용어 관리가 절대적으로 필요하다. 실제적으로 특정 주제영역의 정보와 키워드들은 생성과 분화, 소멸 과정 등이 동적으로 이루어지기 때문에 시소러스의 효율적인 관리가 매우 어려운 실정이다. 따라서 시소러스의 구조와 관리를 유연하게 수행할 수 있는 방안이 필요하다. 이에 따라 본 연구에서는 토픽맵의 기본요소인 토픽과 대상물, 연관관계 등을 활용하여 시소러스 관리를 위한 구조화 방안을 제안하였다. 한편 구조체계의 맵핑 알고리즘과 구조체계의 병합 알고리즘을 이용한 시소러스 기본관계와 세부관계 표현 방법도 제안하였다. 또한 토픽 타입을 이용한 연결중심문서를 기준으로 디스크립터의 확장과 디스크립터의 대치 방안을 제시하였다. 특히, 고정된 개념을 통한 이중 용어관리라는 새로운 방안도 개발하였다. 이는 시간과 공간의 비종속적인 개념을 표현하는 용어를 고정시키고, 해당 개념의 범주에 속하면서 외부의 정보적 상황에 따라 디스크립터를 자유롭게 선정하는 방법이다.

"뉴스 코어 시소러스"의 구축 및 활용 방안에 관한 연구 (A Study on the Establishment and Applications of the "News Core Thesaurus")

  • 장인호
    • 한국도서관정보학회지
    • /
    • 제44권3호
    • /
    • pp.489-512
    • /
    • 2013
  • 본 연구는 뉴스 정보의 효율적인 색인 작성과 검색을 위한 뉴스 코어 시소러스를 구축하고 활용 방안을 제시한다. 뉴스 코어 시소러스는 뉴스의 모든 주제를 커버할 수 있는 매크로시소러스로 구축하여, 향후 정치, 경제사회, 문화 등의 마이크로시소러스를 부분집합으로 가질 수 있도록 하였다. 뉴스 코어 시소러스는 디스크립터 2,012어, 비디스크립터 74어를 SKOS(Simple Knowledge Organization System)로 구현하였다. 일간신문이 아닌 주간이나 격주간 등의 정보량이 적고, 특수한 주제를 다루는 신문은 특수 주제영역만 상세히 다루고, 대형의 뉴스 아카이브나 포털 사이트에서는 각각의 마이크로시소러스를 병합 또는 통합하여 활용할 수 있는 방안을 제시한다.

시맨틱 웹 응용 서비스에서의 텍스트 처리 기술 적용 (Use of Text Processing Technologies in a Semantic Web Application)

  • 정한민;강인수;구희관;이승우;김평;성원경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-196
    • /
    • 2006
  • 본 논문은 시맨틱 웹 응용 서비스를 구현함에 있어 필수적으로 요구되는 온톨로지 인스턴스 구축을 효율적으로 처리하는 데 있어 텍스트 처리 기술이 어떤 역할을 수행할 수 있는 가를 $OntoFrame-K^{(R)}$라는 시맨틱 웹 기반 정보 유통 체계에의 적용 사례를 통해 살펴본다. 본 논문에서 소개하는 텍스트 처리 기술은 개체 확인물 통한 개념 사례화, 주제 분야 할당을 통한 메타데이터 확장에, 그리고 인용 정보 추출 및 인용 관계 구축을 통한 객체 관계속성 구축에 적용된다. 개체 확인에서는 메타데이터 비교 잊 병합을 사용하였으며 이를 기반으로 한 수작업 구축을 통해 8,543명의 인력 URI를 확보하였다. 주제 및 분야 할당에서는 색인어와 분야분류명이 매핑된 시소러스 개념어의 매칭을 통해 색인어 별 TF (Term Frequency), 색인어와 매칭된 개념어 별 TF, 색인어와 매칭된 개념어 별 시소러스에서의 깊이, 색인어와 매칭된 개념어 별 개념 패싯, 색인어와 매칭된 각 개념어에 부착된 분야분류명 목록 등 할당을 위한 다양한 자질을 확보 적용하였다. 인용 정보 추출과 인용 관계 구축에서는 객체 URI와 인력 URI를 기반으로 하여 자동 추출된 인용 정보를 반영하는 방식으로 7,237개 문헌으로부터 총 135개의 인용 네트워크 그룹을 자동으로 확보하였다. 본 연구를 통해 제시된 텍스트 처리 기술의 활용 방안이 향후 시맨틱 웹 응용 서비스 및 인프라 구현에서 다각적으로 활용될 수 있기를 기대한다.

  • PDF