• 제목/요약/키워드: 메타시소러스

검색결과 26건 처리시간 0.03초

질의어 자동수정을 이용한 메타시소러스 검색 방법 (The Method of Searching Metathesaurus, Using Automatic Modified a Query)

  • 김종광;하원식;김태용;류중경;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.454-456
    • /
    • 2003
  • UMLS(2003AA edition 기준)의 메타시소러스는 다국어를 지원하며 875.233개의 개 (concept)과 2,146,897개의 개념명(concept name)을 포함한다. 현재 UMLS 메타시소러스 검색을 제공하는 PubMed나 NLM에서는 UMLS에서는 개념명에 존재하지 않는 잘못된 질의나, 잘못된 구문 또는 개념명의 일부를 이용한 검색이 불가능하다. 이는 사용자가 UMLS에서 정보를 얻기 위해서는 정확한 의학용어를 숙지해야 되며. UMLS 메타시소러스의 데이터가 잘못 되었을 경우 정보를 얻을 수 없다. 본 연구에서는 이러한 문제점을 보완하기 위해서 자연어처리에서 연구되고 있는 문자열 간의 유사도 측정방식을 적용하여 잘못된 질의어에 대한 자동수정 기능을 이용한 메타시소러스 검색방법을 제안한다. 제안한 방법에서는 질의어를 자동수정하기 위하여 철자사전을 자동으로 추출하고 문자열 비교알고리즘을 도입하여 질의어와 철자사전간의 용어의 유사도를 측정한다. 유사도에 의하여 얻어진 용어를 메타시소러스의 형식에 맞게 변환하여 질의에 대한 최적의 결과를 얻을 수 있도록 한다. 제안된 방법의 성능을 평가하기 위해서 최근(2003년 8월) bi-gram 방식을 도입한 NLM에서의 시스템과 비교 평가한다.

  • PDF

시소러스 브라우저 자동구현을 위한 Metadata를 이용한 색인어 처리방안에 대한 연구 (A Theoretical Study on Indexing Methods using the Metadata for the Automatic Construction of a Thesaurus Browser)

  • 서휘
    • 한국도서관정보학회지
    • /
    • 제35권4호
    • /
    • pp.451-467
    • /
    • 2004
  • 본 연구에서는 시소러스 브라우저를 자동으로 구성하기 위한 방법에 대한 이론적인 연구와 함께 시소러스 브라우저 구성과정의 핵심인 자동색인과 용어 간 계층을 자동으로 형성하는 클러스터링 알고리즘에 대한 선행 연구결과를 제시하였다. 그리고 웹 문헌에서 전통적인 종이 형태 문헌의 서지사항에 해당하는 메타데이터를 분석하고 이를 처리하는 방안을 조사함에 의해 웹 문헌에서 색인어를 자동으로 추출할 수 있는 방안에 대하여 연구하였다. 또한 대부분의 웹 문헌에 메타데이터가 수록되어 있지 않음에 착안하여 기존의 웹 문헌에 메타데이터 자동 편집기를 이용하여 메타데이터를 수록하는 방안에 대한 연구결과를 제시하였다.

  • PDF

기초학문자료 메타데이터 설계 분석 및 온톨로지 적용 방안 연구 (A Study on Design and Analysis of Metadata and Ontology based on Humanities and Social Sciences)

  • 이정연;김정민;최석두;김이겸
    • 한국문헌정보학회지
    • /
    • 제41권2호
    • /
    • pp.291-316
    • /
    • 2007
  • 기초학문자료의 특성인 복잡한 관계의 개념구조, 자료유형 및 자료간의 의미적 상관관계 등을 표현할 수 있는 기초학문자료 메타데이터 모형을 설계하였다. 설계된 메타데이터 모형의 정당성 및 효율성을 평가하기 위해 실제 구축된 자료의 분석을 토대로 실제적인 메타데이터 구성요소를 제시하였다. 메타데이터의 기반검색의 한계를 극복할 수 있는 확장된 시소러스를 설계하였으며 도메인 온톨로지를 구축하는 방안을 모색해 보았다. 또한 철학 종교학 분야의 주제분류 중심의 확장시소러스를 설계하고 토픽맵 기반 시스템으로 구현하여 주제 중심의 메타데이터 검색이 가능함을 보였다.

통합의학언어 시스템(UMLS)의 구성 및 적용에 대한 고찰 (A Review of Structure and Application of Unified Medical Language System(UMLS))

  • 김혜선
    • 정보관리연구
    • /
    • 제32권2호
    • /
    • pp.26-39
    • /
    • 2001
  • 효과적인 정보검색 도구로 활용되는 시소러스, 분류표 등의 통제어휘집들은 동일한 개념이나 의미를 표현하는데 서로 다른 어휘를 사용하고 있다. 이러한 동일 개념에 대한 용어 표현차이로 인한 정보의 검색 및 통합문제를 해결하기 위하여 미국국립의학도서관은 통합의학언어시스템(Unified Medical Language System : 이하 UMLS)을 개발하였다. UMLS 개발은 1986년부터 시작된 장기 프로젝트로서 2001년판 UMLS는 메타시소러스, 의미망, 전문가 사전의 세가지 요소로 구성되어 있다. 본고는 UMLS의 개발배경과 구성요소 및 PubMed, NLM Gateway에서의 적용사례에 대해 고찰하였다.

  • PDF

시소러스 구축을 위한 웹 기반 워크벤치 개발 (Development of Web-based Workbench for the Construction of Thesaurus)

  • 이승준;정한민;성원경;최광;이상헌;최석두
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.999-1004
    • /
    • 2006
  • 본 연구에서는 다양한 개념 패싯과 관계 패싯들을 수용한 범용 과학기술 시소러스 구축용 웹 기반 워크벤치 개발에 대해 기술한다. 기존 국내 시소러스 구축용 워크벤치들이 제공하는 기본적인 용어 관계구축 기능을 확장하여 개념 패싯, 범주 관계 패싯, 의미역 관계 패싯, 속성 관계 패싯 및 속성 키워드 처리 기능을 원활히 제공할 수 있는 사용자 중심적 워크벤치를 개발함으로써 시소러스 상의 개념들에 대한 효율적인 구축이 가능하도록 한다. 또한 시멘틱 웹 상의 온톨로지 영역에 보다 근접한 고도화되니 시소러스 구축을 위해 용어들을 개념화시키고, 개념간의 다양한 관계를 설정하는 프로세스 중심적 설계로 분야 적합성이 높은 정보 처리 기반을 갖춘다. 궁극적으로 여러 마이크로 시소러스들을 통합하여 운용할 수 있는 복합 모델을 구축하는 것을 목표로 하고 있다. 이러한 목적에 부합하는 시스템 구현을 위해 CBD(Component Based Development) 개발 방법론으로 MSF/CD를 이용하였으며, 분산 환경에서 이기종간의 데이터 교환을 용이하게 하기 위하여 웹 서비스 (XML Web Services)를 이용하였다. 또한 시멘틱 웹 기반 연구자 간 협업 지원 서비스 구현을 위한 확장 검색용으로서도 활용할 수 있도록 하였다. 시소러스 반출은 CSV, XML 및 RDF를 모두 지원할 수 있도록 함으로써 다양한 사용자 요구 사항에 부합할 수 있도록 하였다. 시소러스 브라우징을 시각화 기반의 3단계 구조를 가진 플래시로 구현하여 사용자가 쉽게 시소러스를 탐색하고 분석할 수 있는 기반을 제공하였다. 또한 다양한 검색 요구를 만족시키고자 기본 검색, 고급 검색, 메타 검색을 선택할 수 있도록 하며, 개념 편집 및 시소러스 브라우징과 연동시켜 효율적인 시소러스 구축이 가능하도록 하였다. 본 연구의 워크벤치를 이용하여 구축된 시소러스는 기존 시소러스들에 비해 사용자가 보다 폭넓은 의미 기반 검색을 수행할 수 있도록 함으로써 다각적인 정보를 쉽게 획득할 수 있는 기반을 마련하고 있다는 데 의의가 있으며, 다국어 시소러스 및 다중 시소러스를 수용할 수 있는 방향으로 발전시킬 계획이다.

  • PDF

객체지향 시소러스를 RDF Schema로 변환하기 위한 매핑 구조의 설계 및 구현 (Design of Mapping Structure and Implementation to transform Object-Oriented Thesaurus into RDF Schema)

  • 양경아;방선이;양재동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.289-291
    • /
    • 2002
  • 본 논문에서는 객체지향 패러다임의 구조적 특성을 적용하여 만든 시소러스를 이용하여 웹 자원의 의미적 연관성을 RDF 형식으로 표현할 수 있는 RDF 문서 자동 생성기를 소개한다. 객체지향 시소러스를 RDF 형식으로 나타내기 위해 시소러스에 사용된 객체와 관계의 내용을 명세한 네임 스페이스를 정의하여 시맨틱 웹에서 메타데이타를 기술하는 표준이 되는 RDF와 RDF Schema 형식으로 매핑할 수 있다. 이러한 연구를 통해 객체지향 시소러스의 내용을 RDF 형식으로 표현함으로써 지식베이스(KnowledgeBase)라 불리는 온톨로지를 생성할 수 있으며, 구축된 온톨로지는 시맨틱 웹 상의 에이전트나 다른 어플리케이션에 응용될 수 있다.

  • PDF

과학기술 분야 시소러스 상에서의 패싯들 (Facets on Thesaurus for Science and Technology Domain)

  • 정한민;성원경;박동인;황순희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.535-537
    • /
    • 2005
  • 본 논문에서는 시소러스 상에서 개념간 세분화를 위한 의미적 기준인 개념 패싯 (Conceptual Facet)과 관계 패싯 (Relational Facet) 그룹을 사용하는데, 패싯이란 공통의 특성을 갖는 개념들을 함께 그룹화하고 용어간 관계를 구조화하기 위한 장치이다. 개념 패싯은 용어가 갖는 대표적인 의미속성, 범주를 의미하며, 용어 각각을 구별되는 의미장 (Semantic Field)에 분류하도록 한다. 관계 패싯은 상$\cdot$하위 개념 간 의미 관계를 표현한 메타 개념이다. 본 시소러스는 여러 전문가들의 다양한 관점을 반영하도록 설계되었다. 관점이란 주관적이며, 임의적이어서 개별 개념에 내재된 자질 또는 속성과는 구별되는 독립적 속성이다. 개념 패싯, 관계 패싯의 도입은 계층 관계, 동등 관계, 범주 관계 등과 더불어 용어 간 관계를 보다 구체적으로 명시함으로써 최종 사용자에게 검색의 효율성과 정확성을 제공할 수 있다.

  • PDF

빈 연결을 제거하는 메타 검색 엔진의 구현 (An Implementation of Meta Search Engine of Removing Empty-Link)

  • 김연곤;엄채임;변정용
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 추계학술발표논문집
    • /
    • pp.359-364
    • /
    • 1998
  • 지금까지 정보 검색에 대한 많은 연구가 있어 왔지만, 여전히 여러 가지 문제들로 인해 사용자는 많은 시간을 소비하게 된다. 본 논문에서는 이러한 문제를 해결하기 위해 검색결과를 분석하여 중복된 URL을 제거하고, 접근이 불가능한 URL 정보를 사용자에게 보여준다. 해결 방안으로는 멀티쓰레드를 이용한 로봇 에이젼트가 자동으로 각 URL을 방문함으로써 가능하게 했으며, 사용자는 직접 방문하지 않고도 접근 불가능한 이유를 미리 알게된다. 구현된 메타 검색 엔진을 기존의 검색 엔진들과 비교 했을 때 약 13%의 효율성 향상을 가져왔으며, 앞으로 시소러스 등을 이용한 더 많은 연구가 진행될 것이다.

  • PDF

인터넷 공공도서관 구축 모형 연구 (A Study on the Model of Internet Public Library in Korea (IPL-Korea))

  • 고영만;오삼균
    • 정보관리학회지
    • /
    • 제16권4호
    • /
    • pp.109-123
    • /
    • 1999
  • 정보의 홍수, 다른 한편으로는 인터넷에서 질적으로 우수한 품질의 정보를 찾는 것이 점점 어려워지는 정보의 패러독스 현상이 가속화 되고 있다. 본 연구는 이러한 정보사회의 패러독스 현상을 극복하기 위한 대안으로서 인터넷 공공도서관 시스템 (IPL-Korea)의 모형을 개발하기 위한 것이다. IPL-Korea는 인터넷 상의 자료들을 대상으로 메타데이터를 통해 우수한 품질의 정보를 선별하여 제공하며, 아동, 청소년, 여성, 노인 분야의 자료들을 특화하였다. IPL-Korea의 시소러스는 ERIC 시소러스를 채택하면서 지속적 연구를 통해 개선하고 확장시키는 시스템으로 구축된다. 메타데이터의 설계는 개체-관계형 모델을 토대로 그 개념스키마가 구성되며, 메타데이터는 오라클에 저장되고 웹 인터페이스 구축을 위해서는 ASP, ColdFusion 및 JAVA 기술이 응용되었다.

  • PDF

조어 중심적 주제어간 관계 추출 및 분석 (Analyzing and Extracting Relations between Topic Keywords Based on Word Formation)

  • 정한민;이미경;성원경
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2008년도 정기학술대회
    • /
    • pp.166-171
    • /
    • 2008
  • 본 연구는 기존에 잘 알려지고 널리 사용되고 있는 어휘 의미망이나 시소러스를 활용하기 어려운 과학 기술 분야, 특히 IT 분야에서 대용량 용어간 관계를 빠른 시간 내에 구축하여 검색 브라우징, 내비게이션 용도로 활용하는 것을 목표로 한다. 시소러스 구축 절차를 따르는 경우에 분야 전문가에 의한 정교한 작업과 고비용을 필요로 하여 충분한 구축 크기를 확보하는 것에 현실적인 어려움이 있다. 시소러스 자동 구축 방법론을 사용하는 경우에도 해당 용어들이 출현하는 방대한 말뭉치를 확보해야 하며 관계 구축 결과에 대한 직관적 이해가 쉽지 않다는 단점이 있다. 본 연구는 해외 학술 논문 말뭉치와 메타데이터에서 획득한 37만 여 주제어들을 이용하여 상 하위 관계, 관련어, 형제 관계를 추출하기 위해 조어적 기준에 근거한 규칙들을 이용한다. 이들 규칙을 이용하여 추출한 관계 수는 상 하위 관계 60여 만 개, 관련어 640여 만 개, 형제 관계 2,000여 만 개 등이다. 또한, 추출 결과 중 일부를 수작업으로 분석하여 단순한 추출 규칙에서 발생하는 오류 유형을 찾아내고 향후 과제에서 해결할 수 있는 방안에 대해 논하자고 한다.

  • PDF