• 제목/요약/키워드: 이용자 검색용어

검색결과 48건 처리시간 0.02초

지질용어 시소러스 시스템의 설계 및 구축 (Design and Implementation of Thesaurus System for Geological Terms)

  • 황재홍;지광훈;한종규;연영광;류근호
    • 한국지리정보학회지
    • /
    • 제10권2호
    • /
    • pp.23-35
    • /
    • 2007
  • 최근 정보 검색 분야에서 시맨틱 웹 기술에 따른 인터넷 용어사전과 더불어 시소러스의 필요성이 더욱 중요시되고 있다. 시소러스는 분류와 사전의 결합으로 상위 및 하위개념 사이의 전후관계를 명확히 하기 위해서 공식적으로 조직, 통제된 색인어의 어휘로 인간의 학습, 탐구활동 등 제반 지식활동의 대상이 되는 개념(용어)간의 관계를 표현한 지식구조의 토픽 맵이다. 하지만 시소러스가 용어의 통제 및 표준화와 더불어 정보를 능률적으로 처리하고 검색하는데 필수적인 수단으로 평가되고 있음에도 불구하고 아직까지 지질분야에서 우리말 시소러스가 없는 실정이다. 시소러스를 구축하기 위해서는 표준화되고 잘 정의된 지침이 필요하다. 이러한 표준화된 지침은 보다 효율적인 정보 관리를 가능하게 할 것이며, 정보 이용자 또한 보다 정확한 정보를 쉽고 편리하게 이용할 수 있게 될 것이다. 본 연구는 지질정보 중 가장 기본이 되는 용어 시소러스 시스템 구축 연구이다. 이를 위해서 첫째, 국내외 지질용어 표준화 동향을 살펴보았다. 둘째, 15개 분야에 대한 지질학적 주제를 정하고 각 주제에 대한 분류체계(안)를 마련하였다. 셋째, 지질용어 시소러스 분류체계를 바탕으로 지질용어 시소러스 명세서를 작성하였다. 마지막으로 이 명세서를 이용하여 인터넷기반 지질용어 시소러스 시스템을 설계하고 구축하였다.

  • PDF

연관 태그의 군집화를 위한 클러스터링 기법 비교 연구 (A Comparative Study on Clustering Methods for Grouping Related Tags)

  • 한승희
    • 한국문헌정보학회지
    • /
    • 제43권3호
    • /
    • pp.399-416
    • /
    • 2009
  • 본 연구에서는 태그 공간에서 정보의 효율적 탐색을 위해 이용자에게 제공될 수 있는 연관 태그 클러스터의 생성을 위해 다양한 유사계수와 클러스터링 기법을 적용한 후 그 결과를 평가하고 비교 분석함으로써 연관 태그의 클러스터링에 가장 적합한 클러스터링 알고리즘을 확인하고자 하였다. Delicious에서 임의의 태그 10개를 대상으로 각각 300개의 문서에서 추출한 연관 태그를 대상으로 태그쌍 간의 연관성을 측정한 후 계층적 기법과 비계층적 기법을 적용하여 생성된 클러스터를 대상으로 클러스터 적합도를 측정한 결과, 일반적으로 용어 클러스터링에서 널리 활용되는 것으로 알려진 워드 기법이 코사인 유사계수와 결합했을 때 거의 모든 실험 대상에 대해 유사한 경향을 보이면서 가장 우수한 성능을 나타내는 것으로 나타났다. 연관 태그 클러스터는 정보관리 측면에서 유사한 합목적성을 갖는 태그끼리 군집을 이루면서 용어의 중의성을 해소함으로써 태그 공간에서의 이용자의 정보 탐색에 유용하게 활용될 것이다.

디지털도서관 구축과정에서 TREC 텍스트 문서의 시각적 표현에 관한 연구 (A Study on the Visual Representation of TREC Text Documents in the Construction of Digital Library)

  • 정기태;박일종
    • 정보관리학회지
    • /
    • 제21권3호
    • /
    • pp.1-14
    • /
    • 2004
  • 이용자들은 유사문서를 검색할 때, 각 가지 문서의 시각적표현을 통하여 도움을 얻게 되며, 모든 정보검색에 관한 연구는 이용자들의 다양한 요구를 충족시키기 위한 여러 가지의 해결책을 제시하고 있다. 제안되어진 해결책은 알파벳 순서로 만들어 진 파피루스 문서로부터 카드목록, 마이크로 필름을 이용한 저장, 컴퓨터 디스크를 이용한 파일 보관 등에 이르기까지 다양한 방법들을 들 수 있을 것이다. 또한 대부분의 정보검색 시스템들은 Document SUITogate( 문헌을 대체할 수 있는 것들 ), 즉 요약문, 목차, 초록, 리뷰한 내용, 기계가독형목록 (MARC) 기록물 등과 같은 서지자료들을 전체논문을 대체하여 이용하게 된다. 본 논문에서는 또 다른 형태의 Document Surrogate 로서 용어 리스트의 집단화 방법을 이용해서 찾아보았다. 이 Document Surrogate 들은 Multidimensional Scaling (MDS) 을 이용해서 2 차원 그래프 위에 좌표로써 표현되어지고 있다. 사용된 2차원의 그래프 위에서 좌표간의 거리는 문헌들의 유사성을 나타낸다고 해석할 수 있으며 거리가 가까우면 가까울수록 두 문서는 더욱 유사한내용을 포함하고 있다고 해석할 수 있는 것으로 밝혀졌다.

SDI System의 사적 연구 (2) (The Historical Study of SDI System (2))

  • 김종회
    • 정보관리학회지
    • /
    • 제2권2호
    • /
    • pp.150-169
    • /
    • 1985
  • 오늘날 정보검색(情報檢索)시스팀의 대표적(代表的)인 한 유형(類型)으로서 널리 보급(普及)되어 운영(運營)되고 있는 SDI(Selective Dissemination of Information)시스팀에 관(關)하여 기술(記述)하였다. 이것은 컴퓨터기술(技術)의 정보검색(情報檢索)에의 응용(應用)으로서 이용자(利用者)의 요구주제(要求主題)에 부합(符合)되는 문헌(文獻)을 검색(檢索)하기 위하여 색인어(索引語)와 일치(一致)(match) 되는 문헌(文獻)을 탐색(探索)하는데 이용(利用)되는 시스팀을 설명(說明)하기 위해 자주 쓰여지는 용어(用語)이다. SDI시스팀을 개발(開發)한 "Luhn"이 최초(最初)로 그 개념(槪念)을 발표(發表)한 이래(以來) 지금까지 개발(開發)되어온 각종(各種)의 SDI시스팀들을 조사(調査) 비교(比較)하고, 이 시스팀들의 발전단계(發展段階), 구성(構成) 및 특성(特性)과 시스팀 설계(設計)에 관(關)한 제문제점등(諸問題點等)에 대(對)해서도 분석(分析) 조사(調査)하였다.

  • PDF

SDI System의 사적연구(史的硏究)(1) (The Historical Study of SDI System)

  • 김종회
    • 정보관리학회지
    • /
    • 제1권1호
    • /
    • pp.146-161
    • /
    • 1984
  • 오늘날 정보검색(情報檢索)시스팀의 대표적(代表的)인 한 유형(類型)으로서 널리 보급(普及)되어 운영(運營)되고 있는 SDI(Selective Dissemination of Information)시스팀에 관(關)하여 기술(記述)하였다. 이것은 컴퓨터기술(技術)의 정보검색(情報檢索)에의 응용(應用)으로서 이용자(利用者)의 요구(要求) 주제(主題) 부합(符合)되는 문헌(文獻)을 검색(檢索)하기 위하여 색인어(索引語)와 일치(一致)(match)되는 문헌(文獻)을 탐색(探索)하는데 이용(利用)되는 시스팀을 설명(說明)하기 위해 자주 쓰여지는 용어(用語)이다. SDI시스팀을 개발(開發)한 "Luhn"이 최초(最初)로 그 개념(槪念)을 발표(發表)한 이래(以來) 지금까지 개발(開發)되어온 각종(各種)의 SDI시스팀들을 조사(調査) 비교(比較)하고, 이 시스팀들의 발전단계(發展段階), 구성(構成) 및 특성(特性)과 시스팀설계(設計)에 관(關)한 제문제점등(諸問提點等)에 대(對)해서도 분석(分析) 조사(調査)하였다.

  • PDF

KCR4 GMD 및 SMD 기술의 새로운 방안 모색 (A Study on New Method for Description of GMD and SMD of KCR4)

  • 이미화
    • 한국도서관정보학회지
    • /
    • 제42권2호
    • /
    • pp.237-255
    • /
    • 2011
  • 본 연구는 이용자의 온라인목록 검색 향상과 FRBR 저작 및 표현형을 구현하기 위해 내용과 용기로 자원유형을 기술하는 방안을 모색하고자 한다. KCR4, 통합KORMARC의 자원유형 리스트의 내용과 용기의 구분이 명확하지 않아 GMD 및 SMD 자원유형 기술 시 어려움을 주고 있다. 이를 위해 본고는 RDA와 ISBD(2010)의 자원유형리스트의 특징을 파악하고, KERIS 종합목록을 대상으로 비디오녹화자료, 녹음자료, 지도자료의 다양한 용어 사용과 기술 현황을 분석하였다. 분석결과 GMD, SMD 용어리스트에 일관성이 부족하였으며, 도서관에서는 내용유형과 용기 유형 용어를 자관에 맞게 혼합하여 적용하였다. 새로운 방안으로 자원의 내용유형 기술의 필요성, 내용유형 및 용기유형 용어의 정립, 디스플레이방식을 제안하였다. 본 연구를 통해 앞으로 FRBR 개념모델을 구현할 수 있는 자원유형 기술에 새로운 방안을 마련할 수 있을 것이다.

2계층 유사관계행렬 구축을 통한 질의 처리 (Fuzzy Query Processing through Two-level Similarity Relation Matrices Construction)

  • 이기영
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권10호
    • /
    • pp.587-598
    • /
    • 2003
  • 본 연구에서는 학술논문을 대상으로 하여 표제와 초록에 대한 2단계 색인어 유사관계행렬을 구축하였다. 동시출현빈도 기반으로 구축된 색인어 유사관계행렬은 호환관계에 따른 질의 확장으로 재현률을 유지하면서 2단계 내용기반 검색으로 정확률을 향상시키기 위한 색인구조이다. 따라서, 주제 분석을 통해 영역지식을 추출하고 이용자의 정보 요구와 영역지식을 퍼지논리 기반으로 추론하였다. 본 연구는 질의에 본질적으로 가지고 있는 용어 불일치 및 정보표현을 향상시키기 위한 연구이다.

  • PDF

객체지향 기법을 이용한 시소러스 관리 시스템의 개발에 관한 연구 (Development of a Thesaurus Management System based on the Object-Oriented Technique)

  • 박계숙
    • 정보관리학회지
    • /
    • 제13권2호
    • /
    • pp.5-18
    • /
    • 1996
  • 시소러스를 구축하기 위해서는 새로운 단어의 입력, 수정, 삭제 및 단어간 관계생성 등의 동적인 변하에 신속 정확히 대용할 수 있도록 시소러스 관리 시스템이 개발되어야 한다. 본 연구에서 개발한 시소러스 관리 시스템은 객체지향적 구조로 데이터베이스를 설계하였으며, GUI화면을 제공하여 이용자 인터페이스를 향상시켰다. 또한 시소러스를 구축하는데 있어서 동일한 영문 용어의 다양한 한글표기로 인한 정보검색 효율 저하 문제를 해결하기 위해 동의어의 확장에 역점을 두었다.

  • PDF

클러스터링 기법을 이용한 개별문서의 지식구조 자동 생성에 관한 연구 (Automatic Generation of the Local Level Knowledge Structure of a Single Document Using Clustering Methods)

  • 한승희;정영미
    • 정보관리학회지
    • /
    • 제21권3호
    • /
    • pp.251-267
    • /
    • 2004
  • 이 연구에서는 전통적인 인쇄매체 환경에서 지식에 대해 지역적인 접근법을 제공하는 권말색인과 목차의 기능에 착안하여 용어 클러스터링 실험과 클러스터 대표어 선정 실험을 통해 개별문서의 지식구조 자동 생성 기법을 제안하였다. 자동 생성된 지식구조가 갖는 기능성을 평가하여 정보 검색 환경에서의 적용 가능성을 확인하였다. 용어 클러스터링 실험에서는 워드 기법의 성능이 중복 분류를 허용하는 퍼지 K-means 클러스터링 기법에 비해 높았으며, 클러스터 대표어 선정 기법으로는 단락빈도를 이용한 경우가 가장 좋은 성능을 나타냈다. 또한, 이용자 태스크를 기반으로 하여 최종적으로 생성된 지식구조의 기능성을 평가한 결과, 이 연구에서 자동 생성된 지식구조가 인쇄매체 환경에서의 권말색인과 목차가 갖는 기능을 어느 정도 수행한다는 것을 입증하였다.

문헌검색(文獻檢索)에 있어서 Chemical Abstracts와 CA Condensates의 비교(比較)

  • Robert, B.E.
    • 정보관리연구
    • /
    • 제9권1호
    • /
    • pp.21-25
    • /
    • 1976
  • 1975년(年) 3월(月), 4년반(年半) 동안의 Chemical Abstracts 색인(索引)과 온-라인이 가능(可能)한 CA Condensates를 비교(比較)하였다. 두가지 데이터 베이스를 함께 이용(利用)하여 검색(檢索)하는 방법(方法)이 가장 효율적(效率的)이지만 실예(實例)에서 보는 바와 같이 CA Condensates를 검색(檢索)하는 것이 보다 실용적(實用的)이다. System Development Corp 사(社) (SDC)에 설치(設置)되어 있는 온-라인 형태(形態)인 CHEMCON과 CHEM7071을 Chemical Abstracts 색인(索引)과 비교(比較)하였다. 대부분(大部分)의 Chemical Abstracts 이용자(理容者)들은 Chemical Abstracts 책자나 우가색인(累加索引)에는 친숙(親熟)하지만 CA Condensates는 아마도 그리 친숙(親熟)하지 못할 것이다. CA Condensates는 서지적 사항을 기계(機械)로 읽을 수 있는 형태(形態)로 되어 있고 Chemical Abstracts에 따라서 색인(索引)되므로 매주 발행되는 Chemical Abstracts 책자의 뒷 부분이 있는 색인(索引)과 같이 우리에게 가장 친숙(親熟)한 형태(形態)로 되어 있다. Chemical Abstracts가 현재(現在) 사용(使用)하고 있는 데이터 데이스이지만 본고(本稿)에서는 Index와 Condensates를 둘 다 데이터 베이스로 정의(定義)한다. Condensates가 미국(美國)의 Chemical Abstracts Service 기관으로부터 상업적(商業的)으로 이용(利用)할 수 있게 되자 여러 정보(情報)센터에서는 이용자(利用者)들의 프로 파일을 뱃취방식(方式)으로 처리(處理)하여 매주 나오는 자기(磁氣)테이프에서 최신정보(最新情報)를 검색(檢索)하여 제공(提供)하는 서어비스 (SDI)를 시작하였다. 어떤 정보(情報)센터들은 지나간 자기(磁氣)테이프들을 모아서 역시 뱃취방식(方式)으로 소급(遡及) 문헌검색(文獻檢索) 서어비스를 한다. 자기(磁氣)테이프를 직접 취급(取扱)하는 사람들을 제외(除外)하고는 대부분(大部分) Condensates를 아직 잘 모르고 있다. 소급(遡及) 문헌검색(文獻檢索)은 비용이 다소 비싸고 두서없이 이것 저것 문헌(文獻)을 검색(檢索)하는 방법(方法)은 실용적(實用的)이 못된다. 매주 나오는 색인(索引)에 대해서 두 개나 그 이상의 개념(槪念)이나 물질(物質)을 조합(組合)하여 검색(檢索)하는 방법(方法)은 어렵고 실용적(實用的)이 못된다. 오히려 주어진 용어(用語) 아래에 있는 모든 인용어(引用語)들을 보고 초록(抄錄)과의 관련성(關連性)을 결정(決定)하는 것이 때때로 더 쉽다. 상호(相互) 작용(作用)하는 온-라인 검색(檢索)을 위한 Condensates의 유용성(有用性)은 많은 변화를 가져 왔다. 필요(必要)한 문헌(文獻)만을 검색(檢索)해 보는 것이 이제 가능(可能)하고 어떤 항목(項目)에 대해서도 완전(完全)히 색인(索引)할 수 있게 되었다. 뱃취 시스팀으로는 검색(檢索)을 시작해서 그 결과(結果)를 받아 볼 때 까지 수시간(數時間)에서 며칠까지 걸리는 번거로운 시간차(時間差)를 이제는 보통 단 몇 분으로 줄일 수 있다. 그리고 뱃취 시스팀과는 달리 부정확하거나 불충분한 검색방법(檢索方法)은 즉시 고칠 수가 있다. 연속적인 뱃취 형태의 검색방법(檢索方法)에 비해서 순서(順序)없이 온-라인으로 검색(檢索)하는 방법(方法)이 분명(分明)하고 정확(正確)한 장점(長點)이 있다. CA Condensates를 자주 이용(移用)하게 되자 그의 진정한 가치(價値)에, 대해 논의(論義)가 있었다. CA Condensates의 색인방법(索引方法)은 CA Abstract 책자나 우가색인(累加索引)의 방법(方法)보다 확실히 덜 체계적(體系的)이고 철저(徹底)하지 못하다. 더우기 두 데이터 베이스는 중복(重複)것이 많으므로, 중복(重複)해서 검색(檢索)할 가치(價値)가 없는지를 결정(決定)해야 한다. 다른 몇 개의 데이터 베이스와 CA Condensates를 비교(比較)한 논문(論文)들이 여러 번 발표(發表)되어 왔는데 일반적(一般的)으로 CA Condensates는 하위(下位)의 데이터 베이스로 나타났다. Buckley는 Chemical Abstracts의 색인(索引)이 CA Condensates 보다 더 좋은 문헌 (데라마이신의 제법에 관해서)을 제공(提供)한 실례(實例)를 인용(引用)하였다. 죠오지대학(大學)의 Search Center는 CA Condensates가 CA Integrated Subject File 보다 기능(機能)이 못하다는 것을 알았다. CA Condensates의 다른 여러 가지 형태(形態)들을 또한 비교(比較)하였다. Michaels은 CA Condensates를 온-라인으로 검색(檢索)한 것과 매주 나오는 Chemical Abstracts 책자의 색인(索引)은 수작업(手作業)으로 검색(檢索)한 것을 비교(比較)한 논문(論文)을 발표(發表)하였다. 그리고 Prewitt는 온-라인으로 축적(蓄積)한 두 개의 상업용(商業用) CA Condensates를 비교(比較)하였다. Amoco Research Center에서도 CA Condensates와 Chemical Abstracts 색인(索引)의 검색결과(檢索結果)를 비교(比較)하고 CA Condensates의 장점(長點)과 색인(索引)의 장점(長點), 그리고 사실상(事實上) 서로 동등(同等)하다는 실례(實例)를 발견(發見)하였다. 1975년(年) 3월(月), 적어도 4년분(年分)의 CA Condensates와 색인(索引)(Vols 72-79, 1970-1973)을 비교(比較)하였다. 저자(著者)와 일반(一般) 주제(主題) 대한 검색(檢索)은 Vol 80 (Jan-June, 1974)을 사용(使用)하여 비교(比較)하였다. CA Condensates는 보통 세분화(細分化)된 복합물(複合物)을 검색(檢索)하는 데 불편(不便)하다. Buckly가 제시(提示)한 실례(實例)가 그 대표적(代表的)인 예(例)이다. 그러나, 다른 형태(形態)의 검색실예(檢索實例)(단체저자(團?著者), 특허수탁저(特許受託著), 개인저자(個人著者), 일반적(一般的)인/세분화(細分化)된 화합물(化合物) 그리고 반응종류(反應種類)로 실제적(實際的)인 검색(檢索)을 위한 CA Condensates의 이점(利點)을 예시(例示)하였다. 다음 실례(實例)에서 CHEMCON과 CHEM7071은 CA Condensates를 온-라인으로 입력(入力)시킨 것이다.

  • PDF