• 제목/요약/키워드: 개념색인

검색결과 112건 처리시간 0.024초

고유명사의 범주에 관한 연구 (A Study on the Scope of Proper Names)

  • 박은경
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.17-22
    • /
    • 2001
  • 고유명사의 개념과 판별, 분류체계에 대한 고찰을 통하여 모호했던 고유명사의 기본적인 범주를 분명하게 하였다. 또한, 이러한 분류체계를 바탕으로 문헌정보학에서 고유명사를 색인 및 검색어로 처리할 때 고려 해야할 점에 대해 논하였다.

  • PDF

이용자 반응 기반 이미지 감정 접근점 확장에 관한 연구 (An Expansion of Affective Image Access Points Based on Users' Response on Image)

  • 정은경
    • 한국비블리아학회지
    • /
    • 제25권3호
    • /
    • pp.101-118
    • /
    • 2014
  • 컴퓨터 정보기술의 발전과 함께 감정 기반 컴퓨팅이 다양한 분야에 빠르게 발전하여 확산되고 있다. 감정 기반 컴퓨팅의 지속적인 발전을 위해서는 이미지와 같은 멀티미디어의 콘텐츠의 감정 기반 색인과 검색이 필수적이다. 그러나 감정과 같은 추상적 개념은 주관적이며 이미지의 하위 수준 속성에서 유추하는데 한계가 있기 때문에 감정 색인은 통상적으로 난제로 여겨진다. 본 연구는 감정 색인 개선을 위해서 이미지에 대하여 이용자가 느끼는 감정 반응을 활용하여 이미지를 감정으로 접근하는데 있어서 확장된 접근점을 제공하는 방안을 고찰하였다. 이를 위하여 유로피아나 DB에서 사랑, 행복, 분노, 공포, 슬픔의 5가지 기본 감정을 표현한 이미지 15건을 선정하여 20명의 연구 참여자에게 보여주고 용어를 수집하였다. 이용자의 이미지 반응에서 수집한 용어는 정련 후 총 399건의 고유한 용어로 나타났다. 고유한 399건의 용어는 전체 1,093회 출현하였으며, 동시출현단어분석을 수행하여 상위 출현한 용어 네트워크를 구현하였다. 동시출현단어분석 기반의 네트워크를 통해서 기본 감정 용어와 함께 빈번하게 출현하는 용어를 규명하였다. 이를 통해 기본 감정용어와 함께 확장되어 제시될 수 있는 용어는 형용사, 동작/행위 표현 등 다양하게 나타났다.

사내(社內) 데이터베이스 구축(構築)을 위한 개념설계(槪念設計) (Concept Design for Inhouse Database Construction)

  • 이창한
    • 정보관리연구
    • /
    • 제23권2호
    • /
    • pp.40-56
    • /
    • 1992
  • 사내(社內) 및 자사관련(自社關聯) 외부자료를 효율적으로 관리하여 사내(社內) 직원(職員)에 제공하여, 사내(社內) 보유정보를 공유함으로써 효과적인 기업활동(企業活動)을 지원하는 사내(社內) 데이터베이스 구축사업은 크게 개념설계, 데이터베이스 포맷설계, 색인초록작성, 데이터베이스 운영 및 유지보수 등의 단계로 분류할 수 있다. 본고(本稿)에서는 사내(社內) 데이터베이스를 본격적으로 구축하기에 앞서 사내(社內) 정보유통지원체제 및 활용자원 등을 체계화시키는 개념설계 방법을 제시하고자 한다.

  • PDF

동형이의어의 구별을 위한 한글한정어 사용에 관한 연구 (A Study on Hangul Qualifier for Homographic Descriptors)

  • 김태수;최석두
    • 정보관리학회지
    • /
    • 제14권1호
    • /
    • pp.107-124
    • /
    • 1997
  • 다의성이 있는 용어를 색인어로 사용하게 되면 탐색자의 요구와 관계없는 주제가 검색되므로 잡음률이 높아지게 된다. 이를 방지하기 위하여 거의 모든 통제어휘시스템에서 색인어로 사용될 기입어가 다의성을 가질 때 한글, 한자, 외국어 등을 이용하여 동형이의어와 세부분야을 한정하고 있다. 그러나 여러 학문분야에 걸친 대단위 어휘사전을 구축하려고 할 때 이들을 이용하여 다의성을 해소하는 데는 미흡한 점이 많으며, 흔히 사용하고 있는 한자한정어도 많은 문제점을 안고 있다. 본 고에서는 색인어로 사용될 기입어가 다의성이 있을 때 한글 한정어를 부기하여 이들을 구별할 것을 제안한다. 한글한정어의 타당성, 사용범위, 사용원칙등에 대하여 시소러스를 중심으로 논하고 이 개념의 확대적용방안에 대하여 언급한다.

  • PDF

잠재의미색인(LSI) 기법을 이용한 kNN 분류기의 자질 선정에 관한 연구 (Evaluation of the Feature Selection function of Latent Semantic Indexing(LSI) Using a kNN Classifier)

  • 박부영;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.163-166
    • /
    • 2004
  • 텍스트 범주화에 관한 선행연구에서 자주 사용되면서 좋은 성능을 보인 자질 선정 기법은 문헌빈도와 카이제곱 통계량 등이다. 그러나 이들은 단어 자체가 갖고 있는 모호성은 제거하지 못한다는 단점이 있다. 본 연구에서는 kNN 분류기를 이용한 범주화 실험에서 단어간의 상호 관련성이 자동적으로 유도됨으로써 단어 자체 보다는 단어의 개념을 분석하는 잠재의미색인 기법을 자질 선정 방법으로 제안한다.

  • PDF

해시 색인 군집화 기반 스카이라인 질의 (Clustered Hash Index-based Skyline Query)

  • 최종혁;나스리디노프 아지즈
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2018년도 동계학술대회
    • /
    • pp.45-48
    • /
    • 2018
  • 스카이라인 질의는 지배라는 개념을 활용, 주어진 데이터로부터 데이터를 대표할 수 있는 데이터들을 탐색하기 때문에 사용자의 요청에 부합하는 최적의 결과를 탐색하거나 기업에서 의사결정을 이루기 위해 사용되는 등 넓은 활용을 보이고 있다. 하지만 스카이라인 질의는 데이터의 차원이 증가하는 경우 전체적인 성능의 감소와 함께 스카이라인으로 선택되는 데이터의 수가 급증하여 사용자에게 유용한 결과를 반환하지 못하게 된다. 이러한 문제를 해결하기 위해 최근에는 Top-k 질의 기반의 방식이나 군집화 기반의 기법을 적용한 방식의 스카이라인 질의들이 새롭게 제안되고 있지만 이들은 데이터의 편향이나 사용자로부터 입력된 k에 큰 영향을 받는 등 해당 질의 결과가 데이터들을 충분히 대표하거나 다양성을 만족시키지 못했다. 이러한 문제를 해결하기 위해 본 논문에서는 해시 색인 기법과 군집화 기법인 DBSCAN을 통해 주어진 데이터들을 충분히 대표함과 동시에 다양성을 만족할 수 있는 새로운 방식의 스카이라인인 CHI-SQ의 이론적 배경을 제안하고자 한다.

  • PDF

문헌검색(文獻檢索)에 있어서 Chemical Abstracts와 CA Condensates의 비교(比較)

  • Robert, B.E.
    • 정보관리연구
    • /
    • 제9권1호
    • /
    • pp.21-25
    • /
    • 1976
  • 1975년(年) 3월(月), 4년반(年半) 동안의 Chemical Abstracts 색인(索引)과 온-라인이 가능(可能)한 CA Condensates를 비교(比較)하였다. 두가지 데이터 베이스를 함께 이용(利用)하여 검색(檢索)하는 방법(方法)이 가장 효율적(效率的)이지만 실예(實例)에서 보는 바와 같이 CA Condensates를 검색(檢索)하는 것이 보다 실용적(實用的)이다. System Development Corp 사(社) (SDC)에 설치(設置)되어 있는 온-라인 형태(形態)인 CHEMCON과 CHEM7071을 Chemical Abstracts 색인(索引)과 비교(比較)하였다. 대부분(大部分)의 Chemical Abstracts 이용자(理容者)들은 Chemical Abstracts 책자나 우가색인(累加索引)에는 친숙(親熟)하지만 CA Condensates는 아마도 그리 친숙(親熟)하지 못할 것이다. CA Condensates는 서지적 사항을 기계(機械)로 읽을 수 있는 형태(形態)로 되어 있고 Chemical Abstracts에 따라서 색인(索引)되므로 매주 발행되는 Chemical Abstracts 책자의 뒷 부분이 있는 색인(索引)과 같이 우리에게 가장 친숙(親熟)한 형태(形態)로 되어 있다. Chemical Abstracts가 현재(現在) 사용(使用)하고 있는 데이터 데이스이지만 본고(本稿)에서는 Index와 Condensates를 둘 다 데이터 베이스로 정의(定義)한다. Condensates가 미국(美國)의 Chemical Abstracts Service 기관으로부터 상업적(商業的)으로 이용(利用)할 수 있게 되자 여러 정보(情報)센터에서는 이용자(利用者)들의 프로 파일을 뱃취방식(方式)으로 처리(處理)하여 매주 나오는 자기(磁氣)테이프에서 최신정보(最新情報)를 검색(檢索)하여 제공(提供)하는 서어비스 (SDI)를 시작하였다. 어떤 정보(情報)센터들은 지나간 자기(磁氣)테이프들을 모아서 역시 뱃취방식(方式)으로 소급(遡及) 문헌검색(文獻檢索) 서어비스를 한다. 자기(磁氣)테이프를 직접 취급(取扱)하는 사람들을 제외(除外)하고는 대부분(大部分) Condensates를 아직 잘 모르고 있다. 소급(遡及) 문헌검색(文獻檢索)은 비용이 다소 비싸고 두서없이 이것 저것 문헌(文獻)을 검색(檢索)하는 방법(方法)은 실용적(實用的)이 못된다. 매주 나오는 색인(索引)에 대해서 두 개나 그 이상의 개념(槪念)이나 물질(物質)을 조합(組合)하여 검색(檢索)하는 방법(方法)은 어렵고 실용적(實用的)이 못된다. 오히려 주어진 용어(用語) 아래에 있는 모든 인용어(引用語)들을 보고 초록(抄錄)과의 관련성(關連性)을 결정(決定)하는 것이 때때로 더 쉽다. 상호(相互) 작용(作用)하는 온-라인 검색(檢索)을 위한 Condensates의 유용성(有用性)은 많은 변화를 가져 왔다. 필요(必要)한 문헌(文獻)만을 검색(檢索)해 보는 것이 이제 가능(可能)하고 어떤 항목(項目)에 대해서도 완전(完全)히 색인(索引)할 수 있게 되었다. 뱃취 시스팀으로는 검색(檢索)을 시작해서 그 결과(結果)를 받아 볼 때 까지 수시간(數時間)에서 며칠까지 걸리는 번거로운 시간차(時間差)를 이제는 보통 단 몇 분으로 줄일 수 있다. 그리고 뱃취 시스팀과는 달리 부정확하거나 불충분한 검색방법(檢索方法)은 즉시 고칠 수가 있다. 연속적인 뱃취 형태의 검색방법(檢索方法)에 비해서 순서(順序)없이 온-라인으로 검색(檢索)하는 방법(方法)이 분명(分明)하고 정확(正確)한 장점(長點)이 있다. CA Condensates를 자주 이용(移用)하게 되자 그의 진정한 가치(價値)에, 대해 논의(論義)가 있었다. CA Condensates의 색인방법(索引方法)은 CA Abstract 책자나 우가색인(累加索引)의 방법(方法)보다 확실히 덜 체계적(體系的)이고 철저(徹底)하지 못하다. 더우기 두 데이터 베이스는 중복(重複)것이 많으므로, 중복(重複)해서 검색(檢索)할 가치(價値)가 없는지를 결정(決定)해야 한다. 다른 몇 개의 데이터 베이스와 CA Condensates를 비교(比較)한 논문(論文)들이 여러 번 발표(發表)되어 왔는데 일반적(一般的)으로 CA Condensates는 하위(下位)의 데이터 베이스로 나타났다. Buckley는 Chemical Abstracts의 색인(索引)이 CA Condensates 보다 더 좋은 문헌 (데라마이신의 제법에 관해서)을 제공(提供)한 실례(實例)를 인용(引用)하였다. 죠오지대학(大學)의 Search Center는 CA Condensates가 CA Integrated Subject File 보다 기능(機能)이 못하다는 것을 알았다. CA Condensates의 다른 여러 가지 형태(形態)들을 또한 비교(比較)하였다. Michaels은 CA Condensates를 온-라인으로 검색(檢索)한 것과 매주 나오는 Chemical Abstracts 책자의 색인(索引)은 수작업(手作業)으로 검색(檢索)한 것을 비교(比較)한 논문(論文)을 발표(發表)하였다. 그리고 Prewitt는 온-라인으로 축적(蓄積)한 두 개의 상업용(商業用) CA Condensates를 비교(比較)하였다. Amoco Research Center에서도 CA Condensates와 Chemical Abstracts 색인(索引)의 검색결과(檢索結果)를 비교(比較)하고 CA Condensates의 장점(長點)과 색인(索引)의 장점(長點), 그리고 사실상(事實上) 서로 동등(同等)하다는 실례(實例)를 발견(發見)하였다. 1975년(年) 3월(月), 적어도 4년분(年分)의 CA Condensates와 색인(索引)(Vols 72-79, 1970-1973)을 비교(比較)하였다. 저자(著者)와 일반(一般) 주제(主題) 대한 검색(檢索)은 Vol 80 (Jan-June, 1974)을 사용(使用)하여 비교(比較)하였다. CA Condensates는 보통 세분화(細分化)된 복합물(複合物)을 검색(檢索)하는 데 불편(不便)하다. Buckly가 제시(提示)한 실례(實例)가 그 대표적(代表的)인 예(例)이다. 그러나, 다른 형태(形態)의 검색실예(檢索實例)(단체저자(團?著者), 특허수탁저(特許受託著), 개인저자(個人著者), 일반적(一般的)인/세분화(細分化)된 화합물(化合物) 그리고 반응종류(反應種類)로 실제적(實際的)인 검색(檢索)을 위한 CA Condensates의 이점(利點)을 예시(例示)하였다. 다음 실례(實例)에서 CHEMCON과 CHEM7071은 CA Condensates를 온-라인으로 입력(入力)시킨 것이다.

  • PDF

과학기술 분야 통합 개념체계의 구축 방안 연구 (An Integrated Ontological Approach to Effective Information Management in Science and Technology)

  • 정영미;김명옥;이재윤;한승희;유재복
    • 정보관리학회지
    • /
    • 제19권1호
    • /
    • pp.135-161
    • /
    • 2002
  • 과학기술 분류표, 시소러스, 용어사전 등의 주요한 색인 및 검색 도구를 한국어, 영어 일본어의 3개 언어로 통합 구축하여 활용할 수 있도록 다기능, 다국어 과학기술 통합 개념체계의 모형을 설계하였다. 이 연구에서는 개념을 기본 단위로 한 시소러스 모형을 개발하였으며, 시소러스와 연계되는 용어사전 레코드는 ISO 12620 표준에 근거하여 필수요소를 지정하였다. 또한 과학기술분야 표준분류표를 마련하고 기존의 일반 분류표와의 매핑 테이블을 작성하여 다른 분류표를 통한 접근이 가능하도록 하였다. 본 연구에서 개발한 통합 개념체계를 이용하여 원자력 분야를 대상으로 한 프로토타입 시스템을 구축하고 실제 검색 사례를 제시하였다.

용어분류의 비교연구 (A Comparative Study on Lexical Classification)

  • 백지원;최석두
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.19-26
    • /
    • 2002
  • 본 연구의 목적은 용어분류를 그 특성에 따라 유형 구분하고 그 각각의 장단점을 밝힘으로써 앞으로의 용어분류 연구를 위한 기반을 제공하는 것이다. 이를 위해 먼저 용어분류의 개념을 밝히고, 그 목적 및 활용분야를 논하였다. 다음으로 다양한 용어 분류 관련 사례를 그 내·외형적 특성에 따라 크게 유의어 사전류와 분류형 시소러스류의 두 가지 유형으로 나눈 후, 이를 다시 세분하여 그 각각의 특징을 분석하였다. 이 분석을 바탕으로, 특히 색인과 검색 등 정보처리에 필요한 용어분류의 유형과 특성을 논하였다.

  • PDF

인권 시소러스 구축에 관한 연구 (A Study on Construction of Human Rights Thesaurus)

  • 심민석;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.57-60
    • /
    • 2004
  • 인권 시소러스는 인권 관련 색인어 작성시 특정성 및 일관성을 유지하고, 다양한 이용자 계층의 정보 검색의 효율성을 증진시키고자 하는 일반적인 목적과 함께, 모호하게 사용되고 있는 인권 용어의 개념화를 통해 전문가 뿐 아니라 일반인들도 손쉽게 인권 전문정보에 접근할 수 있는 토대를 마련하고자 하였다. 이를 위해 본 연구에서는 인권 관련어로 유의미하게 사용되는 용어군을 수집한 후 실험대상군을 설정하여 어느 정도의 관련성을 가지는가를 실험한 것이다.

  • PDF