• 제목/요약/키워드: Korean thesaurus

검색결과 224건 처리시간 0.02초

맥락정보를 이용한 기록 자동분류시스템 설계 (Design of Automatic Records Classification System Using Contextual Information)

  • 장지숙;이해영
    • 한국기록관리학회지
    • /
    • 제9권1호
    • /
    • pp.151-173
    • /
    • 2009
  • 기록학에서의 분류는 기록 자체의 내용보다는 기록이 생산되고 활용되는 맥락에 초점을 둔다. 본 연구에서는 업무활동이 반영된 기록을 업무활동 분석에 기반하여 구축된 분류체계에, 개별 기록의 내용이 아닌 기록의 집합적 맥락을 중심으로 자동분류 할 수 있는 기록 자동분류시스템을 설계하였다. 기 분류된 기록집합체뿐 아니라 분류체계와 시소러스를 분류기준으로 같이 구축하여 상호보완 할 수 있도록 설계하였으며, 분류대상기록의 범주를 할당한 후 바로, 분류된 기록의 맥락정보를 실시간으로 분류기준에 반영할 수 있는 방안도 포함하였다. 설계된 기록 자동분류시스템은 맥락정보의 품질에 따라 시스템의 성능이 좌우되는 한계가 있지만, 이를 통해 맥락정보를 제대로 충실하게 남길 수 있도록 유도하는 역할을 할 수 있다고 판단되었다.

확장된 Fuzzy AHP를 이용한 효율적인 의사결정 (An efficient Decision-Making using the extended Fuzzy AHP Method(EFAM))

  • 류경현;피수영
    • 한국지능시스템학회논문지
    • /
    • 제19권6호
    • /
    • pp.828-833
    • /
    • 2009
  • 웹상에서 이용할 수 있는 방대한 문서의 집합인 WWW은 사용자를 위한 다양한 정보의 보고이다. 그러나 불필요한 정보의 필터링이나 사용자가 필요한 정보를 검색하는데 많은 시간이 소요되어 효율적인 의사결정을 하는데 어려움이 있다. 본 논문에서는 의사결정에 관한 요소를 계층화 구조로 나타내는 AHP나 Fuzzy AHP방법들을 데이터의 관점에서 대안, 평가기준, 주관적 속성가중치, 개념과 객체 사이에 퍼지 관계를 기반으로 웹 자원을 효과적으로 관리하고 의사결정을 할 수 있는 EFAM(Extended Fuzzy AHP Method) 모델을 제안하였다. 제안한 EFAM 모델은 웹상의 효율적인 문서검색과 특정 영역의 문제를 의사결정하기 위하여 영역의 코퍼스로부터 추출된 개념들이 가지는 의미론적 내용에 감성 기준을 고려함으로써 효율적으로 문서를 추출할 수 있어서 명확한 의사결정을 할 수가 있음을 실험을 통하여 확인한다.

XML을 이용한 데이터베이스 통합방안에 관한 연구 (A Study on the Database Integration Methodology using XML)

  • 오세웅;이홍걸;이철영;박종민;서상현
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2005년도 추계학술대회 논문집
    • /
    • pp.353-360
    • /
    • 2005
  • 물류환경에 있어서 데이터베이스 통합의 문제는 중요한 과제로 인식되어 왔으나, 기존 연구들은 스키마 통합 시 발생하는 스키마 충돌을 이론적인 측면에서의 해결 방법만 제시하고 실제 시스템 구현 측면에서의 연구는 부족한 실정이다. 본 연구는 실제적인 DB 통합법과 관련하여 XML 기술을 이용한 통합법을 제시하고 통합 알고리즘으로 개체 및 속성간의 유사도 측정에 기반을 둔 계량화된 충돌 식별법을 사용한다. 구체적으로 DB 스키마를 XML 스키마로 변환시켜 개체명과 속성명을 추출한 다음, DB 통합 시 빈번히 발생하는 의미적 충돌(Semantic Conflict) 현상인 이른바 "Name Conflict"의 식별을 위한 하나의 해결법으로서 시소러스(Thesaurus) 사전과 형태소 분석을 통해, 개체 및 속성 간 종합적인 유사도 측정하는 계량화된 식별방안을 사용하였다

  • PDF

Word2Vec과 WordNet 기반 불확실성 단어 간의 네트워크 분석에 관한 연구 (Network Analysis between Uncertainty Words based on Word2Vec and WordNet)

  • 허고은
    • 한국문헌정보학회지
    • /
    • 제53권3호
    • /
    • pp.247-271
    • /
    • 2019
  • 과학에서 지식의 불확실성은 명제가 현재 상태로는 참도 거짓도 아닌 불확실한 상태를 의미한다. 기존의 연구들은 학술 문헌에 표현된 명제를 분석하여 불확실성을 의미하는 단어를 수동적으로 구축하고 구축한 코퍼스를 대상으로 규칙 기반, 기계 학습 기반의 성능평가를 수행해왔다. 불확실성 단어 구축의 중요성은 인지하고 있지만 단어의 의미를 분석하여 자동적으로 확장하고자 하는 시도들은 부족했다. 한편, 계량정보학이나 텍스트 마이닝 기법을 이용하여 네트워크의 구조를 파악하는 연구들은 다양한 학문분야에서 지적 구조와 관계성을 파악하기 위한 방법으로 널리 활용되고 있다. 따라서, 본 연구에서는 기존의 불확실성 단어를 대상으로 Word2Vec을 적용하여 의미적 관계성을 분석하였고, 영어 어휘 데이터베이스이자 시소러스인 WordNet을 적용하여 불확실성 단어와 연결된 상위어, 하위어 관계와 동의어 기반 네트워크 분석을 수행하였다. 이를 통해 불확실성 단어의 의미적, 어휘적 관계성을 구조적으로 파악하였으며, 향후 불확실성 단어의 자동 구축의 확장 가능성을 제시하였다.

국채보상운동 디지털 아카이브 기록물의 활용을 위한 위키데이터 연계 방안에 대한 연구 (A study on Wikidata linkage methods for utilization of digital archive records of the National Debt Redemption Movement)

  • 도슬기;박희진
    • 한국기록관리학회지
    • /
    • 제23권2호
    • /
    • pp.95-115
    • /
    • 2023
  • 본 연구는 세계기록유산으로 등재된 국채보상운동 디지털 아카이브 기록물의 활용성을 높이기 위한 방안으로 위키데이터와 연계하는 데이터 모델을 설계하고, 적용가능성을 검토하였다. 국채보상운동 기록물 메타데이터, 시소러스, 시맨틱 네트워크 그래프를 분석하여 시사점을 도출하고, 기록물의 내용 분석을 통해 위키데이터와 연계를 위한 데이터 모델의 클래스인 기록물건, 행위주체, 시간, 장소, 사건을 도출하였다. 또한 클래스 간 연결을 위한 관계 속성들을 파악하여, 설계한 데이터 모델을 실제 기록물 사례에 적용해봄으로써, 속성을 중심으로 한 객체 간의 이동을 통해 풍부한 관련 정보들을 획득할 수 있는 가능성을 확인하였다. 본 연구의 결과는 소규모 로컬 아카이브에서 위키데이터를 활용한 데이터의 공유와 활용 체계 마련에 활용될 수 있을 것이다.

KOS 레지스트리 구조화를 위한 분류체계 비교 연구 (A Comparative Study of Classification Systems for Organizing a KOS Registry)

  • 박지영
    • 한국문헌정보학회지
    • /
    • 제58권2호
    • /
    • pp.269-288
    • /
    • 2024
  • KOS 레지스트리를 구조화하기 위해서는 수집된 KOS의 특성에 맞는 분류체계를 선정해야 한다. 이 연구에서는 다양한 분류체계를 적용하여 수집된 국내 KOS 를 분류하고, 그 결과를 바탕으로 KOS 레지스트리의 구조화를 위한 분류체계를 선정할 때 고려해야 할 시사점을 제공하고자 했다. 웹탐색을 통해 수집된 313개의 KOS 데이터를 대상으로 총 5종의 분류체계와 시소러스를 적용하여 분류하고 그 결과를 분석했다. 분석 결과, KOS 레지스트리의 국제적 연계를 위해서는 국외 분류체계를 적용하고, 국내 지식자원과 연계하거나 국내 연구자들에게 최적화하기 위해서는 국내 분류체계를 적용할 필요가 있었다. 그리고 KOS의 분야별 특성에 따라 연구 분야 KOS는 학문 분야를 기반으로 하는 분류체계를 적용하고, 공공 분야 KOS는 정부 업무기능을 기반으로 하는 분류체계를 적용하는 것을 검토할 필요가 있었다. 마지막으로 국내 KOS와 국제 KOS와의 연계를 강화할 필요가 있었고, 이를 위해서 복수의 분류체계를 적용할 필요가 있었다.

유사성 기반 XML 문서 분석 기법 (XML Document Analysis based on Similarity)

  • 이정원;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.367-376
    • /
    • 2002
  • XML 문서가 가지고 있는 태그의 자유로운 정의와 내포된 구조 정보는 정보 검색 및 문서 관리 분야에 많은 이점을 제공할 수 있다. 본 논문은 XML 요소(element)의 의미와 구조 정보를 반영한 문서간의 유사성을 검사할 수 있는 XML 문서 분석 기법을 제시하고자 한다. 도출된 문서간 유사성은 많은 정보 검색 및 마이닝 등의 기초 자료로 사용될 수 있다. 먼저 XML 요소를 시소러스를 이용하여 유사어와 합성어로 구성된 확장-요소 벡터로 확장하고 유사 행렬을 구축하여 요소간 유사성을 판별한다. 또한 오토마타(NFA(Nondeterministic Finite Automata)와 DFA(Deterministic Finite Automata)(를 이용하여 XML 문서의 내포된 구조를 발견하고 최소화 한다. 요소간의 유사 행렬과 최소화된 XML 구조를 이용하여 구조간의 유사성을 판별한다. 본 논문의 XML의 의미를 반영한 유사성 분석 기법은 온라인 서점의 실제 문서의 카테고리를 인식하는 데 있어 100% 정확도를 보였다.

근사 정합과 개념 기반 정합을 지원하는 퍼지 트리플 기반 이미지 검색 (Image Retrieval with Fuzzy Triples to Support Inexact and Concept-based Match)

  • 정선호;양재동;양형정
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권8호
    • /
    • pp.964-973
    • /
    • 1999
  • 본 논문에서는 퍼지 트리플을 사용하는 내용 기반 이미지 검색 방법을 제안한다. 이미지 내 객체들 사이의 공간 관계는 내용 기반 이미지 검색을 위해 사용되는 주요한 속성들 중의 하나이다. 그러나, 기존의 트리플을 이용한 이미지 검색 시스템들은 개념 기반 검색 방법을 지원하지 못하고, 방향들 사이의 근사 정합을 처리하지 못하는 문제점을 가지고 있다. 이 문제를 해결하기 위하여 본 논문에서는 개념 기반 정합과 근사 정합을 지원하는 퍼지 트리플을 이용한 이미지 검색 방법을 제안한다. 개념 기반 정합을 위해서는 퍼지 소속성 집합으로 이루어진 시소러스가 사용되며, 근사 정합을 위해서는 방향들 사이의 관계를 정량화 하기 위한 k-weight 함수가 각각 이용된다. 이 두 가지 정합은 퍼지 트리플 간의 퍼지 정합을 통하여 균일하게 지원될 수 있다. 본 논문에서는 또한, 개념 기반 정합과 근사 정합에 대한 검색 효과를 정량적으로 평가하는 작업을 수행한다. Abstract This paper proposes an inexact and a concept-based image match technique based on fuzzy triples. The most general method adopted to index and retrieve images based on this spatial structure may be triple framework. However, there are two significant drawbacks in this framework; one is that it can not support a concept-based image retrieval and the other is that it fails to deal with an inexact match among directions. To compensate these problems, we develope an image retrieval technique based on fuzzy triples to make the inexact and concept-based match possible. For the concept-based match, we employ a set of fuzzy membership functions structured like a thesaurus, whereas for the inexact match, we introduce k-weight functions to quantify the similarity between directions. In fuzzy triples, the two facilities are uniformly supported by fuzzy matching. In addition, we analyze the retrieval effectiveness of our framework regarding the degree of the conceptual matching and the inexact matching.

스토리기반 저작물에서 감정어 분류에 기반한 등장인물의 감정 성향 판단 (Detection of Character Emotional Type Based on Classification of Emotional Words at Story)

  • 백영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.131-138
    • /
    • 2013
  • 본 논문에서는 등장인물이 대사에서사용한감정어를 이용하여 등장인물의 감정 유형을 분류하는 방법을 제안하고 성능을 평가한다. 감정 유형은 긍정, 부정, 중립의 3 종류로 분류하며, 등장인물이 사용한 감정어를 누적하여 3 종류의 감정 유형 중에 어디에 속하는지를 파악한다. 대사로부터 감정어를 추출하기 위해 WordNet 기반의 감정어 추출 방법을 제안하고 감정어가 가진 감정 성분을 벡터로 표현하는 방식을 제안한다. WordNet은 영어 단어 간에 상위어와 하위어, 유사어 등의 관계로 연결된 네트워크 구조의 사전이다. 이 네트워크 구조에서 최상위의 감정항목과의 거리를 계산하여 단어별감정량을 계산하여 대사를 30 차원의 감정벡터로 표현한다. 등장인물별로 추출된 감정 벡터 성분들을 긍정, 부정, 중립의 3가지 차원으로 축소하여 표현한 후, 등장인물의 감정 성향이 어떻게 나타나는지를 추출한다. 또한 감정 성향의 추출 성능에 대해 헐리우드 영화 4개의 영화에서 12명의 등장인물을 선정하여 평가하여 제안한 방법의 효율성을 측정하였다. 대사는 영어로 이루어진 대사만을 사용하였다. 추출된 감정 성향 판단 성능은 75%의 정확도로 우수한 추출 성능을 나타내었다.

XML을 이용한 데이터베이스 통합방안에 관한 연구 (A Study on the Database Integration Methodology using XML)

  • 오세웅;이홍걸;이철영;박종민;서상현
    • 한국항해항만학회지
    • /
    • 제29권10호
    • /
    • pp.883-890
    • /
    • 2005
  • 물류환경에 있어서 데이터베이스 통합의 문제는 중요 과제로 인식되어 스키마 통합 시 발생하는 스키마 충돌을 이론적인 측면에서의 해결 방법이 제시되었으나 실제 시스템 구현 측면에서의 연구는 부족한 실정이다. 본 연구는 실제적인 DB 통합법과 관련하여 XML 기술을 이용한 통합법을 제시하고 통합 알고리즘으로 개체 및 속성간의 유사도 측정에 기반한 계량화된 충돌 식별법을 사용하였다. 구체적으로 DB 스키마를 XML 스키마로 변환시켜 개체명과 속성명을 추출한 다음, DB 통합 시 빈번히 발생하는 의미적 충돌(Semantic Conflict) 현상인 이른바 이름 충돌 식별을 위한 하나의 해결법으로서 시소러스(Thesaurus) 사전과 형태소 분석을 통해 개체 및 속성 간 종합적인 유사도 측정하는 계량화된 식별방안을 사용하였다.