• 제목/요약/키워드: semantic resources

검색결과 206건 처리시간 0.026초

온톨로지 구축 지원을 위한 과학기술 문헌으로부터의 인력정보 구축 (Construction of Human Resources from Science & Technology Publications for Supporting of Ontology Construction)

  • 정한민;이승우;강인수;성원경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 춘계 종합학술대회 논문집
    • /
    • pp.223-226
    • /
    • 2006
  • 시멘틱 웹의 발전은 정보의 규격화, 의미화를 통한 지식을 기본으로 요구하며, 온톨로지는 이러한 지식 표현을 위해 필수적으로 사용되는 도구이다. 온톨로지 상에서 Individual들은 식별체계인 URI(Universal Resource Identifier)를 이용하여 유일하게 지칭될 수 있어야 한다. 그렇지만, 현실에서 식별체계를 사용하는 경우를 발견하기가 힘들며, 특히 논문과 같은 과학기술 문헌은 그 적용 대상에서 제외되어 왔다. 이러한 이유로 인해 과학기술 문헌상의 인력정보를 식별체계 기반으로 구축하고자 하는 시도가 미약한 실정이었다. 이에 본 논문은 과학기술 문헌을 포함한 국가 과학기술 R&D 기반정보 온톨로지 구축에서 중심이 되는 인력정보를 URI 기반으로 구축하는 방법을 기술한다. 공저자 관계, 이메일, 출판 연도, 소속기관 등을 이용하여 동명이인 문제를 해소하고, 각 저자 그룹 별 URI 부여를 위해 국가과학기술인력 종합정보시스템을 활용한 사례를 소개한다. 이러한 과정을 통해 7,175건의 논문들로부터 획득한 인력정보는 연구자 네트워크 분석, 성과 통계 등 다양한 시멘틱 웹 응용 분야들에 기초적으로 활용될 것으로 기대한다.

  • PDF

형식개념분석을 이용한 폭소노미 마이닝 기법과 지원도구의 개발 (On development of supporting tool for Folksonomy Mining based on Formal Concept Analysis)

  • 강유경;황석형;양해술
    • 한국산학기술학회논문지
    • /
    • 제10권8호
    • /
    • pp.1877-1893
    • /
    • 2009
  • 폭소노미(folksonomy)는 웹에 존재하는 리소스에 대해 사용자가 자유롭게 선택한 태그(tag)를 붙여서 정보를 체계화하는 새로운 분류 체계이다. 폭소노미 기반의 시스템에서는 사용자들의 협력태깅에 의해 사용자, 태그, 리소스사이의 관계를 나타내는 3항원 소데이터가 생성된다. 이와 같은 폭소노미 데이터는 웹 리소스에 대한 정보체계화를 위한 메타데이터로서 시맨틱 웹과 웹2.0 분야에 활용되고 있다. 본 논문에서는 다종다양한 폭소노미 데이터를 다양한 관점으로 분석하여 유용한 정보를 추출하기 위한 형식개념분석 기반의 폭소노미 데이터 마이닝 기법을 제안하고, 이를 지원하기 위한 분석도구 FMT를 개발하였다. 또한, 제안한 기법과 FMT의 유용성을 검증하기 위하여, 폭소노미 기반 시스템인 del.icio.us의 데이터를 대상으로 실험을 수행하고, 그 결과를 보고한다.

인간언어공학에의 활용을 위한 이종 개념체계 간 사상 - 세종의미부류와 KorLexNoun 1.5 - (Mapping Heterogenous Ontologies for the HLP Applications - Sejong Semantic Classes and KorLexNoun 1.5 -)

  • 배선미;임경업;윤애선
    • 인지과학
    • /
    • 제21권1호
    • /
    • pp.95-126
    • /
    • 2010
  • 본 연구에서는 인간언어공학에서의 활용을 위해 매우 이질적인 세종전자사전의 의미부류(SJSC)와 KorLexNoun 1.5(KLN)의 상위노드 간의 사상을 목표로, '의미 입자(sense grain)가 작은 개념체계(fine-grained ontology)' 간 귀납적이며 상향적인 수동 사상 방법론을 제안하였다. 동시에 이종 자원 간의 사상에 있어 각 의미체계의 이질성 때문에 발생하는 여러 가지 문제점을 살펴보고, 그 해결방안도 제안하였다. 두 이종 개념체계 간의 사상 방법은 SJSC의 단말 노드와 KLN의 Least Upper Bound(LUB)를 기본단위로 하여, 첫째, 어휘 분포를 이용하여 사상 후보군을 결정하고, 둘째, 계층 관계와 정의문과 용례를 이용하여 후보군들 간의 정확한 의미구분을 하며, 셋째, 상 하위-자매노드에 SJSC의 적정술어 및 정의문을 적용하여 LUB의 단계를 결정하고, 넷째, 양 의미체계의 계층관계를 비교함으로써 SJSC의 단말 노드와의 사상 여부를 판단하며, 마지막으로 KLN의 오류 및 전문용어 후보군은 사상에서 제외하였다. 이와같이 본 연구에서는 단계별 사상 준거의 설정에 있어 각 의미체계에 기술되어 있는 다양한 언어정보를 적극 이용하였는데, 이는 세밀한 수동 사상의 장점이라 할 수 있다. 본 연구에서 제안한 방법으로 사상한 결과, SJSC의 474개의 단말 및 비단말 노드와 KLN의 신셋(synset) 간에는 중복을 제외하고 6,487개의 LUB가 사상되었으며, 각 LUB의 하위노드를 포함해서는 모두 88,255개의 KLN 신셋이 사상되어 전체적으로는 97.91%가 사상되었다. 본 연구의 결과는 정교한 한국어 통사 및 의미 분석에 활용될 수 있을 것이다.

  • PDF

토픽맵 기반의 기록정보 검색시스템 구축에 관한 연구 (Construction of Record Retrieval System based on Topic Map)

  • 권창호
    • 기록학연구
    • /
    • 제19호
    • /
    • pp.57-102
    • /
    • 2009
  • 최근, 웹을 이용한 기록정보의 유통과 이용이 증가하고, 정보적 활용 가치가 제고되어 웹사이트를 이용한 기록정보서비스가 기록관의 중요업무로 부각되고 있다. 웹을 이용한 기록정보서 비스의 핵심은 이용자가 원하는 기록정보의 검색을 용이하게 하는데 있다. 검색을 용이하게 하기 위해서는 검색시스템의 기본 메커니즘인 이용자질의와 기록정보표현의 매칭의 정확성이 요구된다. 이를 위해 기록정보 관리자들은 다양한 정보표현 도구를 이용하고 있지만, 이용자들은 여전히 정보검색 과정에서 어려움을 겪고 있다. 이를 개선하기 위해 본 연구에는 기록물의 기술정보 메타데이타를 중심으로 정보자원을 구조화하여 이용자 질의의 접근점을 확장하고, 의미있는 매칭을 통해 지식자원화된 검색결과값을 제공하기 위해 토픽맵 기반의 기록정보 검색시스템을 구축하고자 한다. 구축대상은 웹사이트를 이용하는 불특정 이용자이며, 구축범위는 국가기록포탈의 기록자원 중 대통령 기록물로 선정하였다. 구축단계는 다음과 같다. 1)기록물의 기술정보 메타데이타를 중심으로 토픽맵 기반의 기록정보서비스를 위한 온톨로지 모델을 설계한다. 2)설계한 온톨로지 모델을 바탕으로 국가기록포탈에서 추출한 정보자원목록을 에디터를 이용해 토픽맵으로 반입하여 검색시스템으로 구현한다. 3)구축된 검색시스템의 사용자 인터페이스에서 테스트질의를 통해 토픽맵기반 검색시스템의 특징을 확인하고 그 의미를 평가한다. 최종적으로, 의미적 추론에 의한 연관 네비게이션검색을 확인하고, 분산된 기록정보자원 간의 연계된 결과값을 통해 지식자원화의 가능성도 제시한다.

디지털 특수자료를 위한 XML 스키마 기반의 메타데이터 표현 체계 (A Metadata Representation Scheme based on XML Schema for Special Digital Collections)

  • 오삼균;채진석
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.109-131
    • /
    • 2004
  • 정보자원의 전달 매체와 형태가 다양화됨에 따라서 이에 대한 관리방법 또한 다양화되어 왔다. 도서관 환경에서는 정보자원를 위한 관리방법으로서 AACR, KCR 등의 목록규칙이 정립되었으며 이러한 목록규칙에 근거한 정보자원관리를 자동화하고자 하는 노력의 결과로서 MARC가 개발되었다. 하지만, MARC 레코드는 서지 레코드가 지니고 있는 의미적 관계의 표현을 지원하지 못하는 구조적 경직성으로 인해 다양하고 상이한 기술적 특성을 지니는 정보자원들을 적절히 기술하는데 제약이 따른다. 즉, MARC의 기본 설계 목적이 몇몇 정보유형에는 비교적 적합하더라도 새로운 형태의 정보유형의 다양성을 지원하는데 어려움이 있다. 또한 MARC를 활용한 정보자원 관리 방식에서는 정보자원 간 연결 관계의 표현을 지원하지 못한다. 즉, MARC의 데이터 모델은 자원기술의 대상을 단일의 객체로 파악하는 단층 데이터 모델이기 때문에 여러 객체들 간의 연결 관계를 설정할 수 있는 다층 데이터 모델을 이용한 정보자원 기술이 필요한 경우는 적절치 못하다. 본 연구에서는 다층 데이터 모델을 지원하는 IFLA FRBR 기본 모델을 기초로 하여 전자도서관에서 사용되는 고서, 고문서, 음악 자료, 학술회의 및 세미나 자료의 관리에 있어서 이용자의 정보요구를 최대한 수용할 수 있는 최적의 메타데이터 모델과 이에 대한 XML 스키마 기반의 표현 체계를 제시하고자 한다.

상황과 정보 집적도를 고려한 유사도 기반의 맞춤형 지식 생성프레임워크 (Customized Knowledge Creation Framework using Context- and intensity-based Similarity)

  • 손미애;이현정
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.113-125
    • /
    • 2011
  • 정보의 출처와 형식이 다양해지고 정보의 양 또한 많아짐에 따라 소셜 웹에서의 맞춤형 지식 생성은 더욱 어려워지고 있다. RSS(Really Simple Syndication)가 정보 수집 방법의 개선에 일조했으나, 웹에 산재된 정보를 찾아 필요한 정보들만으로 구성된 맞춤형 지식을 생성하는 것은 여전히 사용자들의 몫으로 남아 있다. 본 논문에서는 맞춤형 지식 생성의 용이성을 제고하기 위해 상황 기반 유사도를 이용한 맞춤형 지식생성 프레임워크를 제안하였다. 본 프레임워크는 기본적으로 사례 기반추론의 절차를 따르지만, 기존 사례 기반의 유사도 계산 방식이 문법적 추론에 기반했던 것과 달리, 온톨로지를 활용한 의미적 유사도를 이용한 사례 기반 추론을 활용한다. 또한 사용자 요구를 만족하는 유사사례의 보정을 위해 온톨로지를 활용한 정보 집적도 기반의 유사도 방법론을 제안하였다. 본 프레임워크에서는 첫째 비구조적인 웹 정보를 사례 형태의 구조적 정보로 변환하고, 둘째 사용자의 요구에 적합한 의미론적 유사사례를 찾은 후 셋째, 선택된 유사사례의 정보 집적도를 고려한 보정을 통해 맞춤형 지식을 생성하는 과정을 거친다. 본 논문에서는 유사도 계산에 일반적으로 활용되는 여러 방법론들과 비교를 통하여 제안한 온톨로지 기반 의미적 유사도 계산 방법론의 타당성을 입증하였다.

기록정보 LOD 구축을 위한 의미 상호연결 자동화 실험 연구 (An Experimental Study on the Automatic Interlinking of Meaning for the LOD Construction of Record Information)

  • 하승록;안대진;임진희
    • 한국기록관리학회지
    • /
    • 제17권4호
    • /
    • pp.177-200
    • /
    • 2017
  • 빅데이터, 인공지능 등 신기술 환경에서 LOD는 기록정보자원을 내외부의 다양한 데이터들과 연결되도록 할 것이다. 이러한 연결의 중심에는 상호연결(Interlinking) 기술이 존재하며, 상호연결된 LOD는 기록정보 개방을 데이터 개방(Open Data)의 최상위 단계로 실현할 것이다. 지속적으로 증가하는 기록의 양을 감안하면, LOD 구축 시 상호연결 알고리즘을 통한 자동화는 필수적이다. 이에 본 연구는 기록정보가 외부 데이터와 상호연결되는 구조와 상호연결 시 고려해야 할 기록정보의 특성을 분석하였다. 또한 국가기록원 CAMS 데이터의 샘플을 수집하여 기록정보 LOD를 구축한 뒤, 기록물 메타데이터의 인물정보를 DBPedia와 자동으로 상호연결하는 테스트베드를 진행하였다. 이를 통해 상호연결 자동화 프로세스를 확인하고, 자동화 기술의 성능과 정확도를 확인하였다. 그리고 테스트베드를 통해 얻은 시사점을 통해 기록정보 LOD 상호연결 과정의 고려사항을 파악하였다.

AACR2에서 RDA로 목록규칙 변화에 따른 KCR4의 고려사항에 관한 연구 (A Study on Considerations in KCR4 through Changes of Cataloging Rules from AACR2 to RDA)

  • 이미화
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.23-42
    • /
    • 2011
  • 본 연구는 AACR2와 이를 대체하는 새로운 목록규칙인 RDA의 규칙을 비교하여, RDA에 대한 이해를 높이고, 우리나라의 한국목록규칙에서 고려해야 할 사항을 파악하기 위한 것이다. RDA는 모든 유형의 자원을 서지제어할 수 있는 구조로 International Cataloging Principles(2009), FRBR, FRAD를 구현하기 위한 목록규칙이며, 국제적인 환경에 융통성 있게 적용가능하다. RDA는 웹환경에 맞는 시멘틱 웹으로 구현이 가능하도록 집중기능과 다양한 관계에 기반을 두고 있어 미래의 목록에 큰 영향을 줄 것이기 때문에 국내에서도 이를 반영하는 연구가 필요하다. 비교는 JSC for Development of RDA의 2008년 RDA 초안을 기반으로 저작, 표현형, 구현형의 기술규칙을 대상으로 분석하였다. 구현형에서는 표제, 자료유형, 책임사항, 판사항, 발행사항, 형태사항, 총서사항의 기술영역별로, 저작과 표현형에서는 저작 유형에 따른 채택접근점을 중심으로 RDA와 AACR2 규칙 중에서 변경된 사항을 중심으로 살펴보았다. 본 연구는 RDA에서 제시한 목록규칙을 바탕으로 앞으로 목록의 발전 방향을 파악할 수 있으며, 국내의 목록규칙 개정 시에도 많은 도움이 될 것이다.

지능형 화상 검색 시스템에서의 사용자 모델을 이용한 사용자 적응 (User Adaptation Using User Model in Intelligent Image Retrieval System)

  • 김용환;이필규
    • 한국정보처리학회논문지
    • /
    • 제6권12호
    • /
    • pp.3559-3568
    • /
    • 1999
  • 수많은 정보의 홍수 속에 정보 과다는 현대인의 피할 수 없는 문제로 대두되었다. 특히, 인터넷과 컴퓨팅 기술의 발전으로 정보 자원이 급속도로 증가하고 있다. 따라서, 사용자가 원하는 정보를 찾아내는 것은 더욱 어려워졌다. 이러한 정보 검색 문제들을 해결하기 위하여 많은 정보 검색 시스템이 나타나게 되었다. 현재의 정보 검색 시스템들은 문서 검색에서는 사용자의 요구에 맞는 결과를 찾아 주고 있다. 그러나. 화상에 대한 검색 시스템의 연구는 초보 단계이기 때문에 사용자의 요구에 맞는 결과를 출력하지 못하고 있다. 이러한 문제를 해결하기 위해서 본 논문에서는 화상 검색 시스템이 사용자 모델을 이용하여 사용자에게 적응할 수 있는 기능을 부여하기 위하여 지능 사용자 인터페이스에 관한 고찰을 통한 인간-컴퓨터의 상호 작용 모델인 HCOS(Human-Computer Symmetry) 모델을 적용하고 이를 기반으로 화상 검색 시스템에서의 사용자 적응 능력을 갖는 지능 사용자 인터페이스를 제안하였다. 지능 사용자 인터페이스는 정보 검색의 복잡성과 사용자와 시스템간의 의미상의 차이를 감소시켜야 하며 사용자의 질의 성향과 관심을 반영할 수 있도록 학습 기능과 적응 기능을 포함하고 있어야 한다. 이를 위해 본 논문에서는 화상 검색을 위한 사용자 모델에 기계 학습(Machine Learning) 알고리듬인 결정 트리(Decision Tree)와 역전파 신경망(Backpropagation Neural Network)을 사용하였다. 지능 사용자 인터페이스의 화상 검색 실험을 통하여 시스템이 사용자에 적응하여 검색 효율이 좋아짐을 알 수 있었다.

  • PDF

상수도시스템 수질사고의 전개양상을 고려한 비정형정보 의미분석 (Semantic analysis of unstructured information considering the step in progress of water quality accidents in the water supply systems)

  • 홍성진;문기훈;양성훈;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.378-378
    • /
    • 2022
  • 상수도시스템의 과정 중 최종 단계인 급수단계에서 지역전반에 수질문제가 발생할 경우, 직간접적인 피해의 해결은 장기간 지속될 수 있다. 본 연구에서는 실시간 비정형정보의 빅데이터 분석을 통해 상수도시스템에서 수질사고 문제의 파급력과 2차 피해 등의 연결 관계 변화 추적을 위한 기초적 분석을 수행하였다. 과거 대규모 수질사고가 발생된 바 있는 인천광역시 유충발생 사고를 대상으로 뉴스 기사 웹크롤링 절차를 정립하고, 그 결과를 분석하였다. '인천 유충'이 최초 보도되었던 2020년 7월 13일 부터 이후 1년을 대상으로 네이버 통합검색에 의해 표출되는 뉴스기사를 웹크롤링하였으며, 프로그래밍을 통한 불용어 제거 및 관련성 검토를 통해 총 920건의 기사를 분석하였다. 수질사고의 전개양상에 따라 사고발생, 확산, 수습, 그리고 보상의 4단계로 임의 구분하여 분석하였다. 의미분석을 위한 토픽모델링 기법은 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 방법을 적용하였으며, 긍부정 감정분석은 KNU 한국어 감성사전(KNU sentiment lexicon)을 활용하여 수행하였다. 토픽 모델링 결과, 사고 발생에서부터 확산, 수습, 보상의 단계에 맞춰 적절한 주제어의 조합에 따른 기사들이 도출되었으며, 단계별 긍부정 기사 비율역시 사고의 전개단계에 따라 적절히 나타남을 확인하였다. 제시된 수질사고 관련 비정형정보 분석 방법론과 결과는 과거 사고 사례 분석을 통한 검색 및 긍부정 키워드 확정, 키워드 발생 비율 변동(사고전과 후)에 따른 상황판단 기준설정 등에 활용이 가능하다.

  • PDF