• 제목/요약/키워드: 시맨틱 온톨로지

검색결과 430건 처리시간 0.026초

조선시대 선생안 온톨로지 설계 (Ontology Design for the Register of Officials(先生案) of the Joseon Period)

  • 김사현
    • 동양고전연구
    • /
    • 제69호
    • /
    • pp.115-146
    • /
    • 2017
  • 본고는 조선시대 선생안의 디지털 아카이브를 위한 온톨로지(Ontology) 설계에 관한 연구이다. 선생안(先生案)은 조선시대 각 관청에서 소속 관원(官員)의 인적사항 및 인사이동을 기록한 일종의 인명부(人名簿)이다. 일반적으로 관원의 성명(姓名), 생년(生年), 자(字), 본관(本貫) 등의 인적사항 정보와 관직(官職), 제배일(除拜日), 도임일(到任日), 체임일(遞任日), 체임사유(遞任事由) 등의 인사이동 정보가 기록되어 있다. 현전(現傳)하고 있는 선생안은 국 내외 도서관 및 박물관에 소장되어 있으며 그 수는 176종으로 알려져 있다. 이 중에서 한국학중앙연구원 장서각에 소장된 47건의 선생안을 대상으로 선생안의 내용 및 구조를 검토하고, 선생안의 소장처, 선생안 기록 주체인 관청, 기록된 관직, 관원 등 관련 있는 주변의 내용을 담아낼 수 있는 온톨로지를 설계한다. 조선시대 선생안 온톨로지는 실물자료인 선생안 소장정보와 선생안에 기록된 내용의 특징을 반영해 관원, 관청, 인사이동에 초점을 맞추어 설계하였다. 온톨로지 설계는 대상자원을 클래스(Class)로 범주화 하고, 범주에 속하는 개체들(Individuals)은 공통의 속성(Attribute)를 갖도록 하였다. 그리고 각각의 개체들은 다른 개체와의 관계(Relation)를 명시적으로 표현할 수 있는 의미적인 관계어를 정의하였다. 클래스는 '선생안', '인물', '관청', '관직', '장소', '과거(科擧)', '기록', '개념' 등 8개로 범주화하였다. 관계, 속성의 설계는 기존에 설계되어 활용되고 있는 '더블린코어(Doublin Core)', '유로피아나데이터모델(Europeana Data Mode)', 'CIDOC-CRM', '과거 합격자 데이터베이스를 위한 데이터 모델' 등의 어휘를 참조하여 설계하였다. 기존 데이터모델에서 설계한 어휘를 사용한 경우에는 해당 데이터모델의 이름 공간(Namespace)을 사용하였으며, 필요한 경우 필자가 관계를 정의하였다. 설계한 온톨로지는 명릉선생안(明陵先生案)으로 구현 예시를 보이고, 하나의 선생안에서 다수의 선생안으로 대상을 확대하여 정보를 입력하였을 때 기대되는 효과와 활용 방안에 대해 모색해 보았다. 조선시대 선생안 온톨로지는 현전하는 선생안 176종 모두를 검토하여 설계된 것이 아니기 때문에 완벽한 온톨로지로써 기능하기에는 무리가 있다. 지속적으로 선생안의 정보가 입력되는 과정에서 온톨로지 모델의 수정 및 보완이 필요하며, 그 지향점은 선생안에 기록된 정보들을 체계적으로 정리하기 위한 것도 있지만, 선생안에서 확인되는 인물, 관직 등의 정보 요소가 이미 서비스 구축 되었거나, 향후 제작될 조선시대 인물에 관한 데이터베이스 혹은 아카이브와 연계될 수 있는 것도 고려해야 할 것이다. 조선시대 선생안 온톨로지로 입력된 정보는 조선시대 관청 운영과 인사시스템을 볼 수 있는 일면으로 활용되고, 이미 구축된 여타 조선시대와 관련된 데이터베이스와 연계되어 조선시대의 정치 경제 사회 문화를 종합적으로 이해하는 자료의 하나로 기능하기를 기대한다.

관계형 데이터베이스를 이용한 효율적인 OWL 속성 추론 기법 (An Efficient Reasoning Method for OWL Properties using Relational Databases)

  • 린제시;이지현;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권2호
    • /
    • pp.92-103
    • /
    • 2010
  • OWL(Web Ontology Language)은 시맨틱웹에서 온톨로지를 배포하고 공유하기 위한 W3C의 정식 권고안(Recommendation)으로 채택되었다. OWL 데이터의 숨겨진 정보를 유추하기 위해서 OWL 추론기들이 많이 개발되었다. 그러나 OWL 추론기들은 메모리를 기반으로 처리되기 때문에 대용량 OWL 데이터를 처리하기는 어렵다. 이런 문제를 해결하기 위해서 관계형 데이터베이스에 기반한 시스템이 제안되었다. 이 시스템들은 OWL 데이터를 데이터베이스에 저장하여 데이터베이스 내에서 추론을 한다. 하지만, 이 시스템들은 OWL에서 정의되는 모든 속성(Property)을 고려하지 않았고, 추론에 비효율적인 스키마를 사용하고 있다. 그리고 실제 응용환경에서 자주 발생하는 OWL 데이터 변경에 대해서도 다루지 않았다. 본 논문에서는 관계형 데이터베이스에 기반한 여러 스키마를 비교하고, 효율적인 추론을 위한 개선된 스키마를 제안한다. 그리고 OWL에서 정의되는 모든 종류의 속성을 지원하기 위한 완전하고 효율적인 추론 알고리즘과 OWL 데이터 변경에 대해 효율적인 갱신 방법을 제안한다. 실험결과를 보면 본 논문에서 제안한 스키마가 OWL 데이터 저장 및 추론에 대해 기존 스키마보다 더 좋은 성능을 보이며, OWL 데이터 갱신 방법도 기존의 방법보다 더 효율적이다.

정보검색의 시맨틱웹 지향 설계에 관한 연구 - 온톨로지와 소셜태깅을 활용한 탐험적 발견행위 모델개발을 중심으로 - (A Study of a Semantic Web Driven Architecture in Information Retrieval: Developing an Exploratory Discovery Model Using Ontology and Social Tagging)

  • 조명대
    • 한국비블리아학회지
    • /
    • 제21권3호
    • /
    • pp.151-163
    • /
    • 2010
  • 이 논문에서는 기존 정보검색모델에서의 문제점을 살펴보고 그 대안을 제시하고 있다. 정보환경의 변화에 따라 '개념'중심의 새로운 정보조직인 온톨로지와 소셜태깅은 탐험적 발견행위를 가능하게 해줄 수 있다. 이들을 통해 어느 한 이용자의 머릿속에 있는 생각을 인터넷상의 수많은 사람의 머릿속에 있는 생각을 연결해주고 있다. 이러한 상호작용을 통한 연결고리를 통해서 이젠 이용자들이 탐험적으로, 적극적으로 정보를 찾아 나서고 있다. 이에 본 연구의 목적은 질적인 연구방법론으로 온톨로지와 소셜태깅에서 제공되는 수많은 탐색촉진제의 존재를 밝힌 후, 하나의 탐험적 발견행위 모델을 만들어내는 것이다. 그 결과는 먼저 3개의 상위그룹이 형성되었다. 첫째, 브라우징 및 모니터링으로 어떤 대상을 인지 및 집중하는 단계, 둘째, 의미부여로 적극적인 참여 및 공유하는 단계이며 셋째는 더 적극적으로 생각을 확장시켜나가면서 스스로 사회적 학습을 하는 단계였다. 제일 첫 그룹에는 정보요구인지, 소셜공간에서 도움 필요성인지, 도움을 받을 수 있는 자료 발견, 일단 멈춤, 그 대상에 집중등의 단계가 있었다. 두 번째 그룹에는 적극적 의미형성, 소셜 북마킹 및 태깅, 소셜 네트워크에서 나눔, 처음 정보요구를 더 구체화하는 단계가 있었다. 세 번째는, 발견적인 소셜학습, 우연한 정보 발견, 창조적 생각을 유발, 문제 해결 능력향상 등의 총 13단계를 발견하게 되었다. 이 모델은 이용자들이 탐험적 발견행위를 할 수 있는 능력을 향상하게 시키는 정보시스템 디자인에 공헌할 수 있을 것이다.

관계형 데이터베이스로부터 OWL 온톨로지를 추출하기 위한 SPARQL-DL 프로세서 (SPARQL-DL Processor to Extract OWL Ontologies from Relational Databases)

  • 최지웅;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권3호
    • /
    • pp.29-45
    • /
    • 2015
  • 본 논문에서는 RDB로부터 가상적 변환에 의해 생성되는 OWL 온톨로지의 질의 응답을 위하여 OWL을 위한 질의어인 SPARQL-DL의 구현 방법을 제안한다. 제안하는 SPARQL-DL 프로세서는 입력된 SPARQL-DL 질의문을 내부에서 SQL 질의문으로 변환하여 실행시킨다. 이러한 질의 처리 방식은 두 가지의 장점이 있다. 첫째, RDB로부터 생성된 OWL 온톨로지를 저장하기 위한 별도의 저장소가 요구되지 않는다. 둘째, 대용량 ABox 추론에 문제점을 나타내는 Tableau 알고리즘 기반의 추론기의 사용 없이도 RDB 인스턴스로부터 생성된 대용량 ABox가 서비스 될 수 있다. 본 논문의 SPARQL-DL 질의문으로부터 SQL 질의문을 생성하는 알고리즘은 RDB와의 연결 수립에 따른 오버헤드를 최소화하기 위하여 입력된 하나의 SPARQL-DL 질의문이 하나의 SQL 질의문으로 변환되도록 설계되어있다.

VIVO를 활용한 국가적 전거구축모델에 관한 연구 (Constructing a Model for National Authority Control Utilizing VIVO)

  • 오삼균;한상은;손태익;김성훈
    • 정보관리학회지
    • /
    • 제35권3호
    • /
    • pp.165-187
    • /
    • 2018
  • 전거데이터 공동구축을 목표로 하는 많은 국내 연구가 시행되었음에도 불구하고 국가전거구축의 협업 환경은 표준 전거의 제정, 표준 전거 구축원칙의 제정, 기존 전거구축 기관의 업무 개편, 공동구축 업무의 핵심기관 선정 등과 같은 전제 조건의 미비로 인해 그 실질적 조성이 막혀 있다. 국가전거를 공동으로 구축하고 원활하게 활용하기 위해서는 기존 전거구축기관의 업무에 지장을 초래하지 않는 현실적 협업 방안과 지속적 추진력을 보유한 국가기관의 참여와 아울러 다수 기관의 데이터 병합을 가능케 하는 표준식별체계가 요구된다. 본 연구의 목적은 국가전거의 공동 구축을 위한 여건 조성에 있어서 필수사항이 무엇인가를 문헌조사로 밝히고, 시맨틱웹 기반으로 구축되어 상호운용성이 우수한 VIVO 온톨로지 모델의 활용을 통해 구현 가능한 국가전거 구축모델을 제시하는 것이다.

공공데이터 활용을 위한 링크드 데이터 국가 연계체계 구축에 관한 연구 (A Study on National Linking System Implementation based on Linked Data for Public Data)

  • 윤소영
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.259-284
    • /
    • 2013
  • 공공데이터는 공공기관의 정책 수립 등의 공적 기능을 수행하기 위하여 많은 비용을 들여 수집되고 있으나 대부분은 사일로(silos)로 방치되고 있다. 우리나라도 공공데이터를 개방하려는 움직임이 활발해지고 있으나 일부 기관을 중심으로 OpenAPI 형식으로 데이터를 제공하는 등 제한적인 수준에 머물고 있다. 국가차원에서 LOD(Linking Open Data) 시범사업으로 공공DB 피디아를 구축하면서 최근 들어 공공데이터 활용을 위한 링크드 데이터 구축이 활발하게 논의되고 있다. 본 연구에서는 관련연구 및 공공부문을 중심으로 한 링크드 데이터 구축 사례를 바탕으로 공공데이터 활용을 위한 국가 연계체계 사업인 공공DB 피디아 구축과정에서 도출된 문제를 파악하고 기존의 국가DB 연계체계 구축과정을 참고하여 그 해결 방안을 제시하였다.

스마트 환경에서 이-러닝 서비스를 위한 학습 미디어 Harmonizing 기법 연구 (A Study on the Harmonizing media for E-learning service in Smart Environment)

  • 김스베틀라나;윤용익
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권10호
    • /
    • pp.137-143
    • /
    • 2012
  • 학습자들은 스마트 디바이스를 이용하여 언제 어디서나 인터넷 접속을 통한 각종 학습처리까지 가능하다. 일상생활에서 계속적으로 스마트 디바이스를 이용할 수 있는 인터넷의 자유를 얻는 만큼 학습자들의 다양한 학습(learning) 서비스 요구와 이용 또한 활발해 진 것이다. 이점에서 요구하는 학습의 관련된 자료들을 동시에 제공할 수 있는 조화로운 융합형 학습 서비스를 제공하는 새로운 이-러닝 연구의 필요성이 높아지고 있다. 융합형 학습 서비스는 하나의 혹은 여러 디바이스를 통해 복합 미디어를 구성하는 각각의 콘텐츠간의 조화로운 동기화는 중요 조건이다. 현재는 대표적으로 융합미디어간의 동기화를 제공하는 방법은 콘텐츠간 절대적인 시간 값을 맞추는 방법이다. 그러나 이 방법은 콘텐츠를 전송시 시간적인 딜레이 발생한다. 또한 콘텐츠의 지속시간에 대한 절대적인 시간값을 직접 입력해야하는 번거로움이 있으며, 콘텐츠 작성 시 여러 문제들이 발생한다. 본 논문에는 동기화 문제를 해결 할 수 있는 내용에 따른 하모나이징 동기화 기법 모델(Harmonizing Sync Model)을 제고하고자 한다. 내용에 따른 동기화 기법은 학습 콘텐츠를 집합관계를 효과적으로 모델링 하여 다양한 학습 융합미디어를 갖춘 스마트러닝 개념이다.

스포츠산업 통합정보망 구축 방안 (A construction Plan for the integrated information network of sports industry)

  • 전선혜;강승애;김현철;권형일;강선영;김여진;전희준
    • 융합보안논문지
    • /
    • 제13권3호
    • /
    • pp.63-69
    • /
    • 2013
  • 본 연구는 스포츠산업분야의 정보 체제를 통합한 정보인프라를 구축함으로써 수직적 수평적 네트워크 형성, 지식정보의 공유와 확산의 극대화를 목적으로 하였다. 스포츠산업 통합 정보망 구축 모형 및 방안 모색을 위하여 스포츠 산업 정보 시스템과 네트워크 시스템 현황에 관한 문헌조사와 전문가회의를 실시하였다. 스포츠산업 관련 정보는 국가 기술력의 기반으로 대용량화, 전문화된 스포츠산업 정보의 특성상 분산화, 고속화가 필수적이다. 이를 보장하기 위해서는 유기적인 정보 공유 및 교류가 가능한 인프라를 구축하여 국내외 스포츠산업 관련 기관의 개발자들에게 핵심 인프라를 제공하고, 사용자 중심의 통합정보망으로서의 선도적 역할이 필요하다. 이에 따른 결과로 첫째, 온톨로지(Ontology)를 반영한 스포츠산업 관련정보 DB구축단계이며, 시맨틱 웹(Semantic Web)을 고려한 DB설계가 필요하다. 둘째, DB 구축 이후 이들 간 유기적인 정보 교류를 가능하게 하는 RSS/Atom 기반 능동형 네트워크 구축이 필요하다.

온톨로지 기반 지능형 규칙 구성요소 추출에 관한 연구 (Ontology - Based Intelligent Rule Components Extraction)

  • 김우주;채상용;박상언
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.237-244
    • /
    • 2006
  • 시맨틱 웹 관련연구가 증가함에 따라 하나의 관련분야로 규칙기반 시스템 동의 지능적인 웹 환경에 대한 기대 역시 커지고 있다. 하지만 규칙기반 시스템을 활용하기에는 아직도 규칙습득이 많은 제약이 되고 있다. 규칙습득은 웹으로부터 필요한 규칙을 습득하는 일련의 방법인데, 이러한 규칙을 습득하기 위해서는 규칙구성요소를 먼저 식별해야만 한다. 그러나 이러한 규칙을 식별하는 작업은 대부분 지식관리자의 수작업에 의해 이루어지고 있다. 본 연구의 목적은 웹으로부터 규칙구성요소 식별을 최대한 자동화하고 지식관리자의 수작업을 최소화함으로써 그 부담을 줄여 주는 데 있다. 이러한 방법으로는 온톨로지를 근간으로 하여 웹 페이지와의 문자열 비교, 이러한 비교의 한계를 극복하기 위한 확장등의 방법이 있다. 첫 번째 방법은 온툴로지 기반으로 규칙식별 할 웹 페이지와 비교를 통해 지식관리자의 규칙식별 과정을 최대한 자동화하여 주는 것이다. 여기서 만약 현재 규칙을 식별하고자 하는 웹 사이트와 유사한 시스템의 규칙들을 활용하여 일반화 된 온툴로지가 구축되었다면, 이 온톨로지를 기반으로 규칙을 식별하고자 하는 웹사이트와의 비교를 통해 규칙구성요소를 자동화하여 추출 할 수 있다. 이러한 온툴로지를 기반으로 규칙을 식별하기 위해서는 문자열 비교 기법을 사용하게 된다. 하지만 단순한 문자열 비교 기법만으로는 규칙을 식별하는 데에 자연어 처리에 대한 한계가 있다. 이를 극복하기 위해 다음의 두 번째 방법을 사용하고자 한다. 두 번째 방법은 정형화되지 않은 정보들을 확장하여 사용하는 것이다. 우선 찾고자 하는 단어들의 원형을 찾기 위한 스테밍 알고리즘 기법, WordNet을 이용하여 동의어 유의어등으로 확장을 하는 WordNet Expansion 기법, 의미 유사도를 측정하기 위한 방법인 Semantic Similarity Measure 등을 단계적으로 수행하여 자동화되고 정확한 규칙식별을 하고자 한다. 이러한 방법들의 조합으로 인하여 규칙구성요소 추출이 되지 않을 후보 단어들의 수를 줄여서 보다 더 정확하고, 지능적인 규칙구성요소 추출 방법론을 제시하고 구현하여 지식관리자의 규칙습득에 대한 부담을 줄여 주고자 한다.

  • PDF

한국어 어휘의미망 "KorLex 1.5"의 구축 (Construction of Korean Wordnet "KorLex 1.5")

  • 윤애선;황순희;이은령;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권1호
    • /
    • pp.92-108
    • /
    • 2009
  • 1980년대 중반부터 지난 20여 년간 구축해 온 영어 워드넷(PWN)은 인간의 심상어휘집을 재현하려는 목적으로 개발되기 시작하였으나, 그 활용 가능성에 주목한 것은 자연언어처리와 지식공학 분야다. 컴퓨터 매개 의사소통(CMC), 인간-컴퓨터 상호작용(HCI)에서 인간 언어를 자연스럽게 사용하여 필요한 정보를 획득하기 위해서는 의미와 지식의 처리가 필수적인데, 그 해결의 실마리를 어휘라는 실체를 가진 언어단위에서 찾을 수 있기 때문이다. 이후 전 세계적으로 약 50개 언어의 어휘의미망이 PWN을 참조모델로 구축되어 다국어처리의 기반을 제공할 뿐 아니라, 시맨틱 웹 이후 더욱 주목받고 다양한 방식으로 활용되고 있다. 이 논문은 PWN을 참조 모텔로 2004년부터 2007년까지 구축한 한국어 어휘의미망 KorLex 1.5를 소개하는 데 있다. 현재 KorLex는 명사, 동사, 형용사, 부사 및 분류사로 구성되며, 약 13만 개의 신셋과 약 15만 개의 어의를 포함하고 있다.