• 제목/요약/키워드: Feature Library

검색결과 181건 처리시간 0.024초

동사 어휘의미망 평가를 위한 단어클러스터링 시스템의 활용 방안 (The Method of Using the Automatic Word Clustering System for the Evaluation of Verbal Lexical-Semantic Network)

  • 김혜경;윤애선
    • 한국문헌정보학회지
    • /
    • 제40권3호
    • /
    • pp.175-190
    • /
    • 2006
  • 최근 수년간 한국어를 위한 어휘의미망에 대한 관심은 꾸준히 높아지고 있지만. 그 결과물을 어떻게 평가하고 활용할 것인가에 대한 방안은 이루어지지 않고 있다. 본 논문에서는 단어클러스터링 시스템 개발을 통하여, 어휘의미망에 의해 확장되기 전후의 클러스터링을 수행하여 데이터를 서로 비교하였다 단어클러스터링 시스템 개발을 위해 사용된 학습 데이터는 신문 말뭉치 기사로 총 68.455.856 어절 규모이며, 특성벡터와 벡터공간모델을 이용하여 시스템A를 완성하였다. 시스템B는 구축된 '(-하)동사류' 3,656개의 어휘의미를 포함하는 동사 어휘의미망을 활용하여 확장된 것으로 확장대상정보를 선택하여 특성벡터를 재구성한다. 대상이 되는 실험 데이터는 '다국어 어휘의미망-코어넷'으로 클러스터링 결과 나타난 어휘의 세 번째 층위까지의 노드 동일성 석부로 정확률을 검수하였다. 같은 환경에서 시스템A와 시스템B를 비교한 결과 단어클러스터링의 정확률이 45.3%에서 46.6%로의 향상을 보였다. 향후 연구는 어휘의미망을 활용하여 좀 더 다양한 시스템에 체계적이고 폭넓은 평가를 통해 전산시스템의 향상은 물론. 연구되고 있는 많은 어휘의미망에 의미 있는 평가 방안을 확대시켜 나가야 할 것이다.

OWL DL을 사용한 GPM 핵심 모델의 구현 (Implementation of GPM Core Model Using OWL DL)

  • 최지웅;박호병;김형진;김명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.31-42
    • /
    • 2010
  • GPM(Generic Product Model)은 원자력 플랜트의 라이프 사이클 데이터를 통합, 공유하기 위하여 일본의 Hitachi에서 개발한 공통 데이터 모델이다. GPM은 추상 모델 성격의 GPM 핵심 모델과 핵심 모델의 기술을 위한 구현 언어 그리고 구현 언어로 작성된 참조 라이브러리로 구성되어 있다. GPM 핵심 모델은 객체들 사이의 의미가 부여된 관계 정의를 통하여 객체 의미 관계 네트워크 모델을 구성할 수 있는 특성이 있다. 초기의 GPM은 GPM 핵심 모델의 특성을 반영한 신택스의 GPML이라는 구현 언어를 개발하여 제공하였으나 원자력 플랜트 라이프 사이클동안 다양한 목적으로 GPM 데이터 모델에 접근하는 이기종 애플리케이션들과의 상호운용성을 위하여 XML을 기반으로 하는 GPM-XML로 교체되었다. 그러나 현재 GPM-XML을 사용하여 구축한 GPM 데이터 모델이 객체 의미 관계 네트워크 모델로서 활용되기 위한 GPM-XML 기반의 연구가 미비한 상태이다. 따라서 본 논문에서는 객체 의미 관계 네트워크와 유사한 성격의 온톨로지를 기술할 수 있으며 이를 지원하는 기술 표준 및 도구들이 이미 활용 가능한 수준에 있는 OWL을 GPM 핵심 모델을 위한 구현 언어로서 제안한다. OWL은 XML 기반의 RDF/XML 형식으로 기술될 수 있으므로 상호운용성 또한 보장받을 수 있다. 본 논문은 OWL의 세 가지 하위 언어 사양 중 추론기능을 완벽히 제공받을 수 있는 가운데 문법적 제약이 가장 덜 엄격한 OWL DL을 사용한다. 본 논문은 OWL DL을 GPM 핵심 모델의 구현 언어로서 사용하기 위하여 GPM과 OWL 두 모델 사이의 차이점을 도출한 후 이를 해소할 수 있는 방법을 제안하며 이 방법을 적용하여 GPML로 작성된 참조 라이브러리를 OWL DL 기반의 온톨로지로 변환하여 구축하는 방법을 기술한다.

원자력분야 연구기록물의 체계 분석과 TOC 기반 구조화에 관한 연구 (A Study on Category Analysis and TOC-based Structuralization of Research Records in Atomic Energy Field)

  • 오정훈;이응봉
    • 한국문헌정보학회지
    • /
    • 제48권2호
    • /
    • pp.287-306
    • /
    • 2014
  • 연구개발 과정에서 산출되는 다양한 연구기록물의 효율적인 관리 및 활용을 위한 다양한 연구가 최근 들어 많이 진행되고 있다. 그 중 연구기록물의 유형 분석 및 구조화 방안에 대한 연구는 효율적인 지식전수체계를 위하여 매우 중요한 부분이라고 할 수 있다. 본 연구에서는 연구기록물 통합관리시스템 구축을 위한 기초 연구로서 연구기록물의 특성을 반영한 효율적인 기록물 구조화 방안을 모색하였다. 첫째, 원자력기술 연구개발 과정에서 생산되는 광범위한 연구기록물의 유형을 분석하고 체계화하였다. 둘째, 연구기록물의 이용을 극대화하기 위하여 활용성 측면에서의 보다 효율적인 콘텐츠 구조화 방안을 제시하였다. 특히 연구기록물을 통합적이고 유기적으로 연계시키고자 전체 기록물을 TOC(Table of Contents)에 기반하에 데이터 연계, 검색 및 활용이 가능하도록 구조화를 시도하였다.

생의학 분야 학술 문헌에서의 이벤트 추출을 위한 심층 학습 모델 구조 비교 분석 연구 (A Comparative Study on Deep Learning Topology for Event Extraction from Biomedical Literature)

  • 김선우;유석종;이민호;최성필
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.77-97
    • /
    • 2017
  • 최근 생의학 분야의 학술 문헌이 기하급수적으로 급증함에 따라 관련 분야 연구자들은 선행 연구 및 연구 동향 파악에 어려움을 겪고 있다. 이에 효율적인 선행 연구 및 연구 동향 파악을 위한 정보 추출 기술이 요구되며, 학술 문헌의 정보 추출을 위한 개체인식 및 개체 간의 생의학 이벤트 추출 연구가 활발히 진행되고 있다. 본 연구는 이에 심층 학습(Deep Learning)의 기법 중 하나인 컨볼루션 네트워크(Convolutional Neural Networks, CNN) 모델을 기반으로 이벤트 내의 개체 유형 정보의 적용 위치와 함께, 이벤트 식별 및 분류를 고려하여 총 8가지의 모델을 구성하여 실험하였다. 실험 결과, 본 연구에서 제안하는 모델 중 최고성능을 보인 개체 유형 완전연결 모델이 이벤트 분류 실험에서 F-점수 72.09%의 높은 성능을 보였으나, 이벤트 추출 실험에서는 학습 컬렉션의 불균형 문제 및 이벤트 식별 모델의 성능 저조 등으로 인하여 F-점수 21.81%의 비교적 저조한 성능을 보였다.

서목답문의 분류체계에 관한 연구 (A study on the classification systems of the Shu-mu Da-wen)

  • 박재혁
    • 한국도서관정보학회지
    • /
    • 제27권
    • /
    • pp.171-209
    • /
    • 1997
  • The results of the study can be summarized as follows. The Shu-mu Da-wen was selected and compiled by Zhang Zhi Dong at the end of Qing Dynasty as a reading list for students preparing for the state examination and for the purpose of choosing the best from several versions. Whether it was compiled and edited by Zhang was in dispute. But it is almost certain that Zhang was the main editor because Shu-mu Da-wen showed his political, educational and scientific thoughts and knowledge distinctively. The followings are characteristics of Shu-mu Da-wen being compared with Si-ku Quan-shu Zong-mu Ti-yao. 1. In Jing-bu, the Confucian classics are divided into Zheng-jing Zheng-zhu and 'Lie-chao Jing-zhu Jing-shuo Jing-ben kao-zheng. Zheng-shi lei is divided into Zheng-shi fen he ke ben and Zheng-shi zhu bu biao pu kao-zheng. It is the special sorting method to include Du-ben lei in Jing-bu and Chu xue du-ben in Bie-lu in order to provide first learners for reading order. 2. Shi-bu included Gu-shi newly and Di-li lei is divided into Gu Di-li and Jin di-li in Shi-bu. Tian-wen Suan-fa lei is divided into Zhong-fa and Xi-fa in Zi-bu. Zhang distinguished between old books and contemporary ones to find out the origin and include newly published books in the East and the West. 3. Zhou-Qin zhu-zi is newly added to Zi-pu. In Ji-pu, Bie-ji and Zong-ji are categorized according to their style and period respectively. This show the new sorting method which added classifying system concerning academic development. It is the prominent feature in the compiling system to make Bie-lu and Cong-shu respective chapters. With those characteristics the Shu-mu Da-wen had been edited and published several times. It had a wide effect not only on compiling methods of cataloging afterwards and but also on classification systems before decimal classification was introduced in China.

  • PDF

BIBFRAME 2.0 특징 분석 및 BIBFRAME 구축시 고려사항에 관한 연구 (A Study on the Considerations in Constructing BIBFRAME by Analyzing BIBFRAME 2.0)

  • 이미화
    • 한국도서관정보학회지
    • /
    • 제48권4호
    • /
    • pp.107-127
    • /
    • 2017
  • 본고는 국내에서 BIBFRAME 구축을 위한 세부적인 방안 마련의 필요성을 인식하고 BIBFRAME 2.0의 특징을 변경사항을 중심으로 분석하고 이를 바탕으로 BIBFRAME 구축시 고려사항을 제시하고자 문헌연구를 실시하였다. 고려사항으로 첫째, BIBFRAME 2.0에서 핵심 개체로서 표현형 개체의 추가 혹은 표현형의 명확한 기술 방안의 필요성을 제기하였다. 둘째, 자료유형별 다양한 기술 요소를 BIBFRAME과 매핑하여 BIBFRAME에서 RDA 요소의 반영여부를 파악하고, BIBFRAME 속성, 클래스 어휘의 개발을 제안하였다. 셋째, BIBFRAME에서 우선표제 및 우선이름 기술을 위한 목록규칙 개발의 필요성을 제안하였다. 본 연구는 BIBFRAME 2.0 어휘가 지속적으로 변경되고 개발중인 상황에서 BIBFRAME 모델의 개정과 개발에 기여할 수 있을 것이다

사용자의 요구를 반영하는 동영상 요약 알고리즘 (A Video Abstraction Algorithm Reflecting Various Users Requirement)

  • 정진국;홍승욱;낭종호;하명환;정병희;김경수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.599-609
    • /
    • 2003
  • 자동으로 동영상을 요약하는 알고리즘은 다양한 방향으로 진행되어 왔다. 하지만 이러한 알고리즘들은 한가지 저금수준 내용정보만을 이용하여 동영상을 요약하였기 때문에 요약하는 사용자의 주관을 반영할 수 없다는 단점이 있다. 즉, 동영상 요약이라는 것은 내용에 대한 전반적인 이해에 바탕을 두고 중요한 샷을 선택하는 것이라고 정의할 수 있는데 이 경우에 중요한 샷이라고 결정하는 것은 요약자의 주관에 따라 달라질 수 있기 때문에 사용자의 주관을 반영한 수 없다는 것은 큰 단점으로 대두될 수 있다. 본 논문에서는 사용자의 요구를 반영하는 동영상 요약 알고리즘을 제시한다. 알고리즘에서는 일반적으로 많이 사용하는 동영상 요약에 대한 목적함수와 이들에 대한 가중치를 이용한다. 본 논문에서는 동영상 요약을 목적함수를 극대화 시킬 수 있는 샷들의 집합으로 정의하는데 이 경우 문제점으로 제시될 수 있는 것이 계산량이 많다는 것이다. 즉, n개의 샷을 가진 동영상에 대하여 2$^n$번의 계산량이 필요하기 때문에 전체 알고리즘의 수행 시간이 많아지는 것이다. 본 논문에서는 이러한 문제점을 해결하기 위하여 빠른 시간에 근사 샷들의 집합을 구할 수 있는 Simulated Annealing 알고리즘을 이용하였다. 실험 결과에 의하면 본 논문의 알고리즘은 요약자의 주관을 반영시킬 수 있고, Simulated Annealing 을 이용하여 빠른 시간에 원하는 요약을 할 수 있음을 확인하였다. 본 논문의 알고리즘은 동영상을 대상으로 하는 디지털 비디오 라이브러리와 같은 응용 분야에 이용할 수 있을 것이다.

실시간 멀티미디어 스트리밍 서비스를 위한 Time-triggered Message-triggered Object 기반의 프레임워크 및 동기화 메커니즘 (A Framework and Synchronization Mechanism for Real-time Multimedia Streaming Services based on the Time-triggered Message-triggered Object)

  • 조은환;김문회
    • 정보처리학회논문지C
    • /
    • 제13C권6호
    • /
    • pp.669-676
    • /
    • 2006
  • 본 논문에서는 실시간 객체모델인 Time-triggered Message-triggered Object (TMO)를 사용하여 분산 실시간 멀티미디어 스트리밍 서비스를 효과적으로 개발 할 수 있는 새로운 소프트웨어 프레임워크와 스트림 동기화 메커니즘을 소개한다. 본 프레임워크의 목적은 개발자로 하여금 복잡한 실시간 멀티미디어 스트리밍 서비스를 쉽게 설계하고 적시 스트리밍 기능들을 제공하는데 있다. 이를 위해서 본 프레임워크는 Multimedia Streaming TMO, MMStream TMO Support Library 그리고 TMO Support Middleware로 구성된다. 특히, MMStream TMO와 동기화 기법이 제공하는 time-trigger번 특성은 QoS 보장이 어려운 통신 채널과 시스템 환경에서 불규칙한 미디어 데이터 전달 및 처리하는 역할을 실시간으로 수행한다. 결론적으로 본 논문에서 제시한 프레임워크의 적시 서비스 능력은 향후 실시간 멀티미디어 스트리밍 서비스 개발에 기여할 것으로 기대된다.

히스토그램 기반의 강인한 계층적 GLOCAL 해쉬 생성 방법 (Robust Hierarchical GLOCAL Hash Generation based on Image Histogram)

  • 최용수;김형중;이달호
    • 전자공학회논문지CI
    • /
    • 제48권1호
    • /
    • pp.133-140
    • /
    • 2011
  • 최근 들어, 웹 응용의 하나로 이미지를 통합 관리하는 이미지 거래소(Image Stock), 이미지 도서관(Image Library)과 같은 응용들이 많이 만들어 지고 있다. 이미지의 등록, 관리, 검색에는 주로 이미지 해쉬라는 기술이 구분자(Identifier)로서 쓰이며 해쉬의 분별력을 높이기 위한 연구들이 많이 진행되어지고 있다. 본 논문에서는 계층적 히스토그램을 이용한 GLOCAL(Global to Local) 이미지 해쉬 생성 방법을 제안하였다. 많은 연구들이 이미지 처리 및 기하학적 공격에 강한 히스토그램 기반의 이미지 해쉬 기법들을 제안하였으며 제안된 논문에서는 GLOCAL 해쉬 생성과 가중치(Weighting Factor)를 적용하여 해쉬의 안정성을 높이는데 기여하였다. GLOCAL 해쉬 생성 방법에 의해 기존의 알고리즘들은 좀더 풍부한 길이의 이미지 해쉬를 생성하였다. 즉, 이미지 해쉬의 근본 목적인 Identification과 Discrimination 이라는 두 가지 목적을 잘 달성하였으며 그 결과는 통계학적 가설 검정 (Statistical Hypothesis Testing)을 통해 기존의 알고리즘과 비교하였으며 대부분의 공격종류에 대해 제안된 알고리즘이 향상된 성능을 보여줌을 확인하였다.

DDC 지역구분표의 변천과정

  • 이창수
    • 한국도서관정보학회지
    • /
    • 제18권
    • /
    • pp.193-216
    • /
    • 1991
  • The purpose of this study is to analyze the area table of twenty editions of the DDC in order to identify what major changes have been made chronologically. The summaries about which were discussed according to the edition order about the change processes of the most extensive area table of the DDC auxiliary table are as follows. 1. It is from the 17th edition that area table appeared as a special auxiliary table in DDC for the first time and the method of classifying areas like from 930 to 999 which is regional history in history class was taken before the introduction of independent area table. 2. The entry numbers in which the area table was applied increased continuously until the 18th edition but the applied entry number was rather decreased in the 20th edition especially the number was mainly decreased in history class, this is the result of the fact that the entry was classified by area table without enumerating each regional history in history class except for the basic area since the 17th edition but recently at least the area of over national unit according to the necessity of enumerating the entry in regional history within history class. 3. The relocation or revision of area table was made according to the literary warrant of the relevant area by period political and administrative conditions and the request of related organization or classifiers of the area rather than by the topographical features therefore the revision was made chiefly about the highly interested Europe Northern America especially the United States. 4. The entry numbers which were expanded according to area indicate that gradual improvement for the international feature as the revision of edition is repeated is made but because of the expansion of Northern America, especially the United States, regional disproportion is represented by the occupation of 56% in the entire entry numbers of the United States in case of the 20th edition. Lastly, the reasonable reform plans of area table will have to be groped on the basis of the results of analysis above and the consideration about the problems in the development of area table of DDC and the other main classification systems.

  • PDF