• 제목/요약/키워드: 데이타 모델

검색결과 730건 처리시간 0.023초

점진적 EM 알고리즘에 의한 잠재토픽모델의 학습 속도 향상 (Accelerated Loarning of Latent Topic Models by Incremental EM Algorithm)

  • 장정호;이종우;엄재홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1045-1055
    • /
    • 2007
  • 잠재토픽모델(latent topic model)은 데이타에 내재된 특징적 패턴이나 데이타 정의 자질들 간의 상호 관련성을 확률적으로 모델링하고 자동 추출하는 모델로서 최근 텍스트 문서로부터의 의미 자질 자동 추출, 이미지를 비롯한 멀티미디어 데이타 분석, 생물정보학 분야 등에서 많이 응용되고 있다. 이러한 잠재토픽모델의 대규모 데이타에 대한 적용 시 그 효과 증대를 위한 중요한 이슈 중의 하나는 모델의 효율적 학습에 관한 것이다. 본 논문에서는 대표적 잠재토픽모델 중의 하나인 PLSA (probabilistic latent semantic analysis) 기법을 대상으로 점진적 EM 알고리즘을 활용한, 기본 EM 알고리즘 기반의 기존 학습에 대한 학습속도 증진 기법을 제안한다. 점진적 EM 알고리즘은 토픽 추론 시 전체 데이타에 대한 일괄적 E-step 대신에 일부 데이타에 대한 일련의 부분적 E-step을 수행하는 특징이 있으며 이전 데이터 일부에 대한 학습 결과를 바로 다음 데이타 학습에 반영함으로써 모델 학습의 가속화를 기대할 수 있다. 또한 이론적인 측면에서 지역해로의 수렴성이 보장되고 기존 알고리즘의 큰 수정 없이 구현이 용이하다는 장점이 있다. 논문에서는 해당 알고리즘의 기본적인 응용과 더불어 실제 적용과정 상에서의 가능한 데이터 분할법들을 제시하고 모델 학습 속도 개선 면에서의 성능을 실험적으로 비교 분석한다. 실세계 뉴스 문서 데이타에 대한 실험을 통해, 제안하는 기법이 기존 PLSA 학습 기법에 비해 유의미한 수준에서 학습 속도 증진을 달성할 수 있음을 보이며 추가적으로 모델의 병렬 학습 기법과의 조합을 통한 실험 결과를 간략히 제시한다.

다계층 메타데이타 기반 이미지 내용검색 시스템 설계 (Design of Content-based Image Retrival System using Multilevel Metadata)

  • 신용수;홍성용;나연묵
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.142-144
    • /
    • 2002
  • 대부분의 내용기반 이미지 검색 시스템은 이미지의 특징 벡터인 색상, 모양, 그리고 질감에 의해서 유사한 이미지를 검색하는 기법을 제공하고 있다. 최근 이러한 내용기반 이미지 검색 기술은 의료 영상 이미지와 같은 다양한 분야에 적용되고 있으며, 이에 따라서 의료 이미지를 분석하여 저장, 검색하기 위한 데이터베이스 시스템이 증가하고 있다. 그러나, 대량의 이미지로부터 원하는 이미지를 검색하기 위해서는 이미지의 메타데이타를 효율적으로 표현해야 하며, 의미성과 이미지의 특징 데이터를 통합적으로 저장 관리 할 수 있는 이미지 데이터베이스를 설계하고 구축해야만 한다. 본 논문에서는 기존의 내용기반 이미지 검색 기법을 살펴보고. 이미지를 내용기반으로 분류하고 저장할 수 있는 데이터베이스 시스템을 설계하여 효율적인 의미기반 검색을 지원말 수 있는 모델을 제시한다. 다계층 메타데이타 레이어 구조로 이미지에 대한 개념 지식 모델을 표현하고, 이미지내의 객체를 메타데이타로 표현하여 분류할 수 있는 모델을 제안한다. 또한, 이미지 내용검색을 지원하기 위한 시스템 구조를 설계하고, 메타데이타가 저장되기 위한 관계형 모델을 스타 스키마의 형태로 제시한다. 제안된 방법은 의미적인 이미지 내용 검색 방법의 지원에 활용될 수 있다.

  • PDF

DTD를 이용한 XML 데이타에 대한 질의 최적화 기법 (The Query Optimization Techniques for XML Data using DTDs)

  • 정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.723-731
    • /
    • 2001
  • XML이 웹상에서 정보 교환의 표준으로 채택되면서 XML을 데이타베이스의 데이타로 보고 정보를 추출하는 분야가 주목받고 있다. XML은 그래프 기반의 비정형 데이타(semistructured data) 모델 과 매우 비슷하기 때문에 XML 데이타를 그래프 기반의 비정형 데이타 모델로 매핑한 후, 이에 대하여 질의를 처리할 수 있다. 본 논문에서는 XML 데이타에 대하여 스키마 정보를 가지는 DTB(Document Type Definition)를 이용한 질의 최적화 기법을 제안한다. 제안하는 기법은 인덱싱 효과를 내면서도 기존 방법에 비하여 부가의 메모리를 적게 필요로하고, 입력 데이타의 구조를 그대로 유지하기 때문에 다양한 형태의 질의를 효율적으로 처리할 수 있다. 간단한 예제 데이타베이스에 대하여 제안하는 기법의 실험 결 과를 보였다.

  • PDF

분산 USN 디렉토리 서비스를 위한 메타데이타 검색 모델 (Metadata Search Model for the Distributed USN Directory Service)

  • 강경구;강지훈;김보라;박지혜;안성제;유현석;한재일
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2008년도 춘계학술대회
    • /
    • pp.425-430
    • /
    • 2008
  • USN의 발전으로 인해 인간 중심의 정보화 사회에서 사물 간에도 정보들을 유기적으로 결합하여 활용하는 유비쿼터스 컴퓨팅 사회로 급격히 변모하고 있다. 이러한 유비쿼터스 컴퓨팅 인프라를 성공적으로 구축하기 위해서는 센서노드에 대한 기술의 발전과 함께 USN 미들웨어에 대한 연구가 필요하다. USN의 핵심기술 중 하나인 USN 미들웨어는 시스템 소프트웨어로써 USN 응용에서 USN 계층의 자원과 데이타를 쉽게 활용할 수 있도록 다양한 기본 서비스를 제공한다. USN 디렉토리 서비스는 이와 같은 USN 미들웨어의 핵심 컴포넌트로서 USN 응용이 필요로 하는 USN 자원에 대한 정보를 검색하는 기능을 수행한다. 분산된 USN 자원에 대한 메타데이타의 효율적인 검색은 분산된 환경에서의 USN 디렉토리 서비스의 핵심요소이며 최근 이에 대한 연구가 보이고 있다. 분산 USN 디렉토리 서비스에서의 메타데이타 검색 모델은 크게 중앙 집중식(Centralized) 모델, 계층식(Hierarchical) 모델, P2P(Peer-to-Peer) 모델이 있다. 그러나 현재 메타데이타 검색 모델에 대한 연구는 원하는 메타데이타를 찾기 위한 서버 검색 회수만을 대상으로 하고 있으며 실제 단말 간 응답시간에 영향을 미치는 지연시간은 고려하지 않고 있다. 본 논문은 실제 단말 간 응답시간에 영향을 미치는 검색회수와 지연시간을 고려한 하이브리드 모델을 제안하고, 하이브리드 모델이 계층 모델에서 검색 시 불필요한 검색횟수의 증가와 P2P 모델의 광범위한 지역에서 응답시간이 증가하게 되는 단점을 개선할 수 있음을 보인다.

  • PDF

통합 회계 데이타모형과 그 응용 -객체 중심 접근법을 중심으로- (An Integrated Accounting Data Model and Its Application - Based on Object-oriented Approaches)

  • 남천현;한경석;곽수근
    • 정보기술과데이타베이스저널
    • /
    • 제2권2호
    • /
    • pp.35-54
    • /
    • 1995
  • 회계시스템에 데이타베이스시스템을 도입하는 연구의 주류는 데이타베이스 분야에서 개발된 데이타모형(data mood)을 이용한 회계 데이타모형의 개발에 있었다. 본 연구의 목적은 데이타베이스 분야에서 최근 개발되어 널리 보급되고 있는 객체지향 데이타모형을 적용한 회계 데이타모형(Object-oriented Accounting Data Model; OADM)을 개발하고 응용하는 데 있다. OADM은 회계시스템의 정보제공능력 제고 및 시스템통합의 과제를 해결하는 데 유용한 도구가 될 것이다. OADM은 데이타모형 관점에서 규명된 전통적 회계시스템의 본질을 모형화의 배경으로, REA 모델을 모형화의 기초로, 그리고 객체지향 데이타모형을 모형화의 도구로하여 개발된다. 회계 데이타모형화에 있어서 복합적인 회계데이타의 표현, 복합적이고 까다로운 회계처리절차의 데이타화, 타부문과의 연계, 회계시스템의 변경 및 확장 등의 제 문제점은 기존의 데이타모형으로는 해결하기가 어려우나 객체지향 데이타모형을 회계 데이타모형화에 도입함으로써 이러한 문제점을 해결할 수 있다. 본 연구와 관련한 후행 연구로는 활동중심 원가계산의 모형화, 예산시스템의 모형화 그리고 사무정보시스템의 모형화 등을 들 수 있다. OADM은 이러한 모형화의 기초로 이용될 수 있다. 모형의 실증분석도 가치 있는 미래연구로 본다.

  • PDF

확장 칼만 필터와 최대공산법을 이용한 미사일 공력계수 (Missile aerodynamic structure and parameter identification using the extended Kalman Filter and maximum likelihood method)

  • 성태경;이장규;박양배
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1986년도 한국자동제어학술회의논문집; 한국과학기술대학, 충남; 17-18 Oct. 1986
    • /
    • pp.262-265
    • /
    • 1986
  • 미사일의 동특성은 공력계수(aerodynamic coefficients)들의 구조 및 그 계수값에 의해 결정된다. 현재까지 공력계수는 풍동시험(wind tunnel test)에 의한 모형법으로 구하는 것이 보편적이었으나 모형과 실제 시스템의 차이에 의해 발생하는 오차, 풍동시험의 오차, 모형의 스케일 팩터(scale factor)오차, 실제 대기조건의 특성에 의한 오차 등에 의해, 시제품을 이용한 실제 비행시험 결과가 풍동시험 모델을 이용한 컴퓨터 시뮬레이션(computer simulation)의 가상 비행 데이타와 차이를 나타내게 된다. 이러한 차이를 감소시키기 위하여 필터 이론을 적용하기 위해서는 수학적 계수 모델이 필요하게 된다. 본 연구에서는 풍동시험모델로부터 3가지의 수학적 모델을 가정하고 이를 이용하여 확장칼만필터(extended Kalman Filter: EKF)와 최대공산법(maximum likelihood method :ML)을 각각 적용시켰을때 추정된 계수치에 의한 가상비행데이타와, 풍동시험모델에 의한 가상비행데이타를 비교하여, 수학적 계수 모델 설정에 따른 각 알고리즘의 추정결과를 알아보고, 이에의해 계수 모델 설정의 방법 및 기준, 그리고 계수구조 설정에 따른 EKF와 ML의 성질을 조사하였다.

  • PDF

술어를 이용한 내용 의존적 권한부여 기법 (Content-Dependent Authorization Mechanism using Predicates)

  • 홍성림;박창원;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권1호
    • /
    • pp.1-13
    • /
    • 2003
  • 본 논문은 객체지향 데이타베이스 시스템에서의 내용 의존적 권한부여 기법을 제시한다. 현재까지 객체지향 데이타베이스를 위한 많은 권한부여 모델들이 제안되었으나 대부분 데이타베이스의 내용에 기반한 권한부여를 지원하지 못하였다. 본 논문은 객체지향 데이타베이스를 위한 기존의 내용 독립적 권한부여 모델을 클래스의 애트리뷰트의 값에 대한 술어를 이용하여 확장한 내용 의존적 권한부여 모델을 제시하였다. 제시된 모델은 객체의 값에 대한 명시된 조건을 만족하는 객체들을 집단화하여 그러한 객체들에 대해 하나의 권한을 부여할 수 있게 한다. 또한 부정 권한을 지원하며 긍정 권한과 부정 권한 사이의 충돌을 해결하기 위하여 강성 권한과 약성 권한의 개념을 지원한다. 또한 권한에 술어를 결합시킴으로써 생기는 여러 가지 문제점들을 지적하고 이를 해결한다. 특히 내용 독립적 권한부여 모델에서의 권한 연산들이 본 논문에서 제시하는 모델에서 그대로 적용될 수 없음을 보이고 연산들의 의미를 재정의 하였다.

CORBA 객체의 지속성을 위한 관계 데이타베이스용 객체 데이타베이스 어댑터의 구현 (An Implementation of Object Database Adapter on Relational Database Systems for the Persistence of CORBA Objects)

  • 박우창
    • 정보기술과데이타베이스저널
    • /
    • 제3권2호
    • /
    • pp.39-51
    • /
    • 1996
  • CORBA는 분산 시스템의 객체를 관리하기 위한 모형으로 여러 응용에서 장점을 보인다. 그러나 CORBA 객체의 정의에는 지속성을 가정하고 있지 않다. 본 논문에서는 CORBA의 BOA(Basic Object Adapter)에 객체 데이타베이스 어댑터(Object Database Adapter, ODA)를 구현하여 객체를 관계 데이타베이스에 저장함으로써 객체의 지속성을 유지하도록 하였다. 객체의 관리는 객체지향 데이타베이스 시스템이 자연스러우나 본 논문에서는 이미 구축된 관계 데이타베이스 시스템과 응용을 공유할 수 있도록 관계 데이타베이스용을 구현하였다. ORB는 Orbix를 사용하였고, 튜플의 객체로의 대응은 Tie 법과 객체포장기 개념을 사용하였다. CORBA 응용의 관점에서 데이타베이스 시스템을 이용한 객체의 지속성 유지는 지속성 유지와 더불어 많은 수의 객체를 효율적으로 관리할 수 있고, 병행성, 회복기법 등을 이용할 수 있는 여러 장점이 있다. 또 데이타베이스 시스템 측면에서 CORBA와 데이타베이스 어댑터의 이용은 사용자에게 데이타베이스 스키마에 관한 사항을 숨김으로써 데이타베이스 접근을 쉽게 하고, 분산된 데이타베이스 환경에서는 데이타베이스 모델과 언어의 이질성을 해소할 수 있는 장점이 있다.

  • PDF

분산 FMS의 통합제어를 위한 객체지향 데이타베이스 (Object-Oriented Database for Integrated Control of Distributed FMS)

  • 박장호;차상균
    • 한국통신학회논문지
    • /
    • 제19권10호
    • /
    • pp.1935-1944
    • /
    • 1994
  • FMS(Flexible Manufacturing System)는 로봇, 수치제어기기 등의 프로그램이 가능한 생산설비 하드웨어로 구성된 분산시스템이다. FMS의 효과적인 운용을 위해서는 생산설비 하드웨어를 통합 제어하기 위한 소프트웨어의 존재가 필수적이다. 그런데 FMS의 복잡성과 다양한 변화가능성은 통합제어 소프트웨어의 구축 및 유지, 보수를 어렵게 한다. 이를 해결하기 위하여 본 논문에서는 객체지향 FMS 통합제어 모델을 제안한다. 제안된 모델에서는 FMS에 실재하는 셀이 가상 셀 객체로 모델되어, 통합제어를 위하여 필요한 데이터와 연산들이 캡슐화되어 객체지향 데이타베이스에 관리된다. 또한 이 밖의 FMS운용을 위해 필수적인 데이타와 이들간의 관계성도 데이타베이스에 관리된다. 본 논문은 제안된 모델을 기반으로 구현한 통합제어 소프트웨어시스템인 FREE(Fms Run Time Executive Environment)를 바탕으로 통합제어 데이타베이스에 대하여 기술한다.

  • PDF

최적 클러스터 분석 모델을 이용한 분류시스템의 데이터베이스 구축 (The database construction of a classification system using an optimal cluster analysis model)

  • 이현숙
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.1045-1050
    • /
    • 1998
  • 데이타의 분류기법은 공장자동화나 로보틱스 분야에서 사용되는 지능시스템의 중요한 기능이다. 일반적으로 이러한 분류시스템을 설계하고자 할때, 준비된 데이타는 레이블링 되어야 하고, 분류하고자하는 클래스의 수도 설정되어야한다. 본 연구에서는 이러한 사전 정보없이 분류 시스템을 설계하고자 최적 클러스터 분석 모델, OFCAM을 제안한다. 이때 사용되는 최적 클러스터 분석 모델은 데이타의 구조에 대한 사전정보 없이, 주어진 데이타의 최적 클러스터의 수와 클러스터 중심점 및 각 데이타에 대한 소속정보를 구해준다. 이를 위하여 OFCAM에서는 목적합수를 가지는 비교사 학습신경망과 클러스터 타당성 전략을 결합하고 있다. OFCAM의 결과를 바탕으로 분류시스템의 데이터베이스, PCSDB가 구축되며 이는 결정 모듈에서 쉽게 활용될 수 있음을 보인다. 이와같은 방법은 하나의 데이타베이스 안에서 필요한 테이블만을 첨가하므로 독립적으로 여러 응용의 분류문제를 다룰 수 있다.

  • PDF