• 제목/요약/키워드: database generalization

검색결과 57건 처리시간 0.022초

Is-A Node Type Modeling Methodology to Improve Pattern Query Performance in Graph Database

  • Park, Uchang
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.123-131
    • /
    • 2020
  • 그래프 데이터베이스에서 패턴질의는 관계 데이터베이스 SQL과 비교하여 질의의 쉬운 표현, 높은 질의 처리 성능을 기대할 수 있는 장점이 있다. 그러나 그래프 데이터베이스는 관계 데이터베이스와 달리 논리적 데이터 모델을 구축하는 방법론이 정의되어 있지 않아 모델링에 따라 패턴 질의의 장점을 활용하지 못할 수 있다. 본 연구는 그래프 모델링 과정 중 나타나는 is-a 노드 모델링 방법에서 일반화 모델로 설계할 경우와 특수화 모델로 설계할 경우 그래프 패턴질의의 성능 차이가 있음을 실험하였다. 실험 결과 is-a 노드 설계를 특수화 모델로 설계할 경우 더 우수한 성능을 얻을 수 있음을 보였다. 또 추가로 패턴질의를 작성할 때 변수를 노드나 간선에 바인딩시키는 경우 그렇지 않는 경우보다 성능이 우수할 수 있음을 보였다. 실험 결과들은 그래프 데이터베이스에서 패턴질의에 대한 is-a 노드 모델링 방법 및 그래프 질의 작성 방법으로 제시될 수 있다.

Object Classification Method Using Dynamic Random Forests and Genetic Optimization

  • Kim, Jae Hyup;Kim, Hun Ki;Jang, Kyung Hyun;Lee, Jong Min;Moon, Young Shik
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.79-89
    • /
    • 2016
  • In this paper, we proposed the object classification method using genetic and dynamic random forest consisting of optimal combination of unit tree. The random forest can ensure good generalization performance in combination of large amount of trees by assigning the randomization to the training samples and feature selection, etc. allocated to the decision tree as an ensemble classification model which combines with the unit decision tree based on the bagging. However, the random forest is composed of unit trees randomly, so it can show the excellent classification performance only when the sufficient amounts of trees are combined. There is no quantitative measurement method for the number of trees, and there is no choice but to repeat random tree structure continuously. The proposed algorithm is composed of random forest with a combination of optimal tree while maintaining the generalization performance of random forest. To achieve this, the problem of improving the classification performance was assigned to the optimization problem which found the optimal tree combination. For this end, the genetic algorithm methodology was applied. As a result of experiment, we had found out that the proposed algorithm could improve about 3~5% of classification performance in specific cases like common database and self infrared database compare with the existing random forest. In addition, we had shown that the optimal tree combination was decided at 55~60% level from the maximum trees.

객체지향 소프트웨어 재사용을 위한 클래스 라이브러리 설계에 관한 연구 (The Study of Class Library Design for Reusable Object-Oriented Software)

  • 이해원;김진석;김혜규;하수철
    • 한국정보처리학회논문지
    • /
    • 제6권9호
    • /
    • pp.2350-2364
    • /
    • 1999
  • 본 논문은 객체지향 C++ 클래스 컴포넌트를 분류하여 재사용자에게 필요한 컴포넌트를 제공하기 위한 저장소의 클래스 라이브러리 설계방법을 제안한 것이다. 클래스 라이브러리를 설계하기 위해서 컴포넌트 구성 모델을 정의하였고, Enumerative 분류 방법을 이용한 멀티미디어 영역을 분류하였으며, 문서 클러스터링 방법을 확장하여 유사도에 의한 C++ 클래스를 유사한 그룹으로 분류하는 클러스터 생성 기준을 제안하고 있다. 이 유사 그룹인 클러스터는 클래스 멤버 데이터와 멤버함수 그리고 클래스 유사도를 기반으로 분류되며, 분류된 컴포넌트들은 유사도 관계의 계층구조로 구성된다. 마지막으로 객체지향 개념인 Generalization/Specialization의 C++ 상속관계를 계층구조로 표현할 수 있는 클래스 라이브러리를 설계하였다.

  • PDF

R를 활용한 인구변동요인 산정과 인구추계 시스템 개발 (Development of system of Population projection and driving variation on demography for Korea using R)

  • 오진호
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.421-437
    • /
    • 2020
  • 본 논문은 최근에 널리 사용되고 있는 R 프로그램으로 출산율, 사망률, 국제이동률을 예측하고 이들 결과를 Leslie 행렬에 대입해 인구추계 산출하는 방법을 소개한다. 특히 Kaneko (2003)가 제안한 출산율의 일반화로그감마모형, Li 등 (2013)의 사망률 LC-ER 모형, Ramsay와 Silverman (2005)가 제안한 국제이동률의 함수적데이터모형을 시현할 수 있도록 하였다. 최근 R로 구현된 대표적인 인구추계 패키지로 demography, bayesPop가 소개되고 있으나, 이는 Human Mortality Database (HMD), Human Fertility Database (HFD)에 업로드된 자료에 한에서만 분석이 가능하고 기타 데이터를 적용하기 위해서는 자료 변경과 수정이 요구된다. 특히 우리나라의 경우 HMD에 단기 간의 자료로만 제공되어 있어 이 패키기를 적용하기에는 한계점이 있다. 이에 본 논문은 이런 실정과 한국의 저출산, 고령화, 내국인, 외국인 국제이동률 상이패턴을 반영할 수 있는 R 프로그램을 소개하고, 2117년까지의 인구추계를 도출하였다.

$R^*$-Tree와 Grid를 이용한 이동 객체의 위치 일반화 기법 (Location Generalization Method of Moving Object using $R^*$-Tree and Grid)

  • 고현;김광종;이연식
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권2호
    • /
    • pp.231-242
    • /
    • 2007
  • 패턴 탐사에 관한 기존의 연구들[1,2,3,4,5,6,11,12,13]은 이동 객체의 위치 이력 데이터 집합에 대한 위치 일반화 접근법을 사용하지 않거나 사용해도 특정 공간상의 이동 패턴들 중 단순히 시공간 제약이 없는 빈발 패턴만을 추출하므로, 특정 지점들 간의 최적 이동 경로나 스케줄링 경로와 같은 시공간 제약을 갖는 빈발 패턴 탐사에는 적용하기 어렵다. 또한 패턴 탐사의 수행에 있어 기존의 기법들은 데이터베이스에 대한 반복 접근을 줄이기 위해 메모리 상에 패턴 트리를 생성하여 사용하므로 보다 많은 메모리 공간을 소요하게 된다. 따라서 이러한 기존 탐사 기법들의 문제점들을 해결하기 위한 보다 효율적인 패턴 탐사 기법이 필요한 실정이다. 효율적 탐사 기법을 개발하기 위하여 본 논문에서는 방대한 이동 객체의 이력 데이터 집합에 대한 탐사 수행 시간 및 탐사에 필요한 메모리 공간을 최소화하기 위해서 상세 수준의 데이터들을 의미있는 공간영역 정보로 변환하는 새로운 위치 일반화 방법을 제안한다. 제안된 방법은 패턴 탐사의 전처리 과정에서 $R^*$-Tree와 영역 Grid 해쉬 테이블(AGHT:Area Grid Hash Table)을 기반으로 이동 객체의 위치 속성들을 2차원 공간영역으로 일반화하여 이동 시퀀스를 생성함으로써 효율적인 이동 객체의 공간 이동 패턴 마이닝을 유도할 수 있다.

  • PDF

지식 발견을 위한 라프셋 중심의 통합 방법 연구 (Integrated Method Based on Rough Sets for Knowledge Discovery)

  • 정홍;정환묵
    • 한국지능시스템학회논문지
    • /
    • 제8권6호
    • /
    • pp.27-36
    • /
    • 1998
  • 본 논문은 대규모 데이터베이스에서 유용한 지식을 발견하기 위해 라프셋을 중심으로 한 통합적 방법을 제시한다. 본 방업에서는 데이터베이스에 있는 실제 데이터에서 일반화된 데이터를 추출하기 위해 속성중심의 개념계층 상승기법을 사용하고, 획득 정보량을 측정하기 위해 결정 트리에 의한 귀납법을 사용한다. 그리고 불필요한 속성 및 속성값을 제거하기 위해 라프셋 이론의 지식감축 방법을 적용한다. 통합 알고리즘은 먼저, 개념의 일반화에 의해 데이터베이스의 크기를 줄이고, 다음으로 결정속성에 영향을 적게 미치는 조건속성을 제거함으로써 속성의 수를 줄인다. 마지막으로 속성간의 종속관계를 분석함으로써 불필요한 속성값을 제거하여 간략화된 결정규칙을 유도한다.

  • PDF

Prediction of creep in concrete using genetic programming hybridized with ANN

  • Hodhod, Osama A.;Said, Tamer E.;Ataya, Abdulaziz M.
    • Computers and Concrete
    • /
    • 제21권5호
    • /
    • pp.513-523
    • /
    • 2018
  • Time dependent strain due to creep is a significant factor in structural design. Multi-gene genetic programming (MGGP) and artificial neural network (ANN) are used to develop two models for prediction of creep compliance in concrete. The first model was developed by MGGP technique and the second model by hybridized MGGP-ANN. In the MGGP-ANN, the ANN is working in parallel with MGGP to predict errors in MGGP model. A total of 187 experimental data sets that contain 4242 data points are filtered from the NU-ITI database. These data are used in developing the MGGP and MGGP-ANN models. These models contain six input variables which are: average compressive strength at 28 days, relative humidity, volume to surface ratio, cement type, age at start of loading and age at the creep measurement. Practical equation based on MGGP was developed. A parametric study carried out with a group of hypothetical data generated among the range of data used to check the generalization ability of MGGP and MGGP-ANN models. To confirm validity of MGGP and MGGP-ANN models; two creep prediction code models (ACI209 and CEB), two empirical models (B3 and GL 2000) are used to compare their results with NU-ITI database.

알레르기 비염의 침 치료에 대한 경제성 평가 연구 경향 분석 (A Review of Economic Evaluations in Acupuncture for Allergic Rhinitis)

  • 이동효
    • 한방안이비인후피부과학회지
    • /
    • 제29권2호
    • /
    • pp.1-11
    • /
    • 2016
  • Objective : The purpose of this study is to analyze research trends on the cost-effectiveness in acupuncture for patients with allergic rhinitis. Methods : The literature and research in allergic rhinitis was searched in electronic databases, such as National Health Service Economic Evaluation Database(NHS EED) and the Cochrane Database of Systematic Reviews(CDSR). The general characteristics and the results of each economic analysis such as incremental cost-effectiveness ratios(ICERs) were extracted. Results : In total, thirty seven studies were searched, and two studies were analyzed. They were cost-utility analysis(CUA)s that measured quality-adjusted life years(QALYs). One study showed that the ICER was €22,798 per QALY and was robust in sensitivity analysis. Another showed that the ICER was between €31,241 and €118,889 from society's perspective and between €20,807 and €74,585 from a third-party payer's perspective. Conclusions : Any generalization of these results needs to be made with caution given the specific effects of acupuncture and the difference of cost data in the various countries. Further studies are needed on this topic in order to demonstrate the cost-effectiveness clearly.

관계형 데이터베이스 응용시스템을 위한 통합 설계방법론 개발 -객체지향 분석.설계 방법론을 중심으로- (Development of Integrated Design Methodology for Relational Database Application -Focusing on Object-Oriented Analysis and Design Methodology-)

  • 주경수;조도형
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권11호
    • /
    • pp.25-34
    • /
    • 2011
  • 본 논문에서는 UML(Unified Modeling Language)을 토대로 유스케이스(use case) 중심의 객체지향 분석 설계 방법론을 기반으로 한, 관계형 데이터베이스 통합 설계방법론에 대하여 다룬다. 본 통합 설계방법론에서 사용하는 개념모델은 비즈니스 프로화일(business profile)에 기반을 두고 있으며, 6단계로 구성되어 있다. 첫 번째 단계에서는 비즈니스 유스케이스(business use case)가 식별되어 마크로액티비티 다이어그램(macroactivity diagram)으로 표현되고, 두 번째 단계에서 마크로액티비티 다이어그램은 비즈니스 객체(business object)와 비즈니스 객체흐름(business object flow) 그리고 비즈니스 사용자책임(business worker's responsibilities)을 이용하여 상세 비즈니스 활동다이어그램(detailed business activity diagram)으로 변환된다. 세 번째 단계에서는 상세 비즈니스 활동다이어그램을 기반으로 시스템 전체의 정적 구조를 설명하는 비즈니스 클래스다이어그램(business class diagram)으로 변환된다. 네 번째 단계에서 비즈니스 클래스다이어그램은 대응하는 관계형 데이터베이스 초기 개념모델을 대표하는 클래스다이어그램으로 변환된다. 다섯 번째 단계에서 클래스다이어그램에 일반화와 특수화, 역할과 활동, 클래스 추가 그리고 중복 연관에 따른 추가적인 변환이 이루어지고, 마지막으로 관계형 데이터베이스 스키마로 변환이 이루어지게 된다. 본 논문에서 제시하는 방법론을 적용함으로써, 객체지향 분석 설계 방법론과 관계형 데이터베이스 설계방법론 사이에 유기적 연결이 이루어지게 되어, 객체지향 분석 설계 방법론 관계형 데이터베이스설계 방법론을 통합적으로 다룰 수 있게 된다. 이에따라 관계형 데이터베이스 기반의소프트웨어 시스템에 대한 객체지향 방식의 일관된 그리고 통합된 구축방안이 제공된다. 사례 연구로 제안한 통합 설계 방법론을 비자발급시스템에 대하여 적용한다.

8비트 데이타 정밀도를 가지는 다층퍼셉트론의 역전파 학습 알고리즘 (Learning of multi-layer perceptrons with 8-bit data precision)

  • 오상훈;송윤선
    • 전자공학회논문지B
    • /
    • 제33B권4호
    • /
    • pp.209-216
    • /
    • 1996
  • In this paper, we propose a learning method of multi-layer perceptrons (MLPs) with 8-bit data precision. The suggested method uses the cross-entropy cost function to remove the slope term of error signal in output layer. To decrease the possibility of overflows, we use 16-bit weighted sum results into the 8-bit data with appropriate range. In the forwared propagation, the range for bit-conversion is determined using the saturation property of sigmoid function. In the backwared propagation, the range for bit-conversion is derived using the probability density function of back-propagated signal. In a simulation study to classify hadwritten digits in the CEDAR database, our method shows similar generalization performance to the error back-propagation learning with 16-bit precision.

  • PDF