• 제목/요약/키워드: Automatic model selection

검색결과 103건 처리시간 0.023초

Machine Learning Based Automatic Categorization Model for Text Lines in Invoice Documents

  • Shin, Hyun-Kyung
    • 한국멀티미디어학회논문지
    • /
    • 제13권12호
    • /
    • pp.1786-1797
    • /
    • 2010
  • Automatic understanding of contents in document image is a very hard problem due to involvement with mathematically challenging problems originated mainly from the over-determined system induced by document segmentation process. In both academic and industrial areas, there have been incessant and various efforts to improve core parts of content retrieval technologies by the means of separating out segmentation related issues using semi-structured document, e.g., invoice,. In this paper we proposed classification models for text lines on invoice document in which text lines were clustered into the five categories in accordance with their contents: purchase order header, invoice header, summary header, surcharge header, purchase items. Our investigation was concentrated on the performance of machine learning based models in aspect of linear-discriminant-analysis (LDA) and non-LDA (logic based). In the group of LDA, na$\"{\i}$ve baysian, k-nearest neighbor, and SVM were used, in the group of non LDA, decision tree, random forest, and boost were used. We described the details of feature vector construction and the selection processes of the model and the parameter including training and validation. We also presented the experimental results of comparison on training/classification error levels for the models employed.

품질 정보 수집을 위한 프록시 클라이언트 코드의 자동 생성 방안에 관한 연구 (A Study on Automatic Generation Method of Proxy Client Code to Quality Information Collection)

  • 서영준;한정수;송영재
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.121-125
    • /
    • 2007
  • 본 논문에서는 모니터링 에이전트를 통한 웹 서비스 선정 과정의 자동화를 위해 프록시 클라이언트 코드를 자동 생성하는 방안을 제안한다. 본 논문의 기법은 템플릿 룰에 따라 WSDL 문서의 특정 엘리먼트의 속성 값을 가져옴으로써 서비스 사용자에게 프록시 클라이언트의 소스 코드를 제공할 수 있게 해 준다. 즉 XSLT 스크립트 파일은 클라이언트 코드 생성시 필요한 동적 호출 인터페이스 모델의 코드 골격을 제공한다. 이러한 코드 자동생성 기법은 이동 에이전트 기술과 더불어 선정 아키텍처에서의 기아 상태를 해결하기 위해 필요하다. 선정 서비스를 제외하더라도 검색 결과상의 모든 서비스들에 대한 요청 HTTP 메시지를 발생시키기 위해서는 코드 자동 생성 기법이 필요하다. 생성된 프록시 클라이언트 프로그램 코드는 검색된 서비스들에 대한 더미 메시지를 발생시킨다. 본 논문에서 제시한 클라이언트 코드 생성 방안은 자동 생성 프로그래밍 영역에서의 적용 가능성을 보여준다.

  • PDF

자율적인 웹 서비스 품질 정보 수집을 위한 프록시 클라이언트 코드의 자동 생성 방안 (Automatic Generation Method of Proxy Client Code to Autonomic Quality Information)

  • 서영준;한정수;송영재
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.228-235
    • /
    • 2008
  • 본 논문에서는 모니터링 에이전트를 통한 웹 서비스 선정 과정의 자동화를 위해 프록시 클라이언트 코드를 자동 생성하는 방안을 제안한다. 본 논문의 기법은 템플릿 룰에 따라WSDL문서의 특정 엘리먼트의 속성 값을 가져옴으로써 서비스 사용자에게 프록시 클라이언트의 소스 코드를 제공할 수 있게 해 준다. 즉 XSLT 스크립트 파일은 클라이언트 코드 생성시 필요한 동적 호출 인터페이스 모델의 코드 골격을 제공한다. 이러한 코드 자동 생성 기법은 이동 에이전트 기술과 더불어 선정 아키텍처에서의 기아 상태를 해결하기 위해 필요하다 선정 서비스를 제외하더라도 검색 결과상의 모든 서비스들에 대한 요청 HTTP 메시지를 발생시키기 위해서는 코드 자동 생성 기법이 필요하다. 생성된 프록시 클라이언트 프로그램 코드는 검색된 서비스들에 대한 더미 메시지를 발생시킨다. 본 논문에서 제시한 클라이언트 코드 생성 방안은 자동 생성 프로그래밍 영역에서의 적용 가능성을 보여준다.

On the Use of Adaptive Weights for the F-Norm Support Vector Machine

  • Bang, Sung-Wan;Jhun, Myoung-Shic
    • 응용통계연구
    • /
    • 제25권5호
    • /
    • pp.829-835
    • /
    • 2012
  • When the input features are generated by factors in a classification problem, it is more meaningful to identify important factors, rather than individual features. The $F_{\infty}$-norm support vector machine(SVM) has been developed to perform automatic factor selection in classification. However, the $F_{\infty}$-norm SVM may suffer from estimation inefficiency and model selection inconsistency because it applies the same amount of shrinkage to each factor without assessing its relative importance. To overcome such a limitation, we propose the adaptive $F_{\infty}$-norm ($AF_{\infty}$-norm) SVM, which penalizes the empirical hinge loss by the sum of the adaptively weighted factor-wise $L_{\infty}$-norm penalty. The $AF_{\infty}$-norm SVM computes the weights by the 2-norm SVM estimator and can be formulated as a linear programming(LP) problem which is similar to the one of the $F_{\infty}$-norm SVM. The simulation studies show that the proposed $AF_{\infty}$-norm SVM improves upon the $F_{\infty}$-norm SVM in terms of classification accuracy and factor selection performance.

조음자질을 이용한 한국인 학습자의 영어 발화 자동 발음 평가 (Automatic pronunciation assessment of English produced by Korean learners using articulatory features)

  • 류혁수;정민화
    • 말소리와 음성과학
    • /
    • 제8권4호
    • /
    • pp.103-113
    • /
    • 2016
  • This paper aims to propose articulatory features as novel predictors for automatic pronunciation assessment of English produced by Korean learners. Based on the distinctive feature theory, where phonemes are represented as a set of articulatory/phonetic properties, we propose articulatory Goodness-Of-Pronunciation(aGOP) features in terms of the corresponding articulatory attributes, such as nasal, sonorant, anterior, etc. An English speech corpus spoken by Korean learners is used in the assessment modeling. In our system, learners' speech is forced aligned and recognized by using the acoustic and pronunciation models derived from the WSJ corpus (native North American speech) and the CMU pronouncing dictionary, respectively. In order to compute aGOP features, articulatory models are trained for the corresponding articulatory attributes. In addition to the proposed features, various features which are divided into four categories such as RATE, SEGMENT, SILENCE, and GOP are applied as a baseline. In order to enhance the assessment modeling performance and investigate the weights of the salient features, relevant features are extracted by using Best Subset Selection(BSS). The results show that the proposed model using aGOP features outperform the baseline. In addition, analysis of relevant features extracted by BSS reveals that the selected aGOP features represent the salient variations of Korean learners of English. The results are expected to be effective for automatic pronunciation error detection, as well.

최적부하제한방식의 결정과 운용에 관한 연구 (A Study on the Determination and Application of the Optimum Load Shedding Schemes)

  • Song, Kil-Yeong
    • 대한전기학회논문지
    • /
    • 제34권1호
    • /
    • pp.29-37
    • /
    • 1985
  • During Severe emergencies which result in the case of outage of large generator units, an automatic underfrequency protection scheme can prevent the system frequency from decaying and improve the system stability. This paper presents methods and results of a study on the optimum load shedding scheme which covering as follows. 1) Detail representation of governor model 2) Determination of optimum load shedding amount 3) Selection of action time settings of UFR 4) Comparsson of load shedding programs By this study, the optimum system operating method was recommended for reliable operation of power system.

  • PDF

학습문서의 개수에 따른 편차기반 분류방법의 분류 정확도 (Classification Accuracy by Deviation-based Classification Method with the Number of Training Documents)

  • 이용배
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.325-332
    • /
    • 2014
  • 일반적으로 자동분류는 학습문서의 개수에 영향을 받는다고 알려져 있지만 실제로 학습문서의 수가 텍스트 자동분류에 어떻게 영향을 주는지 입증한 연구는 거의 없었다. 본 연구에서는 학습문서 수가 자동분류에 어떤 영향을 주는지 알아보기 위해 최근에 개발된 편차기반 분류방법을 중심으로 다른 분류 알고리즘과 비교하는데 초점을 두었다. 실험결과, 편차기반 분류모델은 학습문서의 수가 총 21개(7개 장르)인 상황에서 정확도가 0.8로 베이지안이나 지지벡터기계보다 우수하게 나타났다. 이것은 편차기반 분류모델이 장르내의 주제정보를 이용하여 학습하기 때문에 학습문서의 수가 적더라도 다른 학습방법보다 좋은 자질 선택 능력을 갖는다는 것을 입증한 것이다.

시뮬레이션과 퍼지비선형계획 및 신경망 기법을 이용한 경제적 절삭공정 모델 (Economic Machining Process Models Using Simulation, Fuzzy Non-Linear Programming and Neural-Networks)

  • 이영해;양병희;전성진
    • 대한산업공학회지
    • /
    • 제23권1호
    • /
    • pp.39-54
    • /
    • 1997
  • This paper presents four process models for machining processes : 1) an economical mathematical model of machining process, 2) a prediction model for surface roughness, 3) a decision model for fuzzy cutting conditions, and 4) a judgment model of machinability with automatic selection of cutting conditions. Each model was developed the economic machining, and these models were applied to theories widely studied in industrial engineering which are nonlinear programming, computer simulation, fuzzy theory, and neural networks. The results of this paper emphasize the human oriented domain of a nonlinear programming problem. From a viewpoint of the decision maker, fuzzy nonlinear programming modeling seems to be apparently more flexible, more acceptable, and more reliable for uncertain, ill-defined, and vague problem situations.

  • PDF

중계기 선택 기법이 적용된 증분 협력 통신의 중계기 배치에 따른 성능 분석 (Performance Analysis of Incremental Cooperative Communication with Relay Selection Based on The Relays Arrangement)

  • 김렴;공형윤
    • 한국전자파학회논문지
    • /
    • 제22권10호
    • /
    • pp.941-950
    • /
    • 2011
  • 본 논문에서는 중계기 선택 기법이 적용된 증분 협력 통신의 단-대-단 성능을 분석한다. 일반적인 협력 통신은 1 phase에 송신단(S)에서 전송하는 신호를 수신단(D)이 한 번 수신하고, 2 phase에 중계기(R)로부터 S에서 전송한 신호를 재 전송받게 된다. 이러한 과정을 통해 D는 다이버시티 이득을 얻음으로써 수신 성능이 향상되지만, 두 번에 걸친 전송은 스펙트럼 효율성을 감소시킨다. 하지만 증분형 중계 기법을 적용한 협력 통신에서 D는 1 phase에 수신한 신호만으로 복호에 성공할 수 있다고 판단되면, 두 번째 전송을 생략함으로써 이러한 단점을 보완할 수 있다. 증분형 중계 기법에서 D는 ACK/NACK 메시지를 전송하는 ARQ(Automatic Repeat reQuest) 기법을 이용한다. 본 논문에서는 D가 첫 번째 시간 슬롯에 수신한 신호를 복호할 수 있는지를 판단하기 위해 임계 SNR을 이용한 ARQ 기법과 채널 부호화를 이용한 HARQ(Hybrid Automatic Repeat reQuest) 기법과 같이 두 가지 방법을 고려한 시스템에 참여하는 중계기 배치에 따른 성능을 분석하고, 중계기 배치가 성능에 미치는 영향에 대해 연구한다.

평면 다물체 동역학 해석을 이용한 건설장비 작업장치의 링크 피봇점 설계 지원 프로그램 개발 (Development of a Design Support Program for Pivot Points of Working Devices in Construction Equipment using Planar Multi-body Dynamic Analysis)

  • 박현규;장진석;유완석;김민석;이희종;이재욱
    • 한국기계가공학회지
    • /
    • 제14권6호
    • /
    • pp.49-56
    • /
    • 2015
  • For designing working devices of construction equipment, it is necessary to consider not only sufficient working ability but also available working range. Therefore, it is important to select the appropriate pivot positions of links. This paper presents a study on selection of pivot points of links used in construction equipment. To analyze the effect of each pivot point, a design program for pivot selection is developed. A conventional pivot design method requires a complicated process because it needs to create a certain working position manually to evaluate its performance. However, the developed program includes an automatic link assembly algorithm; thus, the working device can easily be analyzed by using pivot information of links. The developed program also included a kinematic/static analysis module and characteristic analysis algorithms. Therefore, it is possible to easily analyze a working device model created through the automatic assembly algorithm, whereby users can easily analyze the effect of each link pivot point for the actual product design.