• 제목/요약/키워드: data weighting

검색결과 645건 처리시간 0.027초

유전자 알고리즘과 하중값을 이용한 퍼지 시스템의 최적화 (Optimization of Fuzzy Systems by Means of GA and Weighting Factor)

  • 박병준;오성권;안태천;김현기
    • 대한전기학회논문지:전력기술부문A
    • /
    • 제48권6호
    • /
    • pp.789-799
    • /
    • 1999
  • In this paper, the optimization of fuzzy inference systems is proposed for fuzzy model of nonlinear systems. A fuzzy model needs to be identified and optimized by means of the definite and systematic methods, because a fuzzy model is primarily acquired by expert's experience. The proposed rule-based fuzzy model implements system structure and parameter identification using the HCM(Hard C-mean) clustering method, genetic algorithms and fuzzy inference method. Two types of inference methods of a fuzzy model are the simplified inference and linear inference. in this paper, nonlinear systems are expressed using the identification of structure such as input variables and the division of fuzzy input subspaces, and the identification of parameters of a fuzzy model. To identify premise parameters of fuzzy model, the genetic algorithms is used and the standard least square method with the gaussian elimination method is utilized for the identification of optimum consequence parameters of fuzzy model. Also, the performance index with weighting factor is proposed to achieve a balance between the performance results of fuzzy model produced for the training and testing data set, and it leads to enhance approximation and predictive performance of fuzzy system. Time series data for gas furnace and sewage treatment process are used to evaluate the performance of the proposed model.

  • PDF

고차원 데이타에 대한 투영 클러스터링에서 특성 가중치 부여 (Feature Weighting in Projected Clustering for High Dimensional Data)

  • 박종수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.228-242
    • /
    • 2005
  • 투영 클러스터링은 고 차원 데이타집합에서 서로 다른 부분공간들에서 클러스터들을 찾으려고 모색한다. 사용자가 출력 클러스터들의 개수와 투영 클러스터들의 부분공간의 평균 차원수를 지정하지 않아도, 거의 최적인 투영 클러스터들을 탐사해내는 알고리즘을 제안한다. 클러스터링의 각 단계에서 알고리즘의 목적 함수는 투영 에너지, 품질, 그리고 이상치들의 개수를 계산한다. 클러스터링에서 투영 에너지를 최소화하고 품질을 최대화하기 위하여, 전체 차원의 표준 편차들을 비교함으로 입력 점들의 밀도 상에서 각 클러스터의 최선의 부분영역을 찾기 시작한다. 부분공간의 각 차원에 대한 가중치 요소가 투영 거리 측정에서 확률 오차를 없애기 위하여 사용된다. 제안된 알고리즘이 투영 클러스터들을 정확하게 발견해내고 대 용량의 데이타 집합에서 비례확장성을 갖는다는 것을 여러 가지 실험으로 보여준다.

데이터 마이닝 기반의 군사특기 분류 방법론 연구 (A Data-Mining-based Methodology for Military Occupational Specialty Assignment)

  • 민규식;정지원;최인찬
    • 한국국방경영분석학회지
    • /
    • 제30권1호
    • /
    • pp.1-14
    • /
    • 2004
  • In this paper, we propose a new data-mining-based methodology for military occupational specialty assignment. The proposed methodology consists of two phases, feature selection and man-power assignment. In the first phase, the k-means partitioning algorithm and the optimal variable weighting algorithm are used to determine attribute weights. We address limitations of the optimal variable weighting algorithm and suggest a quadratic programming model that can handle categorical variables and non-contributory trivial variables. In the second phase, we present an integer programming model to deal with a man-power assignment problem. In the model, constraints on demand-supply requirements and training capacity are considered. Moreover, the attribute weights obtained in the first phase for each specialty are used to measure dissimilarity. Results of a computational experiment using real-world data are provided along with some analysis.

SNS 특징정보를 활용한 마르코프 논리 네트워크 기반의 단문 텍스트 분류 방법 (A Method for Short Text Classification using SNS Feature Information based on Markov Logic Networks)

  • 이은지;김판구
    • 한국멀티미디어학회논문지
    • /
    • 제20권7호
    • /
    • pp.1065-1072
    • /
    • 2017
  • As smart devices and social network services (SNSs) become increasingly pervasive, individuals produce large amounts of data in real time. Accordingly, studies on unstructured data analysis are actively being conducted to solve the resultant problem of information overload and to facilitate effective data processing. Many such studies are conducted for filtering inappropriate information. In this paper, a feature-weighting method considering SNS-message features is proposed for the classification of short text messages generated on SNSs, using Markov logic networks for category inference. The performance of the proposed method is verified through a comparison with an existing frequency-based classification methods.

이진 이미지에 대한 픽셀값 가중치를 이용한 자료 은닉 기법 연구 (A Data Hiding Method of Binary Images Using Pixel-value Weighting)

  • 정기현
    • 한국군사과학기술학회지
    • /
    • 제11권4호
    • /
    • pp.68-75
    • /
    • 2008
  • This paper proposes a new data hiding method for binary images using the weighting value of pixel-value differencing. The binary cover image is partitioned into non-overlapping sub-blocks and find the most suitable position to embed a secret bit for each sub-block. The proposed method calculates the weighted value for a sub-block to pivot a pixel to be changed. This improves the image quality of the stego-image. The experimental results show that the proposed method achieves a good visual quality and high capacity.

공간시계열 모형의 칼만필터 추정과 예측 (Kalman-Filter Estimation and Prediction for a Spatial Time Series Model)

  • 이성덕;한은희;김덕기
    • Communications for Statistical Applications and Methods
    • /
    • 제18권1호
    • /
    • pp.79-87
    • /
    • 2011
  • 공간적, 시간적으로 퍼져나가는 전염성이 강한 질병인 수두자료를 이용하여 공간 시계열 자료를 분석하는데 있어 일반적으로 알려진 ARIMA 모형에 적합하여 분석을 행하면 공간적인 정보를 반영하지 못하기 때문에 기존에 시간만을 고려한 시계열 분석방법에 공간통계의 공간적 정보를 반영한 공간시계열 모형을 고려한다. 공간시계열 모형에서 공간의 위치 및 영향은 시계열 모형에 공간적 정보로써 가중치행렬을 더 함으로써 처리 가능해진다. 가중치행렬은 지리적으로 인접한 지역일수록 공간의존도가 높다는 것을 반영한 것이며 공간시계열 모형의 연구에서 가중치행렬은 인접한 지역들은 동일한 영향을 줄 것이라 가정하였다. 따라서 본 논문에서는 공간시계열 모형인 STARMA 모형과 STBL 모형에 대한 식별방법, 통계적 추론 및 예측력 비교에 대해 연구하였고 특히, 모수추정의 알고리즘 비교와 공간시계열 모형의 예측력 비교를 통해 Kalman-Filter 방법의 우수성을 보이고자 한다.

사용자 질의어 특징을 반영한 하이라이트 기반 노래 가사 검색 (Highlight based Lyrics Search Considering the Characteristics of Query)

  • 김권양
    • 한국지능시스템학회논문지
    • /
    • 제26권4호
    • /
    • pp.301-307
    • /
    • 2016
  • 본 논문에서는 사용자들이 노래 가사를 입력으로 음악을 검색할 때 사용자의 질의어 특징을 반영한 검색 방법을 제안한다. 일반적으로 노래 가사 검색에서 사용자들이 작성하는 질의어들은 음악 하이라이트 부분에 해당된다는 점을 고려하여 본 논문에서는 노래 가사를 색인할 때, 하이라이트 부분이 더 중요하도록 만든다. 이를 위해 본 논문에서는 응집 계층 군집화를 사용하여 자동으로 음악 하이라이트 부분을 찾고, 하이라이트 부분과 그 주변 부분을 중요하게 고려할 수 있는 가우시안 중요도를 제안한다. 이 가우시안 함수는 평균을 하이라이트 부분으로 설정함으로써 하이라이트에서 가장 높은 값을 가지며, 주변부는 하이라이트보다 낮은 중요도를 가진다. 이렇게 얻어진 중요도와 함께 노래 가사를 색인함으로써 사용자들이 작성한 질의어에 대해 더 부합하는 검색 결과를 제공해준다. 실험에서 실사용자 5명에 대해 다양한 질의 타입들과 함께 평가하였으며, 가중치를 고려하지 않는 비교 모델보다 제안한 방법이 효과적임을 보인다.

GMM 기반 실시간 문맥독립화자식별시스템의 성능향상을 위한 프레임선택 및 가중치를 이용한 Hybrid 방법 (Hybrid Method using Frame Selection and Weighting Model Rank to improve Performance of Real-time Text-Independent Speaker Recognition System based on GMM)

  • 김민정;석수영;김광수;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.512-522
    • /
    • 2002
  • 본 논문에서는 GMM(Gaussian Mixture Model)에 기반한 실시간문맥독립화자식별시스템[1][2]의 성능향상을 위하여 프레임선택(Frame Selection)방법과 프레임가중치(Weighting Model Rank)방법을 혼합한 hybrid방법을 제안한다. 본 시스템에서는 GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법과 인식 알고리즘으로 ML(Maximum Likelihood)을 기본적으로 사용하였다. 제안한 hybrid 방법은 두 단계로 이루어진다. 첫째, 화자모델과 테스트 데이터를 이용하여 프레임단위로 유사도를 계산하고, 가장 큰 유사도 값과 두 번째로 큰 유사도 값의 차를 계산한 후, 차가 문턱치보다 큰 프레임만을 선택한다 두 번째로, 선택되어진 프레임에서 계산되어진 유사도 값 대신에 가중치 값을 사용하여 전체 스코어를 계산한다. 특징 파라미터로서는 켑스트럼과 회귀계수를 사용하였으며, 학습과 테스트를 위한 데이터베이스는 채집기간이 다른 여러 데이터베이스들로 구성되어 있으며, 실험을 위한 데이터는 임의의 단어를 선택하여 사용하였다. 화자인식실험은 기본 시스템에 프레임선택방법, 프레임가중치방법, 제안한 Hybrid방법을 각각 적용하여 실험하였다. 실험결과, 프레임선택방법에 비해 평균 4%, 프레임가중치방법에 비해 평균 1%의 인식률 향상을 보여, 본 논문에서 적용한 hybrid방법의 유효성을 확인하였다.

  • PDF

추천을 위한 키워드 가중치를 이용한 멀티모달 미디어 콘텐츠 분류 (Multimodal Media Content Classification using Keyword Weighting for Recommendation)

  • 강지수;백지원;정경용
    • 융합정보논문지
    • /
    • 제9권5호
    • /
    • pp.1-6
    • /
    • 2019
  • 모바일 시장의 확장과 함께 멀티모달 미디어 콘텐츠의 제공을 위한 플랫폼이 다양해지고 있다. 멀티모달 미디어 콘텐츠에는 이종데이터들이 복합적으로 포함되어 있어 사용자들이 선호 콘텐츠를 선택하기 위해 시간과 노력이 요구된다. 따라서 본 논문에서는 추천을 위한 키워드 가중치를 이용한 멀티모달 미디어 콘텐츠 분류를 제안한다. 제안하는 방법은 멀티모달 미디어 콘텐츠의 텍스트 데이터에서 키워드 가중치를 통해 콘텐츠를 가장 잘 나타내는 키워드를 추출한다. 추출된 키워드를 기반으로 서브클래스를 갖는 장르 클래스를 생성하고 이에 적절한 멀티모달 미디어 콘텐츠를 분류한다. 또한 개인화된 추천을 위해 사용자의 선호도 평가를 진행하여 사용자의 콘텐츠 선호도 분석 결과를 기반으로 멀티모달 콘텐츠를 추천한다. 성능평가는 추천 결과의 정확도와 만족도를 통해 우수함을 검증한다. 이는 사용자가 선호하는 장르와 키워드를 모두 고려하여 추천하기 때문에 정확도는 74.62%, 만족도는 69.1%로 높게 나타난다.

암반 사면의 파괴 예측을 위한 불연속면 분포 특성 분석 (Analysis of Discontinuity Distribution Property to Predict Rock Slope Failure)

  • 윤운상;김정환;배기훈
    • 한국지반공학회:학술대회논문집
    • /
    • 한국지반공학회 1999년도 가을 학술발표회 논문집
    • /
    • pp.147-152
    • /
    • 1999
  • Distribution of fracture system is an important factor to analyse instability of jointed rock slope. In the most case of rock slopes, joint distribution properties are related to potential, shape, size and locality of slope failure. The purpose of this paper is to present an application of fracture characterization related to rock slope failure. Fracture data used in this study are collected by scanline survey. Two aspects of fracture characterization for rock slope are handled in this study First, In order to determine the potential and shape of slope failure, trace length of joints is considered as the weighting factor about collected orientation data. Second, Relationship between trace length and spacing is analysed to estimate failure location and size. The distribution of fracture system is directly influenced on wedge failure. It is effective to analyse the orientation of fractures by using weighting factors associated with the trace length of fractures rather than to analyse only that of fractures. It gives a conclusion that the wedge failure occurred along the peak of fracture density(or intensity) cycles.

  • PDF