• Title/Summary/Keyword: 엔트로피 척도

Search Result 45, Processing Time 0.022 seconds

Analyzing the Network of Academic Disciplines with Journal Contributions of Korean Researchers (연구자의 투고 학술지 현황에 근거한 국내 학문분야 네트워크 분석)

  • Lee, Jae-Yun
    • Journal of the Korean Society for information Management
    • /
    • v.25 no.4
    • /
    • pp.327-345
    • /
    • 2008
  • The main purposes of this study are to construct a Korean science network from journal contributions data of Korean researchers, and to analyze the structure and characteristics of the network. First of all, the association matrix of 140 scholarly domains are calculated based on the number of contributions in common journals, and then the Pathfinder network algorithm is applied to those matrix. The resulting network has several hubs such as 'Biology', 'Korean Language & Linguistics', 'Physics', etc. The entropy formula and several centrality measures for the weighted networks are adopted to identify the centralities and interdisciplinarity of each scholarly domain. In particular, the date hubs, which have several weak links, are successively distinguished by local and global triangle betweenness centrality measures.

Double Clustering of Gene Expression Data Based on the Information Bottleneck Method (정보병목기법에 기반한 유전자 발현 데이터의 이중 클러스터링)

  • 김병희;황규백;장정호;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.362-364
    • /
    • 2003
  • 기능 유전체학에서 클러스터링 기법은 고차원의 마이크로 어레이 데이터 분석을 위한 주된 도구 중의 하나이다. 본 논문에서는 정보병목(information bottleneck)기법 기반의 이중 클러스터링에 의한, 유전자 발현 데이터의 계층적 병합방식 클러스터링 기법을 제안한다. 정보병목기법은, 두 랜덤변수의 결합확률분포가 주어진 경우 두 변수의 상호 정보량을 최대한 보존하면서 한 변수를 압축하는 기법이며, 두 변수를 차례로 압축하는 것이 이중 클러스터링이다. 실제 마이크로 어레이 데이터인 NC160 데이터(암세포 내 유전자 발현 데이터)에 대한 실험에서, 먼저 유전자를 그 발현패턴에 따라 클러스터링 한 후 이를 이용하여 표본들을 클러스터링하고 그 성능을 다각도로 분석하였다. 상호 정보량과 유전자 및 표본 클러스터 수와 엔트로피 척도에 의한 성능을 검토해 본 결과, 표본이 추출 조직에 따라 구분 가능할 것이라는 가정을 검증할 수 있었으며, 적절한 클러스터의 수를 결정할 수 있는 임계점의 기준을 설정할 수 있었다.

  • PDF

Selecting on the Preferred Alternatives of the MADM Problems using the Entropy Measure (엔트로피 척도를 이용한 MADM 문제의 선호대안 선정)

  • 이강인
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.26 no.2
    • /
    • pp.55-61
    • /
    • 2003
  • The purpose of this paper is to propose a method for selecting the preferred alternatives of Multiple- Attribute Decision-Making(MADM) problem using the Entropy measure. A decision-maker who wants to estimate exactly the weight to be applied to her/his MADM problem is usually confronted with the embarrassing situation where, although there exist a variety of weighting methods, it is hard to find a right procedure to choose a pertinent value To remedy this uncomfortable situation, the Entropy measure commonly used in information theory, Is proposed as a tool that can be used by decision-makers to more efficiently select the preferred alternatives. As a result, the method proposed in the paper can be significant in that relatively easy to understand by decision-makers.

Detection of an Invariant Direction using K-means Clustering (K-means 클러스터링을 이용한 불변 방향 검출)

  • Kim, Dal-Hyoun;Lee, Woo-Ram;Jun, Byoung-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2011.05a
    • /
    • pp.389-392
    • /
    • 2011
  • 본 논문에서는 영상의 색 항등성을 달성하기 위해 본질 영상의 핵심인 불변 방향을 K-means 클러스터링을 이용해 검출하는 개선된 알고리즘을 제안한다. 우선, RGB 영상을 K-means 클러스터링 기법에 의해 다수의 클러스터로 분할한다. 이 때, 클러스터 간의 거리 측정은 유클리드 거리이다. 그리고 분할된 클러스터 중 가장 많은 색을 가진 클러스터만을 x-색도 공간으로 도시하여 해당되는 후보 불변 방향을 계산한다. 검출된 후보 불변 방향은 방향별로 프로젝션된 히스토그램에서 3개 이상의 프로젝션된 데이터를 가진 bin들의 개수가 가장 적은 방향이다. 그 후, 분할된 다른 여러 클러스터에 해당되는 후 보 불변 방향을 계산하여 가장 많은 빈도로 나타나는 방향을 영상의 최종 불변 방향으로 결정한다. 실험에서 Ebner에 의해 제안된 데이터집합을 실험 영상으로 사용하였고, 색항등성 측도를 평가 척도로 사용하였다. 실험 결과, 제안한 기법은 형광성 표면을 가진 형광 데이터집합에 보다 적합하였으며, 엔트로피 기법보다 색항등성이 1.5배 이상 높았다.

  • PDF

Diagnosis by Rough Set and Information Theory in Reinforcing the Competencies of the Collegiate (러프집합과 정보이론을 이용한 대학생역량강화 진단)

  • Park, In-Kyoo
    • Journal of Digital Convergence
    • /
    • v.12 no.8
    • /
    • pp.257-264
    • /
    • 2014
  • This paper presents the core competencies diagnosis system which targeted our collegiate students in an attempt to induce the core competencies for reinforcing the learning and employment capabilities. Because these days data give rise to a high level of redundancy and dimensionality with time complexity, they are more likely to have spurious relationships, and even the weakest relationships will be highly significant by any statistical test. So as to address the measurement of uncertainties from the classification of categorical data and the implementation of its analytic system, an uncertainty measure of rough entropy and information entropy is defined so that similar behaviors analysis is carried out and the clustering ability is demonstrated in the comparison with the statistical approach. Because the acquired and necessary competencies of the collegiate is deduced by way of the results of the diagnosis, i.e. common core competencies and major core competencies, they facilitate not only the collegiate life and the employment capability reinforcement but also the revitalization of employment and the adjustment to college life.

An Improvement of the Decision-Making of Categorical Data in Rough Set Analysis (범주형 데이터의 러프집합 분석을 통한 의사결정 향상기법)

  • Park, In-Kyu
    • Journal of Digital Convergence
    • /
    • v.13 no.6
    • /
    • pp.157-164
    • /
    • 2015
  • An efficient retrieval of useful information is a prerequisite of an optimal decision making system. Hence, A research of data mining techniques finding useful patterns from the various forms of data has been progressed with the increase of the application of Big Data for convergence and integration with other industries. Each technique is more likely to have its drawback so that the generalization of retrieving useful information is weak. Another integrated technique is essential for retrieving useful information. In this paper, a uncertainty measure of information is calculated such that algebraic probability is measured by Bayesian theory and then information entropy of the probability is measured. The proposed measure generates the effective reduct set (i.e., reduced set of necessary attributes) and formulating the core of the attribute set. Hence, the optimal decision rules are induced. Through simulation deciding contact lenses, the proposed approach is compared with the equivalence and value-reduct theories. As the result, the proposed is more general than the previous theories in useful decision-making.

공기조화용 자기냉동기의 연구 동향

  • 이종석
    • The Magazine of the Society of Air-Conditioning and Refrigerating Engineers of Korea
    • /
    • v.29 no.4
    • /
    • pp.48-54
    • /
    • 2000
  • 자성재료에 자기장을 걸어주변 가열되고 자기장을 제거하면 냉각되는 성질이 있는데, 이를 자기열량효과(magnetocaloric effect)라고 하며, 이것을 이용해서 저온을 생성시키는 방법을 자기냉동(magnetic refrigeration)이라고 한다. 큐리 온도(Curie temperature) 부근의 강자성체에 자 기장이 가해지면 전자례도내에서 쌍을 이루지 않은 전자들의 자기모벤트들이 자기장에 평행 하게 배열되는데, 이로 인해 열역학적 무질서의 척도인 엔트로피는 낮아지고 이러한 손실을 보상하기 위해 재료의 온도가 올라가게 된다.반대로 자기장이 제거되면 자기모벤트가 본래의 무질서한 상태로 돌아오며, 엔트로피가 증가하 고 재료의 온도는 떨어지게 되는 것이다. 역사적으로 보면 1881년에 Warburg가 큐리온도 부근의 철에서 자기열량효과를 처음 발견하였으며. 1926년과 1927년에 Debye와 Giauque가 각각 단열소자볍 (adiabatic demagnetization)을 제안함으로써 실용화되기 시작하여 주로 극저온을 얻는 방법으로 이용되어 왔다. 1950년도 이전의 연구는 절대온도 영도(OK)에 도달하고 자 하는 순수과학적인 노력으로서 개방사이클(open cycle)을 이용한 단열냉각 방식을 추구하 였으나, 1950년 이후부터는 공학적인 응용을 목적으로 밀폐사이클(closed cycle)을 형성하는 자기냉동기에 관한 연구가 진행되었다. 1976년에 Brown은 희토류(rare earth) 금속인 가돌리늄(Gd)을 사용하여 유체(물 80%와 에틸 알코올 20%)를 재생시킴으로써 상온에서 작동 하는 자기냉동기를 보고한 바 있다. 그는 7 T의 큰 자장을 이용하였으며, 고온부와 저온부의 온도는 각각 $46^{\circ}C와\;-1^{\circ}C로서\;47^{\circ}C$의 온도간격을 얻었다. 자기냉동에 있어서의 또 하나의 중요한 진전은 1978년과 1982년에 Steyert와 Barclay에 의해서 능동자기재생기(active magnetic r regenerator)의 개념이 소개되고 개발된 것으로, 이는 자성재료가 냉매로서 뿐만 아니라 열전달 유체의 재생기로도 사용되는 방식이다. 이상과 같은 자기냉동기술의 발달에 이어서 1997년에 미국의 Astronautics사(Wisconsin주 Madison시 소재)와 Ames 연구소(Iowa주 Ames 시 소재)의 공동연구팀이 발표한 두 가지의 새로운 진전으로 인해 공기조화 및 냉동분야에 적용할 수 있는 자기냉동기의 실용화 가능성이 한층 높아졌다. 이들의 연구결과는 (1) 자기냉동이 실온에서도 실현 가능한 기술이며 증기압 축식 냉동에 필적할 만하다는 것을 보인 것과 (2) 이미 알려져 있던 자기냉동재료보다 자기 열량효과가 훨씬 큰 새로운 재료를 발견한 것이다. 이로써 자기냉동에 대한 관심과 기대가 한결 커지고 있다. 본 원고에서는 자기냉동의 원리가 되는 자기열량효과와 이를 이용한 자기냉동의 방법 그리고 최근에 이루어진 새로운 진전에 대해 소개하고 공기조화 및 냉동분야에의 적용 가능성을 전망해 보고자 한다.

  • PDF

lustering of Categorical Data using Rough Entropy (러프 엔트로피를 이용한 범주형 데이터의 클러스터링)

  • Park, Inkyoo
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.13 no.5
    • /
    • pp.183-188
    • /
    • 2013
  • A variety of cluster analysis techniques prerequisite to cluster objects having similar characteristics in data mining. But the clustering of those algorithms have lots of difficulties in dealing with categorical data within the databases. The imprecise handling of uncertainty within categorical data in the clustering process stems from the only algebraic logic of rough set, resulting in the degradation of stability and effectiveness. This paper proposes a information-theoretic rough entropy(RE) by taking into account the dependency of attributes and proposes a technique called min-mean-mean roughness(MMMR) for selecting clustering attribute. We analyze and compare the performance of the proposed technique with K-means, fuzzy techniques and other standard deviation roughness methods based on ZOO dataset. The results verify the better performance of the proposed approach.

Decision Analysis System for Job Guidance using Rough Set (러프집합을 통한 취업의사결정 분석시스템)

  • Lee, Heui-Tae;Park, In-Kyoo
    • Journal of Digital Convergence
    • /
    • v.11 no.10
    • /
    • pp.387-394
    • /
    • 2013
  • Data mining is the process of discovering hidden, non-trivial patterns in large amounts of data records in order to be used very effectively for analysis and forecasting. Because hundreds of variables give rise to a high level of redundancy and dimensionality with time complexity, they are more likely to have spurious relationships, and even the weakest relationships will be highly significant by any statistical test. Hence cluster analysis is a main task of data mining and is the task of grouping a set of objects in such a way that objects in the same group are more similar to each other than to those in other groups. In this paper system implementation is of great significance, which defines a new definition based on information-theoretic entropy and analyse the analogue behaviors of objects at hand so as to address the measurement of uncertainties in the classification of categorical data. The sources were taken from a survey aimed to identify of job guidance from students in high school pyeongtaek. we show how variable precision information-entropy based rough set can be used to group student in each section. It is proved that the proposed method has the more exact classification than the conventional in attributes more than 10 and that is more effective in job guidance for students.

Sample-spacing Approach for the Estimation of Mutual Information (SAMPLE-SPACING 방법에 의한 상호정보의 추정)

  • Huh, Moon-Yul;Cha, Woon-Ock
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.2
    • /
    • pp.301-312
    • /
    • 2008
  • Mutual information is a measure of association of explanatory variable for predicting target variable. It is used for variable ranking and variable subset selection. This study is about the Sample-spacing approach which can be used for the estimation of mutual information from data consisting of continuous explanation variables and categorical target variable without estimating a joint probability density function. The results of Monte-Carlo simulation and experiments with real-world data show that m = 1 is preferable in using Sample-spacing.