• Title/Summary/Keyword: Term Clustering

Search Result 177, Processing Time 0.036 seconds

Technopolis and Regional Development : A Review of Development Experience in Hsinchu, Taiwan

  • Hu, Tai-Shan;Lin, Chien-Yuan
    • World Technopolis Review
    • /
    • v.2 no.2
    • /
    • pp.50-63
    • /
    • 2013
  • The Hsin-Chu Science-Based Industrial Park (HSIP), established in 1980, has made significant contribution to the development of Hsinchu technopolis. In the past three decades, not only the population structure and industrial patterns have changed significantly, but also a special knowledge-based industrial network has been developed. The 30 years experience of HSIP development provides an excellent opportunity for planners to review the long term impacts of science park development. This paper will review the evolution Hsinchu technopolis in areas of socioeconomic transformation and knowledge interactions between technology community and industrial clustering. In addition to the interpretation of its development by prevailing theories, critical factors influencing the future development of HSIP technopolis will also be discussed in this paper.

Clustering Method Using the Union Information of Term Frequency and Link in Hypertext (웹 문서의 단어정보와 링크정보 결합을 이용한 클러스터링 기법)

  • Lee, Won-Hee;Lee, Kyo-Woon;Park, Heum;Kim, Young-Ki;Kwon, Hyuck-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.101-107
    • /
    • 2003
  • 최근의 웹 문서는 텍스트 위주의 구성이 아닌 이미지, 사운드, 동영상 등의 다양한 타입으로 구성되는 추세이다. 이에 따라 단순히 웹 문서 내의 단어 정보추출 만으로는 좋은 성능의 클러스터링을 기대하기 어렵다. 본 논문은 전통적인 문서 클러스터링 기법인 단어기반 클러스터링 기법의 취약점을 제시하고, 웹 문서간의 링크구조정보 중 동시인용 정보를 이용하여 웹 문서 클러스터링 성능향상의 가능성을 보이고자 한다. 실험에서는 네이버디렉토리 중 '자연과학' 범주에 포함된 문서를 대상으로 위의 두 가지 방식과 이 두 가지를 혼합한 단어-링크 혼합 클러스터링을 통해 기존의 방식보다 더 낳은 성능을 얻을 수 있었다.

  • PDF

Genetic Algorithm and Clustering Technique for Optimization of Stochastic Simulation (유전자 알고리즘과 군집 분석을 이용한 확률적 시뮬레이션 최적화 기법)

  • 이동훈;허성필
    • Journal of the Korea Institute of Military Science and Technology
    • /
    • v.2 no.1
    • /
    • pp.90-100
    • /
    • 1999
  • 유전자 알고리즘은 전통적인 등반 알고리즘을 이용하여 구하기 어려웠던 최적화 문제를 해결하기 위한 강인한(Robust) 탐색 기법이다. 특히 목적함수가 (1)여러 개의 국부 최대치를 가지는 경우, (2)수학적으로 표현이 불가능하거나 어려운 경우, (3)목적함수에 교란 항(disturbance term)이 섞여 있을 경우도 우수한 탐색 능력을 갖는 것으로 알려져 있다. 본 논문에서는 유전자 알고리즘을 이용하여 나타나는 다양한 해집합을 형성하는 개체군을 군집성 분석(cluster analysis)을 이용하여 군집화하고, 각 군집에 부여된 군집 적합도에 따라서 최적해를 구함으로써 단순 유전자 알고리즘에 의한 최적화보다 훨씬 향상된 탐색 알고리즘을 제안하였다. 반응표면의 형태가 정형화한 테스트 함수의 형태로 나타난다고 가정한 경우에 대하여 몬테 칼로 시뮬레이션을 통하여 본 알고리즘을 적용하여 평가하고 분석하였다.

  • PDF

Soft Computing as a Methodology to Risk Engineering

  • Miyamoto Sadaaki
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.3-6
    • /
    • 2006
  • Methods for risk engineering is a bundle of engineering tools including fundamental concepts and approaches of soft computing with application to real issues of risk management. In this talk fundamental concepts and soft computing approaches of risk engineering will be introduced. As the term of risk implies both advantageous and hazardous uncertainty in its origins, a fundamental theory to describe uncertainties is introduced that includes traditional probability and statistical models, fuzzy systems, as well as less popular modal logic. In particular, modal logic capabilities to express various kinds of uncertainties are emphasized and relations with rough sets and evidence theory are described. Another topic is data mining related to problems in risk management. Some risk mining techniques including fuzzy clustering are introduced and a recently developed algorithm is overviewed. A numerical example is shown.

  • PDF

Term Clustering based on Causal Context Information (인과관계 문맥정보를 사용한 용어 군집화 연구)

  • Chang, Du-Seong;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.25-31
    • /
    • 2004
  • 단서구문 및 어휘 쌍 확률 등을 이용하면 일정한 영역의 문서에서 사용된 용어의 원인이 되거나 결과를 나타나는 관련어들을 찾을 수 있다. 본 논문에서는 이러한 각 용어의 선행 원인과 후행 결과를 인과관계 정보라고 정의한다. 인과관계 정보가 유사한 용어들은 서로 유사한 개념에 속한다고 가정한다면, 용어의 직/간접적 인과관계로서 용어 온톨로지에서 그 용어가 속할 집합을 결정하는데 도움을 줄 수 있다. 본 논문에서는 각 용어의 인과관계가 용어 군집화를 위한 유용한 문맥 정보의 하나라는 것을 실험을 통해 증명하였다. 속성으로 사용된 인과관계는 대용량의 코퍼스로부터 비지도식 학습방법을 통해 자동 습득하였으며, 그 정확도는 74.84%를 보였다. 1659개 용어에 대한 군집화 실험 결과 70.02%의 정확도를 보였으며, 어휘 유사도만을 사용한 경우에 비해 32.9%의 적용도 향상을 보였다.

  • PDF

Term Clustering and Interleaving for Parallel Information Retrieval (색인어 군집화를 이용한 효율적인 병렬정보검색시스템)

  • 강재호;양재완;정성원;류광렬;권혁철;정상화
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.05a
    • /
    • pp.401-409
    • /
    • 2002
  • 인터넷과 같은 대량의 정보에 대응할 수 있는 고성능 정보검색시스템을 구축하기 위해서는 지금까지 고가의 중대형 컴퓨터를 주로 활용하여 왔으나, 최근 가격대 성능비가 높은 PC 클러스터 시스템을 활용하는 방안이 경제적인 대안으로 떠오르고 있다. PC 클러스터 상에서의 병렬정보검색시스템을 효율적으로 운영하기 위해서는 사용자가 입력한 질의를 처리하는데 요구되는 개별 PC의 디스크 I/O 및 검색관련 연산을 모든 PC에 가능한 균등하게 분배할 필요가 있다. 본 논문에서는 같은 질의에 동시에 등장할 가능성이 높은 색인어들끼리 군집 화하고 생성된 군집을 활용하여 색인어들을 각 PC에 분산저장함으로써 보다 높은 수준의 병렬화를 달성할 수 있는 방안을 제시한다. 대용량 말뭉치를 활용한 실험결과 본 논문에서 제시하는 분산저장기법이 충분한 효율성을 가지고 있음을 확인하였다.

  • PDF

Source Environment Feature Related Phylogenetic Distribution Pattern of Anoxygenic Photosynthetic Bacteria as Revealed by pufM Analysis

  • Zeng, Yonghui;Jiao, Nianzhi
    • Journal of Microbiology
    • /
    • v.45 no.3
    • /
    • pp.205-212
    • /
    • 2007
  • Anoxygenic photosynthesis, performed primarily by anoxygenic photosynthetic bacteria (APB), has been supposed to arise on Earth more than 3 billion years ago. The long established APB are distributed in almost every corner where light can reach. However, the relationship between APB phylogeny and source environments has been largely unexplored. Here we retrieved the pufM sequences and related source information of 89 pufM containing species from the public database. Phylogenetic analysis revealed that horizontal gene transfer (HGT) most likely occurred within 11 out of a total 21 pufM subgroups, not only among species within the same class but also among species of different phyla or subphyla. A clear source environment feature related phylogenetic distribution pattern was observed, with all species from oxic habitats and those from anoxic habitats clustering into independent subgroups, respectively. HGT among ancient APB and subsequent long term evolution and adaptation to separated niches may have contributed to the coupling of environment and pufM phylogeny.

MPPT Control of Photovoltaic by FNN (FNN에 의한 태양광 발전의 MPPT 제어)

  • Choi, Jung-Sik;Ko, Jae-Sub;Chung, Dong-Hwa
    • The Transactions of The Korean Institute of Electrical Engineers
    • /
    • v.58 no.10
    • /
    • pp.1968-1975
    • /
    • 2009
  • The paper proposes a novel control algorithm for tracking maximum power of PV generation system.. The maximum power of PV array is determinated by a insolation and temperature. Prior considered the term in PV generation system is how maximum power point(MPP) is accurately tracked.. The paper proposes a fuzzy neural network(FNN) control algorithm so as to accurately track those maximum power points. The proposed control algorithm comprises the antecedence part of fuzzy rule and clustering method, multi-layer neural network in the consequent part. FNN has the advantages which are depicted both high performance and robustness in fuzzy control and high adaptive control in neural network.. Specially, it can show the outstanding control performance for parameter variations appling to non-linear character of PV array. In this paper, the tracking speed and the accuracy prove the validity through comparing a proposed algorithm with a conventional one.

Recruiting Ranking Techniques Based on Hybrid Using Clustering (군집화를 이용한 하이브리드 기반 채용검색 랭킹 기법)

  • Cho, Bo-Yun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1587-1590
    • /
    • 2012
  • 인터넷의 활용이 보편화 됨에 따라 정보의 양은 급격히 늘어나고 있다. 이에 취업을 희망하는 구직자의 경우 IR 로부터 원하는 정보를 검색하기 위해 과거보다 더 많은 시간과 노력이 필요하게 되었다. 이에 본 논문에서는 TF(Term Frequency)기법을 통해 문서를 추출하고 추출된 문서의 Doc_ID 빈도수를 기준으로 한 내용기반과 군집기법을 혼합한 하이브리드 검색 시스템을 제안한다. 구직자들이 클릭한 취업정보들의 링크번호들을 K-means 알고리즘을 이용하여 군집화를 한다. 생성된 군집들은 각기 하나의 문서로 가정하고, 기존 문서과 더불어 검색 주제와 연관성을 갖고 있는 문서들을 동적비율로 검색 랭킹 하는 방식이다. 기존의 IR 기술과의 비교 실험을 통해 성능을 평가하였다. 실험결과 본 논문에서 제안한 방법이 기존의 방법보다 우수함을 확인할 수 있었다

A Novel Technique of Topic Detection for On-line Text Documents: A Topic Tree-based Approach (온라인 텍스트문서의 계층적 트리 기반 주제탐색 기법)

  • Xuan, Man;Kim, Han-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.396-399
    • /
    • 2012
  • Topic detection is a problem of discovering the topics of online publishing documents. For topic detection, it is important to extract correct topic words and to show the topical words easily to understand. We consider a topic tree-based approach to more effectively and more briefly show the result of topic detection for online text documents. In this paper, to achieve the topic tree-based topic detection, we propose a new term weighting method, called CTF-CDF-IDF, which is simple yet effective. Moreover, we have modified a conventional clustering method, which we call incremental k-medoids algorithm. Our experimental results with Reuters-21578 and Google news collections show that the proposed method is very useful for topic detection.