• Title/Summary/Keyword: 군집 특성

Search Result 2,015, Processing Time 0.03 seconds

Motif-Based Protein Clustering (Motif 기반의 단백질 군집화)

  • Jin, Hoon;Kim, Hyun-Sik; Kim, In-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.235-237
    • /
    • 2002
  • motif란 기능적으로 유사한 단백질 군의 아마노산 서열들에 공통적으로 나타나는 일정한 패턴이나 부분서열을 말한다. 본 논문에서는 motif들로 각 단백질의 특성을 표현한 다음, 이것을 기초로 유사성을 비교하여 단백질들을 기능적으로 유사한 여러개의 계층적 군으로 나누는 군집화 방법을 소개하였다. 영역 특성상 확장성과 계층성을 가지는 신경망 GHSOM을 군집화 알고리즘으로 사용하였고, 실제 307 개의 단백질들에 대한 군집화 실험을 통해 그 효과를 확인해보았다.

  • PDF

Similar Verb Words Extraction based on their Case Frame Structure (격틀 구조에 기반한 유사 동사 추출)

  • Cho, Junghyun;Jung, Hyunki;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.219-224
    • /
    • 2009
  • 한국어 Propbank를 구축하기 위해서는 유사 동사를 군집화하고 군집에 포함되는 동사들의 구문 및 의미 특성을 모아놓은 정보가 필요하다. 본 연구에서는 이러한 군집화의 초기 단계로써 개별 동사들의 격틀 구조에 기반하여 동사간의 유사도를 추정하여 유사 동사를 추출하고자 하였다. 본 연구는 개별 동사의 격틀 정보를 추출하기 위하여 세종 계획의 용언 사전과 KAIST 언어자원의 동사 격틀 사전을 활용하였다. 또한 격틀을 세분화하여 보다 상세한 격틀 정보를 생성하기 위하여 격틀이 가지고 있는 논항의 특성을 활용하였다. 동사의 유사도를 측정하기 위하여 개별 동사들은 벡터로 표현하였고, 벡터의 원소는 해당 동사가 다른 동사와 세분화된 격틀을 공유하는 정도로 하였다. 실험에서는 두 용언 사전에서 개별적으로 위의 과정을 진행하여 각 동사와 유사한 동사들을 추출하였다.

  • PDF

Comparison of clustering methods of microarray gene expression data (마이크로어레이 유전자 발현 자료에 대한 군집 방법 비교)

  • Lim, Jin-Soo;Lim, Dong-Hoon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.1
    • /
    • pp.39-51
    • /
    • 2012
  • Cluster analysis has proven to be a useful tool for investigating the association structure among genes and samples in a microarray data set. We applied several cluster validation measures to evaluate the performance of clustering algorithms for analyzing microarray gene expression data, including hierarchical clustering, K-means, PAM, SOM and model-based clustering. The available validation measures fall into the three general categories of internal, stability and biological. The performance of clustering algorithms is evaluated using simulated and SRBCT microarray data. Our results from simulated data show that nearly every methods have good results with same result as the number of classes in the original data. For the SRBCT data the best choice for the number of clusters is less clear than the simulated data. It appeared that PAM, SOM, model-based method showed similar results to simulated data under Silhouette with of internal measure as well as PAM and model-based method under biological measure, while model-based clustering has the best value of stability measure.

Clustering Weather Data for Study of Local Distinction (기상자료 군집화를 통한 지형적 특성 연구)

  • Kim, Min-Jin;Lee, Il-Byeong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.412-415
    • /
    • 2008
  • 매일 쏟아져 나오는 방대한 양의 기상자료는 현재의 대기상태를 대표하기도 하지만 그 지역의 지형적 특성을 나타내고 있다. 이번 연구는 수원지역의 일일 기상자료를 토대로 지형적 특성과 그에 따른 기상현상(바람, 안개)알고자 한다. K-means를 이용 특정 기상현상끼리 군집화하여 지형적 특성과 비교하였다.

  • PDF

봄철 나로도 협수로 인근해역의 수질환경과 식물플랑크톤 군집 분포특성

  • 윤양호;한명일
    • Proceedings of the Korean Society of Fisheries Technology Conference
    • /
    • 2000.05a
    • /
    • pp.196-197
    • /
    • 2000
  • 한국 남해 중앙부에 위치하는 나로도 연안해역은 대규모 적조 형성으로 막대한 수산피해를 발생시키고 있는 Cochlodinium polykrikoides 적조의 매년 첫 발생해역으로 관심이 모아지고 있을 뿐만 아니라(국립수산진흥원, 1998), 주변해역의 수괴 확장정도에 의해 복잡한 해양환경 특성을 나타내는 곳이기도 하다(양 등, 1999). 따라서 본 해역의 해양환경 및 생물분포는 시·공간적으로 매우 다른 특성을 나타낼 것으로 판단되어, 본 연구에서는 이른봄 나로도 인근해역의 해양환경 특성 및 식물플랑크톤 군집의 분포에 영향을 미치는 환경요인에 대하여 고찰한다(윤과 박, 2000). (중략)

  • PDF

The Effect of Feeding Managements on Physiological Characteristics, Productivity and Characteristics of the Loin Muscle of Jeju Cross-bred Horses (사양환경이 제주산마(제주마×더러브렛)의 생리적 특성과 생산성 및 등심근 특성에 미치는 영향)

  • Woo, Jae-Hoon;Son, Jun-Kyu;Yang, Byung-Chul;Kim, Nam-Young;Shin, Sang-Min;Shin, Moon-Cheol;Yoo, Ji-Hyun;Park, Nam Geon
    • Journal of The Korean Society of Grassland and Forage Science
    • /
    • v.38 no.4
    • /
    • pp.273-279
    • /
    • 2018
  • This experiment was conducted to investigate the effects of individual management and group management of Jeju cross-bred horses on the physiological characteristics, productivity, and characteristics of the loin muscle of the horse meat. Sixteen herds of Jeju cross-bred horses older than 44 months were selected as experimental subjects. The experiment was conducted by dividing the herds into eight herds for individual management and another eight herds for group management. Herds were fed with concentrated feed of 2.5% of the body weight for four times a day and roughage and water were fed ad libitum. In the 12th week, the intestinal pH was statistically significantly lower with group management than with individual management (p<0.05). However, no symptoms of colic were observed. With regard to the general composition of the loin muscle, fat content was a statistically significant difference between the 7.83% with individual management and 5.65% with group management (p<0.05), indicating that individual management is more effective than group management in terms of fattening. In conclusion, feeding a concentrated feed at a level of 2.5% of body weight with individual management during fattening of Jeju cross-bred horses could be utilized as a fattening method.

Patterning Waterbirds Occurrences at the Western Costal Area of the Korean Peninsula in Winter Using a Self-organizing Map (인공신경회로망을 이용한 서해안 겨울철 수조류의 발생특성 유형화)

  • Park, Young-Seuk;Lee, Who-Seung;Nam, Hyung-Kyu;Lee, Ki-Sup;Yoo, Jeong-Chil
    • Korean Journal of Environmental Biology
    • /
    • v.25 no.2
    • /
    • pp.149-157
    • /
    • 2007
  • This study focused on patterning waterbirds occurrences at the western costal area of the Korean Peninsula in winter and relating the occurrence patterns with their environmental factors. Waterbird communities were monitored at 10 different study areas, and the composition of land cover as environmental factors was estimated at each study area. Overall dabbling ducks were the most abundant with 84% of total individuals, followed by shorebird and diving ducks. Species Anae platyrhynchos was the first dominant species, and Anas formosa was the second one. Self-organizing map (SOM), an unsupervised artificial neural network, was applied for patterning wintering waterbird communities, and identified 6 groups according to the differences of communities compositions. Each group reflected the differences of indicator species as well as their habitats.

Analysis of spatial mixing characteristics of water quality at the confluence using artificial intelligence (인공지능을 활용한 합류부에서 수질의 공간혼합 특성 분석)

  • Lee, Seo Gyeong;Kim, Dongsu;Kim, Kyungdong;Kim, Young Do;Lyu, Siwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.482-482
    • /
    • 2022
  • 하천의 합류부에서는 수질이 다른 유체가 혼합하여 합류 전과 다른 특성을 보인다. 하천의 합류부에서 수질을 효율적으로 관리하기 위해서는 수질의 공간적인 혼합 특성을 규명하는 것이 중요하다. 합류부에서 수질의 공간적인 혼합 특성을 분석하기 위해 본 연구에서는 토폴로지 데이터 분석(topological data analysis, TDA), 자기 조직화 지도(Self-Organizing Map, SOM), k-평균 알고리즘(K-means clustering algorithm) 세 가지 기법을 이용하였다. 세 가지 기법을 비교하여 어떤 알고리즘이 합류부의 수질 변화 특성을 더 뚜렷하게 나타내는지 분석하였다. 수질 변화 비교 인자들은 pH, chlorophyll, DO, Turbidity 등이 있고, 수질 인자들은 YSI를 활용해 측정하였다. 자료의 측정 지역은 낙동강과 황강이 합류하는 지역이며, 보트에 YSI 장비를 부착하고 횡단하여 측정하였다. 측정한 데이터를 R 프로그램을 통해 세 가지 기법을 적용시켜 수질 변화 비교를 분석한다. 토폴로지 데이터 분석(topological data analysis, TDA)은 거대하고 복잡한 데이터로부터 유의미한 정보를 추출하는 데 사용하고, 자기조직화지도(Self-Organizing Map, SOM) 기법은 차원 축소와 군집화를 동시에 수행한다. k-평균 알고리즘(K-means clustering algorithm) 기법은 주어진 데이터를 k개의 클러스터로 묶는 머신러닝 비지도학습에 속하는 알고리즘이다. 세 가지 방법들의 주목적은 클러스터링이다. 클러스터 분석(Cluster analysis)이란 주어진 데이터들의 특성을 고려해 동일한 성격을 가진 여러 개의 그룹으로 대상을 분류하는 데이터 마이닝의 한 방법이다. 군집화 방법들인 TDA, SOM, K-means를 이용해 합류 지역의 수질 특성들을 클러스터링하여 수질 패턴들을 분석해 하천 수질 오염을 방지할 수 있을 것이다. 본 연구에서는 토폴로지 데이터 분석(topological data analysis, TDA), 자기조직화지도(Self-Organizing Map, SOM), k-평균 알고리즘(K-means clustering algorithm) 세 가지 기법을 이용하여 합류부에서의 수질 특성을 비교하며 어떤 기법이 합류의 특성을 더욱 뚜렷하게 나타내는지 규명했다. 합류의 특성을 군집화 방법을 이용해 알게 된다면, 합류부의 수질 변화 패턴을 다른 합류 지역에서도 적용할 수 있을 것으로 기대된다.

  • PDF

Study on analysis with partial least square path modeling using multiple factor analysis (다중요인분석을 이용한 부분 최소제곱 경로 모형에 대한 고찰)

  • Park, Ri-Ra;Lee, Eun-Kyung
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.3
    • /
    • pp.315-328
    • /
    • 2018
  • In this paper, we examine the methodology to predict consumer preferences using several groups of attributes of products and application to real data. In the food industry, studies are in progress to investigate the relationship between product attributes and consumer preferences; consequently, various methodologies are proposed. Among these methodologies, we consider multiple factor analysis (MFA). The result of the MFA enable the division of consumers into four clusters with similar liking and the defining of preference characteristics for each cluster. Also, using the results of multiple factor analysis, we find the partial least squares path model to predict consumer preferences through the characteristics of the product and the characteristics evaluated by consumers. We can understand the relationship between the cluster of consumers and the preferred/undesirable characteristics of products through the partial least squares path model applied to two clusters with different liking. When multiple factor analysis is used in the partial least squares path model, it is possible to investigate relationships between products and consumers by analyzing product characteristics and consumer preferences simultaneously. The results can be applied to product developments and sales which makes this methodology important and useful.

Plant Community Structure Snalysis in Chohangyoung Valley of Soraksan National Park (설악산 국립공원 저항령계곡 식물군집구조)

  • 이경재;조현서;한봉호
    • Korean Journal of Environment and Ecology
    • /
    • v.10 no.2
    • /
    • pp.251-269
    • /
    • 1997
  • To investigate the plant community structure of Chohangyoung valley in Soraksan National Park, thirty nine plots(each size was 100m$^{2}$) were set up and surveyed and to analyze the plant community characteristics of valley area and slope area, twenty five plots in five sites were set up and surveyed. According to DCA ordination techniques, the communities were six divided into community types, which were Pinus densiflora community, P. densiflora-Populus maximowiczii community, Po. maximowiczii-P. densiflora community, Po. maszimowiczii community, Fraxinus rhyuchophylla community, Quercus serrata community. Q. serrata community was only distrivuted at slope area and the others were distributied at valley area. The successional trend of six communities was not clearly inferred. Shannon's diversity was 0.9458~1.1769(unit area:500m$^{2}$), and soil acidity was pH 4.65~6.09 in surveyed areas. According to the belt-transect analysis, the dominant species of valley area were P. densiflora, Po. maximowiczii, but the dominant species of slope area was Q. serrata.

  • PDF