• 제목/요약/키워드: 군집형

검색결과 676건 처리시간 0.028초

엔트로피 거리와 SVM를 이용한 SNP 군집분석과 천식 유형 예측 (Cluster Analysis of SNPs with Entropy Distance and Prediction of Asthma Type Using SVM)

  • 이중섭;신기섭;위규범
    • 정보처리학회논문지B
    • /
    • 제18B권2호
    • /
    • pp.67-72
    • /
    • 2011
  • 단일염기다형성은 인간 게놈 구조 연구의 중요한 도구이다. 대량의 유전자 표현형 데이터에서의 군집 분석은 생물학적으로 연관이 있는 유전자 군을 발견하거나 유전자간 상호작용 네트워크를 생성하는데 유용하다. 본 논문에서는 엔트로피 거리를 기반으로 계층적 군집 분석 방법을 사용하여 천식환자군과 정상대조군의 군집을 형성하고 비교하였고 5개짜리 군집에서 두 군의 의미 있는 차이점이 나타남을 보였다. 천식환자군의 각 군집에서의 대표 SNP들의 조합의 질병 예측 정확도를 지지벡터기계를 이용하여 측정하여, 천식의 두 유형을 진단할 수 있는 최상의 조합을 찾았다. 최상의 조합은 유전자 ALOX12에 있는 단일염기다형성을 포함한 5개로 구성된 모델이며 66.41%의 아스피린 내성 천식 질병에 대한 예측 정확도를 갖는다.

벌칙가능도함수를 이용한 1인가구와 저소득 독거노인의 공간군집 탐색 (Investigating spatial clusters of single-person households and low-income elderly single-person using penalized likelihood)

  • 송은정;이우주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1257-1260
    • /
    • 2017
  • 최근 1인 가구가 급격히 증가하고 있으며, 그 증가의 원인 중 하나는 독거노인 수의 증가이다. 이러한 거주형태 변화는 필연적으로 정책적인 변화를 요구하므로 1인 가구의 공간적인 분포를 파악하는 것은 중요한 문제로 볼 수 있다. 또한 공간적인 군집이 나타나게 된 요인들에 대해 이해하는 것은 효율적인 정책 수립에 유리 할 것이다. 본 연구에서는 사회경제적인 불평등을 반영하는 박탈지수 (deprivation index)를 설명변수로 고려하면서 1인 가구와 저소득 독거노인에 대한 공간 군집 탐색을 하였다. 이를 위해서 fused lasso를 이용한 공간 군집 탐색방법이 사용되었다. 이 방법을 통하여 낮은 사회경제적 수준이 l인가구와 저소득 독거노인의 수에 얼마나 영향을 미치는지 확인하고, 박탈정도의 효과가 보정된 공간군집을 살펴보았다. 또한 정수형 자료에서 벌칙가능도함수를 이용한 공간 군집 탐색을 할 수 있도록 구현된 R패키지의 사용법을 자세히 소개하였다.

독도 암반조간대 무척추동물군집의 공간적 분포 (Spatial Distribution of Marine Invertebrate Communities on Intertidal Rocky Shore in Dokdo)

  • 차재훈;김미경
    • 환경생물
    • /
    • 제30권2호
    • /
    • pp.143-150
    • /
    • 2012
  • 독도 조간대 해양무척추동물의 공간적인 분포를 밝히기 위해서 2009년부터 2011년까지 10차례에 걸쳐 현장조사를 실시하였다. Bray-Curtis 유사도를 이용한 집괴분석을 통하여 3개의 군집을 밝혔으며, 첫 번째 군집은 자갈해변군집으로 이동성 복족류인 보말고둥과 깜장각시고둥 그리고 밤고둥이 우점종으로 나타났으며, 두 번째 군집은 잔잔한 암반해안으로 보말고둥, 큰뱀고둥 그리고 군소가 우점종으로 나타났으며, 마지막 군집은 두 종의 고착형 절지동물인 검은큰따개비와 거북손이 우점하는 것으로 나타났다. 이들 군집은 독도 암반조간대의 기질의 종류와 수리역학적인 조건에 의해 결정되었으며, 환경적인 조건이 해양생물의 생물다양성을 유지하고 증가시키는데 중요한 역할을 하는 것으로 보인다.

고창 운곡습지의 식물군락 다양성과 분포 특성 (Diversity and Distribution of Plant Communities on the Ungok Wetland in Gochang)

  • 김종원;이승은;류태복
    • 생태와환경
    • /
    • 제50권3호
    • /
    • pp.295-304
    • /
    • 2017
  • 습지보호지역인 전북 고창 운곡습지의 현존식생에 대한 군락분류와 군락분포를 규명하였다. 전통적인 식물사회학적 방법과 국제식생명명규약에 따라 단위식생을 분류하고 명명하였다. 서식처 기반의 식생 다양성은 침수식생으로부터 연목림식생에 이르기까지 7가지 상관식생형에서 총 88분류군으로 이루어진 12가지 단위식생이 분류되었다: 버드나무-골풀군락, 선버들-이삭사초군집, 달뿌리풀-갈퀴덩굴군락, 갈대군집, 매자기군집, 애기부들-나도겨풀군락, 골풀-별날개골풀군락, 나도겨풀군집, 마름-어리연꽃군집 (전형아군집과 네가래아군집(신칭), 가시연꽃변군집 포함), 연꽃군락, 참통발군락, 말즘군집. 축척 1 : 5,000의 지형도를 바탕으로 현존식생도를 제작하여 식생 공간분포를 기재하였다. 산간 선상지 습지를 포함한 배후습지와 원수대식생역의 서식처-단위식생 대응성에 관한 본 연구의 결과는 운곡습지 생태 관리의 바탕 정보를 제공한다.

자기조직화 지도(SOM) 인공신경망 모형을 이용한 벤쳐기업의 지식경영 유형 세분화에 관한 연구-코스닥 상장기업을 대상으로- (A Self-Organizing Map Neural Network Approach to Segmenting Knowledge Management Type of Venture Businesses in KOSDAG)

  • 이건창;권순재;이광용
    • 지능정보연구
    • /
    • 제7권2호
    • /
    • pp.95-115
    • /
    • 2001
  • 본 논문에서는 우리나라 코스닥시장에 상장된 벤처기업을 대상으로 하여 지식경영 유형을 세분화 하기 위한 방법론을 제시한다. 이 방법론은 우선, 해당 벤처기업에 대하여 설문조사를 통하여 이들 회사의 지식경영 요인을 도출한 다음, 이들 요인 값을 가지고 비감독학습 인공신경망 모형인 SOM을 가지고 4개의 의미 있는 군집을 유도하였다. 이들 군집은 벤처기업이 수행하는 다양한 지식경영 유형을 나타내는 것으로 판명되었으며, 이들 유형은 각각 하이테크형, 조직지식중심형, 정보기술 중심형, 단순형으로 분류된다.

  • PDF

기업의 기술 특성에 따른 산학협력 비교 연구 (Factor Analysis on the Impact of Technical Cooperation Between Large firms and SMEs in South Korea)

  • 박문수;이호형
    • 정보화연구
    • /
    • 제9권2호
    • /
    • pp.199-207
    • /
    • 2012
  • 기업의 개방형 혁신의 관점에서 산학협력은 중요하게 논의되고 있다. 하지만 기업의 특성(산업특성, 혁신특성, 성장단계별 특성 등)에 따라 산학협력의 수요와 실행은 다르고 그에 따른 다른 접근이 필요하다. 본 연구에서는 세 가지 기업 특성을 군집분석을 통해 세 가지 군집(혁신형중소기업군, 일반중소기업군, 대기업군)으로 유형화하고, 그에 따른 산학협력의 수요와 실행을 분석하였다. 분석 결과 혁신형 기업군은 신기술개발에 초점을 맞추고 있으며, 일반 중소기업과 대기업 모두 인력양성에 높은 관심이 있는 것으로 확인되었다. 그에 따른 정책적 시사점은 다음과 같다. 기업 특성을 고려한 산학협력 정책 지원이 필요하다. R&D와 인력양성을 구분하여 산학협력을 추진함으로써 기업 특성의 비교 우위를 통한 산학협력 효율화가 필요하고, 혁신형 기업 지원을 위한 R&D분야 산학협력 활성화에 초점을 맞출 필요가 있다.

음소 군집화 기법을 이용한 어휘독립음성인식의 음소모델링 (Subword Modeling of Vocabulary Independent Speech Recognition Using Phoneme Clustering)

  • 구동욱;최준기;윤영선;오영환
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.33-36
    • /
    • 2000
  • 어휘독립 고립단어인식은 미리 훈련된 부단어(sub-word) 단위의 음향모델을 이용하여 수시로 변하는 인식대상어휘를 인식하는 것이다. 본 논문에서는 소용량 음성 데이터베이스를 이용하여 어휘독립음성인식 시스템을 구성하였다. 소용량 음성 데이터베이스에서 미관측문맥 종속형 부단어에 대한 처리에 효과적인 백오프 기법을 이용한 음소 군집화 방법으로 문턱값을 변화시키며 인식실험을 수행하였다. 그리고 훈련용 데이터의 부족으로 인하여 문맥 종속형 부단어 모델이 훈련용 데이터베이스로 편중되는 문제를 deleted interpolation 방법을 이용하여 문맥 종속형 부단어 모델과 문맥 독립형 부단어 모델을 병합함으로써 해결하였다. 그 결과 음성인식의 성능이 향상되었다.

  • PDF

계층적 군집분석을 이용한 반도체 웨이퍼의 불량 및 불량 패턴 탐지 (Wafer bin map failure pattern recognition using hierarchical clustering)

  • 정주원;정윤서
    • 응용통계연구
    • /
    • 제35권3호
    • /
    • pp.407-419
    • /
    • 2022
  • 반도체는 제조 공정이 복잡하고 길어 결함이 발생될 때 빠른 탐지와 조치가 이뤄져야 결함으로 인한 손실을 최소화할 수 있다. 테스트 공정을 거쳐 구성된 웨이퍼 빈 맵(WBM)의 체계적인 패턴을 탐지하고 분류함으로써 문제의 원인을 유추할 수 있다. 이 작업은 수작업으로 이뤄지기 때문에 대량의 웨이퍼를 단 시간에 처리하는 데 한계가 있다. 본 논문은 웨이퍼 빈 맵의 정상 여부를 구분하기 위해 계층적 군집 분석을 활용한 새로운 결함 패턴 탐지 방법을 제시한다. 제시하는 방법은 여러 장점이 있다. 군집의 수를 알 필요가 없으며 군집분석의 조율 모수가 적고 직관적이다. 동일한 크기의 웨이퍼와 다이(die)에서는 동일한 조율 모수를 가지므로 대량의 웨이퍼도 빠르게 결함을 탐지할 수 있다. 소량의 결함 데이터만 있어도 그리고 데이터의 결함비율을 가정하지 않더라도 기계학습 모형을 훈련할 수 있다. 제조 특성상 결함 데이터는 구하기 어렵고 결함의 비율이 수시로 바뀔 수 있기 때문에 필요하다. 또한 신규 패턴 발생시에도 안정적으로 탐지한다. 대만 반도체 기업에서 공개한 실제 웨이퍼 빈 맵 데이터(WM-811K)로 실험하였다. 계층적 군집 분석을 이용한 결함 패턴탐지는 불량의 재현율이 96.31%로 기존의 공간 필터(spatial filter)보다 우수함을 보여준다. 결함 분류는 혼합 유형에 장점이 있는 계층적 군집 분석을 그대로 사용한다. 직선형과 곡선형의 긁힘(scratch) 결함의 특징에 각각 주성분 분석의 고유값과 2차 다항식의 결정계수를 이용하고 랜덤 포레스트 분류기를 이용한다.

엣지컴퓨팅기반 군집추천 알고리즘을 이용한 지능형 디지털 사이니지 플랫폼 설계 (Intelligent Digital Signage Platform Design Using Edge Computing Based Cluster Recommendation Algorithm)

  • 이기훈;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1166-1168
    • /
    • 2019
  • 본 논문은 엣지컴퓨팅 환경에서 딥러닝기반 추천모델을 이용한 지능형 디지털 사이니지 플랫폼을 제안한다. 제안하는 플랫폼은 서버와 엣지로 구성되어 있다. 서버는 데이터를 관리하고, 광고추천 모델을 학습시키며, 엣지는 학습된 광고추천 모델을 이용하여 실시간으로 광고될 상품을 결정한다. 광고추천 모델은 상품을 선별하는 단계와 구매확률을 예측하는 단계로 구성되어 있다. 선별단계에서는 DNN에 벡터화된 사용자 기본정보와 상품 메타데이터를 입력하여 구매할 만한 상품을 도출한다. 최종적으로 군집의 예측된 구매확률을 이용하여 가장 적합한 광고를 선정한다. 제안하는 시스템은 서버와 통신하지 않고 엣지에서 학습된 모델로 광고를 결정한다. 이를 다수의 사용자에게 즉각적인 반응을 필요로 하는 디지털 사이니지에 적용했다.

데이터 마이닝 기법을 이용한 직무교육 성취집단 예측모형 개발

  • 곽기효;서용무
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.318-323
    • /
    • 2007
  • 국방부에서 발표한 ‘국방개혁에 관한 법률’ 에 따라 2014년까지 현역병들에 대한 복무기간이 단계적으로 단축될 예정이다. 이에 따라 좀 더 효율적인 직무교육 방안이 필요하게 되어, ‘차등제 교육’을 시행하고 있다. 이 교육의 효과를 향상시키기 위해서는 훈련병들의 예상 학업 성취도를 미리 정확하게 예측하는 것이 필수적이다. 따라서, 본 연구에서는 입교 초기에 얻을 수 있는 신병들의 제한된 자료들을 이용하여 교육 성취도 예측 모형을 개발하였다. 본 모형의 목적 변수는 ‘일반관리 인원’, ‘집중관리 인원’의 값을 갖는 이진형 성취집단 변수이며, 사용된 기법은 k-means 군집기볍과 Decision Tree 기법을 혼합한 모형, k-means 군집기법과 Neural Network 기법을 혼합한 모형, Decision Tree 모형, Neural Network 모형, Bayesian 모형, 그리고 Logistic 모형 등을 사용하였다. 그 결과 k-means 군집기법과 Decision Tree를 혼합한 모형이 가장 좋은 예측력올 보이는 것으로 나타났다. 이러한 교육 성취집단 예측 모형은 향후 군에서 이루어지는 다양한 교육 프로그램에 적극적으로 이용될 수 있을 것으로 기대된다.

  • PDF