• 제목/요약/키워드: cluster identification

검색결과 258건 처리시간 0.024초

Microsatellite DNA를 이용한 말 집단의 유전적 특성 및 유연 관계 (Genetic Relationship and Characteristics Using Microsatellite DNA Loci in Horse Breeds.)

  • 조길재
    • 생명과학회지
    • /
    • 제17권5호
    • /
    • pp.699-705
    • /
    • 2007
  • 말 6개 품종 192두를 대상으로 17개의 microsatellite DNA marker를 이용하여 유전자(DNA)형을 분석하여 비교한 결과 제주마에서 각 marker별로 대립유전자의 수는 5-10개(평균 7.35개)로 분포하였고 제주마에서 관찰된 대립유전자는 총 125개가 관찰되어 평균 좌위 당 7.35개로서 몽고마의 130개(평균 7.65개)보다는 낮은 수치였다. 또한 AHT5 marker에서 대립유전자 P, ASB23 marker에서 대립유전자 Q와 R, CA425 marker에서 대립유전자 H, HMS3 marker에서 대립유전자 S, HTG10 marker에서 대립유전자 J, LEX3 marker에서 대립유전자 J 등 6개 marker에서 7개의 특이 대립유전자가 관찰되었다. 관찰된 이형접합성(observed heterozygosity)과 기대된 이형접합성(expected heterozygosity)은 각각 0.429-0.905(평균 0.703)와 0.387-0.841(평균 0.702)로 관찰되었고 다량정보량(PIC)은 0.354(HTG6)-0.816(LEX3)로서 평균 0.659로 나타났으며 17개 marker중 AHT4, AHT5, CA425, HMS2, HMS3, HTG10, LEX3, VHL20 marker 등이 다량정보량(PIC) 0.7 이상을 나타내었다. 17개 marker에 대한 전체 부권부정율(친부마 혹은 친모마 하나의 유전자형을 알고 있을 경우)을 제주마에 적용 시 99.99%로 나타났다. 말 6개 품종별로 분석하였을 때 평균 대립유전자의 수는 7.64개(몽고마)-4.23개(미니츄어 말)로 분포하였고 17개 marker 전체에서는 153개의 대립유전자가 검출되었다. 품종별로 분석한 결과 기대된 이형접합성(expected heterozygosity)과 관찰된 이형접합성(observed heterozygosity)은 각각 0.7950$\pm$0.0141(몽고마)-0.6751$\pm$0.0378(미니츄어 말), 0.7135$\pm$0.0180(제주경주마)-0.5621$\pm$0.0401(미니츄어 말)로 나타났다. 말 6개 품종을 17개 microsatellite marker로 분석한 결과 몽고마, 제주마, 제주경주마 등의 순으로 높은 유전적 다양성을 보였다. 제주마와 가장 가까운 유전적 유연 관계를 나타낸 집단은 몽고마로서 Da genetic distance에서 0.1517로 나타났고, 제주경주마와는 0.2628의 유전적 거리를 보였다.

시스템적인 군집 확인과 뉴스를 이용한 주가 예측 (Predicting stock movements based on financial news with systematic group identification)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.1-17
    • /
    • 2019
  • 빅데이터 시대에 정보의 양이 급증하고, 그중 많은 부분을 차지하는 문자열 정보를 정량화하여 의미를 찾아 낼 수 있는 인공지능 방법론이 함께 발전하면서, 텍스트 마이닝을 통해 주가 예측에 적용해 온라인 뉴스로 주가를 예측하려는 시도가 다양해지고 있다. 이러한 주가 예측의 방법은 대개 예측하고자 하는 기업의 뉴스로 주가를 예측하는 방식이다. 하지만 특정 회사의 뉴스만이 그 회사의 주가에 영향을 주는 것이 아니라, 그 회사와 관련성이 높은 회사들의 뉴스 또한 주가에 영향을 줄 수 있다. 그러나 관련성이 높은 기업을 찾는 것은 시장 전반의 공통적인 영향과 무작위 신호 때문에 쉽지 않다. 따라서 기존 연구들은 주로 미리 정해진 국제 산업 분류 표준에 기반을 둬 관련성이 높은 기업을 찾았다. 하지만 최근 연구에 따르면, 국제 산업 분류 표준은 섹터에 따라 동질성이 다르며, 동질성이 낮은 섹터는 그들을 모두 함께 고려하여 주가를 예측하는 것이 성능에 악영향을 줄 수 있다는 한계점을 가진다. 이러한 한계점을 극복하기 위해, 본 논문에서는 주가 예측 연구에서 처음으로 경제물리학에서 주로 사용되는 무작위 행렬 이론을 사용하여 시장 전반 효과와 무작위 신호를 제거하고 군집 분석을 시행하여 관련성이 높은 회사를 찾는 방법을 제시하였다. 또한, 이를 기반으로 관련성이 높은 회사의 뉴스를 함께 고려하며 다중 커널 학습을 사용하는 인공지능 모형을 제시한다. 본 논문의 결과는 무작위 행렬 이론을 통해 시장 전반의 효과와 무작위 신호를 제거하여 정확한 상관 계수를 찾아 군집 분석을 시행한다면 기존 연구보다 더 좋은 성능을 보여 준다는 것을 보여준다.

부착돌말영양지수(TDI)를 활용한 습지환경 평가 (Wetland Habitat Assessement Utilizing TDI(Trophic Diatom Index))

  • 김성기;최종윤
    • 한국환경생태학회지
    • /
    • 제33권5호
    • /
    • pp.525-538
    • /
    • 2019
  • 낙동강에 위치한 신규조성 습지의 현황 파악 및 관리 방안 마련을 위한 기초연구의 일환으로 부착규조류의 서식현황과 종다양성을 분석하고 부착돌말영양지수(TDI, Trophic Diatom Index)의 적용가능성을 평가하였다. 조사 기간 동안, 부착규조류는 총 38과 173종이 출현하였으며, 봄과 가을에 각각 156종, 154종으로 비슷한 종수를 나타냈다. 자기조직화지도(SOM)를 활용한 분석 결과, 부착규조류의 분포는 각 습지의 영양염류의 농도와 강우 등의 환경요인에 따라 영향 받는 것으로 나타났다. 클러스터 1의 경우, 대부분 가을시기이며, 총인과 총질소 등의 영양염류의 농도와 부착규조류의 종수 및 풍부도가 낮음에도 불구하고, 부착돌말영양지수가 높은 지점들로 구성되었다. 이와 반대로, 클러스터 4는 봄시기의 지점들이며, 총질소가 높음에도 불구하고 부착돌말영양지수가 낮은 특징을 보였다. 신규조성 습지 대부분이 유입 유출구 기능이 원활하지 않은 점을 감안하면, 여름철에 증가된 유량은 가을철에 영양염류 값을 감소시키며, 탁도 증가로 인해 빛의 유입이 원활하지 않아 부착규조류의 종수와 풍부도가 낮아진다. 이와 반대로, 봄철에는 낮은 수위로 인해 부착규조류가 부착할 수 있는 기질표면이 부족하며, 호오탁성 종이 정착 및 발달하기에 이른 시기이기 때문에 부착돌말영양지수 값이 낮게 측정된다. 다양한 기존 연구에서, 부착돌말영양지수를 서식환경 및 수질 평가지표로 활용하고 있으나, 본 습지는 흐름이 적고 정체수역에 가깝기 때문에 대부분 영양염류 농도가 높아 부착돌말영양지수의 평가지표 가치성은 낮은 것으로 판단된다. 여름강우나 유입 유출 조절부의 기능이 부착규조류의 종다양성과 분포에 영향을 미치는 점을 종합적으로 감안한 지속적이고 주기적인 추가 조사가 필요하다.

ICT 인프라 이상탐지를 위한 조건부 멀티모달 오토인코더에 관한 연구 (A Study of Anomaly Detection for ICT Infrastructure using Conditional Multimodal Autoencoder)

  • 신병진;이종훈;한상진;박충식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.57-73
    • /
    • 2021
  • ICT 인프라의 이상탐지를 통한 유지보수와 장애 예방이 중요해지고 있다. 장애 예방을 위해서 이상탐지에 대한 관심이 높아지고 있으며, 지금까지의 다양한 이상탐지 기법 중 최근 연구들에서는 딥러닝을 활용하고 있으며 오토인코더를 활용한 모델을 제안하고 있다. 이는 오토인코더가 다차원 다변량에 대해서도 효과적으로 처리가 가능하다는 것이다. 한편 학습 시에는 많은 컴퓨터 자원이 소모되지만 추론과정에서는 연산을 빠르게 수행할 수 있어 실시간 스트리밍 서비스가 가능하다. 본 연구에서는 기존 연구들과 달리 오토인코더에 2가지 요소를 가미하여 이상탐지의 성능을 높이고자 하였다. 먼저 다차원 데이터가 가지고 있는 속성별 특징을 최대한 부각하여 활용하기 위해 멀티모달 개념을 적용한 멀티모달 오토인코더를 적용하였다. CPU, Memory, network 등 서로 연관이 있는 지표들을 묶어 5개의 모달로 구성하여 학습 성능을 높이고자 하였다. 또한, 시계열 데이터의 특징을 데이터의 차원을 늘리지 않고 효과적으로 학습하기 위하여 조건부 오토인코더(conditional autoencoder) 구조를 활용하는 조건부 멀티모달 오토인코더(Conditional Multimodal Autoencoder, CMAE)를 제안하였다. 제안한 CAME 모델은 비교 실험을 통해 검증했으며, 기존 연구들에서 많이 활용된 오토인코더와 비교하여 AUC, Accuracy, Precision, Recall, F1-score의 성능 평가를 진행한 결과 유니모달 오토인코더(UAE)와 멀티모달 오토인코더(Multimodal Autoencoder, MAE)의 성능을 상회하는 결과를 얻어 이상탐지에 있어 효과적이라는 것을 확인하였다.

Genetic Variation and Polymorphism in Rainbow Trout, Oncorhynchus mykiss Analysed by Amplified Fragment Length Polymorphism

  • Yoon, Jong-Man;Yoo, Jae-Young;Park, Jae-Il
    • 한국양식학회지
    • /
    • 제17권1호
    • /
    • pp.69-80
    • /
    • 2004
  • The objective of the present study was to analyze genetic distances, variation and characteristics of individuals in rainbow trout, Oncorhynchus mykis using amplified fragment length polymorphism (AFLP) method as molecular genetic technique, to detect AFLP band patterns as genetic markers, and to compare the efficiency of agarosegel electrophoresis (AGE) and polyacrylamide gel electrophoresis (PAGE), respectively. Using 9 primer combinations, a total of 141 AFLP bands were produced, 108 bands (82.4%) of which were polymorphic in AGE. In PAGE, a total of 288 bands were detected, and 220 bands (76.4%) were polymorphic. The AFLP fingerprints of AGE were different from those of PAGE. Separation of the fragments with low molecular weight and genetic polymorphisms revealed a distinct pattern in the two gel systems. In the present study, the average bandsharing values of the individuals between two populations apart from the geographic sites in Kangwon-do ranged from 0.084 to 0.738 of AGE and PAGE. The bandsharing values between individuals No.9 and No. 10 showed the highest level within population, whereas the bandsharing values between individuals No.5 and No.7 showed the lowest level. As calculated by bandsharing analysis, an average of genetic difference (mean$\pm$SD) of individuals was approximately 0.590$\pm$0.125 in this population. In AGE, the single linkage dendrogram resulted from two primers (M11+H11 and M13+H11), indicating six genetic groupings composed of group 1 (No.9 and 10), group 2 (No. 1, 4, 5, 7, 10, 11, 16 and 17), group 3 (No. 2, 3, 6, 8, 12, 15 and 16), group 4 (No.9, 14 and 17), group 5 (No. 13, 19, 20 and 21) and group 6 (No. 23). In AGE, the genetic distances among individuals of between-population ranged from 0.108 to 0.392. In AGE, the shortest genetic distance (0.108) displaying significant molecular differences was between individuals No.9 and No. 10. Especially, the genetic distance between individuals No. 23 and the remnants among individuals within population was highest (0.392). Additionally, in the cluster analysis using the PAGE data, the single linkage dendrogram resulted from two primers (M12+H13 and M11+H13), indicating seven genetic groupings composed of group 1 (No. 15), group 2 (No. 14), group 3 (No. 11 and 12), group 4 (No.5, 6, 7, 8, 10 and 13), group 5 (No.1, 2, 3 and 4), group 6 (No.9) and group 7 (No. 16). By comparison with the individuals in PAGE, genetic distance between No. 10 and No. 7 showed the shortest value (0.071), also between No. 16 and No. 14 showed the highest value (0.242). As with the PAGE analysis, genetic differences were certainly apparent with 13 of 16 individuals showing greater than 80% AFLP-based similarity to their closest neighbor. The three individuals (No. 14, No. 15 and No. 16) of rainbow trout between two populations apart from the geographic sites in Kangwon-do formed distinct genetic distances as compared with other individuals. These results indicated that AFLP markers of this fish could be used as genetic information such as species identification, genetic relationship or analysis of genome structure, and selection aids for genetic improvement of economically important traits in fish species.

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

지오태그 이미지를 활용한 북한산국립공원의 경관미 평가 및 맵핑 (Assessing and Mapping the Aesthetic Value of Bukhansan National Park Using Geotagged Images)

  • 김지영;손용훈
    • 한국조경학회지
    • /
    • 제49권4호
    • /
    • pp.64-73
    • /
    • 2021
  • 본 연구의 목적은 소셜미디어에서 공유되는 지오태그 이미지를 활용하여 이용자가 인지하는 북한산국립공원의 경관미를 평가하는 방법을 제시하는 것이다. 연구에서 제시된 평가 방법은 크게 지오태그 이미지 데이터의 수집, 경관 이미지 식별, 조망대상 확률 지수를 적용한 누적가시도 분석의 과정으로 진행되었다. 본 연구에서 데이터로 사용한 램블러(Ramblr)는 국내에서 많은 이용자를 보유하고 있는 아웃도어 활동 지원 어플리케이션으로, 이로부터 북한산국립공원에 대한 총 110,954장의 지오태그 이미지를 수집하여 경관미 평가에 활용하였다. 수집된 지오태그 이미지들은 Google Vision API를 활용해 이미지의 내용을 해석하였으며, 이후 군집분석을 통해서 전체 수집한 사진을 총 11개의 경관이미지 유형과 9개의 비경관이미지 유형으로 구분하였다. 추출한 경관이미지를 바탕으로 북한산국립공원의 경관 유형을 분석한 결과, 봉우리나 산맥과 같은 지형적 특성과 관련한 이미지 유형이 가장 많은 비중을 차지하였으며, 그 외 임내 경관, 단풍경관, 수경관이 주요한 경관 유형으로 발견되었다. 도출된 경관미 평가맵에서는 이러한 주요 경관 유형의 비중과 특성에 따라 표고 및 경사가 높을수록 전반적으로 높은 경관미를 보였다. 그러나 일부 저지대 및 완경사를 지닌 진입지역에서도 높은 경관미가 확인되었다. 또한 북한산 지역이 도봉산 지역보다 경관미가 높게 평가되었으며, 도봉산 지역의 경우에는 표고 및 경사가 높음에도 불구하고, 상대적으로 낮은 경관미가 확인되었다. 이는 경관미가 물리적인 환경 조건뿐만 아니라, 경관을 조망하는 탐방객들의 휴양 활동과도 크게 관계하고 있음을 보여준다. 이처럼 지오태그 이미지의 누적 가시도를 활용한 경관미 평가는 사람들의 인식에 기반한 경관적 가치를 지리적으로 이해하고, 그 편차를 식별할 수 있도록 함으로써 향후 북한산국립공원의 경관 계획 및 관리에 유용하게 활용될 수 있을 것으로 기대된다.

관우한국생태학적일개예설(关于韩国生态学的一个预设): 기우복장탑배적행위(基于服装搭配的行为) (Typology of Korean Eco-sumers: Based on Clothing Disposal Behaviors)

  • Sung, Hee-Won;Kincade, Doris H.
    • 마케팅과학연구
    • /
    • 제20권1호
    • /
    • pp.59-69
    • /
    • 2010
  • 绿色环保或者环境意识已经成为商业、政府机关, 以及消费者和世界关注的重要问题. 针对这一情况, 韩国政府宣布, 在本世纪初, "环保建设" 将被作为一种用以鼓励与环保相关的商业活动的方式. 不同层次的韩国服装业, 提出了不同的产品环保的绿色计划. 这些服装产品包括有机产品和回收的衣服. 要想使这些公司成功, 他们需要那些, 在做产品购买,使用, 处置时, 将绿色问题(如环境的可持续性发展)作为一个人判断的一个组成部分的顾客的信息. 这些消费者可以被看成是生态学的关注者. 过去的研究已经对消费者对于环保产品的购买意愿进行了检测. 此外, 还研究了影响生态保护者或绿色消费者的因素. 但是, 只是关注生态保护者在处置或者回收利用衣服上与采购绿色产品相比较是不够的. 服装处置行为有多种途径, 消费者可以用淘汰, 传承(例如: 把它送给一个年幼的弟弟), 赠与, 交换, 出售或者简单的把他扔掉等多种方式来暂时或者永久的摆脱闲置的衣服或贷款项目. 因此, 购买环保产品的行为应该结合服装处置的行为, 从而进一步了解消费者的消费行为与对环境的态度. 本项研究的目的在于提供韩国生态保护者从有利于生态学的角度出发来购买和处理衣服的生活方式的相关信息. 本研究的目标有: 1, 基于韩国对服装处置行为进行分类; 2, 调查人 们人口统计数据, 生活方式和服装消费价值观赏的差异; 3, 在环保的时尚物品的购买意愿和影响因素之间进行比较. 自填式的调查问卷是基于以往的研究设置出来的. 问卷包括10项处置衣服的条款, 22项可持续并且健康的生活方式的条款, 以及19项消费观念的条款. 根据利克特模板的五分量表设置. 此外, 购买两个时尚物品的意愿和每个物品属性的11项特征都是根据利克特模板的七分量表而来, 两种制成羊毛套衫的可以从PET识别代码的回收瓶子中创造出来的涤纶织物这两种套衫选自一个韩国和一个美国的户外运动服装的品牌. 我们对每一种产品的简介和颜色都进行了调查, 人口统计学(即性别, 年龄, 婚姻状况, 教育程度, 收入, 职业)也被包括在内. 在2009年5月份, 研究数据通过一个专业网站的调查机构进行采集, 最后有600份调查问卷可供分析, 这个调查的受访者年龄从20到49岁不等, 平均年龄为34岁. 百分之50的调查者为男性, 大约58%的受访者是已婚者, 其中62%的受访者有大学学位. 主要成分分析和因素最大方法差的方法用以识别衣服处理规模的潜在尺度. 共有三个因素生成(比如: 倒卖行为, 捐赠行为, 不回收利用行为). 基于他们处置衣服的方式对受访者进行了分类, 群类分析被使用, 最终得到了三个部分. 不同的消费者, 被分别贴上 "转售集团", "捐资团体" 以及 "不回收组织" 的标签加以分类, 其中98%是正确的分类. 从人口统计学角度来看, 这三个类别的人在性别, 婚姻状况, 职业和年龄上有显著的差异. 健康可持续的生活方式被缩减为以下5个因素: 自我满意度, 家庭定位, 健康问题, 环境问题和自愿的服务. 这是三个群体中健康可持续的生活方式的最显著的差异. 转售集团和捐赠组表现出在健康可持续的生活方式上的相同倾向, 同时, 不回收集团在生活方式方面呈现最低的平均值. 转售和捐赠团体自称享受和满意这种生活和消费方式, 并且能够利用空余的时间陪伴家人. 另外, 这两组的人关心健康和有机食品, 并试图保护能源和资源. 对服装消费的价值观产生主要影响的三个因素是: 个人价值, 社会价值和实用价值. 因素的方差测试表明转售集团和其他两组之间的因素差异最大. 转售集团相比其他价值更关注个人价值和社会价值. 相比之下, 非回收集团比捐赠集团更关注高层次的社会价值. 比较购买环保产品的意愿上, 转售集团表现出最高的购买A类产品的意愿. 另一方面, 捐赠集团则在小市场中表现出购买B类产品的最高意愿. 此外, 平均分数表明, 购买韩国的产品(B类产品)相比购买美国的产品(A类产品)更合韩国人的心意. 多元线性回归分析法确定了对环保产品的购买的意愿对制造业产品属性的影响. 产品的设计, 价格, 贡献, 对环境的保护, 价格, 兼容性是影响转售集团的显著因素, 另外, 以及对自身形象的影响是捐赠团体的重要因素. 对于非回收集团来说, 设计, 价格等因素是相同的, 自我的形象,对环保运动的贡献, 和环境保护也是很重要的. 而价格因素具有显著性的共通性. 对于B类产品来说, 设计, 合理的价格, 形象等因素是同等的重要, 但是不同的组对购买的特征和意愿有不同的倾向. 健康可持续的生活方式以及服装消费的意向对购买A类产品和B类产品的影响同样被我们所关注. 实际操作者的健康状况和个人价值都是影响购买意愿的重要因素; 然而, 在这三个群体中说服的力度都很低. 结果表明, 分类出来的每组处理服装的行为, 显示着不同服装产品的属性, 个人价值, 和实践者的特点, 这些都影响了他们的购买环保产品的意愿, 结果会使生态保护者提出并组织更合理的生态设计的战略决策.