• Title/Summary/Keyword: 클러스터 간 유사도

검색결과 107건 처리시간 0.025초

전국자연환경조사를 활용한 포유류 서식지 유형의 분류 (The Habitat Classification of mammals in Korea based on the National Ecosystem Survey)

  • 이화진;하정욱;차진열;이중효;윤희남;정철운;오홍식;배소연
    • 환경영향평가
    • /
    • 제26권2호
    • /
    • pp.160-170
    • /
    • 2017
  • 본 연구는 2006년부터 2012년까지 수행된 제3차 전국자연환경조사 포유류 데이터(70,562개)를 활용하여 국내에서 서식하는 포유류의 서식지 유형을 클러스터링하고 서식지 유형에 나타나는 종의 특징을 파악하고자 하였다. 제3차 전국자연환경조사의 야장에 기록된 서식지 유형 중에서 15개의 키워드를 뽑아 재분류하여 포유류 서식지유형을 통계 분석하였다. 서식지 유형 군집분석에서는 30회 이상 기록된 14개의 서식지 유형을 대상으로 비계층적 클러스터 분석(k 평균 클러스터 분석), 계층적 클러스터 분석, 비계량형 다차원척도법을 시행하였다. 2006년에서 2012년까지 전국에서 수집된 제3차 전국자연환경조사를 통해 확인된 포유류는 총 7목 16과 39종이었다. 서식지 유형에 대한 분류는 11개로 클러스터를 분류했을 때 단순구조지수가 가장 높았다(ssi = 0.07). 계층적 클러스터 분석으로 서식지 유형들 간의 유사성과 위계를 확인해 본 결과, 포유류에게는 주거지가 가장 차별된 서식지 유형이었고, 그 다음은 하천과 해안이 병합된 클러스터였다. 비계량형 다차원척도 분석 결과, 포유류에게 가장 차별된 서식지유형인 주거지의 경우 생쥐와 집쥐 두 종이 제한적으로 나타났으며, 해안과 하천의 경우 수달이 제한적으로 나타났다. 연구결과를 종합해보면, 포유류의 서식지 유형은 크게 산림을 주요 서식지와 이동경로로 이용하는 산림형과, 물을 주요 서식지로 이용하는 하천형, 주거지 인근에서 서식하는 주거형, 곡류나 씨앗을 주 먹이원으로 하는 저지대형 등 4가지로 구분할 수 있다.

효과적인 영상 인식을 위한 개선된 퍼지 ART 알고리즘 (An Enhanced Fuzzy ART Algorithm for Effective Image Recognition)

  • 김광백;박충식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.262-267
    • /
    • 2007
  • 퍼지 ART 알고리즘에서 경계 변수는 패턴들을 클러스터링하는데 있어서 반지름 값이 되며 임의의 패턴과 저장된 패턴과의 불일치(mismatch) 허용도를 결정한다. 이 경계 변수가 크면 입력 벡터와 기대 벡터 사이에 약간의 차이가 있어도 새로운 카테고리(category)로 분류하게 된다. 반대로 경계 변수가 작으면 입력 벡터와 기대 벡터 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 벡터들을 대략적으로 분류한다. 따라서 영상 인식에 적용하기 위해서는 경험적으로 경계 변수를 설정해야 단점이 있다. 그리고 연결 가중치를 조정하는 과정에서 학습률의 설정에 따라 저장된 패턴들의 정보들이 손실되는 경우가 발생하여 인식율을 저하시킨다. 본 논문에서는 퍼지 ART 알고리즘의 문제점을 개선하기 위하여 퍼지 논리 접속 연산자를 이용하여 경계 변수를 동적으로 조정하고 저장 패턴들과 학습 패턴간의 실제적인 왜곡 정도를 충분히 고려하여 승자 노드로 선택된 빈도수를 학습률로 설정하여 가중치 조정에 적용한 개선된 퍼지 ART 알고리즘을 제안하였다. 제안된 방법의 성능을 확인하기 위해서 실제 영문 명함에서 추출한 영문자들을 대상으로 실험한 결과, 기존의 ART1과 ART2 알고리즘이나 퍼지 ART 알고리즘보다 클러스터의 수가 적게 생성되었고 인식 성능도 기존의 방법들보다 우수한 성능이 있음을 확인하였다.

  • PDF

개인화된 건강 자원 조회를 위한 TOS 와 HL7 FHIR 서비스간의 데이터그리드 모델 설계 (Design of a Data Grid Model between TOS and HL7 FHIR Service for the Retrieval of Personalized Health Resources)

  • 전영준;임석진;황희정
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.139-145
    • /
    • 2016
  • 질환 조기경보를 목표로 하는 ICT 힐링플랫폼에서 TOS는 개인 건강관련 데이터 공급자(provider)와 서비스 공급자 사이를 연결하여 개인화된 건강데이터를 중계한다. 이전 연구인 TOS에서는 모바일 기기를 고려하여 문서/측정 값 등의 자원에 대한 조회(retrieval) 및 관제 모니터링 방법이 제안되었다. 그러나 최근 헬스케어 분야에서, 모바일 기기를 이용한 통신 및 데이터 교환에 필요한 표준 항목들이 HL7 FHIR을 통해 정의되었다. 본 논문에서는 TOS를 통해 중계된 개인건강 자원을 FHIR bundle searchset으로 제공하기 위해서, TOS와 FHIR간의 데이터 그리드 모델을 설계하도록 한다. 제안 설계의 구성은 다음과 같다. 우선 TOS 자원 요청 방법과 FHIR observation 요청간의 유사점을 기술한다. 다음으로, IMDG 및 클러스터 기술을 기반으로 FHIR 서비스의 조회 요청을 처리하는 event-bus 모듈을 설계한다. 제안된 설계는 기존의 ICT 힐링플랫폼의 서비스 단말을 FHIR 리소스 활용이 가능한 모바일 헬스 기기로 확장하는데 활용할 수 있다.

U-learning 환경의 대용량 학습문서 판리를 위한 효율적인 점진적 문서 (An Effective Increment리 Content Clustering Method for the Large Documents in U-learning Environment)

  • 주길홍;최진탁
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.859-872
    • /
    • 2004
  • 컴퓨터와 통신 기술이 발전함에 따라 최근의 교육 환경은 학습자 스스로 학습 내용, 학습 시간 및 학습 순서를 선택하고 조직하는 유비쿼터스 학습 방향으로 나아가고 있다. 방대한 양의 학습정보들은 대부분 문서 형태로 관리되고 있기 때문에 문서 단위로 표현된 많은 정도들을 효과적으로 관리하고 검색하기 위한 방법의 연구가 필요하게 되었다. 문서 클러스터링은 문서간의 유사도를 바탕으로 서로 연관된 문서들을 군집화하여 문서틀을 주제별로 통합하는 방법으로 대용량의 문서들을 자통으로 분류하고, 검색하는 데 있어서 검색의 정확성을 증대시킬 수 있다. 따라서 본 논문에서는 새로운 학습 문서의 추가나 기존문서의 삭제로 인하여 군집화 대상이 되는 학습 문서 집합이 점진적으로 변화하는 환경을 위한 점진적 문서 클러스터링 알고리즘을 제안한다. 점진적 문서 클러스터링 알고리즘은 새로운 문서가 추가되었을 경우 문서 전체를 다시 클러스터링하지 않고. 이미 생성된 클러스터들의 구조를 적응적으로 변화시킴으로써 높은 효율성을 제공할 수 있다. 또한, 문서 글러스터링의 정확도극 높이기 위하여 통계적인 기법으로 불용어를 판별하여 제거하는 알고리즘을 제안한다.

  • PDF

대용량 문서 데이터베이스를 위한 효율적인 점진적 문서 클러스터링 기법 (An Effective Incremental Text Clustering Method for the Large Document Database)

  • 강동혁;주길홍;이원석
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.57-66
    • /
    • 2003
  • 컴퓨터의 발전과 인터넷의 급속한 발전으로 정보의 양이 폭발적으로 증가하게 되었고 이러한 방대한 양의 정보들은 대부분 문서 형태로 관리되고 있으며, 문서 단위별 표현된 많은 정보들을 효과적으로 관리하고 검색하기 위한 방법의 연구가 필요하게 되었다. 문서 클러스터링은 문서간의 유사도를 바탕으로 서로 연관된 문서들을 군집화하여 문서들을 주제별로 통합하는 방법으로 대용량의 문서들을 자동으로 분류하고, 검색하는 데 있어서 검색의 정확성을 증대시킬 수 있다. 본 논문에서는 새로운 문서의 추가나 기존문서의 삭제로 인하여 군집화 대상이 되는 문서 집합이 점진적으로 변화하는 환경을 위한 점진적 문서 클러스터링 알고리즘을 제안한다. 점진적 문서 클러스터링 알고리즘은 새로운 문서가 추가되었을 경우 문서 전체를 다시 클러스터링하지 않고, 이미 생성된 클러스터들의 구조를 적극적으로 변화시킴으로써 높은 효율성을 제공할 수 있다. 또한, 문서 클러스터링의 정확도를 높이기 위하여 통계적인 기법으로 불용어를 판별하여 제거하는 알고리즘을 제안하고, 문서 클러스터링에서 정확한 단어가중치 산출을 위해 TF$\times$IDF 공식을 수정한 TF$\times$NIDF 공식을 제안한다.

LSI를 이용한 차원 축소 클러스터 기반 키워드 연관망 자동 구축 기법 (Automatic Construction of Reduced Dimensional Cluster-based Keyword Association Networks using LSI)

  • 유한묵;김한준;장재영
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1236-1243
    • /
    • 2017
  • 본 논문은 기존의 TextRank 알고리즘에 상호정보량 척도를 결합하여 군집 기반에서 키워드 추출하는 LSI-based ClusterTextRank 기법과 추출된 키워드를 Latent Semantic Indexing(LSI)을 이용한 연관망 구축 기법을 제안한다. 제안 기법은 문서집합을 단어-문서 행렬로 표현하고, 이를 LSI를 이용하여 저차원의 개념 공간으로 차원을 축소한다. 그 다음 k-means 군집화 알고리즘을 이용하여 여러 군집으로 나누고, 각 군집에 포함된 단어들을 최대신장트리 그래프로 표현한 후 이에 근거한 군집 정보량을 고려하여 키워드를 추출한다. 그리고나서 추출된 키워드들 간에 유사도를 LSI 기법을 통해 구한 단어-개념 행렬을 이용하여 계산한 후, 이를 키워드 연관망으로 활용한다. 제안 기법의 성능을 평가하기 위해 여행 관련 블로그 데이터를 이용하였으며, 제안 기법이 기존 TextRank 알고리즘보다 키워드 추출의 정확도가 약 14% 가량 개선됨을 보인다.

빅데이터 분석을 이용한 이러닝 수강 후기 분석 (e-Learning Course Reviews Analysis based on Big Data Analytics)

  • 김장영;박은혜
    • 한국정보통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.423-428
    • /
    • 2017
  • 인터넷과 스마트 기기의 사용량 증가로 인해 다양한 교육정보와 많은 양의 데이터가 생성되어 빠르게 확산되고 있다. 최근 이러닝 이용률이 증가하면서 발생하는 빅데이터를 활용하여 학습자들의 교육 성과와 교육 시스템의 효과성을 극대화 하는 것을 목표로 하는 교육 데이터 관련 연구 분야에 대한 관심이 높아지고 있으며 온라인에서 학습자들이 학습한 수많은 기록과 데이터들이 정보로 쌓이게 된다. 이에 본 논문에서는 이러닝 학습자들이 시스템에 남긴 수강 기록을 기반으로 학습자 현황에 대해 객관적으로 파악할 수 있도록 신경망 알고리즘인 Word2Vec을 적용하여 단어 간 유사도를 구하고 클러스터링 알고리즘을 이용하여 군집화 하였다. Word2vec을 이용하여 학습을 시키면 연관된 의미의 단어가 나타나게 되고 학습을 반복해 나가는 과정에서 점차 가까운 벡터를 지니게 된다. 또한 클러스터 알고리즘을 이용하여 명사, 동사, 형용사, 부사가 중심점에서 최소의 거리를 두고 같은 거리에 위치해 있음을 실험 검증하였다.

영역 확장 기법과 오류 역전파 알고리즘을 이용한 자궁경부 세포진 영역 분할 및 인식 (Nucleus Segmentation and Recognition of Uterine Cervical Pop-Smears using Region Growing Technique and Backpropagation Algorithm)

  • 김광백;김성신
    • 한국정보통신학회논문지
    • /
    • 제10권6호
    • /
    • pp.1153-1158
    • /
    • 2006
  • 자궁 경부 세포진 영상의 핵 영역 분할은 자궁 경부암 자동화 검색 시스템의 가장 어렵고도 중요한 분야로 알려져 있다. 자궁 경부 세포진 영상은 배경과 세포의 영역이 확실히 구분되지 않는 경우가 많기 때문에 이들을 확실히 구분하는 것이 매우 중요하다. 본 논문에서는 이러한 문제점을 해결하기 위해 자궁 경부 세포진 영상에서 Region growing 기법을 적용하여 세포 영상을 분할한다. Region growing 기법은 화소간의 유사도를 측정하여 영역을 확장하여 분할하는 방법이다. 세포와 배경이 분할된 영상을 일정 임계값을 이용하여 영상을 이진화 한 후, 8방향 윤곽선 추적 알고리즘을 이용해 세포 영역을 추출한다. 추출된 세포 영역을 원 영상인 RGB 컬러로 변환한 후에 K-means 알고리즘을 적용하여 각 세포 영역의 RGB 화소를 R, G, B 채널로 각각 분리하여 클러스터링 한다. 클러스터링된 각 각의 R, G, B 채널의 클러스터 값을 이용하여 HSI 모델로 변환시킨 후에 세포핵 영역의 Hue 정보를 추출한다. 추출된 세포핵의 특징을 오류 역전파 알고리즘을 적용하여 정상 세포와 비정상 세포를 분류하고 인식한다.

소셜네트워크 빅데이터를 활용한 코로나 19에 따른 프로야구 관람문화조사 (Professional Baseball Viewing Culture Survey According to Corona 19 using Social Network Big Data)

  • 김기탁
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권6호
    • /
    • pp.139-150
    • /
    • 2020
  • 본 연구의 자료처리는 텍스톰(textom)과 소셜미디어의 단어를 중심으로 3가지 영역인 '코로나 19와 프로야구', '코로나 19와 프로야구 무관중', '코로나 19와 프로스포츠'에 대해 웹 환경에서 데이터 수집과 정제작업을 실시한 후 일괄 처리하였으며, 이를 시각화하기 위해 Ucinet6프로그램을 활용하였다. 구체적으로 웹 환경의 수집은 네이버, 다음, 구글의 채널을 활용하였고, 추출된 단어들 중 전문가회의를 통해 30개의 단어로 요약 정리하여 최종 연구에 활용하였다. 30개의 추출된 단어를 매트릭스를 통해 시각화하였으며, 단어의 유사성과 공통성의 군집을 파악하기 위해 CONCOR분석을 실시하였다. 분석결과 코로나 19와 프로야구에 관련된 군집은 1개의 중심클러스터와 5개의 주변클러스터로 구성되었고 코로나 19여파에 따른 프로야구 개막과 관련된 내용을 주로 검색하고 있는 것으로 나타났다. 코로나 19와 프로야구 무관중에 관련된 군집은 1개의 중심 클러스터와 5개의 주변클러스터로 구성되었으며, 코로나 19에 따른 프로야구 경기와 관련된 프로야구 입장의 키워드를 주로 검색하고 있는 것으로 나타났다. 코로나 19와 프로스포츠에 관련된 군집은 1개의 중심클러스터와 5개의 주변클러스터로 구성되었으며, 코로나 19의 여파에 따른 프로스포츠 시작과 관련된 키워드를 주로 검색하고 있는 것으로 나타났다. 이를 종합해보면 포스트 코로나 시대의 프로야구는 많은 변화가 있을 것이라 예상된다. 특히 응원문화는 관중들이 원하는 정도의 만족감은 없겠지만 관중들이 누릴 수 있는 직접관람의 기회를 누리기 위해 야구장에서도 코로나 19를 극복하기 위한 하나의 일상으로의 행동강령이 잘 유지되어야 할 것이다. 관람문화 또한 라이브커머스, AR/VR, O4O(Online for Offline)등의 4차 산업혁명의 기술도입으로 현장감 있는 쌍방향 소통이 가능한 인터렉티브 소통의 디지털이 구현돼야 할 것이다. 포스트 코로나 시대는 프로스포츠에도 새로운 형태의 패러다임이 구축될 것이다. 랜선 응원, SNS를 활용한 응원, 실시간 동시시청, 라이브 채팅응원, 편파중계 등 다양한 형태의 응원문화가 새로운 창작 콘텐츠 형태로 진화할 것이며, 팬들의 욕구를 충족할 수 있는 새로운 형태의 패러다임이 구축돼야 하겠다.

PCR 다형성 분석에 의한 비늘버섯 속 계통의 유연관계 분석 (Phylogenetic relationships in different strains of Pholiota species based on PCR polymorphism)

  • 권운혁;박혁;백민재;조우진;최우정;안치범;신도빈;이태수
    • 한국버섯학회지
    • /
    • 제11권2호
    • /
    • pp.69-76
    • /
    • 2013
  • 우리나라와 전 세계의 여러 지역에서 수집한 비늘버섯속 18 균주와 개암비늘버섯 2 균주를 대상으로 rDNA의 ITS region 염기서열과 genomic DNA의 RAPD-PCR을 수행하였다. ITS1과 ITS2영역의 염기의 수는 각각 233~271, 158~233 그리고 174~219 염기쌍으로 종에 따라 변이가 있었는데 ITS2영역의 염기서열이 ITS1의 영역보다 변이가 높았고 5.8S지역의염기의수는 비교적 변이가 적었다. 각각의 균주 간 유연관계를 알아보기 위해 ITS영역의 염기서열을 이용하여 계통도를 작성한 결과 실험에 사용한 균주는 8개의 클러스터로 나누어지는 것으로 나타났으며 동일한 종의 버섯은 동일한 클러스터에 속하는 것으로 나타났다. 또한 20종류의 primer를 이용하여 비늘버섯속 버섯을 대상으로 RAPD-PCR을 수행한 결과 15개의 primer가 효과적으로 염색체 DNA를 증폭하는 것으로 나타났다. 증폭의 양상은 primer의 종류와 종에 따라 변이가 있었다. 이 결과를 토대로 계통수를 작성한 결과 계통수는 ITS 영역의 PCR 결과와 매우 유사하였다. 본 실험결과, 실험에 사용한 비늘버섯속 버섯의 종과 계통 간의 유연관계는 높았으며, rDNA ITS 영역의 염기서열분석 결과를 이용해 공시된 각각의 비늘버섯 종을 분류하는데 유용하게 사용이 가능하였다.