• 제목/요약/키워드: 계층 군집화

검색결과 141건 처리시간 0.027초

계층적 군집화를 통한 이스트(Yeast) 단백질의 고차 상호작용 추출 (Extraction of higher yeast protein-protein interaction with hierarchical clustering from textual data)

  • 엄재홍;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.364-366
    • /
    • 2002
  • 본 논문에서는 텍스트 형태로 구성된 특정 생물에 대한 문헌 데이터에서 해당 생물의 주요 단백질간의 이진(binary) 관계를 추출하여 이들을 특징별로 계층적으로 군집화 함으로써 특정 현상을 나타내는 단백질간의 주요 관계를 추출하는 방법을 제시한다. 텍스트 데이터에서 단백질간의 이진관계는 기본적인 데이터마이닝 기법을 사용하여 연관규칙(association rule)의 형태로 추출하게 된다. 본 논문에서는 실험을 위해 PUBMED에서 추출한 Yeast의 주요 단백질간의 관계를 포함하고 있는 논문 데이터인 MEDLINE Abstract와 몇몇 공개 데이터베이스를 사용하였다. 실험 결과 SH3와 같이 기존에 알려진 단백질간의 단일 관계를 추출하는 것 이외에 이러한 관계들을 이용하여 클러스터링을 행한 결과 공통 현상에 작용하는 주요 단백질간의 관계들이 서로 군집화 됨을 확인 할 수 있었다. 또한 단순 이진관계가 아닌 클러스터링을 이용한 보다 상위 단계에서 단순 규칙들 간의 관계를 살펴봄으로써 단백질간의 이진관계를 추출하기 위한 데이터로 사용한 문헌 데이터에 나타나 있지 않은 1차 이상의 관계를 고찰 해 볼 수 있었다. 논문에서는 규칙 추출의 전체 과정과 함께 사용된 추출 시스템의 각 부와 데이터에 대한 설명을 다룬다.

  • PDF

사전 뜻풀이를 이용한 용언 의미 군집화 (Semantic Clustering of Predicates using Word Definition in Dictionary)

  • 배영준;최호섭;송유화;옥철영
    • 인지과학
    • /
    • 제22권3호
    • /
    • pp.271-298
    • /
    • 2011
  • 한국어의 어휘 의미 정보를 명확히 파악하기 위해서는 어휘 의미 체계를 구축해야 한다. 본 논문에서는 어휘 의미 체계 구축의 단계 중 하나인 용언의 의미 군집화를 연구하였다. 용언의 하위범주화 논항(주어 및 목적어)과 선택 제약정보, 부사의 결합정보를 이용한 이전의 연구와는 달리 의미태그가 부착된 사전 뜻풀이의 용언정보를 이용하여 용언의 의미 군집화를 시도하였고, 표제어와 뜻풀이 용언 사이 관계의 종개념과 유개념 관계를 이용하여 계층적 의미 군집화를 시도하였다. 그리고 특정 범주의 일반 샘플을 이용했던 특정 용언의 부류가 아닌, 사전에 존재하는 대부분의 용언들을 대상으로 연구를 진행하였다. 본 논문에서 다의어 수준에서 구분된 총 106,501개의 용언(85,754개의 동사와 20,747개의 형용사)을 대상으로 한국어 용언 의미계층 군집 2,748개를 생성하였다. 이 중 순환정의 군집은 130개가 나타났으며, 중간 계층의 서브군집으로 261개가 나타났다. 군집 내 계층의 최대 깊이는 16단계였다. 그리고 용언 의미 군집 평가를 위해 세종사태의미부류와 비교해 보았다. 그 결과 70.14%의 응집도를 보였다.

  • PDF

위치 정보를 갖는 사진집합의 계층적 탐색 인터페이스 (Hierarchical Browsing Interface for Geo-Referenced Photo Database)

  • 이승훈;이강훈
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제16권4호
    • /
    • pp.25-33
    • /
    • 2010
  • 디지털 카메라가 널리 보급되면서 사람들은 언제, 어디서나 사진을 찍고 값싼 저장장치에 많은 수의 사진을 저장할 수 있게 되었다. 하지만 많은 수의 사진 중 원하는 사진을 효율적으로 탐색하는 것은 어려운 문제로 남아 있다. 본 논문은 위치 정보를 갖는 대규모 사진집합을 신속하고 직관적으로 탐색하는 새로운 방법을 제안한다. 전체 사진집합을 구조화하기 위해 지리적 거리가 가장 근접한 사진들을 묶어 군집화하고, 이러한 과정을 반복하여 최종적으로 모든 사진이 하나의 군집으로 병합되는 계층적 군집화를 수행한다. 또한 모든 군집의 컨벡스 헐과 넓이를 미리 계산하여 사진 탐색 시에는 미리 계산된 데이터와 현재 탐색 중인 지리 영역에 포함되는 군집들의 넓이를 비교해 적절한 넓이의 군집들을 선택적으로 시각화한다. 이 때 군집은 포함되는 모든 사진의 위치를 보여주는 대신 컨벡스 헐로 시각화하여 군집의 정확한 공간적 범위를 쉽게 파악할 수 있다. 사용자는 관심 군집을 클릭하여 해당 군집으로 신속하게 이동할수 있으며, 시스템은 관심 군집을 지도 영역에 정확히 채워 보일 수 있도록 자동적으로 지도 이동과 축척 조절을 하고 적절한 넓이의 하위 군집들로 분할하여 시각화한다. 특정주제 검색, 사진분류 등의 일반적인 사진탐색 예제를 통하여 제안된 방법의 유용성을 확인하였다.

건물 형태 발생을 위한 3차원 선소의 계층적 군집화 (Hierarchical Grouping of Line Segments for Building Model Generation)

  • 한지호;박동철;우동민;정태경;이윤식;민수영
    • 전기전자학회논문지
    • /
    • 제16권2호
    • /
    • pp.95-101
    • /
    • 2012
  • 위성 영상에서 건물형태를 발생하기위한 새로운 접근방식이 본 논문에서 제안되었다. 제안된 알고리즘은 낮은 수준의 선소들을 연결하고 유사한 개체들을 군집화하기 위해 선소 측정함수가 적용된 신경망이다. 제안된 신경망은 윤곽선 영상에서 추출된 윤곽선들을 군집화 목적으로 사용된다. 본 논문에서는 3차원 선소의 오류에 의한 군집화 결과의 비현실적 건물모델의 발생을 근원적으로 차단하기 위하여, 높이 정보를 이용한 계층적 군집화를 제안하였다. 제안된 새로운 거리척도의 신경망과 군집화를 통해 성공적인 건물모델의 재구성을 실험으로 보여주었다.

제약된 K-means를 위한 초기 씨드 생성방법 (Initial Seed Generation for Constrained K-means)

  • 서향숙;강재호;류광렬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.283-286
    • /
    • 2003
  • 군집화 시 일반적으로 개별 클래스(class) 혹은 카테고리(category) 당 하나의 군집이 형성되는 결과가 선호된다. 하지만 데이터가 비정형적인 분포를 따르는 경우에는 하나의 군집으로 개별 클래스를 온전히 표현하는 것이 불가능하거나 오히려 부자연스러운 경우가 발생할 수 있다. 본 논문에서는 예제의 클래스를 알고 있는 즉, 레이블(label)된 예제들을 그렇지 않은(unlabeled) 예제들과 함께 활용하여 군집화하는 제약된 K-means (constrained K-means) 알고리즘을 위하여 보다 자연스러운 형태의 군집이 형성될 수 있도록 초기 씨드(seed, 씨앗)를 생성하는 방안을 제안한다. 레이블된 예제들을 계층적으로 군집화하면 다양한 단계에서 제약된 K-means를 위한 씨드집합을 생성할 수 있다. 본 연구에서는 각 단계의 씨드집합을 기반으로 형성된 군집결과간의 변화정도를 측정하여 가장 적절한 것으로 추정되는 씨드집합을 선정하였다. 제안한 방안을 문서 군집화 문제에 적용하여 실험한 결과 개별 클래스마다 하나의 군집을 가정하는 경우보다 더 나은 군집을 형성할 수 있음을 확인하였다.

  • PDF

움직임 벡터의 계층적 군집화를 통한 HEVC 고속 부호화 연구 (Study on Fast HEVC Encoding with Hierarchical Motion Vector Clustering)

  • 임정윤;안용조;심동규
    • 방송공학회논문지
    • /
    • 제21권4호
    • /
    • pp.578-591
    • /
    • 2016
  • 본 논문에서는 HEVC 부호화기의 속도를 향상시키기 위하여, 움직임 벡터의 군집화를 통한 코딩 블록의 최대 분할 깊이를 결정하는 방법을 제안한다. 현재 HEVC (High Efficiency Video Coding)의 참조 소프트웨어 HM은 최적의 코딩 블록 구조를 찾기 위해 다양한 코딩 블록의 깊이들에 대한 율-왜곡 최적화 (RDO: Rate-Distortion Optimization)를 수행한다. 하지만 이는 부호화기의 높은 복잡도를 차지하는 요소 중 하나로 보고된다. 본 논문에서는 최적의 코딩 블록 구조를 움직임 벡터의 군집화 된 결과에 따라 결정함으로써, 부호화 과정에서 코딩 블록 구조를 찾기 위한 RDO의 복잡도를 줄임으로써 부호화기의 속도를 향상시키는 방법을 제안한다. 제안하는 방법은 전처리 과정으로부터 원본 영상에 대한 움직임 벡터 계산, 이를 통한 계층적 군집화를 수행하여, 군집화된 경향을 기반으로 코딩 블록의 최대 깊이를 결정한다. 본 논문의 제안하는 방법은 HEVC 참조 소프트웨어 대비 평균 1.45% BD-rate 손실이 있었으며 평균 16%의 부호화 속도 향상을 보였다. 또한, 기존의 고속화 방법과 함께 적용한 경우 1.84% BD-rate 손실과 45.13%의 평균 부호화 속도 향상을 나타냈다.

Gazebo 기반 UAV 군집 비행 시뮬레이션 개발 및 비행 고도 계층화 개발 (Development of UAV Cluster Flight Simulation and Altitude Layer based on Gazebo)

  • 최효현;김응빈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.271-272
    • /
    • 2021
  • 본 논문에서는 Gazebo 시뮬레이터 기반 UAV 군집 시뮬레이션 구현 및 비행 고도 계층화를 구현한 결과를 보인다. Gazebo 시뮬레이션과 Autopilot Program인 Pixhawk4 SITL(Software In The Loop)을 이용하여 UAV를 시뮬레이터에 생성한 뒤 사전에 정의된 Mission에 대한 정보에 따라 비행이 되도록 구현하였다. 또한, Gazebo 시뮬레이터의 Box Object를 이용하여 UAV의 비행 고도를 시각적으로 계층화하여 표현하였다.

  • PDF

계층적 군집화를 이용한 안드로이드 위치정보에 대한 디지털 포렌식 (Digital Forensics for Android Location Information using Hierarchical Clustering)

  • 손영준;정목동
    • 전자공학회논문지
    • /
    • 제51권6호
    • /
    • pp.143-151
    • /
    • 2014
  • 최근 스마트폰이 널리 보급됨에 따라 이용자의 다양한 정보들이 스마트폰에 저장되고 있다. 그 중 위치정보는 특정 시간의 이용자의 위치나 이용자의 관심지역, 경로 등을 나타낼 수 있으므로 범죄수사 시 유용한 자료로 활용될 수 있다. 그러나 위치 정보에 대한 기존의 포렌식 연구는 단순히 사용흔적이나 위치정보에 대해 확인하는데 그치고 있다. 따라서 본 논문은 안드로이드 스마트폰에 저장되는 위치정보를 로그, 이미지, 각종 애플리케이션 등 다각적으로 접근하여 분석하고, 계층적 군집화를 이용한 통합적인 위치정보 분석모델을 제안한다. 본 논문에서 제안한 모델은 위치정보 분석의 효율성을 높이고 사건에 대한 정보를 제공함으로써 범죄수사과정에 도움이 될 것으로 기대된다.

세그먼트 적합성 판단을 위한 계층적 최근접 검색 기법 (Hierarchical Nearest-Neighbor Method for Decision of Segment Fitness)

  • 신복숙;차의영;이임건
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.418-421
    • /
    • 2007
  • 이 논문에서는 곤충 발자국의 패턴을 판별하기 위한 전 단계로 추출되는 군집화된 세그먼트들 중에서, 곤충 발자국의 패턴을 분석하는 데에 부적합한 세그먼트들을 제거하기 위한 계층적 최근접 검색 기법을 제안한다. 발자국 형태와 거의 구별되지 않는 비정형적인 노이즈는 발자국과 서로 구별되는 특징을 규명하기 전까지는 영상처리 전 단계에서 완전히 제거될 수 없어 군집화 기법에 의해 추출된 세그먼트에도 이러한 노이즈를 내포하게 된다. 따라서 모든 세그먼트의 적합성을 평가하여, 노이즈 정보로 인해 타당성이 부족한 세그먼트를 제거함으로써 다음 단계에 수행되는 세그먼트들에 대한 곤충 발자국 패턴의 특징값 추출 성능이 향상될 수 있다.

  • PDF

사전 뜻풀이를 이용한 용언 의미 군집화 (Semantic Clustering of Predicate using Word Definition in Dictionary)

  • 배영준;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.46-51
    • /
    • 2010
  • 한국어의 어휘의미 정보를 명확히 파악하기 위해서는 어휘 의미 체계를 구축해야 한다. 본 논문에서는 어휘 의미 체계 구축의 단계 중 하나인 용언의 의미 군집화를 연구하였다. 주어 및 목적어의 논항 구조와 선택 제약정보, 부사의 결합정보를 이용한 이전의 연구와는 달리 의미태깅이 된 사전 뜻풀이의 용언정보를 이용하여 용언의 의미 군집화와 간단한 계층화를 시도하였다. 그리고 특정 부류의 일반 샘플을 이용했던 특정 용언의 부류가 아닌 사전에 존재하는 대부분의 용언들을 대상으로 연구를 진행하였다.

  • PDF