• 제목/요약/키워드: 영역확장 Clustering

검색결과 49건 처리시간 0.033초

클러스터링 기반 앙상블 모델 구성을 이용한 이상치 탐지 (Outlier Detection By Clustering-Based Ensemble Model Construction)

  • 박정희;김태공;김지일;최세목;이경훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권11호
    • /
    • pp.435-442
    • /
    • 2018
  • 이상치 탐지는 정상 데이터 분포를 크게 벗어나는 데이터 샘플을 탐지하는 것을 의미한다. 대부분의 이상치 탐지 방법은 데이터 샘플이 정상 상태를 벗어나는 정도를 나타내는 이상치 지수(outlier score)를 계산하여 주어진 임계값 이상일 때 이상치로 판정한다. 그러나, 데이터마다 이상치 지수의 범위가 다양하고 정상 데이터에 비해 이상치 데이터는 적은 비율로 존재하기 때문에 이상치 지수에 대한 임계값을 결정하기는 매우 어렵다. 또한, 실제 상황에서는 학습에 이용할 수 있는 충분한 양의 이상치를 포함하는 데이터의 획득이 용이하지 않다. 본 논문에서는 정상 데이터가 주어졌을 때 이를 이용하여 정상 데이터 영역을 나타내는 모델을 구성하고 새로운 데이터 샘플에 대해 이상치와 정상치의 이진 분류를 수행하는 방법으로 군집화 기반 이상치 탐지 방법을 제안한다. 그리고, 주어진 정상 데이터를 청크로 나누고 각 청크에 대해 클러스터링 모델을 구성한 후 모델들에 의한 이상치 판정 결과를 결합하는 앙상블 방법과 동적 변화가 있는 스트리밍 데이터에서의 적용 방법으로 확장한다. 실제 데이터와 인공 데이터를 이용한 실험결과는 제안 방법의 높은 성능을 보여준다.

객체지향 소프트웨어 재사용을 위한 클래스 라이브러리 설계에 관한 연구 (The Study of Class Library Design for Reusable Object-Oriented Software)

  • 이해원;김진석;김혜규;하수철
    • 한국정보처리학회논문지
    • /
    • 제6권9호
    • /
    • pp.2350-2364
    • /
    • 1999
  • 본 논문은 객체지향 C++ 클래스 컴포넌트를 분류하여 재사용자에게 필요한 컴포넌트를 제공하기 위한 저장소의 클래스 라이브러리 설계방법을 제안한 것이다. 클래스 라이브러리를 설계하기 위해서 컴포넌트 구성 모델을 정의하였고, Enumerative 분류 방법을 이용한 멀티미디어 영역을 분류하였으며, 문서 클러스터링 방법을 확장하여 유사도에 의한 C++ 클래스를 유사한 그룹으로 분류하는 클러스터 생성 기준을 제안하고 있다. 이 유사 그룹인 클러스터는 클래스 멤버 데이터와 멤버함수 그리고 클래스 유사도를 기반으로 분류되며, 분류된 컴포넌트들은 유사도 관계의 계층구조로 구성된다. 마지막으로 객체지향 개념인 Generalization/Specialization의 C++ 상속관계를 계층구조로 표현할 수 있는 클래스 라이브러리를 설계하였다.

  • PDF

Wi-Fi 핑거프린트 기반 실내 이동 경로 데이터 생성 방법 (Wi-Fi Fingerprint-based Indoor Movement Route Data Generation Method)

  • 윤창표;황치곤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.458-459
    • /
    • 2021
  • 최근, 실내 위치 기반 서비스에서 정확한 서비스를 위해 Wi-Fi 핑거프린트 기반의 딥러닝 기술을 이용한 연구가 이루어지고 있다. 딥러닝 모델 중에서 과거의 정보를 기억할 수 있는 RNN 모델은 실내측위에서 연속된 움직임을 기억할 수 있어 측위 오차를 줄일 수 있다. 이때 학습 데이터로서 연속적인 순차 데이터를 필요로 한다. 그러나 일반적으로 Wi-Fi 핑거프린트 데이터의 경우 특정 위치에 대한 신호들만으로 관리되기 때문에 RNN 모델의 학습데이터로 사용이 부적절하다. 본 논문은 RNN 모델의 순차적인 입력 데이터의 생성을 위해 클러스터링을 통한 영역 데이터로 확장된 Wi-Fi 핑거프린트 데이터 기반 이동 경로의 예측을 통한 경로 생성 방법에 대해 제안한다.

  • PDF

시각장애인 예술 문화 향유 확장을 위한 시각 정보 촉각 변환 디스플레이 (Visual Information Tactile Transformation Display to Expand the Enjoyment of Art and Culture for the Blind)

  • 이상돈;이주현;황재형;황현정;이재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.996-997
    • /
    • 2023
  • 시각 장애인들의 시각 정보에 대한 낮은 접근성은 문화, 예술 활동에 큰 제약을 가져다 주고 있다. 실제로 시각 장애인 중 약 절반 이상이 문화, 여가생활에 만족하지 못한다고 답하였고 전시회, 미술품 감상 또는 관람 활동은 약 5%만이[1] 참여하고 있는 것으로 나타났다. 이러한 한계를 극복하기 위해 시각이라는 감각의 한계를 뛰어넘어 시각 미디어를 즐길 수 있게 하는 서비스를 제작하였고, 이는 크게 웹서비스인 web view editor와 물리적인 촉각 디스플레이로 구성된다. 시각 미디어인 이미지는 8×8로 나눠 각 영역을 OpenCV 라이브러리와 K-means clustering 알고리즘을 이용하여 9 level로 분류시키고, 구분된 level에 맞게 cell의 높낮이 차이를 두기 위하여 Arduino를 통한 회전-선형 변환기를 제작했다. Arduino의 PWM 기능을 이용해 모터의 속도와 방향을 제어하며, 각 모터의 드라이버는 Arduino와 연결되어 있어 모터의 회전을 제어하게 했다. 결과적으로 본 연구에서는 cell의 높낮이 차이를 9 level로 구분하여 시각 정보를 촉각으로 수용할 수 있는 장치를 제작하였고, 이 장치를 통해 기존의 시각 장애인들이 문화 생활을 쉽게 향유하고 이를 바탕으로 창의성과 상상력을 증대시켜 더욱 밀접하게 사회와 연결되고 소통 할 수 있는 기회의 초석이 되기를 기대하는 바이다.

소프트웨어 재사용을 지원하는 확장된 패싯 분류 방식과 혼합형 검색 모델 (An Extended Faceted Classification Scheme and Hybrid Retrieval Model to Support Software Reuse)

  • 강문설;김병기
    • 한국정보처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.23-37
    • /
    • 1994
  • 본 논문에서는 소프트웨어 부품을 분류하여 라이브러리에 저장하고, 사용자의 요 구에 따라 효율적으로 검색할 수 있도록 지원하는 확장된 패싯 분류 방식과 혼합형 검색 모델을 제안하고, 프로토타입 시스템을 설계하여 구현하였다. 분류 방식의 설계 를 위하여 부품들의 기본적인 클래스를 분석하여 필요한 항목을 식별한다음, 항목들의 특성을 분석하고 패싯을 결정하여 구품 식별자를 구성한다. 그리고 부품의 기본적인 특성을 기준으로 응용 영역별로 클러스터링시켜 라이브러리에 저장하고, 부품의 특성 을 표현하기 위하여 패싯과 항목들에 가중치를 할당하였다. 부품의 검색을 위하여, 질 의에 의한 검색 모델 및 유사한 바품들을 쉽게 검색할 수 있도록 가중치와 유사도를 이용하였다. 제안한 분류 방식과 검색 모델은 분류 과정이 간단하고, 유사한 부품을 쉽게 식별할 수 있었으며, 또한 질의 작성이 간단해지고, 출력될 부품들의 크기와 순 서의 조절이 가능하여 검색 효율이 개선되었다.

  • PDF

단위블록의 색공간 내용비교 기반 2차원 블록정렬을 이용한 이미지 매칭방법 (A Method of Image Matching by 2D Alignment of Unit Block based on Comparison between Block Content)

  • 장철진;조환규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권8호
    • /
    • pp.611-615
    • /
    • 2009
  • 급증하는 디지털 사진 데이터를 내용정보를 고려하여 효율적으로 관리하기 위해서는 무엇보다도 각 사진 이미지들이 얼마나 유사한지를 밝히는 것이 중요하다. 이를 위해 사진을 블록 단위로 분할하고 높은 유사도를 가지는 상위 블록 쌍을 이용하여, 그리디 알고리즘에 기반한 2차원 정렬(alignment)을 통해 주변 블록으로 유사 매칭 영역을 확장함으로써 동일한 객체 혹은 배경을 공유하고 있는지를 판별한다. 제안하는 정렬 알고리즘을 이용해 전체 이미지상에서 최적의 매칭 유사도 값을 가지는 블록영역을 추출해낼 수 있으며, 객체의 이동이나 자세의 변경 및 카메라의 줌 변경에 구애 받지 않으면서 계산이 가능하다. 실험을 통해 다양한 사진에 대해서 제안한 방법이 어떻게 적용될 수있는 지를 알아보고, 추후의 디지털 사진 클러스터링 및 대용량 사진 관리에 유용하게 활용될 수 있음을 살펴본다.

이동 객체 경로 탐색을 위한 시공간 클러스터링 기법 (A Spatio-Temporal Clustering Technique for the Moving Object Path Search)

  • 이기영;강홍구;윤재관;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제7권3호
    • /
    • pp.67-81
    • /
    • 2005
  • 최근 들어 지리 정보 시스템이 발전함에 따라 경로 검색, 주변 정보 검색, 응급 서비스 등을 제공하는 위치 기반 서비스, 텔레매틱스 등의 새로운 응용 서비스 개발에 대한 관심과 연구가 증대되고 있다. 위치 기반 서비스 및 텔레매틱스에서 사용되는 시공간 데이타베이스에서의 사용자의 검색은 시간 축을 현재의 시간으로 고정하고 공간 및 비공간 속성을 검색하기 때문에 시간 축에 대한 검색 범위가 넓을 경우에는 이를 효율적으로 처리하기 어렵다. 이를 해결하기 위하여 이동 객체의 위치 데이타를 요약하는 기법인 스냅샷이 소개되었다. 그러나, 이러한 스냅샷 기법은 저장해야 되는 총간 영역이 넓을 경우 저장 공간이 많이 필요하며 검색에 자주 사용되지 않는 불필요한 영역까지 스냅샷을 생성하므로 저장 공간 및 메모리를 많이 사용하게 된다. 이에 본 논문에서는 기존의 스냅샷 기법의 단점을 극복하기 위하여 이전에 공간 클러스터링을 위해 사용되던 2차원의 공간 해시 알고리즘을 시공간으로 확장한 해시-기반 시공간 클러스터링 알고리즘(H-STCA)과 과거 위치 데이타로부터 이동 객체 경로 탐색을 위한 지식을 추출하기 위해 H-STCA 알고리즘에 근거한 지식 추출 알고리즘을 제안한다. 그리고, 대용량의 이동 객체 데이터에 대한 검색 시간, 저장 구조 생성 시간, 최적 경로 탐색 시간 등에서 H-STCA를 사용한 스냅샷 클러스터링 방법, 기존의 시공간 인덱스 방법, 스냅샷 방법과의 성능평가에 대하여 설명한다. 성능평가 결과로 H-STCA를 사용한 스냅샷 클러스터링 방법은 기존의 시공간 인덱스 방법이나 스냅샷 방법 보다 이동 객체의 개수가 증가하면 할수록 성능 향상이 더욱 큰 것으로 나타났다.

  • PDF

다중 관계 그래프를 이용한 유전체 보존영역의 계층적 시각화와 개략적 전사 annotation 도구 (Rough Computational Annotation and Hierarchical Conserved Area Viewing Tool for Genomes Using Multiple Relation Graph.)

  • 이도훈
    • 생명과학회지
    • /
    • 제18권4호
    • /
    • pp.565-571
    • /
    • 2008
  • 생물정보학의 발전으로 다양한 형태의 생물정보가 컴퓨터 프로그램에 의해 양산되고 있다. 단순한 서열간의 비교나 작은 규모의 자료를 처리하기 보다는 다각화된 정보와 대규모의 생물정보를 취급하고 있다. 그 중에서 시각화와 annotation를 위한 도구개발은 지난 10년간 많은 연구가 되고 있는 분야이다. 그럼에도 일반화된 도구 개발은 생물정보의 다양성과 사용자 요구의 다양화로 인해 매우 어렵다. 본 논문에서는 유전체간 알려진 정보와 다중 관계 그래프를 이용하여 이를 annotation하고 시각화하는 GenoVA 시스템을 제안한다. 다중 정렬을 위한 몇 개의 프로그램이 존재하지만 그 방법들이 서열내의 복잡성 때문에 많은 정보가 누락된다. 따라서 제안된 방법에서는 pairwise alignment를 확장하여 모든 유전체간 비교를 통해 연관성 도출한다. 유전체간 보존되는 영역의 빈도수와 BLAST 점수가 높은 것을 블록노드라 하고 이들 간의 연관관계를 다중 관계 그래프로 표현하였다. 또한 GenoVA는 알려진 정보, COG, 유전자를 시각화하고 다중 관계 그래프의 한 영역을 중심으로 클러스터링된 경로를 계층적으로 보여주었다. 이때 누락되거나 알려지지 않은 유전자나 다른 annotation정보 추출할 수 있다. 본 논문의 실험을 위해 열 개의 박테리아 유전체가 사용되었고 시각화와 annotation을 위한 자료로 활용하였다. GenoVA는 새로운 유전체에 대한 개략적이고 전산적 annotation을 직관적이고 편리하게 제공한다.

병리특이적 형태분석 기법을 이용한 HRCT 영상에서의 새로운 봉와양폐 자동 분할 방법 (A Novel Method for Automated Honeycomb Segmentation in HRCT Using Pathology-specific Morphological Analysis)

  • 김영재;김태윤;이승현;김광기;김종효
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권2호
    • /
    • pp.109-114
    • /
    • 2012
  • 봉와양폐(Honeycomb)는 직경 2~10mm 정도의 크기가 같지 않은 낭포(Cyst)가 경계가 명확한 섬유질(Fibrosis)로 이루어진 벽에 둘러싸여 밀집된 형태로 이루어져 있다. 봉와양폐가 발견될 경우 급성악화의 발생 빈도가 높으며 따라서 봉와양폐의 관찰 여부와 측정은 임상에서 중요한 지표가 된다. 따라서 본 논문에서는 봉와양폐 영역의 정량적 측정을 위하여 봉와양폐의 특징을 이용한 형태학적 기법과 군집성 평가 기법을 통해 자동 구획 방법을 제안하였다. 첫 번째로 영상의 잡음을 제거하기 위하여 가우시안 필터링을 적용하고, 모폴로지 기법 중 팽창 기법을 이용하여 폐 영역을 구획하였다. 두번째로, 주변 8방향 검사를 통해 봉와양폐를 구성하는 낭포의 후보군을 찾고, 영역 확장과 외곽선 검사를 통해 비 낭포들을 제거하였다. 마지막으로 군집화 검사를 통해 최종적으로 봉와양폐를 구획하였다. 제안한 방법은 80장의 고해상도 컴퓨터 단층촬영 영상에서 실험한 결과, 89.4%의 민감도와, 72.2%의 양성 예측도를 보였다.

정보공유공간의 품질 측정지표 개발에 관한 탐색적 연구 (An Exploratory Study of Developing a Measurement Tool for the Quality of Information Commons)

  • 박지홍;기선아
    • 한국문헌정보학회지
    • /
    • 제46권4호
    • /
    • pp.5-25
    • /
    • 2012
  • 본 연구는 정보공유공간의 품질 측정지표 개발을 위한 설문항목 개발을 목적으로 하였다. 정보공유공간은 도서관 이용자들이 다양한 교육, 연구, 문화 활동을 경험할 수 있는 물리적, 기술적, 지적 공간으로, 최근 도서관 이용자간의 지식 공유와 상호관계를 장려하기 위하여 인기를 얻고 있다. 또한 정보공유공간은 협업활동, 학습, 휴식을 위한 공간을 제공하는데, 이러한 장점과 유용성에도 불구하고 명확히 정보공유공간의 품질에 대한 측정도구가 없다. 여기에서는 도서관 이용자의 정보공유공간에 관한 인식과 정보공유공간에 대한 인지된 품질에 영향을 미치는 요소들을 추출하기 위하여 심층면담, 선행연구 대조 및 사전조사를 수행하였다. 선행연구와 설문 초기 아이템은 분류와 클러스터링을 통하여 데이터 내의 주요 개념이 도출되었다. 그 후 사전조사를 통하여 예비 설문문항의 타당도가 검증되었다. 연구의 의의는 도서관 서비스 품질평가에 대한 연구의 영역을 확장시키고 이용의도를 고려한 새로운 평가 체계를 제시한 점이다.