• 제목/요약/키워드: 클러스터 간 유사도

검색결과 106건 처리시간 0.033초

영역 확장 기법과 오류 역전파 알고리즘을 이용한 자궁경부 세포진 영역 분할 및 인식 (Nucleus Segmentation and Recognition of Uterine Cervical Pop-Smears using Region Growing Technique and Backpropagation Algorithm)

  • 허정민;김성신;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.335-339
    • /
    • 2006
  • 자궁 경부 세포진 영상의 핵 영역 분할은 자궁 경부암 자동화 검색 시스템의 가장 어렵고도 중요한 분야로 알려져 있다. 자궁 경부 세포진 영상은 배경과 세포의 영역이 확실히 구분되지 않는 경우가 많기 때문에 이들을 확실히 구분하는 것이 매우 중요하다. 본 논문에서는 이러한 문제점을 해결하기 위해 자궁 경부 세포진 영상에서 Region growing 기법을 적용하여 세포 영상을 분할한다. Region growing 기법은 화소간의 유사도를 측정하여 영역을 확장하여 분할하는 방법이다. 세포와 배경이 분할된 영상을 일정 임계값을 이용하여 영상을 이진화 한 후, 8방향 윤곽선 추적 알고리즘을 이용해 세포 영역을 추출한다. 추출된 세포 영역을 원 영상인 RGB 컬러로 변환한 후에 K-means 알고리즘을 적용하여 각 세포 영역의 RGB 화소를 R, G, B 채널로 각각 분리하여 클러스터링한다. 클러스터링된 각각의 R, G, B 채널의 클러스터 값을 이용하여 HSI 모델로 변환시킨 후에 세포핵 영역의 Hue 정보를 추출한다. 추출된 세포핵의 특징을 오류 역전파 알고리즘을 적용하여 정상 세포와 비정상 세포를 분류하고 인식한다.

  • PDF

운송 컨테이너 영상의 식별자 인식을 위한 개선된 퍼지 ART 알고리즘 (An Enhanced Fuzzy ART Algorithm for The Identifier Recognition from Shipping Container Image)

  • 류재욱;김태경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.365-369
    • /
    • 2002
  • 퍼지 ART 알고리즘에서 경계 변수는 패턴들을 클러스터링하는데 있어서 반지름 값이 되며 임의의 패턴과 저장된 패턴과의 불일치(mismatch) 허용도를 결정한다. 이 경계 변수가 크면 입력 벡터와 기대 벡터 사이에 약간의 차이가 있어도 새로운 카테고리(category)로 분류하게 핀다. 반대로 경계 변수가 작으면 입력 벡터와 기대 벡터 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 벡터들을 대략적으로 분류한다. 따라서 영상 인식에 적용하기 위해서는 경험적으로 경계 변수를 설정해야 단점이 있다. 그리고 연결 가중치를 조정하는 과정에서 저장된 패턴들의 정보들이 손실되는 경우가 발생하여 인식율을 저하시킨다. 된 논문에서는 퍼지 ART 알고리즘의 문제점을 개선하기 위하여 퍼지 논리 접속 연산자를 이용하여 경계 변수를 동적으로 조정하고 저장 패턴들과 학습 패턴간의 실제적인 왜곡 정도를 충분히 고려하여 승자 노드로 선택된 빈도수를 가중치 조정에 적용한 개선된 퍼지 ART 알고리즘을 제안하였다. 제안된 방법의 성능을 확인하기 위해서 실제 운송 컨테이너 영상들을 대상으로 실험한 결과, 기존의 ART2 알고리즘이나 퍼지 ART 알고리즘보다 클러스터의 수가 적게 생성되었고 인식 성능도 기존의 방법들보다 우수한 성능이 있음을 확인하였다.

RAPD 분석법에 의한 한국형 대장균파아지와 미국형 대장균파아지의 분자적 계통분류 (Molecular Phylogeny of Korean-type Coliphages and American-type Coliphages Determined by a RAPD Analysis)

  • 권오식
    • 대한의생명과학회지
    • /
    • 제6권2호
    • /
    • pp.131-139
    • /
    • 2000
  • 분리한 한국형 대장균파아지군($\phi$C1, $\phi$C2, $\phi$C3 및 $\phi$C4)과 잘 알려진 미국형 대장균파아지군($\phi$T2, $\phi$T4, $\phi$T5, $\phi$T7 및 ${\phi}{\lambda}$)의 유전적 유연관계를 조사하기 위하여 분자적 계통분류를 위한 방법인 RAPD-PCR을 실시하고 컴퓨터분석을 하였다. 그 결과, 9개의 대장균파아지들은 5개의 그룹으로 나위어지면서 한국형 대장균파아지들만이 그들간의 유전적 유사도가 매우 높으면서 하나의 클러스터를 형성하였다. 반면 이국형 대장균파아지들은 오직 하나의 서브클러스터를 가지며 나누어졌다. 즉, 미국형 대장균파아지 중 $\phi$T2와 $\phi$T4($T_{even}$ 파아지)만이 하나의 서브클러스터를 형성하면서 $\phi$T5, $\phi$T7 및 ${\phi}{\lambda}$들과 뚜렷히 구분되고 있었다. 그리고 한국형 대장균파아지들은 미국형 대장균차이지 중 오직 ${\phi}{\lambda}$와 유전적 유연관계를 갖고 있음을 확인하였다. 한편 한국형 대장균파아지의 게놈의 크기는 25,000 bp~35,000 bp 정도 였으며, 이 중 $\phi$C2가 그 크기가 가장 작고 $\phi$C1이 가장 컸다. 그리고 $\phi$C3과 $\phi$C4의 게놈은 중간 크기로 비슷하였다.

  • PDF

검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델 (A Term Cluster Query Expansion Model Based on Classification Information of Retrieval Documents)

  • 강현수;강현규;박세영;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.7-12
    • /
    • 1999
  • 정보 검색 시스템은 사용자 질의의 키워드들과 문서들의 유사성(similarity)을 기준으로 관련 문서들을 순서화하여 사용자에게 제공한다. 그렇지만 인터넷 검색에 사용되는 질의는 일반적으로 짧기 때문에 보다 유용한 질의를 만들고자 하는 노력이 지금까지 계속되고 있다. 그러나 키워드에 포함된 정보가 제한적이기 때문에 이에 대한 보완책으로 사용자의 적합성 피드백을 이용하는 방법을 널리 사용하고 있다. 본 논문에서는 일반적인 적합성 피드백의 가장 큰 단점인 빈번한 사용자 참여는 지양하고, 시스템에 기반한 적합성 피드백에서 배제한 사용자 참여를 유도하는 검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델(Term Cluster Query Expansion Model)을 제안한다. 이 방법은 검색 시스템에 의해 검색된 상위 n개의 문서에 대하여 분류기를 이용하여 각각의 문서에 분류 정보를 부여하고, 문서에 부여된 분류 정보를 이용하여 분류 정보의 수(m)만큼으로 문서들을 그룹을 짓는다. 적합성 피드백 알고리즘을 이용하여 m개의 그룹으로부터 각각의 용어 클러스터(Term Cluster)를 생성한다. 이 클러스터가 사용자에게 문서 대신에 피드백의 자료로 제공된다. 실험 결과, 적합성 알고리즘 중 Rocchio방법을 이용할 때 초기 질의보다 나은 성능을 보였지만, 다른 연구에서 보여준 성능 향상은 나타내지 못했다. 그 이유는 분류기의 오류와 문서의 특성상 한 영역으로 규정짓기 어려운 문서가 존재하기 때문이다. 그러나 검색하고자 하는 사용자의 관심 분야나 찾고자 하는 성향이 다르더라도 시스템에 종속되지 않고 유연하게 대처하며 검색 성능(retrieval effectiveness)을 향상시킬 수 있다.사용되고 있어 적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract

  • PDF

API 콜 시퀀스와 Locality Sensitive Hashing을 이용한 악성코드 클러스터링 기법에 관한 연구 (A Study on Malware Clustering Technique Using API Call Sequence and Locality Sensitive Hashing)

  • 고동우;김휘강
    • 정보보호학회논문지
    • /
    • 제27권1호
    • /
    • pp.91-101
    • /
    • 2017
  • API(Application Program Interface) 콜 시퀀스 분석은 분석 대상 프로그램에서 API 콜 정보를 추출한 후 분석하는 기법으로 다른 기법들에 비해 대상의 행위를 특징할 수 있는 장점이 있다. 하지만 기존의 API 콜 시퀀스 분석기법은 동일한 기능을 수행하는 함수를 상이한 함수로 잘못 식별하여 분석을 수행하는 문제점이 존재한다. 본 연구에서는 API 각각을 추상화시키는 방식을 추가하여 기존의 식별 문제를 해결하고 분석 성능을 향상시키고자 한다. 그 후 분석 대상들에서 획득한 추상화된 API 콜 시퀀스에 LSH(Locality Sensitive Hashing) 기법을 적용하여 각 분석 대상들 간의 유사도를 계산하고 유사한 유형끼리 클러스터를 형성하는 과정을 수행하였다. 본 연구는 악성코드 분석 시 악성코드의 유형을 파악하는 데 요긴하게 사용할 수 있으며, 최종적으로는 해당 유형 정보를 기반으로 악성코드 분석의 정확도를 향상시키는 데 기여할 수 있다.

Underutilization 문제를 해결한 퍼지 신경회로망 모델 (A Fuzzy Neural Network Model Solving the Underutilization Problem)

  • 김용수;함창현;백용선
    • 한국지능시스템학회논문지
    • /
    • 제11권4호
    • /
    • pp.354-358
    • /
    • 2001
  • 본 논문에서는 underutilization 문제를 해결한 퍼지 신경회로망 모델을 제시한다. 이 퍼지 신경 회로망은 ART-1 신경회로망과 유사한 제어 구조를 가지고 있어 유연성이 있으면서도 안정성이 있다. 또한 연결강도의 초기화가 필요 없고 ART-1 신경회로망에 비하여 잡음에 민감하지 않다. 이 퍼지 신경회로망의 학습법칙은 코호넨의 학습법칙을 변형하고 퍼지화 하였으며 누설 경쟁학습의 퍼지화와 조건 확률의 퍼지화에 기반을 두고 있다. 출력 뉴런 중에서 승자를 정한 후에 행해지는 점검 테스트에서는 유사척도로 상대적 거리를 사용하였다. 이 상대적 거리는 유클리디안 거리와 함께 데이터와 클러스터들의 대푯값들 간의 상대적인 위치를 고려한 것이다. 본 논문에서 제안한 퍼지 신경회로망과 코호넨 자기 조직화 특징 지도의 성능을 비교하기 위하여 널리 사용되어온 IRIS 데이터와 가우시안 분포 데이터를 사용하였다.

  • PDF

색인어 가중치 부여 방법에 따른 K-Means 문서 클러스터링의 LSI 분석 (Latent Semantic Indexing Analysis of K-Means Document Clustering for Changing Index Terms Weighting)

  • 오형진;고지현;안동언;박순철
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.735-742
    • /
    • 2003
  • 정보검색 시스템에서 문서 클러스터링 기술은 사용자 질의에 대해 검색된 문서들을 문서간의 유사도를 기반으로 특정 주제에 따라 재배치하여 놓는 기술로써 사용자에게 검색의 편의성을 제공하고, 그 결과들을 시각적으로 보여줄 수 있다. 본 논문에서는 K-Means 알고리즘을 사용하여 문서를 클러스터링하며 문서를 대표하는 색인어에 가중치를 부여하는 기법에 대하여 논한다. 클러스터링 결과를 시각적으로 보여주기 위하여 문서와 클러스터 중심들을 2차원 공간으로 사상하기 위한 Latent Semantic Indexing 접근 방법을 적용하였다. 실험 결과 문서의 색인어에 대한 가중치 부여 방법을 동일하게 하거나 또는 유사한 수식을 적용한 사례보다는 로컬가중치, 글로벌가중치, 정규화 요소를 모두 부여한 사례에서 문서들이 2차원 벡터 공간에서 군집하여 분포하는 클러스터링 효과가 우수하였다. 특히 로컬 가중치와 글로벌 가중치에 logarithm을 적용하였을 때 문서 분포의 군집도는 현저하게 나타남을 알 수 있었다.

계층적 정렬쌍 가시화를 이용한 유전자 클러스터 탐색 알고리즘 (A Gene Clustering Method with Hierarchical Visualization of Alignment Pairs)

  • 진희정;박수현;조환규
    • 정보처리학회논문지A
    • /
    • 제16A권3호
    • /
    • pp.143-152
    • /
    • 2009
  • 최근 생물정보학 분야의 연구는 하나하나의 유전자를 연구하던 예전의 방법에서 유전자들간의 관계를 알아보는 연구들로 변해가고 있다. 이러한 유전자들 간의 연구 중 하나가 유전자 팀(gene team)을 연구하는 것이다. 유전자 팀이란 몇몇 염색체들 사이의 유전자들이 보존되어 있는 것을 말하며, 닫힌 영역 안에 보존되어 있는 유전자들의 집합으로 볼 수 있다. 이들은 진화과정을 거치면서, 유전자 팀 내의 유전자들의 위치나 그 종류가 변한다. 이러한 유전자 팀을 찾기 위해 많은 연구들이 이루어져왔다. 본 논문은 생물정보학 분야에서 많이 사용되는 계층적 클러스터링(hierarchical clustering)방법을 변형하여 전체 유전체(whole genome) 쌍내에서의 의미 있는 영역을 찾고, 영역 내에서 gene team을 찾을 수 있는 방법을 소개한다. 본 연구 방법을 이용하면, 복잡한 구조의 두 유전체 사이의 연관 유전자들이나 유사 영역들의 맵(map)을 단계별로 간략화 하여 나타낼 수 있다.

WSN의 확장성과 에너지 효율성을 보장하는 라우팅 프로토콜 (A Routing Protocol for Assuring Scalability and Energy Efficiency of Wireless Sensor Network)

  • 정윤수;김용태;박길철;이상호
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.105-113
    • /
    • 2008
  • 무선 센서 네트워크에서는 근접한 센서 노드들이 유사한 정보를 감지하는 특성에 의해 임의의 센서 노드의 동작이 실패하거나 기능이 소멸되는 경우에도 네트워크의 전체적인 동작에는 영향을 미치지 않는 장점이 있지만 무선매체의 저속, 오류가 심한 전송특성 및 제한된 전원 공급, 센서 노드의 임의 배치로 인한 교체 불가능 등의 문제점을 가진다. 이 논문에서는 계층적으로 센서 로드를 구성하고 있는 네트워크의 확장성을 보장하면서 전체 노드들의 파워 소비를 줄일 수 있도록 최적 경로 검색 프로세스를 수행하는 PRML 라우팅 프로토콜을 제안한다. 제안된 기법에서는 노드의 잉여 에너지와 연결도를 고려함으로써 클러스터 헤드의 부하 분산이 가능해 졌으며, 노드 간 통신 횟수를 줄일 수 있었다. LEACH-C, HEED기법들과 비교 분석 결과, PRML라우팅 프로토콜은 전체 에너지 소비 측면에서 평균 8%, 클러스터 헤드의 에너지 소비 측면에서 평균 6.4%의 효율성을 얻었고, 네트워크 확장성에 다른 에너지 소비 분포는 LEACH-C, HEED 기법보다 7.5%의 효율성을 얻을 수 있었다.

  • PDF

전국자연환경조사를 활용한 포유류 서식지 유형의 분류 (The Habitat Classification of mammals in Korea based on the National Ecosystem Survey)

  • 이화진;하정욱;차진열;이중효;윤희남;정철운;오홍식;배소연
    • 환경영향평가
    • /
    • 제26권2호
    • /
    • pp.160-170
    • /
    • 2017
  • 본 연구는 2006년부터 2012년까지 수행된 제3차 전국자연환경조사 포유류 데이터(70,562개)를 활용하여 국내에서 서식하는 포유류의 서식지 유형을 클러스터링하고 서식지 유형에 나타나는 종의 특징을 파악하고자 하였다. 제3차 전국자연환경조사의 야장에 기록된 서식지 유형 중에서 15개의 키워드를 뽑아 재분류하여 포유류 서식지유형을 통계 분석하였다. 서식지 유형 군집분석에서는 30회 이상 기록된 14개의 서식지 유형을 대상으로 비계층적 클러스터 분석(k 평균 클러스터 분석), 계층적 클러스터 분석, 비계량형 다차원척도법을 시행하였다. 2006년에서 2012년까지 전국에서 수집된 제3차 전국자연환경조사를 통해 확인된 포유류는 총 7목 16과 39종이었다. 서식지 유형에 대한 분류는 11개로 클러스터를 분류했을 때 단순구조지수가 가장 높았다(ssi = 0.07). 계층적 클러스터 분석으로 서식지 유형들 간의 유사성과 위계를 확인해 본 결과, 포유류에게는 주거지가 가장 차별된 서식지 유형이었고, 그 다음은 하천과 해안이 병합된 클러스터였다. 비계량형 다차원척도 분석 결과, 포유류에게 가장 차별된 서식지유형인 주거지의 경우 생쥐와 집쥐 두 종이 제한적으로 나타났으며, 해안과 하천의 경우 수달이 제한적으로 나타났다. 연구결과를 종합해보면, 포유류의 서식지 유형은 크게 산림을 주요 서식지와 이동경로로 이용하는 산림형과, 물을 주요 서식지로 이용하는 하천형, 주거지 인근에서 서식하는 주거형, 곡류나 씨앗을 주 먹이원으로 하는 저지대형 등 4가지로 구분할 수 있다.