• 제목/요약/키워드: clustering method

검색결과 2,551건 처리시간 0.043초

자기 조직화 맵 기반 유사 검색 시스템 (SOM-Based $R^{*}-Tree$ for Similarity Retrieval)

  • 오창윤;임동주;오군석;배상현
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.507-512
    • /
    • 2001
  • 특징 기반 유사성은 멀티미디어 데이터베이스 시스템에서 중요한 연구 쟁점이 되고 있다. 멀티미디어 데이터의 특징이 멀티미디어 객체들을 구별하는데 유용하다지만 특징 벡터의 차원의 수가 증가함에 따라 종래의 다차원 데이터 구조의 성능은 떨어지는 경향이 있다. $R^{*}-Tree$는 R-Tree의 가장 성공적인 병형으로 본 논문에서 고차원 특징 벡터를 위한 새로운 인덱싱 방법으로서 자기 조직화 맵 기반 $R^{*}-Tree$를 제안한다. 자기 조직화 맵 기잔 $R^{*}-Tree$는 고차원 데이터를 좀더 스칼라화해서 탐색할 수 있도록 SOM과 $R^{*}-Tree$를 결합하여 구축한 인덱싱 기법이다. 자기 조직 맵은 고차원 특징 벡터들로부터 2차원 공간으로의 맵핑을 제공한다. 그러나 맵을 위상 특징 맵이라 하고 인접 노느에서 서로 유사한 특징 벡터들을 모아서 입력데이터의 특징 공간들 속에 유사성을 보존하는데 위상 특징 맵의 각 노드는 코드북 벡터를 가지고 있다. 실험적으로 4만개의 이미지로부터 추출된 색깔 특징 벡터들을 이용하여 자기 조직화 맵 기반 $R^{*}-Tree$의 검색시간 비용과 자기 조직화 맵과 $R^{*}-Tree$의 검색 시간 비용을 비교한다. 그 결과 $R^{*}-Tree$를 구축하는데 필요한 노드 수와 검색 시간 비용이 감소됨으로써 자기 조직화 맵 기반 $R^{*}-Tree$는 자기 조직화 맵과 $R^{*}-Tree$보다 훨씬 우수한 성능을 나타냄이 입증되었다.

  • PDF

최적 pRBFNNs 패턴분류기 기반 2차원 영상과 ASM 알고리즘을 이용한 얼굴인식 알고리즘 설계 (Design of Optimized pRBFNNs-based Face Recognition Algorithm Using Two-dimensional Image and ASM Algorithm)

  • 오성권;마창민;유성훈
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.749-754
    • /
    • 2011
  • 본 연구에서는 최적 pRBFNNs 패턴분류기 기반 2차원 영상과 ASM 알고리즘을 이용한 얼굴인식 시스템을 설계하고자 한다. 기존의 2차원 영상 기반 얼굴 인식 기법들은 인식하고자 하는 객체의 영상내의 위치, 크기 및 배경의 존재 유무에 따라 인식률이 영향을 받는 단점이 있으며, 본 연구에서는 이를 보완하기 위하여 관심 영역 내에서의 얼굴 영역 추출 및 특징 추출기법을 이용한 얼굴인식 방법을 소개한다. 본 연구에서는 CCD 카메라를 이용하여 영상을 획득하고 히스토그램 평활화를 이용하여 조명으로 왜곡된 영상정보를 개선한다. AdaBoost 알고리즘을 이용하여 얼굴영역을 검출하고 ASM을 통하여 얼굴 윤곽선 및 형상을 추출하여 개인 프로필을 구성한 후 PCA 알고리즘을 사용하여 고차원 얼굴데이터의 차원을 축소한다. 그리고 인식 모듈로서 pRBFNNs 패턴분류기를 제안한다. 제안된 다항식 기반 RBFNNs은 조건부, 결론부, 추론부 세 가지의 기능적 모듈로 구성되어 있고 조건부는 퍼지 클러스터링을 사용하여 입력 공간을 분할하고, 결론부는 분할된 로컬 영역을 다항식 함수로 표현한다. 또한 차분진화 알고리즘을 이용하여 제안된 분류기의 파라미터, 즉, 학습률, 모멘텀 계수, 퍼지 클러스터링의 퍼지화 계수를 최적화한다. 제안된 다항식 기반 RBFNNs는 얼굴 인식을 위한 패턴분류기로서 직접 CCD 카메라로부터 입력받은 데이터를 영상 보정, 얼굴 검출 및 특징 추출 등과 같은 데이터 전 처리 과정을 포함하여 고차원 데이터로 이루어진 얼굴 영상에 대한 인식 성능을 확인한다.

유사어 벡터 확장을 통한 XML태그의 유사성 검사 (Similarity checking between XML tags through expanding synonym vector)

  • 이정원;이혜수;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.676-683
    • /
    • 2002
  • XML(extensible Markup Language)문서가 웹 문서의 표준으로 자리 매김 할 수 있는 가장 큰 성공요인은 사용자가 문서 타입을 기술할 수 있는 유연성(flexibility)이다. 그러나 XML의 유연성으로 야기되는 문제점은 동일한 의미를 표현하기 위해 XML문서 작성자마다 서로 다른 태그명과 구조를 사용한다는 점이다. 즉 서로 다른 태그 집합, 요소(element), 속성(attribute)에 대한 서로 다른 이름 또는 다른 문서 구조로 인해 다른 태그로 표현된 문서는 서로 다른 부류의 문서로 간주되기 쉽다. 따라서 본 논문은 XML태그에 내재된 의미 정보(semantic information)와 구조 정보(structured information)를 추출하여 의미적으로 최대한 유사한 동의어로 확장하고, XML문서의 확장된 태그간의 의미적 유사도를 비교 분석할 수 있는 개념 기반의 태그 패턴 매처(Tag Pattern Matcher)를 설계 구현하였다. 두 XML문서의 태그간의 의미적 유사도에 가중치를 부여하여 기존의 비구조적인(semi-structured) 문서를 위한 벡터 스페이스 모델(vector space model)을 확장함으로써 두 XML문서가 유사한지를 파악할 수 있다.

내용 기반 음악 정보 검색에서 주제 선율의 변화 패턴을 이용한 색인 및 검색 기법 (Indexing and Retrieval Mechanism using Variation Patterns of Theme Melodies in Content-based Music Information Retrievals)

  • 구경이;신창환;김유성
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.507-520
    • /
    • 2003
  • 본 연구에서는 내용 기반 음악 정보 검색 시스템의 검색 속도를 증진하기 위해 음악의 대표 선율인 주제 선율을 추출하여 주제 선율 색인을 구성하고 이를 이용한 효율적인 내용 기반 음악 정보 검색 기법을 제안하였다. 추출된 주제 선율을 다차원 공간 색인 기법인 M-tree를 이용하여 주제 선율 색인으로 구성하기 위해 주제 선율의 평균 음 높이 변화량과 평균 음 길이 변화량을 이용하였으며 검색의 정확도를 증진하기 위해 음 높이 변화 패턴을 요약한 높이 시그니처와 음 길이 변화 패턴을 요약한 길이 시그니처를 이용하였다. 또한 제안된 내용 기반 음악 정보 검색 기법에서는 사용자의 질의 선율로부터 질의 선율의 패턴 정보를 구성하고 M-tree의 k-근접 검색 및 범위 검색 기법을 이용하여 사용자의 질의 선율과 유사한 주제 선율을 포함하고 있는 음악 정보를 검색한다. 검색된 결과로부터 순위 부여한 후 사용자 피드백을 하여 사용자의 만족도를 증진하기 위한 특성을 포함하도록 하였다. 또한, 본 논문에서 제안된 주제 선율 색인 기법 및 내용 기반 검색 기법을 포함한 내용 기반 음악 정보 검색 시스템의 프로토타입을 구현하여 제안된 기법의 실효성을 입증하였다.

공간적 자기상관성의 정도에 따른 MAUP에서의 스케일 효과 연구 - LBSNS 데이터를 중심으로 - (A Study on Scale Effects of the MAUP According to the Degree of Spatial Autocorrelation - Focused on LBSNS Data -)

  • 이영민;권필;유기윤;허용
    • 대한공간정보학회지
    • /
    • 제24권1호
    • /
    • pp.25-33
    • /
    • 2016
  • 포인트 속성의 위치 기반 소셜 네트워크 서비스(Location-Based Social Network Services, LBSNS) 데이터를 멀티스 케일의 타일맵상에 효과적으로 시각화하기 위해서는 격자 기반으로 군집화하여 표현해야 할 필요성이 있다. 이때 격자의 크기 및 개수를 결정해야 하는데, 이에 대한 기준은 정해진 것이 없으며 데이터의 종류와 분석 목적에 따라 달라지므로 연구자의 주관이 개입될 수밖에 없다. 이때 연구 결과에 영향을 끼치는 공간단위 임의성의 문제(Modifiable Areal Unit Problem, MAUP)가 발생한다. 본 연구에서는 LBSNS 중 지오태깅(geotagging)된 트위터(Twitter) 데이터를 대상으로 하여 이러한 MAUP의 영향을 스케일 효과(scale effect)의 측면에서 탐색해 보고자 하였다. 이를 위해 공간오차모델(spatial error model)을 이용하여 데이터의 공간적 자기상관성(spatial autocorrelation)의 정도를 조절하였으며, 이에 대해 격자의 크기를 달리함에 따른 공간적 자기상관성의 변화를 Moran's I를 통해 분석하였다. 실험 결과, 원 데이터에는 양의 공간적 자기상관성이 존재하는 것을 확인하였으며, 이러한 경우에는 공간오차모델의 공간자기회귀계수(spatial autoregressive coefficient)의 값이 증가할수록 공간적 자기상관성이 감소하는 것을 알 수 있었다. 이러한 특성을 이용하여 트위터 데이터의 공간적 자기상관성의 강도를 5단계로 조절하였으며, 각 단계에 대하여 격자의 크기를 9단계로 나누어 각각에서의 Moran's I를 계산하였다. 그 결과, 합역 수준이 높아질수록 공간적 자기상관성이 증가하다가 격자의 크기가 600m에서 1,000m 사이일 때 감소하는 것을 알 수 있었으며, 공간적 자기상관성이 강할수록 MAUP에서의 스케일 효과는 감소하는 경향이 있는 것을 확인하였다.

느티만가닥버섯의 분자유전학적 분류 및 품종특이적 DNA 마커 탐색 (Molecular Genetic Classification of Hypsizigus marmoreus and Development of Strain-specific DNA Markers)

  • 임윤정;이창윤;박정은;김상우;이현숙;노현수
    • 한국균학회지
    • /
    • 제38권1호
    • /
    • pp.34-39
    • /
    • 2010
  • 느티만가닥버섯의 품종구분을 위하여 국내 버섯보존기관으로부터 수집한 30종의 품종에 대한 RAPD 분석을 실시하였다. 이를 위하여 고체배지상의 균사로부터 염색체 DNA를 분리하였고 이를 주형으로 하여 3개의 random primer로 PCR 반응을 수행하였다. 그 결과 각 PCR 반응에서 200 bp에서 3000 bp 범위의 크기를 가진 DNA 밴드 약 30종이 관찰되었다. DNA 밴드 패턴은 UPGMA 방법으로 분석하여 그 결과를 dentrogram으로 나타내었다. 느티만가닥버섯은 2개의 클러스터로 분석되었으며, 클러스터 1은 다시 3개의 작은 그룹으로 나눌 수 있었다. 반면, 클러스터 2의 경우에는 유전적으로 클러스터 1보다 다양한 품종으로 구성되어 있었다. 흥미롭게도 덕유산에서 채집된 야생종 Hm3-10의 경우 어느 클러스터에도 속하지 않는 고유의 품종임을 확인하였다. RAPD 결과 나타나는 품종별 고유의 DNA 밴드를 품종특이적 마커로 개발하기 위하여, Hm0-4 품종의 250 bp 특이밴드를 TA-클로닝하고 염기서열을 결정하였다. 결정된 염기서열을 바탕으로 PCR primer를 디자인하였고 이를 이용하여 PCR 반응을 수행하였다. 그 결과 250 bp DNA 밴드는 Hm0-4 품종에서만 관찰되었으며 이는 이러한 접근법이 품종특이적 마커개발에 잘 적용됨을 보여주는 것이다.

Interfacial disruption effect on multilayer-films/GaN : Comparative study of Pd/Ni and Ni/Pd films

  • 김종호;강희재;김차연;전용석;서재명
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2000년도 제18회 학술발표회 논문개요집
    • /
    • pp.113-113
    • /
    • 2000
  • 직접천이형 wide band gap(3.4eV) 반도체중의 하나인 GaN를 청색 및 자외선 laser diode, 고출력 전자장비 등으로 응용하기 위해서는 낮은 접합저항을 갖는 Ohmic contact이 선행되어야 한다. 그러나 만족할만한 p-type GaN의 Ohmic contact은 아직 실현되고 있지 못하며, 이는 GaN와 접합 금속과의 구체적인 반응의 연구를 필요로 한다. 본 연구에서 앞서 Pt, Pt, Ni등의 late transition metal을 p-GaN에 접합시킨 결과 이들은 접합 당시 비교적 평탄하나 후열 처리과정에서 비교적 낮은 온도에서 기판과 열팽창계수의 차이로 인하여 평탄성을 잃어버리면서 barrier height가 증가한다는 사실을 확인하였다. 따라서 본 연구에서는 이러한 열적 불안정성을 극복하기 위하여 Ni과 Pd를 차례로 증착하고 가열하면서 interfacial reaction, film morphology, Fermi level의 움직임을 monchromatic XPS(x-ray photoelectron spectroscopy) 와 SAM(scanning Auger microscopy) 그리고 ex-situ AFM을 이용하여 밝히고자 하였다. 특히 후열처리에 의한 계면 반응에 수반되는 구성 금속원소 간의 합금현상과 금속 층의 평탄성이 밀접한 관계가 있다는 것을 확인하였다. 이러한 합금과정에서 나타나는 금속원소들의 중심 준위의 이동을 체계적으로 규명하기 위해서 Pd1-xNix와 Pd1-xGax 합금들의 표준시료를 arc melting method로 만들어 농도에 따른 금속원소들의 중심 준위의 이동을 측정하여, Pd/Ni/p-GaN 및 Ni/Pd/p-GaN 계에서 열처리 온도에 따른 interfacial reaction을 확인하였다. 그 결과 두 계가 상온에서 nitride 및 alloy를 형성하지 않고 고르게 증착되고, 열처리 온도를 40$0^{\circ}C$에서 $650^{\circ}C$까지 증가시킴에 따라 계면반응의 부산물인 metallic Ga은 증가하고 있으마 nitride는 여전히 형성되지 않는 것을 확인하였다. 증착당시 Ni이 계면에 있는 Pd/Ni/p-GaN의 경우에는 52$0^{\circ}C$까지의 열처리에 의하여 Ni과 Pd가 골고루 섞이고 그 평탄성도 유지되고 barier height의 변화도 없었다. 더 높은 $650^{\circ}C$ 가열에 의해서는 surface free energy가 작은 Ga의 활발한 편석 현상으로 인해 표면은 Ga이 풍부한 Pd-Ga의 합금층으로 덮이고, 동시에 작은 pinhole들이 발생하며 barrier height도 0.3eV 가량 증가하게 된다. 반면에 증착당시 Pd이 계면에 있는 Ni/Pd/p-GaN의 경우에는 40$0^{\circ}C$의 가열까지는 두 금속이 그들 계면에서부터 섞이나, 52$0^{\circ}C$의 가열에 의해 이미 barrier height가 0.2eV 가량 증가하기 시작하였다. 더 높은 $650^{\circ}C$가열에 의해서는 커다란 pinhole, 0.5eV 가량의 barrier height 증가, Pd clustering이 동시에 관찰되었다. 따라서 Ni과 Pd의 일함수는 물론 thermal expansion coefficient가 거의 같으며 surface free energy도 거의 일치한다는 점을 감안하면, 이렇게 뚜렷한 열적 안정성의 차이는 GaN와 contact metal과의 반응시작 온도(disruption onset temperature)의 차이에 기인함을 알 수 있었다. 즉 계면에서의 반응에 의해 편석되는 Ga에 의해 박막의 strain이 이완되면, pinhole 등의 박막결함이 줄어 들고, 이는 계면의 N의 out-diffusion을 방지하여 p-type GaN의 barrier height 증가를 막게 된다.

  • PDF

유통 중인 고추 품종에 대한 Microsatellite 마커 Data Base 구축 (Construction of a Microsatellite Marker Database of Commercial Pepper Cultivars)

  • 권용삼;홍지화;최근진
    • 원예과학기술지
    • /
    • 제31권5호
    • /
    • pp.580-589
    • /
    • 2013
  • 국내에서 최근에 유통되고 있는 고추 170품종을 대상으로 microsatellite 마커를 이용하여 DNA 프로파일 데이터베이스를 구축하기 위하여 품종식별력이 높은 분자표지의 선정 및 이를 활용한 품종 식별력 및 유전적 유사도 검정 등에 대한 연구를 수행하였다. 고추 형태적 특성이 다른 11품종을 302개의 microsatellite 마커로 검정하여 24개의 다형성이 높은 마커를 선정한 다음 170품종에 대한 DNA 프로파일 데이터베이스를 구축하였다. 고추 170품종을 24개의 microsatellite 마커로 분석하였을 때 마커당 평균 대립유전자수는 6.83개로 나타났고, 최소 2개부터 15개까지 다양한 분포를 나타내었다. PIC 값의 경우 0.324-0.873 범위에 속하였으며 평균값은 0.673으로 높게 나타났다. Microsatellite 마커의 대립유전자를 이용하여 고추 170품종에 대한 계통도를 작성하였을 때 과실의 형태에 따라 3개의 그룹으로 크게 나누어졌으며 모든 품종이 microsatellite 마커의 유전자형에 의해 식별이 되는 것으로 나타났다. 이 연구결과에 의해 개발된 고추 품종별 DNA 프로파일 데이터베이스는 품종보호출원 품종의 선 DNA 검정을 통한 대조품종 선정, 구별성, 균일성, 안정성의 재확인에 매우 유용하게 이용되어질 수 있어 향후, 품종보호권 강화 등에 크게 기여할 수 있을 것으로 사료된다.

퍼지 클러스터링을 이용한 다중 스펙트럼 자기공명영상의 분할 (Segmentation of Multispectral MRI Using Fuzzy Clustering)

  • 윤옥경;김현순;곽동민;김범수;김동휘;변우목;박길흠
    • 대한의용생체공학회:의공학회지
    • /
    • 제21권4호
    • /
    • pp.333-338
    • /
    • 2000
  • 본 논문에서는 T1 강조영상, T2 강조 영상 그리고 PD의 영상의 특징을 상호 보완적으로 이용한 자동적인 영상 분할법을 제안한다. 제안한 분할 알고리듬은 3단계로 이루어지는데, 첫 단계에서는 PD 영상으로부터 대뇌 마스크를 획득한 후, T1과 T2, PD의 입력 영상에 대뇌 마스크를 씌워 각각의 대뇌 영상을 추출하고, 둘째 단계에서는 대뇌 내부 조직에 해당하는 두드러진 클러스터(outstanding cluster)를 3차원 클러스터들 중에서 선택한다. 3차원 클러스터는 최적스케일 영상(optimal scale image)으로 이루어지는 3차원 공간상에서 화소가 밀집된 봉우리들을 교집합해서 생성되는 클러스터로 결정한다. 최적스케일 영상은 각 2타원 히스토그램에 스케일 스페이스 필터링을 적용시키고 그래프(graph) 구조를 검색하여 2차원 히스토그램의 모양을 가장 잘 나타내는 봉우리(peak) 영상을 최적 스케일 영상으로 선택한다. 마지막 단계에서는 앞에서 찾은 두드러진 클러스터의 중심값을 FCM 알고리듬의 초기중심 값으로 두고, FCM 알고리듬을 이용하여 대뇌 영상을 분할한다. 제안한 분할 알고리듬은 정확한 클러스터의 중심값을 계산함으로 초기 값을 영향을 많이 받는 FCM 알고리듬의 단점을 보완하였고 다중 스펙트럼 영상의 특성을 조합하여 분할에 이용함으로 단일 스펙트럼 영상만을 이용하는 방법보다 향상된 결과를 얻을 수 있었다.

  • PDF

기계학습과 품질 메트릭을 활용한 객체간 링크결합강도 분류에 관한 연구 (Classifying a Strength of Dependency between classes by using Software Metrics and Machine Learning in Object-Oriented System)

  • 정성균;안재균;여윤구;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권10호
    • /
    • pp.651-660
    • /
    • 2013
  • 객체지향 설계는 상속 및 은닉과 같은 개념이 도입되어 소프트웨어 개발 생산성 및 품질 향상을 가져다 주었다. 하지만 소프트웨어의 크기가 커지게 되면 이를 구성하는 객체의 수가 증가하고 이에 비례하여 상속 또는 호출과 같은 객체간 결합관계가 증가한다. 또한 이러한 객체간 결합관계는 객체지향 소프트웨어의 복잡도와 밀접한 관계를 갖고 있는데 다수의 결합관계는 소프트웨어의 복잡도를 높이어 결국에는 소프트웨어 품질저하로 이어지게 된다. 그래서 소프트웨어 개발 분야에서는 컴포넌트 기반의 설계와 같은 방법을 통하여 객체간 결합관계를 명확히 함으로써 소프트웨어의 품질을 높이려는 노력이 진행되고 있다. 또한 객체 품질 메트릭을 정의, 산출하여 소프트웨어의 품질을 측정하고 이를 활용하여 높은 품질의 소프트웨어가 될 수 있는 방법들을 찾는 연구가 함께 진행되고 있다. 이러한 연구의 일환으로 본 연구는 컴포넌트와 같은 시스템 분해 관점에서 객체 상호간 결합링크 속성의 분석을 통하여 서브시스템 분해를 위한 기초자료를 구축하고자 한다. 이전까지의 연구들이 개별객체를 평가하고 수치화하여 이를 누적하는 방식이었다면 이번 연구는 소프트웨어 복잡도와 밀접한 관계가 있는 객체간 상호간의 링크결합관계를 분석 대상으로 선정하고 객체간 링크의 속성분석 및 결합강도 예측에 기계학습을 활용한 새로운 관점에서의 소프트웨어 분석 방법을 제안한다.