• 제목/요약/키워드: Statistical similarity

검색결과 311건 처리시간 0.027초

내용기반 이미지 검색을 위한 색상, 텍스쳐, 에지 기능의 통합 (Integrating Color, Texture and Edge Features for Content-Based Image Retrieval)

  • 마명;박동원
    • 감성과학
    • /
    • 제7권4호
    • /
    • pp.57-65
    • /
    • 2004
  • 본 논문에서는 color, texture, shape의 정보를 통합 이용하여 내용기반 영상검색 시스템의 성능을 향상시키는 기법을 고찰하였다. 먼저 영상에 내재되어 있는 color를 분석 추출하여 몇 개의 대표색으로 요약 표현한 다음, 이를 활용한 근사치 측정도를 고안하였다. Texture정보 분석에 있어서는 영상의 주축 행렬 데이터를 통계적 접근 방법으로 추출하였다. Edge분석의 방법으로는 Edge 막대그래프에서 색상변환, 양자화, 필터링에 관련된 정보를 선행처리 후 Edge 정보를 추출하였다. 마지막으로, 본 연구의 결과인 내용기반 영상검색 시스템의 효율성을 precision-recall 분석과 실험적 결과를 통하여 입증하였다.

  • PDF

단세포 RNA 시퀀싱 데이터를 위한 가중변수 스펙트럼 군집화 기법 (One-step spectral clustering of weighted variables on single-cell RNA-sequencing data)

  • 박민영;박세영
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.511-526
    • /
    • 2020
  • 단세포 RNA 시퀀싱 데이터(single-cell RNA-sequencing data, 이하 단세포 RNA 데이터)는 세포 조직으로부터 추출한 각 단세포 별 유전자의 신호를 기록한 데이터로, 세포 간의 이질성을 파악하는 것을 주요 목적으로 한다. 그러나 단세포 RNA 데이터는 샘플링 및 기술적인 한계로 인해 결측비율이 높고, 노이즈가 크다. 이러한 이유 때문에 기존의 군집화 방법을 적용하는 데에 한계가 존재한다. 본 논문에서는 단세포 RNA 데이터 분석에서 모티브를 얻어 스펙트럼 군집화(spectral clustering) 기반의 방법을 제안한다. 특히 유사도 행렬(similarity matrix) 계산에서 유전자 별로 가중치를 부여하여 기존의 단세포 데이터 분석 방법과 차별화하였다. 제안하는 군집화 방법은 유전자별 가중치를 부여함과 동시에 세포를 군집화한다. 군집화는 반복 알고리즘을 통해 제안하는 비볼록식(non-convex optimization)을 풀어 진행한다. 또한 실데이터 적용과 시뮬레이션을 통해 제안하는 군집화 방법이 기존의 방법보다 군집을 잘 구분하는 것을 보인다.

MFAC를 사용한 근접관계의 분류 (Classification of Proximity Relational Using Multiple Fuzzy Alpha Cut(MFAC))

  • 류경현;정환묵
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.139-144
    • /
    • 2008
  • 일반적으로 의사결정의 대상이 되는 현실 시스템은 매우 가변적(variable)이며 때로는 많은 불확실성(uncertainty)이 포함된 상황에 놓일 수 있다. 이러한 문제를 해결하기 위해서, 통계적 방법으로 유의수준이나 확신도, 민감도 분석 등이 사용된다. 본 논문에서는 유사성 평가를 가진 분류 결과의 명확성을 개선하기 위해 MFAC(Multiple Fuzzy Alpha Cut)을 기반으로한 퍼지 의사결정에 대한 방법을 제안한다. 제안된 방법에서 MFAC는 상대적 해밍거리와 max-min 방법 사이의 근접관계에서 근접도를 가지고 다수의 ${\alpha}$-level를 추출하기 위해 그리고 MFAC에 의해 추출된 데이터사이의 분할 구간과 연관된 데이터의 개수를 줄이기 위해 사용된다. 의사결정의 최종 대안을 선택하기 위해서 가중치를 계산한다. 실험결과로부터 제안된 방법은 기존 방법의 분류 성능보다 더 간단하고 명백하며 통계적 방법을 통해 표본 데이터의 유의성을 검정함으로써 의사결정자를 위해 효율적으로 대안을 결정한다는 사실을 알 수 있다.

딥러닝을 이용한 기형도 시의 핵심 이미지 분석 (Deep Learning Application for Core Image Analysis of the Poems by Ki Hyung-Do)

  • 고광호
    • 문화기술의 융합
    • /
    • 제7권3호
    • /
    • pp.591-598
    • /
    • 2021
  • 전후방 단어들의 인접 여부 혹은 후방 단어들의 순서를 학습할 수 있는 통계 기법인 SVD, 딥러닝 기법인 CBOW, LSTM으로 단어벡터를 구할 수 있다. 이렇게 학습된 단어벡터를 기형도의 시에 적용하여 핵심 이미지를 대표하는 단어들과 유사도 높은 단어를 구해서 분석해 보았다. 시적 이미지와 어울리지 않는 단어들이 연산되기도 하지만 그 단어가 사용된 시적 맥락에서는 기준 단어와 유사한 이미지를 표현하고 있음을 알 수 있었다. 이러한 단어벡터를 활용하면 핵심 이미지를 대표하는 단어들의 관계와 유사한 관계의 다른 단어들도 유추할 수 있다. 따라서 통계 기법인 SVD 및 딥러닝 기법인 CBOW와 LSTM으로 구한 단어벡터의 유사도 및 유추 연산을 통해 대상 시를 다양하고 심도 깊게 분석할 수 있다.

Generation and Detection of Cranial Landmark

  • Heo, Suwoong;Kang, Jiwoo;Kim, Yong Oock;Lee, Sanghoon
    • Journal of International Society for Simulation Surgery
    • /
    • 제2권1호
    • /
    • pp.26-32
    • /
    • 2015
  • Purpose When a surgeon examines the morphology of skull of patient, locations of craniometric landmarks of 3D computed tomography(CT) volume are one of the most important information for surgical purpose. The locations of craniometric landmarks can be found manually by surgeon from the 3D rendered volume or 2D sagittal, axial, and coronal slices which are taken by CT. Since there are many landmarks on the skull, finding these manually is time-consuming, exhaustive, and occasionally inexact. These inefficiencies raise a demand for a automatic localization technique for craniometric landmark points. So in this paper, we propose a novel method through which we can automatically find these landmark points, which are useful for surgical purpose. Materials and Methods At first, we align the experimental data (CT volumes) using Frankfurt Horizontal Plane (FHP) and Mid Sagittal Plane(MSP) which are defined by 3 and 2 cranial landmark points each. The target landmark of our experiment is the anterior nasal spine. Prior to constructing a statistical cubic model which would be used for detecting the location of the landmark from a given CT volume, reference points for the anterior nasal spine were manually chosen by a surgeon from several CT volume sets. The statistical cubic model is constructed by calculating weighted intensity means of these CT sets around the reference points. By finding the location where similarity function (squared difference function) has the minimal value with this model, the location of the landmark can be found from any given CT volume. Results In this paper, we used 5 CT volumes to construct the statistical cubic model. The 20 CT volumes including the volumes, which were used to construct the model, were used for testing. The range of age of subjects is up to 2 years (24 months) old. The found points of each data are almost close to the reference point which were manually chosen by surgeon. Also it has been seen that the similarity function always has the global minimum at the detection point. Conclusion Through the experiment, we have seen the proposed method shows the outstanding performance in searching the landmark point. This algorithm would make surgeons efficiently work with morphological informations of skull. We also expect the potential of our algorithm for searching the anatomic landmarks not only cranial landmarks.

유역의 수문학적 상사성을 이용한 Nash 모형의 불확실성 평가 (Assessment of Uncertainty for Applying Nash's Model Using the Hydrologic Similarity of Basins)

  • 성기원
    • 한국수자원학회논문집
    • /
    • 제36권3호
    • /
    • pp.399-411
    • /
    • 2003
  • Nash의 관측평균순간단위도의 신뢰구간을 결정하는 기법을 개발하였다. 이 방법은 두 매개변수를 Box-Cox 변환과 유역의 상사성관계식을 이용하여 이변수정규분포의 확률변수화하고 이들의 선형 상관관계를 이용한 통계적 추정과정과 더불어 parametric bootstrap 방법을 이용한 단위도의 신뢰구간 산정 등으로 구성된다. 또한 이 방법은 미계측유역에 대한 단위도 추정에도 이용이 가능한 특징을 갖고 있다. 위천유역에 대하여 제안된 방법을 적용한 결과 제시된 방법론은 단위도의 불확실성을 평가하고 그리고 미계측 유역에 대한 매개변수 추정에 있어서 적절한 대안임을 확인할 수 있었다.

자기 유사성을 갖는 World Wide Web 트래픽 소스 모델링에 관한 연구 (A Study on the World Wide Web Traffic Source Modeling with Self-Similarity)

  • 김동일
    • 한국정보통신학회논문지
    • /
    • 제6권3호
    • /
    • pp.416-420
    • /
    • 2002
  • 네트워크 트래픽의 연구 동향은 LAN, WAN 및 VBR 비디오 트래픽이 통계학적으로 자기 유사과정에 의해 더욱 더 잘 모델링화 된다는 사실을 입증하고 있다. 이것은 기존의 단기간 의존성만을 고려한 포아손 과정에 비해 다른 이론적 특성을 가진다. 즉 광범위한 시계열상에서 aggregation의 정도가 변하더라도 통계학적으로 동일한 특성을 지니게 된다는 것이다. 본 논문에서는 이러한 자기유사과정을 갖는 데이터를 실시간 운영중인 네트워크로부터 측정하여 트래픽을 모델링하고, 비교분석하므로서 다양한 데이터를 지원하는 초고속 네트워크의 성능분석에 적용할 수 있으리라 여겨진다.

분광 상호정보를 이용한 하이퍼스펙트럴 영상분류 (Classification of Hyperspectral Images Using Spectral Mutual Information)

  • 변영기;어영담;유기윤
    • 대한공간정보학회지
    • /
    • 제15권3호
    • /
    • pp.33-39
    • /
    • 2007
  • 하이퍼스펙트럴 영상자료는 객체에 대한 많은 정보를 함유하고 있어 객체의 보다 정확한 분류가 가능하다. 본 논문에서는 하이퍼스펙트럴 영상분류를 위하여 SMI(Spectral Mutual Information)이라는 새로운 스펙트럼 유사도 측정기법을 제안하였다. 본 방법은 정보이론 분야에서 대두된 상호정보량의 개념을 차용하여 고안되었으며 스펙트럼간의 통계적 의존성을 측정할 수 있다. SMI는 영상의 각 화소스펙트럼을 확률변수로 간주하고 두 스펙트럼간의 유사 상호정보량을 통하여 유사도를 측정함으로써 영상을 분류한다. 제안된 기법의 효율성을 평가하기 위해 기존에 개발된 SAM, SSV 분류기법을 이용하여 동일지역에 대해 분류를 수행하고 분류 정확도를 비교 평가하였다. 실험결과 제안한 SMI 기법은 하이퍼스펙트럴 영상분류에 유용하게 적용될 수 있으리라 판단된다.

  • PDF

우리나라에서 불법 유통되는 메스암페타민의 불순물 프로화일 분석 (Impurity Profiling Analysis of Illicit Methamphetamine Seized in Korea)

  • 유영찬;정희선;김은미;김선춘;김승환
    • 약학회지
    • /
    • 제42권6호
    • /
    • pp.627-633
    • /
    • 1998
  • Impurity profiling analysis of methamphetamine seized in Korea was investigated for the evidential and intelligent purpose. Samples were extracted with ethylacetate which contai ns internal standard of dioctylsebacate under basic condition and extracts were analyzed by GC-FID. Ephedrine, chloroephedrine & 1,2-dimethyl-3-phenylaziridine were identified impurities in illicit methamphetamine by GC-MS. These impurities revealed that most of abused methamphetamine in Korea were synthesized from ephedrine as a starting material. For the classification of samples. firstly, 24 impurity peaks were selected after inspection of every peak in 50 samples as the specific markers of impurities. Secondly, corresponding peak retention time and area ratio to the internal standard were calculated and database was created with values of 24 peaks by in-house program. Finally, cluster analysis was attempted with the resultant profiles using the STAR plot, which was based on the Euclidian distance for evaluating similarity among samples. A total of 76 samples were divided into 8 different groups within 90% statistical similarity and inter-batch samples showed similar impurity patterns by this procedure. In conclusion, the analysis of impurities is a suitable index for estimation the common or different origin of methamphetamine sample.

  • PDF

자기 유사성을 갖는 World Wide Web 트래픽 소스 모델링에 관한 연구 (A Study on the World Wide Web Traffic Source Modeling with Self-Similarity)

  • 김동일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.104-107
    • /
    • 2002
  • 네트워크 트래픽의 연구 동향은 LAN, WAN 및 VBR 비디오 트래픽이 통계학적으로 자기유사과 정에 의해 더욱 더 잘 모델링화 된다는 사실을 입증하고 있다. 이것은 기존의 단기간 의존성만을 고려한 포아손 과정에 비해 다른 이론적 특성을 가진다. 즉 광범위한 시계열상에서 aggregation의 정도가 변하더라도 통계학적으로 동일한 특성을 지니게 된다는 것이 다. 본 논문에서는 이러한 자기유사과정을 갖는 데이터를 실시간 운영중인 네트워크로부터 측정하여 트래픽을 모델링하고, 비교분석하므로서 다양한 데이터를 지원하는 초고속 네트워크의 성능분석에 적용할 수 있으리라 여겨진다.

  • PDF