• 제목/요약/키워드: Similarity metric

검색결과 111건 처리시간 0.021초

데이타 유사성 척도를 이용한 생산정보 데이타베이스의 분산 구조 설계 (A Database Design Method using a Data Similarity Metric: Its Application on Manufacturing Database)

  • 최태광;이준연;이국철;이춘열;김주현;이한표
    • 산업공학
    • /
    • 제8권3호
    • /
    • pp.269-278
    • /
    • 1995
  • 본 논문은 분산환경하에서 생산정보, 데이터 분석의 일 방안으로서 데이터의 관리 주체와 데이터들간의 유사성에 기초한 분산 기준을 제시한다. 제안된 분산기준은 데이터베이스 설계의 초기과정에서 네트워크 환경의 각 노드에서의 트랜젝션의 발생 수와 데이터 이용량의 예측이 용이하지 않은 경우에도 적용 가능하다는 점에서 가치를 지닌다. 제시된 설계 기준을 이용하여 생산정보 데이터베이스의 분산 모형을 설계, 제시한다.

  • PDF

Word Similarity Calculation by Using the Edit Distance Metrics with Consonant Normalization

  • Kang, Seung-Shik
    • Journal of Information Processing Systems
    • /
    • 제11권4호
    • /
    • pp.573-582
    • /
    • 2015
  • Edit distance metrics are widely used for many applications such as string comparison and spelling error corrections. Hamming distance is a metric for two equal length strings and Damerau-Levenshtein distance is a well-known metrics for making spelling corrections through string-to-string comparison. Previous distance metrics seems to be appropriate for alphabetic languages like English and European languages. However, the conventional edit distance criterion is not the best method for agglutinative languages like Korean. The reason is that two or more letter units make a Korean character, which is called as a syllable. This mechanism of syllable-based word construction in the Korean language causes an edit distance calculation to be inefficient. As such, we have explored a new edit distance method by using consonant normalization and the normalization factor.

동해 후포 연안 어류상의 수심별 차이 (Depth-dependent Variability of Fish Fauna in the Coastal Waters off Hupo, East Sea)

  • 이충일;정해근;권순만;한문희;설강수;박주면
    • 한국어류학회지
    • /
    • 제30권1호
    • /
    • pp.36-45
    • /
    • 2018
  • 본 연구는 동해 중부 후포 연안에 서식하는 어류 군집의 계절 및 수심에 따른 차이를 분석하였다. 연구에 사용된 어류 시료는 2011년과 2017년 사이에 계절별로 저층자망과 삼중자망을 이용하여 채집하였다. 총 17과에 속하는 46종의 어류가 채집되었고, 정점 A (수심 약 80 m)에서 36종, 정점 B (수심 약 140 m)에서는 22종이 채집되었다. 현존량에서 우점종은 기름가자미(Glyptocephalus stelleri), 용가자미(Cleisthenes pinetorum), 대구횟대 (Gymnocanthus herzensteini), 고무꺽정이(Dasycottus setiger) 였는데, 전자의 3종은 얕은 수심(정점 A)에서 더 많이 채집되었고, 후자 1종은 깊은 수심(정점 B)에서 현존량이 더 높았다. 조사해역 어류 군집의 종수, 현존량, 생체량, 종다양도는 수심에 따라 변하였지만, 시간(계절 또는 연도)에 따라 유의한 차이는 없었다. ANOSIM (Analysis of similarity) 결과 또한 어류 군집 구조는 수심에 따라 차이가 유의하였지만, 연도 또는 계절에 따라 유의한 차이가 없는 것으로 보여주었다. nMDS (Non-metric multidimensional scaling) 결과는 이러한 군집 구조가 시각적으로 뚜렷이 구분되었고, 이러한 구분은 수심과 수온 차이에 따른 우점종의 공간분포 차이 때문으로 설명할 수 있었다.

컴포넌트 메트릭스를 이용한 컴포넌트 설계 재정비 (Improvement of Component Design using Component Metrics)

  • 고병선;박재년
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.980-990
    • /
    • 2004
  • 컴포넌트 기반 개발 방법론은 클래스보다 더 큰 단위인 컴포넌트를 통해 높은 추상화와 재사용을 목표로 하는 개발 방법론이다. 컴포넌트 기반 시스템과 개별 컴포넌트의 품질 향상을 위해서는 개발 이전에 측정하고, 그 결과를 컴포넌트 개발 과정에 반영할 수 있어야 한다. 그러므로 컴포넌트 분석 및 설계 단계에 적용 가능한 컴포넌트 메트릭에 대한 연구가 필요하다. 따라서 본 논문에서는 컴포넌트 설계 정보에 기반한 컴포넌트 응집도, 결합도, 독립도 메트릭을 제안한다. 제안한 메트릭은 컴포넌트의 서비스를 제공하기 위한 오퍼레이션들의 동작 유형의 유사도에 기반 한다. 또한, 기능적으로 응집도가 높으며 복잡도가 낮고 유지 보수가 용이한 컴포넌트 설계가 되도록 하기 위한 클러스터링 기법을 사용한 컴포넌트 재설계 과정을 제안한다. 그리고 개발 이전에 컴포넌트 측정과 컴포넌트 재설계 과정을 통해 바람직한 컴포넌트 설계가 되도록 할 수 있음을 사례 연구를 통해 확인했다.

무선 모바일 네트워크상에서 퍼지 유사도를 이용한 적응형 멀티-레벨 스트리밍 서비스 (Adaptive Multi-level Streaming Service using Fuzzy Similarity in Wireless Mobile Networks)

  • 이종득
    • 한국산학기술학회논문지
    • /
    • 제11권9호
    • /
    • pp.3502-3509
    • /
    • 2010
  • 무선 모바일 네트워크 환경에서 스트리밍 서비스는 불확실한 동적 채널 속성으로 인하여 매우 중요한 이슈가 되고 있다. 특히 혼잡, 지연, 지터 등과 같은 오버헤드는 적응형 멀티-레벨 스트리밍 서비스의 성능 저하를 가져오고 있다. 본 논문에서는 무선 모바일 네트워크상에서의 가변 대역폭, 이동성 자원 제약 등으로 인한 성능 저하를 줄이기 위하여 AMSS 메카니즘을 제안한다. 제안된 AMSS는 다음과 같은 목적을 두고서 스트리밍 서비스를 최적화하는데 있다. 1) 퍼지 유사도 척도 이용, 2) 버퍼 오버플로우와 자원 소모로 인한 패킷 손실 최소화, 3) 혼잡과 지연으로 인한 패킷 손실 최소화. 시뮬레이션 결과 제안된 기법이 기존의 TCP-기반 기법, UDP-기반 기법, 그리고 VBM-기반 기법에 비해서 혼잡 제어와 패킷 손실율의 성능이 더 우수함을 보인다. 제안된 기법은 성능이 우수한 VBM-기반 기법과 비교해 볼 때 혼잡 제어율은 10%, 그리고 패킷 손실율은 8%의 성능 향상을 보였다.

내용기반 음악정보 검색을 위한 선율의 시계열 데이터 변환을 이용한 주제선율색인 구성 (Construction of Theme Melody Index by Transforming Melody to Time-series Data for Content-based Music Information Retrieval)

  • 하진석;구경이;박재현;김유성
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.547-558
    • /
    • 2003
  • 음악은 서로 다른 높이와 길이를 갖는 음표들을 주어진 박자 안에서 리듬성을 갖도록 나열한 패턴이기 때문에 음악의 선율정보는 시간의 흐름에 따라 정보 값을 갖는 시계열 데이터로 변환할 수 있다 따라서 본 연구에서는 음악의 특성을 유지하도록 선율정보를 정규화와 보정과정을 거쳐 시계열 데이터로 변환하고 유클리드 거리함수를 이용하여 선율정보간의 유사도를 계산하며, 유사성을 갖는 선율들을 클러스터링하여 각 클러스터의 대표성을 갖는 선율을 주제선율로서 추출한다. 그리고 추출된 주제선율로 다차원색인 기법인 M-tree를 이용하여 주제선율색인을 구성한다. 사용자 질의에 대한 검색과정에서도 색인 구성단계와 같은 과정으로 사용자 질의를 시계열 데이터로 변환하여 검색을 한다. 또한, 본 연구에서는 주제선율색인을 이용하여 내용기반 음악 검색을 실시하는 프로토타입 시스템을 개발하여 제안된 주제선율색인 구성기법의 실효성을 시험하였다. 실험결과에 따르면, 주제선율색인을 이용하면 원하는 음악 정보를 적은 공간을 사용하여 빠르고 정확하게 검색할 수 있음을 알 수 있다.

자동차 부품 누락 방지를 위한 자동 선별 시스템 (Development of a Inspection System for Automotive Part)

  • 신석우;이종훈;박상흡
    • 한국산학기술학회논문지
    • /
    • 제18권10호
    • /
    • pp.756-760
    • /
    • 2017
  • 자동차 부품 업체에서는 납기 준수, 생산 원가 절감, 품질 관리 향상 등의 고객의 필수적인 요구 사항를 만족하기 위하여 자동화를 추진하고 있다. 현재의 수작업을 통한 육안 검사 공정에서는 이러한 필수 요구 사항을 만족하기에는 불가능하다. 따라서 본 연구에서는 품질 관리 개선을 위하여 도어 힌지 브라켓 부품에 대한 현재의 수작업 육안 검사 공정을 대체할 수 있는 자동 선별 시스템을 제안하고자 한다. 본 제안은 도어 힌지 브라켓 부품의 용접너트 누락 불량 발생을 방지하여 고객사의 검사 요구사항 등을 만족할 수 있도록 설계하였다. 검사 공정 알고리즘 및 유사 척도 매칭 알고리즘 프로그램을 자동 선별 시스템에 적용하여 정상 제품과 불량 제품을 구별할 수 있도록 하였다. 검사 공정 알고리즘 및 유사 척도 매칭 알고리즘의 검증 시험을 통하여 검출정확도 98%의 성공적인 검사 결과를 나타내었고 이를 생산 현장에 적용하여 불량 제품감소에 따른 생산성 향상에 기여하였다.

Fast and Accurate Rigid Registration of 3D CT Images by Combining Feature and Intensity

  • June, Naw Chit Too;Cui, Xuenan;Li, Shengzhe;Kim, Hak-Il;Kwack, Kyu-Sung
    • Journal of Computing Science and Engineering
    • /
    • 제6권1호
    • /
    • pp.1-11
    • /
    • 2012
  • Computed tomography (CT) images are widely used for the analysis of the temporal evaluation or monitoring of the progression of a disease. The follow-up examinations of CT scan images of the same patient require a 3D registration technique. In this paper, an automatic and robust registration is proposed for the rigid registration of 3D CT images. The proposed method involves two steps. Firstly, the two CT volumes are aligned based on their principal axes, and then, the alignment from the previous step is refined by the optimization of the similarity score of the image's voxel. Normalized cross correlation (NCC) is used as a similarity metric and a downhill simplex method is employed to find out the optimal score. The performance of the algorithm is evaluated on phantom images and knee synthetic CT images. By the extraction of the initial transformation parameters with principal axis of the binary volumes, the searching space to find out the parameters is reduced in the optimization step. Thus, the overall registration time is algorithmically decreased without the deterioration of the accuracy. The preliminary experimental results of the study demonstrate that the proposed method can be applied to rigid registration problems of real patient images.

추천의 정확도 및 다양성 향상을 위한 이웃기반 협업 필터링 추천시스템의 개선방안 (Improving Neighborhood-based CF Systems : Towards More Accurate and Diverse Recommendations)

  • 권영옥
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.119-135
    • /
    • 2012
  • 본 연구는 추천의 정확도 및 다양성을 향상시키기 위해, 가장 널리 사용되는 추천 알고리즘의 하나인 이웃 기반의 협업 필터링(Neighborhood-based Collaborative Filtering) 시스템의 개선방안 제시를 목적으로 한다. 이를 위해서 추천 시스템 사용자의 성향을 파악하고 이와 유사한 성향을 가진 이웃 사용자들 중에서 비교 가능한 선호도 정보가 많을수록 높은 가중치를 부여함으로써 최적의 이웃을 선택할 수 있도록 하였다. 영화 데이터를 이용하여 분석한 결과, 대부분의 경우 기존 시스템보다 더 정확하고 다양한 추천 결과를 얻을 수 있었다. 또한 사용자의 선호도를 여러 항목으로 평가할 경우, 사용자의 선호도 정보가 증가하여 추천 결과의 추가적인 향상을 가져왔다. 마지막으로, 추천의 정확도 및 다양성의 요소를 통합적으로 평가할 수 있는 방안을 제시하였다.

Jaccard Index Reflecting Time-Context for User-based Collaborative Filtering

  • Soojung Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.163-170
    • /
    • 2023
  • 추천 시스템의 구현 방식들 중 하나인 사용자 기반의 협력 필터링 기법은 유사한 평가 이력을 가진 이웃 사용자들의 산출을 기반으로 하여, 이들의 선호 항목들을 추천한다. 그러나 공통된 평가 이력이 적을 경우에 추천의 질이 현저히 저하되는 데이터 희소성 문제를 근본적으로 갖고 있다. 이러한 문제의 해결을 위하여 많은 기존 연구에서 자카드 계수를 유사도 척도와 접목하는 다양한 방법들을 제안해 왔다. 본 연구에서는 자카드 계수에 시간 인지 개념을 도입하여 공통 항목의 평가 시간에 따라 다른 비중으로 가중합하는 방안을 제시한다. 다양한 성능 척도와 시간 주기를 활용하여 실험을 수행한 결과, 제안 방법이 대부분의 척도에서 원래의 자카드 계수에 비해 가장 우수한 성능을 보였으며, 최적의 시간 주기는 성능 척도의 종류에 따라 다름을 확인하였다.