• Title/Summary/Keyword: 유사도 질의

Search Result 1,859, Processing Time 0.039 seconds

A Study on Cluster Topic Selection in Hierarchical Clustering (계층적 클러스터링에서 분류 대표어 선정에 관한 연구)

  • Yi, Sang-Seon;Lee, Shin-Won;An, Dong-Un;Chung, Sung-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.669-672
    • /
    • 2004
  • 정보의 양이 많아지면서 정보 검색 시스템에 검색 결과를 자동으로 구조화하는 계층적 클러스터링을 적용하는 시도가 늘고 있다. 계층적 클러스터링은 문서 간의 유사도를 통해 클러스터를 계층 구조로 만들어 검색 성능을 높이고 결과를 사용자에게 이해하기 쉽게 보여준다. 계층 구조는 검색 결과를 요약하는 것이기 때문에 클러스터의 내용을 효과적으로 함축할 수 있는 대표어의 선정이 중요하다. 각 클러스터의 대표어를 선정하기 위해 대표어에 명사인 단어만 추출하고 상위 클러스터 대표어에 사용된 단어는 하위 클러스터에 사용하지 않는 방법을 적용하여 대표어의 질을 높였다.

  • PDF

The classification and prediction of habitat structure using hydraulic model (수리모델링을 이용한 서식처 구조 분류 및 예측 연구)

  • Choi, Mikyoung;Shin, Jihye;Zhang, Ning;Jung, Kwansue
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.82-82
    • /
    • 2020
  • 수리모델링은 유사나 유사량에 따른 하상의 변화를 구현하고 예측하는데 활용하고 있다. 만약 수리모델링을 하천의 생태적 구조나 기능과 연계하여 해석할 수 있다면, 수리학적 모델의 활용 가능성은 무궁무진해 질 수 있다. 본 연구에서는 동일한 시기의 항공사진 영상과 하천단면 자료를 활용한 수리모델링 모의 결과를 이용하여 서식처 구조를 각각 분류하고, 비교 검토하여 수리모델링 모의 결과에서의 서식처 분류 방안을 제안한다. 대상지는 한국의 금강 지류인 갑천 약 2 km 구간이며, 2012년도의 항공사진과 Nays2D모델을 이용한다. 서식처는 여울, 소, 사주 위 웅덩이, 사주부 정수역(backwater) 등으로 구분한다.

  • PDF

Image-based Tourism Recommender System (이미지 기반 여행지 추천 시스템)

  • Young-Min Na;Sol Kim;Gi-Yeon Song;Geumsang Lee;Jaehwan Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.396-397
    • /
    • 2023
  • 추천 시스템은 빅데이터 관련 기술과 알고리즘의 발달로 다양한 분야에서 사용되고 있다. 관광 산업도 예외는 아니다. 본 연구에서는 사용자들이 촬영한 사진을 기반으로 유사한 여행지를 추천하는 추천 시스템을 제안한다. 사용자가 입력한 이미지에서 언어적 특성과 비언어적 특성을 추출하고 이를 기반으로 유사한 이미지를 탐색하고, 이를 기반으로 사용자가 좋아할 다음 여행지를 추천한다. 사용자가 질의어를 입력하지 않고 이미지를 제공하여 추천이 이루어진다는 점과 사용자의실제 여행 여부를 이용해 모델의 성능을 평가했다는 점에서 연구의 의의가 있다.

Attribute-based Multi-level Clustering for Collaborative Filtering (협동적 필터링을 위한 속성기반 다단계 클러스터링)

  • Kim, Taek-Hun;Yang, Sung-Bong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.525-528
    • /
    • 2007
  • 추천시스템은 일반적으로 협동적 필터링이라는 정보 필터링 기술을 사용한다. 협동적 필터링은 유사한 성향을 갖는 다른 고객들이 상품에 대해서 매긴 평가에 기반하기 때문에 고객에게 가장 적합한 유사 이웃들을 적절히 선정해 내는 것이 추천시스템의 예측의 질 향상을 위해서 필요하다. 본 논문에서는 속성 정보를 기반으로 한 다단계 클러스터링을 통한 이웃선정 방법을 제안한다. 이 방법은 대규모 데이터 셋에서 탐색 공간을 줄이기 위해 클러스터링을 수행하여 적절한 이웃 고객들의 집합을 추출한다. 이 때, 속성 정보에 따라 단계적으로 클러스터링을 수행함으로써 보다 정제된 고객집합을 구성할 수 있도록 한다. 본 논문에서는 고객 선호도와 위치 정보를 대표적인 속성 정보로 사용함으로써 모바일 환경에서 보다 정확한 추천이 이루어질 수 있도록 한다.

A Group Humming Expression for Query By Humming (허밍 질의을 위한 그룹 허밍 표현법)

  • Nam, Hyunwoo;Hwang, Seong-Ho;Park, Neungsoo;Kwon, Soonil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.139-141
    • /
    • 2007
  • 최근 멀티미디어를 검색하기 위해 메타데이터 기반의 검색 방법에서 컨텐츠 자체를 검색 하려는 연구들이 활발히 진행되고 있다. 특히 음악 검색의 경우 허밍 입력으로 검색을 하려는 QBH(Query By Humming)가 많은 관심을 끌고 있다. 하지만 허밍 데이터는 개인마다 음높이나 박자 정보들이 모두 다르고 숨소리 등의 내재된 오류 정보들이 많아 정확한 검색 결과를 얻기가 쉽지 않다. 허밍 검색의 정확도 향상을 위해서는 음 데이터 추출이나 허밍의 오류 보정, 유사도 측정과 관련된 연구들이 선행되어야 한다. 본 논문에서는 효과적인 멜로디 표현방법에 대해 다양한 실험을 통해 최적의 모델을 제시하려 한다. 방법으로 UDR을 다양한 범위로 나누고 가중치를 달리하는 방법으로 실험을 한 결과 허밍을 그룹으로 분류하는 방법이 정확도를 향상 시키는 것을 확인 하였다.

Study on the Juvenile Hormone Binding Protein in the Hemolymph of the Silkworm Larva, Bombyx mori. (누에 체액의 유약호르몬 결합단자질(Juvenile hormone hinding protein)에 관한 연구)

  • 손흥대
    • Journal of Sericultural and Entomological Science
    • /
    • v.30 no.1
    • /
    • pp.25-32
    • /
    • 1988
  • In order to examine a physiological role of juvenile(JH) binding proteins in the hemolymph of the silkworm larva, Bombyx mori, [3H] JH I incubated hemolymph was separated by polyacrylamide gel electrophoresis in the fifth-instar larva and the activity of the binding protein was analyzed using charcoal binding assay. The results obtained were as follows; 1. The JH was bound by two protein fractions in the hemolymph of the fifth-instar larva; One was JH binding lipoprotein(JH-LP), the other was JH speific binding protein(JHBP). Their relative mobility values(Rm) were 0.3∼0.33 and 0.81∼0.84, respectively. There were no valid differences in those values from developmental stages of both male and female silkworms. 2. Total protein contents of the hemolymph were gradually increased during the fifth-instar larva, while at the prepupa decreased. The maximum ones were observed at the spinning period and the contents from female were much higher than those from the male. 3. JH binding activity per ml of the hemolymph was low in the early stage of the fifth-instar larva and its activity was maximized at the psinning period and at the prepupa slightly decreased. 4. There was a similar pattern between changes of the JH binding activity per ml of the hemolymph and of the total protein contents of the hemolymph. 5. The JH binding activity per mg of the hemolymph proteins was high in the early stage of the fifth-instar larva, while from the 6th day of the fifth-instar larva to the prepupa its activity showed the lowest levels.

  • PDF

Trajectory Index Structure based on Signatures for Moving Objects on a Spatial Network (공간 네트워크 상의 이동객체를 위한 시그니처 기반의 궤적 색인구조)

  • Kim, Young-Jin;Kim, Young-Chang;Chang, Jae-Woo;Sim, Chun-Bo
    • Journal of Korea Spatial Information System Society
    • /
    • v.10 no.3
    • /
    • pp.1-18
    • /
    • 2008
  • Because we can usually get many information through analyzing trajectories of moving objects on spatial networks, efficient trajectory index structures are required to achieve good retrieval performance on their trajectories. However, there has been little research on trajectory index structures for spatial networks such as FNR-tree and MON-tree. Also, because FNR-tree and MON-tree store the segment unit of moving objects, they can't support the trajectory of whole moving objects. In this paper, we propose an efficient trajectory index structures based on signatures on a spatial network, named SigMO-Tree. For this, we divide moving object data into spatial and temporal attributes, and design an index structure which supports not only range query but trajectory query by preserving the whole trajectory of moving objects. In addition, we divide user queries into trajectory query based on spatio-temporal area and similar-tralectory query, and propose query processing algorithms to support them. The algorithm uses a signature file in order to retrieve candidate trajectories efficiently Finally, we show from our performance analysis that our trajectory index structure outperforms the existing index structures like FNR-Tree and MON-Tree.

  • PDF

The study of integration techniques for storing XML documents efficiently based on structures and semantics (구조 및 의미적 유사성에 기반한 XML 문서들의 효율적인 저장을 위한 통합 기법)

  • 김연희;김병곤;이재호;임해철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.590-592
    • /
    • 2003
  • 최근 XML이 웹 상의 데이터의 표현, 교환, 중재의 표준으로 각광받으면서 이러한 XML 문서를 효과적으로 저장, 접근 및 검색하기 위한 기법에 대한 연구가 많았으나, 기존의 연구들은 하나의 XML 문서를 저장 및 검색의 대상으로 하는 경우가 대부분이였다. 그러나 XML 문서를 데이터의 표현과 교환의 표준으로 이용하는 애플리케이션의 개발이 점차 활성화됨에 따라 저장해야하는 XML 문서의 수가 크게 증가하면서 의미나 구조적으로 많은 유사성을 지니는 XML 문서들을 함께 효율적으로 저장하고 검색하기 위한 기법의 연구가 요구된다. 따라서 본 논문에서는 의미 및 구조적으로 유사성을 가지는 여러 XML 문서들을 통합하는 기법을 제안한다. 제안된 통합 기법은 같은 DTD나 XML Schema를 가지는 경우와 다른 DTD나 XML Schema를 가지는 경우를 모두 고려한다. 또한 특별한 구조적 정보를 가지지 않는 XML 문서의 경우도 다른 DTD나 XML Schema를 가지는 경우와 마찬가지로 처리함으로써 다양한 XML 문서들에 대한 통합이 가능하도록 한다. 이러한 통합 기법은 중복되는 엘리먼트나 애트리뷰트에 대한 저장 공간의 낭비를 최소화한다. 또한 의미적으로 또는 구조적으로 관련성있는 여러 XML 문서의 부분들을 디스크 상의 페이지내에 서로 가까이 저장할 수 있기 때문에 사용자의 일반적인 질의에 대해 효율적이고 빠른 검색 결과를 유도할 수 있고, I/O 횟수를 줄임으로써 그에 따른 오버헤드를 줄일 수 있는 장점이 있다.

  • PDF

The Analysis of Similarity in Image and Selection Factor Recognition for Spa Touristy Places in Chungcheong Area (충청지역 온천관광지 이미지 유사성 및 선택요인 인식도 분석)

  • Kim, Si Joong
    • Journal of the Korean association of regional geographers
    • /
    • v.21 no.3
    • /
    • pp.569-582
    • /
    • 2015
  • This study deals with six spa touristy places to analyze the similarity in image and selection factor recognition through multidimensional scaling method. The result is as following. First, as a result of analysis in the similarity in Image of the 6 touristy Spa places, each "Asan and Onyang" and "Suanbo and Ducksan" form different similar image groups. However, Yoosung does not share the similarity in Image that other Spa places own. Second, as a result of analysis of selection factors in the six touristy spa places, it is found out that there is no big difference in selection factors such as 'spa facility', 'a fee to use', and 'quality of service' in the six spa places. Yet, Onyang, Yoosung, Ducksan, and Suanbo spa reflect high selection factor as 'a recognized spa place' different from Asan and Dogo where the reflection of selection factor is low. Onyang, Yoosung, and Dogo regions reflect high selection factor as a 'Touristy destination' while Asan reflects low selection factor.

  • PDF

Similarity Search in Time Series Databases based on the Normalized Distance (정규 거리에 기반한 시계열 데이터베이스의 유사 검색 기법)

  • 이상준;이석호
    • Journal of KIISE:Databases
    • /
    • v.31 no.1
    • /
    • pp.23-29
    • /
    • 2004
  • In this paper, we propose a search method for time sequences which supports the normalized distance as a similarity measure. In many applications where the shape of the time sequence is a major consideration, the normalized distance is a more suitable similarity measure than the simple Lp distance. To support normalized distance queries, most of the previous work has the preprocessing step for vertical shifting which normalizes each sequence by its mean. The proposed method is motivated by the property of sequence for feature extraction. That is, the variation between two adjacent elements of a time sequence is invariant under vertical shifting. The extracted feature is indexed by the spatial access method such as R-tree. The proposed method can match time series of similar shape without vertical shifting and guarantees no false dismissals. The experiments are performed on real data(stock price movement) to verify the performance of the proposed method.