• 제목/요약/키워드: 유사성 탐색

검색결과 490건 처리시간 0.027초

시그니처 트리를 사용한 의미적 유사성 검색 기법 (Semantic Similarity Search using the Signature Tree)

  • 김기성;임동혁;김철한;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권6호
    • /
    • pp.546-553
    • /
    • 2007
  • 온톨로지의 활용이 늘어나면서 의미적 유사성 검색에 대한 관심이 높아지고 있다. 본 논문에서는 질의 객체와의 의미적 유사성이 높은 객체를 검색하는 최근접 질의 기법을 제안하였다. 의미적 유사성을 측정하는 유사성 함수로는 최적 대응값 방식의 유사도 함수를 사용하였으며 주석 정보에 대한 색인을 위해 시그니처 트리를 사용하였다. 시그니처 트리는 집합 유사성 검색에서 많이 사용되는 색인 구조로서 유사성 검색에 사용하기 위해서는 검색시 각 노드를 탐색하였을 때 발견할 수 있는 유사도의 최대값을 예측할 수 있어야 한다. 이에 본 논문에서는 최적 대응값 방식의 유사도 함수에 대한 예측 최대값 함수를 제안하고 올바른 예측 함수임을 증명하였다. 또한 시그니처 트리에 동일한 시그니처가 중복되어 저장되지 않도록 구조를 개선하였다. 이는 시그니처 트리의 크기를 감소시킬 뿐만 아니라 질의 성능 또한 향상시켜 주었다. 실험의 데이타로는 대용량 온톨로지와 주석 정보 데이타를 제공하는 Gene Ontology(GO)를 사용하였다. 실험에서는 제안한 방법의 성능 향상 외에도 페이지 크기와 노드 분할 방법이 의미적 유사성 질의 성능에 미치는 영향에 대해 알아보았다.

움직임 예측 및 주변화소의 변위정보를 이용한 고속 스테레오 정합 방법 (Fast Stereo Matching Method Using Motion Estimation and Disparity Information of Neighboring Pixels)

  • 장용준;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.186-187
    • /
    • 2017
  • 스테레오 정합은 촬영된 스테레오 영상 속 화소들의 대응점을 탐색한 후 대응점 사이의 변위차를 계산하여 깊이정보를 예측한다. 스테레오 정합에서 변위값을 계산하기 위해서는 스테레오 영상간의 대응점 탐색이 우선적으로 수행되어야 한다. 스테레오 영상의 변위값 범위를 모르는 경우 동일한 탐색선상에 있는 모든 화소들의 유사도를 비교한 후 최적의 대응점을 선택한다. 반면에, 변위값 범위가 제공되는 실험 영상으로 스테레오 정합을 할 경우 정해진 후보 화소들에 대해서만 대응점 탐색을 수행한다. 많은 스테레오 정합 논문들이 실험의 효율성을 위해 변위값 범위 정보가 제공되는 실험 영상으로 스테레오 정합을 수행한다. 하지만 실제 스테레오 정합 환경에서는 이와 같은 정보를 얻기가 힘들다. 이러한 문제점을 극복하기 위해 본 논문에서는 움직임 예측 및 주변화소의 변위정보를 이용한 고속 스테레오 정합 방법을 제안한다.

  • PDF

실시간 환경에서 가용 대역폭과 거리를 고려한 개선된 Kademlia 프로토콜 (An Improved Kademlia Protocol considering Available Bandwidth and Physical Distance in the Real-Time Environment)

  • 박재완;맹주현;이동혁;조인휘
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.56-59
    • /
    • 2019
  • 분산 해시 테이블은 {Key-Value} 형태의 해시 테이블을 시스템 내 노드들이 나누어 가지는 분산 시스템이다. 분산 해시 테이블 중 Kademlia는 Binary Tree 구조를 통해 노드 확장성을 가지고 XOR Metric을 이용하여 빠른 노드 탐색으로 다양한 분야에서 활용되고 있다. 하지만 노드 탐색 시 실제 상황을 배제하고 논리적인 거리만을 고려하여 라우팅 경로를 설정한다는 문제점을 가진다. 본 연구에서는 이 문제를 해결하기 위해 노드 탐색 시 노드 간의 대역폭과 물리적 거리를 고려하여 라우팅 테이블을 생성하는 Kademlia의 효율적인 노드 탐색 기법을 제안한다. 기존의 Kademlia와 유사한 수치의 Lookup Success Ratio와 Lookup Overhead Rates를 보이지만, End-to-End Delay가 감소한 것을 시뮬레이션을 통해 확인하였다.

텍스트마이닝 기법을 활용한 한국인의 행복과 불행 탐색연구 (An Exploratory Study of Happiness and Unhappiness Among Koreans based on Text Mining Techniques)

  • 박상현;도강혁;김학영;박가은;윤진혁;김경일
    • 한국콘텐츠학회논문지
    • /
    • 제18권7호
    • /
    • pp.10-27
    • /
    • 2018
  • 본 연구에서는 텍스트 마이닝 분석을 통해 한국 사회에서 행복과 불행이 갖는 의미를 탐색하였다. 자료수집 및 분석을 위하여 온라인 뉴스 포털에서 Word2Vec과 TF-IDF 방법을 사용하여 '행복' 및 '불행' 키워드와 유사한 단어를 추출했다. 또한 K-LIWC 사전을 사용하여 행복 및 불행과 연관된 단어들의 감성 속성에 대해 알아보았다. TF-IDF 분석 결과, 행복과 불행은 사회적 요인과 해당 년도의 사회적 이슈들과 각각 높은 관련성이 있는 것으로 관찰됐다. Word2Vec 분석에서는 '희망'이 6년 연속으로 행복과 유사성이 높은 단어로 나타났다. K-LIWC 분석에서 '돈재정적이슈', '학교', '의사소통'은 행복 및 불행과 모두 관련성이 높았다. 그밖에 '몸 상태와 증상'이 불행과 높은 관련성이 있는 범주로 나타났다. 이러한 결과를 바탕으로 본 연구의 의의, 제한점 및 후속연구에 대한 필요성을 논의하였다.

교통카드 Tag 제약을 반영한 통행자 경로선택에 대한 합리성 평가 연구 : 수도권 지하철 네트워크를 중심으로 (Rationality of Passengers' Route Choice Considering Smart Card Tag Constraints : Focused on Seoul Metropolitan Subway Network)

  • 이미영;남두희;심대영
    • 한국ITS학회 논문지
    • /
    • 제19권6호
    • /
    • pp.14-25
    • /
    • 2020
  • 본 연구는 교통카드자료 이용하여 수도권 지하철을 통행하는 승객의 경로선택의 합리성에 대한 평가를 시행하는 방법론을 제안한다. 사용자 경로선택의 합리성은 최적의 경로를 선택한다는 기본원리로서 확정성과 유사성으로 구분한다. 확정성은 승객이 선택한 경로는 시스템적 최적경로와 일치하는 정도이다. 유사성은 시스템적 최적경로와 유사하게 파악되는 정도이다. 합리성을 판단하는 기법으로 K경로탐색기법을 이용하여 경로를 열거하는 방법을 구축하였다. 유사성 내에서 확정성을 파악하기 위하여 민자운영기관의 환승단말기 Tag 정보를 활용하였다. 따라서 유사성에서 승객이 선택한 최적경로는 Tag를 경유한 경로와 동일하다는 개념을 적용하였다. 연구결과 최적경로(K=1)로 나타나는 확정성은 90.4(%), K=(2-10)으로 나타나는 유사성은 7.9(%)로서 총 98.3(%)의 수도권 지하철 통행이 합리적으로 설명된다고 평가하였다. 비합리적 통행 1.7(%)는 사용자 다양성을 고려하여 나타나는 설명되지 않는 에러항으로 평가된다고 파악하였다.

마커리스 트래킹을 위한 특징 서술자의 데이터베이스 생성 및 검색방법 (A Database Creation and Retrival Method of Feature Descriptors for Markerless Tracking)

  • 윤요섭;김태영
    • 한국게임학회 논문지
    • /
    • 제11권3호
    • /
    • pp.63-72
    • /
    • 2011
  • 본 논문에서는 증강 현실 환경에서 실시간 마커리스 트래킹을 수행하기 위한 특징 서술자 데이터베이스 생성 및 검색 방법을 제안한다. 먼저, 특징 서술자를 효율적으로 검색하기 위하여 특징 서술자의 형태를 기준으로 정수 부호화 하여 총 4 단계의 인덱스 데이터베이스를 구성한다. 특정 특징 서술자의 검색은 데이터베이스에서 각 단계별로 유사성 있는 후보 특징 서술자의 인덱스를 탐색하고 입력된 특징 서술자와 탐색된 모든 후보 특징 서술자들의 유클리드 거리 값 비교를 통해 이루어진다. 본 연구에서 제안한 검색방법은 형태를 기반으로 유사하지 않은 특징 서술자들을 검색 대상에서 제외하여 검색의 효율을 높였다. 제안된 방법은 기존 KD-Tree 방법에 비해서 특징 서술자당 약 16ms의 검색 속도 개선이 있었음을 확인할 수 있었다.

국가 R&D 정보 유사문서 검색에 대한 연구 (A Study on Similar Document Retrieval for National R&D Information)

  • 한희준;주원균;석중호;최기석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.283-286
    • /
    • 2012
  • 국가과학기술지식정보서비스(NTIS)는 국가 R&D와 관련된 과제, 성과, 인력, 시설 장비, 기술산업 정보에 대해 이용자에게 통합검색서비스를 제공한다. 이용자는 질의어를 입력하여 원하는 정보를 선별하게 되고, 한 건의 상세 메타정보 및 원문을 검색서비스의 최종 목적지로 삼는다. 이 때 이용 중인 정보와 유사한 다른 유형의 R&D 정보를 함께 제공한다면 이용자의 검색 및 탐색노력을 줄임으로써 정보획득의 요구를 쉽게 충족시킬 수 있다. 본 논문에서는 국가 R&D 정보의 메타데이터와 검색엔진의 부스팅 기법을 이용하여 이종 정보간 유사문서 검색 방법에 대해 논한다. 이는 이용자가 원하는 정보를 서비스 최종 화면(메타 상세보기)에서 제공함으로써 검색 서비스의 효율성을 증대시킨다.

연관 태그의 군집화를 위한 클러스터링 기법 비교 연구 (A Comparative Study on Clustering Methods for Grouping Related Tags)

  • 한승희
    • 한국문헌정보학회지
    • /
    • 제43권3호
    • /
    • pp.399-416
    • /
    • 2009
  • 본 연구에서는 태그 공간에서 정보의 효율적 탐색을 위해 이용자에게 제공될 수 있는 연관 태그 클러스터의 생성을 위해 다양한 유사계수와 클러스터링 기법을 적용한 후 그 결과를 평가하고 비교 분석함으로써 연관 태그의 클러스터링에 가장 적합한 클러스터링 알고리즘을 확인하고자 하였다. Delicious에서 임의의 태그 10개를 대상으로 각각 300개의 문서에서 추출한 연관 태그를 대상으로 태그쌍 간의 연관성을 측정한 후 계층적 기법과 비계층적 기법을 적용하여 생성된 클러스터를 대상으로 클러스터 적합도를 측정한 결과, 일반적으로 용어 클러스터링에서 널리 활용되는 것으로 알려진 워드 기법이 코사인 유사계수와 결합했을 때 거의 모든 실험 대상에 대해 유사한 경향을 보이면서 가장 우수한 성능을 나타내는 것으로 나타났다. 연관 태그 클러스터는 정보관리 측면에서 유사한 합목적성을 갖는 태그끼리 군집을 이루면서 용어의 중의성을 해소함으로써 태그 공간에서의 이용자의 정보 탐색에 유용하게 활용될 것이다.

의존성 구조 학습을 통한 masking 효과 축소 (Decreasing the Masking Effect by Learning Dependence Structures)

  • 한경식;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.15-17
    • /
    • 1998
  • 설명 기반 학습은 시스템 성능향상에 필요한 탐색 제어 지식을 학습하는 방법으로 많이 이용되고 있다. EBL은 과거의 문제풀이 과정을 일반화하여 학습한 다음 이와 유사한 상황이 발생할 경우, 문제풀이를 거치지 않고 학습된 해답을 신속하게 제시하여 성능을 향상시킨다. 그러나 새로운 문제 해결이 과거 문제 풀이 해답에 의존할 경우, 그에 대한 해답을 신속히 구할 수는 있지만 해답의 질은 학습 결과에 의존하지 않을 때보다 오히려 못할 수 있다. 이러한 현상을masking효과라고 한다. 본 논문에서는 의존성 구조를 학습, 이용하여 이러한 masking 효과를 축소하고자 한다. 의존성 구조는 현 상태에서 선택된 연산자가 이후의 문제 풀이에 끼치는 영향을 포함하는 구조로서, 이후 유사한 상황에 대해 선택될 연산자의 적합성 및 효율성을 평가하는 기준으로 사용될 수 있다는 점에서 masking 효과를 축소할 수 있다.

  • PDF

종단 사회연결망 분석을 활용한 친사회성의 사회화 과정 탐색: 사회적 관계성의 조절효과 (Socialization of Prosocial Behavior in Early-Adolescence: The Moderating Effect of Social Relatedness)

  • 김진구;강은영
    • 한국심리학회지:학교
    • /
    • 제17권1호
    • /
    • pp.1-16
    • /
    • 2020
  • 본 연구는 초기 청소년기 친사회성의 사회화 과정을 탐색하고, 학급 수준에서 사회적 친밀성의 조절효과를 탐색하고자 하였다. 총 39학급 1,040명의 초등학교 4-5학년 학생을 대상으로, 1학기 초와 말 총 2회에 걸쳐 측정한 친사회성과 또래네트워크 데이터를 활용하여 종단사회 연결망분석을 실시하였다. 그 결과, 초기 청소년기 학생의 친사회성이 사회화 되는 경향을 보였다. 초기 청소년기 학생들은 친사회성 수준이 유사한 친구와 또래관계를 형성하는 경향을 보였으며, 동시에 친구들의 친사회성 수준을 닮아가는 것으로 나타났다. 또한 학급의 사회적 관계성에 따른 친사회성의 사회화의 조절효과를 탐색한 결과, 사회적 친밀성이 낮은 학급에서는 친사회성의 또래선택과 또래영향이 나타나지 않은 반면, 사회적 관계성이 높은 학급에서는 친사회성의 또래영향이 나타났다. 이는 학급의 사회적 관계성이 친사회성의 또래영향을 나타나게 하는 맥락적 조절변인의 역할을 함을 시사한다. 본 연구의 결과를 토대로 친사회성의 사회화에 대한 발달적 특성과 이를 촉진하기 위한 사회적 관계성 측면에서 학교에서의 생활 지도 방안에 대해 논의하였다.