• 제목/요약/키워드: 유사검색

검색결과 1,675건 처리시간 0.035초

건설 위험 식별을 위한 정보 검색 (Information Retrieval in Construction Hazard Identification)

  • 김현수;이현수;박문서;황성주
    • 한국건설관리학회논문집
    • /
    • 제12권2호
    • /
    • pp.53-63
    • /
    • 2011
  • 유사 재해의 반복적 발생은 건설재해의 가장 큰 특징 중 하나이다. 안전사고 예방을 위한 유사 재해사례는 수행 예정인 작업의 위험을 발견하고 안전 대책을 수립하는데 직접적인 정보를 제공한다. 과거 재해 사례들을 검색하여 안전관리 분야에 사용하기 위해 많은 검색시스템들이 개발되었다. 하지만 현장의 다양한 조건과 반영한 결과를 얻기 위해서는 수많은 검색을 수행하거나, 실제 현장의 안전관리 계획 수립 단계별 특성을 반영하지 못하는 단점이 존재한다. 본 연구에서는 기존 안전관리 검색시스템들의 한계점을 개선하기 위해 정보 검색 방법과 BIM(building information modeling)을 이용한 안전관리 단계별 적용이 가능하며 현장의 상황과 유사한 재해사례를 검색하는 시스템을 개발하였다. 검색 시스템은 BIM의 객체를 추출하여 이를 현장 정보 DB와 결합하여 질의를 구성한다. 그리고 질의를 과거 재해사례 DB와 비교하여 가장 유사한 과거 재해 사례를 찾고, 안전 관리자에게 정보를 제공한다. 본 연구의 결과를 바탕으로 안전 관리자는 검색 결과를 얻기 위한 과도한 질의 생성을 줄일 수 있다. 또한 BIM 객체를 통해 과거 유사한 재해가 발생한 현장의 좌표를 얻을 수 있어 위험을 쉽게 인지할 수 있을 것이다.

용어 자동분류를 사용한 검색어 범주화의 분석적 고찰 (An Analytic Study on the Categorization of Query through Automatic Term Classification)

  • 이태석;정도헌;문영수;박민수;현미환
    • 정보처리학회논문지D
    • /
    • 제19D권2호
    • /
    • pp.133-138
    • /
    • 2012
  • 검색 창을 통해 입력된 검색어는 정보이용자가 의미 있는 자료를 찾아내는 적극적인 활동의 산물이다. 따라서 검색로그는 정보이용자의 관심사항을 알 수 있는 중요한 분석 데이터이다. 본 연구의 목적은 입력한 검색어의 범주화 결과와 엑세스한 문서의 범주가 어느 정도 유사한 상관관계를 가지는지 분석적으로 고찰해보는 것이다. KISTI(한국과학기술정보연구원)의 NDSL(과학기술정보센터) 사이트의 2009년 검색로그의 검색세션을 식별하고 검색세션단위로 검색어와 이용 자료를 추출한 후, 검색어에 대해 어떤 주제 분류에 속하는 용어인지 자동분류기로 식별한 결과가 실제 이용한 자료의 주제 분야와 잘 맞는지 비교하였다. 그 결과 상위 100개 검색어 분류에 대한 유사도 평균이 58.8%로 파악되었다. 결국 전체적인 유사도는 58.8%이하이며, 관련 연구에서 수행한 자료의 자동분류 검색성능 전문가 평가 결과인 76.8%에 비해 낮다. 이것은 검색어로 쓰인 용어가 다른 연구 분야의 관심 용어로 새롭게 주목 받고 있기 때문이라는 사실을 알 수 있었다.

마코프 논리 기반의 시맨틱 문서 검색 (Semantic Document-Retrieval Based on Markov Logic)

  • 황규백;봉성용;구현서;백은옥
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.663-667
    • /
    • 2010
  • 본 논문은 질의 문서와 의미가 유사한 문서를 검색하는 문제를 다룬다. 이 문제에 대한 기본적인 접근법은 각 문서를 bag-of-words 형태로 표현한 후, 코사인 유사도 등의 거리 기준에 기반하여 유사 문서를 판별하는 것이다. 그러나, 이처럼 문서에 출현하는 단어에만 의존하는 검색 방법은 의미적 유사성을 제대로 반영하기 어렵다는 단점을 가진다. 본 논문에서는 이러한 문제를 극복하기 위해 데이터 기반의 감독 학습(supervised learning) 기법과 관련 온톨로지 정보를 마코프 논리(Markov logic)에 기반하여 결합한다. 구체적으로, 단어들 사이에 존재하는 관계를 표현한 온톨로지와 유사도가 태깅된 문서 데이터에서 마코프 논리 망(Markov logic network)을 학습하며, 학습된 마코프 논리 망과 문서 데이터 및 새로 주어진 질의 문서에 대한 추론을 통해 질의 문서와 의미적으로 유사한 문서를 검색하는 기법을 제안한다. 제안하는 접근법은 서울시의 민원서비스 홈페이지에서 수집된 실제 민원 데이터에 적용되었으며, 적용 결과, 단순한 문서 간 거리에 기반한 유사 문서 검색 기법에 비해 월등히 높은 정확도를 보였다.

비디오 데이타베이스에서 이동 객체를 위한 k-워핑 알고리즘 기반 유사 부분궤적 검색 (Similar Sub-Trajectory Retrieval based on k-warping Algorithm for Moving Objects in Video Databases)

  • 심춘보;장재우
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권1호
    • /
    • pp.14-26
    • /
    • 2003
  • 이동 객체(moving objects)의 궤적(trajectories)은 내용 기반 비디오 검색을 위해 비디오의 내용이나 의미를 색인하는 데 있어 매우 중요한 역할을 한다. 따라서 본 논문에서는 비디오 데이터가 지니는 이동 객체의 궤적(moving objects' trajectories)에 대한 효율적인 검색을 위해 k-워핑(k-warping) 알고리즘에 기반한 유사 부분궤적 검색(similar sub-trajectory retrieval) 기법을 제안한다. 제안하는 방법은 궤적을 구성하는 움직임 요소 모두에 대해서 고정된 값(k)만큼까지의 반복을 허용하는 고정 반복 유사 부분궤적 검색(Fixed-Replication similar Sub-trajectory Retrieval: VRSR)과 움직임 요소 각각에 대해서 서로 다른 값으로 할당하고 그 값만큼까지의 반복을 허용하는 가변 반복 유사 부분궤적 검색(Variable-Replication similar Sub-trajectory Retrieval: VRSR) 방법이다. 제안하는 방법은 이동 객체의 궤적을 모델링하기 위해 주로 사용되는 방향만의 단일 속성(property) 뿐만 아니라, 방향, 거리, 그리고 시간 등을 포함하는 다중 속성(multiple properties)을 지원한다. 마지막으로, 성능 평가를 통해, 제안하는 k-워핑 알고리즘에 기반한 유사 부분궤적 검색 기법이 동등한 재현율을 유지하면서, 기존의 Li의 방법(no-warping)과 Shan의 OCMR방법(infinite-warping)에 비해 정확율 측면에서 좋은 성능을 보인다.

순차 패턴을 이용한 XML문서의 유사성 계산 방법 분석 (Korea Information Science Society)

  • 이원철;이상민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.232-234
    • /
    • 2004
  • XML 문서의 요소는 의미적인 정보와 트리기반의 구조적인 정보를 포함하고 있기 때문에 요소의 구조적인 유사성이 곧 XML 문서의 유사성으로 연구되어 왔다. 그러나 구조적이고 순차적인 유사성만을 고려한 순차패턴 유사성 검색 방법은 의미적인(sementic) 유사성을 제대로 반영을 할 수가 없다. 이것은 정보 검색에 있어 재현율(recall)을 낮을 수밖에 없는 원인을 제공한다. 따라서 본 논문에서는 기존에 사용되었던 순차패턴을 기반으로 한 유사성의 계산 방법과 각각의 연구 방법이 의미적인 유사성에 대하여 한계가 있음을 찾아보았다.

  • PDF

인간의 인지도에 근거한 질의를 통한 영상 검색의 성능 향상 (Performance Improvement of Image Retrieval System by Presenting Query based on Human Perception)

  • 유헌우;장동식;오근태
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권2호
    • /
    • pp.158-165
    • /
    • 2003
  • 영상간의 유사도는 일반적으로 영상으로부터 추출한 특징벡터간의 벡터공간상의 거리를 계산해서 판단한다. 그러나 이러한 특징벡터가 유사도 계산을 위한 하나의 방법이지만 항상 인간의 유사도 개념을 충실히 반영하지는 않는다. 그러므로 현존하는 대부분의 영상검색시스템들은 각 특징간의 중요도를 선정하여 유사도에 반영하는 방법을 사용하고 있다. 본 논문에서는 영상검색을 위한 새로운 초기 가중치 설정과 갱신 알고리즘을 제안한다. 이를 위해서 먼저 데이터 베이스 영상을 인간의 인지도 판단에 의해 그룹화 한 후, 내부질의와 외부질의를 수행하고, 검색된 영상중 유사한 영상이 어느 그룹에 속하는지 알아내어 각 영상별로 유사도 계산에 필요한 최적 특징 가중치를 계산한다. 2000개의 영상 데이타에 대한 실험을 통해서 제안된 알고리즘의 우수성을 보인다.

음악 데이터베이스를 이용한 음악 표절 감지 시스템 개발 (Development of a System for Music Plagiarism Detection Using Melody Databases)

  • 박정일;김상욱
    • 한국멀티미디어학회논문지
    • /
    • 제8권1호
    • /
    • pp.1-8
    • /
    • 2005
  • 유사 멜로디 검색은 질의 멜로디와 유사한 멜로디들을 음악 데이터베이스로부터 찾는 연산이다. 본 논문에서는 유사 멜로디 검색을 기반으로 하는 표절 감지 시스템 개발에 관하여 논의한다. 먼저, 정합 및 이동 변환을 지원하는 새로운 유사 모델을 제안한다. 또한, 각 멜로디 의 특징들을 인덱싱 하는 방법과 인덱스를 기반으로 표절 감지를 처리하는 방법을 제시한다 제안된 표절 감지 시스템을 이용하여 작곡가는 자신의 멜로디와 유사한 멜로디를 가지 는 곡들을 음악 데이터베이스에서 효과적으로 검색할 수 있다. 실험 을 통한 성능평가를 통하여 제안된 기법의 우수성을 규명한다. 실험 결과에 의하면, 제안된 기법은 순차 검색을 기반으로 하는 방법과 비교하여 약 31배까지의 성능 개선 효과를 보였다.

  • PDF

주제 분류를 활용한 국립국어원 질의응답 게시판 유사 질문 검색 시스템 (Similar Question Search System for Q&A board of The National Institute of the Korean Language using Topic Classification)

  • 문정민;송영호;진지환;이현섭;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.201-205
    • /
    • 2014
  • 국립국어원의 온라인 가나다 서비스는 한국어에 대한 다양한 질문과 정확한 답변을 제공한다. 만일 새롭게 등록되는 질문에 대해 유사한 질문을 자동으로 찾을 수 있다면, 질문자는 빠른 시간에 답변을 얻을 수 있고 서비스 관리자는 수동 답변 작성의 부담을 덜 수 있다. 본 논문에서는 국립국어원 질의응답게시판의 특성을 분석하여 질문의 주제를 6가지로 분류하고, 주제 분류 정보와 벡터 유사도, 수열 유사도를 결합하여 유사한 질문을 검색하는 시스템을 제안한다. 평가에서는 본 논문에서 제시한 주제 분류 정보를 활용한 결과 1위 정답 검색 정확률이 향상되는 결과를 얻었다. 최종 실험에서는 MRR이 0.62, 정답이 1위, 5위내에 검색될 확률은 각각 54.2%, 78.2%를 보였다.

  • PDF

단어 임베딩과 음성적 유사도를 이용한 트위터 '서치 방지 단어'의 자동 예측 (Automatic Prediction of 'Anti-Search Variants' of Twitter based on Word Embeddings and Phonetic Similarity)

  • 이상아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.190-193
    • /
    • 2017
  • '서치 방지 단어'는 SNS 상에서 사용자들이 작성한 문서의 검색 및 수집을 피하기 위하여 사용하는 변이형을 뜻한다. 하나의 검색 키워드가 있다면 그와 같은 대상을 나타내는 변이형이 여러 형태로 존재할 수 있으며, 이들 변이형에 대한 검색 결과를 함께 수집할 수 있다면 데이터 확보가 중요하게 작용하는 다양한 연구에 큰 도움이 될 것이다. 본 연구에서는 특정 단어가 주어진 키워드로부터 의미 벡터 상의 거리가 가까울수록, 그리고 주어진 키워드와 비슷한 음성적 형태 즉 발음을 가질수록, 해당 키워드의 변이형일 가능성이 높을 것이라고 가정하였다. 이에 따라 단어 임베딩을 이용한 의미 유사도와 최소 편집 거리를 응용한 음성적 유사도를 이용하여 주어진 검색 키워드와 유사한 변이형들을 제안하고자 하였다. 그 결과 구성된 변이형 후보의 목록에는 다양한 형태의 단어들이 포함되었으며, 이들 중 다수가 실제 SNS 상에서 같은 의미로 사용되고 있음이 확인되었다.

  • PDF

다중 volume 자료 처리 기술을 기반으로 한 3차원 유사 일기도 검색 시스템 (3-D similar weather retrieval system based on multiplex volume data processing technology)

  • 정창성;이성환;김지윤;황치정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (하)
    • /
    • pp.1087-1090
    • /
    • 2001
  • 본 연구의 목적은 동아시아 지역의 NCEP 데이터를 대상으로 1000hPa, 850hPa, 700hPa, 500hPa에서의 기온, 고도와 300hPa 에서의 풍향, 풍속과 지상의 기온, 기압 데이터를 이용하여 유사 일기도 검색시 동일한 파라메터를 사용하여 유사성 정도를 검색하는 알고리즘을 개발하는데 있다. 또한 각 파라메터에 해당하는 격자 데이터로부터 특징값들을 추출하고 이를 이용하여 유사도 측정을 수행하여 유사일기도를 검색하는 알고리즘을 개발하였다.

  • PDF