• 제목/요약/키워드: 서비스 검색 알고리즘

검색결과 199건 처리시간 0.028초

유사과제파악을 위한 검색 알고리즘의 개발에 관한 연구 (A Study on the Development of Search Algorithm for Identifying the Similar and Redundant Research)

  • 박동진;최기석;이명선;이상태
    • 한국콘텐츠학회논문지
    • /
    • 제9권11호
    • /
    • pp.54-62
    • /
    • 2009
  • 국가적으로 그리고 각 연구기관에서는 투자의 효율성을 기하기 위하여 연구사업 선정과정에서 데이터베이스로부터 중복과제 혹은 유사과제를 검색하는 과정을 거친다. 최근 부얼리언 기반의 키워드 매칭 검색알고리즘의 발전 및 이를 채택한 검색엔진의 개발로 인하여 검색의 정확도가 많이 향상되었지만, 사용자가 입력하는 제한된 수의 키워드들에 의한 검색은 유사과제 파악과 우선순위의 결정에 어려움이 있다. 본 연구에서는 제안된 과제의 문서를 분석하여 다수의 색인어들을 추출하고, 이들에게 가중치를 부여한 후, 기존의 문서들과 비교하여 유사과제를 찾아내는 문서단위의 검색 알고리즘을 제안한다. 구체적으로 벡터공간검색(Vector-Space Retrieval)모델의 한 종류인 TFIDF(Term Frequency Inverse document Frequency)를 기본 구조로 채택한다. 또한 개발되는 알고리즘에는 연구과제 제안문서의 구조에 적합한 속성별 가중치(feature weighting)를 반영하고 검색속도의 향상을 위하여 K-최근접 문서(KNN: K-Nearest Neighbors) 기법도 반영한 알고리즘을 제시한다. 실험을 위하여 실제 연구제안 문서와 구조가 동일한 기존의 보고서를 사용하였는데, KISTI에서 운영하는 과학기술정보포털서비스인 NDSL에서 이미 분류해 놓은 4분야의 1,000 개 연구 보고서 문서를 발췌하여 실험을 하였다.

순수 P2P 환경에서의 효율적 자원 검색 기법 (An Efficient Resource Discovery Mechanism for Pure P2P Environments)

  • 김인숙;강용혁;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.1039-1042
    • /
    • 2003
  • 최근 인터넷의 급속한 성장과 초고속 통신망의 구축으로 인하여 다양한 멀티미디언 서비스들이 제공되고 있다. 그러나 현재 대부분의 멀티미디어 서비스들은 클라이언트/서버 모델을 기반으로 구축되어 있기 때문에, 중앙 서버로의 과도한 부하가 집중되는 문제점을 가지고 있다. 본 논문에서는 수수 P2P 환경으로 구축된 멀티미디어 서비스 환경에서의 자원 검색 기법을 제안한다. 제안 기법은 고정 에이전트를 기반으로 자원 검색을 수행하여 기존의 순수 P2P 환경에서의 검색 기법으로 인한 문제점을 해결한다. 또한, 시나리오를 통하여 본 논문에서 제안하는 알고리즘의 구체적인 동작과정을 제시한다.

  • PDF

멀티에이전트 환경 하에서의 CSP기반의 확장 매치메이킹 알고리즘 (Extended Matchmaking Algorithm based on CSP in Multi-Agent Environments)

  • 복명균;이순근;조근식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.233-238
    • /
    • 2003
  • 인터넷의 급속한 성장과 함께 분산 네트워크 환경 하에서의 정보 검색 문제는 중요한 이슈가 되고 있다. 기하급수적으로 증가하는 정보의 홍수 속에서 사용자가 원하는 정보나 서비스를 효율적으로 찾아주는 방법은 꾸준히 연구되고 있다. 이러한 문제를 해결하기 위해서 멀티에이전트(Multi-agent)환경 하에서 원하는 서비스를 제공하는 에이전트들을 효율적으로 탐색해 주는 에이전트간의 매치메이킹(Matchmaking) 시스템은 좋은 해결방안이 될 수 있다. 본 논문에서 제안한 확장 매치메이킹 알고리즘은 중개 에이전트가 특정 도메이 지식을 효과적으로 이용할 수 있도록 문제에 대한 표현과 추론 과정이 명확한 CSP로 모델링 함으로써 불필요한 탐색 공간을 효율적으로 제거하도록 하였으며, 서비스 요청 에이전트의 요구사항을 만족시키면서 가능한 한 중복되는 에이전트 쌍이 최소화 되도록 일반적인 유사도(Similarity)와 함께 새로운 경쟁도(Competition)를 고려하였다. 본 논문에서 제안한 알고리즘이 기존의 매치메이킹 알고리즘보다 더 효율적인 것을 보이기 위해 온라인 인력 채용박람회를 모델로 하여 중개 에이전트가 직업을 구하는 서비스 요청 에이전트와 인재를 모집하는 서비스 공급 에이전트간의 매치메이킹 문제에 대해 실험 평가하였다.

  • PDF

이질 분산환경에서 MPEG 비디오의 병렬 파싱 (Parallel Parsing of MPEG Video in Heterogeneous Distributed Environment)

  • 남윤영;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.91-93
    • /
    • 2003
  • 디지털 비디오의 사용 증가로 인해 비디오의 인덱싱, 브라우징, 검색과 같은 서비스가 필요하게 되었다. 이와 같은 서비스의 효율적인 구축을 위한 단계 중, 비디오 파싱은 멀티미디어 애플리케이션에서 중요한 부분을 차지하고 있다. 일반적으로. 비디오 파싱은 복잡한 연산을 하기 때문에. 전통적인 단일 컴퓨터에 의한 파싱 방법은 많은 시간이 소요된다. 이러한 문제는 병렬 및 분산 컴퓨팅을 사용하여 파싱에 필요한 시간을 줄임으로써 해결할 수 있다. 본 논문에서는 이질 분산 환경의 멀티 컴퓨터를 사용한 세 가지 MPEG 비디오의 병렬 스케쥴링 알고리즘을 제안하였다. 성능 평가에서는 제안한 스케쥴링 알고리즘의 speedup과 load balancing에 관하여 비교 실험하였으며, 제안한 스케쥴링 알고리즘을 통해 매우 좋은 성능 향상을 얻을 수 있었다.

  • PDF

문자 해시와 이원 탐색 트리를 이용한 어절 빈도 계산 알고리즘의 성능 개선 (Improvement of algorithm for calculating word count using character hash and binary search tree)

  • 박일남;강승식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.599-602
    • /
    • 2010
  • 인터넷 검색 사이트는 사용자들이 검색한 단어들의 순위를 매기는 실시간 검색 순위 서비스를 제공하는데 검색되는 단어들의 순위를 매기기 위해서는 각 단어들의 분포도를 알 수 있는 어절 빈도 계산을 수행해야 한다. 어절 빈도는 BST(Binary Search Tree)를 수행하여 계산할 수 있는데, 사용자에 의하여 검색되는 단어들은 길이와 그 형태가 다양하여 빈도 계산시에 BST 의 깊이가 깊어져서 계산 시간이 오래 걸리게 된다. 본 논문에서는 문자 해시를 이용하여 깊이가 깊은 BST 의 탐색 속도를 개선하는 알고리즘을 제안하였다. 이 방법으로 빈도 계산 속도를 비교하였을 때 문자 해시의 범위에 의해 1KB 의 추가적인 기억공간의 사용하여 9.3%의 성능 개선 효과가 있었고, 해시 공간을 10KB 추가로 사용할 때는 24.3%, 236KB 일 때는 40.6%로의 효율로 BST 의 빈도 계산 속도를 향상 시킬 수 있었다.

일회용 트랩도어를 이용한 검색 가능한 암호 시스템에 관한 연구 (A Study on Searchable Encryption System using One-Time Trapdoor)

  • 이선호;이임영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.618-620
    • /
    • 2013
  • 네트워크 및 컴퓨팅 기술의 발달로 데이터를 위탁 저장하고 이를 언제어디서든 다양한 단말로 처리 할 수 있는 클라우드컴퓨팅서비스가 활성화되고 있다. 특히 클라우드컴퓨팅 서비스 중 DaaS가 널리 사용되고 있다. 하지만, 위탁 저장된 데이터베이스에 신체 정보라던가 개인의 민감한 정보가 암호화 없이 저장된다면 서버에 저장된 데이터를 데이터 소유주의 동의 없이 공격자 및 비윤리적인 서버관리자가 열람할 수 있다는 보안 문제점이 있어 위탁 저장된 데이터베이스의 암호화가 필요하다. 하지만 기존에 사용되고 있는 암호화 알고리즘으로 암호화된 데이터를 안전하게 검색하기 위해선 암호화 데이터를 전부 데이터 소유자의 단말기에 내려 받고 전부 복호화해서 검색해야 하기에 데이터를 위탁 저장하는 의미가 퇴색된다. 이와 같은 문제를 해결하기위해 검색 가능한 암호시스템(Searchable Encryption System)이 등장하게 되었다. 하지만 기존의 검색가능 암호 시스템은 같은 키워드를 검색하기위해 생성된 트랩도어가 동일한 형태를 가지게 된다. 수많은 검색 쿼리들이 위탁저장소에 전송되며, 저장소의 관리자는 쿼리를 통해 키워드를 유추하고, 쿼리를 통해 사용자가 어떤 데이터를 저장하고 검색하는지 학습이 가능하기 때문이다. 따라서 본 논문은 동일한 사용자가 같은 키워드를 검색하더라도 매번 다른 트랩도어가 생성되도록 하여 비윤리적인 서버관리자가 검색 쿼리를 통해 검색 내용 및 데이터를 유추할 수 없도록 하는 일회용 트랩도어를 이용한 검색가능 암호 시스템을 제안한다.

집합 기반 POI 검색을 이용한 문장 유사도 측정 기법 (Sentence Similarity Measurement Method Using a Set-based POI Data Search)

  • 고은별;이종우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권12호
    • /
    • pp.711-716
    • /
    • 2014
  • 최근 논문 표절 논란과 지능형 텍스트 검색서비스에 대한 관심이 증가하면서 문장 유사도 측정의 필요성이 증가하고 있다. n-gram, 편집거리, LSA 등 기존의 다양한 방향으로 선행 연구가 있었지만 각 기법마다 장단점이 존재한다. 본 논문에서는 집합 기반 POI 검색 기법을 이용한 새로운 방향의 문장 유사도 측정 기법을 제안한다. 집합 기반 POI 검색 기법은 하드매칭에 비해 단어의 도치, 누락, 삽입, 변경에 현저한 성능 향상을 보인다. 이 기법을 이용하면 보다 정확하고 빠른 문장 유사도 측정이 가능하다. 제안하는 기법은 기존 집합 기반 POI 검색 기법의 데이터 로딩 알고리즘과 텍스트 검색 알고리즘을 변형하고 어절 연산 알고리즘을 추가하여 두 문장의 유사도를 백분율로 표현한다. 실험을 통해 본 논문에서 제시하는 기법이 정확도와 속도에서 n-gram과 기존 집합 기반 POI 검색 기법에 비해 우수함을 확인하였다.

정확도가 향상된 안전한 Top-k 검색 기반 서비스형 블록체인과 스마트 컨트랙트 설계 (Design Blockchain as a Service and Smart Contract with Secure Top-k Search that Improved Accuracy)

  • 장호빈;천지영;정익래;노건태
    • 인터넷정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.85-96
    • /
    • 2023
  • 클라우드 컴퓨팅 기술 발전과 함께 이커머스, 금융 기업 등 다양한 영역에서 클라우스 서비스 제공자의 서비스형 블록체인을 활용하여 고객 이력 관리, 유통 이력 관리 등을 진행하고 있다. 하지만 추천 알고리즘, 검색 엔진 개발 등의 영역에서 사용자의 검색 이력, 구매 이력 등을 서비스형 블록체인에 활용하고자 하는 경우, 사용자의 검색 쿼리는 서비스형 블록체인을 운영하는 기업에 노출되며, 이에 대한 프라이버시 문제가 야기될 수 있다. Z. Guan 등의 연구는 컨소시엄 블록체인 환경에서 검색 가능 암호를 활용하여 사용자의 검색 쿼리와 검색 결과 간의 비연결성을 보장하며, 내적 유사도를 기반으로 사용자의 검색 쿼리와 관련성이 높은 Top-k 결과를 선정한다. 하지만 내적 유사도의 동점에 의해 Top-k 결과 중 일부가 선정 불가능한 문제점이 존재하며, 클라우드 기반의 서비스형 블록체인 환경은 고려되지 않았다. 따라서 본 논문은 코사인 유사도를 활용하여 Z. Guan 등 연구의 문제점을 해결하여 검색 결과의 정확도를 향상한다. 그리고 이를 바탕으로 정확도가 향상된 안전한 Top-k 검색 기반 서비스형 블록체인 설계 및 프라이버시를 보호하며 사용자의 검색과 관련성이 높은 Top-k 검색 결과를 얻을 수 있는 스마트 컨트랙트를 설계한다.

파싱 알고리즘을 이용한 편의점 정보 검색 시스템 구현 (Implementation of The Shopping Information Retrieval System using Parsing Algorithm)

  • 김승욱;유희경;정인철;김태우
    • 사물인터넷융복합논문지
    • /
    • 제2권4호
    • /
    • pp.1-8
    • /
    • 2016
  • 소비자가 각 편의점에서 제공하는 제품과 행사 상품 등을 값싸게 구매하기 위해서는 해당 편의점의 홈페이지를 들어가거나 직접 방문하여 찾아야 한다. 본 연구에서는 각 편의점에서 어떤 제품이 행사 상품이며, 어떤 편의점에서 어떤 서비스를 제공하는지 여부를 검색하는 앱 프로그램을 개발한다. 본 앱을 사용하여 사용자는 여러 편의점에서 제공하는 행사 정보를 비롯한 각종 서비스를 실시간을 검색할 수 있다.

소셜 이미지 분류를 위한 클러스터링 알고리즘 기반 트레이닝 집합 획득 기법의 비교 (A Study on Comparison of Clustering Algorithm-based Methods for Acquiring Training Sets for Social Image Classification)

  • 정진우;이동호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1294-1297
    • /
    • 2011
  • 최근, Flickr, YouTube 와 같은 사용자 참여형 미디어 공유 및 검색 사이트가 폭발적으로 증가하면서, 이를 멀티미디어 정보 검색 서비스에 효과적으로 활용하기 위한 다양한 연구들이 시도되고 있다. 특히, 이미지에 할당되어 있는 태그를 이용하여 이미지를 효과적으로 검색하기 위한 연구가 활발히 진행 중이다. 그러나 사용자들에 의해 제공되는 소셜 이미지들은 매우 다양한 범위와 주제를 가지고 있기 때문에, 소셜 이미지들의 분류 및 태그 할당을 위한 트레이닝 집합의 획득이 쉽지 않다는 한계점을 가지고 있다. 본 논문에서는 데이터 군집화를 위한 클러스터링 알고리즘들 중 K-Means, K-Medoids, Affinity Propagation 을 활용하여 소셜 이미지 집합으로부터 트레이닝 집합을 획득하기 위한 방법들을 살펴 본다. 또한, 각 알고리즘으로부터 획득한 트레이닝 집합을 이용하여 소셜 이미지를 분류한 결과를 비교 분석한다.