• 제목/요약/키워드: 클러스터 검색

검색결과 210건 처리시간 0.032초

웹과 GIS를 통합한 ″Kyonggi21Search″ 구현 : 색인어간 연관도 생성 및 최적화 (Implementation of ″Kyonggi21Search″ combining GIS with The Web : Optimization of Index Association)

  • 장정훈;이룡;상임미언;권용진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.79-81
    • /
    • 2003
  • Kyonggi21Search시스템은 GIS와 웹을 통합한 지역정보 검색 시스템이다. 웹과 GIS를 연동하여 지리정보를 검색하기 위해 웹 문서에서 지역관련 색인어를 추출하고, 색인어간의 관련성을 계산한다. "Kyonggi21Search"시스템에서는 웹 문서에 많이 나타나는 일반적인 단어보다는, 많은 문서에 나타나지 않는 지리적 문화적인 단어들 간의 관련성을 찾는 것이 더 중요한데, 본 연구에서는 단어들 간의 관련성을 찾는데 연관규칙과 연관클러스터를 이용하여 연관도를 계산한다. 그리고 이런 단어들의 관련성을 찾는데는 연관 클러스터를 이용하는 것이 더 적합하다는 것을 보여준다. 한편 웹 문서와 색인어를 이용하여 만든 행렬은 희소행렬이라는 점을 이용하여 연관 클러스터 방법의 단점인 높은 계산량을 줄이는 최적화 방법을 제안한다.

  • PDF

검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델 (A Term Cluster Query Expansion Model Based on Classification Information of Retrieval Documents)

  • 강현수;강현규;박세영;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.7-12
    • /
    • 1999
  • 정보 검색 시스템은 사용자 질의의 키워드들과 문서들의 유사성(similarity)을 기준으로 관련 문서들을 순서화하여 사용자에게 제공한다. 그렇지만 인터넷 검색에 사용되는 질의는 일반적으로 짧기 때문에 보다 유용한 질의를 만들고자 하는 노력이 지금까지 계속되고 있다. 그러나 키워드에 포함된 정보가 제한적이기 때문에 이에 대한 보완책으로 사용자의 적합성 피드백을 이용하는 방법을 널리 사용하고 있다. 본 논문에서는 일반적인 적합성 피드백의 가장 큰 단점인 빈번한 사용자 참여는 지양하고, 시스템에 기반한 적합성 피드백에서 배제한 사용자 참여를 유도하는 검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델(Term Cluster Query Expansion Model)을 제안한다. 이 방법은 검색 시스템에 의해 검색된 상위 n개의 문서에 대하여 분류기를 이용하여 각각의 문서에 분류 정보를 부여하고, 문서에 부여된 분류 정보를 이용하여 분류 정보의 수(m)만큼으로 문서들을 그룹을 짓는다. 적합성 피드백 알고리즘을 이용하여 m개의 그룹으로부터 각각의 용어 클러스터(Term Cluster)를 생성한다. 이 클러스터가 사용자에게 문서 대신에 피드백의 자료로 제공된다. 실험 결과, 적합성 알고리즘 중 Rocchio방법을 이용할 때 초기 질의보다 나은 성능을 보였지만, 다른 연구에서 보여준 성능 향상은 나타내지 못했다. 그 이유는 분류기의 오류와 문서의 특성상 한 영역으로 규정짓기 어려운 문서가 존재하기 때문이다. 그러나 검색하고자 하는 사용자의 관심 분야나 찾고자 하는 성향이 다르더라도 시스템에 종속되지 않고 유연하게 대처하며 검색 성능(retrieval effectiveness)을 향상시킬 수 있다.사용되고 있어 적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract

  • PDF

클러스터 문서할당을 위한 휴리스틱 기법에 관한 연구 (A Study on Heuristic Methods for Clustered Document Allocation)

  • 박경모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.54-56
    • /
    • 1998
  • 본 논문에서는 병렬 정보검색 시스템에 있어 클러스터 문서할당을 위한 두 가지 휴리스틱 기법을 제시한다. 효율적 문서할당에 관한 매핑 문제를 정의하고 유전알고리즘과 모의냉각기법에 기반을 두는 휴리스틱 매핑 알고리즘을 기술한다. 알고리즘 성능실험과 관련하여 시뮬레이션을 통한 다른 할당 알고리즘과 비교평가한 결과 개선된 성능을 얻을 수 있었다.

  • PDF

파일조직 방법에 따른 검색성능의 비교연구 (An Experimental Study on the Retrieval Performance of File Organization Methods)

  • 송미련
    • 정보관리학회지
    • /
    • 제3권1호
    • /
    • pp.17-39
    • /
    • 1986
  • 정보검색시스템에 대한 관심이 날로 증대하고 또 온라인 정보검색시스템의 발달로 이용자는 더욱 효과적이고 빠른 탐색을 기대하게 되었다. 여기서 중대한 문제의 하나가 파일조직방법의 선택이다. 본 논문에서는 파일조직방법이 검색성능에 영향을 미칠 것이라는 가설하에 여러가지 파일조직방법 충 도치파일과 클러스터파일을 선택하여 그에 따른 검색성능을 비교하였다.

  • PDF

검색결과의 브라우징을 위한 계층적 클러스터링 (A Hierarchical Clustering for Browsing Retrieval Results)

  • 윤보현;김현기;노대식;강현규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.342-344
    • /
    • 2000
  • 대부분 웹 검색엔진들의 검색결과로 수십 혹은 수백만건의 문서가 제시되어 사용자가 원하는 문서를 찾는데 어려움이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 검색 결과의 브라우징을 위한 검색 결과 문서에 대한 자동 클러스터링 방법을 제안한다. 문서간 유사도를 계산하기 위해 공통 키워드 빈도를 이용하고, 클러스터링 방법은 계층적 클러스터링을 사용하고, 각 클러스터에 대한 디스트립터를 추출하기 위해 빈도를 이용한다. 실험 결과, 완전 연결 방법이 가장 나은 정확도를 보였지만 계산시간이 많이 소요되어 동적 환경에 부적합하다는 것을 보였다. 아울러 집단 평균 연결이 정확도나 계산 시간 측면에서 우수함을 알수 있었다.

  • PDF

클러스터 P2P 네트워크에서의 최적 슈퍼피어 개수 (Optimal Number of Super-peers in Clustered P2P Networks)

  • 김성희;김주균;이상규;이준수
    • 정보처리학회논문지C
    • /
    • 제13C권4호
    • /
    • pp.481-490
    • /
    • 2006
  • 슈퍼피어 기반 P2P 네트워크는 전체 네트워크를 여러 개의 작은 서브 네트워크로 클러스터링하고 각 클러스터를 해당 그룹에 속한 노드들에 대한 정보를 가지고 있는 슈퍼피어라는 특정 노드가 관리하는 네트워크 모델로써 검색의 효율성과 네트워크 부하가 적다는 이점을 가지고 있다. 본 논문은 슈퍼피어기반 P2P네트워크에서 먼저 피어들의 정보검색, 새로운 노드 가입, 정보갱신 동의 동작으로 발생하는 메시지의 양을 기반으로 한 트래픽 비용을 클러스터 내의 비용과 슈퍼피어 간의 비용으로 측정하고, 이 두 비용을 바탕으로 다양한 네트워크 크기에 따라 트래픽 비용을 최소화할 수 있는 슈퍼피어의 개수를 제시한다.

음악 추천 시스템에서 대표 선율을 이용한 내용 기반 필터링 기법 (Content-Based Filtering Using Representative Melody in Music Recommendation System)

  • 원재용;구경이;김유성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.229-231
    • /
    • 2004
  • 내용 기반 음악 검색 시스템은 사용자가 원하는 음악에 대해 사전 정보를 모르더라도 곡의 일부로 질의를 함으로써 원하는 결과를 얻을 수 있게 한다. 그러나 내용 기반 음악 검색 시스템은 사용자의 질의에 대해 결과에 대한 순위만을 제공할 뿐 사용자의 취향이나 선호도와 같은 개인 정보를 고려하지 않기 때문에 사용자가 충분히 만족할만한 정보를 제공받지 못해 사용자의 만족도가 떨어진다. 이를 해결하기 위해 본 논문에서는 대표 선율을 이용하여 유사한 곡들로 클러스터링을 수행하고 내용 기반 검색 시 질의가 속하는 클러스터를 찾고 해당 클러스터 안에서 거리함수를 통해 질의와 유사한 곡들을 선별한다. 선별된 곡들과 사용자의 프로파일을 통해 음악 취향을 고려할 수 있는 내용 기반음악 필터링 기법을 적용하여 사용자의 만족을 증가시키는 결과를 제공한다.

  • PDF

효율적인 병렬정보검색을 위한 색인어 군집화 및 분산저장 기법 (Term Clustering and Duplicate Distribution for Efficient Parallel Information Retrieval)

  • 강재호;양재완;정성원;류광렬;권혁철;정상화
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.129-139
    • /
    • 2003
  • 인터넷과 같은 대량의 정보에 대응할 수 있는 고성능 정보검색시스템을 구축하기 위해서는 지금까지 고가의 중대형컴퓨터를 주로 활용하여 왔으나. 최근 가격대 성능비가 높은 PC 클러스터 시스템을 활용하는 방안이 경제적인 대안으로 떠오르고 있다. PC 클러스터 상에서의 병렬정보검색시스템을 효율적으로 운영하기 위해서는 사용자가 입력한 질의를 처리하는데 요구되는 개별 PC의 디스크 I/O 및 검색관련 연산을 모든 PC에 가능한 균등하게 분배할 필요가 있다. 본 논문에서는 같은 질의에 동시에 등장할 가능성이 높은 색인어들끼리 군집화하고 생성된 군집을 활용하여 색인어들을 각 PC에 분배함으로써 보다 높은 수준의 병렬화를 달성할 수 있는 방안을 제시한다. 또한 일부 PC의 결함 또는 유지보수 등의 원인에 의한 서비스 중지상황에도 적극적으로 대처하기 위하여 색인어 역파일을 중복되게 분산저장하는 기법을 제안한다. 대용량 말뭉치를 활용한 실험결과 본 논문에서 제시하는 분산 및 중복저장기법이 충분한 효율성과 실용성이 있음을 확인하였다.

무선 애드-혹 네트워크를 위한 다중-홉 클러스터 라우팅 프로토콜 (Multi-Hop Cluster Routing Protocol in Wireless Ad-hoc Network)

  • 전형국;김문정;엄영익
    • 한국정보과학회논문지:정보통신
    • /
    • 제28권2호
    • /
    • pp.183-195
    • /
    • 2001
  • 무선 ad-hoc 네트워크는 중앙의 특별한 관리 체계 없이 기존의 유선 네트워크 또는 기지국을 사용하지 않는 이동 호스트들만으로 구성된 네트워크를 말한다. 이러한 무선 ad-hoc 네트워크는 잦은 망 구성의 변화 라우터의 수, 제한된 사용자원 등 기존 유선 네트워크와는 다른 특성들을 가지게 된다. 따라서 기존의 유선 네트워크에서 사용하던 라우팅 프로토콜들을 무선 ad-hoc 네트어크의 특성을 고려하여 네트워크 내의 이동 호스트를 멀티 흡을 갖는 클러스터로 묶고 클러스터 헤드로 하여금 자신의 멤버 호스트들과 이웃 클러스터들의 헤드 정보를 유지하게 하여 경로 설정에 대한 요구가 있을때에 적은 지연시간과 적은 패킷으로 목적지까지의 최단 경로를 설정할 수 있도록한다. 또한 이동 호스트로 구성된 클러스터를 무선 ad-hoc 네트워크의 변화에 따라서 적절한 크기로 변화시켜 네트워크에 발생되는 경로 검색 오버헤드를 줄일수 있게 하였고 경로 복구와 경로 유지에 드는 비용을 최소화하기 위한 알고리즘을 제시한다.

  • PDF

클러스터 시스템상에서의 CPU 전원 관리 (CPU Power Management on Cluster Systems)

  • 오수철;김성운
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.553-555
    • /
    • 2007
  • 클러스터 시스템은 가격대 성능비의 효율성 때문에 다양한 분야에서 활용되고 있으며, 구축 규모도 급속히 증가하고 있다. 특히, 인터넷을 통한 정보 검색 및 공유가 활발하게 이루어지면서, 정보를 수집, 가공 및 제공하는 대형 포털들의 규모가 급속히 증가하고 있다. 포털들은 대량의 정보를 서비스하기 위해서 대규모의 클러스터 시스템을 운영하고 있으며, 이러한 시스템을 유지 관리하는 것은 커다란 문제점중의 하나이다. 대규모 클러스터 시스템의 운영 비용중에서 전력비용이 상당히 큰 부분을 차지하고 있으며, 이를 감소시키려는 다양한 시도가 진행되고 있다. 본 논문에서는 클러스터 시스템의 전력사용량을 감소시키기 위해서 CPU 의 전력을 효율적으로 관리하는 있는 관리 메커니즘을 제안한다.