• Title/Summary/Keyword: 키워드 확장

검색결과 204건 처리시간 0.041초

클러스터링 기법을 이용한 키워드 유사도 순위화 알고리즘에 따른 사용자 질의 확장 (User Query Expansion Through Keyword Similarity Ranking Algorithm Us ins Cluster ing Methods)

  • 이상훈;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.479-481
    • /
    • 2003
  • 본 논문에서는 여러 가지 클러스터링 기법들을 사용하여 키워드 유사도롤 순위화하여 사용자의 질의를 확장하는 기법을 제안한다. 클러스터링 기법에는 연관(Association) 클러스터링, 메트릭(Metric) 클러스터링, 스칼라(Scalar) 클러스터링 기법을 사용하고, 이들간의 가중치를 적절히 조절하여 검색 시스템을 만든다. 사용자의 질의가 주어졌을 때, 질의 키워드와 연관된 키워드들을 순위화 하여 사용자에게 보여주고, 사용자의 추가입력을 받아서 질의를 확장한다. 사용자가 적당한 질의어로 판단하여 확장된 질의로 검색을 수행할 때까지 이 과정을 반복한다. 실험에서 사용한 문헌집합은 Korea Herald의 2003년 1월과 2월의 경제 관련 기사들을 수집하여 사용하였고, 실험을 거쳐서 질의를 확장한 결과 만족할 만한 결과가 도출되었다.

  • PDF

멀티미디어 파일에 대한 시맨틱 어노테이션에 관한 연구 (A Study on Semantic Annotation System for Multimedia File)

  • 황인문;유남현;송길종;김원중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (D)
    • /
    • pp.301-305
    • /
    • 2007
  • 기존의 멀티미디어 자료들을 직접 분석하여 메타데이터를 부여하던 기존 연구들은 멀티미디어 파일에 부여된 키워드에 해당하는 온톨로지가 존재하지 않는 경우 해당 멀티미디어 파일에 대한 직접 검색을 실시하지 않거나, 잘못된 의미가 부여된 키워드에 의하여 검색 결과의 정확성과 재현율이 떨어지는 문제점을 가지고 있었다. 본 논문에서 제안한 SASM은 키워드에 부여된 다의성과 동의성의 개념을 이용하여 WordNet을 이용하여 확장한 후, 확장된 키워드들을 이용하여 온톨로지가 구축되어 있지 않더라도 해당 이미지에 대한 직접 분석을 실시할 수 있으며, 키워드에 대한 동의성과 다의성을 이용한 확장된 키워드들을 이용함으로써 검색 결과의 재현율과 정확성의 성능을 향상시켰다.

  • PDF

효율적인 키워드 검색을 지원하기 위한 계층적 확장 Chord (Hierarchical extended Chord to Support Efficient Keyword Search)

  • 이승은;진명희;김경석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.574-576
    • /
    • 2004
  • 현재 Peer-to-Peer (P2P) 파일 공유 시스템은 특정 데이터 항목을 저장한 노드의 위치를 어떻게 효율적으로 찾을 것인가에 대해 연구되고 있다. DHT 기반 구조는 확장 가능하며 정확한 매치(exact-match) 질의가 가능하지만, 정확한 매치가 아닌 질의에 대해서는 효율적이지 못하다. 본 논문은 DT 기반의 P2P 파일 공유 시스템에서 확장 가능한 키워드 기반 파일 검색을 제공하기 위한 메커니즘을 제안한다. 우리의 제안된 구조는 높은 능력을 가진 ' 슈퍼피어 ' 를 둠으로써 많은 파일을 가진 공통 키워드로 인친 발생하는 과도한 저장 공간 소비와 네트워크 트래픽을 감소시킨다.래픽을 감소시킨다.

  • PDF

어휘의 사용 빈도와 프리시젼을 이용한 키워드 검색 성능의 향상 방안 (A Methodology Using Frequency and Precision of Terms for Improving the Searching Performance in Keyword Search)

  • 이상희;이동주;양종원;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.208-210
    • /
    • 2005
  • 웹에서의 검색을 수행하기 위해 다양한 연구가 수행되었으나, 일반적으로 키워드 검색 방식이 주를 이루고 있다. 이는 검색 대상에 대한 정보가 충분한 경우에는 원하는 검색 결과를 찾아내기 친우나, 그렇지 않은 경우에는 사용자로 하여금 원하는 검색 결과를 추출하기 위친 여러 번의 검색을 추가로 수행하는 수고로움을 요구하곤 한다. 이러한 문제를 해결하기 위하여 어휘 간의 관계에 기반을 둔 확장 검색 방식을 제안한다. 시소러스를 바탕으로 유의어 그룹을 정의하고, 사용자의 검색 키워드 정보를 이용하여 어휘 간의 관계 및 그룹 간의 관계를 정의한다. 정의된 관계를 바탕으로 키워드를 확장하고, 확장된 키워드의 사용 빈도와 프리시젼을 이용하여 사용할 어휘를 선별하여 검색을 수행한다.

  • PDF

키워드 검색 지원을 위한 확장 CAN 메커니즘 (Extended-CAN Mechanism to Support Keyword Search)

  • 이명훈;박정수;조인준
    • 한국정보통신학회논문지
    • /
    • 제10권3호
    • /
    • pp.421-429
    • /
    • 2006
  • 분산 해쉬 테이블 기반의 구조적 P2P시스템은 확장성이 우수하며 체계적인 검색과 라우팅을 수행하기 때문에 효율적인 검색이 가능하여 주목을 받고 있다. 그러나 이러한 장점에도 불구하고 공유파일 검색이 파일 식별자의 정확한 일치를 통해서만 가능하다. 즉 키워드 검색을 지원하지 못함으로써 P2P 응용에 있어 커다란 걸림돌이 되고 있다. 본 논문은 분산 해쉬 테이블 기반의 구조적 P2P 시스템 에서 공유파일의 컨텐츠 기반 키워드 추출 및 파일 식별자를 생성하고 PLS의 확장을 통해 키워드 사전인 KID와 CKD를 작성하여 피어에서 키워드 검색을 지원하는 확장된 CAN 메커니즘을 제안하였다.

링크 정보를 활용한 확장된 웹 검색 방법론 (A Rich Web Search Mechanism using Linkage Information)

  • 김승;임태수;이우기;강석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (D)
    • /
    • pp.531-536
    • /
    • 2007
  • 기존의 웹 검색 시스템은 주어진 키워드들을 모두 포함한 웹 페이지의 도출을 목표로 하기 때문에, 검색어의 popularity가 떨어지는 경우나, 키워드의 한정 정도가 과도하거나 많아지는 경우, 또는 키워드가 길어지는 경우 등에는 검색결과가 크게 줄어드는 결과희소성 문제(scarcity problem)를 겪게 된다. 본 연구에서는 이를 해결하기 위해서 검색결과를 개별 웹페이지 집합이 아닌 관련 웹페이지들간의 링크 구조로 도출해주는 확장된 검색 방법을 제시한다. 확장된 웹 검색은 링크기반 분석을 활용하여 개별 질의들에 대한 검색 결과 페이지들간의 링크 관계를 탐색하고, 도출된 검색 결과의 순위 측정을 통해 이루어진다. 본 연구에서 제안하는 확장된 웹 검색 방법은 결과희소성 문제에 효과적임을 보였다.

  • PDF

제어가능한 한국어 패러프레이즈 생성을 위한 제약들 (Constraints for Controllable Korean Paraphrase Generation)

  • 최승권;권오욱;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.544-546
    • /
    • 2022
  • 언어학적 다양성을 가지는 고품질의 한국어 패러프레이즈 생성을 위해 패러프레이즈의 생성을 제어할 수 있는 제약이 필요하다. 원문을 패러프레이즈로 변경하기 위한 생성용 제약으로 6 개의 제약을 제시한다: 키워드 치환, 키워드 확장, 품사 변경, 패턴 변경, 구조 변경, 키워드 리스트, 생성 길이. 원문으로부터 패러프레이즈를 생성할 때 제약이 적용되는 정도를 시물레이션해 보았다. 10 어절 이하의 원문은 평균 2.05 번의 제약이 적용되면 패러프레이즈가 생성되었으며 키워드 치환, 마스킹에 의한 키워드 확장과 패턴 변경에 관한 제약이 가장 많이 적용되는 것을 확인하였다.

유사 단어 커뮤니티 기반의 질의 확장 (Query Expansion based on Word Sense Community)

  • 곽창욱;윤희근;박성배
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1058-1065
    • /
    • 2014
  • 질의 확장은 입력된 질의와 관련된 키워드를 사용자에게 제시하여 검색 활동에 도움을 주는 방법이다. 최근에는 사용자가 검색한 내용에서 군집화 방법을 이용하여 도메인을 찾고 키워드를 제시하는 연구가 많이 이루어졌다. 하지만 군집화 방법은 군집의 개수를 정해야하기 때문에 다양한 도메인을 나타내는데 적절하지 않다. 따라서 본 논문은 커뮤니티 인지 알고리즘으로 검색 문서에서 질의마다 다양한 수의 도메인을 찾고 키워드로 선택하여 제시하는 방법을 제안한다. 이를 위해 사용자가 검색한 결과 중 상위 30개 문서를 대상으로 단어를 추출하여 그래프 기반의 커뮤니티를 만들고, 각 커뮤니티에서 키워드를 추출하여 이를 질의 확장에 이용하였다. 본 논문에서 제안한 방법은 구글 검색 엔진과 검색된 문서의 tf-idf를 이용한 키워드 추천 방법과 비교하였다. 제안한 방법이 다른 비교 대상들에 비해 더 다양한 키워드를 추천할 수 있었다.

확장 불리언 질의에 대한 비용 기반 최적화 (Cost-based Optimization of Extended Boolean Queries)

  • 박병권
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.29-40
    • /
    • 2001
  • 본 논문에서는 역색인 파일을 미용하여 학장 불리언 질의를 처리할 때 최소 비용의 질의 처리 방법을 구해 주는 질의 최적화 알고리즘을 제시한다. 확장 불리언 질의를 처리하는 방법은 질의를 구성하는 키위드의 처리 순서에 따라 여러 가지가 있을 수 있으므로 확장 불리언 질의 최적화 문제는 결국 최적 키워드 처리 순서를 구하는 문제로 귀결된다. 본 논문에서는 이 문제가 데이터베이스 질의 최적화에서 최적 조인 순서를 구하는 문제와 구조적으로 유사함을 보이고 이 분야의 연구 결과를 이용하여 문제를 해결한다. 즉, 확장 불리언 질의 처리에 대한 비용 모델을 수립하고 키워드 선택률과 역색인 파일 접근 비용을 이용하여 키워드 순위 개념을 도입한 후 이를 이용하여 최적 키워드 처리 순서를 구하는 알고리즘을 도출한다. 그리고 도출한 질의 최적화 알고리즘의 최적성을 증명하고. 실험을 통하여 실제로 최소비용의 질의 처리 방법을 구함을 보이고, 질의 최적화를 하지 않을 경우와 비교하였을 때 그 성능이 월등히 우수함을 보인다. 본 논문에서 제시한 질의 최적화 알고리즘은 정보검색시스템의 질의 처리 성능 향상에 큰 기여를 하리라 믿는다.

  • PDF

키워드 확장을 통한 효율적인 유의어 검출 방법 (Efficient Synonym Detection Method through Keyword Extension)

  • 지기용;박지수;손진곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.767-770
    • /
    • 2018
  • 인공지능의 발달로 사람이 사용하는 자연어 형태의 문장을 통해 정보를 주고받는 질의응답 시스템이 주목받고 있다. 이러한 질의응답 시스템은 자연어로 구성된 사용자의 질의문에서 의도를 정확하게 파악해야 한다. 단순히 질의어의 키워드에 의존한 검색은 단어의 중의성을 고려하지 않아 질의문의 의도를 정확히 파악하는 데 문제가 있다. 이런 문제점을 해결하기 위해 질의문의 의미와 맥락에 따른 연관성을 이용하여 유의어를 확장하는 방법이 연구되고 있다. 본 논문에서는 워드 임베딩을 통해 생성된 단어 유사도를 이용하여 질의문에서 추출된 키워드를 확장하는 방법을 제안한다.