• 제목/요약/키워드: 검색어 추출

검색결과 328건 처리시간 0.025초

키워드 마케팅을 위한 연관 키워드 추출 기법 (A Related Keyword Group Extraction Method for Keyword Marketing)

  • 이성진;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.124-126
    • /
    • 2004
  • 인터넷 광고 시장의 급속한 성장과 함께 보다 효율적인 광고기법을 개발하기 위한 노력들이 이루어지고 있는 가운데 최근 들어 검색엔진의 특성을 이용한 키워드 광고가 주목을 받고 있다. 키워드 광고란 사용자가 입력한 검색어와 유사한 범주에 속하는 사이트의 광고를 검색 결과 페이지 상단에 보여주는 것을 말한다. 그러나, 키워드 광고는 키워드를 판매할 수 있는 위치가 한정적이기 때문에 판매 가능성이 있는 키워드에 대한 관리 및 판매 전략이 요구된다. 본 논문에서는 판매 가능성이 있는 키워드에 대한 관리 전략 수립을 위하여 연관 키워드 그룹을 자동으로 추출하는 기법을 제안한다. 연관 키워드 그룹의 생성은 사용자가 입력한 검색어에 의해 노출되는 사이트들을 묶어 그룹으로 형성하고 사이트 그룹의 중요 키워드를 추출한 다음 키워드간의 연관성을 판단하는 과정으로 이루어진다. 본 논문에서는 연관 키워드 그룹 추출의 각 단계를 구체적으로 설명하고 실험 결과를 분석한다. 마지막으로 연구의 결론과 향후 연구 과제에 대하여 기술한다.

  • PDF

의존 구문 구조 관점으로 본 서브토픽 마이닝 (Subtopic Mining from the View of Dependency Structure)

  • 김세종;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.294-296
    • /
    • 2012
  • 본 논문은 일본어 웹 문서 말뭉치로부터 의존 구문 구조 관점으로 바라본 단어들의 동시발생(co-occurrence) 정보를 사용하여 서브토픽 마이닝(subtopic mining)을 수행하는 방법론을 제안한다. 우리는 의존 구문 구조를 반영하는 간단한 패턴들을 사용하여 서브토픽들을 추출 및 생성하고, 제안한 수식을 바탕으로 순위화한다. 본 방법론은 기존의 주요 상용 검색 서비스에서 제공하는 연관 검색어 및 추천 검색어를 사용한 방법론보다 좋은 성능을 보였다.

PDA를 이용한 한국어 자동 색인 시스템 (Korean Automatic Indexing System Using the PDA)

  • 박평구;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.375-378
    • /
    • 2000
  • 인터넷의 급속한 발달로 사용자는 자신의 질의에 적합한 검색결과를 빠르고 정확하게 보장하는 검색도구를 요구하게 되었다. 이러한 사용자의 요구는 검색도구의 성능향상에 필수적인 문서의 내용을 대표하는 색인어를 추출하는 색인 시스템에 대한 관심을 가지게 되었다. 기존의 한국어에서의 자동 색인 방법에는 어절 중심 색인법, 형태소 중심 색인법과 최근에 n-gram 중심 색인법 등이 주류를 이루어 왔다. 그러나 한국어에서 색인어를 추출하는 기존의 방법은 복합명사의 색인과 복잡한 문법적 지식이 필요하고 잘못된 색인어를 추출하는 등의 검색효율에 문제점을 가지고 있다. 본 논문에서는 PDA를 이용한 정형화된 한국어와 영어문장의 자동 색인 방법을 제안한다. 제안하는 방법은 별도의 사전지식이 필요하지 않고 단일 명사와 복합명사의 색인이 가능하며 인터넷으로의 확장과 다양한 언어로 확장성이 좋은 장점 등을 갖는다. 성능 평가로써 한국통신의 KTSET으로 MS사의 IIS를 웹 서버로 ASP를 이용하여 인터넷 환경에서 테스트를 통하여 한국어 뿐 아니라 영어문장의 정형화되고 이용이 간편한 자동색인 결과를 보여준다.

  • PDF

CRF를 이용한 대명사 참조해소 시스템 (Automated Pronoun Resolution Using CRF)

  • 김형철;서형원;김재훈;최윤수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.197-201
    • /
    • 2009
  • 이 논문은 영어 문장에서 대명사의 참조해소 시스템을 구현한다. 대명사는 문장에서 반복되는 말 대신에 사용하는 단어이다. 반복되는 말을 선행어라고 하며 대명사는 선행어보다 간결한 형식으로 사용된다. 정보검색이나 정보추출에서 대명사를 그대로 색인하여 검색하면 정확한 정보를 추출할 수 없다. 따라서 대용어가 가리키는 개체를 정확히 파악해서 이 정보를 색인하고 검색하면 정보검색, 정보추출, 질의응답의 성능을 크게 개선할 수 있다. 이 논문에서는 CRF모델을 이용해서 이용하여 영어 문서에서 대명사 참조해결 방법을 제안하고 이를 구현한다.

  • PDF

사용자 검색이력 기반의 잠재적 질의어 추천 시스템 개발 (Development of the Potential Query Recommendation System using User's Search History)

  • 박정배;박기남;임희석
    • 디지털융복합연구
    • /
    • 제11권7호
    • /
    • pp.193-199
    • /
    • 2013
  • 본 논문에서는 정보검색 시스템 사용자가 자신의 잠재적 정보욕구를 질의어로 표현하고, 원하는 정보가 검색될 수 있도록 사용자 검색이력 기반의 잠재적 질의어 추천 시스템을 제안한다. 제안하는 시스템은 사용자의 검색 질의어를 기반으로 기존 사용자들의 검색이력과의 연관관계를 분석하고, 사용자 잠재적 정보욕구를 추출하였다. 추출된 잠재적 정보욕구는 추천 질의어로 표현되어 사용자에게 추천된다. 본 논문에서는 제안한 시스템의 효용성 분석을 위하여 27,656건의 검색이력 데이터를 이용하여 행동실험을 실시하였다. 실험결과 피험자들은 제안한 시스템을 사용할 때 일반 검색엔진을 사용할 때 보다 높은 통계적으로 유의미한 만족도를 나타내었다.

지역 감성기반 영상 검색을 위한 감성 스케치 질의 (Query-by-emotion sketch for local emotion-based image retrieval)

  • 이경미
    • 인터넷정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.113-121
    • /
    • 2009
  • 본 논문에서는 지역적으로 서로 다른 감성을 지닌 영상을 검출하기 위해서 감성 스케치를 이용한 영상 검색 시스템을 제안 하였다. 제안하는 검색 시스템은 영상을 $17{\times}17$의 겹치지 않는 부분영역으로 나누고, 각 부분영역에 대한 감성 특징을 추출한다. 본 논문에서는 부분영역 내에서 감성 특징을 추출하기 위해서, H. Nagumo의 배색이미지차트에서 제안하는 160개 감성어에 대한 감성 색상을 이용하였다. 부분영역으로부터 해당 감성어에 대한 감성 색상의 분포정도를 계산하여 각 부분영역의 감성어에 대한 히스토그램 값 중 가장 큰 값을 지닌 감성어를 취하게 된다. 제안하는 감성 스케치를 이용한 영상 검색 시스템은 Corel 영상 데이터베이스에 대해서 유효성을 평가하여, 전역적 방법보다 우수한 검색 정확도와 재현도를 가짐을 보여주었다.

  • PDF

정보검색에서 사용자 검색 패턴을 이용한 질의 확장 (Query Expansion Using User Search Pattern in Information Retrieval)

  • 천우관;김영도;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.771-774
    • /
    • 2001
  • 정보검색에서 가장 많이 사용되는 불리언(Boolean)검색에서는 키워드 일치에 의해서만 검색하는 단점을 가지고 있다. 이를 보완하기 위해 다양한 정보원에서 추출한 관련 용어들을 원질의어에 첨가하여 검색의 효율을 높이기 위한 질의 확장 방법들이 모색되어 왔다. 본 논문에서는 질의 확장을 위하여 사용자가 검색에 사용하였던 질의어들의 연속성을 찾아내어 첨가할 용어를 선택하고 질의 확장을 하는 방법을 제시한다. 사용자가 입력한 질의어의 연속성을 찾아내는 방법으로는 데이터 마이닝 기법중 연관 규칙 탐사 방법을 이용한다. 실험은 현재 구축된 정보통신 기술기준 정도시스템에서 사용자들이 검색한 키워드 정보를 이용하였으며 사용자 검색 패턴(USP) 정보를 이용함으로써 사용자가 검색하고자 하는 질의어와 좀더 연관성 있는 용어로 확장하여 사용자 중심적 결과를 얻을 수 있다.

  • PDF

실시간 검색어 연관 분석을 통한 핵심 이슈 선정 (Selecting a key issue through association analysis of realtime search words)

  • 정민영
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.161-169
    • /
    • 2015
  • 포털 사이트의 실시간 검색어는 현재 관심이 급상승하고 있는 이슈를 보여주기 위해 주로 검색횟수가 많은 순서에 따라 몇 초 간격으로 제공되고 있다. 그렇지만 너무 짧은 시간 내에 순위가 바뀌는 실시간 검색어의 특성 때문에 하루의 핵심 이슈를 비켜가는 문제가 발생한다. 본 논문에서 이러한 문제를 보완하기 위해 검색어들 사이의 연관 분석을 통하여 검색어들이 관련된 핵심 이슈를 도출하는 방법을 제안하고자 한다. 이를 위해 먼저 실시간 검색어를 순위와 상대적 관심도를 기반으로 점수화하여 집단별 기술통계를 통해 최상위 10개의 검색어를 도출한다. 그 다음으로 지지도와 신뢰도를 기반으로 연관 규칙을 추출하고 이를 가시화하는 그래프 결과를 바탕으로 핵심 이슈를 선정한다. 실험 결과는 단일 최상위 실시간 검색어보다 연관분석을 통해 높은 점수로 선정된 핵심 이슈가 더 큰 의미를 갖는다는 것을 보여준다.

이질적 분산 데이터베이스의 통합검색을 위한 질의어 XML DTD 설계에 관한 연구 (A Study on the XML DTD Design of Query for Integrated Retrieval of Heterogeneous Distributed Databases)

  • 이성진;이응봉
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.125-130
    • /
    • 2001
  • 정보 저장 검색 기술의 발달로 여러 개의 데이터베이스를 한꺼번에 검색할 수 있는 분산통합검색 시스템에 관심이 증가하고 있다. 그러나 데이터베이스의 종류 및 검색방식이 다양하기 때문에 분산통합검색 시스템의 구축에는 통합검색의 확장성과 데이터베이스간의 독립 운영성이 떨어지는 문제가 있다. 따라서 본 고에서는 이러한 문제점 해결을 위해 기존 데이터베이스들의 질의 구조를 분석해서 질의 구조의 핵심 요소들과 관련 요소들을 추출한 후, XML을 사용하여 대부분의 데이터베이스의 질의어를 포괄할 수 있는 질의어 Meta Format을 설계한다. 이렇게 작성한 표준화된 XML 질의어 Meta Format(DTD)은 분산통합검색에 적용되어 분산통합검색 시스템과 지역 데이터베이스들간의 독립 운영성 및 확장성을 증대시킬 전망이다.

  • PDF

주제어 가중치 기법에 의한 효율적인 블로그 검색 시스템 (Efficient Blog Retrieval System by Topic-based Weighting)

  • 신현일;윤은일;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.1-9
    • /
    • 2010
  • Web 2.0으로 불리는 새로운 세대의 웹에서, 블로그를 통하여 누구나 손쉽게 정보나 의견을 세상에 알릴 수 있게 되었고 이러한 블로그를 효과적으로 검색하기 위해서 블로그의 특성을 고려한 검색 알고리즘들이 새롭게 제안이 되고 있다. 그러나 실제 블로그 검색 시스템에 적용된 키워드 기반 검색이나 블로그간의 링크 분석을 통한 랭킹만으로는 사용자가 기대하는 성능을 발휘하지 못한다. 본 논문에서는 검색 결과를 향상시키기 위해 블로그 글과 검색어와의 연관성을 고려한 주제어 가중치 기반의 블로그검색 시스템을 제안한다. 제안된 시스템은 블로그 글 마다 주제어(Topic)를 추출하여 색인어보다 더 높은 가중치를 부여한다. 기존 시스템과의 비교에서 제안된 방법이 실제 검색 결과에서 재현율이 향상됨을 알 수 있었다.