• 제목/요약/키워드: web search

검색결과 1,673건 처리시간 0.025초

폭소노미 기반 개인화 웹 검색 시스템 (Folksonomy-based Personalized Web Search System)

  • 김동욱;강수용;김한준;이병정
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권1호
    • /
    • pp.105-115
    • /
    • 2010
  • 검색엔진들은 사용자로부터 질의어를 전송받아 질의어와 관련이 가장 높은 웹 문서들을 보여주게 된다. 하지만 검색엔진이 사용자의 질의어만 가지고 사용자의 의도를 파악하여 정확한 웹 문서를 제공하기는 어렵다. 따라서 검식 엔진 시스템은 다양한 개인화 방법을 사용하여 각 사용자가 원하는 검색 결과를 보여주기 위해 노력한다. 본 논문에서는 개인화 검색을 위해 '폭소노미'를 기반으로 사용자에게 적합한 질의어를 추천해 주는 방법을 제안한다. 또한 이러한 개인화된 검색 결과를 제공하는 시스템이 가질 수 있는 프라이버시 침해 위험성을 제거하면서도 검색 서비스 제공자 입장에서는 사용자 정보를 활용한 다양한 서비스(개인화 광고등) 제공이 가능하도록 하는 개인화 검색 서비스 구조를 제안한다.

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

시맨틱 웹에서의 효율적인 온톨로지 추론을 위한 개선방법에 관한 연구 (A Study on Methodology for Efficient Ontology Reasoning in the Semantic Web)

  • 홍준석
    • 한국전자거래학회지
    • /
    • 제13권3호
    • /
    • pp.85-101
    • /
    • 2008
  • 온톨로지를 이용한 시맨틱 웹은 의미 기반의 표현 수단으로써 기존의 웹이 갖는 한계점을 극복할 수 있는 차세대 웹의 표준으로 인식되고 있다. 시맨틱 웹에 표현된 정보를 최대로 활용하기 위해서는 온톨로지에 대한 질의 검색 및 추론 기능이 필요한데, 대부분의 시맨틱 웹 도구들은 RDF 메타데이터 구조에 따른 Triple 기반의 저장 구조를 이용함으로 인해 온톨로지 추론을 위한 의미 단위의 복합 질의를 효율적으로 지원하지 못하고 있다. 본 연구에서는 기술 논리(DL)에 기반하여 온톨로지 데이터 구조와 일치하는 저장 구조를 설계하고, 이를 이용하여 시맨틱 웹 온톨로지에 대한 질의 검색 도구를 개발함으로써 온톨로지 추론을 위한 효율적인 복합 질의 검색을 지원할 수 있는 개선 방법을 제시하고자 한다. 그리고 제안된 방법을 구현한 시스템인 SMART-DLTriple을 기존의 시스템과 비교하여 그 성과를 평가하였다. 개선된 온톨로지 질의 검색 방법은 온톨로지 추론의 성능 향상에 기여하여 실용적인 온톨로지 추론 시스템의 개발에 도움을 줄 것이다.

  • PDF

3-태그 기반의 웹 이미지 검색 기법 (3-tag-based Web Image Retrieval Technique)

  • 이시화;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1165-1173
    • /
    • 2012
  • 웹2.0 환경에서의 대중적인 기술 중 하나는 태깅이며, 현재 블로그와 같은 웹 문서에서부터 이미지, 동영상 등과 같은 멀티미디어 데이터에 이르기까지 폭넓게 적용되고 있다. 그러나 태깅에 사용된 태그가 정보 검색에 재사용되어 검색의 효율성을 극대화 시킬 것이라는 기대와는 달리 실제로는 부정확한 태그로 인해 낮은 검색 결과를 제공 하고 있다. 이에 선행 연구에서는 웹상에 산재되어있는 다양한 리소스 및 그에 따른 태그 정보들을 수집하여 태그들 간의 연관성에 따라 맵핑하고, 이를 클러스터링 하기 위한 연구를 진행하였다. 본 논문에서는 클러스터링된 태그들을 검색에 활용하는 3-태그 기반 검색 알고리즘을 제안하였다. 제안 알고리즘의 성능평가를 위하여, 태그 기반 대표 사이트인 Flicker 사이트의 이미지 검색 결과와 정확성 및 재현율을 비교 평가하였다.

시맨틱 웹을 이용한 B2B E-Marketplace 제품 검색 프레임워크 구현 (An Implementation of the B2B E-Marketplace Product Search Framework using Semantic Web)

  • 유제석;정영일;김창욱
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2005년도 춘계공동학술대회 발표논문
    • /
    • pp.1-9
    • /
    • 2005
  • Today, according to tremendous development of B2B e-commerce, B2B e-marketplaces which accomplish various types of transactions through a number of buyers and sellers on online are embossed importantly. However, buyers are unable to search correct products because of inconsistency of product information between buyers and sellers. This paper solved this problem as semantic web technology. Semantic Web is an extension of current Web in which information is given well-defined meaning, better enabling computers and people to work in cooperation. The Semantic Web aims at machine-processable information. Its underlying technologies are RDF, RDF Schema, and ontology as the shared formal conceptualization of particular domains. In this paper, we present an implementation of Semantic Web enabled search system for B2B E-Marketplace domains. The system exploits OWL as the standard ontology language proposed by W3C and the Jena which is a Semantic Web toolkit, namely a Java framework writing Semantic Web applications. Finally, we summarize our experiences and discuss future research topics.

  • PDF

연관 규칙 탐사 기법을 이용한 해양 전문 검색 엔진에서의 질의어 처리에 관한 연구 (A Research on User′s Query Processing in Search Engine for Ocean using the Association Rules)

  • 하창승;윤병수;류길수
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.266-272
    • /
    • 2002
  • Recently various of information suppliers provide information via WWW so the necessary of search engine grows larger. However the efficiency of most search engines is low comparatively because of using simple pattern match technique between user's query and web document. And a manifest contents of query for special expert field so much worse A specialized search engine returns the specialized information depend on each user's search goal. It is trend to develop specialized search engines in many countries. For example, in America, there are a site that searches only the recently updated headline news and the federal law and the government and and so on. However, most such engines don't satisfy the user's needs. This paper proposes the specialized search engine for ocean information that uses user's query related with ocean and search engine uses the association rules in web data mining. So specialized search engine for ocean provides more information related to ocean because of raising recall about user's query

  • PDF

의학 분야 웹 자료의 분류에 대한 개선 방안 연구 (A Study on the Organizing Web Materials in the Field of Medicine)

  • 정경희
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.89-106
    • /
    • 2004
  • 웹 상의 의학 분야 자료들은 방대한 규모로 존재하며, 각 검색엔진에서는 이를 분류하여 제공하고 있으나 그 구성에 있어서 일관성과 체계성이 부족하다. 따라서 본 논문은 검색엔진에서 의학 분야 웹 자료 분류체계를 구성하기 위하여 의학 전문 문헌분류표인 NLMC를 준용하고, 항목의 배열이 주제간 관련성을 기반으로 이루어져야 한다는 것을 제안하였다. 또한 순환성을 고려한 1차 분류 및 2차 분류 항목에서의 중복 분류시, 그에 대한 명확한 기준이 설정되어야 하며, 분류 항목명을 의학 분야 표준 용어집인 MeSH와 $\boxDr$의학용어집$\boxUl$의 용어로 선택하여 기존의 도서관 정보검색시스템과의 상호호환성을 높여야 한다는 것을 제안하였다.

동시링크분석을 이용한 웹정보원의 지적구조 변화에 관한 연구 (A Study on Changes of the Intellectual Structure in Web Information Using the Co-links Analysis)

  • 이성숙
    • 정보관리학회지
    • /
    • 제22권2호
    • /
    • pp.205-228
    • /
    • 2005
  • 이 연구는 웹정보원의 지적 구조를 동시링크분석을 이용하여 시기별 변화와 검색엔진별 차이를 중심으로 분석하였다. 지적 구조의 시기별 변화를 분석한 결과, 이차원 지도상에 나타난 웹정보원의 군집과 위치는 6년간의 시간흐름에 따른 지적 구조의 변화를 나타냈다. Altavista와 MSN Search 검색엔진을 대상으로 지적구조의 차이를 분석한 결과, 웹정보원 지도에 나타난 전체적인 지적 구조는 유사한 양상을 나타냈지만, 몇몇 웹정보원의 경우 소속 군집이 달라지는 경우가 발생했다. 인쇄 정보원에 적용되던 동시인용기법이 웹정보원에 대한 통시적 분석에도 응용될 수 있음을 확인하였다.

웹 검색 성능 최적화를 위한 융합적 방식 (Fusion Approach for Optimizing Web Search Performance)

  • 양기덕
    • 정보관리학회지
    • /
    • 제32권1호
    • /
    • pp.7-22
    • /
    • 2015
  • 이 논문은 시스템 성능을 최적화하기 위해 정적 및 동적 튜닝 방법을 이용한 웹 융합검색 연구의 내용을 보고합니다. 기존의 융합 방식을 넘어선 "다이나믹 튜닝"이라는 과정을 도입하여 웹의 다양한 정보소스의 기여를 최적화 시킬 수 있는 융합 공식을 생성하는 방법을 조사한 이 연구의 결과는 웹 검색 환경의 풍요로운 여러 데이터 소스를 활용하는 것이 효과적인 전략이라는 것을 보여주었습니다. 본 연구에서는 즉각적인 시스템 피드백 인지분석을 기반으로 융합 매개 변수를 미세 조정하는 반복적 인 다이나믹 튜닝 과정을 통해 크게 검색 성능을 향상시킬 수 있었습니다.

RIA 기반 개인화 검색을 위한 Widget 응용의 구현 (RIA based Personalized Search with Widget Implementation)

  • 박차라;임태수;이우기
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권6호
    • /
    • pp.402-406
    • /
    • 2007
  • 쉽고 유연한 조작과 역동적인 화면구성에 초점을 맞춘 인터넷서비스 맞춤기술인 RIA(Rich Internet Application) 기술들은 웹2.0기술 중 사용자 편의성을 강조한 차세대 UI기술로 기대되고 있다. 본 논문은 평면적이고 순차적인 방법의 고급검색을 동적UI로 구현하고 사용자가 개인화 검색정보를 저장해서 검색에 활용할 수 있도록 구현하였다. 또한 사용자중심의 선호도를 통해 기존 웹 검색보다 개인화된 검색 결과물을 발견할 수 있는 검색구조를 설계하였다. 본 연구는 RIA 기술을 활용한 개인화 검색 관리자의 적용을 통해 검색된 페이지양의 감소를 입증하여 사용자에게 더욱 정제된 데이터를 제공하며 결론적으로 사용자들이 더욱 유연하고 편리한 방법으로 개인화된 웹 검색을 이용할 수 있음을 보였다.