• 제목/요약/키워드: 웹 검색어

검색결과 263건 처리시간 0.03초

웹 포털 이용자 로그 데이터에 기반한 개인화 검색 서비스 모형의 설계 및 평가 (Design and Evaluation of a Personalized Search Service Model Based on Web Portal User Activities)

  • 이소영;정영미
    • 정보관리학회지
    • /
    • 제23권4호
    • /
    • pp.179-196
    • /
    • 2006
  • 이 연구에서는 한국형 포털에 적합한 커뮤니티 기반 개인화검색 서비스 모형을 제안하였다. 개인화 검색 서비스 모형은 이용자의 관심 주제를 파악하는 과정과 이를, 반영한 검색 결과 재순위화 및 관련 주제 카테고리와 질의어 추천 과정으로 구성된다. 개인화 검색 모형의 유용성을 검증하기 위한 실험에서는 포털 사이트 다음에서 12일간 수집한 이용자 로그 데이터를 사용하였다. 실험 결과 개별 이용자의 주제 카테고리 선정에 사용한 카페 활동성 분석과 신지식 활동성 분석 데이터는 매우 유용한 것으로 나타났으며, 개인화 검색 결과와 추천서비스에 대한 만족도도 비교적 높게 나타났다.

빅 데이터를 이용한 임플란트에 대한 관심도 분석: 웹 기반 연구 (Analysis of interest in implant using a big data: A web-based study)

  • 공현준
    • 대한치과보철학회지
    • /
    • 제59권2호
    • /
    • pp.164-172
    • /
    • 2021
  • 목적: 본 연구는 구글 트렌드를 이용하여 일반적인 인터넷 사용자들이 치과 임플란트에 대해 가지고 있는 관심도를 분석하고, 관심도의 수준을 국민건강보험공단의 빅 데이터와 비교하기 위함이다. 재료 및 방법: 구글 트렌드는 검색 키워드에 대한 상대적 검색 볼륨을 제공하는데, 이것은 특정 기간 동안의 검색 빈도를 시각화하여 보여주는 평균 데이터이다. 임플란트를 검색어로 선정하여, 2015년에서 2019년까지의 일반적인 인터넷 사용자들의 관심도를 추세선과 6개월 이동평균선을 이용하여 분석하였다. 다음으로, 임플란트에 대한 상대적 검색 볼륨을 국민건강보험의 적용을 받아 임플란트를 식립한 환자 수의 변화와 함께 비교하였다. 임플란트와 전통적인 의치에 대한 상대적 관심도를 비교하였으며, 임플란트와 관련된 주요 연관 검색어를 분석하였다. 결과: 임플란트에 대한 상대적 검색 볼륨은 점진적으로 증가하였으며, 국민건강보험 혜택을 받은 환자 수와 유의한 양의 상관관계를 보였다 (P < .01). 임플란트에 대한 관심도는 모든 기간에 있어서 의치에 비해 높았다. 연관 검색어로는 임플란트 비용이 가장 빈번하게 관찰되었으며, 임플란트 과정에 대한 검색이 증가하였다. 결론: 본 제한된 연구의 결과를 근거로, 임플란트에 대한 대중의 관심은 점진적으로 증가하고 있으며, 관심의 세부 분야는 변하고 있다. 또한 웹 기반의 구글 트렌드 데이터를 전통적인 방식의 데이터와 비교한 결과, 유의한 상관관계를 확인할 수 있었다.

이미지 검색 과정에 나타난 질의 전환 및 재구성 패턴에 관한 연구 (Examining Categorical Transition and Query Reformulation Patterns in Image Search Process)

  • 정은경;윤정원
    • 정보관리학회지
    • /
    • 제27권2호
    • /
    • pp.37-60
    • /
    • 2010
  • 이 연구는 이미지 특성 범주와 관련하여 질의 재구성 패턴을 탐색하고자 하였다. 이러한 연구 목적을 수행하기 위해서 Excite 웹검색 엔진 로그 데이터가 사용되었으며, 총 592 세션과 2,445 질의어가 분석되었다. 데이터 분석은 Batley의 정보 형태 구분과 선행 연구에서 밝혀진 팻싯과 서브팻싯을 활용하여 수행되었다. 분석결과는 두가지 형태로 구분하여 제시되었다. 첫째, 질의 재구성에 관한 분석결과이다. 질의 분석 결과, 가장 많은 부분을 차지하는 범주는 특정어(specific)와 지칭어(nameable)이며, 이러한 경향은 다양한 정보 탐색 단계에서도 지속적으로 나타났다. 둘째, 질의 재구성 패턴과 관려하여, 평행이동이 가장 많이 나타났으며, 이러한 경향은 최초 혹은 직전 질의 범주에 따라 근소한 차이를 보였다. 범주 전환 분석에서는 높은 비율(60%-80%)로 검색 질의의 범주가 지속적으로 동일한 범주에 머무르는 경향을 밝혀내었다. 이러한 결과는 이미지 검색 시스템 설계와 구현에 있어서, 이용자의 질의 선정 과정에 도움을 제공하고 효과적인 시소러스 구축 등에 활용될 수 있을 것으로 기대된다.

지식 생산 방식에 따른 집단지성 구조 분석 -네이버 지식IN과 위키피디아를 중심으로- ('Collective intelligence Structure' Analysis)

  • 한창진
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1363-1373
    • /
    • 2009
  • 본 연구는 두 집단지성의 가장 대표적인 서비스인 네이버 지식iN과 위키피디아의 구조적, 경험적 차이를 바탕으로 생산의 차원에서 생산 주기, 생산 참여자, 생산물의 모델을 설정하고, 새롭게 탄생하는 지식을 중심으로 검증함으로써 최종 지식 소비 행위를 반영한 각각의 종합모델을 도출하였다. 우리는 웹에서 집단지성의 일상화를 확인할 수 있다. 지식 획득 매체가 매스미디어에서 인터넷으로 변화하는 과정에서 등장한 포털 및 검색사이트는 지식의 생산이 전문가패러다임에서 소비자 중심으로 재편될 수 있는 가능성을 열어주었다. 그리고 이러한 생산 방식의 변화는 '지식'의 개념 역시 변화시키고 있다. 즉, 집단지성이라는 새로운 웹2.0의 현상이 지식생산방식을 변화시키고 변화된 지식생산방식은 '지식'자체를 변화시킨다는 이론적 가설을 도출할 수 있는 것이다. 본 연구는 이러한 새로운 현상들을 분석하기 위해서는 먼저 보다 엄밀하게 집단지성의 개념을 규정할 필요성에 출발하였다. 현재 집단지성이라는 이름으로 불리면서 급격히 성장하고 있는 위키 방식의 인터넷 서비스와 지식검색 방식의 인터넷 서비스를 비교함으로써 보다 정교한 집단지성의 모델을 구축하고자 하였다. 위키형 집단지성과 지식검색형 집단지성의 차이점은 경험적으로도 뚜렷하게 확인할 수 있다. 본 연구는 이러한 경험적 차이와 기존의 문헌에서 밝혀진 사실들을 바탕으로 두 서비스의 지식생산 방식을 생산플로우, 생산참여자 성향, 생산물(지식)의 성향과 같이 세 영역으로 나누어 각각의 가설 모델을 설정하고 이 모델을 선정된 질의어를 바탕으로 검증한 뒤에 최종적인 모델을 도출하는 방식으로 진행되었다. 지식검색형 집단지성은 '질문-답변-채택'의 구조이고, 그 구조 속에서 '질문기-답변기-순서화기'를 거쳐 하나의 지식 덩어리인 'K-let'을 생산한다. 생산된 'K-let'들은 지식검색서비스의 데이터베이스에 축적되고, 이는 공통된 질의어를 기준으로 소비자들에 의해서 검색되어 소비된다. 하나의 질문에 대해 여러 개의 답변들이 존재하고, 답변자의 성향은 크게 전문성과 체계성을 바탕으로 한 전문가형 답변자와 경험적이고 의견지향적인 대화형 답변자로 나눠진다. 다수의 네티즌들의 참여에 의해서 지식의 생산이 진행되므로 질문의 성향 역시 사실, 의견, 경험 등 다양한 스펙트럼을 가지는 모델로 설정하였다. 반면에 위키형 집단지성은 개방형 플랫폼을 바탕으로 한 백과사전의 형식이며, 이러한 형식 속에서 최초의 개념어 등록과 다수의 편집활동을 거치면서 완성되지 않는 하나의 아티클인 'W-let'을 생산한다. 이러한 'W-let'은 생성 초기에 소수에 의한 활발한 내용 입력 활동으로 어느 정도의 안정화를 거친 후에는 꾸준한 다수의 수정활동을 통해서 'W-let'의 생명력을 유지함으로써 지식의 실제적인 변화를 반영한다. 생산된 'W-let'들은 위키형 집단지성 서비스의 데이터베이스에 축적되고, 이것들은 내부링크를 통해서 모두 연결되어 있다. 백과사전 형식으로 하나의 개념어를 설명하는 하나의 아티클은 오로지 사실적인 지식들로만 구성되나 내부링크와 외부링크를 통해서 다양한 스펙트럼을 가지는 모델로 설정하였다. 위와 같이 설정된 모델을 바탕으로 공통된 질의어 및 개념어를 선정하여 각각의 서비스에 노출시켰다. 이를 통해서 얻어진 각 서비스의 데이터베이스에 축적된 모든 데이터들 중에서 일정한 기간을 기준으로 각각의 모델 검증에 필요한 데이터를 추출하여 분석하는 방식으로 진행되었다. 그 결과 지식검색형 집단지성에서는 '질문-답변-채택'의 생산 구조 속에 다수가 참여하여 질문-채택답변-기타답변으로 배열되어 있는 완성된 형태의 K-let들을 지속적으로 생산하며 비슷한 성향을 가진 K-let들이 반복적으로 생산되어 지식검색 데이터베이스에 누적된다. 지식 소비자들은 질의어 검색을 통해서 다양한 K-let들을 선택하여 비교, 검토한 후에 선택된 K-let들의 배열은 해체되어 소비자들에 의해서 재배열됨을 발견할 수 있었다. 이에 지식검색형 집단지성이란 다수의 의해서 생산되고 누적된 지식들이 소비자의 검색과 선택에 의해 해체되어 재배열되는 지식의 맞춤화 과정이라고 정의내릴 수 있었다. 반면에 위키형 집단지성에서는 '내용입력-미세수정' 구조 속에서 생명력 있는 W-let을 생성한다. W-let은 백과사전처럼 정리되어 내부링크를 통해서 서로 연결되고, 외부링크를 통해 확장되고, 지식소비자들은 검색을 통해 최초의 W-let에 도달한 후에 링크를 선택함으로써 지식을 확장시킴을 검증할 수 있었다. 따라서 위키형 집단지성이란 다수의 의해서 생산되고 정리된 지식들이 소비자의 검색과 링크에 의해 무한히 확장되는 지식의 확대 재생산되는 과정이라고 정의 내릴 수 있다. 결국, 현재의 집단지성이란 지식이 다수의 참여로 생산됨으로써 개인에게 맞춤화되고, 끊임없이 확대 재생산되는 과정을 의미한다. 그리고 이러한 집단지성의 방식은 지식이라는 현재의 차원을 넘어서 정치, 경제를 비롯한 사회의 전 영역으로 점차적으로 확대되어갈 것이다. 앞으로 연구들은 두 가지 모델이 혼재되어 있는 현재의 집단지성이 어떠한 새로운 모델을 만들면서 다른 영역으로 확장되어갈 것인지에 대해서 초점을 맞춰 나가야할 것이다.

  • PDF

웹 문서 중 의미 있는 표의 추출 (Extraction of Meaningful Tables from The Web Documents)

  • 정성원;이원희;김영기;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.332-339
    • /
    • 2002
  • 현재까지 정보 검색 시스템은 색인어 위주로써 문서의 구조적 정보를 고려하지 알았다. 글자의 크기나 글자체, 들여 쓰기, 표 등은 저자의 의도를 구체화하며, 문서를 명확하게 하는 주요한 수단이다. 이 연구에서는 특히 표에 주목한다. 표는 많은 문서에 일반적으로 쓰이며, 글을 명확하게 해 준다. 일반 문서에 비해서 웹 문서는 태그를 이용하여 정보를 추가할 수 있어 표를 쉽게 구분할 수 있다. 하지만, 웹 상의 표는 지식을 구조화하는 근본적인 목적이외에, 단순히 화면을 정렬하려고 하는 목적으로도 많이 쓰인다. 이 연구에서는 정보 검색시스템에 표 정보를 사용하기 위한 전처리 단계로 의미 있는 표를 추출하는 방법을 제시하며, 이를 위하여 결정 트리를 사용한다.

  • PDF

사용자 모델 신경회로망을 기반으로 한 사용자 중심의 리서치 에이전트 시스템 (Personalized Research Agent System Based on User Model Neural Network)

  • 송종길;김유신;조영임
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.321-323
    • /
    • 1999
  • 본 논문에서는 사용자가 자신이 연구하고 있는 분야에 관련된 웹 문서를 스스로 찾아서 보여 주는 PReA 시스템을 구현한다. 사용자의 성향을 파악하기 위해서 미리 작성된 서지 정보데이터를 사용자가 사용하는 것을 관찰하여 사용자 모델 신경회로망을 구축한다. 사용자 모델 신경회로망은 단어의 부하와 단어 사이의 부하로 구성되어 있어서 사용자의 정보 요구의 의미를 나타낼 수 가 있다. 사용자 모델 신경회로망을 기반으로 질의어를 생성하고 웹문서를 검색하며 검색된 문서에 대해 순위를 정한다. 순위가 정해진 문서중 사용자가 선택한 문서와 선택하지 않은 문서는 각각 사용자 모델 신경회로망을 학습하는데 쓰이게 되며 오랜 시간 동안 사용함에 따라 회로망은 사용자의 성향에 적응하게 되어 보다 정확한 검색을 수행하게 된다.

  • PDF

어휘의 사용 빈도와 프리시젼을 이용한 키워드 검색 성능의 향상 방안 (A Methodology Using Frequency and Precision of Terms for Improving the Searching Performance in Keyword Search)

  • 이상희;이동주;양종원;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.208-210
    • /
    • 2005
  • 웹에서의 검색을 수행하기 위해 다양한 연구가 수행되었으나, 일반적으로 키워드 검색 방식이 주를 이루고 있다. 이는 검색 대상에 대한 정보가 충분한 경우에는 원하는 검색 결과를 찾아내기 친우나, 그렇지 않은 경우에는 사용자로 하여금 원하는 검색 결과를 추출하기 위친 여러 번의 검색을 추가로 수행하는 수고로움을 요구하곤 한다. 이러한 문제를 해결하기 위하여 어휘 간의 관계에 기반을 둔 확장 검색 방식을 제안한다. 시소러스를 바탕으로 유의어 그룹을 정의하고, 사용자의 검색 키워드 정보를 이용하여 어휘 간의 관계 및 그룹 간의 관계를 정의한다. 정의된 관계를 바탕으로 키워드를 확장하고, 확장된 키워드의 사용 빈도와 프리시젼을 이용하여 사용할 어휘를 선별하여 검색을 수행한다.

  • PDF

구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템 설계 및 구현 (A design and implementation of the management system for number of keyword searching results using Google searching engine)

  • 이주연;이중화;박유현
    • 한국정보통신학회논문지
    • /
    • 제20권5호
    • /
    • pp.880-886
    • /
    • 2016
  • 인터넷 상에 많은 정보들이 발생하면서 검색 엔진은 사용자에게 필요한 흩어진 정보를 모아주는 중요한 역할을 하고 있다. 일부 검색 엔진에서는 검색어가 포함된 검색 결과 페이지뿐만 아니라 검색 결과 수도 함께 제공하고 있다. 구글 검색엔진에서 제공하는 검색 결과 수는 인터넷에서 해당 검색어에 대한 전체적인 추세를 파악하는데 활용될 수 있다. 본 논문에서는 구글 검색엔진에서 제공하는 검색결과 수를 효과적으로 관리할 수 있는 구글 검색엔진을 활용한 키워드 검색결과 수 관리 시스템을 설계하고 구현하고자 한다. 제안하는 시스템은 웹으로 작동하며 검색 에이전트, 저장 노드, 검색 노드로 구성되어 키워드 및 검색 결과 수를 관리하고 검색을 수행한다. 최종 검색 결과로는 검색 키워드, 검색 결과 수, 검색 결과 수를 활용하여 두 키워드의 거리를 계산하는 NGD(Normalized Google Distance)가 제공된다.

웹 상의 정보검색을 위한 지능형 검색시스템의 연구 (A Study of Practical Search System for Information Retrieval on the Web)

  • 박병율;임종태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1737-1740
    • /
    • 2002
  • 검색시스템은 분류시스템과 지식탐사 시스템을 결합하여 구성한 복합적인 시스템으로 일반 사용자들에게 자신이 일하는 정보의 데이터를 우선적으로 제공한다. 시스템의 특징으로 겉으로 보기에는 일반 검색엔진과 유사하나, 시스템적으로는 요구하는 각종 기능과 검색 기법, 지식탐사기법이 들어있다. 시스템에서는 문서 분류기법과 문서와 검색어 사이의 연관성을 찾기 위한 방법, 문서간의 연속적인 사건을 통한 검색 패턴 탐사기법을 사용하였다. 이들은 시스템의 검색과 분류 결과를 지금까지보다 더욱 인공지능에 가깝도록 하여 준다.

  • PDF

웹 브라우저 다중 사용 환경과 비영어권 국가에서의 인터넷 사용흔적 조사 방법 (A Method for Tracing Internet Usage in Multi-use Web browser Environment and Non-English Speaking Countries)

  • 이승봉;이상진
    • 정보보호학회논문지
    • /
    • 제20권5호
    • /
    • pp.125-132
    • /
    • 2010
  • 웹 브라우저는 인터넷을 사용하기 위한 필수적인 응용 프로그램이다. 만약 용의자가 범죄 행위 시 웹 브라우저를 사용하였다면, 범죄와 관련된 흔적은 웹 브라우저 로그 파일에 저장이 된다. 따라서 용의자의 컴퓨터에 저장되어 웹 브라우저 로그 파일을 조사 한다면, 사건과 관련된 유용한 정보를 얻을 수 있다. 특히 검색어는 범죄 수사 시 매우 유용한 정보를 제공한다. 그러나 영어가 아닌 언어는 인코딩되어 표현되기 때문에 국내 범죄 수사 시 어려움이 존재한다. 본 논문에서는 웹 브라우저 로그 파일 조사에 관련한 사전 연구와 도구들에 대하여 살펴보고 이러한 보그 파일을 포렌식 관점에서 분석하는 방법을 소개한다. 그리고 소개한 방법을 적용한 도구를 실제 사건에 적용한 사례에 대하여 설명한다.