• 제목/요약/키워드: 하이퍼링크

검색결과 198건 처리시간 0.025초

웹의 개념지식을 위한 Anchor Text에서의 키워드 추출 알고리즘의 구현 (A Implementation of Keyword Extraction Algorithm Using Anchor Text for Web's Conceptual Knowledge)

  • 조남덕;배환국;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.72-74
    • /
    • 2000
  • 인터넷을 효과적으로 검색하기 위하여 검색엔진을 많이 이용하고 있다. 그런데 문서의 키워드를 추출할 적에 지금까지는 Anchor Text를 염두에 두지 않았었다. Anchor Text는 사람이 직접 요약한 것이고(요약성), 하이퍼링크를 포함하는 웹 문서에 반드시 존재하므로(보편성) 그 하이퍼링크가 가리키는 곳의 문서의 키워드를 추출에 적합한 용도가 될 수 있다. 웹 그래프는 이러한 Anchor Text를 이용하여 키워드를 추출함으로써 문서와 문서간, 단어와 단어간의 관계(연관성)까지도 나타내 줄 수 있게 한 검색 엔진 시스템이다. 그러나 Anchor Text 자체가 본문의 내용이 아니고, Anchor Text를 작성한 사람에 따라 다르게 작성되며, 본문의 내용과 무관한 내용도 작성할 수 있다. 따라서 Anchor Text 자체를 어떠한 여과 없이 문서의 키워드로 받아들이긴 힘들다. 본 논문에서는 TFIDF를 통해 좀 더 정확성이 있는 키워드를 추출하였다.

  • PDF

탐색과 브라우징을 지원하는 하이퍼미디어 시스템의 설계 (Design of a hypermedia system for effective searching and browsing)

  • 고영곤;최윤철
    • 정보관리학회지
    • /
    • 제10권1호
    • /
    • pp.15-30
    • /
    • 1993
  • 하이퍼미디어 시스템은 멀티미디어 정보간의 연상적 관게를 링크, 노드개념에 입각하여 지원함으로써 기존의 데이타베이스 시스템이나 텍스트 검색 시스템의 한계성을 극복해 준다. 본 연구는 텍스트, 그래픽, 영상, 목소리/사운드 등의 멀티미디어 정보를 지원해 주는 하이퍼미디어 시스템을 설계, 구현하였고 시스템의 기능을 보여주기 위하여 성경과 성경 관련 정보에 적용하여 응용시스템을 구축하였다. 특히 본 시스템에서는 탐색과 브라우징 기능을 효율적으로 통합함으로써 하이퍼미디어 시스템의 정보검색 기능과 사용자 인터페이스를 높이도록 설계하였다. 국립중앙도서관에 제안한 고서용 MARC 포멧과 기술규칙을 기초로 그 특징적인 것을 요약 정리한 것이다.

  • PDF

하이퍼 텍스트의 가중치 조절과 링크 구조 분석 기법을 통한 검색 엔진 성능 개선 (Performance Improvement of Information Retrieval System through Weight Adjustment of Hypertext and Link Structure Analysis)

  • 이상호;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.108-112
    • /
    • 2003
  • 웹 문서의 가장 큰 특징 중 하나는 링크 구조이다. 이 링크들을 이용하여 전체 웹 문서를 커다란 하나의 네트워크로 구성할 수 있으며 이러한 네트워크를 분석함으로써 보다 중요한 문서, 보다 유용한 사이트를 찾아낼 수 있다. 전통적인 검색 모델인 벡터 모델의 성능 개선을 위해 이러한 링크 분석 기법을 활용하여 검색 정확도를 향상시키기 위한 방법을 제안한다. 또한 하이퍼 텍스트는 보다 정확한 키워드를 포함할 확률이 높으므로, 이를 가중치 계산에 적용하여 보다 정확한 결과를 산출한다.

  • PDF

웹 로봇 에이전트의 하이퍼링크 분석기법을 이용한 음란메일 차단 시스템의 구현 (Implementation of Anti-Porn Spam System based on Hyperlink Analysis Technique's of the Web Robot Agent)

  • 이승만;정희석;한상;송우석;이도한;홍지영;반의환;양준영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.332-335
    • /
    • 2007
  • 이메일은 누구나 쉽게 정보를 교환할 수 있는 편리함 때문에 인터넷에서 가장 중요한 수단으로 사용되고 있다. 그러나 순수한 의사소통의 수단이 아닌 스팸메일의 범람은 성인뿐만 아니라, 어린이 청소년에게도 무차별적으로 전송됨으로써 심각한 부작용을 낳고 있다. 본 논문은 점차 지능화 되는 신 유형의 음란 스팸메일로부터 청소년을 보호하기 위하여 새로운 방법의 음란메일 차단시스템을 제안하고자 한다. 기존의 스팸메일 차단시스템은 사용자가 직접 음란한 메일이라고 판단되는 메일에 대해 일일이 키워드를 설정하거나, 메일 내용 중에 텍스트만을 추출하여 패턴 매칭방법으로 분류하는 것이 대부분이었지만, 본 논문은 기존 방법의 문제점을 해결하기 위하여 이미지 내 Skin-Color분포의 Human Detection 알고리즘과 웹 로봇 에이전트의 하이퍼링크 분석기법을 사용하였다. 성능 측정결과, 형태소 분석과 Human Detection 알고리즘을 병합하여 적용한 경우 성능 측정에서 90% 정도의 F-measure를 보였지만, 추가적으로 웹 로봇 에이전트의 하이퍼링크 분석기법을 병합하여 적용한 경우 97% 이상의 F-measure를 보이며, 신뢰성이 높은 음란스팸메일 차단 시스템을 구현할 수 있다는 것을 증명하였다.

  • PDF

정부포탈 지식관리의 하이퍼링크 네트워크 실증 분석 - 혁신포탈 사례를 중심으로 - (A Study on a Government Portal from the Knowledge Management Perspective Using Hyperlink Network Analysis: Focusing on the Innovation Portal)

  • 김재근;유승현
    • 정보화정책
    • /
    • 제17권2호
    • /
    • pp.25-44
    • /
    • 2010
  • 조직의 생존 과정에서 지식관리의 기능은 지식의 흐름을 용이하게 할 수 있는 네트워크 구조의 구축을 강조하는 구조적 접근방법과 각각의 맥락에 맞는 새로운 지식을 창출 또는 재창출하기 위한 과정으로서 지식활동 주체들 간 사회적 네트워킹의 활성화를 강조하는 과정적 접근방법의 통합적 관점에서 논의될 수 있다. 이러한 맥락에서 혁신포탈은 혁신 지식 네트워크를 형성하여 기존 지식의 공유 및 새로운 지식의 창출 또는 재창출을 촉진시킴으로써, 각 주체의 혁신역량을 강화하고 혁신 효율성 및 성과를 제고하기 위한 목적으로 2005년에 구축 개통되었다. 구축 당시 참여정부의 혁신방향이 참여형 거버넌스의 강화에 있었음을 감안할 때, 혁신포탈은 정부혁신을 한 단계 성숙시키는 중요한 정책수단이 될 것으로 기대되었다. 그러나 혁신포탈은 이와 같은 기대를 충족시키지 못한 채, 2008년 이명박 정부의 출범과 함께 폐쇄되었다. 이에 본 연구에서는 정부기관의 웹사이트 간 하이퍼링크 네트워크 분석을 적용하여 당시 혁신포탈의 실효성을 통합적인 지식관리 관점에 초점을 맞추어 분석함으로써, 향후 정부포탈의 구축 및 운영에 관한 이론적 정책적 함의를 모색하였다.

  • PDF

웹페이지의 의학용어 출현 빈도와 하이퍼링크에 기반한 웹사이트 분류 (Website Classification based on Occurrence Frequency of Medical Terms and Hyperlinks in Webpage)

  • 이인근;김화선;조훈
    • 한국지능시스템학회논문지
    • /
    • 제23권2호
    • /
    • pp.126-132
    • /
    • 2013
  • 본 논문은 웹페이지에 포함된 의학용어의 출현 빈도와 웹페이지 간의 하이퍼링크로 이루어진 웹사이트의 구조에 기반하여 인터넷 웹사이트를 분류하는 방법을 제안한다. 제안하는 방법에서는 (1)웹페이지에 포함된 전체 용어에서의 의학용어 출현빈도와 (2)웹페이지에 포함된 중복을 제거한 용어에서의 의학용어 출현 빈도를 인자로 하여 웹페이지의 의학분야 적합도를 측정한다. 그리고 (3)홈페이지로부터 특정 웹페이지에 접근하기 위해 거쳐야 하는 하이퍼링크의 개수를 이용한 전체 웹페이지의 적합도 연산을 통해 웹사이트의 의학분야 적합도를 측정한다. 인터넷 포털 사이트의 디렉토리 검색 서비스에 등록된 80 개의 의학분야 웹사이트와 127 개의 비 의학분야 웹사이트를 대상으로 제안한 방법에 기반하여 웹사이트 분류 실험을 수행하였고, 82.5 %의 분류 정확률을 확인하였다.

하이퍼링크 구조를 이용한 웹 검색의 순위 알고리즘에 관한 연구 (The Study on the Ranking Algorithm of Web-based Sear ching Using Hyperlink Structure)

  • 김성희;오건택
    • 정보관리연구
    • /
    • 제37권2호
    • /
    • pp.33-50
    • /
    • 2006
  • 본 연구에서는 하이퍼 링크 구조를 이용한 웹 검색 알고리즘에 대해 살펴 본 후 페이지 품질을 측정하기 위해 웹의 하이퍼 구조를 이용하고 있는 알고리즘인 HITS와 PageRank를 분석하였다. 이어서 이들 방법을 이용한 검색 엔진인 Google과 Ask.com을 검색 알고리즘의 특성을 기준으로 분석하였다. 이런 연구는 미래의 웹 문서의 중요도를 평가하는 데 기초자료로 활용할 수 있으며, 웹 정보검색의 검색성능을 향상시키는 시스템 개발에 도움이 될 수 있을 것이라 생각한다.

동적 포맷팅 방식에 관한 연구 (A Study on Dynamic Formatting Method)

  • 임광택;이수연
    • 한국통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.730-738
    • /
    • 1993
  • 주기억 장치의 크기등과 같은 하드웨어적 특성에 구애받지 않고, 메뉴얼등과 같은 대용량 문서를 효과적으로 제작할 수 있으며, 단일 문서내의 서로 인접하지 않는 페이지간의 상호 참조나 하이퍼텍스트 응용의 링크 설정에 긴요한 동일 스크린내 복수개 페이지의 동시 표현과 같은 사용자 인터페이스를 실현할 수 있는 동적 포맷팅 방식을 제안한다. 또한 복수개의 문서중 각각의 특정 페이지를 선택적으로 동일 스크린내 표시함으로써 문서의 일부분을 발췌하여 다른 문서에 포함시키거나, 문서간 하이퍼링크의 설정 및 상호 참조등에도 유효하게 적용할 수 있다. 본 연구에서 제안한 방식은 X 윈도우 및 Motif를 이용한 WYSIWYG방식의 전자 출판 시스템의 연구개발의 일환으로 구현하였다.

  • PDF

문서의 효율적인 검색을 위한 HTML 문서 변환 시스템 (HTML Document Conversion System for Effective Retrieval of Text Document)

  • 김수의;장대용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.184-186
    • /
    • 2000
  • 이 연구에서는 텍스트 문서를 웹에서 HTML 문서 형태로 효율적으로 검색할 수 있는 변환 시스템을 개발하였다. 웹상에 사용자가 원하는 부분만을 HTML 문서 형태로 제공하도록 문서의 논리적인 구조를 파악하며 그 구조에 대한 정보와 각 논리 단위에 해당하는 부분의 범위 정보를 저장할 수 있도록 관계형 데이터베이스 스키마를 개발하였다. 개발한 시스템은 문서의 목차 테이블을 자동으로 구축하고 목차 테이블의 각 항목에 하이퍼링크를 설정한다. 문서를 웹에서 검색하기 위한 첫 화면은 목차 테이블이며, 그 중 한 항목이 클릭되면 그 항목의 내용이 제공되고, 만약 그 하위에 속하는 항목들이 있다면 그들에 대한 링크를 역시 제공한다. 이러한 방법으로 한 문서의 전체를 그 논리 구조에 따라 사용자가 원하는 대로 검색할 수 있다. 이 시스템은 멀티미디어 타입의 문서를 하이퍼미디어 문서 형식으로 변환할 수 있도록 확장하여 보완 개발될 수 있고, 장래에 전자 출판과 전자 도서관에 응용될 수 있다.

  • PDF

하이퍼텍스트 정보 관점에서 의도적으로 왜곡된 웹 페이지의 검출에 관한 연구 (Detecting Intentionally Biased Web Pages In terms of Hypertext Information)

  • 이우기
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.59-66
    • /
    • 2005
  • 웹(World Wide Web)은 정보의 저장 및 검색에 있어서 보편적인 매체가 되고 있다 웹에서는 일반적으로 검색엔진(Web search engine)을 통해 정보 검색을 수행하지만, 그 결과가 사용자의 요구와 늘 일치하는 것은 아니며 때로는 의도적으로 조작된 검색 결과가 제시되기도 한다. 웹 페이지에 대한 평가를 조작하는 것을 의도적 조작이라고 부른다. 최근에 가장 각광을 받는 링크 기반 검색 방식에는 의도적 조작이 상대적으로 어렵지만, 링크 기반 검색 방식의 대표격인 구글의 페이지 점수법(PageRank algorithm)도 구글밤처럼 조작할 수 있는 방법이 있다 본 논문에서는 기본적으로 링크 기반 검색 방식을 기초로 웹을 하나의 유향그래프(directed graph)로 인식하여 각 웹 페이지들은 하나의 노드로, 하이퍼텍스트 링크를 에지(edge)로 표현하며. 하이퍼텍스트 정보관점에서 링크 내역과 대상 페이지(target page) 사이의 유사도(similarity)를 구하고. 이것을 이용하여 페이지 점수화 (PageRank) 접근법의 전이 행렬(transition matrix)을 재구성하는 방법을 취했다 결과적으로 기존의 점수화 방법과 비교하여 효과가 $60\%$ 이상 될 수 있음을 입증했다.

  • PDF