• 제목/요약/키워드: 웹 링크

검색결과 365건 처리시간 0.022초

문서간의 유사도를 이용한 개선된 PageRank 알고리즘 (Improved PageRank Algorithm Using Similarity Information of Documents)

  • 이경희;김민구;박승규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.169-171
    • /
    • 2003
  • 웹에서의 검색 방법에는 크게 Text-Based 기법과 Link-Based 기법이 있다. 본 논문은 그 중에서 Link-Based 기법의 하나인 PageRank 알고리즘에 대해 연구 하고자 한다. 이 PageRank 알고리즘은 각 페이지의 중요성을 수치로 계산하는 방법이다. 하지만 이 알고리즘에서는 페이지에서 페이지로 링크를 따라갈 확률의 값을 일정하게 주어서 모든 페이지의 값을 획일적으로 계산하였기 때문에 각 페이지의 검색 효율성에 문제가 있다고 판단하여, 이를 해결하고자 본 논문은 페이지사이의 유사도를 측정하여 유사도에 따라 링크를 따라가는 확률 값인 Damping factor값을 다르게 부여하여 검색의 효율성을 높였다. 이를 위하여 두 가지 방법의 실험을 통하여 구현, 증명하였다.

  • PDF

웹 로봇 에이전트의 하이퍼링크 분석기법을 이용한 음란메일 차단 시스템의 구현 (Implementation of Anti-Porn Spam System based on Hyperlink Analysis Technique's of the Web Robot Agent)

  • 이승만;정희석;한상;송우석;이도한;홍지영;반의환;양준영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.332-335
    • /
    • 2007
  • 이메일은 누구나 쉽게 정보를 교환할 수 있는 편리함 때문에 인터넷에서 가장 중요한 수단으로 사용되고 있다. 그러나 순수한 의사소통의 수단이 아닌 스팸메일의 범람은 성인뿐만 아니라, 어린이 청소년에게도 무차별적으로 전송됨으로써 심각한 부작용을 낳고 있다. 본 논문은 점차 지능화 되는 신 유형의 음란 스팸메일로부터 청소년을 보호하기 위하여 새로운 방법의 음란메일 차단시스템을 제안하고자 한다. 기존의 스팸메일 차단시스템은 사용자가 직접 음란한 메일이라고 판단되는 메일에 대해 일일이 키워드를 설정하거나, 메일 내용 중에 텍스트만을 추출하여 패턴 매칭방법으로 분류하는 것이 대부분이었지만, 본 논문은 기존 방법의 문제점을 해결하기 위하여 이미지 내 Skin-Color분포의 Human Detection 알고리즘과 웹 로봇 에이전트의 하이퍼링크 분석기법을 사용하였다. 성능 측정결과, 형태소 분석과 Human Detection 알고리즘을 병합하여 적용한 경우 성능 측정에서 90% 정도의 F-measure를 보였지만, 추가적으로 웹 로봇 에이전트의 하이퍼링크 분석기법을 병합하여 적용한 경우 97% 이상의 F-measure를 보이며, 신뢰성이 높은 음란스팸메일 차단 시스템을 구현할 수 있다는 것을 증명하였다.

  • PDF

웹 브라우저 기반 악성행위 탐지 시스템(WMDS) 설계 및 구현 (Design and Implementation of Web-browser based Malicious behavior Detection System(WMDS))

  • 이영욱;정동재;전상훈;임채호
    • 정보보호학회논문지
    • /
    • 제22권3호
    • /
    • pp.667-677
    • /
    • 2012
  • 악성코드 유포자들은 웹 어플리케이션 취약점 공격을 이용해 주로 악성코드를 유포한다. 이러한 공격들은 주로 악성링크를 통해 이루어지며, 이를 탐지하고 분석하는 연구가 활발히 이루어지고 있다. 하지만, 현재의 악성링크 탐지 시스템은 대부분 시그니처 기반이어서 난독화 된 악성링크는 탐지가 거의 불가능하고 알려진 취약점은 백신을 통해 공격을 사전에 방지 할 수 있지만 알려지지 않은 취약점 공격은 사전 방지가 불가능한 실정이다. 이러한 한계점을 극복하기 위해 기존의 시그니처 기반 탐지 방법을 지양하고 행위기반 탐지 시스템에 관한 연구가 이루어지고 있다. 하지만 현재 개발된 탐지 시스템은 현실적으로 제약사항이 많아 실제로 활용하기에는 한계가 있다. 본 논문에서는 이와 같은 한계를 극복하고 탐지 효율을 높일 수 있는 새로운 웹 브라우저 기반 악성행위 탐지 시스템인 WMDS (Web-browser based Malicious behavior Detection System)를 소개 하고자 한다.

일반인을 위한 링크드 데이터 생성 시스템 개발 및 활용 (Development of a Linked Data Creation System for Ordinary People and Application)

  • 정효숙;김희진;박성빈
    • 컴퓨터교육학회논문지
    • /
    • 제14권2호
    • /
    • pp.47-59
    • /
    • 2011
  • 링크드 데이터는 아직 링크가 형성되어 있지 않지만 서로 관련된 데이터를 연결하기 위해서 웹을 사용하는 것이다. 링크드 데이터를 생성하기 위해서는 URI와 RDF를 이용하여 데이터, 정보, 지식 등을 표현하고, 공유하며, 연결시킬 수 있어야 한다. 그러나 URI와 RDF에 대한 지식이나 사용 능력이 없는 일반 사용자들이 이러한 링크드 데이터를 생성하는 것은 쉽지 않은 작업이다. 본 논문에서는 이러한 일반 사용자들이 서로 다른 RDF 문서에 존재하는 데이터를 연결하여 링크드 데이터를 생성할 수 있는 시스템을 제안하고자 한다. 사용자는 자신의 컴퓨터에 저장한 RDF 데이터나 Swoogle에서 검색한 RDF 데이터들을 연결시키는 새로운 링크를 추가하여 링크드 데이터를 생성하게 된다. 본 논문에서 제안한 시스템은 교수자의 교육용 컨텐츠 제작에 활용될 수 있다. 예를 들어, 교사는 비록 자신이 개발한 것은 아니지만, 학습자의 학습 수준에 적합한 다양한 데이터를 찾아 이를 연결한 링크드 데이터를 제작함으로써 자신의 다양한 학습 컨텐츠를 개발할 수 있다.

  • PDF

한글 웹 문서 클러스터링 성능향상을 위한 자질선정 기법 비교 연구 (A Comparative Study of Feature Selection Methods for Korean Web Documents Clustering)

  • 김영기
    • 한국문헌정보학회지
    • /
    • 제39권1호
    • /
    • pp.45-58
    • /
    • 2005
  • 이 연구는 한글 웹 문서를 클러스터링 하기 위한 자질 선정 방법에 대한 비교연구이다. 이 연구에는 두 개의 코퍼스가 사용되었다. 클러스터링을 위한 실험 문서는 Naver의 자연과학 범주에서, 자질 선정을 위한 학습문서는 Yahoo Korea의 같은 범주에서 수집하였다. 우선 실험 문서를 단어자질과 동시링크, 그리고 이 둘을 혼합한 방법으로 클러스터링 한 다음 그 성능을 비교하였다. 다음으로 학습문서에서 카이제곱 통계량$(X^2)$, 정보획득량(IG), 그리고 상호정보량(MI)을 이용하여 용어자질을 선정한 다음. 이를 실험문서에 적용하여 클러스터링 성능을 비교하였다. 석기에 각 범주별로 최댓값을 갖는 용어들만을 해당 범주를 대표하는 자질로 선정하는 '최댓간 자질 선정기법'을 실험적으로 도입하여 적용해 보았다. 실험 결과 사용된 자질에 따른 한글 웹 문서 클러스터링 정확률은 자연어 $ 72.3\%$, 동시링크 $74.3\%$, 단어-링크 혼합 $74.8\%$, $X^2\;79.6\%\;Max\;X^2\;83.8\%$로 나타났다. 전통적 자질 선정 기법 중에서는 $X^2$가 약간 나은 성능을 보여 주었지만 큰 차이는 발견되지 않았다. 그러나 최댓값 자질 선정기법을 적용하였을 때 클러스터링 성능은 크게 향상되었다. 이 논문에서 제안된 최댓간 자질 선정 기법은 웹 문서의 자질 공간 축소와 한글 웹 문서의 클러스터링을 위한 간단하면서도 효과적인 수단이다.

웹 사이트 탐색 알고리즘 비교분석 (Comparision and Analysis of Algorithm for web Sites Researching)

  • 김덕수;권영직
    • 한국산업정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.91-98
    • /
    • 2003
  • 무선 PDA.휴대폰을 통해 웹을 탐색하려는 이용자들은 인터페이스 상의 문제 때문에 어려움을 겪는다. 단지 그래픽을 문자로 바꾸거나 기호체계를 재구성한다고 해서 해결될 문제가 아니다. 심층 연계 구조를 통과하는 데에는 많은 시간이 걸리기 때문이다. 이러한 문제들을 해결하기 위해서 본 논문에서는 실시간의 최단경로를 제공하기 위하여 무선 웹 탐색을 자동적으로 개선시키는 Minimal Path 알고리즘을 제안한다. 본 논문의 결과 Minimal Path 알고리즘은 웹 이용자들에 대해 지름길을 제공해 주며, 링크의 숫자가 가장 짧았음을 알 수 있었다.

  • PDF

품질기반의 웹 서비스 검색을 위한 확장 UDDI 개발 (Development of an Exteneded UDDI for Quality based Web Service Retrieval)

  • 박성수;이종근;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.79-81
    • /
    • 2006
  • 최근 이질 분산형태를 갖는 정보를 통합하는 방법으로서 웹 서비스 기술을 이용한 바이오 정보 시스템이 개발 구축되고 있다. 이러한 웹 서비스 기반 바이오 정보 시스템으로 Bio-MOBY. DDBJ, MyGrid Project 등을 들 수 있다. 그러나 이들 기존 시스템에서는 선택한 DB에 대한 accession 번호 검색을 지원하거나. 시스템에 등록된 서비스의 선택만이 허용되는 등 이용형태가 매우 제한적이다. 또한 서비스의 품질 평가 기능이 제공되지 않아 서비스의 관련성을 판별하지 못하며, 심지어 링크가 바르게 연결되지 않았거나, 작동하지 않는 서비스의 분별조차 불가능한 실정이다. 본 논문에서는 이러한 문제점을 해결하고자 서비스 검색과정에서 웹 서비스의 품질을 평가하고 평가된 품질을 기반으로 웹 서비스를 순위화해 사용자에게 제공하는 품질기반 UDDI를 제안한다. 이를 위해 우리는 Gene Ontology를 이용한 연관 키워드 검색방식과 키워드 기반의 서비스 품질 평가 방법을 제안하고, 본 방식의 유용성을 보인다.

  • PDF

개념 기반 키워드 정보를 이용한 웹 문서의 자동 분류 (Automatic Classification of Web Documents Using Concept-Based Keyword Information)

  • 박사준;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.151-153
    • /
    • 2003
  • 본 연구에서는 웹 문서를 분류하기 위해서 분류하고자 하는 영역(category)에 대한 개념 지식을 이용한다. 먼저, 영역별 개념 지식을 기구축된 웹 문서의 집합으로부터 제목과 하이퍼링크에 기반한 앵커 텍스트를 이용하여 개념을 보유한 키워드를 추출한다. 추출된 키워드를 형태소 분석을 통해 색인어로 추출한다. 추출된 색인어에 대해 TFIDF를 확장한 영역 적용 색인 가중치 TFIDFc를 적용하여 영역별 개념 기반 색인어와 색인를 구축한다. 색인은 TFIDF를 영역별로 확장하여 구축한다. 구축된 영역별 개념 기반 색인을 이용하여 새로운 웹 문서에 대해서 어떤 영역에 해당하는 가를 결정하는 자동 분류 알고리즘을 수행한다. 자동 분류 알고리즘에 의해 수행된 문서는 영역별로 정리되며, 또한, 분류된 웹 문서의 색인어는 새로운 개념 기반 키워드로 추출되어 개념 기반 영역 지식을 구축한다.

  • PDF

전자상거래에 적용 가능한 시간 연관 규칙 탐사 기법 (Temporal Association Rule Mining on Electronic Commerce)

  • 서성보;이준욱;김선철;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.370-372
    • /
    • 1999
  • 전자상거래가 활성화되었지만 현재의 쇼핑몰은 단순한 상품 구매 역할과 정보 제공, 그리고 정적인 웹 공간의 관리로 이를 통해 인터넷 쇼핑몰 상품의 효율적인 진열, 상품 연관성을 고려한 마케팅 전략, 고객관리와 웹 페이지간의 시간 연관성을 고려한 링크 정보 등과 같은 효율적인 마케팅 전략을 구사하기에는 한계가 있다. 이 논문에서는 전자상거래에 적용 가능한 시간 연관 규칙 탐사기법을 통해 구매 데이터를 기반으로 상품간의 시간 연관 규칙 탐사와, 웹 서버에서 수집된 웹로그 파일로부터 연관 규칙을 찾아내기 위한 모델을 제시한다. 또한 이를 통해 생성된 규칙을 해석하여 사용자에 따른 웹 공간 구성, 방문 페이지 간의 연관성을 고려한 마케팅 전략과 효율적인 광고 전략 등을 위한 방안을 제시한다.

  • PDF

정책연구기관의 웹자원 관리와 서비스 제공 방안에 관한 연구 (A Study on the Management and Services of Web Resources in Policy Research Institutes)

  • 이명희
    • 한국비블리아학회지
    • /
    • 제27권2호
    • /
    • pp.171-191
    • /
    • 2016
  • 6개 정책연구기관 홈페이지에서 웹자원을 정보자원으로 수집 제공하는 사례를 조사하고, 이들이 정책정보의 가치를 가진 웹자원으로 서비스 되는지를 내용분석법으로 분석하였다. 이를 위하여 정책연구기관에서 정책정보로 제공되는 웹자원을 4개 부문으로 구분 평가하였다. 평가는 내용, 디자인, 접근용이성, 메타데이터의 4개 부문의 10개 항목에서 이루어졌다. 평가결과, 내용에서 신뢰성, 최신성을 유지하고 있었으나 정보내용의 좀 더 충실한 기술이 요구되었다. 디자인에서 네비게이션과 검색기능은 우수하였으나 모든 기관에서 데드링크가 존재하였다. 접근용이성에서 3회 클릭으로 정보 접근이 가능하였으나 검색기능의 정확도를 높이기 위해 메타데이터의 종합적인 검토가 필요함을 발견하였다. 개선점으로 데드링크 해결방안, 메타데이터의 질적관리, 정책연구정보의 전문적이고 체계적인 관리방안, 정책연구정보포털시스템의 종합적인 관리체제를 제안하였다.