• 제목/요약/키워드: URL정보

검색결과 325건 처리시간 0.026초

URL 패턴을 이용한 웹문서의 선택적 자동수집 방안 (A Method of Selective Crawling for Web Document Using URL Pattern)

  • 정준영;장문수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.41-44
    • /
    • 2007
  • 특정 분야별로 구축되는 온톨로지에 관하여 그 언스턴스를 쉽고 빠르게 구축하기 위해서는 구조화된 문서를 이용하는 것이 효율적이다. 그러나, 일반적인 웹 문서는 모든 분야에 대하여 다양한 형식으로 표현되어 존재하기 때문에, 대상이 되는 구조 문서를 자동으로 수집하기는 쉽지 않다. 본 논문에서는 웹사이트의 URL 패턴을 XML 기반의 스크립트로 정의하여, 필요한 웹 문서만을 지능적으로 수집하는 방안을 제안한다. 제안하는 수집 방안은 구조화된 형태로 정보를 제공하는 사이트에 대해서 매우 빠르고 효율적으로 적용될 수 있다. 본 논문에서는 제안하는 방법을 적용하여 5만개 이상의 웹 문서를 수집하였다.

  • PDF

모바일 환경에서 실시간 악성코드 URL 탐지 및 차단 연구 (A Study of Realtime Malware URL Detection & Prevention in Mobile Environment)

  • 박재경
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.37-42
    • /
    • 2015
  • 본 논문에서는 악성코드에 대한 피해를 실시간으로 탐지하고 차단하기 위해 모바일 내부에 악성링크에 대한 데이터베이스를 저장하고 또한 악성링크 탐지 엔진을 통해 웹 서비스를 통제함으로 인해 보다 안전한 모바일 환경을 제공하고자 한다. 최근 모바일 환경에서의 악성코드는 PC 환경 못지않게 기승을 부리고 있으며 새로운 위협이 되고 있다. 특히 모바일 특성상 악성코드의 피해는 사용자의 금전적인 피해로 이어진다는 것이 더 중요한 이유이다. 이러한 사이버 범죄를 어떻게 예방하고 실시간으로 차단할 수 있을 것 인지에 대해 많은 연구가 진행되고 있지만 초보적인 수준에 불과한 실정이다. 추가적으로 SMS나 MMS를 통해 전달되는 스미싱도 탐지 및 차단할 수 있는 방안을 제안하고자 한다. 향후 모바일 사업자는 본 연구를 바탕으로 한 근본적인 대책을 수립하여 안전한 모바일 환경을 구축해야 할 것이다.

스타일에 따른 웹 문서의 자동 분류 (Automatic Classification of Web documents According to their Styles)

  • 이공주;임철수;김재훈
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.555-562
    • /
    • 2004
  • 스타일 또는 장르는 문서의 주제와는 다른 문서를 보는 또 하나의 관점이 될 수 있다. 그렇기 때문에 문서의 스타일은 문서 분류의 기준으로 사용될 수 있다. 문서의 스타일에 따른 자동 분류 시스템에 대한 여러 연구들이 수행되어 왔다. 그러나 이런 연구들의 대부분이 일반 문서를 대상으로 수행하였으며, 몇몇 일부의 연구만이 웹 문서를 대상으로 스타일 분류에 대한 연구를 수행하였다. 웹 문서는 일반 문서와는 달리 URL HTML을 갖고 있다. 본 연구에서는 이와 같은 URL과 HTML로부터 추출한 자질들을 웹 문서의 스타일 분류에 사용해 보고자 한다. 실험을 통해서 이와 같은 자질들이 웹 문서의 스타일 분류에 어떤 영향을 미치는지를 밝혀보고자 한다.

URL 스푸핑을 이용한 피싱 공격의 방어에 관한 연구 (A Study on the Phishing Attack Protection using RUL Spoofing)

  • 민동옥;손태식;문종섭
    • 정보보호학회논문지
    • /
    • 제15권5호
    • /
    • pp.35-45
    • /
    • 2005
  • 최근 증가하고 있는 피싱 공격은 사용자의 실수를 유발해 개인정보를 공격자에게 노출시켜 공격자가 경제적 이득을 취하는 공격이다 유사 메일이나 유사 주소로 사용자를 속이던 이 기법은, 메일주소 위조, 도메인 주소 위조 등으로 점점 다양해지며 기술적으로 발전해 왔다. 최근에 이르러서는 몇몇 웹 브라우저에서 발생한 취약점, 정상적인 스크립트, HTML, DNS 스니핑 등을 이용한 RUL 스푸핑 공격을 피싱 공격에 이용하면서 그 피해가 크게 늘고 있다. 본 논문에서는 피싱 공격에 사용되는 고도화된 기법인 URL 스푸핑을 이용한 피싱 공격에 대해서 논의하고 이에 대한 검사방법과 예방책, 더 나아가 피싱 공격을 근본적으로 제한할 수 있는 스킴을 제안한다.

Link와 Clustering을 이용한 적극적 문서 수집 기법 (Greedy Document Gathering Method Using Links and Clustering)

  • 김원우;변영태
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 춘계정기학술대회
    • /
    • pp.393-398
    • /
    • 2001
  • 특정 영역에 대해 사용자에게 관련 정보를 제공해 주는 서비스를 하는 정보 에이전트를 개발 중이다. 정보 에이전트는 사용자 질의 처리를 달은 Agent Manager와 지식베이스를 관리하는 KB Manager, 그리고 Web으로부터 해당 영역의 관련 문서를 끌어오는 Web Manager로 구성되어 있다. Web Manager는 방문할 URL을 수집하고, 이들 문서에 대한 관련 평가와 Indexing을 수행한다. Web Manager는 검색 엔진을 이용하거나, 방문한 문서의 link를 이용하여 URL을 수집하는데 이러한 URL수집기법은 많은 관련 문서를 놓치는 문제점이 있다. 이 문제점을 해결하기 위해서 해당 영역과 관련된 Site들을 대상으로 Link를 이용해 문서들을 모아와, 문서들을 TAG들의 패턴으로 얻어낸 문서 형식을 이용해 Clustering하며 관련 문서들의 Group을 찾아내는 적극적 문서 수집 기법을 제안한다. 실험 결과, Link와 Clustering을 이용할 경우 기존보다 효과적으로 관련 문서를 많이 수집할 수 있음을 알 수 있다.

  • PDF

RADIUS 서버를 이용한 사용자 인증 기반 URL 필터링 시스템의 설계 및 구현 (A Design and Implementation of URL Filtering System Based on User Authentication Using RADIUS Server)

  • 김태웅;류호연;김성조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.433-435
    • /
    • 2003
  • 엄청난 양의 정보를 제공하는 인터넷은 사람들에게 편의성을 제공해 주고 있다. 그러나 다른 한편으로는 인터넷으로 인하여 청소년들이 유해한 정보에 무방비로 노출되고, 회사에서는 업무와 관련이 없는 인터넷 사용으로 업무 능률이 저하되며 네트워크 자원이 낭비되는 등의 여러 가지 문제가 발생하고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 개인별로 인증을 받은 후에 각 개인에 따라 설정된 필터링 정책에 의해 인터넷을 사용하는 시스템을 제안한다. 기존의 시스템은 시스템 구성 및 성능, 사용자 관리의 어려움 등의 문제로 ISP 등의 대단위 네트워크에 적용하기 어렵다. 본 논문에서는 대단위 네트워크에 적용 가능하고 사용자 관리가 용이한 URL 필터링 시스템을 제안한다. 이러한 시스템을 사용하면 학교나 가정 및 직장에서 개인별로 다양한 필터링 정책을 적용할 수 있어 유해한 정보로부터 청소년을 보호할 수 있으며, 업무 능률의 상승과 네트워크 자원을 효율적으로 활용할 수 있는 장점이 있다.

  • PDF

학술지 디지털 콘텐츠 식별패턴에관한 연구 (A Study on the Identifier Pattern of Digital Contents of the Journal)

  • 김문정
    • 정보관리연구
    • /
    • 제33권2호
    • /
    • pp.67-94
    • /
    • 2002
  • 현대 사회의 발전과 더불어 수많은 매체나 환경을 통해 정보를 접하고 공유하며 살아가고 있다. 그러나 디지털 정보원에 대한 식별패턴이 도서관에서 사용하는 정보시스템에 따라 각기 다르다는 문제점을 지니고 있다. 이에 본 연구는 신속하고 편리한 디지털 콘텐츠의 검색을 위하여 아날로그 환경에서의 식별체제와 인터넷 자원을 대상으로 한 디지털 콘텐츠의 식별체제와 현황을 고찰하였다. 또한 OPAC 환경에서의 학술지 검색의 식별패턴 구조의 문제점을 분석하여 식별패턴 표준화의 필요성을 제시하고자 한다. 디지털 콘텐츠에 대한 효과적인 식별구문의 표준화 필요성을 제시하기 위해 본 연구는 아날로그 환경에서의 ISBN, ISSN과 디지털 환경에서의 URI체계 하의 URL, URN, URC의 식별체제 구조를 고찰하였다. 각 대학도서관 OPAC 시스템의 상이한 URL 식별 구문으로 인한 문제점을 분석한 후 효과적인 식별패턴에 대한 표준안을 제시하였다.

미러링 환경에서의 페이지 리다이렉션 기술 (Page Redirection Techniques of Mirroring Environment)

  • 정승일;박재경
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제52차 하계학술대회논문집 23권2호
    • /
    • pp.63-66
    • /
    • 2015
  • 본 논문에서는 미러링 환경에서 동작하는 악성링크 차단 및 URL 필터링 시스템에서 URL 접속을 차단할 수 있는 페이지 리다이렉션 기술을 소개한다. 미러링(Mirroring: Out of Path) 환경에서 URL 패킷을 차단하기 위해서 많이 사용하고 있는 방법으로는 RST (Reset) 패킷을 전송하여 세션을 종료하는 방법이다. 이 방법은 요청 서버에 RST(Reset) 패킷을 보내 강제로 종료하는 방식이기 때문에 사용자에게 접근 차단과 관련된 상태 등의 정보를 알려줄 수 없다. 현재 인라인(In-line) 방식에서 사용되고 있는 페이지 리다이렉션 기술을 미러링 환경에서 구현하여 사용자에게 차단 정보를 보여줄 수 있으며 다양한 장비 개발 환경에서 유용하게 사용할 수 있는 기술이라고 판단한다.

  • PDF

메신저피싱 예방을 위한 Open API 활용 메신저 위험 인자 감지 시스템 설계 (Design of Messenger RISK Detection System for Smishing Prevention Using Open API )

  • 김도윤;박광영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.237-238
    • /
    • 2023
  • 코로나 19 로 대면이 아닌 비대면이 일상이 되며 공공기관과 기업들이 사용자에게 보내는 메시지의 양이 증가하였다. 이에 따라 공공기관을 사칭하는 메신저피싱이 증가하였다. 본 논문에서는 OpenAPI 데이터를 활용한 메신저 위험 url 감지 시스템의 설계를 제시한다. 메신저피싱으로 인한 금전 피해 및 개인정보 탈취를 예방하기 위해 메시지의 포함된 피싱 url 과 기관, 기업의 사전 안전 인증을 통한 안전 url 을 구분한다. 이를 통해 사용자에게 안전하고 쾌적한 인터넷을 제공한다. 향후, 제안하는 시스템의 현실적인 검증과 성능 평가가 필요하다.

MALICIOUS URL RECOGNITION AND DETECTION USING ATTENTION-BASED CNN-LSTM

  • Peng, Yongfang;Tian, Shengwei;Yu, Long;Lv, Yalong;Wang, Ruijin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권11호
    • /
    • pp.5580-5593
    • /
    • 2019
  • A malicious Uniform Resource Locator (URL) recognition and detection method based on the combination of Attention mechanism with Convolutional Neural Network and Long Short-Term Memory Network (Attention-Based CNN-LSTM), is proposed. Firstly, the WHOIS check method is used to extract and filter features, including the URL texture information, the URL string statistical information of attributes and the WHOIS information, and the features are subsequently encoded and pre-processed followed by inputting them to the constructed Convolutional Neural Network (CNN) convolution layer to extract local features. Secondly, in accordance with the weights from the Attention mechanism, the generated local features are input into the Long-Short Term Memory (LSTM) model, and subsequently pooled to calculate the global features of the URLs. Finally, the URLs are detected and classified by the SoftMax function using global features. The results demonstrate that compared with the existing methods, the Attention-based CNN-LSTM mechanism has higher accuracy for malicious URL detection.