• 제목/요약/키워드: URL정보

검색결과 321건 처리시간 0.027초

URL Prefix 해시 트리를 이용한 URL 목록 검색 속도 향상 (Fast URL Lookup Using URL Prefix Hash Tree)

  • 박창욱;황선영
    • 한국정보과학회논문지:정보통신
    • /
    • 제35권1호
    • /
    • pp.67-75
    • /
    • 2008
  • 본 논문에서는 URL 목록 기반 웹사이트 컨텐츠 필터링 시스템에서 효율적인 URL 목록 검색 방식을 제안한다. 제안된 방식은 URL prefix 형태로 변환된 URL 목록을 해시 트리 형식으로 표현하여 한번의 트리 검색으로 URL 검색을 수행한다. 그 결과 단일 해시 테이블 방식의 중복 탐색을 제거하였다. 실험 결과 제안된 검색 방식은 세그먼트의 개수에 따라 단일 해시 테이블 방식에 비해 $62%{\sim}210%$의 성능 향상을 보인다.

스마트한 QR코드에 의한 비저장식 데이터 기록 시스템 및 비저장식 데이터 제공방법에 관한 연구 (A study on non­storage data recording system and non­storage data providing method by smart QR code)

  • 오은열
    • 융합정보논문지
    • /
    • 제9권4호
    • /
    • pp.14-20
    • /
    • 2019
  • 본 논문은 원 데이터를 암호화하여 URL(Uniform Resource Locator)정보 형식으로 변형하고, URL정보를 QR코드로 인코딩함으로써 원 데이터의 저장없이 QR코드를 매개로 데이터를 기록하고 해독할 수 있도록 하는 스마트한 QR코드에 의한 비저장식 데이터 기록 시스템 및 비저장식 데이터 제공방법을 제시하는 데 목적이 있다. 연구의 방법은 선행기술연구와 문헌조사를 통해 연구의 차별성을 두기 위한 방법을 제시했으며 분석결과, 온라인 관리서버에 구축되는 시스템으로서, 데이터 입력 신호별 매칭 암호가 저장된 암호DB, QR코드 생성 명령에 따라 입력데이터를 암호DB에서 매칭되는 암호정보로 치환하여 관리서버 도메인네임의 하위 로케이터로 결합시킨 URL정보로 변환시키고, URL정보를 QR코드로 인코딩하는 코드 생성부, 그리고 URL접속신호 수신에 따라, URL정보를 입력데이터로 변환 제공하는 암호 해독부를 포함하는 QR코드에 의한 비저장식 데이터 기록시스템을 제공한다. 따라서 스마트한 QR방식의 데이터관리방식(기록과 제공)은 사용의 편리성과 공간의 제약이나 용량사용의 장애가 없다는 점을 밝히고 있다.

SWF 파일의 URL정보 분석도구 (A Study on analysis tools in the SWF file URL)

  • 장동환;송유진;이재용
    • 한국산업정보학회논문지
    • /
    • 제15권5호
    • /
    • pp.105-111
    • /
    • 2010
  • SWF는 벡터 그래픽 전용파일 포맷 파일로 각종 웹사이트 광고, 위젯, 게임, 교육, 동영상 등 다양한 콘텐츠 제작에 활용되고 있다. 현재 포렌식 조사 시 대부분이 웹 브라우저의 사용자 캐시정보를 토대로 조사하는 비중이 크다. 하지만 개인정보유출의 문제로 인해 Web Browser 자체에서 사용흔적을 삭제하거나 사용자들이 복구되지 않은 방법으로 그 흔적을 지워 행위를 추정할 수 없는 경우가 발생하고 있다. SWF파일은 PC사용자가 브라우저를 통해 웹사이트 방문 시 웹 캐시와 함께 특정경로에 저장되어 PC상에 남게 된다. 이런 SWF파일 내 데이터 중 액션스크립트 상에서 웹서버와 통신할 수 있게 URL 정보를 포함하고 있으며 포렌식 조사 입장에서 웹 브라우저의 History 정보 이외에 중요한 조사정보로 활용할 수 있다. 허나 포렌식 도구에서 SWF파일 내 정보를 체계적으로 분류해주는 경우는 없다. SWF파일 내 URL 정보 분석 도구를 통해 확인할 수 없었던 사용자의 웹 행위 정보를 조사할 수 있으며 신뢰할 수 있는 증거를 수집할 수 있다.

사이트 기반의 URL 정규화 평가 (Evaluating Site-based URL Normalization)

  • 정효숙;김성진;이상호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.28-30
    • /
    • 2005
  • URL 정규화는 다양하게 표현된 동일 URL들을 하나의 통일된(cannonical) 형태의 URL로 변환하는 과정이다. 동일문서에 대한 중복된 URL 표현은 URL 정규화를 통하여 제거된다. 표준 정규화는 잘못된 긍정(동일하지 않는 URL들을 동일 문자열로 변환)이 없도록 개발되었다. 그러나 표준 정규화는 많은 잘못된 부정이 발생하게 되므로, 잘못된 긍정을 일부 허용하면서 잘못된 부정을 현격히 줄일 수 있는 확장 정규화가 제기되고 연구되어 왔다. 본 논문에서는 동일 사이트 내의 URL들에 대한 확장 정규화의 적용 결과가 유사한 정도를 보임으로써, 한 사이트 내의 URL에 대한 임의의 확장 정규화 결과 정보가 동일 사이트 내의 다른 URL들의 정규화에 효과적으로 사용될 수 있음을 보인다. 이를 위하여, 한 사이트의 확장 정규화 결과 동일성 척도와 사이트 기반의 확장 정규화 평가 척도를 제안한다. 20,000만개의 실제 국내 웹 사이트에서 추출된 25만개의 URL에 대해 6가지 확장 정규화가 평가된다.

  • PDF

URL 정규화 향상을 위한 URL 서명 (URL Signatures for Improving URL Normalization)

  • 순레이키;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.139-149
    • /
    • 2009
  • URL은 표준 URL 정규화에서 정의한 단계에 의하여 구문적으로 정규화된다. 본 논문에서는 웹 페이지의 메타데이타를 이용하여 표준 URL 정규화를 보완하는 기법을 제안한다. 메타데이타는 HTML 분석 도중 추출될 수 있는 웹 페이지 본문과 페이지 크기이다. 첫 번째 실험에서는 웹 페이지 본문이 동등한 URL 식별에 효과적이라는 것을 보인다. 두 번째 실험에서는 웹 페이지 본문을 Message-Digest 5 알고리즘으로 해싱하여 URL 서명을 만들며, 동일한 서명을 가지는 URL은 동일하게 취급한다. 두 번째 실험 결과에서, 우리가 제시한 URL 서명이 표준 URL 정규화와 비교하여 32.94%의 중복 URL을 더 감소시킬 수 있음을 알 수 있었다.

분류 알고리즘 기반 URL 이상 탐지 모델 연구 제안 (A Study proposal for URL anomaly detection model based on classification algorithm)

  • 김현우;김홍기;이동휘
    • 융합보안논문지
    • /
    • 제23권5호
    • /
    • pp.101-106
    • /
    • 2023
  • 최근 사이버 공격은 지능적이고 지속적인 피싱사이트와 악성코드를 활용한 해킹 기법을 활용하는 사회공학적 공격이 증가하고 있다. 개인 보안이 중요해지는 만큼 웹 어플리케이션을 이용해 악성 URL 여부를 판별하는 방법과 솔루션이 요구되고 있다. 본 논문은 악성 URL를 탐지하는 정확도가 높은 기법들을 비교하여 각각의 특징과 한계를 알아가고자 한다. 웹 평판 DB 등 기반 URL 탐지 사이트와 특징을 활용한 분류알고리즘 모델과 비교하여 효율적인 URL 이상탐지 기법을 제안하고자 한다.

웹 어플리케이션을 위한 URL 정규화 (URL Normalization for Web Applications)

  • 홍석후;김성진;이상호
    • 한국정보과학회논문지:정보통신
    • /
    • 제32권6호
    • /
    • pp.716-722
    • /
    • 2005
  • 웹에서는 문법적으로 서로 다른 문자열의 URL들이 동일 자원을 나타낼 수 있다. URL 정규화는 동일 자원을 나타내는 서로 다른 URL들을 통일된 형태로 변환하는 과정이다. 현재 URL 정규화에 대한 표준화가 진행 중에 있다. 표준 URL 정규화는 "잘못된 긍정"을 허용하지 않으며 "잘못된 부정"을 최소화하는 것을 목적으로 한다. 본 논문에서는 표준 URL 정규화에서 고려되지 않은 네 가지 정규화 요소를 고려한다. 본 논문은 "잘못된 긍정"을 부분적으로 허용하여 표준 URL 정규화에서 빈번히 발생하는 "잘못된 부정"을 제거하는 것을 목적으로 한다. 또한, 제안된 정규화 고려 요소의 효과를 평가하기 위하여 두 개의 척도가 정의되었다. 마지막으로, 본 논문은 실제 웹 문서 중에 발견된 약 1억 7천만 개의 URL에 대하여 실험을 수행하고 결과를 기술한다.

스팸성 자질과 URL 자질을 이용한 최대엔트로피모델 기반 스팸메일 필터 시스템 (A Spam Filter System based on Maximum Entropy Model Using Spamness Features and URL Features)

  • 공미경;이경순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-219
    • /
    • 2006
  • 본 논문에서는 스팸메일에 나타나는 스팸성 자질과 URL 자질을 이용한 최대엔트로피모델 기반 스팸 필터 시스템을 제안한다. 스팸성 자질은 스패머들이 스팸메일에 인위적으로 넣는 강조 패턴이나 필터 시스템을 통과하기 위해 비정상적으로 변형시킨 단어들을 말한다. 스팸성 자질 외에 반복적으로 나타나는 URL과 비정상적인 Ink도 자질로 사용하였다. 메일 수신자에게 추가적인 정보 제공을 목적으로 하이퍼링크로 연결시키거나 메일에 직접 타이핑한 URL 중 필터 시스템을 피하기 위해 유효하지 알은 비정상적인 URL들이 스팸 메일을 걸러내는데 도움을 줄 수 있기 때문이다. 또한 스팸성 자질과 URL을 각각 적용한 두 분류기를 통합하였다. 분류기의 통합은 각 분류기에 이용된 자질을 독립적으로 사용할 수 있다는 장점을 가지고 있다. 실험 결과를 통해 스팸성 자질과 URL을 이용함으로써 스팸 필터 시스템의 성능을 향상시킬 수 있음을 확인할 수 있었다.

  • PDF

OTACUS: 간편URL기법을 이용한 파라미터변조 공격 방지기법 (OTACUS: Parameter-Tampering Prevention Techniques using Clean URL)

  • 김귀석;김승주
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.55-64
    • /
    • 2014
  • 웹 애플리케이션에서 클라이언트와 서버간의 정보전달의 핵심요소인 URL 파라미터는 F/W이나 IPS등의 네트워크 보안장비를 별다른 제약없이 통과하여 웹서버에 전달된다. 공격자는 이렇게 전달되는 파라미터를 변조하여 조작된 URL을 요청하는 것만으로도 인가받지 않은 기밀정보를 유출하거나 전자상거래를 통하여 금전적 이익을 취할 수 있다. 이러한 파라미터변조 취약점은 해당 애플리케이션의 논리적 판단에 의해서만 조작여부를 확인할 수 있어 웹 방화벽에서 차단할 수 없다. 이에 본 논문에서는 기존 방지기법의 취약점을 점검하고 이를 보완하는 OTACUS (One-Time Access Control URL System)기법을 제시한다. OTACUS는 파라미터가 포함된 복잡한 URL을 단순화 하는 간편URL기법을 이용하여 공격자에게 URL노출을 막음으로써 POST이나 GET방식으로 서버로 전달되는 파라미터의 변조를 효과적으로 차단할 수 있다. 실제 구현된 OTACUS의 성능 실험결과 3%이내의 부하가 증가함을 보여 안정적인 운영이 가능함을 증명한다.

URL 주요특징을 고려한 악성URL 머신러닝 탐지모델 개발 (Development of a Malicious URL Machine Learning Detection Model Reflecting the Main Feature of URLs)

  • 김영준;이재우
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1786-1793
    • /
    • 2022
  • 최근 코로나 19, 정치적 상황 등 사회적 현안을 악용한 스미싱, 해킹메일 공격이 지속되고 있다. 공격의 대부분은 악성 URL 접근을 유도하여 개인정보를 탈취하는 방식을 취하고 있는데, 이를 대비하기 위해 현재 머신러닝, 딥러닝 기술 연구가 활발하게 진행되고 있다. 하지만 기존 연구에서는 데이터 세트의 특징들이 단순하기 때문에 악성으로 판별할 근거가 부족하다고 판단하였다. 본 논문에서는 URL 데이터 분석을 통해 기존 연구에 반영된 URL 어휘적인 특징 이외에도 "URL Days", "URL Words", "URL Abnormal" 3종, 9개 주요특징을 추가 제안하였고, 4개의 머신러닝 알고리즘 적용을 통해 F1-Score, 정확도 지표로 측정하였다. 기존 연구와 비교 분석 시 평균 0.9%가 향상된 결과 값과 F1-Score, 정확도에서 최고 98.5%가 측정됨에 따라 주요특징이 정확도 및 성능 향상에 기여하였다.