• 제목/요약/키워드: 불법 사이트

검색결과 43건 처리시간 0.019초

HTML 태그 순서를 이용한 불법 사이트 탐지 자동화 기술 (An Automated Technique for Illegal Site Detection using the Sequence of HTML Tags)

  • 이기룡;이희조
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1173-1178
    • /
    • 2016
  • 2001년 비트토렌트 프로토콜이 설계된 후로 음악, 영화, 소프트웨어 등 모든 것을 다운로드할 수 있게 되었다. 이를 통해 저작권이 있는 파일이 무분별하게 공유가 되었고 저작권자들은 많은 피해를 입었다. 이 문제를 해결하기 위해 국가에서는 관련법을 제정하였고 ISP는 불법 사이트를 차단하였다. 이러한 노력들에도 불구하고 pirate bay와 같은 불법 사이트들은 도메인을 바꾸는 등 쉽게 사이트를 재오픈하고 있다. 이에 우리는 재오픈된 불법 사이트를 쉽게 탐지하는 기술을 제안한다. 이 자동화 기술은 구글 검색엔진을 이용하여 도메인을 수집하고, 최장공통부분수열(LCS) 알고리즘을 이용하여 기존 웹페이지 태그와 검색된 웹페이지 태그를 비교, 유사도를 측정한다. 실험을 위해 총 2,383개의 검색 결과를 구글 검색으로 얻었다. LCS 유사도 알고리즘을 적용하여 검사한 결과 44개의 해적 사이트를 탐지하였다. 또한 해외 불법 사이트에 적용한 결과 805개 검색 도메인에서 23개의 불법 사이트를 탐지하였다. 이를 통해 제안된 탐지 자동화 기술을 사용한다면 불법 사이트가 재 오픈을 하더라도 쉽게 탐지할 것으로 보인다.

저작권 침해 불법 스트리밍 사이트 차단을 위한 효율적인 기법 (Effecient Techniques to Block Copyright Infringement Illegal Streaming Sites)

  • 김찬희;유호제;김서연;오수현
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.837-844
    • /
    • 2022
  • 정보통신 기술의 비약적인 발전과 비례하여 저작권 침해에 대한 피해도 증가하고 있다. 특히, 최근 몇 년 사이 OTT 플랫폼 시장이 크게 성장하면서 저작권을 침해하는 불법 복제물의 복제 속도와 유통량이 과거와 비교하여 빠르게 증가하고 있다. 그에 따라 국가에서는 불법 스트리밍 사이트를 탐지 및 차단 함으로써 저작권 침해를 방지하기 위해 노력하고 있지만, 불법 스트리밍 사이트의 생산 속도가 빨라 큰 성과를 기대하기 어려운 상황이다. 따라서, 본 논문에서는 차단된 불법 스트리밍 사이트가 빠르게 생산될 수 있는 원인에 대해 분석하였으며, 불법 스트리밍 사이트 58곳을 추적 및 분석하여 분석 결과를 바탕으로 불법 스트리밍 사이트를 효과적으로 차단할 수 있는 방안에 대해 제안한다.

Tag2vec 기반의 지능형 불법 도박 사이트 탐지 모형 개발 (Development of an Intelligent Illegal Gambling Site Detection Model Based on Tag2Vec)

  • 송찬우;안현철
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.211-227
    • /
    • 2022
  • 오늘날 온라인 도박 사이트를 통한 불법 도박이 큰 사회문제가 되고 있다. 인터넷 기술의 발전과 스마트폰 보급으로 시공간의 제약이 사라지고 불법 온라인 도박을 누구나 쉽게 접근할 수 있게 되었기 때문이다. 이를 막기 위해 국내에서는 자체 모니터 요원의 탐지, '누리캅스'와 같은 제보 시스템 등을 활용해 불법 사이트를 탐지하고 있지만 이러한 수동적인 프로세스로는 인력부족 같은 한계로 모든 불법 사이트를 탐지하기 어려운 실정이다. 이에 여러 학자들이 인공지능 기반의 자동 불법 도박 사이트 탐지 기술을 연구해왔다. Xu et al. (2019)은 가짜 사이트들의 HTML Tag 구조에는 차별적인 특징이 있다는 점을 발견하였다. 이는 HTML Tag 구조가 불법 사이트를 탐지하는데 주요한 특징정보가 될 수 있음을 시사하지만, 불법 사이트 탐지 모델에 HTML Tag 구조를 반영하여 모형의 성능을 제고하고자 하는 연구는 지금까지 거의 시도되지 않았다. 이러한 배경에서 본 연구는 HTML Tag 구조를 특징화하여 모형의 성능을 향상시키고자 하였고, HTML Tag 구조를 적절하게 벡터화하기 위한 방법론으로 Doc2Vec을 변형한 Tag2Vec을 제안한다. Tag2Vec 기반 모델의 효과를 검증하기 위해 '더 치트'의 유해 사이트 목록과 Google 검색을 통한 정상 사이트 목록을 데이터 세트로 활용하여 실증분석을 수행하였다. 그 결과 비교 모델로 설정된 URL 기반 탐지 모델보다 본 연구에서 제안하는 Tag2Vec 기반 탐지 모델이 분류 정확도, Recall, F1_Score에서 모두 향상된 성능을 보임을 확인할 수 있었다. 이러한 본 연구의 제안모델은 향후 지능형 기술을 통해 우리 사회의 건강도를 제고하는데 효과적으로 활용될 수 있을 것으로 기대된다.

GNN을 이용한 웹사이트 Hierarchy 유사도 분석 기반 해외 침해 사이트 분류 모델 연구 (A Study on the Classification Model of Overseas Infringing Websites based on Web Hierarchy Similarity Analysis using GNN)

  • 서주현;유선모;박종화;박진주;이태진
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.47-54
    • /
    • 2023
  • 전 세계적으로 한류 콘텐츠가 유행하며 국내뿐만 아니라 해외에서도 국내 저작물의 저작권 침해 사례가 지속적으로 증가하고 있다. 이에 대응하기 위한 국내 불법 저작물 유통 사이트를 탐지하는 기술에 대한 연구가 활발하게 진행되고 있으며 최근 연구는 국내 불법 저작물 유통 사이트들이 광고 배너를 상당수 포함하고 있는 특징을 활용한 연구가 존재한다. 그러나 해외 불법 저작물 유통 사이트의 경우 광고 배너를 포함하지 않거나 국내 사이트에 비해 적은 양의 광고를 포함하고 있어 국내와 같은 탐지 기술의 적용이 제한적이다. 본 연구에서는 저작물 불법 공유 사이트가 게시물과 저작물의 이미지를 유사한 계층 구조로 포함하는 특징을 이용하여 링크 트리 및 텍스트 유사도 비교 기반의 탐지 기술을 제안한다. 대량의 링크로 작성된 대규모 트리의 정확한 유사도 비교를 위해 GNN(Graph Neural Network)를 활용한다. 본 연구의 실험에서 일반 사이트와 저작물 불법 유통 사이트를 분류에 95% 이상의 높은 정확도를 보였고 해당 알고리즘을 적용하여 불법 유통 사이트의 자동화된 탐지를 통해 신속한 저작권 침해 대응이 가능할 것으로 기대된다.

불법유해정보 법.제도 동향 분석

  • 윤여생;유진호
    • 정보보호학회지
    • /
    • 제22권3호
    • /
    • pp.25-36
    • /
    • 2012
  • 기존 불법유해정보 분류체계를 비교 분석하여 재정립하고, 국내외 불법유해정보 법 제도 현황을 살펴 보았다. 이와 함께 불법유해정보 접근 차단 방안에 대한 이용자 설문 결과를 기초로 불법유해정보 차단에 대한 정책적 제언을 다음과 같이 제시하고자 한다. 먼저 기존 유해정보차단 프로그램의 문제점인 메모리 사용량 증가에 따른 컴퓨터 성능 저하현상을 개선할 수 있는 기술적인 대책이 마련되어야 하며, 청소년 이용자의 보호자 또는 학부모가 사이트별로 제한할 수 있는 기능을 추가하여 다중 필터링 시스템 환경을 조성해야 한다. 또한 기존의 불법유해정보 신고 프로그램은 신고주소, 신고제목, 증거자료 입력 등 복잡한 구성으로 인해 효율성이 떨어지므로, 신고를 원하는 사이트를 이미지화 하여 바로 저장 및 전송이 가능한 형태로 신고 프로그램을 제작하여 신고완료까지의 시간을 단축해야 할 것이다. 기존의 주민등록번호 입력 방식에서 개인식별번호를 이용한 i-PIN 도입을 의무화하고, 기존 i-PIN 사용자의 전환사용을 통해 불편함을 최소화하여 개인정보유출 방지를 위한 i-PIN 사용을 의무화해야 한다. 마지막으로 '자율 등급 서비스' 이외에도 제3의 기관을 통한 '제3자 등급 서비스'를 동시에 사용하여 정보제공자의 부정확한 등급 표시의 문제점을 보완하도록 해야 한다.

만화 온라인 불법복제물 시장의 양성화를 위한 이용자 연구 (User Study for Legalization of Pirate Comics Market)

  • 황선태;진전은영
    • 한국콘텐츠학회논문지
    • /
    • 제15권5호
    • /
    • pp.550-559
    • /
    • 2015
  • 한국의 만화산업은 오랜 역사에도 불구하고 뿌리 깊숙이 박혀 있는 불법복제물 시장으로 인해 아직까지 자생적인 건강한 생태계를 이루지 못하고 있다. 그간 불법복제물 시장 근절을 위한 다양한 연구가 있어왔으나 아직까지 이렇다 할 실효성을 인정받지 못하고 있는 상황이다. 이에 본 논문에서는 만화복제물 시장에 관한 연구를 이용자 관점에서 분석해 보고자 한다. 특히 불법복제물이지만 유료인 파일공유 사이트를 이용하는 이용자들을 대상으로 설문조사와 서면인터뷰를 통해 파악해 보았다. 이를 통해 이용자들의 도덕성과 사이트 이용 간의 상관관계는 어떠한지, 이용자들이 느끼는 파일공유 사이트의 인지된 편의성은 무엇인지 그리고 그들을 합법적인 만화 포털 사이트로 유인하기 위한 요인은 무엇인지를 중심으로 연구하였다. 그 결과, 만화 포털 사이트는 이용자들의 양성화를 위해 양질의 콘텐츠 확보, 결제 수단 등의 불편함 개선, 콘텐츠에 관한 자세한 정보 제공, 콘텐츠 구매 대여 방식 다양화 등의 구매 요인들을 개선할 필요가 있음을 알 수 있었다.

불법 저작물 사이트의 광고 차단을 통한 저작권 침해 방지 연구 - 자금 추적 기반 방식을 중심으로 (Study on Preventing Copyrights Infringement through Blocking Advertisements of Illegal Copyrighted Websites)

  • 신명섭;용미란;이영주
    • 한국콘텐츠학회논문지
    • /
    • 제20권7호
    • /
    • pp.331-341
    • /
    • 2020
  • 최근 정부가 대표적인 불법 저작물 사이트의 운영자를 구속하여 사이트를 폐쇄했지만, 곧 유사한 사이트가 만들어지고 이용자들이 고스란히 이동하는 '풍선효과'가 나타나고 있다. 이에 저작권 침해 방지 대책을 보완할 수 있는 '자금 추적 기반 접근 방식'이 주목받고 있다. 이 방식은 불법 저작물 사이트의 상업화 체계와 자금흐름을 추적하고 주 수익원이 되는 광고의 공급 및 게재를 차단함으로써 수익원을 차단해 불법 저작물 사이트의 운영을 악화시켜 자진 폐쇄를 목표로 한다. 본 연구에서는 자금 추적 기반 접근 방식을 도입한 해외 사례를 중심으로 살펴보았다. 분석 결과, 국가마다 세부 정책과 캠페인 방식이 다르지만, 비형벌적 조치, 관련 업계의 자발적 참여를 바탕으로 한 파트너십, 저작권 산업 보호만을 목적으로 하지 않는다는 공통점이 발견되었다. 그간 국내에서 민·관 합동 대응 체계가 제대로 구축되지 못한 것은 정책 추진 단계에서 양측의 견해차가 발생했기 때문이다. 광고주와 대행사에 불법 사이트 광고 집행이 브랜드 이미지 손상 등의 역효과와 막대한 경제적 손실을 줄 수 있다는 인식 제고가 필요하다. 더불어 관련 연구 및 세미나를 통해 상호 이해와 협력을 바탕으로한 저작권 침해 방지가 이루어져야 한다.

이미지 블랙리스트 기반 저작권 침해 의심 사이트 탐지 기법 (Detection Technique of Suspected Piracy Sites based on Image Black List)

  • 김의진;정인수;송유래;곽진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.148-150
    • /
    • 2021
  • 저작권 콘텐츠의 해외 진출과 함께, 국내·외 저작권 시장 규모가 증가하고 있다. 이와 동시에 등장한 저작권 침해사이트는 메인 페이지에 저작권 침해사이트를 대표하는 이미지를 게시하는 특징이 있다. 이러한 저작권 침해사이트는 음악, 영화, 드라마 등의 저작권 콘텐츠를 불법 유통시키며 저작권 시장에 피해를 입히고 있다. 공공기관에서는 저작권 침해를 방지하기 위해 저작권 침해사이트를 차단하는 등의 대응을 하고 있지만, 저작권 침해사이트의 생성 속도에 비해 침해 여부 판단 속도가 상대적으로 느려서 차단에 어려움이 존재한다. 따라서, 본 논문에서는 저작권 침해사이트의 대표 이미지를 활용한 이미지 블랙리스트에 기반하여 저작권 침해 의심 사이트 탐지 기법을 제안하고자 한다.

사행산업 관련 뉴스의 빅데이터 분석을 통한 정책 연구 (Study of Policy through Big data Analysis about Gambling News)

  • 문혜정;김성경
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.190-193
    • /
    • 2016
  • 본 연구는 사행산업의 분야인 복권, 체육진흥투표권, 경마, 카지노에 대해 언론에서는 어떻게 다루어지고 있는지를 1990년부터 2015년까지의 뉴스데이터를 빅데이터 분석 방법 중 테스트의 의미연결망 분석을 통해 밝혀보고자 하는 연구이다. 이 논문은 의미망 분석을 통해 기사의 빈도와 연결성을 프레이밍과 시민관심 정도로 재조명 하여 기사에 대한 언론보도자의 의도와 시민의 인식차이를 밝혔고, 이를 통해 정책적 특성과 개혁과제를 탐색하였다. 분석결과 복권의 경우 당첨번호, 당첨금, 조작의혹 등 당첨에 대한 부분이 주제인 '사회문제' 형태였으며, 체육진흥투표권의 경우에는 사업입찰, 불법사이트, 발매대상 등 주로 사업추진과 불법사이트에 대한 '의무정보' 종류였고, 경마의 경우 사업장, 홍보, 기사 등으로 사업홍보나 광고 관련 뉴스이었고, 마지막으로 카지노의 경우에는 불법, 도박장, 외국인 등 '주요정보'에 해당하는 논문이었다. 시대에 따라 1990년대에는 카지노, 2000년대에는 복권, 2010년대에는 경마에 대한 기사보도가 많아졌으며, 이에 대한 시민의 반응도 사업비리, 당첨, 시민운동 등의 차이가 있었다. 마지막으로 기사의 빈도와 연결성이 나타내는 프레이밍 정도와 시민의 관심은 '1. 홍보광고, 2. 의무정보, 3. 사회이슈, 4. 주요정보' 네 가지로 구분되었으며 이 중 사고, 비리 등 주요기사로 구분되는 사회문제가 주요 공공의제로 형성되는 것을 확인할 수 있었다.

  • PDF

인터넷 카페와 홈페이지의 어문저작물 불법 전송 실태에 관한 연구 (A Study on the Current State of Illegal Distribution of Literary Works on Internet Cafes and Homepages)

  • 곽동철
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.209-231
    • /
    • 2004
  • 본 연구에서는 인터넷 카페와 홈페이지의 어문저작물 불법 전송 실태를 조사${\cdot}$분석하였고, 이를 바탕으로 저작권자의 권리를 보호할 방안을 모색하는데 목적을 두었다. 이러한 연구목적을 달성하기 위해 구체적인 연구 내용은 각 사이트별로 어문저작물 불법 복제 및 불법 전송이 이루어질 수 있는 개연성을 지닌 카페나 홈페이지의 메뉴들을 조사하였고, 전체 자료수, 어문저작물 자료수, 최고조회수, 평균조회수를 파악한 후, 어문저작물의 유형을 시, 소설, 기타 등으로 구분하여 분석하였다. 이러한 분석 결과, 정부나 저작권 관련 기관이 이를 법제화하여 통제를 하는 경우에 국내 어문저작물에 대한 순기능적인 인식의 확산을 저해할 요소가 있다. 하지만, 카페 및 홈페이지 운영자와 여기에 올리는 이용자 모두가 저작권에 대한 인식이 거의 없는 상황이므로 법제화 이전에 국민 계도 차원에서 단계별 교육 및 대국민 홍보를 강화할 필요성이 있다. 즉, 각각의 포털서비스 사업자가 사이트별 카페 및 홈페이지 운영자 및 이용자에 대한 저작권 관련 교육 및 시스템적 지원을 강화할 수 있는 방안을 강구해야 할 것이다.