DOI QR코드

DOI QR Code

Development of Lifecycle Model for Copyright Infringement Site

저작권 침해 사이트 생애 주기 모델 개발

  • Kim, Deuk-Hun (Graduate Student, ISAA Lab., Department of Computer Engineering, Ajou University) ;
  • Jeong, Hae-Seon (Graduate Student, ISAA Lab., Department of Computer Engineering, Ajou University) ;
  • Kwak, Jin (Professor, Department of Cyber Security, Ajou University)
  • 김득훈 (아주대학교 컴퓨터공학과 정보보호응용및보증연구실 대학원생) ;
  • 정해선 (아주대학교 컴퓨터공학과 정보보호응용및보증연구실 대학원생) ;
  • 곽진 (아주대학교 사이버보안학과 교수)
  • Received : 2019.12.09
  • Accepted : 2019.12.16
  • Published : 2020.02.29

Abstract

Technology and culture are converging with various industries to create added value of contents. In addition, the country is creating a foundation environment for grafting new technologies onto the cultural content. However, copyright infringement by voice demand and supply is continuously occurring for cultural contents with copyright, and more and more recently, there have been increasing cases of creating and operating sites with servers overseas to bypass monitoring on infringement sites. To prevent this, various copyright protection studies are under way in many areas, but the current detection and prevention technologies are largely reactive and therefore have problems of effectiveness. Accordingly, this paper proposes a model of the lifecycle of copyright infringement site to lay the foundation for preemptive response to the distribution of illegal copies through analysis of the lifecycle of copyright infringement site.

기술 및 문화는 다양한 산업과 융합하여 컨텐츠 부가가치를 창출하고 있다. 또한, 국가에서는 새로운 기술과 문화 컨텐츠를 접목시키기 위한 기반 환경을 조성하고 있다. 그러나 저작권을 갖는 문화 컨텐츠에 대하여 음성적인 수요 및 공급에 의한 저작권 침해가 지속적으로 발생하고 있으며, 최근에는 침해 사이트 단속 모니터링을 회피하기 위해 해외에 서버를 두고 사이트를 생성 및 운영하는 사례가 증가하고 있다. 이를 방지하기 위해 여러 분야에서 다양한 저작권 보호 연구가 진행 중이지만, 현재의 탐지 및 방지 기술은 주로 사후대응을 이루고 있어서 실효성의 문제가 존재한다. 이에 따라, 본 논문에서는 저작권 침해 사이트의 생애주기 분석을 통해 불법 복제물 유통에 대한 선제적 대응 기반 마련을 위한 저작권 침해 사이트 생애주기 모델을 제안한다.

Keywords

I. 서론

IT 기술이 고도화되고 이에 수반되는 기술의 발전을 통해 사회 및 문화 분야에서 새로운 변화가 진행되고 있다[1]. 특히, 기술 및 문화 컨텐츠는 다양한 산업과 융합하여 컨텐츠 부가가치를 창출하고 있다[2]. 최근에는 전 세계적으로 다양한 컨텐츠가 확산되고 있으며[1], 짧은 시간에 문화 컨텐츠를 소비하는 것으로 정의된 스낵컬처가 유행하면서 다수의 컨텐츠가 제작되고 있다.

그러나 저작권을 갖는 문화 컨텐츠에 대하여 음성적인 수요 및 공급에 의한 저작권 침해가 지속적으로 발생하고 있다. 또한, 침해 사이트 단속 모니터링을 회피하기 위해 해외에 서버를 두고 사이트를 생성 및 운영하는 사례가 증가하고 있다[2].

컨텐츠 저작권 보호를 위해 여러 분야에서 다양한 연구[3-5]가 진행 되었지만, 현재의 탐지 및 방지기술은 주로 사후대응을 이루고 있어서 실효성의 문제가 존재한다. 더불어, 저작권 침해 사이트의 생애주기가 점진적으로 짧아지고 있으며 다양한 형태로 진화하고 있는 실정이다.

이에 따라, 저작권 침해 사이트의 생애주기 분석을 통해 불법 복제물 유통에 대하여 선제적 대응을 위한 기반을 마련해야 한다.

본 논문에서는 저작권 침해 사이트 중 토렌트 및 만화/웹툰 사이트에 대하여 생애주기를 분석하고 시나리오를 적용하여 침해 사이트에 대한 생애주기 모델을 제안하였다. 또한 실제 생성 및 운영 중인 토렌트, 만화/웹툰 사이트에 대한 메타데이터셋을 수집하였다. 이후 수집된 데이터를 활용하여 제안한 생애주기 모델에 대한 수용률 및 예측률 측정을 통해 검증한다. 2장에서는 저작권 침해 동향과 생애주기 모델을 정의하고, 3장에서는 저작권 침해 사이트 유형을 분석하며, 4장에서는 저작권 침해 사이트의 시나리오를 제안하고 이를 실제 침해 사이트에 적용하여 저작권 침해 사이트의 생애주기 모델을 제안한다. 이후 5장에서 제안한 생애주기 모델에 대한 검증 및 분석을 수행하고, 6장에서 결론으로 끝을 맺는다.

II. 관련 연구

2.1 저작권 침해 동향

저작권은 컨텐츠를 제작한 저작자가 자신의 컨텐츠에 대해 갖는 법적 권리이다. 즉, 저작자의 권리를 보호함으로써 문화를 발전시키는 것을 목적으로 한다[2]. 그러나 법·제도의 구축만으로는 컨텐츠의 불법 유통 및 이용 현황이 근절되거나 예방되지 않는다[6]. 2018년 국내 기준으로 불법 복제물 이용 경험이 있는 인구가 약 1,773만 명으로 조사되었으며, Fig.1.과 같이 전년 대비 경험률이 약 3% 증가되었다[1].

JBBHCB_2020_v30n1_101_f0001.png 이미지

Fig. 1. Illegal Copies Usage Rate

이와 같은 조사 결과를 통해서 컨텐츠에 대한 불법 유통 및 이용이 지속되고 있음을 알 수 있다. 이를 방지하기 위해 다양한 분야에서 저작권 보호를 위한 기술이 연구되었다[3-5]. 또한, 정부에서도 온라인상의 불법 복제물 추적관리시스템(illegal content obstruction program)을 구축하고 침해 사이트 모니터링을 병행 운영하여 저작권을 보호하고 있다. 특히, 2018년 5월 정부 합동 수사를 통해서 Table 1.과 같이 토렌트 및 만화/웹툰 등 25개의 저작권 침해 사이트를 폐쇄 조치하였다.

Table 1. List of Closed Illegal Copies Distribution Sites

JBBHCB_2020_v30n1_101_t0001.png 이미지

그러나 Fig.2.와 같이 불법 저작물 유통량이 높았던 ‘토렌***킴’ 사이트가 폐쇄된 것을 악용하여, 2019년 11월 기준으로 지속 생성 및 운영되고 있다.

JBBHCB_2020_v30n1_101_f0002.png 이미지

Fig. 2. Continuous Creation and Operation of Sites Similar to Closed Torrent 「Torre***kim」

위와 같이 토렌트, 만화/웹툰 등의 저작자는 저작권 침해 사이트에 의해 자신의 컨텐츠에 대한 권리를 보장받기 어려운 실정이다. 또한, 침해 사이트 운영자는 무분별하게 불법 복제물을 업로드하고 개인의 금전적 이익을 부당하게 획득하고 있다.

이에 따라, 저작권 보호를 위해 지속적인 연구가 필요한 실정이다. 본 논문에서는 다양한 저작권 보호방안 중 저작권 침해 사이트의 생애주기 모델을 통해서 현재 저작권 침해 사이트의 상태 및 향후 변화 대응을 예측하려 한다.

2.2 생애주기 모델 정의

생애주기 모델은 인간의 성장기 또는 소프트웨어 개발 및 배포 기간 등 다양한 분야에서 일정 단계별 변화에 대응하기 위해 활용되고 있다[7-8].

본 논문에서는 저작권 침해 사이트에 대한 생애주기 모델을 ‘시간의 흐름에 따라 대응하는 저작권 침해 사이트의 단계별 과정’으로 정의한다. 이때, 단계별 구분은 저작권 침해 사이트를 대상으로 발생하는 특정 조치를 식별할 수 있는 변화 내용을 기준으로한다. 일반적인 사이트의 경우 ‘생성-운영-폐쇄’로 크게 3단계의 생애주기를 도출할 수 있다.

∙ 생성 단계 : 사이트를 구축하고 도메인을 등록하는 단계

∙ 운영 단계 : 운영자 및 사용자가 정보를 게시하고, 방문자는 게시된 정보를 획득할 수 있으며, 사이트 홍보를 통해 방문자를 유치하고 지속적인 사이트 유지보수를 수행하는 단계

∙ 폐쇄 단계 : 사이트 유지보수 비용 부족, 천재지변 및 기타 사항에 의해 사이트 운영이 어려운 경우 도메인을 소멸하는 단계

도출한 사이트 생애주기를 기반으로 저작권 침해 사이트의 생애주기 모델을 고려할 때, 각 단계별 세부적인 지표가 존재할 수 있다. 따라서 생애주기 모델의 부합성을 향상시키기 위해 저작권 침해 사이트 유형을 분석해야 한다.

III. 저작권 침해 사이트 유형 정의

토렌트, 만화/웹툰, 모바일, 웹하드, P2P 및 스트리밍 서비스 등 불법 복제물 유통 환경에 따라 다양한 유형의 침해 사이트가 존재한다. 그러나 모든 유통 환경의 공통점을 도출하기에는 어려움이 존재한다. 이에 따라 생애주기 모델을 적용하는 유통 환경을 선정할 필요가 있다.

2018년 온라인 불법 복제물 모니터링 대상 온라인 서비스 제공자(online service provider) 현황은 Table 2.와 같다[1].

Table 2. Status of OSP in Illegal Online Copies

JBBHCB_2020_v30n1_101_t0002.png 이미지

또한, 온라인 불법복제물의 유통 경로는 토렌트(27.8%), 모바일(21.9%), 웹하드(17.9%) 및 포털(16.9%) 순으로 조사되었다[2]. 최근에는 불법 복제물의 유통이 기존 웹하드 및 P2P에서 토렌트, 만화/웹툰 및 SNS로 변화하는 추세이다. 따라서 모니터링 대상 현황, 유통량, 선호 동향 및 사이트 특징 유사성을 고려하여 토렌트 및 만화/웹툰 사이트를 선정하였다.

3.1 토렌트 사이트 정의

토렌트 사이트는 P2P(Peer-to-Peer) 파일 전송 프로토콜인 비트토렌트(BitTorrent)를 통해 파일을 업/다운로드 할 수 있는 토렌트(*.torrent) 파일을 배포하는 사이트를 의미한다. 이때 합법적으로 재배포가 가능한 컨텐츠의 토렌트 파일을 배포하는 합법 토렌트 사이트도 있지만, 저작권법을 위반하는 불법 복제물에 대한 토렌트 파일을 배포하는 토렌트 사이트가 다수 존재한다.

Table 3. Selection of Infringement Site Types for the Application of Life Cycle Models

JBBHCB_2020_v30n1_101_t0003.png 이미지

토렌트 사이트는 Fig. 3.과 같이 미디어 컨텐츠, 음악 컨텐츠 및 게임 컨텐츠 등 다양한 저작물이 침해되고 있는 실정이다.

JBBHCB_2020_v30n1_101_f0003.png 이미지

Fig. 3. Example of Torrent Site

3.2 만화/웹툰 사이트 정의

만화/웹툰 사이트는 만화/웹툰 제공 플랫폼에서 만화/웹툰 작가들이 제작한 다양한 저작물을 게시하는 사이트를 의미한다. 이때 합법적으로 작가들에게 수익을 주는 계약을 통해 무료 또는 유료로 만화/웹툰을 게시하는 사이트도 있지만, 저작권법을 위반하는 불법 복제로 만화/웹툰 저작물을 무료로 게시하는 불법 사이트가 다수이며, Fig. 4.와 같이 만화/웹툰 관련 저작물이 침해되고 있는 실정이다.

JBBHCB_2020_v30n1_101_f0004.png 이미지

Fig. 4. Example of Comics/Webtoon Site

IV. 제안 모델

4.1 저작권 침해 사이트 생애주기 시나리오

본 논문에서 제안하는 저작권 침해 사이트의 생애 주기 시나리오는 Fig. 5.와 같다.

JBBHCB_2020_v30n1_101_f0005.png 이미지

Fig. 5. Copyright Infringement Site Lifecycle Scenario​​​​​​​

Step 1. 도메인 등록 / 사이트 운영

온라인 서비스 제공자는 저작권 침해 사이트의 사이트명, 도메인 등을 등록한다. 이후 타 사이트에 광고 및 링크를 통해 사용자의 접속을 유도하며 사이트 운영을 통해 부당한 금전 이익을 얻는다.

Step 2. 모니터링 및 차단

온라인상에 불법 복제물 추적관리시스템(ICOP)과 모니터링에 의해서 저작권 침해 여부가 파악되면 운영 중인 도메인 접속이 차단된다.

Step 3. 경우의 수

접속이 차단되었을 경우 온라인 서비스 제공자는 2가지 독립적 형태로 차단에 대응한다.

Step 3-1. 우회 접속

첫 번째로 차단된 도메인과 유사한 형태의 도메인(예를 들어, torrent1.com → torrent2.com과 같이 번호를 높인 경우)을 추가로 등록한다. 이때, VPN을 통해 우회하여 차단된 도메인에 접속한 사용자가 새로 추가 등록한 도메인으로 접속할 수 있도록 대응한다.

Step 3-2. 타 사이트 리다이렉션

두 번째로 차단된 도메인과 유사한 형태의 도메인이 아닌 타 침해 사이트의 도메인으로 리다이렉션하여, 유사 형태 도메인에 대한 모니터링을 회피할 수 있도록 대응한다.

Step 4. 폐쇄 조치

온라인 서비스 제공자가 지속적인 모니터링에 의해 Step 3과 같은 2가지 독립된 형태로 대응하기 어려울 경우 또는 수사로 인해 검거될 경우, 해당 사이트의 도메인 서비스가 중단되며 사이트가 폐쇄된다.

4.2 제안하는 저작권 침해 사이트 생애주기 모델

4.1절의 시나리오에 대한 분석을 통해서 저작권 침해 사이트의 생애주기 모델은 Fig. 6.과 같이 생성, 운영, 대응, 변경 및 폐쇄로 크게 5단계로 도출하였다.

JBBHCB_2020_v30n1_101_f0006.png 이미지

Fig. 6. Proposed Copyright Infringement Site Lifecycle Model​​​​​​​

또한, 생애주기 단계별 세부적인 특징을 고려하여 Fig. 7.과 같은 흐름으로 생애주기 모델이 수행된다. 특히, 제안한 생애주기 모델을 실제 침해 사이트에 적용시키기 위해 각 단계별로 가중치 를 설정하였다.

JBBHCB_2020_v30n1_101_f0007.png 이미지

Fig. 7. Flow Chart for Proposed Lifecycle Model​​​​​​​

4.2.1 생성 단계(creation)

저작권 침해 사이트를 운영하기 위해 웹언어를 통해 사이트를 구축하거나, 기존에 구축된 웹페이지 소스를 구매한 후에 사이트명 설정 및 도메인 등록을 통해 저작권 침해 사이트를 생성한 경우일 때, 생애주기를 ‘생성’으로 분석한다.

생성 단계에서는 침해 사이트의 도메인 등록 여부가 생애주기 단계의 변화 내용이다. 이에 따라 도메인 등록을 통한 침해 사이트 생성 시 가중치 w1=1, 비생성 시 가중치w1=0  으로 설정하였다.

4.2.2 운영 단계(operation)

운영 단계는 첫 번째로 침해 사이트 도메인이 기존 대비 최신으로 업데이트 되었을 때 우회하지 않아도 업데이트된 도메인에 접속이 가능하고, 해당 도메인이 다른 침해 사이트로 리다이렉트되지 않을 경우.

두 번째로 침해 사이트 도메인이 업데이트 되지 않았을 때 기존의 도메인에 우회하지 않아도 접속이 가능한 경우에 생애주기를 ‘운영’으로 분석한다. 또한, 대응 및 변경 단계도 운영의 범주에 포함되게 생애주기를 설정한다.

운영 단계에서는 침해 사이트의 다양한 특징 여부가 생애주기 단계의 변화 내용이며, 토렌트 및 만화/웹툰 침해 사이트의 운영 단계 특징 지표는 다음과 같다.

∙ 도메인 유사 변경 여부(w2)

: 기존 도메인 차단 시 업데이트되는 최신 도메인이 기존 도메인과 유사​​​​​​​

∙ 회원제 여부(w3)

: ID/PW를 통한 회원 DB 관리

∙ 광고 배치 여부(w4)

: 사이트내 광고배너 배치

∙ 차단 시 사이트 변경 안내 여부(w5)

: 도메인 차단 시 트위터, 텔레그램 또는 자체 공지를 통해 업데이트되는 최신 도메인 안내

이에 따라 도메인 유사 변경 시, 회원제 시, 광고배치 시, 차단 시 사이트 변경 안내에 대한 가중치는 각각 w2=0.2, w3=0.2, w4=0.2, w5=0.2, 특징 지표에 해당하지 않을 시 각각 w2=0, w3=0, w4=0, w5=0 으로 설정하였다.

4.2.3 대응 단계(action)

대응 단계는 첫 번째로 침해 사이트 도메인이 기존 대비 최신으로 업데이트 되었을 때 우회 접속이 가능할 경우. 두 번째로 침해 사이트 도메인이 업데이트 되지 않았을 때 기존의 도메인에 정상 접속이 불가능하지만 우회 접속은 가능하며, 해당 도메인이 다른 침해 사이트로 리다이렉트되지 않는 경우에 생애주기를 ‘대응’으로 분석한다.

대응 단계에서도 운영 단계의 저작권 침해 사이트 특징 여부가 생애주기 단계의 변화 내용이며, 가중치를 운영 단계와 동일하게 설정하였다.

4.2.4 변경 단계(change)

변경 단계는 첫 번째로 침해 사이트 도메인이 기존 대비 최신으로 업데이트 되었을 때 우회하지 않아도 업데이트된 도메인에 접속이 가능하고, 해당 도메인이 다른 침해 사이트로 리다이렉트될 경우. 두 번째로 침해 사이트 도메인이 업데이트 되지 않았을 때기존의 도메인에 정상 접속이 불가능하지만 우회 접속은 가능하며, 해당 도메인이 다른 침해 사이트로 리다이렉트될 경우에 생애주기를 ‘변경’으로 분석한다. 변경 단계에서도 운영 단계의 저작권 침해 사이트 특징 여부가 생애주기 단계의 변화 내용이며, 가중치를 운영 단계와 동일하게 설정하였다.

4.2.5 폐쇄 단계(closed)

폐쇄 단계는 침해 사이트 도메인이 기존 대비 최신으로 업데이트 되지 않았으며, 기존의 도메인에 정상 접속 및 우회 접속 모두 불가능한 경우일 때, 생애주기를 ‘폐쇄’로 분석한다.

폐쇄 단계에서는 침해 사이트의 도메인 소멸 여부가 생애주기 단계의 변화 내용이다. 이에 따라 도메인 소멸을 통한 침해 사이트 폐쇄 시 가중치 w6=0.2 , 비폐쇄 시 가중치 w6=0 으로 설정하였다.

V. 모델 검증 및 분석

본 장에서는 토렌트 및 만화/웹툰 저작권 침해 사이트를 대상으로 실험을 수행하여 데이터셋을 수집 및 분석한다. 이후, 제안한 생애주기 모델을 실제 침해 사이트에 적용하여 모델 검증 및 결과 분석을 나타낸다.

5.1 실험 환경

본 논문의 실험 환경은 CPU Intel Xeon W-2123 4C(3.6GHz)와 RAM 48GB ECC의Windows 10 Pro 64bit 환경으로 구성된다.

해당 환경에서 Fiddler 5.0과 Python 3.7 소프트웨어를 사용하여 데이터셋을 수집 및 분석한다.

웹 디버깅 도구인 Fiddler 5.0을 사용하여 도메인 검색 요청 시 도메인 자원 검색 사이트의 통신 과정을 분석하였다. 이를 통해 도메인 자원 검색 사이트 내 정보를 자동으로 수집하기 위한 HTTP 요청 URL 및 헤더 값을 획득할 수 있다.

Fiddler를 사용하여 획득한 HTTP 요청 정보를 통해, 도메인 정보를 자동으로 요청하여 수집하는 프로그램을 Python 3.7 프로그래밍 언어를 사용하여 구현한다. CSV 파일에 저장된 데이터를 읽고, 생성한 데이터를 CSV 파일에 저장하기 위해 Pandas 라이브러리를 임포트(Import)한다. 또한 자동화된 HTTP 요청을 위해 Requests 라이브러리를 임포트하며, BeautifulSoup 라이브러리를 임포트하여 요청한 사이트의 HTML 코드를 파싱한다.

위의 실험 환경을 통해 본 논문에서는 토렌트 사이트(47개)와 만화/웹툰 사이트(28개)를 대상으로 생애주기 모델 적용을 위한 데이터셋을 분석하였다.

Table 4. Experimental setup​​​​​​​

JBBHCB_2020_v30n1_101_t0004.png 이미지

5.2 검증 및 결과 분석

저작권 침해 여부 및 침해 시 대응하기 위해서 제안하는 생애주기 모델을 통해 현재 알려진 저작권 침해 사이트의 생애주기와 부합 여부 및 향후 생애주기를 예측해야 한다. 이에 따라 본 절에서는 제안하는 생애주기 모델의 수용률 및 예측률을 산출하여 제안 모델 검증을 수행한다.

5.2.1 생애주기 모델 수용률 산출식 도출

생애주기 모델을 적용하여 수용률(Acceptance Rate)을 산출하기 위해서 실험을 통해 부록 A와 같은 데이터셋을 수집하였다.

4.2절의 제안한 생애주기 모델에서 단계별로 수용률 산출 지표 가중치가 설정되어 있으며, 이는 Fig. 8.과 같다. 즉, 생성(w1→ 1), 운영-대응-변경  (w2-5→ 0.8), 폐쇄(w6→ 0.2)로 값이 설정되었으며, 주기 당(1 Cycle) 전체 가중치는 2를 갖게 된다.

JBBHCB_2020_v30n1_101_f0008.png 이미지

Fig. 8. Weight by Lifecycle Phase​​​​​​​

침해 사이트에 대한 생애주기 모델의 수용률을 산출하기 위해 필요한 기호를 정의하면 다음과 같다.

AR : 수용률(%)

N : 전체 침해 사이트 수(1 ≤ N)

i:생애주기 모델 적용 침해 사이트(1≤ i)

W : 전체 가중치(W= 6)

 :단계 지표별 가중치(1≤≤ S)

S : 전체 생애주기 단계 지표 수

이때, 수용률은 임의의 저작권 침해 사이트에 대해 산출식에 활용되는 전체 침해 사이트 수(N)에 대한 전체 가중치(W)와 제안한 생애주기 모델을 적용한 각 침해 사이트(i)에 대한 단계 지표별 가중치(wz) 총합의 백분율이다. 따라서 수용률(AR) 산출식은 다음과 같다.

\(A R=\frac{\sum_{i=1}^{N} i\left(\sum_{x=1}^{S} w_{x}\right)}{N \times W} \times 100(\%)\)       (1)

5.2.2 생애주기 모델 예측률 산출식 도출

생애주기 모델을 적용하여 예측률(Prediction Rate)을 산출하기 위해서 실험을 통해 부록 B와 같은 데이터셋을 수집하였다.

예측률 산출은 침해 사이트의 생애주기에 대한 변동 관련 데이터셋이 필요하다. 따라서 실험에 사용된 알려진 침해 사이트는 부록 A에서 수용률 산출을 위해 사용된 지표 중 생애주기가 ‘변경’ 단계일 때 또는 도메인 유사 변경 여부가 ‘○’인 경우로 축소 선정하였다. 

‘변경’ 단계의 사이트(4개), 도메인 유사 변경 여부가 ‘○’일 때 생애주기가 ‘운영-대응’ 단계의 사이트(38개)를 대상으로 검증을 진행한다.

침해 사이트에 대한 생애주기 모델의 예측률을 산출하기 위해 필요한 기호를 정의하면 다음과 같다.

PR : 예측률(%)

S : ‘변경’ 또는 ‘운영-대응’ 단계

N8 : 단계 S에 속하는 전체 침해 사이트 수

R : Mm - Mstd 이상, Mm + Mstd 이하의 범위

C : 평균 대응일이 R에 속하는 사이트 수(1 ≤N8)

Mi : 특정 사이트의 평균 대응일 (i≤N8)

Mm : 단계 S의 평균 대응일 평균

Mstd : 단계 S의 평균 대응일 표준편차

이때, 부록 B의 사이트별 단계 변화 대응 소모일은 평균 (9.33), (0), (95), (21.5), (131.6), (5.92)일 등으로 편차가 컸다. 이처럼 규칙적이지 않은 저작권 침해 사이트의 대응 주기를 분석하기 위해, 평균과 표준편차를 사용한 대응 주기의 예측 범위를 설정한다.

사이트별 평균 변동 대응일(Mi)의 평균(Mm) 사이트별 평균 변동 대응일(Mi)의 표준편차 (Mstd)을 사용하여 구성한 예측 범위는 다음과 같다. Mstd는 사이트별 평균 변동 주기(Mi )들이 Mm 과 갖는 차이의 평균이기 때문에 Mm - Mstd 이상, Mm + Mstd 이하의 범위(R)를 평균 대응일의 범위로 설정한다. 평균 대응일이 R 내에 속하는 경우 예측 성공으로 판단하고, 평균 대응일이 R 내에 속하지 않는 경우 예측 실패로 판단한다.

이에 따른 예측률은 분석 대상 사이트 수(Ns) 대비 예측 성공 사이트 수(C)에 대한 백분율이다. 따라서 예측률(PR) 산출식은 다음과 같다.

\(PR=\frac C {N_s} \times 100(\%)\)​​​​​​​       (2)

5.2.3 검증 결과 분석

본 절에서는 실험을 통해 수집한 데이터셋을 제안한 생애주기 모델에 적용하여, 수용률 및 예측률을 산출한 결과를 분석한다.

❒ 수용률 검증 결과 분석

부록 A의 알려진 토렌트 사이트(47개) 및 만화/웹툰 사이트(28개)에 대한 수용률을 산출하였다. 결과는 Table 5.와 같다.

Table 5. Verification Result of Proposed Lifecycle Model Acceptance Rate​​​​​​​

JBBHCB_2020_v30n1_101_t0005.png 이미지

❒ 예측률 검증 결과 분석

부록 B의 알려진 토렌트 사이트(30개) 및 만화/웹툰 사이트(12개) 중 생애주기가 ‘변경’ 단계인 사이트(4개), 도메인 유사 변경 여부가 ‘○’일 때 생애주기가 ‘운영-대응’ 단계인 사이트(38개)에 대한 예측률을 산출하였다. 결과는 Table 6.과 같다.

Table 6. Verification of Proposed Lifecycle Model through Prediction Rate​​​​​​​

JBBHCB_2020_v30n1_101_t0006.png 이미지

예측률 산출식을 통한 검증 결과, ‘변경’ 단계의 4개 사이트에 대한 예측률은 충분하지 않은 분석 대상수로 인해 50%의 결과를 보였다. 하지만, 범위(R)내에 포함되지 않는 평균 대응일 또한 R에서 크게 벗어나지 않았다. 결과적으로, ‘변경’ 단계의 예측률은 분석 대상을 충분히 확보할 경우 향상된 결과를 나타낼 것으로 예상된다.

‘운영-대응’ 단계의 경우, 38개 사이트 중 32개의 사이트에 대한 예측을 성공하였으며, 약 84.21%의 예측률을 보였다. 전체적으로는 42개 사이트 중 34개의 사이트에 대한 예측을 성공하였으며, 80.95%의 예측률을 보였다.

JBBHCB_2020_v30n1_101_f0009.png 이미지

Fig. 9. Verification Result of Proposed Lifecycle Model Acceptance Rate​​​​​​​

JBBHCB_2020_v30n1_101_f0010.png 이미지

Fig. 10. Verification Result of Proposed Lifecycle Model Prediction Rate​​​​​​​

VI. 결론

현재 저작권 시장은 컨텐츠 저작권에 대한 법·제도가 규정되어 있으며, 불법 복제물을 유통하는 다양한 환경을 추적 및 모니터링하는 기술을 통해 저작권 보호에 노력하고 있다.

그러나, 저작권 침해 사이트는 법·제도 및 추적·모니터링과 같은 기술을 회피하기 위해 해외에 서버를 두고 지속적인 생성 및 운영을 하고 있다. 또한, 침해 사이트의 생애주기가 짧아지고, 침해 유형도 다양화되고 있어서 모든 저작권 침해 사이트를 추적·모니터링하기 어려운 실정이다. 따라서, 저작권 침해 사이트 추적 및 모니터링 기술을 고도화하기 위한 기반 마련이 필요하였다.

본 논문에서는 저작권 침해 사이트의 생애주기 모델을 제안하였다. 이를 위해, 저작권 침해 유형 중 토렌트 및 만화/웹툰 사이트를 선정하여 저작권 침해 생애주기 시나리오를 적용하고, 각 침해 유형 사이트에 대한 메타데이터를 수집 및 분석하여 수용률 및예측률 측정을 통해 제안한 생애주기 모델을 검증하였다. 이를 통해, 불법 복제물 유통에 대한 선제적 대응을 할 수 있는 기반을 마련하였으며, 향후에는 저작권 침해 사이트의 생애주기 모델을 학습시키고, 고도화된 저작권 침해사이트 추적 및 모니터링을 위한 기술에 대해 연구를 진행할 예정이다.​​​​​​​

References

  1. "2019 Annual Report on Copyright Protection," Korea Copyright Protection Agency, pp. 1-395, Aug. 2019.
  2. "2018 Annual Report on Copyright Protection," Korea Copyright Protection Agency, pp. 1-374, May. 2018.
  3. Jung-Sik Hwang and Hyun-Gon Kim, "Blockchain-based Copyright Management System Capable of Registering Creative Ideas," Journal of Internet Computing and Services, 20(5), pp. 57-65, Oct. 2019.
  4. Tae-Jung Kim, Jae-Ho Hwang, and Choong-Seong Hong, "A Wavelet Based Robust Logo Watermarking Algorithm for Digital Content Protection," Journal of Internet Computing and Services, 9(1), pp. 33-42, Feb. 2008.
  5. Hee-Wan Park, "Design and Implementation of Server-based Resource Obfuscation Techniques for Preventing Copyrights Infringement to Android Contents," Journal of the Korea Contents Society, 16(5), pp. 13-20, May. 2016. https://doi.org/10.5392/JKCA.2016.16.05.013
  6. Eui-Yul Choi and Yong-Bae Jeon, "An Analysis of Factors InFluencing Copyright Protection Decision-Making among Korean eSports Game Users," Journal of the Korea Contents Society, 14(12), pp. 723-732, Dec. 2014.
  7. Hee-Chang Park, "Membership Life Analysis in Internet Site Using Life Table," Journal of the Korean Data Analysis Society, 10(6), pp. 3191-3198, Dec. 2008.
  8. Jae-Hyun-Ha and Su-Gie Lee, "Analysis on the Determinant Factors of Commuting Time by Individuals Life Cycle Stage - Based on the 2010 Household Travel Survey Data of the Seoul Metropolitan Area-," Journal of Korea Planning Association, 52(4), pp. 135-152, Aug. 2017. https://doi.org/10.17208/jkpa.2017.08.52.4.135