Robust DNA Watermarking based on Coding DNA Sequence

부호 영역 DNA 시퀀스 기반 강인한 DNA 워터마킹

  • Lee, Suk-Hwan (Dept. of Information security, Tongmyong University) ;
  • Kwon, Seong-Geun (Div. of Electronics, Computer & Telecommunication, Pukyong National University) ;
  • Kwon, Ki-Ryong (Dept. of electronics engineering, KyungIl University)
  • 이석환 (동명대학교 정보보호학과) ;
  • 권성근 (부경대학교 전자컴퓨터정보통신공학부) ;
  • 권기룡 (경일대학교 전자공학과)
  • Received : 2011.11.22
  • Accepted : 2012.03.06
  • Published : 2012.03.25

Abstract

This paper discuss about DNA watermarking using coding DNA sequence (CDS) for the authentication, the privacy protection, or the prevention of illegal copy and mutation of DNA sequence and propose a DNA watermarking scheme with the mutation robustness and the animo acid preservation. The proposed scheme selects a number of codons at the regular singularity in coding regions for the embedding target and embeds the watermark for watermarked codons and original codons to be transcribed to the same amino acids. DNA base sequence is the string of 4 characters, {A,G,C,T} ({A,G,C,U} in RNA). We design the codon coding table suitable to watermarking signal processing and transform the codon sequence to integer numerical sequence by this table and re-transform this sequence to floating numerical sequence of circular angle. A codon consists of a consecutive of three bases and 64 codons are transcribed to one from 20 amino acids. We substitute the angle of selected codon to one among the angle range with the same animo acid, which is determined by the watermark bit and the angle difference of adjacent codons. From in silico experiment by using HEXA and ANG sequences, we verified that the proposed scheme is more robust to silent and missense mutations than the conventional scheme and preserve the amino acids of the watermarked codons.

본 논문에서는 DNA 시퀀스의 불법 복제 및 변이 방지와 개인 정보 침해 방지, 또는 인증을 위한 DNA 워터마킹에 대하여 논의하며, 변이에 강인하고 아미노산 보존성을 가지는 부호영역 DNA 시퀀스 기반 DNA 워터마킹 기법을 제안한다. 제안한 DNA 워터마킹은 부호 영역의 코돈 서열에서 정규 특이점에 해당되는 코돈들을 삽입 대상으로 선택되며, 워터마크된 코돈이 원본 코돈과 동일한 아미노산으로 번역되도록 워터마크가 삽입된다. DNA 염기 서열은 4개의 문자 {A,G,C,T}로 (RNA은 {A,C,G,U}) 구성된 문자열이다. 제안한 방법에서는 워터마킹 신호처리에 적합한 코돈 부호 테이블을 설계하였으며, 이 테이블에 따라 코돈 서열들을 정수열로 변환한 다음 원형 각도 형태의 실수열로 재변환한다. 여기서 코돈은 3개의 염기들로 구성되며, 64개의 코돈들은 20개의 아미노산으로 번역된다. 선택된 코돈들은 아미노산 보존성을 가지는 원형 각도 실수 범위 내에서 인접 코돈과의 원형 거리차 기준으로 워터마크에 따라 변경된다. HEXA와 ANG 시퀀스를 이용한 $in$ $silico$ 실험을 통하여 제안한 방법이 기존 방법에 비하여 아미노산 보존성을 가지면서 침묵 변이와 미스센스 변이에 보다 강인함을 확인하였다.

Keywords

References

  1. P. Sankar, "Genetic Privacy," Annual Review of Medicine, vol. 54, pp. 393-407, Feb. 2003. https://doi.org/10.1146/annurev.med.54.101601.152131
  2. C. T. Clelland, V. Risca, C. Bancroft, "Hiding messages in DNA microdots," Nature, vol. 399, pp. 533-534, June 1999. https://doi.org/10.1038/21092
  3. A. Leier, C. Richter, W. Banzhaf, and H. Rauhe, "Cryptography with DNA binary strands," Biosystems, vol. 57, Issue 1, pp. 13-22, June 2000. https://doi.org/10.1016/S0303-2647(00)00083-6
  4. B. Anam, K. Sakib, M. A. Hossain, and K. Dahal, "Review on the Advancements of DNA Cryptography," 4th International Conference on Software, Knowledge, Information Management and Applications, Aug. 2010.
  5. N. Yachie, K. Sekiyama, J. Sugahara, Y. Ohashi, and M. Tomita, "Alignment-based approach for durable data storage into living organisms," Biotechnol. Prog. vol. 23, pp. 501-505, April 2007. https://doi.org/10.1021/bp060261y
  6. D. Heider and A. Barnekow, "DNA watermarks in non-coding regulatory sequences," BMC Bioinformatics, vol. 2, no. 125, 2009.
  7. D. Heider and A. Barnekow, "DNA-based watermarks using the DNA-Crypt algorithm," BMC Bioinformatics, vol. 8, no. 176, May 2007. https://doi.org/10.1186/1471-2105-8-176
  8. B. Shimanovsky, J. Feng, and M. Potkonjak, "Hiding data in DNA," Procs. of the 5th Intl. Workshop in Information Hiding, pp. 373-386, October 2002.
  9. M. Arita and Y. Ohashi, "Secret Signatures Inside Genomic DNA," Biotechnology Prog., vol. 20, pp. 1605-1607, 2004. https://doi.org/10.1021/bp049917i
  10. D. Heider and A. Barnekow, "DNA Watermarks - A proof of concept," BMC Bioinformatics, vol. 9, no. 40, April 2008. https://doi.org/10.1186/1471-2105-9-40
  11. J. Shuhong and R. Goutte, "Code for encryption hiding data into genomic DNA of living organisms," 9th International Conference on Signal Processing (ICSP), pp. 2166-2169, Oct. 2008.
  12. 김정연, 남제호, "DCT 압축영역에서의 DC 영상 기반 다해상도 워터마킹 기법," 대한전자공학회, 전자공학회논문지-SP, 제45권 제4호, pp. 1-9, 2008년 7월.
  13. 박혜정, 최준림, "H.264/AVC 비디오 보호를 위한 비가시적 워터마킹의 설계 및 검증," 대한전자공학회, 전자공학회논문지-SD, 제45권 제6호, pp. 74-79, 2008년 6월
  14. 이석환, 권기룡, "기하학적 구조 및 위치 보간기를 이용한 3D 애니메이션 워터마킹," 대한전자공학회, 전자공학회논문지-CI, 제43권 제6호, pp. 71-82, 2006년 11월.
  15. 이석환, 권성근, 권기룡, "볼록 집합 투영 기법을 이용한 3D 메쉬 워터마킹," 대한전자공학회, 전자공학회논문지-CI, 제43권 제2호, pp. 81-92, 2006년 3월.
  16. T.A. Brown, Genomes 3, Garland Science, 2006.
  17. D. Anastassiou, "Genomic Signal Processing," IEEE Signal Processing Magazine, pp. 8-20, July 2001.
  18. R.C. Deonier, S. Tavare, S, and M.S. Waterman, Computational Genome Analysis: An Introduction, Springer, 2005.