• 제목/요약/키워드: 음성 변조

검색결과 91건 처리시간 0.023초

음성 비식별화 모델과 방송 음성 변조의 한국어 음성 비식별화 성능 비교 (Comparison of Korean Speech De-identification Performance of Speech De-identification Model and Broadcast Voice Modulation)

  • 김승민;박대얼;최대선
    • 스마트미디어저널
    • /
    • 제12권2호
    • /
    • pp.56-65
    • /
    • 2023
  • 뉴스와 취재 프로그램 같은 방송에서는 제보자의 신원 보호를 위해 음성을 변조한다. 음성 변조 방법으로 피치(pitch)를 조절하는 방법이 가장 많이 사용되는데, 이 방법은 피치를 재조절하는 방식으로 쉽게 원본 음성과 유사하게 음성 복원이 가능하다. 따라서 방송 음성 변조 방법은 화자의 신원 보호를 제대로 해줄 수 없고 보안상 취약하기 때문에 이를 대체하기 위한 새로운 음성 변조 방법이 필요하다. 본 논문에서는 Voice Privacy Challenge에서 비식별화 성능이 검증된 Lightweight 음성 비식별화 모델을 성능 비교 모델로 사용하여 피치 조절을 사용한 방송 음성변조 방법과 음성 비식별화 성능 비교 실험 및 평가를 진행한다. Lightweight 음성 비식별화 모델의 6가지 변조 방법 중 비식별화 성능이 좋은 3가지 변조 방법 McAdams, Resampling, Vocal Tract Length Normalization(VTLN)을 사용하였으며 한국어 음성에 대한 비식별화 성능을 비교하기 위해 휴먼 테스트와 EER(Equal Error Rate) 테스트를 진행하였다. 실험 결과로 휴먼 테스트와 EER 테스트 모두 VTLN 변조 방법이 방송 변조보다 더 높은 비식별화 성능을 보였다. 결과적으로 한국어 음성에 대해 Lightweight 모델의 변조 방법은 충분한 비식별화 성능을 가지고 있으며 보안상 취약한 방송 음성 변조를 대체할 수 있을 것이다.

스마트폰 음성 녹음 파일 위변조 검출을 위한 스펙트로그램 분석의 한계점 (Limitations of Spectrogram Analysis for Smartphone Voice Recording File Forgery Detection)

  • 한상민;손영민;박재완
    • 문화기술의 융합
    • /
    • 제9권2호
    • /
    • pp.545-551
    • /
    • 2023
  • 오늘날 누구나 디지털 정보를 용이하게 활용할 수 있게 됨에 따라 디지털 증거의 채택이 증가되고 있다. 하지만 다양한 음성 파일 편집 도구를 보급과 함께 정교한 편집 과정을 거친 음성 녹음 파일의 경우 위변조 진위 여부를 판단하는 것은 사실상 불가능하다. 본 연구는 음성 녹음 파일에 삽입, 삭제, 연결 및 합성 편집 기술을 활용해 원본 파일과 구별하기 어려운 위변조가 가능함을 증명하고자 한다. 본 연구는 위변조 된 음성 파일을 원본과 동일한 확장자로 인코딩하는 작업을 통해 위변조 검출의 어려움을 제시한다. 또한 특징점이 발생한 실험에 한 하여 추가적으로 천이대역의 삭제 및 2차 인코딩 작업을 수행할 경우 위변조 검출은 불가능함을 나타냈다. 이를 통해 본 연구는 음성 녹음 파일을 디지털 증거로 채택하기 위한 더 엄격한 증거능력 판단 기준 수립에 공헌할 것으로 기대된다.

스마트폰 음성녹음 파일 구조 및 메타데이터의 위변조 기법에 관한 연구 (A Study on Forgery Techniques of Smartphone Voice Recording File Structure and Metadata)

  • 박재완;곽원준;이상현
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.807-812
    • /
    • 2022
  • 최근 음성녹음 파일도 법정 증거로 제출되는 수가 늘어남에 따라 위변조를 주장하는 사례도 증가하고 있다. 객관적 근거인 음성녹음 파일 구조 및 메타데이터를 완벽하게 위변조 할 경우에는 정교한 음성녹음 파일의 위변조 검출은 사실상 불가능하다. 위변조된 음성녹음 파일을 가지고 수행된 파일 구조 및 메타데이터 분석이 법정에서 거부되는 것은 쉽지 않다. 본 연구는 음성녹음 파일 구조 및 메타데이터의 위변조가 손쉽게 가능하다는 것을 증명하는 것을 목적으로 한다. 이를 위해 본 연구에서는 음성녹음 파일의 편집 방법의 유형화를 기반으로 정교한 편집이 가능한 '혼합붙여넣기' 기능을 적용할 경우 위변조 검출의 불가능함을 소개했다. 더욱이 실험을 통해 파일 구조 및 메타데이터의 위변조가 가능하다는 것을 증명했다. 따라서 음성녹음 파일이 디지털 증거로 채택됨에 있어서 더 엄격한 증거능력 판단 기준이 필요하다. 본 연구는 법관이 디지털 증거를 채택함에 무결성의 기준에 공헌할 뿐만 아니라 향후 개발될 것으로 예상되는 녹음파일 위변조 검출 인공지능을 위한 데이터셋 구축 방법에 공헌할 것이다.

카오스 발생회로를 이용한 음성비화통신 제어시스템 (Speech Secure Communication Control System Using Chaos Generation Circuit)

  • 여지환;이익수
    • 한국지능시스템학회논문지
    • /
    • 제6권2호
    • /
    • pp.72-80
    • /
    • 1996
  • 본 논문은 카오스 발생회로(chaos generation circuit)를 설계 및 구현하고, 카오스 회로들간의 카오스 동기화(chaos synchronization) 알고리즘을 기초로 하여 카오스 변조통신을 구성하여 음성비화시스템의 구현에 관하여 실험적으로 검증했다. Pecorra와 Carroll 은 카오스 신호로서 카오스 시스템을 구동하면 카오스 동기화가 가능하다고 발표했다. 이러한 제어기법은 카오스 신호의 마스킹과 복원 알고리즘의 등장을 초래했다. 본 연구는 카오스 신호를 발생하기 위하여 상태변수 기법을 이용하여 로렌쯔(Lorenz) 카오스 발생회로를 하드웨어로 구현했다. 수치 실험 및 보드상의 실험에서 카오스 회로는 카오스의 동적특성을 나타냈으며, 카오스 발생회로들간의 카오스 동기제어를 아루었다. 음성비화를 위한 카오스 신호의 변조는 카오스 신호에 음성신호를 가산하여 송신하며, 광대역)spread spectrum)의 카오스 변조통신 (chaotic modulation communication)에서 음성정보는 수신시스템의 카오스 부시스템에서 카오스 신호를 빼내어 신호를 복원한다. 보드상에서 하드웨어로 구현한 카오스 변.복조 통신시스템을 구성하여 음성신호와 비화통신에 카오스 지능제어기법을 적용하였다.

  • PDF

MTF-STI를 이용한 유리창 도청음의 명료도 분석 (Intelligibility Analysis on the Eavesdropping Sound of Glass Windows Using MTF-STI)

  • 김희동;김윤호;김석현
    • 한국음향학회지
    • /
    • 제26권1호
    • /
    • pp.8-15
    • /
    • 2007
  • 음향 공동-유리창 연성계를 대상으로 도청음의 음성 명료도를 검토한다. MLS신호를 음원으로 유리창의 가속도와 속도 응답을 가속도계와 레이저 도플러 진동계를 사용하여 측정한다. 변조전송함수 (MTF)를 사용하여 공동-유리창 진동계의 음성전달특성을 규명한다. 변조전송함수에 근거하여 음성전송지수 (STI)를 구하고, 유리창 진동음의 음성명료도를 평가한다. 가속도음과 속도음의 음성명료도를 비교하고, 최종적으로 대화음의 명료도를 주관적 평가로 확인한다.

피드백 마스킹 기법을 사용한 카오스 음성비화통신 (Chaotic Speech Secure Communication Using Feedback Masking Techniques)

  • 이익수;여지환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.353-356
    • /
    • 2002
  • 본 논문은 카오스 신호를 이용하여 안전한 음성신호의 전송을 위한 아날로그 비화통신 시스템의 성능분석에 관한 연구이다. 기존의 카오스 동기화 및 카오스 변조통신 알고리즘을 개선하여 실제 통신환경에서 발생하는 다양한 조건들을 적용하여 음성신호의 복원능력을 모의실험으로 분석하였다. 일반적인 PC 제어기법과 제안한 피드백 마스킹 기법을 사용하여 송신단에서 음성신호를 카오스 신호로 마스킹하여 변조하고, 통신채널에 잡음신호를 추가하여 전송하였다. 수신단에서는 카오스 응답시스템을 이용하여 음성신호를 복조하고, 복원성능을 계산하기 위하여 아날로그 복원 에러신호의 평균전력을 제안하여 계산하였다. 실험결과 마스킹 정도, 파라미터들의 민감성, 채널잡음 등에 대하여 PC 제어기법보다 피드백 제어기법의 복원성능이 우수함을 확인할 수 있었다. 또한 로렌쯔 카오스 시스템을 비화통신시스템에 사용할 경우 파라미터들의 조합으로 암호키를 구성해야 하므로 키값들의 선정에 기준이 되는 파라미터 변화율에 대응하는 복원에러율의 관계를 실험 값으로 구하였다.

유리창의 레이저 탐지음에 대한 음성명료도 분석 (Speech Intelligibility Analysis on the Laser Detected Sound of the Glass Windows)

  • 김석현;이현우;김희동
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.127-134
    • /
    • 2009
  • 본 연구에서는 다양한 두께의 유리창을 대상으로 레이저 원격 도청 가능성을 검토한다. MLS 신호음을 사용하여 유리창을 진동시키고 레이저 도플러센서로 진동음을 탐지한다. 탐지된 진동음으로부터 음성정보의 인식 수준인 음성명료도를 객관적으로 평가한다. 평가에는 변조전송함수에 근거하여 결정되는 음성전송지수를 사용한다. 또한, 외부 스피커와 유리창 교란기로 각각 교란파를 발생시켜, 배경소음과 도청방지기의 음성명료도에 대한 교란효과를 평가한다. 다양한 두께의 유리창을 대상으로 레이저 원격 도청음의 음성인식 수준과 국산 도청 방지장치의 도청방지 성능을 평가하는 데에 본 연구의 목적이 있다.

천해에서 SSB 모뎀의 실험결과 분석 (Experimental Results of SSB Modem in Shallow Sea)

  • 주형준;한정우;김기만
    • 한국정보통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.990-998
    • /
    • 2008
  • 본 논문은 SSB(Single Side Band) 변조 기법을 이용하여 실제 해상에서 실험을 수행한 결과를 분석하였다. 현재 수중 통신 분야에서의 연구는 디지털 변조 기법 및 OFDM이나 MIMO 시스템을 적용하고 있으나, 실제 해상에서 사용되는 상용 통신기로는 아날로그 변조 방식을 많이 사용하고 있다. 그에 따라 본 연구에서는 한국 해양 특성에 맞는 고품질의 수중 통신기기 개발을 목적으로 실험을 수행하였다. 실험은 SSB 아날로그 변조 기법으로 경상남도 진해 연안 천해의 조건에서 수행되었으며, 데이터는 수중 채널 특성 파악을 위한 토널 신호와 LFM 신호 및 실제 음성 통신을 위해 한국인 여성의 음성을 사용하였다.

PSK 변조방식이 수중통신에 미치는 영향에 관한 연구 (Effects of PSK Modulation Methods in Underwater Acoustic Communication)

  • 조진수;정승백;심태보
    • 한국음향학회지
    • /
    • 제26권7호
    • /
    • pp.366-374
    • /
    • 2007
  • 수중에서 무선통신이 기존에는 초음파를 이용한 단거리통신에 국한되었으나 최근 고주파를 이용한 장거리 통신의 필요성이 증가되고 음성뿐만이 아니라 각종 데이터나 고화질 영상자료의 송수신 수요가 늘어나고 있다. 본 연구에서는 수중에서 디지털 변조방식의 차이에 따라 실제 수중통신에 미치는 영향에 대하여 연구하였다. 모의 환경 하에서 PSK기반의 변조방식(BPSK, QPSK, MSK, GMSK)에 대한 시뮬레이션을 통해 실험한 결과 GMSK만이 큰 차이를 보였다. 위 결과를 바탕으로 SNR을 35dB이하로 하고 부산 남방에 위치한 207-선(한국해양자료센타)의 15Km 구간을 모의하여 음성통신과 영상자료를 전송실험한 결과 음성통신시($10^{-2}$BER, 채널용량 1Kbps기준)는 약 8Km의 거리 차이를, 그리고 영상자료($3{\times}10^5$ 화소, 화소 당 정보량 4bit) 전송시는 BPSK, QPSK, MSK 는 60Kbps, GMSK는 45Kbps의 전송율을 확보하여 약 7초의 전송시간 차이가 생김을 확인하였다.