• 제목/요약/키워드: 오디오압축

검색결과 180건 처리시간 0.023초

부동 소수점 DSP를 이용한 MPEG-4 HVXC 인코더 및 디코더의 실시간 구현 (Real-time Implementation of MPEG-4 HVXC Encoder and Decoder on Floating Point DSP)

  • 강경옥;나훈;홍진우;정대권
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.37-44
    • /
    • 2000
  • 본 논문에서는 인터넷 폰, 디지털 이동통신 등과 같이 낮은 비트율이 요구되는 분야에 사용될 수 있는 MPEG-4 오디오의 HVXC(Harmonic Vector eXcitation Coding) 알고리즘을 부동 소수점 DSP인 TMS320C6701에 실시간 구현한 내용을 기술한다. 실시간 동작을 위한 하드웨어 구조를 채택하였으며, 소프트웨어 최적화의 경우 연산 시간이 많이 소요되는 함수 루틴에 대한 C 언어 및 어셈블리 언어 레벨의 최적화를 수행하였다. 또한, DSP의 내부 프로그램 메모리의 프로그램 캐쉬로의 활용, DSP의 내부 데이터 메모리의 영역의 중첩 활용 및 background DMA 방식을 이용한 최적화를 수행하였다. 최적화 결과 2kbps및 4kbps의 비트율에서 압축 및 복원을 실시간으로 수행할 수 있으며, 인코더의 경우 2kbps의 경우에는 최적화 전에 비해 약 96% 정도로 수행시간을 단축하였다. 또한, 비공식 주관품질 평가에 의하면 2kbps의 비트율에서 약 MOS 2.45를 얻었다.

  • PDF

4-way 수퍼 스칼라 디지털 시그널 프로세서 코어 설계 (On Designing 4-way Superscalar Digital Signal Processor Core)

  • 김준석;유선국;박성욱;정남훈;고우석;이근섭;윤대희
    • 한국통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.1409-1418
    • /
    • 1998
  • 최근의 오디오 압축 알고리듬은 다양한 코딩 기법을 조합하여 사용하고 있다. 이들은 DSP 작업(DSP task), 제어 작업(controller task), 그리고 혼합 작업(mixed task)으로 나눌 수 있다. 기존의 DSP 프로세서들은 이들 중 DSP 작업만을 효율적으로 설계되어 있어 제어작업이나 혼합작업에 대해서는 자원을 효율적으로 활용하지 못하는 단점이 있다. 본 논문에서는 기존의 DSP 프로세서가 가지는 DSP 작업에 대하여 고성능을 그대로 유지하면서 제어작업과 혼합작업에서도 좋은 성능을 가지는 새로운 구조를 제안하고 구현하였다. 제안된 프로세서 YSP-3는 4개의 실행 유닛 (곱셈기, 2개의 ALU, 메모리 접근 유닛)을 병렬로 배치한 후 4-way 수퍼스칼라명령어 구조를 사용하여 각 우ㅠ닛을 독립적으로 사용할 수 있도록 하였다. 제안된 구조는 일반적인 DSP 알고리듬과 AC-3 디코딩 알고리듬을 실행하여 성능을 평가하였다. 마지막으로 VHDL을 통해 $0.6\$\mu$textrm{m}$-3ML 표준셀 기술로 합성한 후 Compass상에서 모의실험으로 통해 33MHz의 시스템 클럭에 대해 최대 지연시간 상황에서 실시간 동작을 확인하였다.

  • PDF

음악 특징점간의 유사도 측정을 이용한 동일음원 인식 방법 (Same music file recognition method by using similarity measurement among music feature data)

  • 성보경;정명범;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.99-106
    • /
    • 2008
  • 최근 다양한 분야에서(웹 포털, 유료 음원서비스 등) 디지털 음악의 검색이 사용되고 있다. 기존의 디지털 음악의 검색은 음악 데이터에 포함된 자체 메타 정보를 이용하여 이루어진다. 하지만 메타 정보가 다르게 작성되었거나 작성되지 않은 경우 정확한 검색은 어렵다. 요즘 이러한 문제의 보완 방안으로 음악자체를 이용하는 내용기반정보 검색 기법에 대한 연구가 이루어지고 있다. 본 논문에서는 음악의 파형에서 추출된 특징 정보간의 유사도 측정을 통하여 동일음원을 인식하는 방법에 대해 논하고자 한다. 디지털 음악의 특징 정보는 단순화시킨 MFCC (Mel Frequency Cepstral Coefficient)를 이용하여 음악의 파형으로부터 추출하였다. 디지털 음악간의 유사도는 Vision 및 Speech Recognition 분야에서 사용되던 DTW (Dynamic Time Warping) 기법을 활용하여 측정하였다. 제안된 동일 음원 인식 방법의 검증을 위한 같은 장르에서 무작위 추출된 1000곡에서 시행한 500번의 검색은 모두 성공했다. 검색에 사용된 500개의 디지털 오디오는 60개의 디지털음원을 압축방식과 비트율을 다르게 조합하여 만들었다. 실험의 결과로 DTW을 이용한 유사도 측정법이 동일음원을 인식할 수 있음을 증명하였다.

  • PDF

인간시각 시스템 기반의 그레이로고 & 컬러 이미지의 워터마킹 (Watermarking of Gray Logo & Color Image based on Human Visual System)

  • 노진수;신광규;이강현
    • 전자공학회논문지CI
    • /
    • 제42권3호
    • /
    • pp.73-82
    • /
    • 2005
  • 최근 인터넷의 광범위한 보급과 연결 응용 프로그램들의 개발에 따라 디지털 멀티미디어 자료(사진, 영화, 디지털오디오)의 보급 및 사용이 쉬워지고 있다. 그렇지만, 디지털 신호는 복제가 용이하고 복제된 데이터가 원 데이터와 동일한 품질을 가질 수 있다. 이러한 문제점의 해결방안으로써 연구되거나 사용되고 있는 저작권 보호방법은 크게 암호화(encipher)에 의한 방법과 워터마킹(watermarking) 기술을 사용한 방법이 있다. 디지털 워터마킹은 지적재산권의 보호와 올바른 멀티미디어 자료의 소유권자를 인증하기 위해 사용되어진다. 본 논문은 컬러 정지영상에 웨이블렛 변환을 사용하여 256 그레이 로고 이미지와 컬러 이미지를 워터마크 시킬 수 있는 워터마킹 알고리즘을 제안하였다. 제안된 알고리즘은 웨이블렛 변환 영역(LL, LH, HL, HH) 중 LH 주파수 영역에 워터마크를 삽입시켰으며, 워터마크에 데이터 통신에 사용되는 인터리빙 알고리즘을 적용시켜 워터마크 데이터량이 증가하여 PSNR이 감소하나 압축, 필터링, crop 등의 외부공격에 강인성을 가지게 된다.

다중 미디어 정보의 실시간 최적화 합성 및 방송 (Real-time Optimized Composition and Broadcasting of Multimedia Information)

  • 이상엽;박성원
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.177-185
    • /
    • 2012
  • 본 연구는 일반적인 성능의 PC와 모바일 디바이스를 사용하여 다양한 동영상 데이터, 문서 데이터, 각종 카메라 디바이스로부터 입력되는 비디오 스트리밍 데이터와 오디오 스트리밍 데이터를 실시간에 가까운 빠른 시간 안에 효율적으로 편집하고 방송하는 기술을 개발하는 것을 목적으로 한다. 본 연구에서는 두 개의 알고리즘을 개발하였는 데, 입력되는 여러 가지 형태의 여러 개의 동영상을 실시간에 합성하기 위하여 대략적 최적화 방법과 메모리 큐를 이용한 순차적 합성 방법이다. 본 연구에서 개발한 시스템은 강사가 동영상 강의 콘텐츠를 제작할 때 모바일 기기 또는 PC를 사용할 수 있으므로 보다 비용 측면에서 효율적이며 유용하다. 본 연구에서 개발한 시스템은 교육 분야뿐 만 아니라 동영상 합성 및 편집이 필요한 다양한 분야에서 매우 유용하게 사용될 수 있으므로 응용 분야가 넓을 것으로 판단된다.

기록의 디지털화 기준에 관한 연구 (A Study on the Criteria for Digitization of Records)

  • 임나영;남영준
    • 한국비블리아학회지
    • /
    • 제30권3호
    • /
    • pp.5-30
    • /
    • 2019
  • 본 논문은 우리나라의 기록 디지털화 기준이자 공공표준인 "NAK 26:2018(v2.0) 기록물 디지털화 기준"의 문제점과 미비점을 보완하여 원본 기록의 내용과 속성을 충실히 재현할 수 있는 디지털화 개선(안)을 제안하는 것에 그 목적이 있다. 이에 우리나라의 기록 디지털화 기준을 해외의 기록 관련 기관의 디지털화 기준, 지침, 권고사항 등과 비교분석하여 디지털파일 형태로 생산되지 않은 기록에 대한 디지털화 프로세스에 적용되어야할 기술적 기준 개선(안)을 제안하고, 이에 대한 타당성과 활용도를 검증받기 위하여 관련 전문가에게 면담을 실시하였다. 그 결과 무손실무압축방식 사용, 기록 유형 별 적절한 해상도 값 설정, 오디오 채널, 프레임 레이트, 주사방식에 대한 기준안 제안, 마이크로폼 형태에 대한 디지털화 기준 제안 등의 최종적 개선(안)을 제안하였다.

영화배우 최민식의 스크린 퍼포먼스 (Screen Performance of the Korean Actor Choi Min-sik)

  • 김종국
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권8호
    • /
    • pp.131-140
    • /
    • 2020
  • 이 글은 사회문화적 의미를 지향하는 퍼포먼스로서의 영화연기라는 방법론을 최민식의 연기에 적용하고자 하였다. 구체적으로, 영화배우 최민식의 인터뷰 구술에 언급된 신체, 얼굴, 오디오, 연출과의 관계, 영화기술에 대한 태도 등을 분석하였다. 결론적으로, 최민식의 연기는 메소드 액팅으로만 규정할 수 없고, 스타니슬랍스키, 스트라스버그, 메이어홀드, 브레히트, 그로토프스키 등의 전형적이거나 전위적인 연기론을 함축하거나 통합하며, 무엇보다 크라카우어가 제시한 움직임으로 재현되는 생명의 흐름을 명시하는 표상이다. 최민식 스스로가 강조하는 연민의 정서가 생명의 흐름을 재현하는 영화의 본질과 맞닿아 있고, 그것은 어떤 목적을 갖는 의도된 스크린 퍼포먼스로 확장된다. 연민과 생명의 흐름으로 압축할 수 있는 스크린 퍼포먼스는 최민식의 다양한 페르소나로 표출된다. 선악을 넘나드는 그의 페르소나는 한국사회의 현재를 반영한다.

대용량 플래시 메모리를 위한 임베디드 텍스트 인덱스 시스템 (An Embedded Text Index System for Mass Flash Memory)

  • 윤상훈;조행래
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-10
    • /
    • 2009
  • 플래시 메모리는 비휘발성이고 저전력으로 동작하며 가볍고 내구성이 강하다. 이러한 특성으로 휴대용 멀티미디어 재생기(PMP)와 같은 모바일 컴퓨팅 환경에서의 저장 장치로 많이 사용되고 있다. 대용량의 플래시 메모리를 저장 장치로 가진 모바일 기기들은 비디오/오디오/사진등과 같은 다양한 종류의 멀티미디어 데이터를 저장하고 재생한다. 모바일 컴퓨팅 장치를 위한 기존의 인덱스 시스템은 노래 가사와 같은 텍스트 형태의 정보 검색에 비효육적이다. 본 논문에서는 대용량 플래시 메모리 기반 임베디드 텍스트 인덱스(Embedded Text Index: EMTEX) 시스템을 제안한다. EMTEX는 먼저 임베디드 시스템을 고려한 압축 알고리즘을 사용하며, 텍스트 인덱스가 구성된 필드에 삽입 및 삭제시 인덱스에 즉시 반영된다. 뿐만 아니라, 플래시 메모리의 특성을 고려한 효율적인 삽입, 삭제, 재구성 기능을 수행하며, DBMS의 상위 계층에서 독립적으로 동작한다는 장점을 갖는다. 제안한 시스템의 성능 평가를 위해 다양한 환경에서 실험을 수행하였다. 그 결과 EMTEX는 임베디드 환경에서 Oracle Text나 FT3와 같은 기존의 인덱스 시스템보다 더 좋은 성능을 보여주었다.

MPEG-2 AAC Encoder의 심리음향 모델 최적화 (An Optimization on the Psychoacoustic Model for MPEG-2 AAC Encoder)

  • 박종태;문규성;이강현
    • 전자공학회논문지CI
    • /
    • 제38권2호
    • /
    • pp.33-41
    • /
    • 2001
  • 최근 멀티미디어 분야 중에서 가장 중요한 기술 중의 하나가 압축이다. 오디오 파일들은 인터넷을 중심으로 급속히 전파되어가고 있으며, 그 중에서 가장 유명한 것이 MP-3(MPEC-1 Layer3)인데, MP-3는 128Kbps에서 CD음질을 얻을 수 있지만 64Kbps 이하에서는 음질이 급속히 떨어진다. 반면에 MPEG-2 AAC(Advanced Audio Coding)는 MPEG-1과 호환성을 무시하지만 MP 3보다 1.4배의 높은 압축 율을 갖으며, 최대 7.1채널과 96KHz의 샘플 율을 갖는다. 본 논문에서는 MPEG-2 AAC 인코더 부분에서 막대한 연산 량을 갖는 심리음향 모델을 최적화하여 AAC 인코딩 연산 량을 감소시키며 처리속도를 증가하는 알고리즘을 제안한다. 심리음향 모델 최적화 응용 프로그램은 C++언어를 이용하여 구현하였으며, 실험결과 심리음향 모델은 SMR(Signal to Masking Ratio)을 위하여 44.1KHz의 샘플 율을 갖고 2048포인트의 FFT(Fast Fourier Transform)연산을 수행하며, 인코더 블록의 제어를 위하여 서브밴드 필터에 각각의 엔트로피 값들이 입력된다. 제안된 심리음향 모델은 비 예측성 값의 최적화로 인하여 빠른 속도로 수행되었다. 또한 비 예측성 값을 순음지수로 변화 시, 고 주파수 영역의 순음지수 값의 최적화로 연산처리 속도가 증가하였다.

  • PDF

인터넷 환경에서 FEC 기능이 추가된 AMR음성 부호화기를 이용한 오디오 스트림 전송 (Audio Stream Delivery Using AMR(Adaptive Multi-Rate) Coder with Forward Error Correction in the Internet)

  • 김은중;이인성
    • 한국통신학회논문지
    • /
    • 제26권12A호
    • /
    • pp.2027-2035
    • /
    • 2001
  • 본 논문에서는 ETSI와 3GPP에서 차세대 이동통신 IMT-2000 서비스의 음성부호화기의 표준으로 채택한 AMR을 인터넷을 통한 멀티미디어 서비스에서 사용하기 위해 부가 정보를 이용한 손실 패킷 복구 방법이 첨가된 전송방법을 제시한다. 인터넷과 같은 패킷 교환 망에서의 음성 통신에서 과도한 패킷 손실은 급격한 음질 저하를 유발한다. 본 논문에서는 음성 패킷 데이터를 순방향 오류정정(FEC)의 부가 정보로 사용하고 연속 패킷 손실이 발생하였을 경우 오류 은닉방법을 사용하여 패킷 손실에 의한 음질 저하를 개선하는 방법을 제안한다. 순방향 오류정정방법 중 부가 음성 정보를 원래의 음성정보와 함께 보냄으로써 손실된 음성은 부가 음성 정보를 이용해 복구할 수 있다. 본 연구에서 사용한 AMR 음성 부호화기는 CELP기반의 음성 부호화기 이므로 음성 부호화기의 특징을 이용해 2개 이상의 군집오류가 발생했을 경우 패킷 손실이 일어나기 전후의 데이터를 이용해서 손실된 패킷으로 인한 영향을 최소로 하는 오류은닉 방법을 사용하였다. 제안된 방법의 성능을 평가하기 위해 AMR 부호화기의 고음질 압축 방법인 12.2 kbit/s 모드로 전송하는 방법과 ITU-T 표준안인 CS-ACELP로 전송하는 방법을 SNR과 MOS 측정을 통해 비교하였다. 제안된 방법이 10%의 평균 패킷 손실률에서 부호화기 자체의 오류은닉 기술을 적용한 AMR - 12.2 kbit/s 모드보다 MOS값에서는 1.1, SNR값은 5.61 dB 높았으며, 제안된 방법은 20%의 손실률에서도 통신 가능한 음질을 유지하였다.

  • PDF