• 제목/요약/키워드: Digital Audio

검색결과 625건 처리시간 0.027초

기록관리 분야에서 한국어 자연어 처리 기술을 적용하기 위한 고려사항 (Considerations for Applying Korean Natural Language Processing Technology in Records Management)

  • 김학래
    • 한국기록관리학회지
    • /
    • 제22권4호
    • /
    • pp.129-149
    • /
    • 2022
  • 기록물은 과거와 현재를 포함하는 시간적 특성, 특정 언어에 제한되지 않는 언어적 특성, 기록물이 갖고 있는 다양한 유형을 복합적으로 갖고 있다. 기록물의 생성, 보존, 활용에 이르는 생애주기에서 텍스트, 영상, 음성으로 구성된 데이터의 처리는 많은 노력과 비용을 수반한다. 기계번역, 문서요약, 개체명 인식, 이미지 인식 등 자연어 처리 분야의 주요 기술은 전자기록과 아날로그 형태의 디지털화에 광범위하게 적용할 수 있다. 특히, 딥러닝 기술이 적용된 한국어 자연어 처리 분야는 다양한 형식의 기록물을 인식하고, 기록관리 메타데이터를 생성하는데 효과적이다. 본 논문은 한국어 자연어 처리를 기술을 소개하고, 기록 관리 분야에서 자연어 처리 기술을 적용하기 위한 고려사항을 논의한다. 기계번역, 광학문자인식과 같은 자연어 처리 기술이 기록물의 디지털 변환에 적용되는 과정은 파이썬 환경에서 구현한 사례로 소개한다. 한편, 자연어 처리 기술의 활용을 위해 기록관리 분야에서 자연어 처리 기술을 적용하기 위한 환경적 요소와 기록물의 디지털화 지침을 개선하기 위한 방안을 제안한다.

DSP를 이용한 전류구동 스피커의 저주파 공진 보상 (Compensation of low Frequency Resonance in Current Driven Loudspeakers using DSP)

  • 박종필;은창수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.584-588
    • /
    • 2021
  • 음향시스템을 구성하는 스피커의 임피던스는 고정된 값으로 인식되고 있다. 그러나 스피커의 임피던스는 입력신호의 주파수 변화에 따라 계속 변화하고 그 변화량은 스피커의 공진 주파수 대역에서 매우 크다. 스피커의 음압 레벨은 스피커를 구성하는 코일에 흐르는 전류에 따라 결정되는데 스피커를 전압 구동 할 경우 변화하는 임피던스에 의해 음압 레벨의 왜곡이 발생한다. 스피커를 전류 구동 할 경우 이러한 문제는 해결되지만 저주파에서 공진의 영향으로 음압 레벨의 왜곡이 발생하는데 이는 음향시스템의 음질 저하를 가져올 수 있다. 본 논문에서는 전류구동 음향시스템의 음질 개선을 위해 DSP(Digital Signal Processing)를 이용하여 음압레벨의 왜곡을 보정하는 공진 보상회로를 제안한다. 본 논문은 스피커의 등가 모델을 이용한 음향 시스템의 전류 구동 모의실험을 통해 주파수 변화에 따른 음압 레벨 왜곡을 확인하고 이를 보정하는 회로를 제안하는 것으로 구성하였다. 제안한 회로는 상태변수필터를 이용하여 구성하였고 주파수 및 출력이 조절 가능하여 다양한 음향 시스템에 적용 가능 할 것으로 보인다.

  • PDF

지상파 UHD 방송 AV 스트림 오버헤드 분석 (Transport Overhead Analysis in Terrestrial UHD Broadcast A/V Stream)

  • 김나연;배병준
    • 방송공학회논문지
    • /
    • 제22권6호
    • /
    • pp.744-754
    • /
    • 2017
  • 본 논문에서는 기존 DTV 방식과 UHDTV의 두 가지 방식에 대한 상세한 전송 효율 비교를 위해, DTV 방송에서 오디오, 비디오, 부가 정보를 다중화하고 동기화하는 데에 널리 쓰이던 MPEG-2 TS 스트림과 새로운 방송 통신 환경에 맞추어 등장한 차세대 멀티미디어 방송 규격인 MMT, ROUTE 등 세 가지 프로토콜의 전달 오버헤드를 분석하여 비교한다. 신뢰성 있는 비교를 위해 실제 상용 UHD 방송서비스에서 제공되고 있는 ROUTE 및 MMT AV 스트림을 캡쳐하고, 이를 개발한 전달 오버헤드 분석 프로그램을 이용해 상세 결과를 도출한다. 또한, 동일한 조건에서의 비교를 위해서 UHD 스트림으로부터 추출한 ES를 DTV 표준에 적용하여 MPEG-2 TS 스트림의 오버헤드를 계산한다. 이를 종합하여 별도의 부가서비스를 제외하고 기본적인 AV 스트림만을 전송하는 경우에 프로토콜 간 전송 효율을 계산 및 분석한 결과, MMT와 ROUTE는 오버헤드가 비슷한 양상을 보이고 MPEG-2 TS는 상대적으로 작게 보임을 알 수 있었다. 그러나 MPEG-2 TS의 경우 널 패킷을 고려하지 않았으므로 이를 고려하면 상대적 오버헤드 차이는 줄어들 것으로 예상된다.

MPEG-2비트열에서의 인증 및 조작위치 검출을 위한 디지털 워터마킹 기법 (Digital watermarking algorithm for authentication and detection of manipulated positions in MPEG-2 bit-stream)

  • 박재연;임재혁;원치선
    • 대한전자공학회논문지SP
    • /
    • 제40권5호
    • /
    • pp.378-387
    • /
    • 2003
  • 디지털 워터마킹은 소유권자의 정보나 특정 코드, 혹은 패턴을 디지털화 되어 있는 정지영상, 동영상, 음성 데이터 등에 인간의 시각이나 청각으로는 감지 할 수 없도록 삽입하는 기술이다. 디지털 워터마킹은 크게 강인성 워터마킹과 연성 워터마킹으로 분류 될 수 있다. 강인성 워터마킹은 이미지나 영상에 대한 소유권자의 소유권을 보호하는 것이 주된 목적이며, 연성 워터마킹은 디지털 콘텐츠를 불법적인 변형으로부터 보호하는 것이 목적이다. 특히 준 연성(semi-fragile) 워터마킹은 잡음 첨가 혹은 압축과 같은 데이터의 전송 과정에서 자주 발생하는 비의도적 변형에 대해서는 삽입된 워터마크가 제거되지 않아야 하지만 의도적 변형에 대해서는 삽입된 워터마크가 훼손되어 검출되지 않아야 한다. 본 논문에서는 이러한 요구 사항들을 만족시키는 MPEG-2 비트열에서의 인증 및 조작위치 검출을 위한 준 연성 워터마킹 알고리즘을 제안한다. 제안된 알고리즘은 두 가지의 워터마크를 양자화 된 DCT 계수에 삽입한다. 따라서 압축된 비트스트림에 직접적으로 적용할 수 있다. 첫번째 워터마크는 해쉬 함수를 사용하여 비디오 데이터에 대한 인증을 한다. 두번째 삽입되는 워터마크는 양자화 된 DCT DC 계수를 이용하며 조작위치를 검출하는데 사용한다. 제안된 알고리즘은 비트스트림 영역에서의 트랜스 코딩에 의한 비디오 데이터의 변형과 의도적인 변형을 구별 할 수 있으며 만약 비디오 데이터에 의도적인 변형이 있었을 경우 인트라 프레임에 대해서는 변형된 위치를 블록 단위로 검출 가능하다. 또한 제안된 알고리즘은 가역적 특성을 갖고 있기 때문에 비디오 데이터에 변형이 없었을 경우에는 원래의 데이터를 복원 할 수 있다.

독일 공영방송 온라인 서비스의 법적 한계 탈피와 제3의 미디어로서 위상 확립과정에 관한 연구 (A Study on the Overcoming of the Legal Limits and the Status-Consolidating of the Online Services of the German Public Broadcasting System as the Third Media)

  • 고수자
    • 한국언론정보학보
    • /
    • 제47권
    • /
    • pp.74-95
    • /
    • 2009
  • 독일 공영방송은 80년대 중반 이원방송 제도 도입 시 연방헌법재판소에 의해 국민 각계각층의 의견을 반영하여 다양성을 보존해야 하는 방송의 '기본적 공급과제'(Grundver-sorgungsaufgabe)를 부여받았고 이 과제수행을 위해 수신료에 의한 재정 지원과 발전이 보장되어 있다. 90년대 독일 공영방송은 디지털 전문채널의 확대와 적극적 온라인 서비스 활동으로 융합 환경에 대응해왔고 이는 지속적 수신료 인상의 주요 동인으로 비판의 대상이 된 것이다. 법적 근거가 있는 공영방송의 디지털 전문채널에 비해 매스커뮤니케이션인 방송을 대상으로 하는 기본적 공급과제의 연계기능으로서 온라인 서비스는 법적 한계가 있는 것이다. 대외적으로는 유럽연합의 공영방송 수신료에 대한 국가보조 금지 통제와 타협, 국내적으로는 공영방송 수신료 인상폭의 축소 결정과 이 과정에 대한 국가의 개입으로 2007년 위헌으로 판결된 제9차 수신료 판결을 거치며 결국 공영방송 온라인 서비스는 TV와 라디오에 이어 기본적 공급과제에 속하는 제3의 미디어로서 위상이 확립되었다. 2009년 6월 1일자로 공포된 제12차 개정 방송국가협약에서 수신료 판결, 공익성 검증 도입, 유럽연합 시청각미디어서비스 지침의 독일국내법 전환 등 3차원의 법제화가 단행되었다. 유럽연합의 영향으로 독일 방송계의 지각변동기 일어난 이 과정은 융합시대에도 변할 수 없는 독일 고유의 공익적 방송환경 유지 의지를 현재의 상황에서 법적으로 관철한 것이며 이는 신자유주의 확신추세 속에서 융합 환경에 상응하는 우리나라의 공익적 규제체계 마련에 이론적, 법적 논거가 될 수 있다.

  • PDF

이중 편파 MIMO를 쓰는 DVB-T2 시스템의 비트 매퍼 성능 분석 (Performance Analysis of a Bit Mapper of the Dual-Polarized MIMO DVB-T2 System)

  • 강인웅;김영민;서재현;김흥묵;김형남
    • 한국통신학회논문지
    • /
    • 제38A권9호
    • /
    • pp.817-825
    • /
    • 2013
  • 초고해상도의 비디오와 다채널 오디오를 통한 극사실적인 방송 서비스를 지향하는 UHDTV (Ultra-High Definition TeleVision)가 차세대 방송 표준으로 논의되고 있으나 기존의 지상파 방송 시스템의 데이터 전송률이 UHDTV 방송 서비스의 요구 전송률에 크게 미치지 못하기 때문에 새로운 지상파 방송 시스템의 개발 또는 현재 시스템의 전송률 증가에 대한 연구가 필요한 상황이다. 이를 위해 기존의 DVB-T2 (Digital Video Broadcasting-2nd generation Terrestrial) 시스템에 고차 성상 변조 및 이중 편파 안테나를 이용한 다중 입출력 시스템을 적용하여 데이터 전송량을 증가시키는 연구가 진행되고 있다. 비정규 LDPC (Low-Density Parity Check) 부호를 사용하는 DVB-T2에 기반한 다중 입출력 시스템의 성능을 최적화하기 위해, 다중 입출력 시스템을 위한 최적의 비트 매퍼 설계에 대한 연구가 필요하다. 그러나 현재까지 진행되어 온 비트 매퍼 설계는 단일 입출력 시스템에 대해 국한되어 있다. 따라서 본 논문에서는 다중 입출력 시스템의 위한 최적의 비트 매퍼를 설계하기 위한 사전 연구로, 이중 편파 다중 입출력 시스템의 VND (Variable Node Degree) 분포를 나타내는 파라미터를 새롭게 정의하고 정의된 파라미터에 따른 시스템의 수신 성능을 분석하였다.

미디어 콘텐츠의 시장가치 산정을 위한 가치평가 프레임워크 개발 (Development of Valuation Framework for Estimating the Market Value of Media Contents)

  • 성태응;박현우
    • 서비스연구
    • /
    • 제6권3호
    • /
    • pp.29-40
    • /
    • 2016
  • 20세기 후반 이후 영상, 음성, 부호, 문자 등의 디지털 데이터에 IT 기술을 융합 적용하여 디지털포맷으로 상품화된 미디어 콘텐츠의 시장가치를 높이려는 많은 노력이 있어 왔다. 그렇다면 미디어에서 언급하는 드라마 '태양의 후예' 혹은 애니메이션 영화 '겨울왕국'에 대한 시장가치는 어떠한 기준과 방법론으로 산출할 수 있을까? 현재까지 미디어 콘텐츠 가치평가 프레임워크나 시스템 개발 등에 대한 연구가 전무한 실정에서, 본 논문에서는 영화, 온라인게임, 방송광고, 애니메이션 등 4가지 미디어 유형에 대한 콘텐츠 가치평가 프레임워크를 정형화하고 제시함으로써, 향후 콘텐츠 이전거래, 투자적정성 검토 등 다양한 목적을 위한 실용적인 가치평가모형을 제안하고자 한다. 따라서, 여기서는 미디어 콘텐츠 유형별로 제작(개발)비용을 포함한 현금흐름(cash flow: C.F.)의 산출방안을 제시하고, 이와 연관된 기타 가치평가 핵심변수요인(경제적 수명, 할인율, 콘텐츠 기여도 및 로열티율)에 관한 참조정보 D/B를 제시하여, 기존 무형자산 평가시에 적용되었던 수익접근법 및 로열티공제법 방식의 가치평가 개념을 활용한 미디어 콘텐츠 가치평가 프레임워크를 개발하고 제안한다.

DMB 응용을 위한 10b 25MS/s $0.8mm^2$ 4.8mW 0.13um CMOS A/D 변환기 (A 10b 25MS/s $0.8mm^2$ 4.8mW 0.13um CMOS ADC for Digital Multimedia Broadcasting applications)

  • 조영재;김용우;이승훈
    • 대한전자공학회논문지SD
    • /
    • 제43권11호
    • /
    • pp.37-47
    • /
    • 2006
  • 본 논문에서는 Digital Video Broadcasting (DVB), Digital Audio Broadcasting (DAB) 및 Digital Multimedia Broadcasting (DMB) 등과 같이 저전압, 저전력 및 소면적을 동시에 요구하는 고성능 무선 통신 시스템을 위한 10b 25MS/s $0.8mm^2$ 4.8mW 0.13um CMOS A/D 변환기 (ADC)를 제안한다. 제안하는 ADC는 요구되는 해상도 및 속도 사양을 만족시키면서 동시에 면적 및 전력 소모를 최소화하기 위해 2단 파이프라인 구조를 사용하였으며, 스위치 기반의 바이어스 전력 최소화 기법(switched-bias power reduction technique)을 적용하여 전체 전력 소모를 최소화하였다. 입력단 샘플-앤-홀드 증폭기는 낮은 문턱전압을 가진 트랜지스터로 구성된 CMOS 샘플링 스위치를 사용하여 10비트 이상의 해상도를 유지하면서, Nyquist rate의 4배 이상인 60MHz의 높은 입력 신호 대역폭을 얻었으며, 전력소모를 최소화하기 위해 1단 증폭기를 사용하였다. 또한, Multiplying D/A 변환기의 커패시터 열에는 소자 부정합에 의한 영향을 최소화하기 위해서 인접신호에 덜 민감한 3차원 완전 대칭 구조의 커패시터 레이아웃 기법을 제안하며, 기준 전류 및 전압 발생기는 온-칩으로 집적하여 잡음을 최소화하면서 필요시 선택적으로 다른 크기의 기준 전압을 외부에서 인가할 수 있도록 설계하였다. 또한, 다운 샘플링 클록 신호를 사용하여 바이어스 전류를 제어함으로써 10비트의 해상도에서 응용 분야에 따라서 25MS/s 뿐만 아니라 10MS/s의 동작 속도에서 더 낮은 전력 사용이 가능하도록 하였다. 제안하는 시제품 ADC는 0.13um 1P8M CMOS 공정으로 제작되었으며 측정된 최대 DNL 및 INL은 각각 0.42LSB 및 0.91LSB 수준을 보인다. 또한, 25MS/s 및 10MS/s의 동작 속도에서 최대 SNDR 및 SFDR이 각각 56dB, 65dB이고, 전력 소모는 1.2V 전원 전압에서 각각 4.8mW, 2.4mW이며 제작된 ADC의 칩 면적은 $0.8mm^2$이다.

사운드에 반응하는 시청각적인 인터랙티브 아트에 관한 연구 (A Study on Audio-Visual Interactive Art interacting with Sound -Focused on 21C Boogie Woogie)

  • 손진석;양지현;김규정
    • 만화애니메이션 연구
    • /
    • 통권35호
    • /
    • pp.329-346
    • /
    • 2014
  • 미술은 한 사회의 정치, 경제, 사회, 문화가 만들어낸 시대적 산물이다. 최근의 디지털 매체의 발전은 예술에서 표현을 확장하는데 기여하였다. 디지털 매체는 이미지뿐만 아니라 소리나 물리적 지각 반응을 예술 창작의 한 요소로써 활용하는 것을 가능하게 한다. 또한 디지털 매체는 이미지, 소리, 빛, 그리고 다양한 조형 요소들 간의 재 융합이나 관객의 물리적 반응의 결합을 통해서 작품과 관객과 상호소통적인 공감각적이고 시지각적인 환경을 창출하도록 돕는다. 본 연구에서는 최근에 소리에 반응하는 다양한 미디어아트 작품들이 제작되고 있는데, 주로 관객이나 외부의 자극으로부터 발생되는 소리의 물리적 데이터를 시각화하는 작업에 초점을 두고 시지각적 관점에서 소리의 반응에 따른 데이터의 시각화와 작품의 이미지와 관객의 반응 관계 등을 분석하였다. 외부의 소리로부터 생성되는 물리적 데이터는 여러 가지 관점에서 분석될 수 있다. 예를 들면, 음성이나 외부 소리의 고저(pitch), 음량, 또는 주파수 분석을 통해서 데이터 분류가 가능하다. 본 연구자는 관객의 음성이나 외부의 물리적 자극을 통해서 발생되는 소리의 주파수를 분석하여 이에 상응하여 발광하는 LED기반 시각화 연구를 통해서 최근 새로운 미디어아트의 가능성을 모색하고, 실시간으로 생성될 수 있는 물리적 데이터들을 빛(LED)의 환영적 특성으로 변환함으로써 우연하게 관객에 반응하여 생성되는 다양한 시각이미지의 연출 가능성을 탐구하였다. 결과적으로 연구자는 사운드에 반응하는 시지각적인 인터랙티브 작품을 구현해보기 위하여 피에트 몬드리안(Piet Mondrian, 1872~1944)의 브로드웨이 부기우기(Broadway Boogie Woogie, 1942~3)작품을 모티브로 삼았다. 몬드리앙은 회화의 본질적인 표현 요소들을 단순화하는 작업으로 불필요하다고 생각된 요소들을 하나씩 제거하여 색, 수직선, 수평선으로 대상을 추상화시킴으로써 그 대상의 본질에 다가가고자 하였다. 연구자는 몬드리앙의 이러한 단순화된 구성을 외부의 소리 자극을 단순화하여 빛(LED)의 요소로 재현하는 시각적 표현의 메타포로 사용하였고, 몬드리앙의 정적 구성에서 빛과 소리의 공감각적인 표현을 극대화하는 동적 구성으로의 관객의 참여를 유도하는 환경을 구현해 보았다.

Wearable Computers

  • Cho, Gil-Soo;Barfield, Woodrow;Baird, Kevin
    • 섬유기술과 산업
    • /
    • 제2권4호
    • /
    • pp.490-508
    • /
    • 1998
  • One of the latest fields of research in the area of output devices is tactual display devices [13,31]. These tactual or haptic devices allow the user to receive haptic feedback output from a variety of sources. This allows the user to actually feel virtual objects and manipulate them by touch. This is an emerging technology and will be instrumental in enhancing the realism of wearable augmented environments for certain applications. Tactual displays have previously been used for scientific visualization in virtual environments by chemists and engineers to improve perception and understanding of force fields and of world models populated with the impenetrable. In addition to tactual displays, the use of wearable audio displays that allow sound to be spatialized are being developed. With wearable computers, designers will soon be able to pair spatialized sound to virtual representations of objects when appropriate to make the wearable computer experience even more realistic to the user. Furthermore, as the number and complexity of wearable computing applications continues to grow, there will be increasing needs for systems that are faster, lighter, and have higher resolution displays. Better networking technology will also need to be developed to allow all users of wearable computers to have high bandwidth connections for real time information gathering and collaboration. In addition to the technology advances that make users need to wear computers in everyday life, there is also the desire to have users want to wear their computers. In order to do this, wearable computing needs to be unobtrusive and socially acceptable. By making wearables smaller and lighter, or actually embedding them in clothing, users can conceal them easily and wear them comfortably. The military is currently working on the development of the Personal Information Carrier (PIC) or digital dog tag. The PIC is a small electronic storage device containing medical information about the wearer. While old military dog tags contained only 5 lines of information, the digital tags may contain volumes of multi-media information including medical history, X-rays, and cardiograms. Using hand held devices in the field, medics would be able to call this information up in real time for better treatment. A fully functional transmittable device is still years off, but this technology once developed in the military, could be adapted tp civilian users and provide ant information, medical or otherwise, in a portable, not obstructive, and fashionable way. Another future device that could increase safety and well being of its users is the nose on-a-chip developed by the Oak Ridge National Lab in Tennessee. This tiny digital silicon chip about the size of a dime, is capable of 'smelling' natural gas leaks in stoves, heaters, and other appliances. It can also detect dangerous levels of carbon monoxide. This device can also be configured to notify the fire department when a leak is detected. This nose chip should be commercially available within 2 years, and is inexpensive, requires low power, and is very sensitive. Along with gas detection capabilities, this device may someday also be configured to detect smoke and other harmful gases. By embedding this chip into workers uniforms, name tags, etc., this could be a lifesaving computational accessory. In addition to the future safety technology soon to be available as accessories are devices that are for entertainment and security. The LCI computer group is developing a Smartpen, that electronically verifies a user's signature. With the increase in credit card use and the rise in forgeries, is the need for commercial industries to constantly verify signatures. This Smartpen writes like a normal pen but uses sensors to detect the motion of the pen as the user signs their name to authenticate the signature. This computational accessory should be available in 1999, and would bring increased peace of mind to consumers and vendors alike. In the entertainment domain, Panasonic is creating the first portable hand-held DVD player. This device weight less than 3 pounds and has a screen about 6' across. The color LCD has the same 16:9 aspect ratio of a cinema screen and supports a high resolution of 280,000 pixels and stereo sound. The player can play standard DVD movies and has a hour battery life for mobile use. To summarize, in this paper we presented concepts related to the design and use of wearable computers with extensions to smart spaces. For some time, researchers in telerobotics have used computer graphics to enhance remote scenes. Recent advances in augmented reality displays make it possible to enhance the user's local environment with 'information'. As shown in this paper, there are many application areas for this technology such as medicine, manufacturing, training, and recreation. Wearable computers allow a much closer association of information with the user. By embedding sensors in the wearable to allow it to see what the user sees, hear what the user hears, sense the user's physical state, and analyze what the user is typing, an intelligent agent may be able to analyze what the user is doing and try to predict the resources he will need next or in the near future. Using this information, the agent may download files, reserve communications bandwidth, post reminders, or automatically send updates to colleagues to help facilitate the user's daily interactions. This intelligent wearable computer would be able to act as a personal assistant, who is always around, knows the user's personal preferences and tastes, and tries to streamline interactions with the rest of the world.

  • PDF