• 제목/요약/키워드: Audio file

검색결과 95건 처리시간 0.021초

기록의 디지털화 기준에 관한 연구 (A Study on the Criteria for Digitization of Records)

  • 임나영;남영준
    • 한국비블리아학회지
    • /
    • 제30권3호
    • /
    • pp.5-30
    • /
    • 2019
  • 본 논문은 우리나라의 기록 디지털화 기준이자 공공표준인 "NAK 26:2018(v2.0) 기록물 디지털화 기준"의 문제점과 미비점을 보완하여 원본 기록의 내용과 속성을 충실히 재현할 수 있는 디지털화 개선(안)을 제안하는 것에 그 목적이 있다. 이에 우리나라의 기록 디지털화 기준을 해외의 기록 관련 기관의 디지털화 기준, 지침, 권고사항 등과 비교분석하여 디지털파일 형태로 생산되지 않은 기록에 대한 디지털화 프로세스에 적용되어야할 기술적 기준 개선(안)을 제안하고, 이에 대한 타당성과 활용도를 검증받기 위하여 관련 전문가에게 면담을 실시하였다. 그 결과 무손실무압축방식 사용, 기록 유형 별 적절한 해상도 값 설정, 오디오 채널, 프레임 레이트, 주사방식에 대한 기준안 제안, 마이크로폼 형태에 대한 디지털화 기준 제안 등의 최종적 개선(안)을 제안하였다.

DMA 인터페이스를 갖는 블루투스 기저대역 모듈의 설계 및 구현 (Design and Implementation of a Bluetooth Baseband Module with DMA Interface)

  • 천익재;오종환;임지숙;김보관;박인철
    • 대한전자공학회논문지SD
    • /
    • 제39권3호
    • /
    • pp.98-109
    • /
    • 2002
  • 블루투스 무선 기술은 음성 및 데이터 전송을 위한 단거리 일대다중 무선 주파수 통신을 위해 제안된 범용적으로 사용 가능한 무선통신 기술이다. 블루투스는 2.4㎓ ISM 밴드에서 동작하며 약 l0m 범위의 다양한 이동 장치와 휴대용 장치를 위한 저가격의 기저대역 무선 접속을 제공한다 본 논문은 DMA 방식의 블루투스 기저대역 모듈을 개발하고 그 구조와 테스트 결과를 보인다. 개발된 모듈은 링크 컨트롤러, UART 그리고 오디오 코덱의 세가지 블록으로 구성되며 메인 프로세서 사이의 정보 전달 및 DMA지원을 위한 버스 인터페이스와 RF모듈과의 데이터 송수신을 위한 RF 인터페이스를 지원한다. DMA의 사용은 FIFO를 이용한 데이터의 송수신 방법을 사용하는 기저대역 모듈에 비하여 모듈의 구현 크기 및 데이터의 처리 속도에 있어서도 많은 차이점을 갖는다. 각 블록을 DMA를 지원하도록 설계함으로써 작은 크기의 모듈을 설계할 수 있다. 이러한 작은 크기의 모듈은 생산비용의 절감과 함께 다양한 응용분야에 사용될 수 있는 범용성을 제공한다. 또한 본 모듈은 UART를 이용한 펌웨어 업그레이드 방식을 지원하고 소프트 IP로 설계되었으며 FPGA와 ASIC으로 구현하여 개인용 컴퓨터 사이의 파일 전송과 비트-스트림 전송을 통해 테스트 되었다.

음성패턴인식 인터랙티브 콘텐츠 개발 (Interactive content development of voice pattern recognition)

  • 나종원
    • 한국항행학회논문지
    • /
    • 제16권5호
    • /
    • pp.864-870
    • /
    • 2012
  • 언어 학습 콘텐츠에서 공통적으로 가질 수 있는 문제점들을 분석하고 문제점에 대하여 음성 패턴인식기술을 적용하여 기존의 문제점을 해결하였다. 언어 학습 콘텐츠의 첫 번째 문제점은 온라인 학습 자세이다. 수업 진행은 되었지만 다른 웹 페이지를 열어 게임을 하는 등 학생들의 집중력은 떨어졌다. 두 번 째 문제점은 Speaking 학습 과정을 만들었지만 실제로 따라 읽는지 판단할 수가 없었다. 세 번 째 문제점은 학습 관리 시스템에 의한 기계적 진행이 아니라 선생님들의 평가에 의해 잘하는 학생들과 못하는 학생간의 학습 진행에 차이를 둘 필요가 생겼다. 마지막으로 가장 큰 문제는 기존에 만들어 놓은 콘텐츠들은 그대로 유지되면서 위의 문제들을 해결할 수 있어야 했다. 이러한 배경 하에 음성 패턴인식기술은 말하기 학습 전용 학습 프로그램으로 학습 진행을 위한 음성인식은 물론 학습 자체를 위한 음성인식 기능들을 모두 가지고 있으며 인식 절차에 사용된 학습자의 발화 데이터를 원하는 형태의 오디오 파일로 변경하여 서버의 특정 위치로 전송하거나 SQL서버에 등록할 수도 있으며, 또한 컴포넌트이기 때문에 그 어떠한 시스템이나 프로그램이라도 모두 적용 가능하고 이미 만들어진 콘텐츠 전체를 손상시키지 않고 쉽게 삽입하여 새로운 기능들을 사용할 수 있었다. 본 논문으로 교육 방식을 보다 인터렉티브하게 바꾸어 적극적인 수업참여가 되도록 기여하였다.

전자기록 관점에서 본 대체 불가능한 토큰(NFT) 특성 및 활용 방안 이전 및 거래 가능한 기록을 중심으로 (A Study on the Characteristics of Non-Fungible Token(NFT) and Application Plans from the Digital Records Perspective : Focused on Transferable Records)

  • 원주혜;소현기;오효정
    • 기록학연구
    • /
    • 제73호
    • /
    • pp.47-79
    • /
    • 2022
  • NFT(Non-Fungible Token)는 문자 그대로 '대체 불가능한 토큰'으로, 특정한 가상 자산을 블록체인에 기록한 디지털 파일이다. 토큰의 거래를 거치며 해당 자산의 소유권, 거래 내역 등의 이벤트가 블록체인에 기록되므로 위조와 변조가 불가능하다는 특징이 있다. 따라서 NFT는 특정한 가상 자산을 고유하게 표현할 수 있는 도구로 사용되며 이는 전자기록의 기본 속성과 깊게 관련된 측면이 있다. 본 논문은 기록관리에 NFT 기술 활용 가능성을 타진하는데 목적을 두고 디지털 저작물로서 자산의 성격을 가지며 이전 및 거래가 가능한 전자기록물에 초점을 맞추어 연구를 진행하였다. 이를 위해 먼저 NFT의 개념과 디지털 자산의 소유권 및 저작권 등 제도적 이슈, 자산으로서의 가치 증명 원리를 살펴본다. 특히, 예술, 패션, 스포츠 등 NFT가 실제로 활용되고 있는 분야에서 NFT의 특성이 어떻게 활용하고 있는지 살펴보았다. 나아가 전자기록의 특성과 NFT의 특성을 비교하여 전자기록에 적용 가능한 요소를 규명함으로써 NFT의 적용이 효과적일 것으로 예상되는 전자기록물의 유형을 파악하고, 그에 따른 활용 가능성과 기록관리 내 도입을 위한 논의점을 제시하였다.

Bi-LSTM 모델을 이용한 음악 생성 시계열 예측 (Prediction of Music Generation on Time Series Using Bi-LSTM Model)

  • 김광진;이칠우
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.65-75
    • /
    • 2022
  • 딥러닝은 기존의 분석 모델이 갖는 한계를 극복하고 텍스트, 이미지, 음악 등 다양한 형태의 결과물을 생성할 수 있는 창의적인 도구로 활용되고 있다. 본 고에서는 Niko's MIDI Pack 음원 파일 1,609개를 데이터 셋으로 삼아 전처리 과정을 수행하고, 양방향 장단기 기억 순환 신경망(Bi-LSTM) 모델을 이용하여, 효율적으로 음악을 생성할 수 있는 전처리 방법과 예측 모델을 제시한다. 생성되는 으뜸음을 바탕으로 음악적 조성(調聲)에 적합한 새로운 시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델(Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.