• 제목/요약/키워드: 음향데이터

검색결과 943건 처리시간 0.025초

영화 시나리오와 영화촬영기법을 이용한 감정 예측 시스템 (Emotion Prediction System using Movie Script and Cinematography)

  • 김진수
    • 한국융합학회논문지
    • /
    • 제9권12호
    • /
    • pp.33-38
    • /
    • 2018
  • 최근에 다양한 정보로부터 감정을 예측하여 청중에게 감독이 알리고자 하는 정보를 빠르게 전달하고자 한다. 또한, 청중은 감독의 의도를 대화 내용에 나타나는 대사뿐만 아니라, 영상내의 다양한 정보인 촬영 기법, 장면의 배경, 배경 음악 등을 통해 비대사 구간에서도 감정의 흐름을 이해하려고 한다. 본 논문에서는 대사와 같은 문맥의 상황뿐만 아니라, 촬영 영상에 담아낸 색상, 음향, 구도, 배치 등에 의해 표현된 정보를 혼합하여 감정을 추출하고자 한다. 즉, 다양한 감정 표현 기법을 대사 구간, 비대사 구간으로 나누어 학습하고 판별하여 영상의 완성도에 기여하고 새로운 변화에 빠르게 적용할 수 있는 감정 예측 시스템을 제안한다. 본 논문에서 제안한 감정 예측시스템이 변형된 n-gram 방식과 형태소 분석을 적용한 사례와 비교했을 때, 정확도는 약 5.1%, 0.4% 향상되었고, 재현율은 약 4.3%, 1.6% 향상되었다.

컨볼루션 혼합신호의 암묵 잡음분리방법 (Blind Noise Separation Method of Convolutive Mixed Signals)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.409-416
    • /
    • 2022
  • 본 논문은 시간지연 컨볼루션 혼합신호의 암묵잡음분리방법에 관한 것이다. 폐쇄된 공간에서 음향신호의 혼합모델은 다채널이기 때문에 convolutive 암묵신호분리방법을 적용하며 두 마이크 입력신호의 시간지연된 데이터 샘플들을 사용한다. 이 신호분리방법은 분리계수를 직접 계산하는 것이 아니라 역방향 모델을 이용하여 혼합계수를 산출하며, 계수의 갱신이 2차 통계적 성질에 기반한 반복적인 계산에 의해 이루어진다. 제안한 암묵신호분리의 성능을 검증하기 위해 많은 시뮬레이션을 수행하였다. 모의실험 결과, 이 방법을 사용한 잡음분리는 컨볼루션혼합에 상관없이 안전하게 동작하고, 일반적인 적응 FIR(Finite Impulse Response) 필터구조에 비해 PESQ(Perceptual Evaluation of Speech Quality)가 0.3점 개선되는 것으로 나타났다.

사용자 선택에 따른 자유 시점 비디오 서비스 기반의 통합 플레이어 시스템 구현 (Implementation of Integrated Player System based on Free-Viewpoint Video Service according to User Selection)

  • 양지희;송민기;박구만
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.265-274
    • /
    • 2020
  • 자유 시점 비디오 서비스는 사용자와의 상호작용을 통해 원하는 임의의 각도나 위치, 거리에서 시청할 수 있게 하는 기술이다. 본 논문에서는 사용자가 선택하여 시청할 수 있는 자유 시점 비디오 서비스를 Inward view, Outward view, 3D object view, First person view의 네 가지 시청 모드로 정의하였으며 하나의 플레이어에서 시청이 가능한 새로운 통합 프로그램을 개발 및 구현하였다. 아이돌 공연과 농구 경기 콘텐츠에 대해 각 시청 모드에 적합한 다시점 카메라를 설치하여 데이터를 확보하였으며, 서버에 저장된 데이터가 네트워크를 통해 스트리밍 됨으로써 시청이 가능하도록 하였다. 사용자는 자유롭게 네 가지의 시청 모드와 공간상의 위치, 각도 등을 선택할 수 있으며, 선택된 시점에 맞는 영상과 음향이 렌더링 되어 통합 플레이어에 표출된다. 이는 기존의 자유 시점 비디오 서비스를 포함한 다양한 시청 형태를 결합함으로써 사용자에게 몰입감과 현장감을 제공할 수 있을 뿐만 아니라 확장성이 있는 자유 시점 비디오 서비스 플레이어가 될 것으로 기대된다.

프레임레벨유사도정규화를 적용한 문맥독립화자식별시스템의 구현 (Realization a Text Independent Speaker Identification System with Frame Level Likelihood Normalization)

  • 김민정;석수영;김광수;정현열
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.8-14
    • /
    • 2002
  • 본 논문에서는 Gaussian mixture model을 이용한 실시간 문맥독립화자식별시스템을 구현하여 인식실험을 수행하였으며, 인식시스템의 성능을 향상시키기 위하여 화자검증시스템에서 좋은 결과를 보인 유사도 정규화(Likelihood normalization)방법을 적용하여 인식실험을 하였다. 시스템은 크게 전처리단과 화자모델생성단, 화자식별단으로 나누어진다. 전처리단에서는 화자의 발성변화를 고려하여 CMN(Cepstral mean normalization)과 Silence removal 방법을 적용하였다. 화자모델생성단에서는, 화자발성의 음향학적 특징을 잘 표현할 수 있는 GMM(Gaussian mixture model)을 이용하여 화자모델을 작성하였으며, GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법을 사용하였다. 화자식별단에서는 학습된 데이터와 테스트용 데이터로부터 ML(Maximum likelihood)을 이용하여 유사도를 계산하였으며, 이 과정에서 유사도 정규화를 적용한 경우에는 프레임단위로 유사도를 계산하게 된다. 계산된 유사도는 스코어(S$_{C}$)로 표현하였고, 가장 높은 스코어를 가지는 화자가 인식화자로 결정된다. 화자인식에서 발성의 종류로는 문맥독립 문장을 사용하였다. 인식실험을 위해서는 ETRI445 DB와 KLE452 DB를 사용하였으며, 특징파라미터로서는 켑스트럼계수 및 회귀계수값만을 사용하였다. 인식실험에서는 등록화자의 수를 달리하여 일반적인 화자식별방법과 프레임단위유사도정규화방법으로 각각 인식실험을 하였다. 인식실험결과, 프레임단위유사도정규화방법이 인식화자수가 많아지는 경우에 일반적인 방법보다 향상된 인식률을 얻을 수 있었다.

  • PDF

레일매립궤도 시스템이 적용된 판형교의 진동 및 소음특성에 대한 연구 (Research on Vibration and Noise Characteristics of Steel Plate Girder Bridge with Embedded Rail Track System)

  • 박정근;고효인;강윤석;정영도;이성태
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제23권1호
    • /
    • pp.94-101
    • /
    • 2019
  • 기존 선로구조물의 대부분은 준공된 지 상당한 시일이 경과되어 노후화가 많이 진행된 상태이다. 특히 기존 철도교량 중 판형교는 상당수가 준공으로부터 40~60년 이상 경과된 노후교량이며 도상 없이 거더에 침목이 직결되어 있어서 차량의 주행하중이 교량에 직접 전달되므로 유도상 교량과 비교하여 교량에 가해지는 충격 및 소음이 클 뿐만 아니라 동적인 충격과 진동도 상대적으로 크다. 따라서 기존선 판형교에 대한 적절한 유지관리 및 보수, 보강기술의 개발이 매우 시급하다. 본 연구에서는 기존선 판형교의 성능개선과 소음, 진동 문제 해결을 위해 기개발된 레일매립궤도 시스템의 특징을 소개하고, 레일매립궤도의 진동 및 소음 저감 성능을 평가하기 위해 길이 5m 침목이 설치되어 있는 무도상 판형교와 레일매립궤도를 적용한 판형교를 제작하여 동일한 가진 조건에 따라 발생되는 진동응답을 측정하고 분석하였다. 또한 실험에서 얻은 진동응답 데이터를 음향해석 모델의 입력데이터로 사용하여 방사소음해석을 수행하였다. 실험 및 해석 결과 레일매립궤도를 적용한 판형교가 무도상 판형교 보다 진동에서는 15.0~18.8dB정도 감소하고 소음의 경우 평균 7.7dB(A)정도 감소하는 것으로 확인되었다.

Hi, KIA! 기계 학습을 이용한 기동어 기반 감성 분류 (Hi, KIA! Classifying Emotional States from Wake-up Words Using Machine Learning)

  • 김태수;김영우;김근형;김철민;전형석;석현정
    • 감성과학
    • /
    • 제24권1호
    • /
    • pp.91-104
    • /
    • 2021
  • 본 연구에서는 승용차에서 사람들이 기기를 사용하기 위해 사용하는 기동어인 "Hi, KIA!"의 감성을 기계학습을 기반으로 분류가 가능한가에 대해 탐색하였다. 감성 분류를 위해 신남, 화남, 절망, 보통 총 4가지 감정별로 3가지 시나리오를 작성하여, 자동차 운전 상황에서 발생할 수 있는 12가지의 사용자 감정 시나리오를 제작하였다. 시각화 자료를 기반으로 총 9명의 대학생을 대상으로 녹음을 진행하였다. 수집된 녹음 파일의 전체 문장에서 기동어 부분만 별도로 추출하는 과정을 거쳐, 전체 문장 파일, 기동어 파일 총 두 개의 데이터 세트로 정리되었다. 음성 분석에서는 음향 특성을 추출하고 추출된 데이터를 svmRadial 방법을 이용하여 기계 학습 기반의 알고리즘을 제작해, 제작된 알고리즘의 감정 예측 정확성 및 가능성을 파악하였다. 9명의 참여자와 4개의 감정 카테고리를 통틀어 기동어의 정확성(60.19%: 22~81%)과 전체 문장의 정확성(41.51%)을 비교했다. 또한, 참여자 개별로 정확도와 민감도를 확인하였을 때, 성능을 보임을 확인하였으며, 각 사용자 별 기계 학습을 위해 선정된 피쳐들이 유사함을 확인하였다. 본 연구는 기동어만으로도 사용자의 감정 추출과 보이스 인터페이스 개발 시 기동어 감정 파악 기술이 잠재적으로 적용 가능한데 대한 실험적 증거를 제공할 수 있을 것으로 기대한다.

태백산국립공원에 서식하는 매미류의 생물음향 및 서식환경 분석 (Bioacoustics and Habitat Environment Analysis of Cicadas in Taebaeksan National Park)

  • 김윤재;정태준;기경석
    • 한국환경생태학회지
    • /
    • 제33권6호
    • /
    • pp.664-676
    • /
    • 2019
  • 본 연구는 국내 고산지대인 태백산국립공원에 서식하는 매미류의 생물음향 및 서식환경 분석에 목적이 있다. 매미 번식울음 녹음 데이터는 2018년 7월부터 9월까지 약 3개월간 태백산국립공원 내 대덕산계곡과 백천계곡에 녹음장치를 설치하여 24시간 매일 녹음하였다. 매미 서식분포 데이터는 2018년 8월에 태백산국립공원 탐방로에 위치한 111개소에서 소리를 녹음하였다. 기상 데이터는 기상청 태백시 기상 자료를 활용하였다. 연구 결과, 태백산국립공원에 출현한 매미류는 소요산매미, 참깽깽매미, 호좀매미, 참매미, 애매미 5종이었다. 매미별 출현 시기는 소요산매미는 7월 초순부터 7월 중순까지 울었으며, 참깽깽매미, 호좀매미, 참매미, 애매미는 7월 중순부터 9월 초순까지 울었다. 매미별 일주기 패턴은 참깽깽매미, 호좀매미, 참매미가 06~07시에 번식울음을 시작하였고, 울음 종료 시각은 3종 모두 19시 전후로 나타났다. 울음 피크 시간대는 참깽깽매미 11시, 참매미 12시, 호좀매미 13~14시경으로 나타났다. 태백산국립공원에 서식하는 매미 번식울음에 영향을 미치는 환경요인을 로지스틱 회귀분석으로 분석하였다. 분석 결과, 참깽깽매미, 호좀매미는 평균기온이 1도 높아질수록 울 가능성이 1.192배, 1.279배 높아졌다. 참깽깽매미, 참매미는 일조량이 1시간 길어질수록 울 가능성이 4.366배, 2.624배 높아졌다. 종간영향은 참깽깽매미는 참매미가 1번 울면 울 가능성이 14.620배 증가하며, 호좀매미는 참매미가 1번 울면 울 가능성이 2.784배 증가하였다. 참매미는 참깽깽매미가 울면 울 가능성이 11.301배 증가하며 호좀매미가 울면 울 가능성이 2.474배 증가하였다. 참깽깽매미와 호좀매미는 서로 영향을 주고받지 않았다. 종별 서식환경 분석 결과, 각 매미가 서식하는 지점의 평균 해발고도(Altitude)는 참깽깽매미 1,046m(780~1,315m), 호좀매미 1,072m(762~1,361m), 참매미 976m(686~1,245m)으로 나타났다. 호좀매미와 참깽깽매미는 낮은 고도에서 발견되는 참매미와 달리 700m 이하 해발고도에서 확인되지 않았다. 각 매미가 서식하는 평균 방향(Aspect)는 참깽깽매미가 166°(125~207°) 방향에서 발견되었고, 호좀매미가 100°(72~128°) 방향에서 발견되었으며, 참매미가 173°(118~228°) 방향에서 발견되었다. 매미별 분포도를 확인하였을 때, 태백산 문수봉을 기준으로 동남향 능선 밑 경사지에서 매미가 주로 분포하고 있었다. 결과를 종합하면, 태백산국립공원에 서식하는 참깽깽매미와 호좀매미는 한반도 전역에서 서식하는 참매미보다 높은 해발고도에서 서식하였다. 또한 매미가 주로 서식하는 방향은 일조량 확보가 용이한 동남쪽(100~173°) 지형으로 확인되었다.

선형 판별분석과 공통벡터 추출방법을 이용한 음성인식 (Speech Recognition Using Linear Discriminant Analysis and Common Vector Extraction)

  • 남명우;노승용
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.35-41
    • /
    • 2001
  • 본 논문에서는 선형 판별분석 (LDA: Linear Discriminant Analysis)과 공통벡터 추출방법을 이용한 음성인식방법을 제안하였다. 음성신호는 화자의 성별, 나이, 출생지, 주위 잡음, 정신적 상태, 발성기관의 구조 등과 같은 다양한 정보를 포함하고 있다. 이로 인해 같은 음성신호라 할지라도 서로 다른 화자가 발성하게 되면 서로 다른 특성을 보이게 된다. 음성신호의 이러한 성질은 같은 음성군 (class)에 포함된 공통된 특성벡터를 추출하는 일을 상당히 어렵게 한다. 음성신호에서 공통된 특징 벡터를 추출하는 방법은 KLT (Karhunen-Loeve Transformation)와 같이 선형 대수적인 접근방법이 많이 사용되어지고 있으나, 본 논문에서는 M. Bilginer et al.이 제안한 공통벡터 추출 방법을 사용하였다. M. Bilginer et al.이 제안한 방법은 주어진 훈련 음성신호들에 대하여 최적의 공통 벡터를 추출하여 주면서 공통벡터 추출에 사용된 훈련 데이터에 대해서는 100%의 인식결과를 보여준다. 그러나 공통벡터 추출을 위한 훈련 음성신호의 수를 무한히 늘릴 수 없다는 점과 공통벡터들간의 구별정보 (discriminant information)가 정의되지 않았다는 단점이 있다. 본 논문에서는 단어그룹간 (class) 구별정보를 추출된 공통벡터와 결합해 단어간의 오인식률 (error rate)을 감소시킬 수 있는 방법과 공통벡터 추출방법에 적합한 파라미터 가공 방법을 제안하였다. 공통벡터 추출방법은 음성신호의 시간 축 정규화 방법과 벡터의 차원 크기에 따라 인식시간과 인식률에 영향을 받는다. 따라서 부적절한 시간 축 정렬과 너무 큰 벡터의 차원 수는 인식률 저하 등과 같이 알고리즘의 효율성을 떨어뜨린다. 본 논문에서 제안한 방법을 사용하여 실험한 결과 알고리즘의 효율성이 증가되었으며, 기존방법보다 약 2%정도의 향상된 인식률을 얻을 수 있었다.낮추는 효과를 나타내었다.다. 이상의 결과를 통하여 추출 온도와 용매 농도에 따른 수율의 차이가 있었으며 free radical 소거 활성에서는 종자 에탄을 추출물이 과피 에탄올 추출물 보다 145배 이상의 현저히 높은 활성을 나타내었다.을 나타내었다.'Lian(연)' : repeatability, continuance, plenty and intercommunicate, 2. 'Lian(연)'-'Lian(염)': integrity, 3. 'He (하)'-'He(화)' : peace, harmony and combination, 4. 'He(하)'-'He(하)' : clear river, 5.'He(하)'-'He(하)' ; all work goes well. When the Chinese use lotus patterns in lucky omen patterns, same pronunciation and pitch of Chinese language more prominent than natural properties or the image of Buddhism. I guess that it cause praying individual's peace and happiness more serious than philosophical meaning or symbol that base in Buddhism for ordinary people.ML., -9.00~12.49 and -19.81~19.81%, respectively). Therefore, it is concluded that the two formulations are bioequivalent for both the extent and the rate of absorption after single dose administration.ation.ion.ion.ation.ion.n. fibrosis, collagen bundle) was

  • PDF

국내용 애니메이션 사운드 라이브러리 구축 방안 (A Program for Korean Animation Sound Libraries)

  • 임영규
    • 만화애니메이션 연구
    • /
    • 통권15호
    • /
    • pp.221-235
    • /
    • 2009
  • 애니메이션 영상물에서 사용되는 사운드는 거의 모두가 인위적으로 만들어진다. 많은 수의 사운드는 실제의 소리를 녹음해서 사용하기도 하고, 신디사이저와 같은 전문 음향장비로 제작된 가상적 사운드를 여러 가지 방법으로 가공하여 사용하기도 한다. 한 편의 애니메이션은 적지 않은 양의 사운드를 소비하는데, 그를 위한 제작비용 또한 만만치 않다. 이렇게 해서 만들어진 사운드들은 여러 다른 영상작품에 사용될만한 가치가 충분히 있음에도 불구하고, 그렇지 못한 것이 현실이다. 본 논문은 이러한 사운드 소스들을 현 시장상황 하에서 새로운 부가가치로 인정받을 수 있는 '디지털 콘텐츠'로 활용하는 방안에 대하여 논의해 보려한다. 현재 가장 성공적인 디지털 콘텐츠 유통모델로 인정받고 있는 미국 Apple사의 iTunes Music Store 시스템은 국내 음원시장에서의 적용이 가능하다. 연구결과 이 시스템은 사운드의 창작자가 스스로 온라인 스토어의 콘텐츠 제공자로서 역할을 주도하며, 동시에 사용자는 간편한 방법과 저렴한 비용으로 원하는 콘텐츠를 제공 받을 수 있다는 특성을 갖고 있다. 그리고 이러한 시스템을 구축 할 때 반드시 필요한 것이, 원하는 데이터를 짧은 시간 안에 검색 가능하게 해 주는 검색 시스템인데, 이 부분은 우리말의 특징을 고려하여 새롭게 디자인 되어야 하는 부분일 것이다. 본 논문에서는 위키 시스템을 활용하여, 검색 작업과 더불어 사용자 스스로가 데이터베이스를 구축하고 다른 사용자들과 그것을 공유할 수 있도록 하는 방안을 제시하려 한다. 이러한 시스템을 바탕으로 국내판 애니메이션 사운드 라이브러리라는 새로운 음원 디지털 콘텐츠로써 국내 음원시장 개척의 발판을 마련하고자 한다.

  • PDF

지능형 반응 공간 기술 개발을 위한 시스템 아키텍처 (A Study of System Architecture for Intelligent Responsive Space)

  • 염기원;이중호;이승수;엄주일;박준구;김래현;조현철;김건희;권미수;유호연;손영태;표정국;김태수;박면웅;박세형;하성도;박지형
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 3부
    • /
    • pp.854-858
    • /
    • 2006
  • 디지털화의 가속, 고속 통신 인프라의 확대 등으로 전자, 정보 통신 기기들이 단일 네트워크로 연결되어 영상 및 음향 정보를 서로 공유할 수 있으며, 생활 공간 내에서 실생활의 질 향상을 위한 지능적 정보 서비스와 자연스럽고 편한 내추럴 인터페이스 기술에 의한 지능형 반응 정보 서비스 공간 기술이 중요한 이슈로 등장하고 있다. 본 연구에서는 지능형 반응 공간의 물리적 객체로서 학교, 연구 기관 및 회사 등의 회의실을 선정한다. 그리고, 이를 대상으로 회의 참여자들이 자연스럽고 편리하게 의견 교환, 관련 자료 및 정보 처리를 할 수 있는 시스템 구축을 위한 아키텍처에 대하여 논의한다. 본 연구에서 제안하는 시스템 아키텍처는 회의와 관련된 문서나 회의 내용 등의 정보를 실감 가시화 노드로 추상화되고 메타 정보화함으로써 전체 회의 내용의 파악과 회의 정보에 대한 체계적이고 논리적인 관리를 가능하게 한다. 또한 여러 사람의 공동 작업을 필요로 하는 정보 또는 문서에 대한 동시 편집 기능과 자연스러운 동작에 의한 데이터 조작을 지원하는 실감 워크벤치 및 워크스크린 기술, 정보 핸들링의 다양성과 조작의 편리성을 위한 실감 아이콘에 의하여 자연스럽고 편리한 회의를 가능하게 한다. 그리고, 이러한 요소 기술들이 에이전트에 의해 회의 프로세스 및 요소 기술들의 시스템적 통합을 가능하게 한다.

  • PDF