통합 검색 | Korea Science

TMS320C32 DSP를 이용한 실시간 화자종속 음성인식 하드뒈어 모듈 구현 (Real-time implementation of speaker dependent speech recognition hardware module using the TMS320C32 DSP)

정훈;정익주
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
- /
- pp.14-22
- /
- 1998
본 연구에서는 Texas instruments 사의 저가형 부동소수점 디지털 신호 처리기인 TMS320C32를 이용하여 실시간 화자종속 음성인식 하드웨어 모듈을 개발하였다. 하드웨어 모듈의구성은 40MHz 의 TMS320C32, 14bit 코덱인 TLC32044, EPROM 과 SRAM 등의 메모리와 호스트 인터페이스를 위한 로직회로로 이루어져 있다. 뿐만 아니라 이 하드웨어 모듈을 PC 상에서 평가해보기 위한 PC 인터페이스용 보드 및 소프트웨어도 개발하였다. 음성인식 알고리즘은 C 및 어셈블리를 이용한 최적화를 통하여 계산속도를 대폭 개선하였다. 현재 인식률은 일반 사무실 환경에서 30단어에 대하여 95% 이상으로 매우 높은 편이며, 특히 배경음악이나 자동차 소음과 같은 잡음환경에서도 잘 동작한다.
PDF

LMA를 기반으로 한 캐릭터 동작의 긴장도 측정 (Measuring tensions of character motions based on LMA)

곽창섭;권지용;이인권
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (A)
- /
- pp.193-194
- /
- 2007
본 연구는 Laban이 제시한 모션 분석 기법을 이용하여 모션의 긴장도를 측정하는 방법을 제안한다. 이러한 긴장도값을 이용하면 캐릭터 모션과 배경음악간의 자동적 동기화를 위한 기준값으로 사용할 수 있다. Laban의 모션 분석 기법. 즉 LMA는 모션을 Effort라고 명명된 4개의 시공간적 요소로 나누고 각 4개의 Effort마다 2가지 상반된 기준을 제시함으로써 모션을 분석하도록 하였다. 이러한 기준을 양적으로 측정하기 위해 우리는 운동학, 역학에 기초한 수식을 제안하고 이를 통해서 계산된 실제 긴장도 값을 실험데이터에 근거하여 조정하였다. 실험을 통해 제안한 긴장도 측정 결과는 어느 정도 사람의 반응과 비슷한 정도의 순위 판별 능력을 보였다.
PDF

S4A 기반의 터치센서를 이용한 영어단어 학습용 콘텐츠 개발 (Development of English word learning contents using touch sensor based on S4A)

위지연;이준형;이형옥
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2017년도 춘계학술대회
- /
- pp.317-320
- /
- 2017
S4A(Scratch For Arduino)는 스크래치로 아두이노를 제어하는 프로그램이다. 본 연구에서는 S4A를 기반으로 하여 터치센서를 사용하고, 스크래치 언어로 구성한 간단한 게임 형식의 학습용 콘텐츠를 개발하였다. 영어를 이제 막 배우기 시작한 학생들의 동기와 흥미를 유발시키기 위해 배경음악과 점수를 사용하였다.
PDF

SNS 공유를 위한 UCC 제작 앱 개발 (The Development of UCC Production App for Sharing on the SNS)

장은겸;김정은;김형석;이경민;최경훈;이다희
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2015년도 제52차 하계학술대회논문집 23권2호
- /
- pp.155-156
- /
- 2015
대중화된 소셜 네트워크 환경에서 사용자가 제작한 콘텐츠를 빠르고 간편하게 공유할 수 있도록 하는 모바일 App을 개발하였다. 기존 사용자 영상 콘텐츠 제작 환경에서는 필요 이상의 소음과 잡음이 혼재하여 영상에서 풍기는 이미지의 감동을 저해하고 있다. 이러한 주의의 소음과 잡음으로부터 영상을 보호하도록 배경음악을 영상과 함께 재생하여 영상의 감동과 느낌을 사용자에게 전달하기 위한 App이다. 또한 소셜 네트워크 환경에 간편하게 업로드 할 수 있도록 페이스북을 통해 다른 사용자와 빠른 공유를 할 수 있다.
PDF

유화 애니메이션을 통해 재현된 고흐의 인생-Loving Vincent를 중심으로 (The Life of Van Gogh Represented in the Oil Painting Animation, )

차오이쥔;이현석
- 한국콘텐츠학회:학술대회논문집
- /
- 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
- /
- pp.131-132
- /
- 2018
빈센트 빌렘 반 고흐(1853-1890)는 후기 인상주의를 대표하는 인물이다. 후기 인상주의는 프랑스 미술사에 있어 인상주의를 뒤이은 미술 사조로 20세기 예술 중 특히 야수파와 표현주의에 지대한 영향을 끼쳤다. 반 고흐의 인생과 작품은 시대를 초월해 많은 문학, 영화, 소설, 시, 음악 등을 통해 소개되고, 재현되었다. 본 논문은 이러한 고흐의 인생과 작품세계가 유화 애니메이션을 통해 어떻게 각색되고 재현되는지 살펴보고자 한다. 이를 위해 후기 인상주의 배경과 특성 그리고 고흐의 고독한 일생 및 작품세계에 대한 문헌고찰을 진행하고, 이를 바탕으로 유화애니메이션 에 대해 사례분석을 진행한다.
PDF

딥러닝을 이용한 오디오 콘텐츠 분석 기반의 자동 음량 제어 기술 개발 (Development of Automative Loudness Control Technique based on Audio Contents Analysis using Deep Learning)

이영한;조충상;김제우
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2018년도 추계학술대회
- /
- pp.42-43
- /
- 2018
국내 디지털 방송 프로그램은 2016년 방송법 개정 이후, ITU-R / EBU에서 제안한 측정 방식을 활용하여 채널 및 프로그램 간의 음량을 맞추어 제공되고 있다. 일반적으로 뉴스나 중계와 같이 실시간으로 음량을 맞춰야 하는 분야를 제외하고는 평균 음량을 규정에 맞춰 송출하고 있다. 본 논문에서는 일괄적으로 평균 음량을 맞출 경우 발생하는 저음량의 명료도를 높이기 위한 기술을 제안한다. 즉, 방송 음량을 조절하는 기술 중의 하나로 오디오 콘텐츠를 분석하여 구간별 음량 조절 정도를 달리함으로써 저음량에서의 음성은 상대적으로 높은 음량을 가지고 배경음악 등을 상대적으로 낮음 음량을 가지도록 생성함으로써 명료도를 높이는 방식을 제안한다. 제안한 방식의 성능을 확인하기 위해 오디오 콘텐츠 분석 정확도 측정과 오디오 파형 분석을 실시하였으며 이를 통해 기존의 음량 제어 기술과 비교하여 음성 구간에 대해 음량을 증폭시키는 것을 확인하였다.
PDF

하모닉 정보를 이용한 SAOC의 보컬 신호 제거 방법에 관한 연구 (A Study on Vocal Removal Scheme of SAOC Using Harmonic Information)

박지훈;장대근;한민수
- 한국멀티미디어학회논문지
- /
- 제16권10호
- /
- pp.1171-1179
- /
- 2013
IAS는 대게 사용자가 자신의 취향에 맞는 음악을 직접 제작 및 편집 가능한 기능을 제공하는 서비스이다. SAOC는 낮은 전송률로 IAS가 가능한 다객체 오디오 코딩 기술이다. 하지만 SAOC 기법은 특정 객체를 제거하는 경우, 특히 보컬 객체를 제거하는 경우 배경음악에 보컬 객체의 하모닉이 남아있는 문제점이 있다. 그래서 본 논문은 하모닉 추출과 제거를 사용한 보컬 객체 제거 기법을 제안한다. 제안 하는 기법은 부호화기에서 추출한 하모닉 정보를 이용하여 복호화기에서 보컬 객체 신호를 다운믹스 신호에서 제거하는 기법이다. 하모닉 정보로써, 기본 주파수, MVF, 하모닉 크기를 사용한다. 성능평가로 객관적, 주관적 실험을 수행하였으며 모든 실험 결과를 통해 SAOC 기법보다 제안하는 기법이 우수함을 확인한다.
https://doi.org/10.9717/kmms.2013.16.10.1171 인용 PDF KSCI

서포트 벡터 머신과 퍼지 클러스터링 기법을 이용한 오디오 분할 및 분류 (Audio Segmentation and Classification Using Support Vector Machine and Fuzzy C-Means Clustering Techniques)

;강명수;김철홍;김종면
- 정보처리학회논문지B
- /
- 제19B권1호
- /
- pp.19-26
- /
- 2012
최근 멀티미디어 정보가 급증함에 따라 콘텐츠 관리에 대한 요구도 함께 증가되고 있다. 이에 오디오 분할 및 분류는 멀티미디어 콘텐츠를 효과적으로 관리할 수 있는 대안이 될 수 있다. 따라서 본 논문에서는 동영상에서 취득한 오디오 신호를 분할하고, 분할된 오디오 신호를 음악, 음성, 배경 음악이 포함된 음성, 잡음이 포함된 음성, 묵음(silence)으로 분류하는 정확도가 높은 오디오 분할 및 분류 알고리즘을 제안한다. 제안하는 알고리즘은 오디오 분할을 위해 서포트 벡터 머신(support vector machine, SVM)을 이용하였다. 오디오 신호의 분류를 위해서는 분할된 오디오 신호의 특징을 추출하고 이를 퍼지 클러스터링 알고리즘(fuzzy c-means, FCM)의 입력으로 사용하여 각 계층으로 오디오 신호를 분류하였다. 제안하는 알고리즘의 평가는 분할과 분류에 대해 각각 그 성능을 평가하였으며, 분할 성능 평가는 정확도율(precesion rate)과 오차율(recall rate)을 이용하였으며, 분류 성능 평가는 정확성(classification accuracy)을 사용하였다. 또한 오디오 분할의 경우는 이진 분류기와 퍼지 클러스터링을 이용한 기존의 알고리즘과 그 성능을 비교하였다. 모의 실험 결과, 제안한 알고리즘의 분류 성능이 기존 알고리즘 보다 정확도율과 오차율 면에서 모두 우수하였다.
https://doi.org/10.3745/KIPSTB.2012.19B.1.019 인용 PDF KSCI

EM 최적화를 이용한 오디오 텍스처 합성 (Audio Texture Synthesis using EM Optimization)

노창환;유민준;이인권
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2007년도 학술대회 1부
- /
- pp.274-280
- /
- 2007
오디오 텍스처 합성은 주어진 짧은 오디오 클립으로부터 임의의 길이를 갖는 새로운 오디오 클립을 생성하는 방법이다. 이는 애니메이션이나 영화에서 비디오와 정확한 동기화를 이루는 사운드 효과를, 혹은 임의의 길이를 갖는 배경 음악을 효율적으로 만들 수 있는 방법이다. 최근 Lie Lu는 주어진 예제 오디오 클립을 여러 조각으로 나눈 후, 이 조각들을 그래프 형태로 연결하고, 생성된 그래프를 탐색하면서 임의의 길이를 가지는 오디오 클립을 합성하는 방법을 제안하였다. 비교적 간단한 방법으로도 원본 오디오 클립과 비슷한 느낌의 오디오 클립을 만들어낸다는 장점이 있지만, 이는 원본 내의 여러 오디오 조각들이 단지 지속적으로 연결되는 형태로 합성되기 때문에 종종 반복되는 느낌을 받는다는 단점이 있다. 본 논문에서는 Lie Lu의 방법과는 달리 주어진 예제 오디오 클립을 직접 합성함으로써 반복성을 줄이면서도 원본과 비슷한 느낌을 갖는 결과 오디오 클립을 생성할 수 있는 방법을 제안한다. 특히 본 논문에서는 정확한 합성을 위하여 EM 최적화 방법을 사용한다. 본 논문에서 제안하는 합성 방법은 먼저 예제 오디오 클립을 일정 단위로 나누고 이렇게 나눠진 부분들을 일정 길이만큼 서로 겹쳐지게 합성하여 임의의 길이의 오디오 클립을 만든다. 그 후 만들어진 오디오 클립을 예제 오디오 클립과 부분 부분을 비교하여 확장된 오디오 클립과 최대한 비슷한 부분을 예제 오디오 클립에서 찾는다. 그 다음 찾아진 결과를 결과 오디오에 다시 합성하여 오디오 클립을 만든다. 이런 과정을 반복하여 최적화된 가장 적절한 결과값을 구한다. 이 결과는 분할된 부분들이 가장 자연스럽게 이어지는 결과가 된다. 본 논문에서는 최적화를 사용하여 오디오를 합성하기 때문에 합성 결과를 쉽게 조정할 수 있다는 장점이 있다. 최적화 문제에 특정 제약 조건을 넣음으로써 사용자가 원하는 부분의 음악이 결과 사운드의 특정 부분에 위치 할 수 있게 하고 이로써 특정 흐름을 만들어낼 수 있으며, 일부가 손실된 사운드 데이터의 복구를 가능하게 하는 등의 결과를 생성할 수 있다. EM 최적화를 사용한 오디오 텍스처 합성 방법은 기존의 합성 방법에 비해 질적인 측면에서 보다 좋은 결과를 생성할 수 있고, 비교적 반복이 덜한 패턴들을 만들어 낼 수 있다. 이를 입증하기 위해 이에 대한 사용자 설문 조사 결과가 제시된다.
PDF

아프로퓨처리즘 : 문화, 기술 그리고 연대의 상상력 (Afrofuturism : Culture, Technology and Imagination of Solidarity)

한창희
- 문화기술의 융합
- /
- 제9권5호
- /
- pp.99-104
- /
- 2023
본 연구는 아프로퓨처리즘에 대한 1) 이론적 고찰을 통해 지금까지 논의된 정의를 정리하여 보고, 2) 탐색적 사례연구를 통해, 3) 미래 기술 발전의 지향점과 관련해서 갖는 의의를 도출하고자 했다. 이를 위해, 먼저 아프로퓨처리즘에 관한 이론적 배경 및 개념적 논의를 살펴보고, SF문학·음악·미술 분야의 작품을 분석했다. 옥타비아 버틀러(Octavia Butler)의 SF문학은 노예제도의 과거를 들추어 세상과 마주하게 함으로써 타자화된 억압으로부터 흑인 자신들을 해방해야 한다는 사상을 확인케 한다. 자넬모네(Janelle Monae)의 음악은 기술을 통해 소수자가 외부와 관계맺을 수 있는 해방된 유토피아를 제시한다. 또한, 장 미셸 바스키아(Jean-Michel Basquiat)의 미술 작품은 흑인 예술인으로서 지금까지 배제되었던 흑인의 정체성을 재해석하고 나아가 확장된 공동체적 논의를 모색한다. 이와 같은 그들의 작업에 비추어, 본 논문은 아프리카 휴머니즘의 내재된 가치들이 기하급수적으로 발전하는 기술의 발전 속 타자와 타자의 관계 맺음으로 생성되는 공진화(共進化)의 실마리를 제공할 수 있다고 제안한다.
https://doi.org/10.17703/JCCT.2023.9.5.99 인용 PDF

검색결과 202건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)