Search | Korea Science

Pitch and Rhythm of Rhyme for Rap Music Appreciation (랩 음악 각운의 음고와 박자)

Jeung, Mi-Sun;Lee, Chung-Min
- Proceedings of the Korean Society for Cognitive Science Conference
- /
- 2005.05a
- /
- pp.239-243
- /
- 2005
랩 음악은 음악의 특성과 발화 언어의 특성을 가지고 있으며 음악적 특징을 가진 시와도 공통점을 가진다. 이러한 유사성을 근거로 Eminem이라는 랩 가수의 freestyle음악을 음성분석 프로그램을 사용하여 분석하였다. 대상 음악이 즉석적인 발화였음에도 불구하고 각운 부분에서의 피치(pitch)와 리듬은 매우 유사한 값을 보였다. 분석 결과에서 보여준 약간의 차이 값은 인간의 지각 능력과 성향을 고려하여 봤을 때 같은 피치(pitch) 같은 리듬으로 지각하기에 충분하다고 결론 내렸다.
PDF

Analysis for Data Traffic Characteristics in 3G Mokile Communication Systems (3G 이동통신시스템에서의 데이터 트래픽 특성분석)

구혜련;임석구
- Proceedings of the Korea Multimedia Society Conference
- /
- 2004.05a
- /
- pp.421-424
- /
- 2004
음성 중심의 기존 2G CDMA/PCS 시스템과 달리 CDMA2000 및 1xEV-DO와 같은 차세대 이동통신 시스템에서 패킷 데이터 서비스가 부각됨에 따라 효율적인 망의 설계 및 디멘져닝을 위해서는 무엇보다도 데이터 트래픽의 주요 특성인 버스트(Burst)와 자기유사성(Self-similarity)이 반영된 모델이 요구된다. 본 논문에서는 차세대 이동통신 시스템에서 자기유사 특성을 갖는 트래픽의 큐잉 성능을 시뮬레이션 하였고, 그 결과를 해석적 모델과 비교하였다. 또한 Crossover point의 변화와 출력링크의 변화도 분석하였다.
PDF

Taboo Word Matching System Using a Common Multilingual Phoneme System (다국어 공통 음소 체계를 이용한 금기어 매칭 시스템)

Kim, Da-Hee;Shin, Sa-Im;Jang, Dal-Won;Lee, Jong-Seol;Jang, Sei-Jin
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2015.07a
- /
- pp.155-158
- /
- 2015
단어의 유사도 측정 알고리즘은 DB 인덱싱, 필터링, 소스코드 분석 소프트웨어, 음성 인식 등 다양한 분야에서 활용되고 있다. 하지만 기존의 단어의 유사도만 비교하는 시스템에는 발음이 비슷한 유사단어나 오타가 있는 유사단어들은 측정을 못하는 단점이 있다. 언어의 유사도 측정에서는 알파벳만으로 볼게 아니라 언어 발음의 발화적 특성 또한 고려되어야 한다. 본 논문에서는 글로벌 시장에서의 다국적 기업들의 제품이나 문화 수출 등의 도움이 되는 각 나라의 금기어와의 발화적 특성까지 고려한 단어 유사도를 측정 할 수 있는 시스템을 제안한다. 11개국의 4개 언어 총 21487개의 금기어 단어를 금기어 데이터로 사용하였다. 제안하는 방법의 성능을 평가하기 위하여 타 알고리즘과의 성능비교와 여러 나라의 다양한 언어의 사용자들로부터 사용자 평가를 수행하였고 제안하는 방법이 발음 유사도를 측정하지 않는 알고리즘보다 우수한 성능을 보임을 확인하였다.
PDF

Trends of Wi-Fi Calling Service (와이파이 콜링 서비스 동향)

Jeong, S.K.;Lee, S.W.
- Electronics and Telecommunications Trends
- /
- v.30 no.4
- /
- pp.212-218
- /
- 2015
와이파이 콜링 서비스란 Wi-Fi 네트워크 환경에서 음성전화 및 Short Message Service(SMS) 등의 이동전화서비스를 제공하는 것으로 Subscriber Identification Mobule(SM) 카드에 부여된 자신의 이동전화번호를 그대로 사용하여 음성전화 및 문자의 착 발신이 가능한 서비스이다. 아이폰6 출시 당시 와이파이 콜링 기능을 탑재하여 이슈가 된 바 있으며, 미국의 통신사업자인 T-Mobile 등이 커버리지 보완을 목적으로 적극적으로 서비스하고 있다. 본고에서는 와이파이 콜링 서비스의 특징, 유사 서비스와의 비교, 기술방식, 서비스 동향을 알아보고자 한다.
PDF

Speech Segmentation using Weighted Cross-correlation in CASA System (계산적 청각 장면 분석 시스템에서 가중치 상호상관계수를 이용한 음성 분리)

Kim, JungHo;Kang, ChulHo
- Journal of the Institute of Electronics and Information Engineers
- /
- v.51 no.5
- /
- pp.188-194
- /
- 2014
The feature extraction mechanism of the CASA(Computational Auditory Scene Analysis) system uses time continuity and frequency channel similarity to compose a correlogram of auditory elements. In segmentation, we compose a binary mask by using cross-correlation function, mask 1(speech) has the same periodicity and synchronization. However, when there is delay between autocorrelation signals with the same periodicity, it is determined as a speech, which is considered to be a drawback. In this paper, we proposed an algorithm to improve discrimination of channel similarity using Weighted Cross-correlation in segmentation. We conducted experiments to evaluate the speech segregation performance of the CASA system in background noise(siren, machine, white, car, crowd) environments by changing SNR 5dB and 0dB. In this paper, we compared the proposed algorithm to the conventional algorithm. The performance of the proposed algorithm has been improved as following: improvement of 2.75dB at SNR 5dB and 4.84dB at SNR 0dB for background noise environment.
https://doi.org/10.5573/ieie.2014.51.5.188 인용 PDF KSCI

The Development of Speech Synthesizer In Korean TTS System (한국어 문어변환 시스템 내에서의 음성 합성기 개발)

강찬희;진용옥
- The Journal of the Acoustical Society of Korea
- /
- v.12 no.2
- /
- pp.14-27
- /
- 1993
본 논문은 매 40ms 정도의 음성파형으로부터 추출된 6내지 9ms 정도의 1피치주기 파형을 합성단위로 사용하여 합성시킨 시간영역에서의합성방식을 한국어 문어 변환 시스템내에서의 음성합성기에 적용시킨 연구결과이다. 시험 결과, 4가지 유형의 한국어 음절 합성이 가능하고, 장단강약과 같은 운율요소의 제어가 용이하고, 또한 합성 알고리즘이 간단하여 실시간 처리가 가능하였으나, 문장 단위의 음성을 합성하기 위하여는 문장내에서의 다양한 피치 패턴에 대한 연구와 이의 효율적인 제어에 관한 연구가 이루어져야 할 것이다. 합성음에 대한 평가방법으로는 원음과 합성음에 대한 시간영역에서의 파형비교, 주파수 영역에서의 스펙트럼 포락선 유사성 비교 및 합성음에 대한 청취도 실험을 행하였다.
PDF

Text/Voice Recognition & Translation Application Development Using Open-Source (오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발)

Yun, Tae-Jin;Seo, Hyo-Jong;Kim, Do-Heon
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2017.07a
- /
- pp.425-426
- /
- 2017
본 논문에서는 Google에서 지원하는 오픈소스인 Tesseract-OCR을 이용한 문자/음성 인식 및 번역 앱에 대해 제안한다. 최근 한국어를 포함한 외국어 인식과 번역기능을 이용한 다양한 스마트폰 앱이 개발되어 여행에 필수품으로 자리잡고 있다. 스마트폰의 카메라기능을 이용하여 촬영한 영상을 인식률을 높이도록 처리하고, Crop기능을 넣어 부분 인식기능을 지원하며, Tesseract-OCR의 train data를 보완하여 인식률을 높이고, Google 음성인식 API를 이용한 음성인식 기능을 통해 인식된 유사한 문장들을 선택하도록 하고, 이를 번역하고 보여주도록 개발하였다. 번역 기능은 번역대상 언어와 번역할 언어를 선택할 수 있고 기본적으로 영어, 한국어, 일본어, 중국어로 번역이 가능하다. 이 기능을 이용하여 차량번호 인식, 사진에 포함된 글자를 통한 검색 등 다양한 응용분야에 맞게 앱을 개발할 수 있다.
PDF

An Algorithm for extracting English-Korean Transliteration pairs using Automatic I-K Transliteration (자동 음차표기를 이용한 영-한 음차표기 대역쌍의 자동 추출)

오종훈;배선미;최기선
- Proceedings of the Korean Information Science Society Conference
- /
- 2004.04b
- /
- pp.928-930
- /
- 2004
지금까지 기계번역과 교차언어 정보검색 등과 같은 자연언어응용에서 사용되는 번역지식을 자동으로 구축하는 연구가 활발히 진행되어 왔다. 번역지식을 자동으로 구축하는 연구는 대역사전에 등재되어 있지 않은 미등록어에 대한 대역정보를 문서에서 자동으로 획득하는 것을 목표로 한다. 최근에는 이러한 미등록어 중 음차표기 번역지식에 대한 연구가 활발히 진행되고 있다. 음차표기는 주로 영어 단어를 발음에 기반하여 비영어권의 언어로 표기하는 것을 의미한다. 음차표기된 단어들은 새로운 개념을 나타내는 신조어가 많기 때문에 사전에 등재되어 있지 않온 경우가 많다. 따라서 효과적인 번역지식 구축을 위해서는 이러한 음차표기 번역지식을 자동으로 획득하는 것은 매우 중요하다. 본 논문에서는 영-한 음차표기 대역쌍을 문서에서 자동으로 추출하는 알고리즘을 제안한다. 본 논문의 기법은 한국어 음차표기의 인식, 영-한 자동음차표기, 한국어 음차표기와 자동음차표기된 영어단어간의 음성적 유사도 비교를 통하여 음차표기 대역쌍을 추출한다. 본 논문의 기법은 약 93%의 정확률과 68%의 재현율을 나타내었다.
PDF

Classification of Sasang Constitution Taeumin by Comparative of Speech Signals Analysis (음성 분석 정보값 비교를 통한 사상체질 태음인의 분류)

Kim, Bong-Hyun;Lee, Se-Hwan;Cho, Dong-Uk
- The KIPS Transactions:PartB
- /
- v.15B no.1
- /
- pp.17-24
- /
- 2008
This paper proposes Sasang constitution classification through speech signals analysis values and comparison. For this, this paper wishes to propose Taeumin classification method of output values signals that comes out speech signal analysis to connect with process classification of Soeumin through skin diagnosis by first step in the whole system configuration to provide for objective index of Sasang constitution. First of all, these characteristic of voices wish to extract phonetic elements that each Sasang constitution groups' clear features. Also, we wish to classify Taeumin through constitution groups' difference and similarity on the basis of results value. Finally, the effectiveness of this method is verified through the experiments.
https://doi.org/10.3745/KIPSTB.2008.15-B.1.17 인용 PDF KSCI

A Study on Cut Detection of Video Retrieval Using the Color Threshold (칼라임계값을 이용한 동영상의 컷 검출에 관한 연구)

이명주;김형균;정기봉;오무성;김태성
- Proceedings of the Korea Multimedia Society Conference
- /
- 2000.04a
- /
- pp.153-156
- /
- 2000
동영상 정보는 영상정보뿐만 아니라 음성정보, 문자정보 및 각종 의미있는 정보들을 포함하고 있어서 기존의 검색방법으로는 사용자가 원하는 이미지를 찾는데 어려움이 따른다. 따라서, 본 연구에서는 동영상 정보의 효율적인 활용을 위한 색인방법으로 칼라 임계값을 이용한 컷 검출 방법을 제안하였다. 이것은 frame 간의 유사도를 측정해서 이 값이 주어진 임계값보다 작을 경우, 장면의 전환이 일어나는 곳을 컷 지점으로 검출하는 것인데, 동영상의 장면에 따른 유사도가 다를 수 있기 때문에, 컷을 구성하는 프레임들간의 칼라 임계값에 변동을 주어 최적의 컷 검출율을 구하고자 했다. 초기의 칼라 임계값은 '80'을 사용했고, 이후 frame 의 유사도가 임계값보다 클 경우, 즉 장면전환이 일어나지 않았을 경우일정한 상수 값을 초기 임계값에서 감산토록 하였다. 이러한, 과정을 거쳐 추출된 frame을 가지고 원하는 이미지를 검색하게 되면 사용자의 노력 및 검색 시간이 단축되고, 동영상 정보의 관리가 용이해진다.
PDF

Search Result 306, Processing Time 0.026 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)