• 제목/요약/키워드: speech analysis

검색결과 1,580건 처리시간 0.029초

어깨지지형 도립위(倒立位)가 기공수련(氣功修鍊) 전후(前後)의 뇌파(腦波) 및 심박변이도(心搏變移度)에 미치는 영향 (Effects of an Inverted Position on EEG and Heart Rate Variability before and after Qi-gong Training)

  • 이상남;권영규
    • 동의생리병리학회지
    • /
    • 제22권4호
    • /
    • pp.918-929
    • /
    • 2008
  • This study investigated the effects of inverted position on EEG and heart rate variability before and after Bang song gong. BSG is a training method using in qi-gong and meditation to give a convergence of consciousness on body segments in order and take a silent speech of 'song'. The subjects were the 14 university students(n=7 per group) who had not experienced any medical problem and had not practiced BSG. They took a practice of the two way of BSG training program for 30 minutes every other day for two weeks. During practicing BSG, A group took sitting position and lean sitting position by turns, B group took inverted and lean sitting position in the same way. Statistical analysis conducted by two-way ANOVA($2groups^{\ast}2periods$) with p<0.05 for average difference of EEG and HR according to position change in each group before and after BSG. In A group, EEG and HR were changeless irrespective of the change of position and BSG. On the other hand, in B group, significant changes were observed in EEG(p<0.05). ${\alpha}$ wave of inverted position were on the increase, ${\beta}$ and ${\delta}$ wave of inverted position showed smaller power after two weeks training. In the variation of HR, there were smaller variation according to the position change after BSG compared to before BSG(p<0.05). The results suggested that an inverted position may make the depth of meditation deeper, and is likely to be effective for decreasing tension of brain and the sleepiness during qi-gong training. In addition to, an inverted position seemed to promote control of blood pressure of brain. So the application of an inverted position to 'BSG' will be very helpful to achieve deeper relaxation and to obtain the desired effect from qi-gong training.

오차 역전파 알고리즘을 갖는 MLP를 이용한 한국 지명 인식에 대한 연구 (A Study on the Spoken Korean Citynames Using Multi-Layered Perceptron of Back-Propagation Algorithm)

  • 송도선;이재건;김석동;이행세
    • 한국음향학회지
    • /
    • 제13권6호
    • /
    • pp.5-14
    • /
    • 1994
  • 이 논문은 오차역전달(error back-propagation) 알고리듬을 갖는 다층구조 퍼셉트런(Multi-Layered Perceptron)을 사용하여 우리말 단어음성을 화자종속으로 기계 인식하는 실험에 관한 연구 결과다. 대상단어는 시외 자동전화 지역번호표에서 임의로 선택한 50개 지역명이며, 이 중 43개는 2음절로 구성되어있고 나머지 7개는 3음절이다. 단어를 음소나 음절별로 분리(segmentation)하지 않고, 단어의 각 부분에서 골고루 추출된 특징성분을 신경망에 입력하는 방법을 사용했다. 그렇게 함으로써 발음지속시간에 관계없는 결과를 얻을 수 있으며, 이 때 사용된 특징 성분은 선형예측분석으로 구해진 PARCOR계수다. 전체학습과 구분학습의 비교, 프레임 갯수와 PARCOR차수에 대한 인식률의 의존도, 중간층 뉴런의 갯수에 대한 인식률의 변동, 그리고 출력층 뉴런의 구성 방법에 따른 비교 등 4가지 실험을 통하여 가장 최량의 조건을 찾아보고자 하였다. 이 연구를 발전시킨다면 실시간의 화자독립 소규모어휘 음성인식이 가능해질 것으로 보인다.

  • PDF

잡음환경하의 연속 음성인식을 위한 유사음소단위 분석 (An Analysis on Phone-Like Units for Korean Continuous Speech Recognition in Noisy Environments)

  • 신광호;임수호;서준배;김주곤;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.123-126
    • /
    • 2004
  • 본 논문은 잡음환경 하에서의 효율적인 문맥의존 음향 모델 구성에 대한 기초연구로서 잡음환경 하에서의 유사 음소단위 수에 따른 연속 음성인식 성능을 비교, 평가한 결과에 대한 보고이다. 기존의 연구[1,2]로부터 연속음성 인식의 경우 문맥종속모델은 변이음을 고려한 39유사음소를 이용한 경우가 48유사음소를 이용하는 것보다 더 좋은 인식성능을 나타냄을 알 수 있었다. 이 연구 결과를 바탕으로 본 연구에서는 잡음환경에서도 효율적인 문맥 의존 음향모델을 구성하기 위한 기초 연구를 수행하였다. 다양한 잡음환경을 고려하기 위해 White, Pink, LAB 잡음을 신호 대 잡음비(Signal to Noise Ratio) 5dB, 10dB, 15dB 레벨로 음성에 부가한 후 각 유사음소단위 수에 따른 연속음성인식 실험을 수행하였다. 그 결과, 39유사음소를 이용한 경우가 48유사음소를 이용한 경우보다 clear 환경인 경우에 약 $7\%$$17\%$ 향상된 단어인식률과 문장 인식률을 얻을 수 있었으며, 각 잡음환경에서도 39유사음소를 이용한 경우가 48유사음소를 이용한 경우보다 평균 적으로 $17\%$$28\%$ 향상된 단어인식률과 문장인식률을 얻을 수 있어 39유사음소 단위가 한국어 연속음성인식에 더 적합하고 잡음환경에서도 유효함을 확인할 수 있었다.

  • PDF

문화공유지(Cultural Commons) 개념에 의한 대학도서관의 공간프로그램과 디자인방법의 특성 - 타마미술대학 도서관을 중심으로 - (Analysis of the University Library's Space Program and Design Characteristics with the Concept of 'Cultural Commons' - Focused on the Tama Art University Library -)

  • 편영희;박찬일
    • 한국실내디자인학회논문집
    • /
    • 제24권3호
    • /
    • pp.48-58
    • /
    • 2015
  • This study is to conclude a direction for Information Commons, which supports the university library in a new role. The study explains perspectives on the changing role of the university library by examining the approaches, histories, and theories practiced by various researchers on Information Commons. The study aims to discover ways of improving the library space that are dedicated to technology using Information Commons, it also examines ways of creating a unified "library space" that will support learning and access to knowledge and information. The features of Cultural Commons include making improvements to technology-centered space, and providing support to research, freedom of speech, creative approach, public freedom and collaboration, and interaction. The functions of Cultural Commons within the university library are listed: First, it supports programs that will transform the library into a social hub within the university. The space specifically blurs the boundary between the library building and its surroundings, and unifies these spaces to enhance its catalytic role in aiding social interactions and human-centered approach. Second, it supports active participation through cultural programs and provides a fluid and interactive space with virtual resources. Third, it enhances user experience to supports behaviors and activities that involve fixtures and equipment in the space to promote learning. The study notes that, with the emergence of these characteristics, the university library is changing by implementing Cultural Commons for on-campus social space and new learning. Accordingly, this implementation is expected to enhance active acceptance of the library space in the future.

테프론 막 재료의 흡음특성 및 적용효과 연구 (Sound Absorption Characteristics and Application Effect of PTFE Membrane Material)

  • 정정호;손장열;김정중
    • 한국소음진동공학회논문집
    • /
    • 제17권4호
    • /
    • pp.342-349
    • /
    • 2007
  • Following the 2002 World-Cup held in Korea, studies have been actively conducted on plans to utilize all-weather stadiums of fine figures, where large-scale spaces are available for various utilizations. In Japan, dome-type stadiums have been built and are utilizing across the whole nation not only for sports events but also variety of other large-scale events. PTFE(poly tetra fluoro ethylene) is one of the membrane material mainly used for the outer ceiling surface of membrane structures. However, there has not been enough research on the acoustical properties of PTFE membrane material which has been widely used in the multi-purpose stadiums. In this study, air permeability values and sound absorption coefficient of PTFE membrane materials were measured and evaluated in the gymnasium. From the results of measurements of sound absorption coefficient and air permeability of inner membrane materials, it was found that the sound absorption coefficient was good in the air permeability range of $5{\sim}15\;cc/cm^2/s$. Also the relation ship between air permeability and sound absorption coefficient was very high and the sound absorption coefficient was the highest in the range of $6{\sim}9\;cc/cm^2/s$. Secondly, an analysis on the measurements sound absorption characteristics of inner membrane material reveals that the overall sound absorption coefficient was stabilized(higher than 0.5 throughout the whole frequency bands) when the air space behind the membrane material was deeper than 600 mm. When PTFE sound absorptive membrane material was installed in the ceiling of gymnasium, it was confirmed that sound absorptive membrane material can reduce reverberation and increase speech intelligibility in the gymnasium.

동물 만화영상의 풍자적 표현 연구 (A Study on Satirical Expression of Animal Cartoon & Animated Cartoon)

  • 이화자
    • 만화애니메이션 연구
    • /
    • 통권9호
    • /
    • pp.266-282
    • /
    • 2005
  • 만화영상은 이미지적 속성과 언어적 속성으로 되어있으며, 유머와 풍자적 내용이 밀접하게 관계되어 있다. 그리고 영상매체에서 동물 소재로 표현되었던 풍자적 표현 기법들을 연구 ${\cdot}$ 분석한다. 그 방법으로 이론적 배경은 동물 만화 영상의 역사적 배경으로 선사시대 원시 동굴 벽화로부터 시작하여 현대의 다양한 만화영상 캐릭터 산업까지 간략한 흐름을 살펴본다. 그리고 동물 풍자적 표현 유형으로 동물 묘사의 문학적 표현의 다양한 유형을 정리해 본다. 마지막으로 문학에서의 풍자 표현 기법인 비유적 표현, 상징적 표현, 수사적 표현들의 개념을 알아보고 비교하여 작품분석을 시도한다. 이러한 시도는 기존에 개념화되었던 인문학적 분류와 새로운 시각영상예술인 만화영상매체에 의미 연결 및 결합의 기초 분석법을 제시하고, 또한 자료들을 데이터베이스화함을 목적으로 한다. 이러한 축적된 자료들은 만화영상에 창작되는 동물 캐릭터들의 내적인 풍자 속성의 이야기 생산 및 그 의미작용에 대한 세부적인 자료를 제시할 것이다.

  • PDF

자동차 음성인식 인터랙션의 안전감과 만족도 인식 영향 요인 : 에이전트 퍼소나와 사용자 경험 속성을 중심으로 (Determinants of Safety and Satisfaction with In-Vehicle Voice Interaction : With a Focus of Agent Persona and UX Components)

  • 김지현;이가현;최준호
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.573-585
    • /
    • 2018
  • 커넥티드카 시스템에서 인공지능 음성인식 인터페이스 기기를 통한 주행 안내 및 엔터테인먼트 서비스가 상용화되고 있다. 이 연구는 차량용 음성 에이전트의 개발사를 IT와 자동차 제조사로 구분하여, 운전자의 안전감과 만족도에 영향을 미치는 에이전트의 퍼소나와 사용자 경험 속성들을 탐색하는 것을 목적으로 하였다. 자동차 시뮬레이터 주행 실험에서, 참가자들은 음성인식 에이전트를 통해 엔터테인먼트와 내비게이션조작 과제를 수행하고 안전감과 만족도를 평가하였다. 회귀분석 결과 안전감에 영향을 미치는 주요 선행요인은 에이전트 제조사의 신뢰도였으며, 퍼소나 요인은 따뜻함과 매력으로 나타났고, UX요인에서는 효율성과 배려로 나타났다. 만족도에서는 선행요인 중 에이전트 제조사의 일치 여부와 운전자 성별이, 퍼소나 속성은 거리감 적음, UX 측면에서는 편리성, 효율성, 사용 용이성, 배려가 유의미한 영향 요인으로 나타났다. 이 연구의 의의와 기여점은 자율주행 환경에서 대화형 VUI를 핵심 인터랙션 모드로 발전시키기 위해 어떤 요인들을 우선해야 할 것인지 선별한 실증적 결과를 제시한 데 있다.

스파크 기반 딥 러닝 분산 프레임워크 성능 비교 분석 (A Comparative Performance Analysis of Spark-Based Distributed Deep-Learning Frameworks)

  • 장재희;박재홍;김한주;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.299-303
    • /
    • 2017
  • 딥 러닝(Deep learning)은 기존 인공 신경망 내 계층 수를 증가시킴과 동시에 효과적인 학습 방법론을 제시함으로써 객체/음성 인식 및 자연어 처리 등 고수준 문제 해결에 있어 괄목할만한 성과를 보이고 있다. 그러나 학습에 필요한 시간과 리소스가 크다는 한계를 지니고 있어, 이를 줄이기 위한 연구가 활발히 진행되고 있다. 본 연구에서는 아파치 스파크 기반 클러스터 컴퓨팅 프레임워크 상에서 딥 러닝을 분산화하는 두 가지 툴(DeepSpark, SparkNet)의 성능을 학습 정확도와 속도 측면에서 측정하고 분석하였다. CIFAR-10/CIFAR-100 데이터를 사용한 실험에서 SparkNet은 학습 과정의 정확도 변동 폭이 적은 반면 DeepSpark는 학습 초기 정확도는 변동 폭이 크지만 점차 변동 폭이 줄어들면서 SparkNet 대비 약 15% 높은 정확도를 보였고, 조건에 따라 단일 머신보다도 높은 정확도로 보다 빠르게 수렴하는 양상을 확인할 수 있었다.

웨이블릿 변환을 이용한 잡음제거기 설계 (Design of the Noise Suppressor Using Wavelet Transform)

  • 원호진;김종학;이인성
    • 한국음향학회지
    • /
    • 제20권7호
    • /
    • pp.37-46
    • /
    • 2001
  • 본 논문에서는 웨이블릿 변환을 이용한 주변 잡음제거기를 제안하였다. 기존의 고정된 시간-주파수 해상도를 가지는 단구간 푸리에 분석법 대신 다양한 시간-주파수 해상도를 제공하는 웨이블릿 분석법을 사용함으로써 시간 특성이 변하는 베이블 (Babble) 잡음에 좀더 효율적인 잡음제거 방법을 설계하였다. 본 논문에 제안된 웨이블릿 변환 잡음제거기는 스펙트럴 차감법에 기반하여 구성하였으며, 고주파 영역에서 높은 시간 해상도를 갖는 웨이블릿 마스크 패턴을 사용함으로써 시간 특성이 빠르게 변화하는 고주파 잡음에 더욱 효율적인 동작을 하도록 설계하였다. 성능평가를 위해 차량 잡음, 길거리 잡음, 베이블 잡음과 같은 이동통신에서 많이 사용하는 주변잡음에서 시험하였으며, 그 주관적 음질 평가 결과 베이블 잡음의 경우 기존의 EVRC(Enhanced Variable Rate Coder) 잡음 제거기보다 Mos (Mean Opinion Score) 0.2의 성능 개선을 이룰 수 있었다. 출력 음성의 스펙트로그램에서도 성능 개선을 확인할 수 있었다.

  • PDF

상황 정보를 활용한 동영상 문맥 광고 (Contextual In-Video Advertising Using Situation Information)

  • 이봉준;우현욱;이정태;임해창
    • 한국산학기술학회논문지
    • /
    • 제11권8호
    • /
    • pp.3036-3044
    • /
    • 2010
  • 동영상 데이터 서비스가 나날이 증가함에 따라 특정 동영상 장면에 적합한 광고를 보여주거나 추가적인 정보를 제공하려는 요구가 커지고 있다. 장면에 적합한 광고를 보여주기 위하여 동영상의 영상이나 음성 정보를 직접 이용하는 방법은 현재의 기술력으로 한계가 있고, 제목, 카테고리 정보, 요약 등의 메타데이터도 계속해서 변화하는 장면의 내용을 반영하지 못한다. 본 연구는 동영상의 대본 자막에서 추출한 장면의 상황 정보를 이용하여 주어진 동영상 장면에 적합한 광고를 자동으로 부착해 주는 새로운 동영상 문맥 광고 시스템을 제안한다. 대본 자막에서 추출한 상황 정보를 광고 검색에 이용했을 때 높은 성능 향상을 확인할 수 있었고, 이를 이용하여 사용자에게 더 적합한 광고를 보여줄 수 있다.