• 제목/요약/키워드: 음성 동기화

검색결과 76건 처리시간 0.026초

ATM(비동기전송모드)의 원리

  • 유재우
    • 정보화사회
    • /
    • 통권109호
    • /
    • pp.70-73
    • /
    • 1997
  • B-ISDN은 전송모드로서 ATM(Asynchronous Transfer Mode)를 사용하는 것으로 되어 있다. 전송모드란 신호를 다중화.전송.교환하는 방법을 말한다. 예를 들어 전화망에서 취급하는 정보는 전화음성으로 사용하는 법이 대충 정해져 있기 때문에 그것에 맞는 전송모드를 사용하면 좋다. 예컨대 디지탈 전화망의 경우 동기다중에서 회선교환이라는 구성이 있다. 이것을 동기전송모드(STM : Synchronous Transfer Mode)라 하고 있다. 이에반해 여러가지 정보를 취급하는 B-ISDN에서는 STM은 효율이 나쁘게 되어 새로운 전송모드가 필요하게 되었다.

  • PDF

클라이언트-서버 구조를 기반으로 한 민속놀이 안내 도우미 시스템의 설계 및 구현

  • 강오한;김병만
    • 한국산업정보학회논문지
    • /
    • 제3권1호
    • /
    • pp.23-36
    • /
    • 1998
  • 본 논문에서는 전통 민속놀이를 동영상 및 안내음성으로 초고속통신망을 통하여 전송하고 상영할수 있는 클라이언트-서버형 민속놀이 안내 도우미 시스템의 구현 기술을 설명한다. 사용자가 마우스나 간단한 자연어를 통하여 보고자 하는 민속놀이나 요구사항을 입력하면 클라이언트는 서버에게 이를 전송하고 , 서버는 이런 조건을 만족하는 민속놀이의 동영상 및 안내음성을 초고속통신망을 통하여 클라이언트에게 전송하여 상영한다. 클라이언트-서버 시스템의 많은 기능들이 웹(WWW) 서버 프로그램과 브라우져(Browser0에서 기본 기능으로 제공되므로, 시스템의 구현에 이들 기능을 활요하였다. 클라이언트-서버형 도우미 시스템에서는 멀티미디어 데이터를 생성하는 기본기능외에도 멀티미디어 데이터의 동기화,키워드를 이용한 검색, 음성인식, 탐색(navigation)등의 다양한 기능을 사용자의 질의에 맞게 동작되도록 구현하였다.

교수와 학습자간의 행동 동기화를 이용한 웹 기반의 실시간 원격 강의 시스템 (A Web-based Remote Instruction System on Real-time using Action Synchronization between the Instructor and Learners)

  • 이부권;박규석;서영건
    • 한국멀티미디어학회논문지
    • /
    • 제3권6호
    • /
    • pp.611-616
    • /
    • 2000
  • 일반적으로 강의에서 가장 중요한 내용 전달 매체는 음성이며 다음으로 도큐먼트이다. 실제로 많은 원격 강의 기법에서 동영상을 제공하려고 하지만 네트워크 대역폭의 제한으로 인하여 만족할 만한 결과를 얻지 못하고 있다. 또한 특별한 브라우저를 사용하지 않고 웹 상에서 불특정 다수의 사용자들이 접근하도록 하기위해 웹 브라우저를 사용하고 있다 이와같이 동영상이나 음성과 같은 연속 미디어를 제공하기 위해서 네트워크의 제한으로 인하여 만족스럽지 못한 강의 내용을 제공하고 있으며, 웹 브라우저를 사용하게 되면 대체로 도큐먼트(웹 페이지) 위주의 강의 자료를 제공할 뿐이다. 따라서, 본 논문에서는 정보 전달 매체 중에서 가장 중요한 음성과 도큐먼트를 이용하여 웹 상에서 실시간 원격 강의 시스템을 제안한다. 여기에 사용된 부가기법으로는 교수와 학습자간의 웹 브라우저 동기화와 펜을 이용하며, 교수자는 자신의 컴퓨터를 이용하여 도큐먼트를 보면서 강의하고, 학습자는 교수자가 보고 있는 도큐먼트와 같은 것을 보면서 강의를 듣게 된다

  • PDF

자기피드백 마스킹 기법을 사용한 카오스 음성비화통신 (Chaotic Speech Secure Communication Using Self-feedback Masking Techniques)

  • 이익수;여지환
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.698-703
    • /
    • 2003
  • 본 논문에서는 카오스 신호를 이용하여 음성신호의 보안전송을 위한 아날로그 비화통신 시스템을 제안하고 통신성능을 분석하였다. 기존의 카오스 동기화 및 카오스 변조통신 알고리즘을 개선하여 통신환경에서 발생하는 다양한 조건들을 적용하여 음성신호의 복원능력을 모의실험 하였다. 일반적인 PC(Pecora & Carroll) 제어기법과 제안한 SFB(Self-FeedBack) 마스킹 기법을 사용하여 송신단에서 음성신호를 카오스 신호로 마스킹하여 변조하고, 통신채널에 잡음신호를 추가하여 전송하였다. 수신단에서는 카오스 응답시스템을 이용하여 음성신호를 복조하고, 복원성능을 계산하기 위하여 아날로그 복원 에러 신호의 평균전력을 제안하여 계산하였다. 실험결과 마스킹 정도, 파라미터들의 민감성, 채널잡음 등에 대하여 PC 제어기법보다 피드백 제어기법의 복원성능이 우수함을 정량적인 데이터로 확인할 수 있었다. 또한 로렌쯔 카오스 비화통신시스템에 사용할 경우 파라미터들의 조합으로 암호키를 구성해야 하므로 파라미터 변화율에 대응하는 복원에러율의 관계를 모의실험 값으로 구하였다.

시간-주파수영역에서의 새로운 피치검출 방법 (A New Pitch Detection Method in time-Frequency Domain)

  • 김종국;최호진;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.805-808
    • /
    • 2001
  • 음성인식, 합성 및 분석과 같은 음성신호처리 분야에 있어서 기본주파수 즉, 피치를 정확히 검출하는 것은 중요하나 만일 음성신호의 기존주파수를 정확히 검출할 수 있다면 음성인식에 있어서 화자에 따른 영향을 줄일 수 있기 때문에 인식의 정확도를 높일 수 있고, 음성합성 시에 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석시 피치에 동기 시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 따라서 제안한 논문에서는 시간영역처리에서 시간영역파형에서 먼저 성도성분이 제거된 성문특성 즉 피치주기 성분을 강조하기 위해 음성신호의 기울기를 이용한 Positive 센터 클리핑를 수행하고 주파수 영역에서는 원신호의 스펙트럼과 센터클립된 신호의 스펙트럼과의 Peak-Fiting을 수행하고 선형 인터폴래이션(스무딩)을 통해 평탄화된 스펙트럼을 얻었다. 결과적으로 유성음 구간과 음성이 변하는 전이구간에서 G-peak가 강조된 더욱 정확한 Pitch를 검출할 수 있었다.

  • PDF

멀티미디어 동기화 및 표현을 위한 SMIL 저작 시스템 (SMIL Authoring System for Multi-media synchronization and representation)

  • 함종완;진두석;최봉규;조극양;박만섭;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.653-656
    • /
    • 2009
  • 현재 초고속 통신망의 발전과 하드웨어의 발전으로 인하여 많은 멀티미디어 콘텐츠들이 인터넷상에서 아주 빠른 속도로 퍼지고 있다. 이러한 환경 때문에 멀티미디어 콘텐츠 제작 환경이 발전하고 있으며, 멀티미디어 콘텐츠들이 늘어나고 있다. 그러나 수많은 음성, 화상, 텍스트등과 같은 멀티미디어 콘텐츠의 시간과 공간적 동기화의 문제가 발생하기 시작하였다. 그래서 이러한 문제점을 해결하기 위하여 W3C(World Wide Web Consortium) 에서는 다양한 멀티미디어 콘텐츠의 표현을 구성할 수 있는 XML(Extensible Markup Language)에 기반을 둔 SMIL(Synchronized Multimedia Integration Language)이 표준으로 제안되었다. SMIL은 일련의 개별적 멀티미디어 객체를 시간과 공간적으로 동기화된 멀티미디어 표현으로 통합 할 수 있도록 한다. 본 논문에서는 다양한 멀티미디어 콘텐츠의 시간과 공간적인 동기화 하고, 통합하여 표현할 수 있도록 SMIL 저작 시스템을 설계 및 구현 하였다.

  • PDF

실시간 영상회의 시스템보안 (Security for Real-Time Desktop Video Conferencing System)

  • 이상하;장준교;신성철;김동규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.556-558
    • /
    • 1998
  • 실시간 영상회의 시스템을 인터넷상에서 다양하게 사용하려는 시도가 이루어지고 있다. 이런 부분의 연구는 오디오, 비디오 압축기법, 멀티미디어의 동기화, 다자간의 영상회의를 지원하기 위한 IP multicast 의 Mbone의 연구가 활발하게 이루어지고 있고, 통신의 회선속도가 고속화됨에 따라 인터넷에서 영상을 통한 다양한 멀티미디어 서비스가 이루어지고 있다. 개방형 분산 인터넷 통신망 환경에서의 영상회의는 영상회의 데이터인 영상 및 음성 보안에 대한 문제가 심각하게 대두된다. 본 논문에서는 실시간 영상회의에서 멀티미디어 데이터의 특성에 따른 보안 방법을 제시하고자 한다.

  • PDF

가상현실 기반 실시간 원격교육 시스템에서의 멀티미디어 통합 브라우저 설계 (Design of Integrated Multimedia Browser in Real Time Distance Learning System using Virtual Reality)

  • 김우석;박인수;박용진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.430-432
    • /
    • 2002
  • 가상현실 기반 실시간 원격교육 시스템에서는 오디오와 비디오 그리고 Presentation Slide외에 3D VRML Data를 이용하여 강의를 구성한다. 강사의 음성과 화상 외에 텍스트와 2D, 3D Graphics를 이용함으로써 강의의 효율을 높이고 있다. 이러한 실시간 강의 시스템에서 발생하는 각 미디어간의 동기화를 위해 본 논문에서는 Synchronization Event Model(SEM)을 정의하고, 이것을 기반으로 한 가상현실 기반 실시간 원격 교육 시스템에서의 멀티미디어 통합 브라우저를 설계하고 있다.

  • PDF

MPEG TS 패킷 분류 프로그램과 데이터 정보의 복원 프로그램 (A Decoding Program of MPEG TS Packet and A Restoring Program of Data Information)

  • 정명수;손승일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.646-650
    • /
    • 2005
  • 요즘 아날로그 방송에서 디지털 방송시대로 변화함에 따라 디지털 방송기술이 많이 발전되었다. 디지털 방송은 방송국으로부터 만들어지는 영상, 음성, 데이터 스트림들이 MPEG을 통해 효율적으로 압축하고 동기식으로 패킷화되어서 MPEG TS 패킷형식으로 서비스 이용자에게 위성 또는 지상파를 통해 전송되어진다. 방송되어지는 데이터 정보는 물론 그 외의 비관련 데이터도 제공되어짐으로써 서비스 이용범위도 많이 늘어나고 특히 기존의 영상과 음성위주의 방송과는 달리 사업자와 이용자간의 쌍방향으로 데이터를 송수신할 수 있는 기술이 고부가가치 사업으로 대두되고 있다. 디지털 방송을 수신해서 보기 위해서는 튜너로부터 수신되어 디지털화된 MPEG TS 패킷들을 분류해주는 과정이 필요하다. 본 연구에서는 실제 디지털 방송되었던 패킷 파일을 가지고 분류하였다. 영상 스트림과 음성 스트림을 분류하고 데이터 스트림을 분리하였다. 그리고 데이터 방송 규격의 데이터 스트림 파일을 별도로 입력하여 데이터를 분류하였다. 프로그램은 Microsoft visual c++6.0을 사용하여 구현하였다.

  • PDF

코퍼스 기반의 립싱크 알고리즘 개발 (Development of a lipsync algorithm based on A/V corpus)

  • 하영민;김진영;정수경
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.145-148
    • /
    • 2000
  • 이 논문에서는 2차원 얼굴 좌표데이터를 합성하기 위한 음성과 영상 동기화 알고리즘을 제안한다. 영상변수의 획득을 위해 화자의 얼굴에 부착된 표시를 추적함으로써 영상변수를 획득하였고, 음소정보뿐만 아니라 운율정보들과의 영상과의 상관관계를 분석하였으며 합성단위로 시각소에 기반한 코퍼스를 선택하고, 주변의 음운환경도 함께 고려하여 연음현상을 모델링하였다. 입력된 코퍼스에 해당되는 패턴들을 lookup table에서 선택하여 주변음소에 대해 기준패턴과의 음운거리를 계산하고 음성파일에서 운율정보들을 추출해 운율거리를 계산한 후 가중치를 주어 패턴과의 거리를 얻는다. 이중가장 근접한 다섯개의 패턴들의 연결부분에 대해 Viterbi Search를 수행하여 최적의 경로를 선택하고 주성분분석된 영상정보를 복구하고 시간정보를 조절한다.

  • PDF