• Title/Summary/Keyword: 화상 및 음성처리

Search Result 38, Processing Time 0.027 seconds

Korea Electronic Technology Institute (멀티미디어 컨텐츠의 지능형 선택/검색 시스템 구현)

  • 이종설;이윤주;박우출;정하중;조위덕
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.61-63
    • /
    • 2002
  • 멀티미디어 컨텐츠의 지능형 선택/검색 시스템(MISS: Multimedia Content Intelligent Selection/search) 는 콘텐츠를 공급하는 서버에 다량의 멀티미디어 컨텐츠들이 존재하며, 이 컨텐츠 중에서 원하는 것을 검색, 선택하는 시스템이다. 지능적 검색, 선택기능을 갖는 MISS 시스템은 인터넷 및 네트워크상에 연결된 시스템들간의 맞춤형 서비스 구현에 필요한 핵심이며, 모든 종류의 멀티미디어 콘텐츠에 적용 가능하다. 현재 WWW 서비스경우는 정보를 찾기 위하여 웹상에서 문서를 찾아주는 텍스트 기반 정보검색기술이 사용되고 있는데, 점점 우리가 접하는 정보의 형태는 텍스트와 함께 화상, 음성, 동영상 등의 멀티미디어화 및 디지털화하고 있다. 사용자들에게는 멀티미디어 데이터를 효과적으로 찾아야 하는 필요성이 증가하고 이에 따라 방대한 양의 분산된 멀티미디어 데이터를 처리할 수 있는 색인 및 검색 도구의 요구가 커지게 되었다. MISS 시스템은 WWW 서비스의 요구에도 적용될 수 있다. MISS 시스템은 다량의 동영상 콘텐츠 중에서 특정 배우, 감독등의 여러 가지 검색 조건으로 콘텐츠를 검색/선택할 수 있고, 하나의 동영상 콘텐츠 내에서 특정Video Segment를 검색할 수 있다. 본 MISS 시스템은 동영상에 대한 Search/Query를 위한DS 구조로써 MPEG-7의 User preference metadata를 이용하였다.

  • PDF

Design of a multimedia interface for the description of human error caused nuclear power plant trips (인적오류로 인한 원자력발전소 고장정지 사건묘사를 위한 멀티미디어 인터페이스 설계)

  • 박근옥
    • Proceedings of the ESK Conference
    • /
    • 1993.10a
    • /
    • pp.65-75
    • /
    • 1993
  • 원자력발전소에서 발생하는 고장정지 사건에 내포된 인적오류의 발생내용을 흥미있고 현장감 있게 묘사시킴과 동시에 종사원들의 인적오류를 저감시키기 위한 새로운 교육훈련방 법으로써 멀티미디어 기술의 사용을 고려하였다. 즉, 컴퓨터 환경하에서 숫자와 텍스트, 음 향 및 음성, 그래픽, 애니메이션, 화상 등의 미디어를 사용하여 인적오류로 인한 고장정지 사건발생의 내용을 전달하는 새로운 교육훈련 방법을 사용하는 것이다. 이를 위하여 고장정 지 사건과 관련한 원자력발전소 구성정보와 종사원의 활동정보를 입출력하기 위한 멀티미디어 인터페이스를 설계하였다. 설계는 멀티미디어 제공환경 구축과 인터페이스 운영논리 설정의 두단계로 구성한 절차에 따라 수행하였다. 멀티미디어 인터페이스는 원자력발전소 구성정보를 설계하여 저장시켜둔 퍼스널 컴퓨터 환경하에서 운영되며, 입력 및 출력의 두가지 인터페이스 를 갖는다. 입력 인터페이스는 인적 오류를 포함한 고장정지 사건의 발생내용을 숫자, 텍스트, 음성 미디어로 받아들여 출력 인터페이스에서 사용될 수 있도록 미디어 결합을 수행하고, 컴퓨터 저장장치에 저장하는 기능을 수행한다. 출력 인터페이스는 저장장치에 기록된 내용을 판독하여 고장정지의 진행경위와 인적오류의 발생내용을 숫자, 문자, 텍스트, 음성, 음향, 그래픽 애니메 이션, 정지화상으로 원자력발전소 종사원들에게 출력시켜 주는 기능을 수행한다. 멀티미디어 출력정보는 사용자가 CRT 화면에 제공되는 버튼 또는 Click Touch 메뉴를 사용함에 따라 이전, 이후의 출력정보로 전이할 수 있도록 하였다.상대적으로 중요한 검사 항목으로 나타났다. 또한 상대적 중요도 결과를 적용한 적성검사 성적이 적용하지 않은 적성검사 성적에 비해 비행성적에 대한 예측 능력이 좋은 것으로 평가되었다.al age)가 있다는 것을 의미하는 것이다. 한편, 생산현장에서는 자동화, 기계화가 진보되어 육체적인 노동이 경감된 결과, 중고령자라도 할 수 있는 작업이 많아지고 있다. 또, VDT (Visual Dislay Terminal) 작업과 같은 정보처리 작업의 수요가 증가하여 그 인재의 부족이 지적되고 있다. 따라서 중고령자의 기능을 조사하여 어떠한 작업에 적합한가를 판단하는 것이 중요한 과제로 되었다. 그러나 노동에는 많은 기능이 관여 하고, 그 내용에 따라서 요구되는 기능이 서로 다르기 때문에 노동적응능력의 기본적인 기능으로 보여지는 것에 좁혀서 작업능력의 연령증가 변화에 대하여다원적 평가를 하는 것이 실제적이라고 할 수 있다. 따라서 본 연구에서는 인간이 가지고 있는 다수의 기능중에서 수지교 치성과 연령증가와의 관계를 조사한다. 만약 연령증가 만으로 수지교치성을 평가 할 수 없는 경우에는 어떠한 요인이 수지기민성의 변화에 영향을 미치는가를 검토한다.t list)에서 자동적으로 사건들의 순서가 결정되도록 확장하였으며, 설비 제어방식에 있어서도 FIFO, LIFO, 우선 순위 방식등을 선택할 수 있도록 확장하였다. SIMPLE는 자료구조 및 프로그램이 공개되어 있으므로 프로그래머가 원하는 기능을 쉽게 추가할 수 있는 장점도 있다. 아울러 SMPLE에서 새로이 추가된 자료구조와 함수 및 설비제어 방식등

  • PDF

The Speech Enhancement of G.723.1 Vocoder by the Improvement of Pitch Accuracy Using a Flattened Energy in a Transient Period (전이구간에서의 Energy 평탄화를 통한 피치정확도 향상에 의한 G.723.1 Vocoder의 음질향상)

  • Park Won;Kim JungJin;Bae MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.59-62
    • /
    • 2000
  • 화상회의 및 인터넷폰을 목적으로 개발된 G.723.1은 CELP계열 보코더와 같이 화자의 개성정보를 위해 피치를 전송하고 있다. 하지만 안정구간과 비 안정구간의 차이를 두지 않고 처리를 하기 때문에 비 안정구간, 특히 전이구간에서 정확한 피치검출이 이루어지지 않는 이유로 음질의 열하가 발생하게 된다. 따라서 본 논문에서는 한 프레임 구간에서 에너지의 기울기로 대략적인 피치이득을 구한 다음 안정구간일 때와 프레임 내의 에너지의 기울기가 문턱 값을 넘을 때에는 기존의 방법으로 피치를 구하고 그런지 않은 경우에는 에너지를 조정하여 피치를 다시 구하는 방법을 사용하였다. 실제 음성시료에 대해 기존의 방법과 제안한 방법을 비교하기 위해 SegSNR 과 MOS를 비교하였을 때 각각 1.302(dB)와 평균 0.045 MOS가 향상되었다.

  • PDF

A Preliminary Study on the Acoustic Signal Processing for Binaural Telecommunication (현장감통신을 위한 음향신호처리 방식의 검토)

  • 강성훈
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1992.06a
    • /
    • pp.168-168
    • /
    • 1992
  • 사회활동이 활발하게 됨에 따라 사무실에서의 효율적인 업무수행을 위한 여러 가지 요구사항이 대두되고 있다. 그 일환으로 최근 기업내 회의소집 및 회의시간을 단축하고, 이동에 필요한 여행경비를 절감하기 위하여 원격 화상회의(Video Conference)나 음성회의(Voice Conference) 시스템이 주목을 받게 되었고, 이를 구축하여 활용하는 기업도 증가하고 있다. 원격회의 시스템에서는 다수인이 서로 다른 장소에서 동시에 참가하기 때문에 참가자 전원이 동일장소에 있는 것 같은 현장감을 느끼게 해주어야만 정확한 의사전달이 이루어질 수 있을 것이다. 그러기 위해서는 터미널 상호간에 입체영상정보와 입체 음향정보가 중요한 역할을 한다. 본고에서는 음향의 현장감 통신을 위하여 연구되고 있는 음상제어 방식, Stereo재생 방식, 3차원 음장재생 방식에 관한 특징을 기술하고, 그 장,단점을 비교 고찰한다. 또한 그 구성이 간단하고 다수인이 회의에 참석하기 위한 근거리 음장 재생 방식에 관한 예비실험에 관하여 보고한다.

  • PDF

MPEG Video Segmentation Using Frame Feature Comparison (프레임 특징 비교를 이용한 압축비디오 분할)

  • 김영호;강대성
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.4 no.2
    • /
    • pp.25-30
    • /
    • 2003
  • Recently, development of digital technology is occupying a large part of multimedia information like character, voice, image, video, etc. Research about video indexing and retrieval progresses especially in research relative to video. In this paper, we propose new algorithm(Frame Feature Comparison) for MPEG video segmentation. Shot, Scene Change detection is basic and important works that segment it in MPEG video sequence. Generally, the segmentation algorithm that uses much has defect that occurs an error detection according to a flash of camera, movement of camera and fast movement of an object, because of comparing former frames with present frames. Therefore, we distinguish a scene change one more time using a scene change point detected in the conventional algorithm through comparing its mean value with abutted frames. In the result, we could detect more corrective scene change than the conventional algorithm.

  • PDF

Key Distribution Protocol and Call Control for Secure ISDN (안전한 종합정보통신망을 위한 키 분배 프로토콜과 호 제어)

  • Jeong, Hyeon-Cheol;Sin, Gi-Su;Lee, Seon-U;Kim, Bong-Han;Kim, Jeom-Gu;Lee, Jae-Gwang
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.1
    • /
    • pp.195-208
    • /
    • 1997
  • ISDN is network which has been developed to integrate and transfer some information(data, video, voice). In the ISDN, security problem that threat and intrusion about important information resource increase because every information is transferred in the form of digital and access of network has patiency. In this paper, for protect important information resource, studied that apply application method and encryption system to ISDN, and system structure, ITU-T Q.931 protocol were analyzed, and proposable encryption key distribution protocol, call control with hybrid encryption system for user information privacy to provide security service.

  • PDF

A New Wideband Speech/Audio Coder Interoperable with ITU-T G.729/G.729E (ITU-T G.729/G.729E와 호환성을 갖는 광대역 음성/오디오 부호화기)

  • Kim, Kyung-Tae;Lee, Min-Ki;Youn, Dae-Hee
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.45 no.2
    • /
    • pp.81-89
    • /
    • 2008
  • Wideband speech, characterized by a bandwidth of about 7 kHz (50-7000 Hz), provides a substantial quality improvement in terms of naturalness and intelligibility. Although higher data rates are required, it has extended its application to audio and video conferencing, high-quality multimedia communications in mobile links or packet-switched transmissions, and digital AM broadcasting. In this paper, we present a new bandwidth-scalable coder for wideband speech and audio signals. The proposed coder spits 8kHz signal bandwidth into two narrow bands, and different coding schemes are applied to each band. The lower-band signal is coded using the ITU-T G.729/G.729E coder, and the higher-band signal is compressed using a new algorithm based on the gammatone filter bank with an invertible auditory model. Due to the split-band architecture and completely independent coding schemes for each band, the output speech of the decoder can be selected to be a narrowband or wideband according to the channel condition. Subjective tests showed that, for wideband speech and audio signals, the proposed coder at 14.2/18 kbit/s produces superior quality to ITU-T 24 kbit/s G.722.1 with the shorter algorithmic delay.

The Research of Improving The Performance of the G.723.1 MP-MLQ Vocoder (G.723.1 MP-MLQ 부호화기의 성능개선에 관한 연구)

  • Min SoYeon;Na DuckSn;Kim JeongJin;BAE MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.49-52
    • /
    • 1999
  • 4.8kbps 내외의 전송률에서 양호한 음질을 제공하는 CELP 계열 음성 부호화기 중에서 인터넷 폰 및 화상회의를 목적으로 개발된 G.723.1은 5.3kbps ACELP(Algebraic CELP)와 6.3kbps MP-MLQ(Multi-Pulse Maximum Likelihood Quantization) 두 개의 부호화기를 포함하고 있다[1]. 이 중 MP-MLQ는 고정 코드북 검색 시 많은 계산량으로 인해 실시간 구현에 어려움이 따르고 있다. 이러한 문제점을 개선하기 위해 본 논문에서는 유/무성음을 분리한 후 grid bit를 먼저 결정하여 코드북을 검색하는 방법 제안한다. LSP 파라미터의 분포특성을 이용하여 유/무성음을 분리한 후 무성음에 대해서는 스펙트럼 정보만 전송하고 유성음에 대해서만 코드북 검색을 수행한다. 그리고 코드북 검색 시 Grid bit를 먼저 결정하여 수행하였다. Grid bit는 짝/홀수번째 전체 펄스를 이용하여 합성한 합성음과 DC 성분이 제거된 원음과의 비교를 통하여 결정하였다. 실험 결과 전체 처리시간은 평균적으로 약 $20.55\%$ 감소하였으며 주관적 음질평가 결과 음질 열하는 거의 발생하지 않았다.

  • PDF

Dynamic Frequency Allocation in OFDMA Cellular Networks (OFDMA 셀룰러 망에서 동적 주파수 할당 방법)

  • Lee, Jong-Chan;Lee, Gi-Sung
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.14 no.6
    • /
    • pp.2992-2998
    • /
    • 2013
  • The future mobile communication system can support not only voice but also multimedia applications such as data, image and video. It requires greater resources than the voice-oriented mobile system. We propose user and sub-channel priority based resource allocation for mobile multimedia services in the OFDMA systems. Our method is able to guarantee QoS continuity of realtime services and carry the maximum number of non-realtime subscriber. Simulation is focused on total throughput and blocking rate. The simulation results show that our proposed method provides a better performance than the conventional method.

Remotely controlled Interactive Magnetic Resonance Imaging in Network Environment (Network을 이용한 원격 핵자기 공명 영상)

  • Park, J.I.;Kim, C.Y.;Park, D.J.;Ryu, W.S.;Ahn, C.B.
    • Proceedings of the KIEE Conference
    • /
    • 1996.07b
    • /
    • pp.1383-1385
    • /
    • 1996
  • A network based interactive magnetic resonance imaging (MRI) system has been developed using the World Wide Web. For this purpose, an HTTP server is developed on the host computer of the MRI system. Capabilities of video and audio conferencing are included for monitoring experiment. Using the developed system. MRI imaging has been successfully carried out at the Signal Processing Lab in the Kwangwoon University with the remote MRI system located at the Medical Image Research Center at the KAIST in Daejon.

  • PDF