• 제목/요약/키워드: 음성망

검색결과 874건 처리시간 0.026초

다중 센서 융합 알고리즘을 이용한 사용자의 감정 인식 및 표현 시스템 (Emotion Recognition and Expression System of User using Multi-Modal Sensor Fusion Algorithm)

  • 염홍기;주종태;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.20-26
    • /
    • 2008
  • 지능형 로봇이나 컴퓨터가 일상생활 속에서 차지하는 비중이 점점 높아짐에 따라 인간과의 상호교류도 점점 중요시되고 있다. 이렇게 지능형 로봇(컴퓨터) - 인간의 상호 교류하는데 있어서 감정 인식 및 표현은 필수라 할 수 있겠다. 본 논문에서는 음성 신호와 얼굴 영상에서 감정적인 특징들을 추출한 후 이것을 Bayesian Learning과 Principal Component Analysis에 적용하여 5가지 감정(평활, 기쁨, 슬픔, 화남, 놀람)으로 패턴을 분류하였다. 그리고 각각 매개체의 단점을 보완하고 인식률을 높이기 위해서 결정 융합 방법과 특징 융합 방법을 적용하여 감정 인식 실험을 하였다. 결정 융합 방법은 각각 인식 시스템을 통해 얻어진 인식 결과 값을 퍼지 소속 함수에 적용하여 감정 인식 실험을 하였으며, 특징 융합 방법은 SFS(Sequential Forward Selection) 특징 선택 방법을 통해 우수한 특징들을 선택한 후 MLP(Multi Layer Perceptron) 기반 신경망(Neural Networks)에 적용하여 감정 인식 실험을 실행하였다. 그리고 인식된 결과 값을 2D 얼굴 형태에 적용하여 감정을 표현하였다.

국내 H.323 기반 도메인간 상호운용 표준개발 (Development of Domestic Standard of VoIP for Inter-Domain Interoperability based on H.323)

  • 이일진;이종화;강신각
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 추계종합학술대회
    • /
    • pp.430-433
    • /
    • 2001
  • VoIP 기술은 인터넷 망 계층 프로토콜인 IP(Internet Protocol) 상에서 데이터 뿐만 아니라 음성 서비스를 동시에 제공할 수 있도록 지원하는 기술을 말한다. 이 기술은 인터넷이 급속하게 확산되고 이용자가 폭발적으로 증가함에 따라 인터넷 서비스에서 부각되는 기술로 자리잡고 있다. 현재 VoIP 기술을 위한 표준 기술은 H.323이 가장 성숙해 있다. 그러나, 이 프로토콜은 현재 단일 도메인 상에서 서비스되고 있다. 그러므로 도메인 간의 상호운용 표준 개발을 통해 서로 다른 도메인 상의 사용자들에게 서비스를 제공할 수 있는 기술이 요구된다. 이러한 요구에 따라 국제적으로 상호 운용성을 확보하고자 관련 사업자들로 이루어진 IMTC (International Multimedia Telecommunications Consortium. Inc.)에서 활발히 상호 운용 표준을 개발하고 있으며, 국내에서도 VoIP 포럼을 중심으로 국내 VoIP 표준 개발이 추진되고 있다. 본 논문에서는 이러한 연구를 위한 국내 H.323 기반 도메인간 상호 운용성을 확보하기 위한 콜 모델 및 요구 사항에 대하여 기술하고자 한다.

  • PDF

VLC에서 이동망간 연동성 성능분석 (Performance of an Interworking on the VLC)

  • 왕야;장효뢰;전웨이웨이;기장근;이규대
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.9-16
    • /
    • 2011
  • 본 논문에서는 이동망에서 통신노드가 다이나믹하게 이동하는 경우, VLC 음성품질을 위지하기 위한 상호연동 구조를 다룬다. 연동구조에서 체계적인 품질 분석은 OPENT 시뮬레이터를 사용하였으며, 패킷지연율과 성능분석으로 결과를 제시하였다. 실험결과에 따라 이동노드의 수가 작을 때, PDR은 상대적으로 데이터 프래픽이 증가함에 따라 안정을 유지하며, 성능은 이동노드의 수에 영향을 받는다. 특히 MANET 노드 밀도가 크게 증가하면, 성능은 높아지지만 이동속도에 영향을 받지 않았다. 또한 FTP 업다운 응답시간은 이동속도와 노드의 수에 크게 영향을 주지 않음을 확인하였다.

한국어 숫자음의 음운변화 및 화자 발성특성을 고려한 연결숫자 인식의 성능향상 (Performance Improvement of Connected Digit Recognition by Considering Phonemic Variations in Korean Digit and Speaking Styles)

  • 송명규;김형순
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.401-406
    • /
    • 2002
  • 한국어 숫자는 모두 단음절로 이루어져 있으며, 연속적으로 발음될 때 인접 숫자들의 상호조음현상에 의해 각 숫자의 고유 발음이 변화하고, 또한 그 숫자들의 경계도 모호해지는 문제점이 있다. 이러한 문제점들과 더불어 배경잡음이나 채널에 의한 왜곡에 따른 문제점들로 인해 한국어 연결숫자의 인식 성능은 만족스럽지 못한 것이 현실이다. 본 논문에서는 연결숫자의 인식성능 향상을 위해서 한국어 숫자들의 음운변화를 고려하여 유사음소 (phonelike units: PLUs)군을 정의하고, 사용자의 여러 가지 발성형태에 따른 다양한 음운 현상의 변화를 흡수할 수 있도록 인식 시스템을 구성하는 방식을 검토하였다. 전화망 4연숫자를 이용한 화자독립 인식 실험을 수행한 결과 제안된 방법의 숫자열 인식률은 상태당 믹스쳐 (mixture) 개수가 1인 경우 83.2%로, 기준 시스템 (baseline)에 대한 오류감소률이 7.2%였고 가장 높은 성능을 나타낸 믹스쳐 개수가 11인 경우 숫자열 인식률은 91.8% 오류감소율은 4.7%였다.

VoIP 보안 위협 분석 및 대책 연구 (A Study on VoIP Security Risk Analysis and Countermeasure)

  • 곽진석;김현철;이영실;이훈재
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.277-280
    • /
    • 2011
  • VoIP(Voice over Internet Protocol)는 기존의 인터넷망을 이용하여 음성데이터를 패킷단위로 송 수신하여 전화통화를 하는 기술로써, 기존 전화통화 방식보다 비용절감의 이점을 가지며 최근 활성화되고 있는 추세이다. 그러나 최근 VoIP Application을 받을 수 있는 마켓에서의 취약점(누구든지 올릴 수 있다.)을 악용하여 악성코드를 심은 파일을 받게 유도하여 도청을 한 사례, 그리고 DDos 공격으로 인한 마비, 해킹으로 과금 우회 공격 등이 있다. 이를 미루어보아 VoIP에 대한 보안위협에 대한 분석과 대책 마련이 시급한 것으로 사료된다. 이에 본 논문에서는 VoIP 보안 위협에 대해 실제 Soft Phone, Smart Phone App상에서 야기될 수 있는 취약점을 분석하며, 이에 대한 보안 대책을 연구하여 기술한다.

  • PDF

다층 슬랩-광섬유접속구조를 갖는 광필터의 설계 (Design of Optical Filter with Multilayer Slab/Fiber Structure)

  • 정찬권;강영진;김선엽
    • 한국산학기술학회논문지
    • /
    • 제8권6호
    • /
    • pp.1369-1375
    • /
    • 2007
  • 최근 전기통신통신망의 용량은 인터텟, 음성패킷, Audio/Video 스트리밍의 멀티미디어 서비스 수요로 인한 정보통신 용량의 증가에 비례하여 급속히 증가하고 있다. 그 결과 DWDM(Dense Wavelength Division Multiplexing) 기법이 초고속 광통신망에서 추가적인 광섬유망과 고속장비 없이 용량을 증가시키는 해결 방법으로 행하여지고 광학적인 방법이 가능하다는 것이 판명되었다. 따라서, 본 논문에서는 이러한 기능을 갖는 광필터를 설계하기 위하여 광섬유 한쪽의 클래드를 연마하여 다층 슬래브 도파로에 결합시킨 형태의 광섬유/다층 슬래브 결합구조의 광필터를 제안하였다. 광섬유와 슬래브의 분리간격이 $3{\mu}m$일 때 제안된 광필터는 $1.3{\mu}m$의 통신창에서 편광 독립성은 32nm로서 TM 모드와 TE 모드에 대해 중심파장이 각각 ${\lambda}_0=1.274755{\mu}m$${\lambda}_0=1.30591{\mu}m$일 때 0.1 nm의 FWHM(Full Width at Half Maximun) 특성을 가진다.

  • PDF

품질 보장형 IP 멀티캐스트 수락 제어 메커니즘 (QoS guaranteed IP multicast admission control mechanism)

  • 송강호;이우섭
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.51-55
    • /
    • 2008
  • High영상, High품질, 양방향성을 요구하는 BcN은 음성전화, 방송, 데이터 인터넷서비스가 모두 가능해지며 고유한 통신서비스 영역을 허물어 버렸다. 또한, 새로운 비즈니스와 ISP에게 안정적으로 품질이 보장되는 정보통신과 High품질 멀티미디어 서비스를 위해 신뢰성 있는 멀티캐스팅 품질보장 메커니즘이 요구 되어진다. 이와 같은 서비스 제공을 위해서는 End-to-End QoS가 보장되는 멀티캐스트 메커니즘이 제공 되어야 하며 사용자가 요구하는 패킷 손실률이나 전송지연 요구사항을 보장과 신뢰성 있는 멀티캐스트 Path망이 제공되어야 한다. 이를 위해 본 논문에서는 IP기반 멀티캐스트 신규 조인시 연결 수락을 효과적으로 할수 있는 Probing 패킷 기반의 멀티캐스트 메커니즘을 제시하고 ns-2를 이용한 성능분석를 제시 하였다.

  • PDF

소아 망진을 위한 얼굴 특징 추출 및 영아 산통 진단을 위한 울음소리 분석 (Face Feature Extraction for Child Ocular Inspection and Diagnosis of Colics by Crying Analysis)

  • 조동욱;김봉현
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.97-104
    • /
    • 2006
  • 의사 표현 능력이 떨어지는 소아들은 질병 발생시 이를 효과적으로 자신의 불편함을 표현할 방법이 없다. 따라서 임상의들은 소아 환자의 부모들로부터 문진(inquiring)을 통해 질병 진단을 하고 있는 것이 현 실정이며 이는 잘못된 진단 결과를 초래 할 수 있는 문제점을 가지고 있다. 이를 위해 본 연구에서는 인체 오장 육부의 생체 신호가 안면과 음성에 반영되어 나타난다는 한방 원리를 이용하여 소아 망진, 소아 청진 기기를 개발한다. 그 결과 진단시 임상의들의 직관을 시각화, 객관화, 정량화하여 소아 질병 진단의 정확성을 기하고자 한다. 본 논문은 전체 개발 시스템 중 그 첫 번째 작업 수행 결과로서 소아 망진의 경우 색상 보정, YCbCr 적용과 살색 영역 선정 그리고 오관 및 명당 추출 방법 등을 개발한다. 또한 소아 청진의 경우 피치, 강도, 포먼트 분석을 통해 영아 산통 질병의 울음소리 특성을 수치화하였으며 이를 통해 임상의들의 직관을 객관화한다. 끝으로 실험에 의해 제안한 방법의 유용성을 입증한다.

이동 컴퓨팅 환경에서 수정된 지역 위치등록을 이용한 고속 핸드오프 프로토콜 개선 (An Improvement of Fast Handoff Protocol using Modified Local Registration in Mobile Computing Environment)

  • 한승진;최성용;이정현
    • 정보처리학회논문지C
    • /
    • 제9C권2호
    • /
    • pp.267-276
    • /
    • 2002
  • 무선 단말기를 이용하여 단순한 문자 및 음성 전송 뿐만아니라 멀티미디어 트래픽을 전송하고자 하는 사용자가 증가하고 있다. 본 논문에서는 이동 망에서 수정된 지역 위치등록을 이용하여 멀티미디어 트래픽의 실시간 전송에 적합한 고속 핸드오프 프로토콜을 제안한다. 제안한 프로토콜은 기존에 제시된 개방된 문제점 중 삼각 라우팅 문제를 CN의 프로토콜을 수정하지 않고 해결한다. 또한 MN이 핸드오프 중이라도 실시간으로 패킷을 수신할 수 있는 방법을 제안한다. 본 논문에서는 제안하는 고속 핸드오프 프로토콜을 기존의 방법과 위치등록 비용 및 패킷 전송 비용으로 나누어 성능 평가하여 본 논문에서 제안하는 방법이 우수하다는 것을 입증한다.

External knowledge를 사용한 LFMMI 기반 음향 모델링 (LFMMI-based acoustic modeling by using external knowledge)

  • 박호성;강요셉;임민규;이동현;오준석;김지환
    • 한국음향학회지
    • /
    • 제38권5호
    • /
    • pp.607-613
    • /
    • 2019
  • 본 논문은 external knowledge를 사용한 lattice 없는 상호 정보 최대화(Lattice Free Maximum Mutual Information, LF-MMI) 기반 음향 모델링 방법을 제안한다. External knowledge란 음향 모델에서 사용하는 학습 데이터 이외의 문자열 데이터를 말한다. LF-MMI란 심층 신경망(Deep Neural Network, DNN) 학습의 최적화를 위한 목적 함수의 일종으로, 구별 학습에서 높은 성능을 보인다. LF-MMI에는 DNN의 사후 확률을 계산하기 위해 음소의 열을 사전 확률로 갖는다. 본 논문에서는 LF-MMI의 목적식의 사전 확률을 담당하는 음소 모델링에 external knowlege를 사용함으로써 과적합의 가능성을 낮추고, 음향 모델의 성능을 높이는 방법을 제안한다. External memory를 사용하여 사전 확률을 생성한 LF-MMI 모델을 사용했을 때 기존 LF-MMI와 비교하여 14 %의 상대적 성능 개선을 보였다.