• 제목/요약/키워드: 음성데이터베이스

검색결과 270건 처리시간 0.034초

마이크로어레이 데이터와 PPI 데이터를 이용한 에스트로겐 수용체 음성 유방암 환자의 예후 특이 네트워크 식별 및 예후 예측 (Identification of prognosis-specific network and prediction for estrogen receptor-negative breast cancer using microarray data and PPI data)

  • 황유현;오민;윤영미
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.137-147
    • /
    • 2015
  • 본 논문에서는 유전자 네트워크를 기반으로 유방암 환자의 예후를 예측하는 알고리듬을 제안한다. 유방암 환자의 마이크로어레이 데이터와 PPI(Protein-protein interaction)데이터를 이용하여 알고리듬의 분류자로 사용될 예후 특이 네트워크(Prognosis specific gene network)를 추출한다. PPI에 속한 모든 유전자 네트워크에 대하여 각각의 네트워크가 예후 좋음과 나쁨을 잘 구분하는지에 대한 점수를 피어슨 상관계수(Pearson's correlation coefficient)와 마이크로어레이 데이터를 이용하여 계산한다. 이들 중 가장 예후에 유의한 네트워크를 식별하고, 이 네트워크를 분류자로 사용하여 에스트로겐 수용체 음성 유방암 환자의 예후를 분류 분석 한다. 본 연구와 기존 연구의 알고리듬 정확도를 비교 분석 하기 위하여 독립 실험을 진행하고, 본 연구에서 제안된 알고리듬의 성능이 더 우수함을 보인다. 또한, Gene Ontology 데이터베이스를 활용하여 식별된 예후 특이 네트워크를 기능적으로 검증 한다.

디지털 선박 내 다차원 센서 스트림 데이터의 효율적인 처리 (Efficient Processing of Multidimensional Sensor stream Data in Digital Marine Vessel)

  • 송병호;박경우;이진석;이경효;정민아;이성로
    • 한국통신학회논문지
    • /
    • 제35권5B호
    • /
    • pp.794-800
    • /
    • 2010
  • 디지털 선박에서는 선박 내의 각종 센서로부터 측정된 디지털 데이터에 대한 정확하고 에너지 효율적인 관리가 필요하다. 센서 네트워크에서 대용량의 입력 스트림 데이터 전체를 데이터베이스에 모두 저장하여 한꺼번에 처리하는 것은 효율적이지 못하다. 본 논문에서는 디지털 선박 내 센서 네트워크의 에너지 효율성과 정확성을 고려하여 여러 센서에서 지속적으로 들어오는 다차원 스트림 데이터의 처리 성능을 높이고자 한다. 디지털 선박 내에 다수 개의 센서(온도, 습도, 조도, 음성 센서)를 배치하고 효율적인 입력 스트림 처리를 위해서 슬라이딩 윈도우 기반으로 질의를 처리하고 Mjoin 방법으로 다중 질의 계획을 수립한 후 SVM 알고리즘을 통해 저장 데이터를 축소하는 효율적인 처리 기법을 제안한다. 분류된 데이터들 중 필요하지 않는 데이터는 자동으로 데이터베이스에서 삭제되고 유효한 데이터는 디지털 선박 모니터링 시스템에 이용하였다. 35,912개의 데이터 집합을 사용하여 실험한 결과 실제 입력되는 데이터보다 저장 공간의 18.3%를 축소함으로써 효과적임을 보였다.

멀티미디어 기술 기반 방송제작 체계

  • 김경수
    • 정보과학회지
    • /
    • 제20권5호
    • /
    • pp.10-16
    • /
    • 2002
  • 디지털 기술의 급속한 발전에 의한 디지털 방송의 도입은 방송환경에 커다란 변혁을 초래하고 있다. 기술의 발전은 방송, 통신, 컴퓨터를 융합시킨 새로운 미디어 서비스를 등장시키고 있으며, 이러한 미디어의 융합은 지금까지 독자적인 영역에서 발전하여 오던 각각의 미디어들이 가지고 있는 한계성 또는 단점을 상호보완적으로 개선함으로써 서비스 능력을 대폭적으로 향상시키는 방향으로 전개되고 있다. 이와같은 디지털 시대의 대변혁은 멀티미디어 서비스를 그 중심축으로 하고 있으며, 이른바 방송통신 융합시대의 경쟁력 있는 서비스를 도입하기 위한 미디어간, 국가간의 경계영역을 초월한 글로벌 경쟁체제가 급속히 진전되어 가고 있다. 이와 같은 미디어의 융합 현상에 따라 제작 환경도 새로운 디지털 방송 서비스를 효율적으로 지원하도록 전환되어야 한다. 디지털 방송의 특징인 고품질 및 다채널 시대를 맞아 방송 콘텐츠의 재활용도를 높이는 것은 매우 중요하며, 데이터 방송, 인터넷 방송 등 다양한 기능의 서비스를 도입하기 위해선 제작 체계의 개선이 뒷받침되어야 한다. 따라서 본 논문에서는 새로운 제작 환경에 대해서 살펴보고자 한다. 특히, 컴퓨터 기반의 제작 환경 구축에 핵심 요소인 넌리니어 편집시스템과 방송 콘텐츠를 효율적으로 관리하고 재활용할 수 있는 디지털 아카이브에 대해 소개하고자 한다. 테이프 대신 하드디스크를 기록 매체로 하는 넌리니어(non-linear) 시스템의 등장에 따라 방송 프로그램 제작에 대한 새로운 개념의 정립이 필요하게 되었으며, 이를 근간으로 하는 새로운 프로그램 제작환경, 즉 네트워크에 의해 컴퓨터와 데이터베이스를 연결하여 제작으로부터 송출가지 통합관리가 가능한 새로운 방송 프로그램 제작환경, 이른바 멀티미디어 제작환경을 구축하는 것이 디지털 방송 시대의 방송 사업자에게 가장 중요한 과제중의 하나가 되었다. 멀티미디어 제작환경을 구축함으로써 영상, 음성 및 다양한 부가 데이터를 포함하는 멀티미디어 프로그램을 편리하게 제작할 수 있으며, 데이터베이스로부터 필요한 영상 이미지를 자유롭게 합성, 조작하는 등, 매우 다양하고 편리한 제작기법을 활용할 수 있다. 또한 멀티미디어를 응용한 제작 분야로서 컴퓨터 그래픽스 기술은 방송의 사전제작에 커다란 기여를 하고 있으며, 이미 선거방송을 비롯한 여러가지 프로그램은 가상스튜디오와 가상캐릭터 기술을 활용하여 제작하고 있다. 방송사업자는 이러한 멀티미디어 제작시스템을 근간으로 영상검색, 영상 합성, 스크립트 편집, 가상현실 응용 등 고도의 제작 기법을 활용함으로써 사용자 친화성, 다이나믹한 표현, 실시간, 대화성을 특징으로 하는 다양한 멀티미디어 서비스를 시청자에게 제공할 수 있을 것이다.

한국어 폐쇄자막을 이용한 지식기반 비디오 검색 시스템 (Knowledge-based Video Retrieval System Using Korean Closed-caption)

  • 조정원;정승도;최병욱
    • 전자공학회논문지CI
    • /
    • 제41권3호
    • /
    • pp.115-124
    • /
    • 2004
  • 저 수준의 특징정보를 사용하는 내용기반 검색만으로 지능형 정보검색을 위한 사용자의 개념적인 요구에 부합하는 검색결과를 제공하기 어렵다. 일반적으로 비디오 데이터에는 동영상 정보와 함께 음성, 음향 등의 오디오 정보와 폐쇄자막 등의 정보가 포함되어 있다. 지식기반 비디오 검색은 그러한 다양한 정보를 사용하여 자동색인을 수행하고 색인 데이터베이스를 구축한다. 이로써 사용자는 보다 개념적인 검색 요구에 부합하는 검색 결과를 얻을 수 있다. 본 논문에서는 비디오 내의 한국어 폐쇄자막을 이용한 지식기반 비디오 검색 시스템을 제안한다. 한국어 폐쇄자막은 형태소 분석 수준에서 자동색인되며, 색인 데이터베이스를 이용하여 키워드 질의를 통해 비디오를 검색할 수 있다. 실험에서 한국어 속기시스템으로 제작된 폐쇄자막이 포함된 뉴스비디오에 적용하여, 제안하는 방법이 사용자의 보다 의미 있는 개념적인 요구에 부합하는 검색 결과를 얻을 수 있음을 확인하였다.

DSR 환경에서의 다 모델 음성 인식시스템의 성능 향상 방법에 관한 연구 (A Study on Performance Improvement Method for the Multi-Model Speech Recognition System in the DSR Environment)

  • 장현백;정용주
    • 융합신호처리학회논문지
    • /
    • 제11권2호
    • /
    • pp.137-142
    • /
    • 2010
  • 다 모델 음성인식기는 잡음환경에서 매우 우수한 성능을 보이는 것으로 평가되고 있다. 그러나 지금까지 다 모델 기반인식기의 성능시험에는 잡음에 대한 적응을 고려하지 않은 일반적인 전처리 방식이 주로 활용하였다. 본 논문에서는 보다 정확한 다 모델 기반인식기에 대한 성능 평가를 위해서 잡음에 대한 강인성이 충분히 고려된 전처리 방식을 채택하였다. 채택된 전처리 알고리듬은 ETSI (European Telecommunications Standards Institute)에서 DSR (Distributed Speech Recognition) 잡음환경을 위해서 제안된 AFE (Advanced Front-End) 방식이며 성능비교를 위해서 DSR 환경에서 좋은 성능을 나타낸 것으로 알려진 MTR (Multi-Style Training)을 사용하였다. 또한, 본 논문에서는 다 모델 기반인식기의 구조를 개선하여 인식성능의 향상을 이루고자 하였다. 기존의 방식과 달리 잡음음성과 가장 가까운 N개의 기준 HMM을 사용하여 기준 HMM의 선택시에 발생할 수 있는 오류 및 잡음신호의 변이에 대한 대비를 하도록 하였으며 각각의 기준 HMM을 훈련을 위해서 다수의 SNR 값을 이용함으로서 구축된 음향모델의 강인성을 높일 수 있도록 하였다. Aurora 2 데이터베이스에 대한 인식실험결과 개선된 다 모델기반인식기는 기존의 방식에 비해서 보다 향상된 인식성능을 보임을 알 수 있었다.

SNR 기반 가중 KL 거리를 활용한 화자 변화 검증에 관한 연구 (The Study on Speaker Change Verification Using SNR based weighted KL distance)

  • 조준범;이지은;이경록
    • 융합정보논문지
    • /
    • 제7권6호
    • /
    • pp.159-166
    • /
    • 2017
  • 본 논문에서는 방송 뉴스에서 화자 변화 검증 성능 향상을 위해서 입력소음음성 향상과 SNR(Signal to Noise Ratio)기반 가중 함수 $w_m$를 적용한 KL 거리 $D_s$를 실험하였다. GMM-UBM(Gaussian Mixture Model-Universal Background Model) 기반 KL(Kullback Leibler) 거리 D를 이용한 화자 변화 검증 시스템(실험 0)을 기본 시스템으로 한다. 실험 1은 실험 0의 입력소음음성 향상을 위해 MMSE Log-STSA(Minimum Mean Square Error Log-Spectral Amplitude Estimator)를 적용하였다. 실험 2는 실험 1의 기존 KL거리 D 대신에 $D_s$를 적용하였다. 실험 데이터베이스는 다양한 소음을 반영하기 위해 스포츠 뉴스와 실외 인터뷰를 중심으로 구축하였다. 실험은 화자 변화 정보의 누락을 막기 위해 MDR(Missed Detection Rate) 0%를 기준으로 하였다. 실험 0은 FAR(False Alarm Rate) 71.5%의 성능을 보였다. 실험 1은 FAR 67.3%로 실험0에 비해 4.2% 향상되었고, 실험 2는 FAR 60.7%로 10.8% 향상되었다.

뇌성마비 마비말장애 성인의 파찰음 실현 양상 분석 (Acoustic analysis of Korean affricates produced by dysarthric speakers with cerebral palsy)

  • 문지현;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.45-55
    • /
    • 2021
  • 본 연구는 경직형 경도-중등도 뇌성마비 마비말장애 성인이 산출한 한국어 파찰음의 음향학적인 특징을 분석한다. 한국어의 마찰음과 파찰음은 조음오류가 빈번하게 발생하는 자음인데, 기존 연구들은 마찰음에만 집중했다. 따라서 본 연구에서는 마비말장애 화자가 산출한 파찰음을 음향학적으로 분석하고자 한다. QoLT_SPEECH_2014 데이터베이스 내에서 파찰음 /tɕ, tɕh, ͈tɕ/이 어두 초성 및 어중 초성에 위치하는 단어를 선정하여 경도-중등도 경직형 장애 남성 화자 6명과 비장애 남성 화자 5명의 발화 데이터를 분석에 사용하였다. 한국어의 파찰음의 특성을 고려하여 파찰음의 음향학적 특징을 나타내는 매개변수를 선정하여 분석을 시행하였다: 마찰구간의 길이, 묵음 구간의 길이, 무게중심, 분산, 왜도, 첨도, 중심적률. 분석 결과는 다음과 같다: 1) 어중 초성 파찰음에서 마비말장애인이 유의하게 긴 마찰구간의 길이를 보였다, 2) 마비말장애인이 유의하게 긴 묵음 구간의 길이를 보였다, 3) 무게중심의 경우 두 집단 간의 유의한 차이가 존재하지 않았다, 4) 마비말장애인이 유의하게 큰 왜도 값을 보였다, 5) 마비말장애인이 유의하게 큰 중심적률 값을 보였다. 본 연구는 마비말장애인이 산출한 파찰음의 특성을 분석하고, 비장애인이 산출한 파찰음과의 차이를 밝혔다.

문맥종속 반음소단위에 의한 자동 음운 레이블링 시스템의 구현 및 성능평가 (Implementation of Automatic Phoneme Labelling System Using Context-dependent Demi-phone Unit and Performance Evaluation)

  • 박순철;김태환;김봉완;이용주
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.65-70
    • /
    • 1999
  • 음소 단위로 레이블링된 데이터베이스는 음성연구에 있어 매우 중요하다. 그러나 수작업에 의한 음소분할 및 레이블링 작업은 많은 시간과 노력이 필요하기 때문에 자동 음소분할 및 레이블링 시스템에 대한 많은 연구가 진행되고 있다. 저자들은 자동레이블링 시스템에서 레이블링 분할의 단위로monophone과 triphone의 장점을 포함하는 문맥 종속 반음소 단위 모델을 이용한 자동 음소분할 및 레이블링 시스템을 제안한바 있다[1]. 본 논문에서는 문맥종속 반음소 단위 자동음소분할 및 레이블링 시스템의 성능을 개선하기 위하여, 반음소의 단위를 개선하였다. 기존에 제안된 반음소 단위는 음소의 중점을 기준으로 left/right의 반음소 단위로 양분하였다. 본 논문에서는 음소의 길이가 120ms 이상일 경우 음소의 천이구간의 특성을 잘 나타낼 수 있도록, 음소의 앞뒤구간 각각 60ms를 전반음소와 후반음소로 나누고, 나머지 안정구간을 별도의 모델로 구성하였다. 본 논문에서 제안한 반음소 단위의 성능을 평가하기 위하여 PBW 452단어를 발성한 남자 30명분의 데이터를 이용하여 레이블링 시스템을 훈련하고, 훈련에 사용하지 않은 남자 4명분의 데이터를 이용하여 테스트 하였다. 실험결과, 기존의 반음소 단위에 비하여 10ms에서 $69.09\%$$1.65\%$, 20ms에서 $85.32\%$$1.02\%$의 성능향상을 가져왔다.

  • PDF

유사도검사 기법을 이용한 안전관리 개선시스템 연구 (A Study on Safety Management Improvement System Using Similarity Inspection Technique)

  • 박구락
    • 한국융합학회논문지
    • /
    • 제9권4호
    • /
    • pp.23-29
    • /
    • 2018
  • 건설현장에서 흔히 발생하는 안전관리 문제점 중 시정조치 지연으로 인해 발생하는 재해율을 낮추기 위해, 기존의 시스템 중 점검 후 시정조치를 할 때까지 발생하는 시간을 단축하기 위하여 사전에 사고유형 데이터베이스를 구축하고 점검시 유사도 검사를 이용하여 점검자에게 문제점을 실시간으로 알려주어 현장에서 바로 시정조치를 수행할 수 있는 시스템을 모델링하여, 안전사고에 보다 적극적으로 대처할 수 있는 시스템을 연구하였다. 연구 결과 90 %이상의 개방 효과와 60 %이상의 안전사고 감소율이 있음을 알 수 있었다. 이 시스템을 기반으로 음성 인식과 딥러닝을 결합하여 보다 효과적인 시스템을 지속적으로 연구 할 것이다.

키넥트 센서를 활용한 셀프 운동 교정 프로그램 (Self-Exercise Correction Program Using Kinect Sensor)

  • 신현지;김강일;김광훈;박수진;이연희;고병철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.1083-1085
    • /
    • 2017
  • 개인별 건강관리에 대한 관심이 증가함에 따라 다양한 형태의 운동관리 프로그램이 개발되고 있다. 본 연구에서는 개인별 맞춤 트레이닝 관리를 위해 키넥트 센서를 활용한 셀프 운동 교정 프로그램을 개발하였다. 셀프 운동 교정 프로그램의 동작 과정은 다음과 같이 구성된다. 1)키넥트 센서를 활용하여 사용자의 운동 모습을 촬영 2) USB 어댑터를 이용하여 PC와 연동한 후 실시간으로 골격분석 및 좌표를 추출 및 각도를 계산 3)표준 자세의 데이터와 비교, 분석하여 잘못된 동작을 인식 4)잘못된 동작이 인식되면 음성지원을 통해 실시간 알림, 운동이 끝난 후 수집되는 운동 기록(횟수, 영상) 데이터를 데이터베이스에 저장하고 열람 및 관리할 수 있도록 함으로써 효율적으로 개인 운동교정이 가능하다.