• 제목/요약/키워드: 모달 영역

검색결과 52건 처리시간 0.024초

신경망을 이용한 이중모달 음성 인식 모델링 (Bimodal Speech Recognition Modeling Using Neural Networks)

  • 류정우;성지애;이순신;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.567-569
    • /
    • 2003
  • 최근 잡음환경에서 강인한 음성인식을 위해 음성 잡음에 영향을 받지 않은 영상정보를 이용한 이중모달 음성인식 연구가 활발히 진행되고 있다. 기존 음성인식기로 좋은 성능을 보이는 HMM은 이질적인 정보를 융합하는데 있어 많은 제약과 어려움을 가지고 있다. 하지만 신경망은 이질적인 정보를 효율적으로 융합할 수 있는 장점을 가지고 있으며 그에 대한 많은 연구가 수행되고 있다. 따라서 본 논문에서는 잡음환경에 강인한 이중모달 음성 인식 모델로 이중모달 신경망(BN-NN)을 제안한다. 이중모달 신경망은 특징융합 방법으로 음성정보와 영상정보를 융합하고 있으며. 입력정보의 특성을 고려하기 위해 윈도우와 중복영역의 개념을 적용하여 시제위치를 고려하도록 설계되어있다. 제안된 모델은 잡음환경에서 음성인식기와 성능을 비교하고, 화자독립 고립단어 인식에서 기존 융합방법인 CHMM과 비교하여 그 가능성을 확인한다.

  • PDF

비닐하우스 아치구조의 모달계수 산정 (Estimation of Modal Parameters for Plastic Film-Covered Greenhouse Arches)

  • 조순호
    • 한국지진공학회논문집
    • /
    • 제14권2호
    • /
    • pp.67-74
    • /
    • 2010
  • 비닐하우스 아치구조에 고정햄머 및 이동가속도계 형식을 취한 충격진동실험을 수행하여 획득한 일련의 진동기록으로 부터 고유진동수, 감쇠율 및 모드형태 등과 같은 모달계수를 추출하기 위하여 최신 고급 주파수영역 시스템판별법인 PolyMAX 및 FDD를 적용하였다. 전자는 입력-출력 데이터 모두를 사용하며, 후자는 출력 데이터 만 을 사용한다. 본 연구의 비닐하우스 강재 파이프 아치와 같이 매우 세장한 구조물에 진동계측 등과 같은 비파괴 실험기법을 적용하여 정적좌굴 하중을 결정할 수 있는 지 여부 및 손상을 감지할 수 있는지 등에 대하여 중점적으로 조사하였다. 대체로 추출한 모달계수는 유한요소해석으로부터 획득한 결과와 좋은 일치를 나타냈으며, 지속적으로 수행 할 후속연구에 가능성을 제시하였다.

다중모달리티 영상정합기반 뇌 해마영역 기능대사 정량분석 (Quantitative Analysis of Metabolism for Brain Hippocampus based on Multi-modality Image Registration)

  • 김민정;최유주;김명희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.1645-1648
    • /
    • 2004
  • 해마를 비롯하여, 뇌 기능과 밀접한 관련을 가지는 뇌 하위조직의 분석에 대한 최근 연구로 MR 영상 등의 해부학적 영상으로부터의 볼륨 추출, 형상 복원, 대칭성 비교 등을 들 수 있다. 이러한 연구들은 뇌의 해부학적 정보에만 의존함으로써 관심영역에 대한 신진대사 등의 분석에 한계를 가진다. 본 논문에서는 뇌 해마영역에 대하여 해부학적, 기능적 특성의 동시 분석이 가능한 프로시저를 제안한다. 먼저 해부학적 영상과 기능적 영상의 다중모달리티 영상정합을 수행하고 이를 기반으로 해마 SPECT 볼륨이 추출되며, 나아가 체적 측정 및 강도 분포 등의 정량분석을 수행함으로써 해부학적 영역의 기능정보에 대한 직관적이며 객관적인 분석이 가능하도록 하였다.

  • PDF

다중 모달 정합에 의한 Visible Human의 뼈 분할 방법 (Bone Segmentation Method of Visible Human using Multimodal Registration)

  • 이호;김동성;강흥식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.719-726
    • /
    • 2003
  • 본 논문에서는 Visible Human 컬러 단면 영상에서 인접한 지방 영역과 색상 특성이 유사하여 구별이 매우 힘든 뼈 영역을 분할하기 위해 다중 모달 정합 방법을 제안한다. 뼈와 그 인접영역의 구별이 뚜렷한 CT 영상에서 뼈를 분할하고 두 영상의 정합을 이용하여 컬러 영상에서 최종 뼈 분할을 수행한다. CT 영상에서 뼈의 분할 방법은 임계값 기반 방법을 사용하였고, 정합은 두 영상에서 신체 부위를 임계값 기반의 방법을 사용하여 분할된 객체들의 경계를 상호 상관관계(cross-correlation)방법을 사용하여 수행하였다. 제안된 방법은 Visible Human 컬러 단면 영상 중에 뼈와 인접 지방이 유사하여 그 분할이 어려운 머리부위와 다리부위에 적용하여 고무적인 결과론 얻었다.

어포던스 이론 기반 터치 스크린을 이용한 멀티 모달 미디어 아트 콘텐츠의 설계 (Design of the Multi-Modal Media Art Contents using Touch Screen based on Affordance Theory)

  • 이강소;최유주
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.36-37
    • /
    • 2015
  • 본 논문에서는 전시 공간에서 전시 콘텐츠를 그냥 지나치거나 적극적으로 상호작용하려 하지 않는 관람객의 관심과 흥미를 이끌어 내기 위하여 어포던스(affordance, 행위 유발성) 특성을 반영한 인터랙티브 아트 콘텐츠 설계에 관한 내용을 다룬다. 이를 위하여, 우선, HCI 나 인지심리 영역에서 다루고 있는 어포던스 이론을 고찰하고, 특히 전시 공간에 나타나는 어포던스의 요소를 연구한 기존 연구들 분석하였다. 이를 기반으로 사람들의 행동과 흥미를 유발 시킬 수 있는 전시공간에 적합한 어포던스 기반 멀티 모달 인터페이스 설계 방향을 제시하였다. 또한, 제시된 멀티 모달 인터페이스 설계 특성을 반영하여 터치 스크린을 이용한 멀티 모달 미디어 아트 콘텐츠를 설계 제작하였다.

  • PDF

모바일 디바이스 기반의 멀티 모달 사용자 거리 추정 시스템 (Multi-Modal User Distance Estimation System based on Mobile Device)

  • 오병훈;홍광석
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.65-71
    • /
    • 2014
  • 본 논문에서는 모바일 디바이스에 기본적으로 제공되는 모노 카메라와 모노 마이크의 멀티 모달 입력을 통하여 사용자와 모바일 디바이스간의 거리를 추정하는 방법을 제안한다. 영상을 이용한 거리 추정은 모노 카메라로 입력되는 영상에서 피부색 영역을 추출하고, 노이즈를 제거한 후에 얼굴 영역 및 눈 영역을 검출하여 사용자의 거리를 추정한다. 음성을 이용한 거리 추정은 모노 마이크로 입력되는 음성으로부터 가장 큰 피크(Peak)를 선정하고, ROI(Region of Interest)를 지정한 후에 FFT(Fast Fourier Transform)을 수행하여 주파수 축에서의 크기(Magnitude)를 계산한다. 계산된 크기 값과 거리별 크기 값의 모델을 비교하여 거리 별 우도(Likelihood)를 계산하고, 정렬한 후 가중치를 주어 더함으로써 사용자의 거리를 추정한다. 실험결과 영상 및 음성을 멀티 모달 입력으로 이용하여 거리를 추정한 결과 단일 모달로 거리를 추정한 결과 보다 향상된 결과를 얻을 수 있었다.

오디오-비디오 정보 융합을 통한 멀티 모달 음성 인식 시스템 (Audio-Visual Integration based Multi-modal Speech Recognition System)

  • 이상운;이연철;홍훈섭;윤보현;한문성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.707-710
    • /
    • 2002
  • 본 논문은 오디오와 비디오 정보의 융합을 통한 멀티 모달 음성 인식 시스템을 제안한다. 음성 특징 정보와 영상 정보 특징의 융합을 통하여 잡음이 많은 환경에서 효율적으로 사람의 음성을 인식하는 시스템을 제안한다. 음성 특징 정보는 멜 필터 캡스트럼 계수(Mel Frequency Cepstrum Coefficients: MFCC)를 사용하며, 영상 특징 정보는 주성분 분석을 통해 얻어진 특징 벡터를 사용한다. 또한, 영상 정보 자체의 인식률 향상을 위해 피부 색깔 모델과 얼굴의 형태 정보를 이용하여 얼굴 영역을 찾은 후 강력한 입술 영역 추출 방법을 통해 입술 영역을 검출한다. 음성-영상 융합은 변형된 시간 지연 신경 회로망을 사용하여 초기 융합을 통해 이루어진다. 실험을 통해 음성과 영상의 정보 융합이 음성 정보만을 사용한 것 보다 대략 5%-20%의 성능 향상을 보여주고 있다.

  • PDF

표면거리 및 표면곡률 최적화 기반 다중모달리티 뇌영상 정합 (Multimodal Brain Image Registration based on Surface Distance and Surface Curvature Optimization)

  • 박지영;최유주;김민정;태우석;홍승봉;김명희
    • 정보처리학회논문지A
    • /
    • 제11A권5호
    • /
    • pp.391-400
    • /
    • 2004
  • 서로 다른 종류의 영상을 정확하게 연관시켜 복합적인 정보를 제공하는 다중모달리티 의료 영상정합기법 중 표면정보 기반 영상정합에서는 일반적으로 동일 대상에 대한 서로 다른 모달리티에서 추출된 표면 윤곽정보 사이의 거리를 최소화함으로써 매칭이 이루어진다. 그런데 동일대상에 대해 취득되는 서로 다른 두 모달리티는 관심 영역 상의 표면 특성이 서로 유사하다. 그러므로 다중모달리티 영상정합에서 표면거리와 함께 표면의 형태 특성을 고려하여 두 영상을 매칭하는 방법이 정합결과의 정확도를 향상시킬 수 있다. 본 연구에서는 동일 대상의 서로 다른 두 모달리티 뇌영상 간의 표면거리와 표면곡률을 최적화하는 정합기법을 제안한다. 영상정합은 참조영상과 테스트영상에 대한 표면정보 생성과 이 두 개의 표면정보를 최적화하는 단계로 구성된다. 표면정보 생성 단계에서는 두 모달리티로부터 관심영역의 윤곽선을 추출하고, 이 중 참조 볼륨의 윤곽선에 대해서는 표면거리맵과 표면곡률맵을 구성하게 된다. 최적화 단계에서는 표면거리맵과 표면곡률맵을 참조하는 최적화 평가함수(cost function)에 의해 두 객체의 표면거리 차이와 표면곡률 차이를 최소화하는 정합 변환 값이 결정되고, 이것이 테스트영상의 변환에 적용되어 결과적으로 두 영상이 정합 되게 된다. 제안된 최적화 평가함수는 표면거리 정보만을 사용하는 평가함수에 비해 보다 견고한 정합 정확도를 보였으며 또한 본 연구는 정합결과의 볼륨 가시화를 통해 효율적인 영상 분석 수단을 제공하고자 하였다.

모달 질량 가속도 곡선을 이용한 인공위성 탑재품의 설계하중 예측 및 검증 (Prediction and Validation of Design Loads of Satellite Components Using Modal Mass Acceleration Curve)

  • 고명석;임재혁;김경원;황도순;오현웅
    • 한국항공우주학회지
    • /
    • 제49권9호
    • /
    • pp.739-748
    • /
    • 2021
  • 본 연구에서는 모달 질량 가속도 곡선을 이용한 인공위성 탑재품의 설계하중 예측 및 검증에 관해 다룬다. 모달 질량 가속도 곡선을 구성하기 위해 SpaceX의 Falcon 9 발사체 정보를 사용하였으며, 이를 통해 모달 영역에서의 상계가속도 곡선을 도출하고 이를 위성체/발사체 경계하중 및 위성체 모달 정보와 결합하여 위성체 탑재품이 발사환경에서 노출될 최대가속도 하중을 예측하였다. 또한 단순한 인공위성 및 발사체 모델을 이용한 연성하중해석 결과와 비교 검토하여 모달 질량 가속도 곡선이 적절한 상계해를 도출하는 것을 확인하였다.

시간영역 변형형상을 이용한 철도교량의 손상평가 (Damage Evaluation of a Railroad Bridge Using Time-domain Deflection Shape)

  • 최상현;임남형;강영종
    • 한국철도학회논문집
    • /
    • 제12권1호
    • /
    • pp.129-134
    • /
    • 2009
  • 공용기간동안 철도교량의 안전성 및 사용성을 확보하기 위해서는 지속적인 감시를 통하여 교량의 구조적 성능을 유지하는 것이 필요하다. 구조물의 구조적 건전성을 감시하기 위하여 현재까지 개발된 대부분의 방법들은 모달 응답을 이용하고 있으나, 이러한 모달응답은 별도의 추출 과정이 필요하며 실제 구조물에서 얻을 수 있는 수가 제한된 다는 단점이 있다. 이 논문에서는 열차이동하중으로 인한 시간영역의 변형형상을 이용하여 자유진동응답에 기반한 손상평가방법의 적용성을 검토하였다. 검토된 방법은 이동하중으로 인한 시간영역의 변형응답을 이용하므로 별도의 모달 응답 추출과정이 필요 없어 실제 구조물에 적용이 용이하다. 제시된 방법의 적용성은 단순판형교 수치예제를 이용하여 검증하였다.