• 제목/요약/키워드: 영상 언어

검색결과 529건 처리시간 0.023초

음성/영상 정보를 이용한 새로운 끝점추정 방식에 기반을 둔 음성인식 시스템 (A Speech Recognition System based on a New Endpoint Estimation Method jointly using Audio/Video Informations)

  • 이동근;김성준;계영철
    • 방송공학회논문지
    • /
    • 제8권2호
    • /
    • pp.198-203
    • /
    • 2003
  • 본 논문에서는 멀티미디어 데이터에 존재하는 입술의 움직임(영상언어)과 음성을 함께 이용하여 음성의 끝점을 정확히 추정하는 방법과 이를 기반으로 한 음성인식 시스템을 제안한다. 잡음 섞인 음성의 끝점추정 방법은 다음과 같다. 각 테스트 단어에 대하여 영상언어를 이용한 끝점과 깨끗한 음성을 이용한 끝점을 각각 구한 후 이것들의 차이를 계산한다. 이 차이에 영상언어 끝점을 더하여 잡음 섞인 음성의 끝점으로 추정한다. 이와 같은 끝점(즉, 음성구간)의 추정방법을 인식기에 적용한다. 동일한 구간의 음성이 인식기의 각 단어모델에 입력되는 기존의 인식 방법과는 달리, 새로운 인식기에서는 각 단어별로 추정된 서로 다른 구간의 음성이 각 해당단어모델에 입력된다. 제안된 방식을 모의실험 한 결과, 음성잡음의 크기에 관계없이 정확한 끝점을 추정 할 수 있었으며, 그 결과 약 8% 정도의 인식률 향상을 이루었다.

대만 뉴웨이브 영화의 사회의제 표현 분석 연구 - 허우 샤오시엔과 에드워드 양이 중심으로 (A Study on the Expression Analysis of Social Topics in Taiwan's New Wave Movies - Focused on Hou Hsiao-hsien and Yang Teh-chang)

  • 이태훈;장이란
    • 디지털융복합연구
    • /
    • 제19권7호
    • /
    • pp.349-358
    • /
    • 2021
  • 1980년대, 홍콩 장르영화가 빠르게 발전함에 따라 홍콩 뉴웨이브 영화의 신화가 시작되었으며, 이는 같은 시기의 대만 영화에도 깊은 영향을 끼쳤다. 이 과정에서 대만의 뉴웨이브 영화들은 독특한 영상언어를 통해 대만의 그릇된 사회현실을 지적하고, 역사문화에 대해 반성을 표현하는 사회의제로 시대정신을 발현, 예술적 가치를 구현하였다. 본 논문에서는 대만 뉴웨이브의 대표적인 감독인 허우 샤오시엔과 에드워드 양의 작품 속 영상 스타일을 통한 주제 표현, 영상언어, 등에 대해 대중 예술적 가치를 분석하였다. 또한 이러한 대만 뉴웨이브 영화의 영상표현적인 특징을 통해 표출된 감독의 의도 등으로 동아시아 영화산업의 대중 예술적 가치에 대한 시사점을 도출했으며, 신세대 영화인들의 창작과 혁신을 위해 다채로운 영화창작 구도를 제시하였다. 또한 사회계몽적인 측면에서 향후 중국 영화를 발전시키는데 중요한 시사점을 제안하려 한다.

동양의 전통 족자와 현대의 디지털 세로 영상의 공간 구성 비교 연구 (A Comparative Study of Spatial Composition in East Asian Hanging Scrolls and Contemporary Digital Vertical Videos)

  • 손령;김유진
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.289-298
    • /
    • 2024
  • 디지털 모바일 기술이 발전함에 따라 세로 영상은 뉴미디어 환경에서 중요한 영상 포맷으로 자리 잡았으며, 이는 기존의 가로 지향적인 영상 미학에 새로운 시각적 언어로써 도전장을 내밀었다. 이 연구는 동양 족자의 고유한 공간 구성 기법인 '삼원법', '일하양안 삼단식', '여백기법'과 '시서화 합일'과 같은 전통적 요소를 현대의 세로 영상 창작에 접목하여, 두 매체 간의 시각적 및 구조적 유사성과 차이점을 탐구한다. 이를 통해, 세로형 배치가 어떻게 화면의 깊이와 계층을 강화하고, 감정 표현을 심화시키며, 창작자에게 새로운 표현의 가능성을 열어주는지를 분석한다. 본 연구에서는 전통적인 동양 족자와 현대 디지털 환경에서 널리 사용되는 세로 영상 사이의 공간 구성 방식을 비교 분석함으로써 새로운 시각적 언어와 미학적 가치를 탐색하고자 한다.

구조적 프로그래밍을 위한 언어 학습 시스템 (Language Education System with Structured Programming)

  • 박경욱;류남훈;김응곤
    • 한국전자통신학회논문지
    • /
    • 제5권5호
    • /
    • pp.459-464
    • /
    • 2010
  • 컴퓨터 프로그램은 기계, 우주, 항공, 의학을 비롯한 사회 전 분야에서 필요로 한다. 하지만 프로그래밍 교육과정은 수많은 교재와 동영상 강의에도 불구하고 어려워하고 있다. 프로그래밍 언어는 매우 다양하지만 대부분의 언어들은 동일한 구조를 사용하며, 표현 방식에 차이가 있을 뿐이다. 그래서 하나의 프로그래밍 언어를 습득하면 또 다른 언어를 배우는데 많은 시간과 노력을 기울이지 않아도 된다. 대부분의 프로그래밍 언어들은 일반적으로 순서, 선택, 반복 구조를 사용한다. 프로그래밍을 배우는 사람에게 중요한 것은 프로그램의 문법이 아니라 프로그램의 구조나 알고리즘이다. 본 논문에서는 순서도를 활용해 구조화된 프로그래밍을 학습할 수 있는 언어 학습 시스템을 설계하고 구현하였다.

SIMD를 이용한 영상의 고속 이진화에 관한 연구 (A Study on High-speed Image Binarization Using SIMD)

  • 김두식;이상호;김병근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.775-778
    • /
    • 2002
  • 영상 이진화란 명도 영상(gray-scaled image)을 이진 영상(bi-leveled image)으로 변환하는 것을 말한다. 영상 이진화는 문서 인식, 비디오 영상 분석 등과 같이 영상처리 분야에서 많이 사용되는 기본적인 영상 처리 과정에 해당한다. 본 논문은 Intel 사의 Pentium 계열 프로세서에서 지원하는 SIMD(Single-Instruction Multiple-Data) 기술을 이용하여 영상 이진화를 고속으로 수행하는 방법을 소개한다. 우편영상에 대하여 실험한 결과, SSE2 명령어로 구현된 프로그램은 기존의 C 언어로 구현된 프로그램에 비하여 4배 이상의 속도 향상을 보였다.

  • PDF

fMRI에 나타난 모국어와 외국어로서의 한국문자와 중국문자의 차이 (Two Languages in One Brain Shown by fMRI: Orthography Specific Effects in L2)

  • 이동훈;이홍재;문찬홍;유재욱;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.216-221
    • /
    • 2002
  • 본 연구는 문자 규칙 심층성이 다른 문자체계인 한국어와 중국어의 차이가 이중언어화자의 모국어 처리와 외국어 처리에서 각각 어떤 대뇌 활성화의 차이를 가져오는지 fMRI (functional Magnetic Resonance Imaging)를 이용하여 살펴보았다. 중국어 (Ll)-한국어(L2) 이중언어화자 및 한국어(Ll)-중국어(L2) 이중언어화자를 제 2언어 습득시기에 따라 초기 및 후기 이중언어화자로 구분하여 모국어 차이와 습득시기에 따른 영향을 알아보았다. 실험 1에서는 어휘 판단 과제(lexical decision task)를 실시하였고, 실험 2에서는 의미 판단 과제(semantic decision task)를 각각 실시하였다. 어휘판단과제를 사용한 실험 1의 결과는 음운처리와 관련된 좌반구 SMG(supramarginal gyrus), 하두정소엽(inferior parietal lobule, BA 39, 40)에서 중국어-한국어 초기 및 후기이중언어화자의 경우, 한국어 조건에서 보다 많은 활성화를 보였으나, 한국어-중국어 화자의 경우 활성화가 나타나지 않았다. 철자처리에 관련된 방추상회(fusiform gyrus, BA 37, 19) 영역에서는 중국어-한국어 화자뿐만 아니라, 한국어-중국어 인중언어화자의 경우도 중국어 조건에서 보다 많은 활성화를 보였다. 실험 2에서 사용한 의미판단과제의 경우, 중국어-한국어 이중언어화자의 경우 어휘판단과제를 사용한 실험 1의 결과에서 보고된 한국어 특정적인 반응, 즉 SMG영역에서의 활성화의 증가가 실험 2에서는 나타나지 않았다. 그러나 한국어-중국어 이중언어화자의 경우, 실험 1에서 나타난 것과 같이 철자처리 혹은 의미처리와도 관련된다고 보고되는 방추상회(fusiform gyrus)등의 영역 유의미한 차이를 나타났다. 이는 어휘 판단과제와 의미판단과제가 유도하는 뇌 활성화 양상이 다름을 시사한다. 종합해 볼 때, 이중언어화자의 뇌 영상 연구에서 어휘수준에서는 거의 공통적인 활성화를 보인다는 개략적 수준의 연구 결과를 넘어, 음운처리 및 철자처리와 같은 어휘접근 수준에서는 이중언어화자들의 뇌 활성화가 다르게 일어남을 보여주고 있다. 따라서 이중언어 화자의 뇌 기전을 밝히기 위해서도 보다 개략적 수준을 넘어 언어처리의 세부적인 수준에 따른 접근이 필요함을 시사한다.

  • PDF

공간 및 언어 과제 수행 시 소뇌의 편측화에 관한 뇌 기능 연구 (An fMRI study on the cerebellar lateralization during visuospatial and verbal tasks)

  • 정순철;손진훈;최미현;이수정;양재웅;이법이
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.425-432
    • /
    • 2009
  • 본 연구에서는 공간 및 언어 과제를 수행하게 하면서 뇌 기능 영상을 획득하여, 각 인지 과제 수행에 따른 소뇌 활성화 영역을 알아보고, 소뇌 편측화의 차이를 규명하고자 한다. 8명의 오른손잡이 남자 대학생(평균 $21.5{\pm}2.3$세)과 8명의 오른손잡이 남자 대학생(평균 $23.3{\pm}0.5$세)이 각각 공간 및 언어 과제 실험에 참여하였다. 3T MRI 에서 single-shot EPI 기법을 이용하여 뇌 기능 영상을 획득하였다. 뇌 기능 영상 데이터는 SPM-99 S/W 를 사용하여 분석하였다. 실험은 네 개의 블록으로 구성되며, 각 블록은 통제과제(1분), 인지 과제(1분)을 포함하며, 한 실험당 소요시간은 블록당 2분씩, 총 8분이었다. 감산법을 이용하여 공간 및 언어 과제에 대한 소뇌 활성화 영역을 알아보았고, 소뇌의 활성화 voxel 수를 이용하여 소뇌의 편측화 지수를 계산하였다. 두 인지 과제 수행 시 활성화된 소뇌 영역은 선행 연구와 비교하여 유사한 영역이었다. 두 인지 과제 모두 좌, 우소뇌 반구의 활성화 voxel 수가 비슷하여 소뇌 기능의 편측화가 나타나지 않았다.

  • PDF

언어 중추 영역에 대한 기능적 자기공명영상: 시각적, 청각적 지시 과제에 관한 비교 (Functional MR Imaging of Language System : Comparative Study between Visual and Auditory Instructions in Word Generation Task)

  • 구은회;권대철;김동성;송인찬
    • 대한의용생체공학회:의공학회지
    • /
    • 제24권4호
    • /
    • pp.241-246
    • /
    • 2003
  • 정상 성인을 대상으로 언어생성과제의 시각적 지시과제와 청각적 지시과제에 대한 기능적 MR영상들을 비교하고자 하였다. 6명의 정상 성인을 대상으로 자기공명영상기기를 이용하였다 시각적, 청각적 언어 지시과제는 명사의 언어를 이용하여. 휴지기. 확성기를 각각 6번 구성하였다. 뇌의 활성영역의 휴지기와 확성기의 신호변화에 따른 데이터는 MRDx 프로그램으로 처리하였고 cross correlation 방법으로 통계 처리하였다. 시각적, 청각적 지시과제의 분석방법은 lateralization index 공식으로 뇌 반구의 활성화 voxel의 총합과 좌$.$우 반구의 픽셀 수를 구하였고, 지시 과제에 대한 활성화 영역을 “Area of Activation Cells” 값에 따라 4등급으로 분류하여 비교 분석하였다. 시간적 청각적 지시과제에서 Broca, Wernicke 영역 등에서 크기는 다르지만 모두 활성화가 관찰되었다. lateralization index에서 뇌반구의 활성화 값에 차이는 시각적 지시과제에 비해 청각적 지시과제가 높은 활성화 값을 보였다. 그러므로 언어영역에 대한 뇌의 기능적 영상을 얻는데 두 방법 모두 유용하다고 생각된다.

TMS320C6201을 이용한 H.263 동영상 부호화기의 실시간 구현 (Real-time Implementation of H.263 Encoder Using TMS320C6201)

  • 김민성;정재호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.63-66
    • /
    • 2001
  • 본 논문에서는 TI사의 TMS320C6201 DSP를 이용하여 H.263 동영상 부호화기를 실시간 구현하고자 한다. 구현한 부호화기는 QCIF 형식의 영상을 사용하여 ITU-T H.263 권고안의 기본 모드를 따라 주로 C 언어와 intrinsics를 사용하여 구현하였다. 특히, 속도 향상을 위해서 고속 메모리의 사용을 극대화하는데 중점을 두었고, 연산량이 많은 모듈에 대한 최적화와 데이터의 병렬 처리 및 DMA (Direct Memory Access) 전송 등을 고려하여 구현하였다.

  • PDF

동영상 기반 자동 발화 심층 분석(SUDA) 어플리케이션 개발 (Development of the video-based smart utterance deep analyser (SUDA) application)

  • 이수복;곽효정;윤재민;신동춘;심현섭
    • 말소리와 음성과학
    • /
    • 제12권2호
    • /
    • pp.63-72
    • /
    • 2020
  • 본 연구는 동영상을 기반으로 일상생활에서 녹화한 아동 및 성인의 발화를 자동으로 분석해주는 SUDA(smart utterance deep analyser) 하이브리드 앱 개발에 관한 것이다. 특히, 아동과 부모가 원하는 시간 및 장소에서 상호작용하는 장면을 촬영하여 업로드할 수 있고 시간의 흐름에 따라 데이터를 계속 축적하여 이를 관찰하고 분석할 수 있도록 도울 수 있다. SUDA는 안드로이드폰, 아이폰, 태플릿 PC 기반에서 구동되며, 대용량의 동영상을 녹화 및 업로드할 수 있고, 사용자의 목적(일반인, 전문가, 관리자)에 따라 차별화된 기능을 제공할 수 있다. 전문가 모드에서는 자동화된 시스템과 협업하여 대상자의 발화를 말·언어적인 측면(비유창성, 형태소수, 음절수, 단어수, 말속도, 반응시간 등)에서 세부적으로 분석할 수 있다. 즉, SDUA 시스템이 대상자의 발화를 반자동으로 전사 및 분석하면, 언어치료사가 이를 검토하고, 보완하여 의사소통장애 진단과 중재 시 활용할 수 있다. 일반인(부모)의 경우, 전문가가 분석한 결과를 그래프 형태로 제공 받아 모니터링 할 수 있고, 관리자는 발화 분석, 영상삭제 등 전체 시스템을 관리할 수 있다. 본 시스템은 발화 분석의 반자동화로 치료사와 연구자의 부담을 줄여주고, 부모가 자녀의 발화를 기반으로 하여 말·언어발달에 대한 정보를 쉽고 다양하게 제공 받을 수 있다는 점에서 임상적 의의가 있다. 또한, 한국형 말더듬아동 진단 및 중재에 적용할 수 있는 종단데이터를 구축하고, 말더듬 회복 예측 요인들을 찾는 기초자료로 활용하고자 한다.