• 제목/요약/키워드: 영상 언어

검색결과 530건 처리시간 0.027초

비디오에 대한 말풍선 효과 합성 (Word-balloon effects on Video)

  • 이선영;이인권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.332-334
    • /
    • 2012
  • 최근 영화나 드라마 같은 미디어 데어터가 폭발적으로 증가하면서, 다양한 언어로 번역된 자막 데이터도 증가하고 있다. 이러한 자막은 대부분 화면 하단이나 우측에 위치가 고정되어 나타내는 방식을 취하고 있다. 그러나 이 방식에는 몇 가지 한계점을 가지고 있다. 자막과 등장인물의 얼굴이 거리가 먼 경우, 시청자의 시선이 분산되어 영상에 집중하기 어렵다는 점과 청각장애를 가진 사람의 경우 자막만으로는 누가 말하고 있는 대사인지 혼동이 온다는 점이다. 본 논문에서는 만화에서 대사를 전달하기 위해 사용하던 말풍선을 동영상의 자막을 나타내는데 사용하는 새로운 자막 시스템을 제안한다. 말풍선을 사용하면 말꼬리로 화자의 위치를 가리키고, 시청자의 시선을 화자의 얼굴 근처에 집중시킴으로써 기존 자막이 갖는 한계점을 개선시킬 수 있다. 본 연구의 결과물을 검증하기 위해 사용자 평가를 실시했고, 기존의 자막 방식에 비해 시선의 안정성과 흥미성, 정확도에서 더 낫다는 결과를 얻을 수 있었다.

ET 영상복원에서 클러스터 컴퓨팅에 의한 자코비안 계산의 속도 향상 기법 (A performance enhancement scheme for Jacobian matrix via cluster computing on ET image reconstruction procedure)

  • 이정훈;손수방
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.343-345
    • /
    • 2002
  • 본 논문은 차원이 큰 행렬 연산 때문에 많은 계산 시간을 필요로 하는 ET 영상 복원 응용의 속도를 개선하기 위하여 3 대의 PC로 구성된 클러스터를 구축하고 복원 과정 중 가장 많은 시간을 차지하는 자코비언 행렬 계산에 대해 병렬 계산 기법을 제시한다. 각 노드는 리눅스 운영체제, MPI, 산술 계산 라이브러리 등을 탑재하여 C 언어로 옹용이 작성될 수 있으며 자코비언 행렬은 각 계산 루프의 데이터 독립성이 강하므로 병렬 계산의 장점을 최대화 할 수 있다. 구현된 클러스터 자코비언 프로그램은 주어진 인자를 분석하여 MPI 프리미티브에 의해 각각의 노드에 분배시키고 각 노드들로 하여금 자신의 계산 라이브러리를 이용하여 계산하게 한 다음 이 부분 결과를 모아 최종적인 자코비언 행렬을 생성한다. 이 프로그램을 클러스터에서 수행시키고 그 수행시간을 측정한 결과 기존의 자코비언 프로그램에 비해 최대 40% 까지 수행시간을 단축시킬 수 있었으며 추후 행렬의 차원이 증가할 경우 클러스터 컴퓨팅에 의한 성능 개선을 기할 수 있다.

  • PDF

확산 텐서 영상으로부터 신경섬유 경로의 생성과 알츠하이머 환자와 정상인의 비교 분석 (Construction of the Fiber Pathways from Diffusion Tensor Imaging and Comparative Analysis of the Fiber Pathways of Alzheimer patient and Normal People)

  • 이욱;박병규;한경숙
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.747-750
    • /
    • 2013
  • 알츠하이머병은 치매의 주요 원인 중 하나로 기억, 판단, 언어 등의 지적 기능의 감퇴뿐만 아니라 인격, 행동양상 장애 등을 동반하며 결국은 환자를 죽음에 이르게 하는 위험한 병이다. 본 연구는 뇌 백질의 비등방성을 잘 보여줄 수 있는 확산 텐서 영상 (diffusion tensor imaging; DTI) 데이터로 부터 신경섬유 경로를 생성하고, 알츠하이머병 환자와 정상인의 신경섬유 경로의 특징을 비교 분석 하였다. FSL 프로그램을 사용하여 생성한 신경섬유 경로에서 알츠하이머 환자와 정상인 집단간의 신경섬유 경로는 부피와 밝기에 커다란 차이를 보인다. 특히, 신경섬유 경로의 부피에서 현저한 차이가 있다는 점은 알츠하이머의 조기 진단에 유용하게 사용될 수 있다.

3D 모델링을 활용한 메타버스 가상 도시 구현 (Implementation of Metaverse Virtual City Using 3D Modeling)

  • 정에스더;서용덕
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.149-150
    • /
    • 2022
  • 본 연구는 현실과는 다른 공간, 시대 및 문화적 배경 등을 디자인하고 그 속에서 살아가는 메타버스 가상 세계를 작품으로 제시한다. 제시된 작품인 언플래닛 시티(Unplanet City)는 상징적 의미가 담긴 조형 언어를 통해 새롭게 창조된 도시를 의미하며, 기존 도시와 대칭점에 있는 상상 속 세상이다. 현재 우리가 사는 플래닛과 대칭되는 언플래닛 시티에는 상징적인 건축물로 가득하며, 이 건축물들은 3D로 표현되었다. 언플래닛 시티는 작품 전체가 전시 공간이 되는 새로운 전시 공간의 활용과 확장 가능성에 목적을 둔다.

  • PDF

공항 내 시설 안내 서비스를 위한 마커리스 한국 수어 인식 기술 (Keypoint-based Korean sign language recognition for guiding airport facilities)

  • 박한무;정윤영
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.476-478
    • /
    • 2020
  • 공항은 다양한 시설들이 혼재되어 있는 복합 공간으로 원하는 장소로 이동하기 위해서는 지도나 표지판뿐만 아니라 유·무인 안내 서비스를 이용하는 것이 필수적이다. 그러나 이러한 시설 안내 서비스는 이용객의 대다수를 차지하는 비장애인을 기준으로 설계되어 있는 것이 대부분이며, 특히 청각장애인은 음성 언어인 한국어를 통한 의사소통이 어려워 이러한 안내 서비스의 사각 지대에 놓여있다고 볼 수 있다. 본 논문에서는 청각장애인을 대상으로 공항 내 시설 위치 안내 서비스를 제공하는 키오스크를 구현하기 위해 마커리스(makerless) 한국 수어 인식 기술을 적용하는 방법을 제안한다. 기존의 알고리즘들이 수어를 인식하기 위해 사용자의 신체에 마커(marker)를 부착하거나 사용에 제약이 있는 깊이, 자기장 센서 등을 활용한 데 반해, 특징점 기반의 인식 기술은 별도의 마커 없이 RGB 영상만을 활용하여 수어를 인식하기 때문에 사용자의 편의성을 극대화할 수 있는 방법이다. 영상 기반의 마커리스 수어 인식 기술을 위치 안내 키오스크에 적용함으로써 청각장애인이 다른 사람의 도움 없이 공항 시설을 쉽고 안전하게 이용할 수 있도록 지원할 수 있으며, 나아가 배리어프리 (barrier-free) 공항을 구현하는 데에 큰 도움이 될 수 있을 것으로 기대된다.

  • PDF

실시간 영상 감시를 위한 웹 카메라 시스템의 구현에 관한 연구 (A Study on the Implementation of the Web-Camera System for Realtime Monitoring)

  • 안영민;진현준;박노경
    • 전기전자학회논문지
    • /
    • 제5권2호
    • /
    • pp.174-181
    • /
    • 2001
  • 본 논문에서는 인터넷 상에서 실시간 영상 감시를 위한 웹 카메라 시스템의 구조를 제안하고 구현하였다. 구현된 웹 카메라 시스템은 구현 방식에 따라 두 가지로 개발되었다. 첫 번째 시스템에서는 웹서버와 카메라 서버가 서로 동일한 시스템 상에서 구현되어 동작되도록 하였다. 이 시스템에서는 동영상 파일이 주기적으로 JPEG 파일로 압축되어 인터넷을 통하여 사용자에게 전달된다. 두 번째 시스템에서는 웹서버와 카메라 서버가 서로 다른 시스템에 구현되도록 하여 카메라 서버가 동영상 파일을 웹서버로 전송하면 최종적으로 웹서버에 접속한 사용자에게 동영상 파일을 전송하도록 하였다. JPEG으로 압축된 영상 이미지의 전송을 위하여 본 시스템은 자바 애플릿과 자바 스크립트를 사용하여 개발되었는데 이는 ActiveX나 스크립트 언어만을 사용한 경우보다 운영시스템과 브라우저에 독립적으로 동작할 수 있게 하기 위함이다. 본 논문에서 구현된 두 가지 구조의 시스템의 성능 비교를 위하여 각 시스템에 대하여 전송되는 데이터의 트래픽을 초당 바이트 단위로 측정하여 그 결과를 시뮬레이션 하였다.

  • PDF

적응적 베이즈 영상분할을 이용한 경계추출 (Boundary Detection using Adaptive Bayesian Approach to Image Segmentation)

  • 김기태;최윤수;김기홍
    • 한국측량학회지
    • /
    • 제22권3호
    • /
    • pp.303-309
    • /
    • 2004
  • 영상의 밝기값과 텍스쳐 모두를 사용하여 대상물의 경계를 보다 정확하게 추출할 수 있는 적응적 베이즈 영상 분할기법을 C 프로그래밍 언어로 개발하였다. 사전확률밀도함수를 추정하기 위하여 깁스 분포 모델을 적용하였고, 조건확률밀도함수를 추정하기 위하여 퍼지 C-군집화 기법을 도입하였다. 추정된 두 확률밀도함수로부터 최대 사후주변확률이 산출되었고, 이를 시뮬레이션영상에 적용하여 99% 이상의 신뢰도를 획득하였다. 또한 개발된 알고리즘을 1963년 미 정찰위성사진을 이용하여 제작한 남극 정사영상에 적용하여 남극 전체 해안선에 대하여 최대 300미터 정확도를 갖는 벡터지도를 제작하였다.

라인메모리 유형에 따른 이미지 처리 속도의 분석 (Analysis of the Image Processing Speed by Line-Memory Type)

  • 한시연;정세민;강봉순
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.494-500
    • /
    • 2023
  • 영상처리는 현재 다양한 분야에서 활용되고 있다. 그중 자율주행 자동차, 의료 영상처리, 로봇 제어 등은 빠른 영상처리 응답 속도가 필요하다. 이를 충족하기 위해 실시간 처리를 위한 하드웨어 설계가 활발히 연구되고 있다. 하드웨어 처리 속도는 입력 영상의 크기 외에도, 이미지에서 라인과 프레임을 구분하는 비활성화 영상 공백 구간의 크기에 영향을 받는다. 본 논문에서는 비활성화 영상 공백 구간과 밀접한 관련이 있는 라인메모리 유형에 따라 세 가지 스케일러 구조를 설계한다. 이 구조들은 Verilog 표준 언어를 사용하여 하드웨어로 설계되고, Xilinx Vivado 2023.1을 이용하여 field programmable gate array 환경에서 논리회로로 합성된다. 합성된 결과는 실시간 처리할 수 있는 표준 이미지 크기를 비교하면서 프레임 레이트 분석에 사용된다.

공간주파수를 이용한 장면영상에서 텍스트 검출 (Text Detection in Scene Images using spatial frequency)

  • Sin, Bong-Kee;Kim, Seon-Kyu
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.31-39
    • /
    • 2003
  • 장면 영상 속의 분사 영역에는 다른 부분과는 구분되는 특징적인 공간주파수가 있다. 이 특징은 직관적이며 또한 유용한 정보로서의 가치가 있다. 본 논문에서는 장면 영상에서 수평 텍스트를 찾는 방법을 제안한다. 수직 및 수평 방향으로 걸친 edge 픽셀의 빈도수와 푸리에 변환에 의한 기본 주파수의 두 가지 특징을 이용한 방법이다. 두 가지 특징을 독립적으로 활용하여 그 결과를 결합하거나 연속하여 적용하여 원하는 결과를 얻을 수 있다. 이와 같은 특징은 대체로 언어 또는 문자에 무관함을 확인하였다. 이에 추가하여 Hough 변환을 이용한 장면 속의 사각형을 탐색하였다. 여러 사람들에게 유용한 정보는 보통 강한 색상대비로 눈에 잘 띄는 색깔의 사각형 안에 씌어있는 경우가 보통이므로 사자형의 탐색함으로써 보다 효과적으로 문자를 탐색할 수 있다.

스릴러장르 영화 오프닝 시퀀스의 시각적 리듬 - '아이덴티티(Identity)'를 중심으로 (Visual Rhythm of Thriller Movies's Opening Title - Focusing on Identity)

  • 신승윤;성봉선;김재호
    • 한국멀티미디어학회논문지
    • /
    • 제13권9호
    • /
    • pp.1365-1372
    • /
    • 2010
  • 영상 정보는 시간적 질서화를 통해 시각적 리듬(Visual Rhythm)으로 느껴질 수 있다. 영상 분석의 기본 단위인 샷은 다양한 시간적 조합을 가지며 관객의 심리적 느낌에 영향을 준다. 여기에 등장인물의 시점샷은 심리적 긴장을 조절하며 스토리의 밀도를 조절한다. 이러한 변에서 샷 지속시간과 시점샷의 상관관계 분석은 시각적 리듬 연구에 도움이 될 수 있다. 분석 대상은 스릴러 장르 작품 중 아이덴티티(Identity)를 선정하였다. 이 작품은 오프닝 시퀀스 분야의 거장인 카일 쿠퍼(Kyle Cooper)의 작품이다. 이 분석 결과는 상징적이고 함축적인 영상 언어의 표현에 도움이 될 수 있다고 사료된다.