• 제목/요약/키워드: 영상 언어

검색결과 529건 처리시간 0.022초

웹GIS 기반의 실시간 피해정보제공시스템 개발에 관한 연구 (Development of Web-GIS based Real-time Damage Information System)

  • 김태훈;김계현;이철용
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.381-386
    • /
    • 2008
  • 본 연구에서는 현장 조사를 통해 얻어지는 피해정보를 광역적 무선통신을 이용해 전송하고 웹GIS의 지도상에 실시간으로 업데이트하여 보다 신속하고 효율적으로 관련 정보를 제공하는 실시간 피해정보제공시스템을 개하였다. 연구 대상지역은 매년 대형 태풍과 집중호우로 인한 피해가 발생하고 있는 부산시 강서구를 선정하였다. 도형 데이터베이스는 대상지역 $179.05km^2$에 대하여 1:5,000 및 1:1,000 수치지도를 기반으로 행정경계 등 7개의 주제도로 구축하였다. 또한, IKONOS위성의 1m급 고해상도 위성영상을 스트리밍 방식으로 구축하여 실제 피해현장과 주변 환경에 관한 정보들을 함께 제공할 수 있는 방안을 연구하였다. 웹GIS 시스템의 웹 프레임은 HTML과 ASP언어를 이용하여 개발되었으며, 맵 서비스 프레임은 ArcIMS를 이용하여 개발되었다. 현장에서 조사된 피해정보는 좌표를 기반으로 하여 웹GIS 시스템에 점으로 표출되며 재해대장 웹 페이지를 통해 피해지역의 영상 및 피해추정액등 세부적인 피해정보를 함께 제공하도록 하였다. 웹GIS 시스템은 피해현황을 GIS 데이터와 함께 실시간으로 제공함으로써 신속한 현장파악, 대응책 마련 및 복구계획 수립을 위한 의사결정에 활용 가능할 것이라 예상되며, 소방방재청에서 구축하고 있는 NDMS와 연계를 통하여 여러 국가기관에서 얻어지는 다양한 피해정보의 제공 또한 가능할 것이라 사료된다.

  • PDF

웹 환경에서의 MPEG-21테스트베드의 구현

  • 손정화;손현식;권혁민;조영란;김만배
    • 정보통신설비학회논문지
    • /
    • 제1권2호
    • /
    • pp.70-81
    • /
    • 2002
  • 1990년대 후반부터 다양한 디지털 통신망을 이용하여 멀티미디어 컨텐츠 서비스가 가능하게 되었다. 하지만 멀티미디어 컨텐츠의 전달 및 이용을 위한 기반 구조들의 독자적 발전 및 다양한 통합 관리 시스템 때문에 멀티미디어 컨텐츠 표현 방식의 호환성, 네트워크 방식과 단말기 등의 잠재적인 문제점이 발생한다. 이를 위해서 현재 존재하는 기술 및 기반 구조들 사이의 연동을 통한 큰 멀티미디어 프레임워크인 MPEG-21이 진행 중이다. 본 논문에서는 현재 표준화 작업이 진행 중인 MPEG-21을 기반으로 하는 웹 (Web) 기반 테스트베드를 제안한다. 기본적으로 테스트베드는 서버(server), 클라이언트(client), DIA(Digital Item Adaptation)의 세 모듈로 구성된다. 서버의 역할은 멀티미디어 컨텐츠를 Digital Item(DI)의 형태로 생성하고, 클라이언트가 DI를 요구할 경우 DIA 모듈을 통해서 변환된 DI를 클라이언트에게 제공한다. DIA 모듈은 서버에서 동작되며 클라이언트로부터 요청된 DI를 분석하고 클라이언트로부터 전송된 환경 정보를 이용하여 클라이언트 환경에 적합하게 변환된 (adapted) DI를 생성하는 것이 주 기능이다. 클라이언트는 서버에 저장되어 있는 DI를 선택하고 사용자 선호도(user preferences), 터미널 능력(terminal capabilities) 등의 필요한 정보를 서버로 전송한다. 테스트베드에서는 스포츠 경기의 동영상, 정지 영상, 경기 내용, 역사를 기록한 파일 등의 DI를 이용한다. 표현 언어는 XML이며, HTTP 기반의 웹 환경에서 구동되도록 설계된다.

  • PDF

CMOS 카메라 이미지 센서용 ISP 구현 (An Implementation of ISP for CMOS Image Sensor)

  • 손승일;이동훈
    • 한국정보통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.555-562
    • /
    • 2007
  • CMOS 이미지 센서로부터 수신한 베이어 입력 스트림을 디스플레이 장치로 보기위해서는 영상 신호처리를 수행해야 한다. 즉, 이러한 영상 신호처리를 수행한 부분을 ISP(Image Signal Processor)라 한다. ISP 처리를 통해서 실제 원본 이미지를 볼 수 있다. ISP는 감마교정, 인터폴레이션, 공간적 변환, 이미지 효과, 이미지 스케일, AWB, AE, AF 등과 같은 기능을 수행한다. 본 논문에서는 CMOS 카메라 이미지 센서용 ISP를 모델링하여 최적화 알고리즘을 소프트웨어 검증을 통해 도출하였으며, VHDL 언어를 이용하여 설계하고 ModelSim6.0a 시뮬레이터를 이용하여 검증하였다. 또한 보드 레벨의 검증을 위해 PCI 인터페이스를 이용하여 설계한 ISP 모듈을 자일링스 XCV-1000e에 다운로드하여 결과를 확인하였다.

트랜스포머를 이용한 GVQA 모델의 성능 개선에 관한 연구 (A Study on Performance Improvement of GVQA Model Using Transformer)

  • 박성욱;김준영;박준;이한성;정세훈;심춘보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.749-752
    • /
    • 2021
  • 오늘날 인공지능(Artificial Intelligence, AI) 분야에서 가장 구현하기 어려운 분야 중 하나는 추론이다. 근래 추론 분야에서 영상과 언어가 결합한 다중 모드(Multi-modal) 환경에서 영상 기반의 질의 응답(Visual Question Answering, VQA) 과업에 대한 AI 모델이 발표됐다. 얼마 지나지 않아 VQA 모델의 성능을 개선한 GVQA(Grounded Visual Question Answering) 모델도 발표됐다. 하지만 아직 GVQA 모델도 완벽한 성능을 내진 못한다. 본 논문에서는 GVQA 모델의 성능 개선을 위해 VCC(Visual Concept Classifier) 모델을 ViT-G(Vision Transformer-Giant)/14로 변경하고, ACP(Answer Cluster Predictor) 모델을 GPT(Generative Pretrained Transformer)-3으로 변경한다. 이와 같은 방법들은 성능을 개선하는 데 큰 도움이 될 수 있다고 사료된다.

VRML을 이용한 융합 영상에서 간질환자 발작 진원지의 3차원적 가시화와 위치 측정 구현 (Visualization and Localization of Fusion Image Using VRML for Three-dimensional Modeling of Epileptic Seizure Focus)

  • 이상호;김동현;유선국;정해조;윤미진;손혜경;강원석;이종두;김희중
    • 한국의학물리학회지:의학물리
    • /
    • 제14권1호
    • /
    • pp.34-42
    • /
    • 2003
  • World Wide Web (WWW)에서 Virtual Reality Modeling Language (VRML)를 이용하는 3차원 (3D) 디스플레이는 사용자에게 직관적인 정보를 더 효과적으로 제공해 준다. 웹을 기반으로 하는 해부학적 영상과 융합되는 기능적 영상의 3D 가시화는 아직까지 체계적인 방식으로 연구가 활발히 진행되지 않았다. 이 연구의 목적은 2D 영상들과 함께 웹에서 VRML을 이용하여 구현되는 3D 해부학적 표면 영상들과 기능적 표면 영상들을 동시적으로 관찰할 수 있게 하고 VRML을 통해 만들어진 거리 측정 도구를 가지고 관심영역의 공간적인 위치 정보를 제공하는 것이다. 본 연구에서는 한 명의 간질 환자로부터 Magnetic Resonance (MR) 축면 영상과 발작기 및 발작간기 Single Photon Emission Computed Tomography (SPECT) 축면 영상들을 각각 획득하였다. 발작 진원지의 확인을 향상시키기 위해서 subtractionictal SPECT coregistered to MRI (SISCOM)을 수행하였다 SISCOM 결과로 나타난 각 2D 영상들은 모든 voxel들의 평균값 위로 1-표준편차와 2-표준편차에 해당하는 문턱 이상의 영상 값을 갖도록 하였다. SISCOM으로 나타나는 간질 발작 진원지들과 MRI 영상에서 회색질, 백색질 및 뇌척수액의 경계들을 각각 분할하고 marching cube 알고리즘에 의해 VRML 표면 영상들로 나타내었다. 축면 영상에서 실제 거리를 나타내는 x, y축의 길이를 획득하고 z축선의 길이를 계산하였다. VRML을 이용한 거리 측정도구를 만들어 이전의 VRML 표면 영상들과 융합하였다. MRI 영상을 이용하여 3D 표면 영상들의 단면을 나타내고 3D 표면 영상들의 투명도를 설정하기 위해 Java Script 루틴을 사용자 인터페이스 도구로서 삽입하였다 웹 페이지에서 구현되는 3D 표면 영상들의 투명도와 관찰 위치를 조절함에 따라 모델들 사이의 공간적인 정보를 직관적으로 알 수 있었다. 간질 발작 진원지에 대응하는 해부학적 구조를 3D 표면 영상들을 가로지르는 MRI 평면 영상들을 통해서 확인하였다 간질 발작 진원지는 뇌의 오른쪽 측두엽에서 나타났고 공간적으로 발작 진원지의 실제 위치를 VRML 거리 측정 도구에 의해 알 수 있었다. 결론적으로 본 연구에서 제시하는 웹에 근거한 3D 융합 영상의 가시화와 위치 측정은 진단 및 치료 방사선학과 외과학 등의 분야에서 온라인 방식의 연구와 교육에 있어 많은 도움을 줄 것이다.

  • PDF

4.7T 고자장 초전도 자석에서 Tailored RF를 이용한 고양이 뇌의 자화율 강조영상법에 의한 자기공명혈관 조영술 (Susceptibility-Contrast-Enhanced MR Venography of Cat Brain Using Tailored RF Pulse at High Magnetic Field of 4.7 Tesla Superconducting Magnet)

  • 문치웅;김상태;이대근;임태환;노용만;조장희;이윤
    • 한국의학물리학회지:의학물리
    • /
    • 제5권1호
    • /
    • pp.55-66
    • /
    • 1994
  • 4.7T의 고자장 자기공명 영상(Magnetic Resonance imaging : MRI) 장치에서 Tailored RF 경사자계반향(Tailored RF Gradient-Echo : TRGE)기법을 이용하여 phantom 영상과 고양이 뇌의 정맥혈관 영상을 얻었다. 증류수에 MgCl$_2$를 섞어 T1을 짧게한 지름 6cm의 원통형 phantom으로 TRGE기법에 대한 검증을 먼저 하였다. 이후 halothane으로 전신 마취된 몸무게 3.0~4.0kg의 고양이 뇌로부터 얻은 시단면(sagittal slice) 영상에서 Dorsal sagittal sinus, Straight sinus, Vein of corpus callosum과 Internal cerebral vein등의 혈관이 강조되어 나타남을 고양이 뇌의 해부학적 그림과 비교해 보였다. Tailored RF 파형은 ASPECT 3000 computer(스위스 BRUKER사 제품)의 PASCAL 언어를 이용하여 제작하였다. 사각형의 절편모양(slice profile)과 원하는 절편의 두께(slice thickness)에 선택절편내에서 절편방향으로 위상분포가 최대 2$\pi$가 되는 bi-linear ramp 모양을 갖는 절편함수를 공간상에서 Fourier 변환시켜 Tailored RF를 만들었다. TR/TE=205/10 msec, 절편두께 TH=7mm, 화소배열수(matrix size)=256$\times$256, 평면해상도(in-plane resolution)=0.62$\times$0.31mm$^2$, 관심영역 크기(field of view : FOV)=8cm의 영상조건으로 자기공명 TRGE 영상을 얻었다.

  • PDF

MPEG 동영상 컨텐츠 보호를 위한 양자화-적응적 워터마킹 알고리즘 (A Quantization-adaptive Watermarking Algorithm to Protect MPEG Moving Picture Contents)

  • 김주혁;최현준;서영호;김동욱
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.149-158
    • /
    • 2005
  • 본 논문에서는 동영상 컨텐츠의 위${\cdot}$변조, 불법사용 및 복제를 방지하기 위하여 비가시성과 공격에 대한 강인성을 동시에 만족하는 blind 워터마킹 방법을 제안하였다. 이 방법은 MPEG-2 동영상 압축시스템을 대상으로 하며, 이 압축시스템의 적응적 양자화에 부합하도록 양자화 스케일 코드에 따라 삽입할 워터마크 비트 수를 조절하도록 설계하였다. 워터마크의 삽입위치는 영상의 주파수 특성에 따라 삽입할 영상블록을 선정하고, 선정된 영상블록의 가로, 세로, 대각선의 주파수 특성과 블록내의 각 계수의 주파수 특성을 고려하여 계수를 선정하였다. 또한 각 계수에 삽입할 워터마크 비트 수는 양자화 스텝을 고려하여 결정하였다. 이 알고리즘은 C/C++ 언어로 구현하였으며, 자체 제작한 MPEG-2 시스템을 테스트 베드로 하여 비가시성과 강인성을 실험하였다. 실험결과 삽입한 워터마크의 비가시성이 충분히 만족되었고, 일반적인 공격방법에 대해 추출된 워터마크의 에러율이 $10\%$ 이하의 강인성을 보였다. 따라서 제안한 방법은 MPEG-2 시스템을 사용하는 동영상 압축, 특히 네트워크 적응적 압축이 필요한 응용분야에서 매우 유용하게 사용될 수 있으리라 사료된다.

입술움직임 영상신호를 고려한 음성존재 검출 (Speech Activity Decision with Lip Movement Image Signals)

  • 박준;이영직;김응규;이수종
    • 한국음향학회지
    • /
    • 제26권1호
    • /
    • pp.25-31
    • /
    • 2007
  • 본 논문은 음성인식을 위한 음성구간 검출과정에서, 음향에너지 이외에도 화자의 입술움직임 영상신호까지 확인하도록 함으로써, 외부의 음향잡음이 음성인식 대상으로 오인식되는 것을 방지하기 위하여 시도한 것이다. 먼저, PC용 화상카메라를 통하여 영상을 획득하고, 입술움직임 여부가 식별된다. 그리고 입술움직임 영상신호 데이터는 공유메모리에 저장되어 음성인식 프로세스와 공유한다. 한편, 음성인식의 전처리 단계인 음성구간 검출과정에서는 공유메모리에 저장되어 있는 데이터를 확인함으로써 사람의 발성에 의한 음향에너지인지의 여부를 확인하게 된다. 음성인식기와 영상처리기를 연동시켜 실험한 결과, 화상카메라에 대면해서 발성하면 음성인식 결과의 출력까지 정상적으로 진행됨을 확인하였고, 화상카메라에 대면하지 않고 발성하면 음성인식 결과를 출력하지 않는 것을 확인하였다. 이는 음향에너지가 입력되더라도 입술움직임 영상이 확인되지 않으면 음향잡음으로 간주하도록 한 것에 따른 것이다.

만화영상학의 학문적 체계화를 위한 융합적 연구 (A Convergence Study for the Academic Systematization of Cartoon-animation)

  • 임재환
    • 만화애니메이션 연구
    • /
    • 통권43호
    • /
    • pp.285-320
    • /
    • 2016
  • 만화와 애니메이션은 문학적 글과 소리로 기술한 언어예술(言語藝術)과 미술적 그림으로 시각화한 조형예술(造形藝術)과 영화적 움직임으로 제작한 영상예술(映像藝術)을 복합적으로 응용하여 창작하는 융합예술(融合藝術)이다. 그런데 만화와 애니메이션이 20세기 후반기부터 뒤늦게 대학의 전공 학과로 개설 운영되어 학문적 연구 개발과 예술적 창작 표현이 충족되지 못하였다. 따라서 만화와 애니메이션의 학문적 체계화를 위하여 용어적 개념과 정의, 역사적 전개와 발전, 연구 영역과 탐구 방법, 그리고 전공 교육과 관련 창업군 등을 융합적으로 정립할 필요성이 대두되고 있다. 최근 포털사이트 네이버와 형설출판사가 공동 운영하는 "학문명백과(學問名百科)" 서비스에도 만화를 비롯한 애니메이션, 영상, 게임, 콘텐츠 등의 신종 문화예술 산업 분야가 등재되지 못하고 있다. 무엇보다도 만화와 애니메이션은 불가분의 관계라서 설령 분리 독립하여 쓰더라도, 합성어로 구성된 '만화영상학(漫畵映像學, animatoon)'을 학문명과 학위명으로 원용하면서 세부 전공을 만화와 애니메이션, 영상과 게임 그리고 콘텐츠 등으로 정립하는데 연구 목적이 있다. 서론에서 만화영상은 만화와 애니메이션의 축약형 합성어로 만화(漫畵)가 한자로 동양에서 통용하는데, 애니메이션은 한자와 로마자가 상(像)+영상(映像)+화상(畵像)+동화(動畵)+동영상(動映像)+동만화(動漫畵)+만화영화(漫畵映畵)이거나 image, pictorial image, ani, anime, animation, animated cartoon, cartoon animation, moving picture 등으로 난삽하여 이를 융합한 만화영상학(漫畵映像學, animatoon)으로 규명하고 학문적으로 체계화하여 학문명과 학위명으로 원용하고자 한다. 본론에서 첫째, 역사적 전개와 발전은 고대 중세 근대 현대의 만화영상으로 시대를 구분하여 동굴벽화, 동물희화, 종교만화, 캐리커처, 카툰, 풍자만화, 코믹스, 애니메이션, 2D+3D, 웹툰, K-toon 등으로 변천사를 미학예술론적으로 융합 분석하였다. 둘째, 만화영상학의 연구 영역을 이론+장르+작품+작가 연구를 살펴보고, 탐구 방법으로 인문사회+과학기술+문화예술 등과 융복합한 전공과목을 제시하였다. 그리고 셋째, 전공 교육은 아동+청소년+전공 학생의 만화영상 교육을 고찰하고, 만화영상의 창업군은 개인적 작품창작과 집단적 제작창업 활동을 다양한 직업군으로 탐색하였다. 결론적으로, 만화영상학의 현안과제로는 작가들의 개성화, 내용의 전문화, 형식의 다양화, 창작의 자율화를 고찰하고, 발전 방향으로 만화영상의 학문화 예술화 문화화 산업화를 제창한다. 21세기 문화의 세기에 만화와 애니메이션은 영상과 게임과 함께 그 중요성이 높아져 만화영상학의 학문적 체계화를 위한 융합적 연구로 예술적 창작활동과 문화산업의 콘텐츠로 개발해야 영속한다.

$H_2^{15}O$ 양전자단층촬영술을 이용한 뇌기능 지도 작성(I): 통계적 파라메터 지도작성법 (Functional Brain Mapping Using $H_2^{15}O$ Positron Emission Tomography ( I ): Statistical Parametric Mapping Method)

  • 이동수;이재성;김경민;정준기;이명철
    • 대한핵의학회지
    • /
    • 제32권3호
    • /
    • pp.225-237
    • /
    • 1998
  • 목적: $H_2^{15}O$ 양전자단층촬영으로 작업기억을 조사할 때 뇌기능을 국소화한 뇌기능지도를 만들기 위해 동원되는 통계적 가정과 추론의 여러 방법을 해석하고 뇌활성화와 관련된 뇌기능 국소화 방법에 영향을 미치는 요소를 조사하였다. 대상 및 방법: 정상인 6명에 대하여 각각 대조과제, 언어성 작업기억 활성화과제 2종류, 시각적 작업기억 활성화과제 1종류를 수행시키며 뇌혈류 $H_2^{15}O$ PET 촬영을 시행하였다. SPM96 소프트웨어를 이용하여 각 영상과 표준지도의 뇌피질 경계가 일치 되도록 부분 선형적으로 변형하였으며 선형화한 비선형적 변형 방법으로 사람에 따라 나타나는 뇌피질 및 내부 구조의 미세한 차이를 제거하였다. 공간정규회된 영상들을 16mm의 FWHM을 갖는 가우시안 커널로 중첩적분하여 편평화하였다. 각 화소의 방사능 계수는 뇌피질전체 뇌혈류, 활성화에 의한 특정 효과, 여러 교란변수의 영향과 오차의 선형 결합으로 이루어진다는 일반선형모델을 가정하고 공분산분석 방법으로 전체 뇌혈류 차이를 제거하였다. 각 화소의 방사능 계수가 자극과 뇌활성화 작업에 상관없을 경우 평탄한 무작위 가우스장의 행동을 따른다고 가정하고 특정화소의 계수차이가 이 무작위장의 정상적인 교란 이상인지 검정하였다. 화소별 t 값을 Z 값으로 바꾸어 표현하고 가설검정 결과에 따라 화소, 덩어리, 화소 또는 덩어리의 차이가 얼마나 유의한지 제시하였다. 결합분석을 하여 여러 과제를 수행할 때 동시에 화소의 계수가 증가하는 곳을 찾았다. 각 화소의 Z 값을 3차원으로 렌더링한 표준지도와 투명유리뇌에 투사하여 활성화된 부위를 알아볼 수 있게 하였다. 결과: 피검자 모두 성공적으로 검사를 마쳤으며 대조 과제와 기억 과제를 수행하는 동안 피험자는 평균 95%를 맞췄다. 활성화된 덩어리의 개수는 언어성 기억과제 I에서 4개, 언어성 기억과제 II에서 9개, 시각적 기억과제에서 9개, 결합분석에서 6개였다. 언어성 기억과제에서는 주로 왼쪽 뇌가, 시각적 기억과제에서는 오른쪽 뇌가 활성화되었다. 결론: $H_2^{15}O$ 양전자 단층촬영술과 통계적 파라메터 지도작성법이 언어성 및 시각적 작업기억과 관련되어 활성화된 지 영역을 찾는데 유용하였다.

  • PDF