• Title/Summary/Keyword: 영상 언어

Search Result 530, Processing Time 0.028 seconds

GeoNet: Web-based Renotely Sensed Image Processing System (GeoNet: 웹 기반 위성영상 처리)

  • Ahn, Chung-Hyun;Kim, Kyung-Ok
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.8 no.2 s.16
    • /
    • pp.109-116
    • /
    • 2000
  • GeoNet is java-based remotely sensed image processing system. It is based on java Ibject-oriented paradigm and features cross-platform, web-based execution and extensibility to client/server remotely sensed image processing model. Remotely sensed image processing softwares made by java programming language can suggest alternatives to meet readily demand on remotely sensed image processing in proportion to increasement of remotely sensed data.

  • PDF

Cognitive Neruopsychological Assessment and fMRl Study in an Acquired Dyslexic Patient : A case study (후천성 난독증에 대한 인지신경심리학적 언어행동평가와 대뇌 활성화 양상 : 단일사례연구)

  • Sohn, Hyo-Jeong;Pyun, Sung-Bom;Nam, Ki-Chun
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.270-272
    • /
    • 2004
  • 본 논문에서는 뇌손상으로 인하여 난독증을 보이는 환자를 대상으로 시각적 단어 재인과정에 대한 평가와 기능적 자기공명영상기법을 통한 언어처리과정의 대뇌활성 양상을 살펴봄으로써 난독증의 특성을 알아보고자 한다. 인지신경심리학적 언어행동평가를 통해 환자 JYM는 자소-음소 변환(grapheme-phoneme conversion)경로와 직접 경로(direct route) 모두가 손상된 심층성 난독증(deep dyslexia)으로 보이며. 기능적 자기공명영상촬영 결과 언어처리과정에서 특정한 언어관련영역보다 등외측전전두영역과 시각피질의 활성이 증가되는 양상을 나타냈다.

  • PDF

Language Identification of Character-level in Document Image (문서영상의 낱자 단위 언어 구분)

  • 권세광;오일석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.613-615
    • /
    • 2003
  • 본 논문은 문서 구조분석을 통해 얻어진 텍스트 영상에 대해 낱자 단위 분할 과정과 분할된 낱자에 대한 언어 구분 방법을 제안한다. 먼저 8방향 연결 요소를 이용한 레이블링을 수행하고 각 레이블의 거리관계와 한글 종모음의 특징을 이용하여 낱자 분리를 수행한다. 분리가 이루어진 낱자의 언어 구분은 각 낱자에 존재하는 concavity 특징을 이용하여 한글과 영어로 구분하게 된다. Concavity 특징을 찾기 위해 낱자를 이루는 흑화소 중 수직런을 이루는 흑화소 중 일부와 세리프 성분을 제거하며 그 방법을 기술한다. concavity 특징은 분리기를 통해 한글과 영어 두 가지로 분리되며, 분류기는 신경망을 이용한다. 제안된 방법은 20개의 텍스트 영상에 총 7923개의 낱자를 대상으로 실험하였으며, 낱자 분리는 97.20%의 정확도를 보였으며 분리된 낱자에 대한 언어 구분은 92.70%의 정확도를 얻을 수 있었다.

  • PDF

Real-Time Visual Grounding for Natural Language Instructions with Deep Neural Network (심층 신경망을 이용한 자연어 지시의 실시간 시각적 접지)

  • Hwang, Jisu;Kim, Incheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.487-490
    • /
    • 2019
  • 시각과 언어 기반의 이동(VLN)은 3차원 실내 환경에서 실시간 입력 영상과 자연어 지시들을 이해함으로써, 에이전트 스스로 목적지까지 이동해야 하는 인공지능 문제이다. 이 문제는 에이전트의 영상 및 자연어 이해 능력뿐만 아니라, 상황 추론과 행동 계획 능력도 함께 요구하는 복합 지능 문제이다. 본 논문에서는 시각과 언어 기반의 이동(VLN) 작업을 위한 새로운 심층 신경망 모델을 제안한다. 제안모델에서는 입력 영상에서 합성곱 신경망을 통해 추출하는 시각적 특징과 자연어 지시에서 순환 신경망을 통해 추출하는 언어적 특징 외에, 자연어 지시에서 언급하는 장소와 랜드마크 물체들을 영상에서 별도로 탐지해내고 이들을 추가적으로 행동 선택을 위한 특징들로 이용한다. 다양한 3차원 실내 환경들을 제공하는 Matterport3D 시뮬레이터와 Room-to-Room(R2R) 벤치마크 데이터 집합을 이용한 실험들을 통해, 본 논문에서 제안하는 모델의 높은 성능과 효과를 확인할 수 있었다.

Chinese and Korean Cross Lingual News Detection in Twitter (트위터에서 이슈가 되고 있는 중국어-한국어 교차언어 뉴스 탐지)

  • Zhao, Shengnan;Tsolmon, Bayar;Lee, Kyung-Soon;Lee, Yong-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.658-661
    • /
    • 2012
  • 국제적으로 이슈가 되고있는 사건들의 뉴스는 보도당국의 입장차이에 따라 동일 이슈에 대한 관점의 차이를 나타낸다. 교차언어 연구에서는 번역하는 과정이 중요하다. 본 논문에서는 중-한 어휘번역에서 발생하는 오류 및 모호성을 해결하기 위해 키워드를 중심으로 문맥 어휘를 이용해서 번역한 후 번역결과에서 빈도가 높은 한국어 어휘를 선택하는 방법을 제안한다. 제안 방법의 유효성을 검증하기 위해 소셜 이슈 3 개에 대한 트윗 데이터에서 실험하여 추출된 중-한 이슈 뉴스 결과에서의 정확도 85.8%의 성능을 보였다. 실험을 통해 제안 방법이 중-한 교차언어 트위터 데이터에서 동일한 이슈와 관련된 뉴스를 찾는데 효과적인 방법임을 알 수 있다.

A Study on the Robust Bimodal Speech-recognition System in Noisy Environments (잡음 환경에 강인한 이중모드 음성인식 시스템에 관한 연구)

  • 이철우;고인선;계영철
    • The Journal of the Acoustical Society of Korea
    • /
    • v.22 no.1
    • /
    • pp.28-34
    • /
    • 2003
  • Recent researches have been focusing on jointly using lip motions (i.e. visual speech) and speech for reliable speech recognitions in noisy environments. This paper also deals with the method of combining the result of the visual speech recognizer and that of the conventional speech recognizer through putting weights on each result: the paper proposes the method of determining proper weights for each result and, in particular, the weights are autonomously determined, depending on the amounts of noise in the speech and the image quality. Simulation results show that combining the audio and visual recognition by the proposed method provides the recognition performance of 84% even in severely noisy environments. It is also shown that in the presence of blur in images, the newly proposed weighting method, which takes the blur into account as well, yields better performance than the other methods.

Flowchart-C Conversion System using Camera (카메라를 이용한 flowchart-C변환 시스템)

  • 이창우;주윤희;손영선
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.05a
    • /
    • pp.165-168
    • /
    • 2003
  • 본 논문에서는 CCD 흑백 카메라를 이용하여 프로그래머의 알고리즘이 표현된 flowchart의 영상을 입력받아 C언어 코드로 변환하는 시스템을 구현하였다. 입력된 영상을 이진화 처리한 영상으로부터 flowchart 기호들을 인식하기 위하여 chain code 방법을 이용하였고, flowchart 기호에 기술된 영문자 및 특수문자의 인식을 위하여 가로 및 세로 히스토그램을 이용하여 한 문자색 분할한 후 각 문자들을 구성하는 흑화소 pixel의 합과 chain code 방법을 사용하였다. 가로 및 세로 투영을 이용하여 흐름선을 인식함으로써 flowchart의 논리흐름을 파악할 수 있었다. 이 시스템을 수치연산에 적용하여, 프로그래머의 알고리즘에 부합하는 프로그램이 작성되어짐을 확인할 수 있었다.

  • PDF

편도적출술후 음성변화에 관한 음성학적 및 영상학적 연구

  • 이종환;구수권;이상화;왕수건
    • Proceedings of the KSLP Conference
    • /
    • 1998.11a
    • /
    • pp.184-184
    • /
    • 1998
  • 배경 : 이비인후과 영역에서 많이 시행되어지고 있는 편도적출술은 공명실의 구조중 인강의 구조에 직접적인 영향을 줄 수 있는 수술로서 술후 음성의 변화를 호소하는 경우를 볼 수 있다. 지금까지 음성변화에 관한 음성학적 연구는 많으나 성도(vocal tract)의 변화에 대한 영상학적 연구는 아직 미비하다. 이에 저자들은 편도적출술후의 음성변화에 관한 음성학적 및 영상학적 연구를 시행하였다. (중략)

  • PDF

Automatic Dubbing System for Remote Personalized Basketball Feedback Video (원격 개인 농구 기술 피드백 영상 자동 더빙 시스템)

  • Jong-Uk Lim;Ray Kim;Young Yoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.466-467
    • /
    • 2024
  • 본 논문은 전문 스킬 트레이너들의 개인 농구 기술 분석 및 피드백 영상에 더빙을 자동으로 적용하는 시스템을 제안한다. 이 시스템은 농구 용어집 기반 번역, 음성-텍스트 변환 모델 간의 비교 분석, 영상과 더빙 트랙 동기화 알고리즘을 통해 다양한 언어로의 신속한 자동 번역과 더빙을 가능하게 함으로써 선수와 코치 간의 언어 장벽 없는 소통을 지원한다. 본 연구는 자동 더빙 기술에 힘입어 원격 농구 교육 효율성과 질의 재고 및 저변 확산에 기여하고자 한다.

  • PDF

Language Identification by Fusion of Gabor, MDLC, and Co-Occurrence Features (Gabor, MDLC, Co-Occurrence 특징의 융합에 의한 언어 인식)

  • Jang, Ick-Hoon;Kim, Ji-Hong
    • Journal of Korea Multimedia Society
    • /
    • v.17 no.3
    • /
    • pp.277-286
    • /
    • 2014
  • In this paper, we propose a texture feature-based language identification by fusion of Gabor, MDLC (multi-lag directional local correlation), and co-occurrence features. In the proposed method, for a test image, Gabor magnitude images are first obtained by Gabor transform followed by magnitude operator. Moments for the Gabor magniude images are then computed and vectorized. MDLC images are then obtained by MDLC operator and their moments are computed and vectorized. GLCM (gray-level co-occurrence matrix) is next calculated from the test image and co-occurrence features are computed using the GLCM, and the features are also vectorized. The three vectors of the Gabor, MDLC, and co-occurrence features are fused into a feature vector. In classification, the WPCA (whitened principal component analysis) classifier, which is usually adopted in the face identification, searches the training feature vector most similar to the test feature vector. We evaluate the performance of our method by examining averaged identification rates for a test document image DB obtained by scanning of documents with 15 languages. Experimental results show that the proposed method yields excellent language identification with rather low feature dimension for the test DB.