• 제목/요약/키워드: 영상 언어

검색결과 530건 처리시간 0.022초

오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발 (Text/Voice Recognition & Translation Application Development Using Open-Source)

  • 윤태진;서효종;김도헌
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제56차 하계학술대회논문집 25권2호
    • /
    • pp.425-426
    • /
    • 2017
  • 본 논문에서는 Google에서 지원하는 오픈소스인 Tesseract-OCR을 이용한 문자/음성 인식 및 번역 앱에 대해 제안한다. 최근 한국어를 포함한 외국어 인식과 번역기능을 이용한 다양한 스마트폰 앱이 개발되어 여행에 필수품으로 자리잡고 있다. 스마트폰의 카메라기능을 이용하여 촬영한 영상을 인식률을 높이도록 처리하고, Crop기능을 넣어 부분 인식기능을 지원하며, Tesseract-OCR의 train data를 보완하여 인식률을 높이고, Google 음성인식 API를 이용한 음성인식 기능을 통해 인식된 유사한 문장들을 선택하도록 하고, 이를 번역하고 보여주도록 개발하였다. 번역 기능은 번역대상 언어와 번역할 언어를 선택할 수 있고 기본적으로 영어, 한국어, 일본어, 중국어로 번역이 가능하다. 이 기능을 이용하여 차량번호 인식, 사진에 포함된 글자를 통한 검색 등 다양한 응용분야에 맞게 앱을 개발할 수 있다.

  • PDF

SMIL(Synchronized Multimedia Integration Language) Player의 설계 및 구현 (Design and Implementation of a SMIL Player)

  • 유초롱;김은영;권택근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.446-448
    • /
    • 2000
  • 오늘날 멀티미디어 프리젠테이션에 대한 관심이 급증하면서 많은 사용자들이 텍스트 서비스뿐 아니라 이미지나 오디오, 동영상 데이터를 전송하거나 받을 수 있는 서비스를 요구한다. 이에 따라 멀티미디어를 통합 표현하기 위한 요구가 확산되어 XML에 기반을 둔 SMIL 이라는 멀티미디어 동기화 언어가 등장하게 되었다. SMIL은 오디오, 비디오, 이미지, 텍스트 등의 다양한 미디어 데이터들을 SMIL 문서 안에 하나의 시나리오로 동기화 하여 프리젠테이션 할 수 있게 한다. SMIL이 제공하는 동기화는 미디어들의 공간적인 배치에 따른 동기화와 프리젠테이션 시간에 따른 동기화로 나뉜다. 멀티미디어의 동기화를 위한 표준 언어인 SMIL은 사용자가 보다 편리하게 멀티미디어를 동기화하고 프리젠테이션 할 수 있도록 한다. 본 논문에서는 SMIL 1.0 권고안을 따르고 사용자들이 보다 쉽게 사용할 수 있는 SMIL 플레이어를 설계 및 구현하고자 한다.

  • PDF

필기체 문자 인식을 위한 문자 영상 데이터 구축에 관한 연구 (A Study of Construction of Character Image Data for Recognition Handwritten Text)

  • 이향란;고경철;이말례
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.63-67
    • /
    • 2000
  • In order to develop a character recognition system, it is an essential preceding work that gathers an image data of the standard. On this purpose a data of the digitized images of a handwritten characters was collected. The types of a gathered image data are Korean character, Chiness character, Numeral, English character, Special character, and so on. This paper deals with a handwritten character image data base, and the image data base different from the general storage structure of a lame capacity multimedia was designed and builded.

  • PDF

시조문화 정보시스템 개발의 가능성과 전망 (The possibility and prospect for developing Sijo Munhwa information system)

  • 한창훈
    • 한국시조학회지:시조학논총
    • /
    • 제19권1호
    • /
    • pp.37-62
    • /
    • 2003
  • 이 논문은 시조문화 정보 시스템 개발의 가능성과 전망을 논한 것이다. 본문의 내용을 요약하여 제시하면 다음과 같다. 1. 언어 자료로서의 시조 문화 정보 시스템은 원전 자료를 포함한 자료의 입력ㆍ교정 작업이 우선 필요하다. 2. 구축된 원시 자료를 가공할 때에는 TEI (Text Encoding Initiative), 시소러스(Thesauras) 등의 작업이 고려되어야 한다. 3. 이는 Topic Map을 구축하는 기본 작업이 된다. 4. 예술 자료로서의 시조 문화 정보 시스템은 다른 자료들 - 이미지, 동영상 등 -과의 연결(link)이 매우 중요하다.

  • PDF

손동작 인식을 통한 컴퓨터 제어 (Computer Control through Recognition of the Hand Movement)

  • 김희성;이봉환;이규원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.912-915
    • /
    • 2014
  • 사람과 기계의 의사소통을 위해 기본적으로 개발된 방식은 사람의 문자를 기계어로 바꿔주어 작성된 이진 코드들을 기계가 인식하는 방법이었다.[1] 이는 중간 처리기만 이용하여 쉽게 언어를 변환하는게 가능하였고, 현재까지도 가장 많이 이용되는 방법이다. 하지만 문자를 이용하는 방식 또한 평상시 사람들이 사용하는 언어가 아닌 기계어로의 변환이 용이하도록 미리 정의된 단어들을 사용하기 때문에, 일반적인 사람들이 이용하는 데에는 어려움이 있다. 본 논문에서는 사람의 손동작 영상을 이용한 컴퓨터 제어시스템을 제안하고자 한다.

BASIC 언어를 사용한 Hill-Sliding 무감독 분류법 Algorithm 개발 (Development of the Hill-Sliding Clustering Algorithm Using BASIC Language)

  • 鄭夢炫;崔圭弘;朴景允;Park, J.Kyoungyoon
    • 대한원격탐사학회지
    • /
    • 제1권1호
    • /
    • pp.89-97
    • /
    • 1985
  • Hill-Sliding Clustering이라는 다변량 자료의 무감독 분류 방법을 Apple II personal computer의 BASIC언어를 사용한 Algorithm으로 개발하였다. 이 Algorithm으로 다변량 multimode를 갖는 정규 분포 자료에서 사전 지식없이 자료를 집단화하여 구분해 낼 수 있게 되 었다. 한국 연안 지역의 Landsat(지구 자원 탐사 위성)의 다중, Spectrum 영상 자료에 적용한 시 험 결과, 매우 고무적 결론을 얻었다.

감정 분석에서의 심리 모델 적용 비교 연구 (A Comparative Study on Sentiment Analysis Based on Psychological Model)

  • 김해준;도준호;선주오;정서희;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.450-452
    • /
    • 2020
  • 기술의 발전과 함께 사용자에게 가까이 자리 잡은 소셜 네트워크 서비스는 이미지, 동영상, 텍스트 등 활용 가능한 데이터의 수를 폭발적으로 증가시켰다. 작성자의 감정을 포함하고 있는 텍스트 데이터는 시장 조사, 주가 예측 등 다양한 분야에서 이용할 수 있으며, 이로 인해 긍부정의 이진 분류가 아닌 다중 감정 분석의 필요성 또한 높아지고 있다. 본 논문에서는 딥러닝 기반 감정 분류에 심리학 이론의 기반 감정 모델을 활용한 결합 모델과 단일 모델을 비교한다. 학습을 위해 AI Hub에서 제공하는 데이터와 노래 가사 데이터를 복합적으로 사용하였으며, 결과에서는 대부분의 경우에 결합 모델이 높은 결과를 보였다.

  • PDF

Prompting 기반 매개변수 효율적인 멀티 모달 영상 하이라이트 검출 연구 (Parameter-Efficient Multi-Modal Highlight Detection via Prompting)

  • 한동훈;남성욱;박은환;곽노준
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.372-376
    • /
    • 2023
  • 본 연구에서는 비디오 하이라이트 검출 및 장면 추출을 위한 경량화된 모델인 Visual Context Learner (VCL)을 제안한다. 기존 연구에서는 매개변수가 고정된 CLIP을 비롯한 여러 피쳐 추출기에 학습 가능한 DETR과 같은 트랜스포머를 이어붙여서 학습을 한다. 하지만 본 연구는 경량화된 구조로 하이라이트 검출 성능을 개선시킬 수 있음을 보인다. 그리고 해당 형태로 장면 추출도 가능함을 보이며 장면 추출의 추가 연구 가능성을 시사한다. VCL은 매개변수가 고정된 CLIP에 학습가능한 프롬프트와 MLP로 하이라이트 검출과 장면 추출을 진행한다. 총 2,141개의 학습가능한 매개변수를 사용하여 하이라이트 검출의 HIT@1(>=Very Good) 성능을 기존 CLIP보다 2.71% 개선된 성능과 최소한의 장면 추출 성능을 보인다.

  • PDF

읽기의 기능적 자기공명영상에 관한 연구 (A Functional MR Imaging Study of Reading)

  • 유재욱;나동규;변홍식;최대섭;문찬홍;이은정;정우인
    • Investigative Magnetic Resonance Imaging
    • /
    • 제3권1호
    • /
    • pp.78-83
    • /
    • 1999
  • 목적: 기능적 자기공명영상을 이용하여 읽기 과제에서 활성화되는 뇌영역을 알아보고, 읽기 과제의 종류에 따른 활성화 영여의 차이를 규명하고자 하였다. 대상 및 방법: 오른손잡이 자원자 9명(남자 7명, 여자 2명)을 대상으로 한글의 자음, 가짜단어, 단어를 속으로 읽도록 하면서 기능적 영상을 얻었다. 1.5T 초전도 자기공명여앙장치에서 EPI의 BOLD 기법을 이용하여 20 절편의 활성화 영상을 얻었고(gradient echo single shot EI, TR/TE 3000/60, flip angle $90^{\circ}$, matrix $64{\times}64$, 5mm thickness, no slice gap), 영상후처리는 SPM 분석 프로그램을 이용하였다. 2번가의 활성기와 3번의 휴식기를 번갈아 시행하였고 스캔 시간은 각각30초였다. 유의수준 p<0.01을 기준으로 자극 과제에 따라 활성화된 뇌지도를 얻어 활성화 영역을 육안으로 비교 분석하여다. 결과: 9명 모두에서 성공적으로 활성화 영상을 얻었고, 활성화 신호는 모든 자극과제에서 후두엽의 화성화를 제외하고 좌측으로 편재되는 경향을 보였으며, 전두엽, 측두엽, 두정엽, 후두엽의 여러 부위에서 활성화 신호가 나타났다. 가짜단어와 자음을 읽은 경우가 단어를 읽은 경우에 비하여 언어영역의 활성화가 많았다. 가짜단어를 읽은 경우가 자으을 읽은 경우에 비해 활성화 신호가 좌측으로 편재화 되는 경향을 나타냈다. 결론: 자음이나 단어형태를 읽는 것 만으로도 언어와 관련된 여러 뇌영역에 활성화가 유도됨을 확인하였으며, 자음이나 가짜단어를 읽는 것이 익숙한 단어를 읽는 것에 비해 활성화 신호가 많았다.

  • PDF

동물 만화영상의 풍자적 표현 연구 (A Study on Satirical Expression of Animal Cartoon & Animated Cartoon)

  • 이화자
    • 만화애니메이션 연구
    • /
    • 통권9호
    • /
    • pp.266-282
    • /
    • 2005
  • 만화영상은 이미지적 속성과 언어적 속성으로 되어있으며, 유머와 풍자적 내용이 밀접하게 관계되어 있다. 그리고 영상매체에서 동물 소재로 표현되었던 풍자적 표현 기법들을 연구 ${\cdot}$ 분석한다. 그 방법으로 이론적 배경은 동물 만화 영상의 역사적 배경으로 선사시대 원시 동굴 벽화로부터 시작하여 현대의 다양한 만화영상 캐릭터 산업까지 간략한 흐름을 살펴본다. 그리고 동물 풍자적 표현 유형으로 동물 묘사의 문학적 표현의 다양한 유형을 정리해 본다. 마지막으로 문학에서의 풍자 표현 기법인 비유적 표현, 상징적 표현, 수사적 표현들의 개념을 알아보고 비교하여 작품분석을 시도한다. 이러한 시도는 기존에 개념화되었던 인문학적 분류와 새로운 시각영상예술인 만화영상매체에 의미 연결 및 결합의 기초 분석법을 제시하고, 또한 자료들을 데이터베이스화함을 목적으로 한다. 이러한 축적된 자료들은 만화영상에 창작되는 동물 캐릭터들의 내적인 풍자 속성의 이야기 생산 및 그 의미작용에 대한 세부적인 자료를 제시할 것이다.

  • PDF