• 제목/요약/키워드: 영상 언어

검색결과 529건 처리시간 0.024초

VL-KE-T5: 한국어와 영어로 구성된 영상-언어 병렬 데이터를 이용한 대조학습 기반 사전학습모델 구축 (VL-KE-T5: A contrastive learning-based pre-trained model using image-language parallel data composed of Korean and English)

  • 김산;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.337-342
    • /
    • 2022
  • 본 논문은 한국어-영어 기반 영상-언어 모델인 VL-KE-T5를 소개한다. VL-KE-T5는 영상-텍스트 쌍으로 구성된 한국어와 영어 데이터 약 2천 3백만개를 이용하여 영상-언어 모델의 임베딩 벡터들을 정렬시킨 사전학습모델이며, 미세조정을 통하여 여러 영상-언어 작업에 활용할 할 수 있다. VL-KE-T5는 텍스트 기반 영상 검색 작업에서 높은 성능을 보였으나, 세세한 속성을 가진 여러 객체들의 나열이나 객체 간 관계를 포함한 텍스트 기반 영상 검색에서는 비교적 낮은 성능을 보였다.

  • PDF

TV 보도 영상의 서사구조과 의미구조: '9.11 참사' 보도의 영상에 대한 기호학적 분석을 중심으로 (Narrative and Meaning Structure of Pictures in TV Reporting: A Semiological Study on Korean TV News Coverage on '9.11 Disaster' of U.S.)

  • 백선기
    • 한국언론정보학보
    • /
    • 제20권
    • /
    • pp.57-109
    • /
    • 2003
  • 본 연구는 TV 보도에 있어서 영상화면의 서사구조와 의미구조를 밝히고자 한 것이다. TV 보도는 전통적인 언어기사와 영상화면의 복합체로 이루어지는데, 과거에는 영상화면은 언어기사의 단순한 부가물로 간주되었었다. 그러나 현재는 영상화면이 보다 더 중요하게 인식되고 있다. 그렇다면 이러한 영상화면이 지니는 의미는 어떻게 구현되는가 하는 것이 주관심사이다. 따라서 미국에서 발생한 '9 11참사'에 대한 우리 TV 보도를 분석하였다. 그 결과, 영상화면은 언어기사와 유사하게 일정한 서사구조로 이루어지고 있으며, 그러한 서사구조는 특정한 의미를 표출하게 됨을 발견할 수 있었다. 둘째, 영상화면의 의미는 경우에 따라서는 언어기사의 의미를 넘어서는 정도로 표출하고 있으며, 영상화면의 의미가 언어기사의 의미보다도 더욱 중요하게 소구되고 있기도 하다. 셋째, 영상화면이 표현하는 의미는 언어기사가 지니고 있는 의미의 범위, 상상력, 한계 등을 설정해주고 있다. 넷째, 영상화면이 표출하고자 하는 이미지도 언어체계로 구상되기도 하고, 언어체계로 해석되기도 한다는 점을 발견할 수 있었다.

  • PDF

한국어와 중국어 이중언어 화자의 대뇌 언어 영역 활성화 양상

  • 이홍재;이동훈;유재욱;문찬홍;나동규;남기춘
    • 대한자기공명의과학회:학술대회논문집
    • /
    • 대한자기공명의과학회 2001년도 제6차 학술대회 초록집
    • /
    • pp.102-102
    • /
    • 2001
  • 목적: 이중언어자에 있어서 각각의 언어가 대뇌에 어떻게 표상 되어 있는가에 대한 연구가 활발히 진행되고 있다. 본 연구에서는 한국어/중국어 이중언어화자를 대상으로 사용한 언어와 과제에 따라 활성화된 부위에 차이가 있는지 알아보고자 하였다. 대상 및 방법: 이중언어자(화교) 자원자 8명을 대상으로 하였고, 모두 오른손잡이였다. 한국어와 중국어로 구성된 어휘판단과제(lexical decision task)와 의미판단과제 (semantic decision task)를 이용하여 언어 영역의 활성화를 유도하였다. 어휘판단과제는 화면에 제시되는 두 자극이 모두 단어인지 아닌지 판단하여 신호하도록 하였고(예:원개 · 교화, 토끼, 지욱), 의미판단과제는 화면에 제시되는 두 자극의 의미가 관련 있는지 없는지 판단하여 신호하도록 하였다. (예:가가 ·제제, 아침·저녁). 대조과제는 아랍어(예:equation omitted) 글자의 크기를 판단하여 신호하도록 하였다. 1.5T 초전도 자기공명영상장치에서 EPI BOLD 기법을 이용하여 기능적 영상을 얻었으며 8명에서 얻은 영상을 정상화(normalize)한 후 SPM 프로그램을 이용하여 통계분석을 하였다. p<0.000001을 기준으로 얻어진 활성화 영상에서 각 언어와 과제별로 나타난 활성화 신호의 차이를 육안적으로 분석하였다.

  • PDF

언어와 비언어 표현의 통합 분석을 통한 리뷰 동영상의 신뢰성 분석 시스템 설계 (A Design of Reliability Analysis System for Review Videos using the Integrated Analysis of Verbal and Nonverbal Sentiment)

  • 신희원;이소정;손규진;김혜린;곽서현;김영민;김윤희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.515-518
    • /
    • 2020
  • 영상 콘텐츠 생산 간편화와 방송 채널 운영의 편리화에 따른 '영상의 시대'가 도래함에 따라 여러 제품에 대한 리뷰 영상이 관심을 받고 있다. 본 연구에서는 리뷰 영상의 언어와 비언어적 감성 분석을 토대로 통합 신뢰도 분석 시스템을 제안한다. 이를 위해, 영상 속 음성의 언어 감성 분석과 리뷰어의 표정 분석을 통해 얻은 각 감성값을 추출하고 정량화한다. 이후 표준화된 언어, 비언어적 감성 값에 대한 통합 신뢰도 분석을 진행한다. 결과적으로, 리뷰 영상에 대한 신뢰도를 객관화된 지표로써 평가할 수 있다.

바른 언어 표현법 매뉴얼과 동영상 구축을 통한 내부 및 외부 고객의 만족도 증진 (Improvement of internal/external customer satisfaction through standard manual and animation on correct language expression)

  • 이현정;박승혜
    • 한국의료질향상학회지
    • /
    • 제17권1호
    • /
    • pp.61-66
    • /
    • 2011
  • 문제: 병원에서는 잘못 사용하는 신체 관련 언어, 문법적으로 틀린 말, 비속어, 지나친 겸양어, 잘못 사용하는 존칭어, 격에 안 맞는 준말 등으로 내부 및 외부 고객과의 의사전달이 정확하지 않은 경우가 흔히 있다. 병원 직원의 부적절한 언어 사용은 외부 고객 유치 및 유지를 방해하며, 병원의 이미지 실추와도 관련이 있다. 목적: 바른 언어 표현법 매뉴얼과 동영상 구축 및 활용으로 내부 및 외부 고객의 만족도를 향상시키고자 한다. 의료기관: 서울시 종로구에 소재한 대학병원 질 향상 활동: 바른 언어 표현법 매뉴얼 구축 후 동영상을 완성하여 병원의 모든 직원들이 학습하여 활용할 수 있도록 하였다. 개선효과: 바른 언어 표현법을 잘 학습하면 바른 언어를 사용하는 습관을 가지게 되어 의사전달이 명확해지고 표현이 풍부해지며 상호간 이해하는 폭이 넓어져 내부 고객 및 외부 고객의 만족도가 향상될 것이다. 또한 병원직원 전체 언어생활의 품격이 높아질 뿐만 아니라 병원의 위상도 높아질 것이다.

  • PDF

영상 콘텐츠의 신뢰도 평가를 위한 언어와 비언어 통합 감성 분석 시스템 (Integrated Verbal and Nonverbal Sentiment Analysis System for Evaluating Reliability of Video Contents)

  • 신희원;이소정;손규진;김혜린;김윤희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권4호
    • /
    • pp.153-160
    • /
    • 2021
  • IT 기술 발달에 따른 영상 콘텐츠 생산과 소비가 증가함에 따라 영상 콘텐츠를 통한 제품 리뷰 정보로 구매의사 결정이 빈번해졌다. 따라서, 리뷰 영상에 대한 신뢰성을 평가할 필요가 있다. 본 연구에서는 제품 리뷰 영상을 얼굴 표정 분석과 텍스트 마이닝을 통해 리뷰어의 표정과 음성을 분석하여 영상의 신뢰도를 분석한다. 영상 내 인물 표정의 감성 값을 추출하는 알고리즘을 활용하여 비언어 감성을 정량화하고, 유의미한 감정 변화 구간을 추출한다. 유의미한 감정 변화 구간의 리뷰어 음성을 텍스트화하여 표준어 및 비표준어 감성 사전 활용을 통해 긍정과 부정으로 리뷰에 대한 언어 감성 분석 후 수치화 한다. 비언어 감성 분석과 언어 감성 분석의 결과를 통합하여 일치 여부에 따라 신뢰도를 도출한다. 본 연구를 통해 영상 콘텐츠의 신뢰성 평가 방법을 제시한다.

영상을 이용한 정보검색 (Information Retrieval Using Images)

  • 최윤경;이은애;하석운
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.37-39
    • /
    • 2002
  • 정보 검색 시스템은 인터넷에 존재하는 수많은 정보 중에서 사용자가 필요한 특정 정보만을 포함하는 문서를 검색할 수 있다. 현재 정보 검색 시스템은 텍스트를 입력하는 방식을 이용한다. 검색어를 이용하게 되면 몇 개의 키워드를 통하여 원하는 정보를 신속하게 찾을 수 있지만 언어를 기반으로 하기 때문에 각 나라의 언어와 키워드를 알아야 사용할 수 있다는 단점이 있다. 이런 문제점을 해결하기 위해 본 시스템은 언어와 키워드를 알지 못하더라도 정보 검색이 가능하도록 누구나 쉽게 의미를 알 수 있는 영상을 질의로 하는 시스템을 제안한다. 본 시스템은 데이터베이스 내에 200개의 비교 대상 영상들을 5개의 대분류로 나눈 후 각각 3개의 소분류로 나누어 영상의 특징 및 키워드를 추출하여 영상특징키워드 데이터베이스(IFKDB, Image Feature Keyword DataBase)에 저장하였다. 사용자 인터페이스를 통해 새로운 영상을 만들거나 흑은 기존에 만들어진 영상을 선택하여 질의로 사용하면 질의 영상의 특징 중 에지를 추출하여 IFKDB와 비교하여 유사도가 높은 영상의 키워드 중 적정 개수를 선택하여 정보 검색의 키워드로 사용할 수 있게 하였다. 사용자가 그린 단순한 영상으로 검색이 가능하고 사용자가 원하는 영상과 비슷한 영상을 찾을 수 있으며 영상으로 정보 검색이 가능하므로 검색의 편의성을 제공한다.

  • PDF

그래픽 유저 인터페이스와 비언어적 메시지 영상 표현의 관계 (a study of expression of non-coded Message in Visual Image and Graphic User Interface)

  • 서현석;김현석
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 2부
    • /
    • pp.281-285
    • /
    • 2008
  • 디지털미디어 환경에서 메시지는 언어적 표현이외에도 다양한 영상으로 의미를 표현하고 인터페이스에서 이와 같은 메시지의 표현이 나타난다. 인터페이스에서 이러한 메시지 구성의 변화는 인간에게 메시지의 수용을 수동적 수용에서 능동적 수용으로 변화시키고 있다. 최근 개발된 인터페이스는 사용자로 하여금 다양한 시각적 효과를 경험하게 하고 있다. 인터페이스에서 전해지는 의미의 전달은 모호하지만 사용자는 감각적으로는 강한 인상을 받는다. 이와 같은 다양한 비언어적인 메시지 영상 표현을 인터페이스를 통해 경험하고 있다. 비언어적 메시지 영상들은 사용자에게 어떤 메시지를 전하고 있지만 사용자마다 받아들이는 해석은 다르다. 그 이유는 비언어적 메시지 영상은 의사소통에 있어서 개념화되지 않아 사람마다 의미의 차이를 보이고, 사용자에게 인터페이스의 사용 경험에 있어서 즉흥적인 시각 경험을 주기 때문이다. 의미는 모호하지만 감각을 지극히는 즉흥적이고 화려한 영상 효과는 디지털 미디어 환경에서 흔히 나타나는 현상이 되었고 일상화되며 즐기고 있다. 비언어적 메시지 영상 표현은 아직 개념화되지 않은 커뮤니케이션의 시각적 표현의 확장이고, 나아가 사용자들에게 제공되는 또 하나의 메시지가 될 수 있다. 따라서 다양한 시각표현을 제공하는 인터페이스(GUI)에서는 시각적 감각만을 통해 수용하기 보다는 다감각적인 분산적 지각으로 수용한다.

  • PDF

CORBA 기반의 의료영상회의 시스템을 위한 Web Client 설계 (Design of Web Client for Medical Image Conference System Based on CORBA)

  • 김정현;강재효;박세명;최항묵
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.339-343
    • /
    • 1998
  • 본 연구에서는 Web 환경에서 분산객체 기술인 CORBA(Common Object Request Broker Architecture)를 이용하여 Java Applet으로 구현되는 의료영상회의 시스템의 Web Client를 설계 구현하였다. 플랫폼(platform)에 독립적이고, 다양한 개발 언어를 지원하는 CORBA를 기반으로 한 이 의료영상회의 시스템은 시스템의 개발, 확장성 및 유지 보수 측면에서 아주 뛰어나다. 또한 객체 지향언어이면서 다양한 플랫폼에 구애를 받지 않는(Architecture Neutral) Java 언어를 이용하여 Web 환경에서 쉽게 실행 가능한 Applet으로 의료영상회의를 할 수 있는 Web Client를 설계 구현하였으므로 Web 브라우저를 이용할 수 있는 환경이라면 손쉽게 이용할 수 있는 장점을 가진다.

  • PDF

조응구조의 지시사상 (mapping) 이론

  • 박영규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.199-199
    • /
    • 1990
  • 입력된 문서 영상으로부터 분리 추출된 문자 영상을 올바르게 인식하는 것은 문서 인식에서 가장 핵심적인 부분이다. 스캐너를 통해 입력되고 분리된 실제의 문자 영상은 많은 문제점들을 가지고 있다. 한글의 경우 이 중 개별 문자 영상내의 각 자소간의 접촉은 올바른 인식을 저해하는 주요한 원인이다. 이런 접촉의 문제를 효율적으로 해결하기 위해 한글의 구조적 특성을 지닌 "방향 필터"를 정의하고, 이것을 이용하여 세선화된 문자 영상을 추적하면서 선소들을 뽑아낸다. 이렇게 하여 얻은 선소들과 선소들간의 지식을 조합하여 한글자소 획을 추출케 되고 결국에는 이런 획의 조합을 통해 문자 영상을 인식하는 방법을 제안한다.

  • PDF