Search | Korea Science

VL-KE-T5: A contrastive learning-based pre-trained model using image-language parallel data composed of Korean and English (VL-KE-T5: 한국어와 영어로 구성된 영상-언어 병렬 데이터를 이용한 대조학습 기반 사전학습모델 구축)

San Kim;Saim, Shin
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.337-342
- /
- 2022
본 논문은 한국어-영어 기반 영상-언어 모델인 VL-KE-T5를 소개한다. VL-KE-T5는 영상-텍스트 쌍으로 구성된 한국어와 영어 데이터 약 2천 3백만개를 이용하여 영상-언어 모델의 임베딩 벡터들을 정렬시킨 사전학습모델이며, 미세조정을 통하여 여러 영상-언어 작업에 활용할 할 수 있다. VL-KE-T5는 텍스트 기반 영상 검색 작업에서 높은 성능을 보였으나, 세세한 속성을 가진 여러 객체들의 나열이나 객체 간 관계를 포함한 텍스트 기반 영상 검색에서는 비교적 낮은 성능을 보였다.
PDF

Narrative and Meaning Structure of Pictures in TV Reporting: A Semiological Study on Korean TV News Coverage on '9.11 Disaster' of U.S. (TV 보도 영상의 서사구조과 의미구조: '9.11 참사' 보도의 영상에 대한 기호학적 분석을 중심으로)

Baek, Seon-Gi
- Korean journal of communication and information
- /
- v.20
- /
- pp.57-109
- /
- 2003
The purpose of this study was to investigate narrative structure and meaning structure of pictures In TV reporting. TV reporting consists of linguistic representation and pictural representation with which implicate specific meanings. In the past, the latter has been considered as a kind of added material to the former. But, todays, the latter has been considered more important than the latter in implicating specific meanings. Therefore, the author analysed pictures of TV reporting. Specifically, he selected KBS TV news coverage on '9 11 Disaster of U.S.' with various semiological research methods. Through this study, firstly, It was found that the pictural representation was organized with specific narrative structure applied for linguistic representation. Secondly, its meaning was more important than one of linguistic representation. Thirdly, its styles and structures tended to confine range, abstract and limitation of meanings presented by linguistic representation. Fourthly, images of the pictural representation could be interpreted with narrative structures of linguistic representation.
PDF

한국어와 중국어 이중언어 화자의 대뇌 언어 영역 활성화 양상

이홍재;이동훈;유재욱;문찬홍;나동규;남기춘
- Proceedings of the KSMRM Conference
- /
- 2001.11a
- /
- pp.102-102
- /
- 2001
목적： 이중언어자에 있어서 각각의 언어가 대뇌에 어떻게 표상 되어 있는가에 대한 연구가 활발히 진행되고 있다. 본 연구에서는 한국어/중국어 이중언어화자를 대상으로 사용한 언어와 과제에 따라 활성화된 부위에 차이가 있는지 알아보고자 하였다. 대상 및 방법： 이중언어자(화교) 자원자 8명을 대상으로 하였고, 모두 오른손잡이였다. 한국어와 중국어로 구성된 어휘판단과제(lexical decision task)와 의미판단과제 (semantic decision task)를 이용하여 언어 영역의 활성화를 유도하였다. 어휘판단과제는 화면에 제시되는 두 자극이 모두 단어인지 아닌지 판단하여 신호하도록 하였고(예：원개 · 교화, 토끼, 지욱), 의미판단과제는 화면에 제시되는 두 자극의 의미가 관련 있는지 없는지 판단하여 신호하도록 하였다. (예：가가 ·제제, 아침·저녁). 대조과제는 아랍어(예：equation omitted) 글자의 크기를 판단하여 신호하도록 하였다. 1.5T 초전도 자기공명영상장치에서 EPI BOLD 기법을 이용하여 기능적 영상을 얻었으며 8명에서 얻은 영상을 정상화(normalize)한 후 SPM 프로그램을 이용하여 통계분석을 하였다. p<0.000001을 기준으로 얻어진 활성화 영상에서 각 언어와 과제별로 나타난 활성화 신호의 차이를 육안적으로 분석하였다.
PDF

A Design of Reliability Analysis System for Review Videos using the Integrated Analysis of Verbal and Nonverbal Sentiment (언어와 비언어 표현의 통합 분석을 통한 리뷰 동영상의 신뢰성 분석 시스템 설계)

Shin, Hee-Won;Lee, So-Jeong;Son, Gyu-Jin;Kim, Hye-Rin;Gwak, Seo-Hyun;Kim, Yeong-Min;Kim, Yoonhee
- Proceedings of the Korea Information Processing Society Conference
- /
- 2020.11a
- /
- pp.515-518
- /
- 2020
영상 콘텐츠 생산 간편화와 방송 채널 운영의 편리화에 따른 '영상의 시대'가 도래함에 따라 여러 제품에 대한 리뷰 영상이 관심을 받고 있다. 본 연구에서는 리뷰 영상의 언어와 비언어적 감성 분석을 토대로 통합 신뢰도 분석 시스템을 제안한다. 이를 위해, 영상 속 음성의 언어 감성 분석과 리뷰어의 표정 분석을 통해 얻은 각 감성값을 추출하고 정량화한다. 이후 표준화된 언어, 비언어적 감성 값에 대한 통합 신뢰도 분석을 진행한다. 결과적으로, 리뷰 영상에 대한 신뢰도를 객관화된 지표로써 평가할 수 있다.
https://doi.org/10.3745/PKIPS.y2020m11a.515 인용 PDF

Improvement of internal/external customer satisfaction through standard manual and animation on correct language expression (바른 언어 표현법 매뉴얼과 동영상 구축을 통한 내부 및 외부 고객의 만족도 증진)

Lee, Hyun Jung;Park, Seung Hye
- Quality Improvement in Health Care
- /
- v.17 no.1
- /
- pp.61-66
- /
- 2011
문제: 병원에서는 잘못 사용하는 신체 관련 언어, 문법적으로 틀린 말, 비속어, 지나친 겸양어, 잘못 사용하는 존칭어, 격에 안 맞는 준말 등으로 내부 및 외부 고객과의 의사전달이 정확하지 않은 경우가 흔히 있다. 병원 직원의 부적절한 언어 사용은 외부 고객 유치 및 유지를 방해하며, 병원의 이미지 실추와도 관련이 있다. 목적: 바른 언어 표현법 매뉴얼과 동영상 구축 및 활용으로 내부 및 외부 고객의 만족도를 향상시키고자 한다. 의료기관: 서울시 종로구에 소재한 대학병원 질 향상 활동: 바른 언어 표현법 매뉴얼 구축 후 동영상을 완성하여 병원의 모든 직원들이 학습하여 활용할 수 있도록 하였다. 개선효과: 바른 언어 표현법을 잘 학습하면 바른 언어를 사용하는 습관을 가지게 되어 의사전달이 명확해지고 표현이 풍부해지며 상호간 이해하는 폭이 넓어져 내부 고객 및 외부 고객의 만족도가 향상될 것이다. 또한 병원직원 전체 언어생활의 품격이 높아질 뿐만 아니라 병원의 위상도 높아질 것이다.
PDF

Integrated Verbal and Nonverbal Sentiment Analysis System for Evaluating Reliability of Video Contents (영상 콘텐츠의 신뢰도 평가를 위한 언어와 비언어 통합 감성 분석 시스템)

Shin, Hee Won;Lee, So Jeong;Son, Gyu Jin;Kim, Hye Rin;Kim, Yoonhee
- KIPS Transactions on Software and Data Engineering
- /
- v.10 no.4
- /
- pp.153-160
- /
- 2021
With the advent of the "age of video" due to the simplification of video content production and the convenience of broadcasting channel operation, review videos on various products are drawing attention. We proposes RASIA, an integrated reliability analysis system based on verbal and nonverbal sentiment analysis of review videos. RASIA extracts and quantifies each emotional value obtained through language sentiment analysis and facial analysis of the reviewer in the video. Subsequently, we conduct an integrated reliability analysis of standardized verbal and nonverbal sentimental values. RASIA provide an new objective indicator to evaluate the reliability of the review video.
https://doi.org/10.3745/KTSDE.2021.10.4.153 인용 PDF KSCI

Information Retrieval Using Images (영상을 이용한 정보검색)

최윤경;이은애;하석운
- Proceedings of the Korean Information Science Society Conference
- /
- 2002.10c
- /
- pp.37-39
- /
- 2002
정보 검색 시스템은 인터넷에 존재하는 수많은 정보 중에서 사용자가 필요한 특정 정보만을 포함하는 문서를 검색할 수 있다. 현재 정보 검색 시스템은 텍스트를 입력하는 방식을 이용한다. 검색어를 이용하게 되면 몇 개의 키워드를 통하여 원하는 정보를 신속하게 찾을 수 있지만 언어를 기반으로 하기 때문에 각 나라의 언어와 키워드를 알아야 사용할 수 있다는 단점이 있다. 이런 문제점을 해결하기 위해 본 시스템은 언어와 키워드를 알지 못하더라도 정보 검색이 가능하도록 누구나 쉽게 의미를 알 수 있는 영상을 질의로 하는 시스템을 제안한다. 본 시스템은 데이터베이스 내에 200개의 비교 대상 영상들을 5개의 대분류로 나눈 후 각각 3개의 소분류로 나누어 영상의 특징 및 키워드를 추출하여 영상특징키워드 데이터베이스(IFKDB, Image Feature Keyword DataBase)에 저장하였다. 사용자 인터페이스를 통해 새로운 영상을 만들거나 흑은 기존에 만들어진 영상을 선택하여 질의로 사용하면 질의 영상의 특징 중 에지를 추출하여 IFKDB와 비교하여 유사도가 높은 영상의 키워드 중 적정 개수를 선택하여 정보 검색의 키워드로 사용할 수 있게 하였다. 사용자가 그린 단순한 영상으로 검색이 가능하고 사용자가 원하는 영상과 비슷한 영상을 찾을 수 있으며 영상으로 정보 검색이 가능하므로 검색의 편의성을 제공한다.
PDF

a study of expression of non-coded Message in Visual Image and Graphic User Interface (그래픽 유저 인터페이스와 비언어적 메시지 영상 표현의 관계)

Seo, Hyun-Seok;Kim, Hyun-Suk
- 한국HCI학회:학술대회논문집
- /
- 2008.02b
- /
- pp.281-285
- /
- 2008
In the digital media era, coded and non-coded communication are used to convey the message. As the computer interface has been adopted human communication methods, non-coded communication has bee used in the computer interface as well. The changes of message structure in the computer interface have an effect on shifting the way of user's message acceptance from passive to active. The recently developed computer user interfaces are for user to experience diverse visual effect The communication conveyed with this visual effects could be vague but user can conceive strong impact. This experience is understood not only through the visual experience from a monitor screen but also with a sense of tactile. The meaning of sensual and spectacle motion image could be ambiguous. However in the experience of using an interface, it plentifully expands the human sense by giving a visual experience on a whim. The sensually extemporaneous and splendid visual effect that has vague meaning has been very common happening in digital media environment.
PDF

Design of Web Client for Medical Image Conference System Based on CORBA (CORBA 기반의 의료영상회의 시스템을 위한 Web Client 설계)

김정현;강재효;박세명;최항묵
- Proceedings of the Korea Multimedia Society Conference
- /
- 1998.04a
- /
- pp.339-343
- /
- 1998
본 연구에서는 Web 환경에서 분산객체 기술인 CORBA(Common Object Request Broker Architecture)를 이용하여 Java Applet으로 구현되는 의료영상회의 시스템의 Web Client를 설계 구현하였다. 플랫폼(platform)에 독립적이고, 다양한 개발 언어를 지원하는 CORBA를 기반으로 한 이 의료영상회의 시스템은 시스템의 개발, 확장성 및 유지 보수 측면에서 아주 뛰어나다. 또한 객체 지향언어이면서 다양한 플랫폼에 구애를 받지 않는(Architecture Neutral) Java 언어를 이용하여 Web 환경에서 쉽게 실행 가능한 Applet으로 의료영상회의를 할 수 있는 Web Client를 설계 구현하였으므로 Web 브라우저를 이용할 수 있는 환경이라면 손쉽게 이용할 수 있는 장점을 가진다.
PDF

조응구조의 지시사상 (mapping) 이론

Park, Yeong-Gyu
- Annual Conference on Human and Language Technology
- /
- 1990.11a
- /
- pp.199-199
- /
- 1990
입력된 문서 영상으로부터 분리 추출된 문자 영상을 올바르게 인식하는 것은 문서 인식에서 가장 핵심적인 부분이다. 스캐너를 통해 입력되고 분리된 실제의 문자 영상은 많은 문제점들을 가지고 있다. 한글의 경우 이 중 개별 문자 영상내의 각 자소간의 접촉은 올바른 인식을 저해하는 주요한 원인이다. 이런 접촉의 문제를 효율적으로 해결하기 위해 한글의 구조적 특성을 지닌 "방향 필터"를 정의하고, 이것을 이용하여 세선화된 문자 영상을 추적하면서 선소들을 뽑아낸다. 이렇게 하여 얻은 선소들과 선소들간의 지식을 조합하여 한글자소 획을 추출케 되고 결국에는 이런 획의 조합을 통해 문자 영상을 인식하는 방법을 제안한다.
PDF

Search Result 529, Processing Time 0.025 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)