• Title/Summary/Keyword: visual language

Search Result 713, Processing Time 0.026 seconds

Hand Shape Classification using Contour Distribution (윤곽 분포를 이용한 이미지 기반의 손모양 인식 기술)

  • Lee, Changmin;Kim, DaeEun
    • Journal of Institute of Control, Robotics and Systems
    • /
    • v.20 no.6
    • /
    • pp.593-598
    • /
    • 2014
  • Hand gesture recognition based on vision is a challenging task in human-robot interaction. The sign language of finger spelling alphabets has been tested as a kind of hand gesture. In this paper, we test hand gesture recognition by detecting the contour shape and orientation of hand with visual image. The method has three stages, the first stage of finding hand component separated from the background image, the second stage of extracting the contour feature over the hand component and the last stage of comparing the feature with the reference features in the database. Here, finger spelling alphabets are used to verify the performance of our system and our method shows good performance to discriminate finger alphabets.

The Posibility of Combination with Characters in Han-Gul Typeface Design (한글 활자체의 조합형 설계 가능성 연구)

  • Kim, Jin-Pyong
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.293-300
    • /
    • 1992
  • 모아쓰기 원리에 의한 한글은 조합 가능한 글자수가 총 11,172자에 달한다. 오늘날 정보산업화 시대의 다양한 요구로 인해 과거와 달리 이제는 한 벌의 한글 활자체도 조합 가능한 글자를 모두 갖추어야 하는 시대가 되었다. 활자체 설계 방식에서 과거처럼 글자 한 자 한 자를 다듬어 내던 설계 방식인 완성형 설계방식으로는 글자수를 모두 수용하면서도 다양한 활자체를 신속하게 만들어 내기는 매우 힘들게 되었다. 이를 해결 할 수 있는 설계 방식은 한글의 모아쓰기 원리를 활용해서 자소를 조합하여 설계하는 조합형 설계 방식이다. 이러한 조합형 설계의 성공적인 결과를 위해서는, 활자체 설계 전문가의 합리적 조합 규칙 설정 및 자소설계와 함께 효율적 전산 프로그램이 뒷받침되어야만 한다.

  • PDF

A STUDY ON VISUAL IMAGE DIVERSITY OF HANGUL (한글의 시각적 이미지 다양화에 관한 연구.)

  • Lee, Hyoun-Joo;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.591-599
    • /
    • 1992
  • 한글의 신속하고 정확한 정보전달 기능을 유지 발전시킴과 동시에, 정보 전달의 목적 및 효율성을 높이기 위하여, 인간심리에 직접 영향 미치는 시각적 이미지를 지니는 조형적 문자의 서체 및 기능 개발에 필요한 현행 한글서체들의 시각적 이미지에 대한 분석적 연구를 시도하였다. 대표적인 24개의 현행 한글서체에 대한 이미지를 표본조사 및 수치분류적 기법에 의한 이미지 특성을 분석하였다. 연구결과, 현행 한글서체는 크게 5개의 그룹으로 구분되며, 예서체는 현행 한글서체 중에서 가장 독특하고 집중된 이미지를 지닌 서체로 나타났다. 한글서체 개발은 수치적 분석에 의하여 방향정립 및 높은 예측성을 지닐 수 있으며. 목적지향적인 폰트개발 및 균형있는 서체운용 체계의 운용에 의하여 극대화될 수 있다.

  • PDF

The Effects of Reading Pronunciation Training of Korean Phonological Process Words for Chinese Learners (중국인 학습자의 우리말 음운변동 단어의 읽기 발음 훈련효과)

  • Lee, Yu-Ra;Kim, Soo-Jin
    • Phonetics and Speech Sciences
    • /
    • v.1 no.1
    • /
    • pp.77-86
    • /
    • 2009
  • This study observes how the combined intervention program effects on the acquisition reading pronunciation of Korean phonological process words and the acquisition aspects of each phonological process rules to four Korean learners whose first language is Chinese. The training program is the combination of multisensory Auditory, Visual and Kinethetic (AVK) approach, wholistic approach, and metalinguistic approach. The training purpose is to evaluate how accurately they read the words of the phonological process which have fortisization, nasalization, lateralization, intermediate sound /ㅅ/ (/${\int}iot"$/). We access how they read the untrained words which include the four factors above. The intervention effects are analyzed by the multiple probe across subjects design. The results indicate that the combined phonological process rule explanation and the words activity intervention affects the four Chinese subjects in every type of word. The implications of the study are these: First, it suggests the effect of Korean pronunciation intervention in a concrete way. Second, it offers how to evaluate the phonological process and how to train people who are learning Korean language.

  • PDF

Implementation of a process control language for pager manufacturing (호출기 자동 생산 제어 프로그램 언어 구현)

  • Jeon, Se-Jung;Yi, Keon-Young
    • Proceedings of the KIEE Conference
    • /
    • 1998.07g
    • /
    • pp.2405-2407
    • /
    • 1998
  • Implementation of a process control language for a pager manufacturing is dealt in this paper. The pager manufacturing process is consisted of a tune and an exam part. In the tune part, three capacitor trimmers are tuned to optimize the state of the pager. In the exam part, message receiving status with the arbitrary calling is tested using a vision system. The program has the ability to reuse the address discarded in the exam part when the, pager testing is not working properly even though there exist the processing gaps between two processes. The system is composed of a personal computer(PC586) and TEM-cells, Flex pager testers, an oscilloscope, a camera, and actuators. Visual Basic running on the Windows 95 is used to implement the control software which has the GUI to make an operator convenient. The validity of applying the completed program to practical machines, which are developing in the KITECH, is shown by using the virtual machine.

  • PDF

Document Embedding and Image Content Analysis for Improving News Clustering System (뉴스 클러스터링 개선을 위한 문서 임베딩 및 이미지 분석 자질의 활용)

  • Kim, Siyeon;Kim, Sang-Bum
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.104-108
    • /
    • 2015
  • 많은 양의 뉴스가 생성됨에 따라 이를 효과적으로 정리하는 기법이 최근 활발히 연구되어왔다. 그 중 뉴스클러스터링은 두 뉴스가 동일사건을 다루는지를 판정하는 분류기의 성능에 의존적인데, 대부분의 경우 BoW(Bag-of-Words)기반 벡터유사도를 사용하고 있다. 본 논문에서는 BoW기반의 벡터유사도 뿐 아니라 두 문서에 포함된 사진들의 유사성 및 주제의 관련성을 측정, 이를 분류기의 자질로 추가하여 두 뉴스가 동일사건을 다루는지 판정하는 분류기의 성능을 개선하는 방법을 제안한다. 사진들의 유사성 및 주제의 관련성은 최근 각광을 받는 딥러닝기반 CNN과 신경망기반 문서임베딩을 통해 측정하였다. 실험결과 기존의 BoW기반 벡터유사도에 의한 분류기의 성능에 비해 제안하는 두 자질을 사용하였을 경우 3.4%의 성능 향상을 보여주었다.

  • PDF

A Design and Implementation of Visual Authoring Tool for Mobile Communication Markup Language(WML) (무선통신 마크업 언어(WML)를 위한 시각화 저작도구의 설계 및 구현)

  • 박영조;이정구;방혜자
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.251-253
    • /
    • 2000
  • 현재 국내의 이동통신의 인구가 유선인터넷의 인구를 앞지르고 있다. 이에 무선통신의 시장의 잠재적인 시장을 형성하고, 시장점유율이 점차 증가하고 있는 추세에 있다. 아직까지 표준안이 발표된 것은 없지만, 무선통신을 위한 수많은 방법 중에서 사실상의 표준으로 받아들여지고 있는 WAP이 전세계적으로 가장 많은 사용자층을 확보하고 있으며, 많은 연구가 되고 있다. 그러나, 많은 양의 컨텐츠, 홈페이지를 개발함에 있어서 모든 Markup language의 표준을 기억하기란 여간 까다로운 것이 아니다. 많은 양의 속성, 계속 변하는 표준속에서 일반 사용자가 무선통신상의 홈페이지, 컨텐츠를 구성하는데는 어려움을 겪는다. 따라서, 본 논문에서는 WAP에서 사용되어지는 마크업 언어인 WML을 손쉽게 구현을 할 수 있는 저작도구를 설계함으로써 무선인터넷 컨텐츠개발자 뿐만 아니라 일반사용자도 손쉽게 무선환경하에서의 홈페이지를 손쉽게 구현을 할 수 있게끔 하고자 한다.

  • PDF

Visualized Assurance Approach for Enterprise Architecture

  • Zhi, Qiang;Zhou, Zhengshu;Yamamoto, Shuichiro
    • Journal of information and communication convergence engineering
    • /
    • v.17 no.2
    • /
    • pp.117-127
    • /
    • 2019
  • In software engineering, to ensure reliability between systems, describing both system architecture and assurance arguments between system elements is considered necessary. There are proposals for system architecture assurance, but use of these traditional methods often requires development of different diagrams using different editors. Because the visual sense of the traditional methods is inadequate, errors readily occur when manipulating different diagrams. Therefore, it is essential that the assurance of dependability between components and systems is visualized and easy to understand. In this paper, an integrated approach to describe the relationship between system actors and system architecture is proposed, and this approach is clarified using an enterprise architecture modeling language. A case study is carried out and comparison to the traditional approach $d^*$ framework is explained. The comparison results show that the proposed approach is more suitable for ensuring dependability in system architecture.

MMA: Multi-modal Message Aggregation for Korean VQA (MMA: 한국어 시각적 질의응답을 위한 멀티 모달 메시지 통합)

  • Park, Sungjin;Park, Chanjun;Seo, Jaehyung;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.468-472
    • /
    • 2020
  • 시각적 질의응답(Visual Question Answering, VQA)은 주어진 이미지에 연관된 다양한 질문에 대한 올바른 답변을 예측하는 기술이다. 해당 기술은 컴퓨터 비전-자연어 처리 연구분야에서 활발히 연구가 진행되고 있으며, 질문의 의도를 정확히 파악하고, 주어진 이미지에서 관련 단서 정보를 찾는 것이 중요하다. 또한, 서로 이질적인 특성을 지닌 정보(이미지 객체, 객체 위치, 질문)를 통합하는 과정도 중요하다. 본 논문은 질문의 의도에 알맞은 정보를 효율적으로 사용하기 위해 멀티 모달 입력 이미지 객체, 객체 위치, 질문)에 대한 Multi-modal Message Aggregation (MMA) 제안하며 이를 통해 한국어 시각적 질의응답 KVQA에서 다른 모델보다 더 좋은 성능을 확인하였다.

  • PDF

Parameter-Efficient Multi-Modal Highlight Detection via Prompting (Prompting 기반 매개변수 효율적인 멀티 모달 영상 하이라이트 검출 연구)

  • DongHoon Han;Seong-Uk Nam;Eunhwan Park;Nojun Kwak
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.372-376
    • /
    • 2023
  • 본 연구에서는 비디오 하이라이트 검출 및 장면 추출을 위한 경량화된 모델인 Visual Context Learner (VCL)을 제안한다. 기존 연구에서는 매개변수가 고정된 CLIP을 비롯한 여러 피쳐 추출기에 학습 가능한 DETR과 같은 트랜스포머를 이어붙여서 학습을 한다. 하지만 본 연구는 경량화된 구조로 하이라이트 검출 성능을 개선시킬 수 있음을 보인다. 그리고 해당 형태로 장면 추출도 가능함을 보이며 장면 추출의 추가 연구 가능성을 시사한다. VCL은 매개변수가 고정된 CLIP에 학습가능한 프롬프트와 MLP로 하이라이트 검출과 장면 추출을 진행한다. 총 2,141개의 학습가능한 매개변수를 사용하여 하이라이트 검출의 HIT@1(>=Very Good) 성능을 기존 CLIP보다 2.71% 개선된 성능과 최소한의 장면 추출 성능을 보인다.

  • PDF