Search | Korea Science

Word Spotting Algorithms Using SIFT in Document Images (SIFT를 이용한 문서 영상에서의 단어 검색 알고리즘)

Lee, Duk-Ryong;Jeon, Hyo-Jong;Oh, Il-Seok
- Proceedings of the Korean Information Science Society Conference
- /
- 2011.06a
- /
- pp.488-490
- /
- 2011
본 논문에서는 문서 영상에서 글자 분할 및 인식이 필요 없는 단어 검색 알고리즘을 제안한다. 글자 분할을 하지 않고 검색하기 위해 영상 검색에 사용되는 SIFT특징을 이용하였다. 제안하는 알고리즘은 사용자가 입력한 질의어를 질의 영상으로 변환하고, 질의 영상에서 SIFT특징을 추출한다. 추출된 특징은 문서영상에서 추출한 특징과 매칭을 통해 매칭점 쌍을 생성한다. 생성된 매칭점 쌍들을 군집화 조건에 따라 군집화 한다. 군집화는 질의 영상과 지리적 분포가 유사하게 군집화 되도록 설계되었다. 생성된 군집은 군집에 포함된 특징점의 개수가 많을수록 질의 영상과 유사하다. 따라서 N개 이상의 원소를 가지는 군집을 결과로 출력한다. 실험한 결과 제안하는 알고리즘의 가능성을 확인할 수 있었다.

Face Recognition System Using Gray Color Features (흑백 색상 정보 특징을 이용한 얼굴 인식 시스템)

이현순;오동수;유관우
- Proceedings of the Korean Information Science Society Conference
- /
- 2002.10d
- /
- pp.583-585
- /
- 2002
얼굴 인식은 이미지에 대한 많은 변화(표정, 조명, 얼굴의 방향)로 인해 높은 인식률을 얻기 어렵다. 이 문제를 해결하기 위해, 여러 가지의 얼굴 인식에 관한 방법이 연구되었다. 본 논문은 윤곽선이 검출된 흑백 이미지에서 명암 정보를 이용하여 특징을 추출한 얼굴 인식 시스템을 구현한다. 얼굴 방향에 대해 제약조건을 지닌 정면의 얼굴 이미지에서 소벨 마스크(Sobel Mask)를 이용하여 추출한 윤곽선 이미지를 일정한 크기의 영역들을 구성하여 특징벡터를 생성한다. 생성된 특징벡터를 이용하여 빠른 속도로 얼굴의 특징을 추출하여 개인 정보를 생성할 수 있다. 개인 정보를 가지고 SVM(Support Vector Machine)을 이용하여 일대일 대응에서 인증을 실험한다. 이 시스템은 기하학적 특성 추출 방법보다 계산량이 적고, 높은 인식률을 보여준다.
PDF

Efficient Feature Descriptor Extraction and Matching for Fast Image Stitching (효율적인 특징점 기술자 생성을 이용한 빠른 이미지 스티칭 기법)

Ahn, Hyochang;Shin, In-Kyung;Park, Sunghyun;Lee, Yong-hwan;Rhee, Sang-Burm
- Proceedings of the Korea Information Processing Society Conference
- /
- 2012.11a
- /
- pp.626-628
- /
- 2012
최근 이미지에서 특징점을 추출하고 이를 활용하는 분야로 이미지 스티칭에 대한 연구가 활발하게 진행되고 있다. 이미지 스티칭에서는 특징점을 추출 및 정합이 중요한 요소이다. 본 논문에서는 특징점 기술자의 차원을 효과적으로 감소시켜 정확하면서도 빠르게 정합점을 찾을 수 있는 효율적인 특징점 기술자 생성을 이용한 빠른 이미지 스티칭 기법을 제안한다. 실험 결과, 이미지 스티칭 속도가 기존의 알고리즘 보다 빠르면서도 향상된 스티칭 이미지를 생성할 수 있었다.
https://doi.org/10.3745/PKIPS.y2012m11a.626 인용 PDF

Motion Saliency Map and its Application (모션 특징점 맵과 응용)

Kwon Ji-Yong;Yoon Jong-Chul;Lee In-Kwon
- Proceedings of the Korean Information Science Society Conference
- /
- 2006.06a
- /
- pp.97-99
- /
- 2006
우리는 관절체 캐릭터에 대해 시간에 따른 인식의 정도를 측정하는 모션 특징점 맵을 제안한다. 모션 특징점 맵은 이미지 특징점 맵에서 사용된 가우시안 거리 방법을 응용하여 계산할 수 있다. 관절 계층 구조에서의 모션과 시각적 인지간의 관계를 고려하여, 우리는 관절 동선 모션 특징점 맵과 관절 구동 모션 특징점 맵의 두 가지 모션 특징점 맵을 정의하였다. 정의한 두 가지 모션 특징점 맵을 사용하여 한 프레임에서의 모션 특징점 맵 또한 계산할 수 있다. 계산된 모션 특징점 맵은 모션의 시놉시스 생성, 정운동학 연산량의 축소, 자동적 카메라 동선 생성 등 여러 가지 응용 분야에 적용할 수 있다. 실험을 통하여 우리는 모션에 대한 인식 기반적인 접근을 통해 모션의 질적인 향상은 물론 계산적인 퍼포먼스의 향상에도 많은 기여를 할 수 있음을 알 수 있었다.
PDF

A Scale-Space based on Bilateral Filtering for Robust Feature Detection in SIFT (SIFT 알고리즘의 강인한 특징점 검출을 위한 양방향 필터 기반 스케일 공간)

Kim, Seungryong;Yoo, Hunjae;Son, Jongin;Oh, Changbum;Sohn, Kwanghoon
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2012.07a
- /
- pp.79-82
- /
- 2012
컴퓨터 비전에서 영상 매칭 기술은 다양한 분야에 응용될 수 있는 기초적인 기술 중에 하나이다. 강인한 영상 매칭을 위해서는 정확하고 독특한 특징점을 검출하는 과정이 중요하다. 기존의 SIFT나 SURF 등 영상 매칭 알고리즘은 등방성 가우시안 필터링을 사용한 스케일 공간을 생성하여 특징점을 검출한다. 이러한 기존의 특징점 검출 방식은 스케일 공간에서 영상의 경계선을 모호하게 만들어 정확한 특징점 검출을 어렵게 만들고 영상 매칭의 성능을 떨어뜨리는 문제점을 가지고 있다. 본 논문에서는 SIFT 알고리즘의 강인한 특징점 검출을 위하여 양방향 필터링을 사용하여 스케일 공간 생성을 제안한다. 이러한 스케일 공간 생성 방식은 스케일 공간에서 영상의 경계선을 보존해 줌으로서 강인한 특징점 검출을 가능하게 하여 영상 매칭 성능을 향상시킨다. 특히 왜곡이 존재하는 영상들의 매칭에서 제안하는 특징점 검출 방법이 적용된 SIFT 알고리즘은 기존의 SIFT 알고리즘보다 우수한 영상 매칭 결과를 보여준다.
PDF

A Feature Map Generation Method for MSFC-Based Feature Compression without Min-Max Signaling in VCM (VCM 의 MSFC 기반 특징 압축을 위한 Min-Max 시그널링을 제외한 특징맵 생성 기법)

Dong-Ha Kim;Yong-Uk Yoon;Jae-Gon Kim
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2022.11a
- /
- pp.79-81
- /
- 2022
MPEG-VCM(Video Coding for Machines)에서는 머신비전(machine vision) 네트워크의 백본(backbone)에서 추출된 이미지/비디오 특징 압축을 위한 표준화를 진행하고 있다. 현재 VCM 표준기술 탐색 과정에서 가장 좋은 압축 성능을 보이는 MSFC(Multi-Scale Feature compression) 기반 압축 네트워크 모델은 추출된 멀티-스케일 특징을 단일-스케일 특징으로 변환하여 특징맵으로 구성하고 이를 VVC 로 압축한다. 본 논문에서는 MSFC 기반 압축 모델에서 Min-Max 값 시그널링을 제외한 최소-최대(Min-Max) 정규화를 포함한 개선된 특징맵 생성 기법을 제시한다. 즉, 제안기법은 VCM 디코더에서의 특징맵 복원을 위한 Min-Max 값을 학습 기반으로 생성함으로써 Min-Max 시그널링의 비트 오버헤드 절감뿐만 아니라 별도의 시그널링 기제를 생략한 보다 단순한 전송 비트스트림 구성을 가능하게 한다. 실험결과 제안기법은 이미지 앵커(Anchor) 대비 BPP-mAP 성능에서 83.24% BD-rate 이득을 보이며, 이는 기존 MSFC 보다 1.74%정도 다소 떨어지지만 별도의 Min-Max 시그널링 없이도 기존의 성능을 유지할 수 있음을 보인다.
PDF

Voice Synthesis Detection Using Language Model-Based Speech Feature Extraction (언어 모델 기반 음성 특징 추출을 활용한 생성 음성 탐지)

Seung-min Kim;So-hee Park;Dae-seon Choi
- Journal of the Korea Institute of Information Security & Cryptology
- /
- v.34 no.3
- /
- pp.439-449
- /
- 2024
Recent rapid advancements in voice generation technology have enabled the natural synthesis of voices using text alone. However, this progress has led to an increase in malicious activities, such as voice phishing (voishing), where generated voices are exploited for criminal purposes. Numerous models have been developed to detect the presence of synthesized voices, typically by extracting features from the voice and using these features to determine the likelihood of voice generation.This paper proposes a new model for extracting voice features to address misuse cases arising from generated voices. It utilizes a deep learning-based audio codec model and the pre-trained natural language processing model BERT to extract novel voice features. To assess the suitability of the proposed voice feature extraction model for voice detection, four generated voice detection models were created using the extracted features, and performance evaluations were conducted. For performance comparison, three voice detection models based on Deepfeature proposed in previous studies were evaluated against other models in terms of accuracy and EER. The model proposed in this paper achieved an accuracy of 88.08%and a low EER of 11.79%, outperforming the existing models. These results confirm that the voice feature extraction method introduced in this paper can be an effective tool for distinguishing between generated and real voices.
https://doi.org/10.13089/JKIISC.2024.34.3.439 인용 PDF HTML

A Study on Image Generation from Sentence Embedding Applying Self-Attention (Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구)

Yu, Kyungho;No, Juhyeon;Hong, Taekeun;Kim, Hyeong-Ju;Kim, Pankoo
- Smart Media Journal
- /
- v.10 no.1
- /
- pp.63-69
- /
- 2021
When a person sees a sentence and understands the sentence, the person understands the sentence by reminiscent of the main word in the sentence as an image. Text-to-image is what allows computers to do this associative process. The previous deep learning-based text-to-image model extracts text features using Convolutional Neural Network (CNN)-Long Short Term Memory (LSTM) and bi-directional LSTM, and generates an image by inputting it to the GAN. The previous text-to-image model uses basic embedding in text feature extraction, and it takes a long time to train because images are generated using several modules. Therefore, in this research, we propose a method of extracting features by using the attention mechanism, which has improved performance in the natural language processing field, for sentence embedding, and generating an image by inputting the extracted features into the GAN. As a result of the experiment, the inception score was higher than that of the model used in the previous study, and when judged with the naked eye, an image that expresses the features well in the input sentence was created. In addition, even when a long sentence is input, an image that expresses the sentence well was created.
https://doi.org/10.30693/SMJ.2021.10.1.63 인용 PDF KSCI

Feature-Based Deformation of 3D Facial Model Using Radial Basis Function (Radial Basis Function 을 이용한 특징점 기반 3 차원 얼굴 모델의 변형)

Kwon Oh-Ryun;Min Kyong-Pil;Chun Jun-Chul
- Proceedings of the Korea Information Processing Society Conference
- /
- 2006.05a
- /
- pp.715-718
- /
- 2006
아바타를 이용한 얼굴 애니메이션은 가상 현실이나 엔터테인먼트와 같은 분야에서 많이 적용된다. 얼굴 애니메이션을 생성하는 방법에는 크게 3 차원 모델을 직접 변형시키는 기하학적인 변형 방법과 2 차원 이미지의 워핑이나 모핑방법을 이용한 이미지 변형 방법이 있다. 기하학적인 변형 방법 중 3 차원 모델을 변형시키기 위한 방법으로 RBF(Radial Basis Function)을 이용하는 방법이 있다. RBF 함수를 이용하여 모델의 부드러운 변형을 만들 수 있다. 이 방법은 모델의 임의의 한 점을 이동하게 되면 영향을 받는 정점들을 좀 더 자연스럽게 이동시킴으로써 자연스러운 애니메이션을 생성할 수 있다. 본 연구에서는 RBF 를 이용하여 3 차원 얼굴 메쉬 모델의 기하학적 변형을 통해 모델의 얼굴 표정을 생성하는 방법에 대해 제안하고자 한다. 얼굴 모델 변형을 위해 얼굴의 특징인 눈, 입, 턱 부분에 특징점을 정하고 각 특징점에 따라 영향을 받는 영역을 정하기 위해 얼굴 모델을 지역적으로 클러스터링한다. 각 특징점에 따라 영향을 받는 영역에 대해 클러스터링을 적용하고 RBF 를 이용하여 자연스러운 얼굴 표정을 생성하는 방법을 제안한다.
PDF

Korean Caption Extraction with Decision Tree (의사결정 트리를 이용한 한글 자막 추출)

Jung, Je-Hee;Lee, Seun-Hoon;Kim, Jae-Kwang;Lee, Jee-Hyong
- Proceedings of the Korean Information Science Society Conference
- /
- 2008.06c
- /
- pp.527-532
- /
- 2008
자막은 영상과 관련이 있는 정보를 포함한다. 이러한 영상의 정보를 이용하기 위해서 자막을 추출하는 연구가 진행되고 있다. 기존의 자막 추출 연구는 언어 독립적인 특징으로 자막을 이루는 획의 에지는 일정한 간격을 유지하거나 수평라인으로 존재하는 글자의 분포를 이용한 방법을 제안하였다. 이러한 방법들은 획의 간격이 일정한 자막이나 하나의 글자가 하나의 획으로 이루어진 글자에서만 정상적인 동작을 보장하였다. 본 논문에서는 한글 자막 특징을 고려한 자막 추출 방법을 제안한다. 먼저, 한글 자막의 특징인 가로 획의 다수 분포를 고려한 적응형 에지 이진화를 수행하여 에지 영상을 생성하고 에지 연결 객체를 생성한다. 그 후에 생성한 연결 객체를 특징을 추출하여 사전에 생성한 의사결정 트리로 연결 객체를 자막과 비자막 연결객체로 분류한다. 의사결정 트리를 생성하기 위해서 사용한 연결 객체는 뉴스, 다큐멘터리 프로그램에서 획득하였으며, 성능 평가를 위해서 뉴스, 다큐멘터리, 스포츠 프로그램과 같은 대중 방송에서 획득한 영상에서 자막을 추출하였다. 평가 방법은 찾아진 연결 객체 중에 자막 연결 객체의 비율과 전체 자막 중에서 찾아진 자막 연결 객체의 비율로 분석하였다. 실험 결과에서는 제안한 방법이 한글 자막의 추출에 적용 가능함을 보여준다.
PDF

Search Result 2,833, Processing Time 0.032 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)