통합 검색 | Korea Science

장면 이미지로부터 문자-에지 맵 특징을 이용한 텍스트 추출 (Text Extraction using Character-Edge Map Feature From Scene Images)

박종천;황동국;이우람;권교현;전병민
- 한국산학기술학회:학술대회논문집
- /
- 한국산학기술학회 2006년도 춘계학술발표논문집
- /
- pp.139-142
- /
- 2006
본 연구는 장면 이미지로부터 텍스트에 존재하는 문자-에지 특징을 이용하여 텍스트를 추출하는 방법을 제안한다. 캐니(Canny)에지 연산자를 이용하여 장면 이미지로부터 에지를 추출하고, 추출된 에지로부터 16종류의 에지-맵 생성한다. 생성된 에지 맵을 재구성하여 문자 특징을 갖는 8종류의 문자-에지 맵을 만단다. 텍스트는 배경과 잘 분리되는 특징이 있으므로 텍스트에 존재하는 '문자-에지 맵'의 특징을 이용하여 텍스트를 추출한다. 텍스트 영역에 대한 검증은 문자-에지 맵의 분포와 텍스트에 존재하는 글자간의 공백 특징으로 한다. 제안한 방법은 다양한 종류의 장면 이미지를 실험대상으로 하였고, 텍스트는 적어도 2글자 이상으로 구성된다는 제한조건과 너무 크거나 작은 텍스트는 텍스트 추출에서 제외하였다. 실험결과 텍스트 영역 추출률은 약 83%를 얻었다.
PDF

장면 텍스트 영역 추출을 위한 적응적 에지 강화 기반의 기울기 검출 및 보정 (The Slope Extraction and Compensation Based on Adaptive Edge Enhancement to Extract Scene Text Region)

백재경;장재혁;서영건
- 디지털콘텐츠학회 논문지
- /
- 제18권4호
- /
- pp.777-785
- /
- 2017
실세계에서 텍스트가 포함 된 장면은 텍스트를 추출하고 인식하여 많은 정보를 얻을 수 있으므로, 장면의 텍스트 영역을 추출하고 인식하는 기술들은 꾸준히 발전하고 있다. 장면에서 텍스트 영역을 추출하는 기술은 크게 텍스쳐를 기반으로 하는 방법과 연결요소방법, 그리고 이 둘을 적절히 혼합하는 방법들로 구분 할 수 있다. 텍스처를 기반으로 하는 방법은 영상의 색상, 명도 등의 정보를 이용하여 텍스트가 다른 요소와는 다른 값을 갖는다는 것을 기반으로 한다. 연결 요소 방법은 장면의 각 화소마다 인접해 있는 유사 화소를 연결 요소로 만들어 기하학적인 특성을 이용하여 판별한다. 본 논문에서는 텍스트 영역 추출의 정확도를 높이기 위해 영상의 기울기를 검출하고 보정한 후 에지를 적응적으로 변경하는 방법을 제안한다. 제안 방법은 영상의 기울기를 보정한 후 텍스트가 포함 된 정확한 영역만 추출하기 때문에 MSER보다 15%, EEMSER보다 10% 더 정확하게 영역을 얻었다.
https://doi.org/10.9728/dcs.2017.18.4.777 인용 PDF KSCI

스크립트에 기반한 시공간 상황들을 표현하기 위한 멀티미디어 시뮬레이터의 개발 (Development of a Script-Based Multimedia Simulator for Representing Spatio-Temporal Situation)

백경훈;박종희;김남철
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 1996년도 학술대회
- /
- pp.119-124
- /
- 1996
본 논문에서는 복잡하고 다양한 시공간적 장면들을 하이퍼텍스트적 구조[1]를 이용하여 서로 연결하고 스크립트 및 프레임이라는 구조를 통해서 장면을 구성함으로써 객체의 재활용도 및 네트워킹을 높이는 객체지향적 멀티미디어 시스템을 설계하고 개발한다. 장면을 구성하는 사물을 객체로 정의하며, 이러한 객체는 2D 그래픽, 텍스트, 사운드와 같은 멀티미디어 정보와 장면에 적용되었을 때 필요한 정보로 구성되어져 있다. 이와 함께 장면과 객체 사이를 연결하는 스크립트와 프래임구조를 통해서 장면 속에서의 객체의 역할을 정의한다.
PDF

MPEG-4 컨텐츠 저작 도구

김상욱;차경애;김희선;배수영;지동해;민옥기
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
- /
- pp.254-256
- /
- 1999
MPEG-4는 멀티미디어 객체들로 구성된 시청각 장면을 컨텐츠 단위로 표현하기 위해서 장면을 기술하는 장면 디스크립션을 가진다. 이것은 장면을 구성하는 각 멀티미디어 객체들의 시공간적인 위치와 그들 사이의 관계를 표현하는 이진 형식의 스트림이다. 즉 MPEG-4 장면을 저작하기 위해서는 텍스트 형태로 장면 디스크립션을 기술한다. 그러나 시청각 컨텐츠로 구성되는 장면의 저작은 시각적으로 컨텐츠를 구성할 수 있는 저작 환경의 제공이 보다 효과적이고 편리한 작업을 가능하게 할 것이다. 본 논문에서는 시청각 장면의 텍스트 저작 작업의 한계를 극복하고 MPEG-4 컨텐츠의 시공간적 관계를 시각적으로 저작할 수 있는 MPEG-4 장면의 시각적 저작도구를 제안하고 그 구현 예를 보인다.
PDF

MPEG-4 LASeR 장면기술을 활용한 효율적인 EPG 서비스 제공 방법 (Effective EPG service on the basis of using MPEG-4 LASeR scene description)

박용철;김병철;김규헌
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2011년도 추계학술대회
- /
- pp.188-191
- /
- 2011
본 논문에서는 MPEG-4 LASeR (Lightweight Application Scene Representation) 장면기술을 활용하여 효과적인 EPG(Electronic Program Guide) 서비스를 제공하는 방안을 제안한다. EPG는 텔레비전 방송 프로그램의 편성표를 텔레비전 화면상에 표시하는 것으로, 텔레비전을 시청하는 사람은 이 편성표를 통해 원하는 프로그램을 선택하거나 시간, 제목, 채널, 장르 등을 기준으로 원하는 프로그램을 검색할 수 있는 서비스를 말한다. 국제 표준 규격인 MPEG-4에는 장면의 동적인 업데이트를 위해 다양한 명령을 포함한 장면 서술정보를 제공 할 수 있는 LASeR 기술을 제공하고 있다. 특히, LASeR 표준은 구조화된 정보의 표현 및 수정 방법을 제공하기 위한 방법으로 PMSI (Presentation Method & Structured Information)를 제정하였으며, 해당 기술은 장면 서술정보에서 구조화된 정보의 일부분을 참조하여 장면에 효과적으로 표현하는 것을 가능하게 해 준다. 본 논문에서는 MPEG-4 LASeR PMSI를 기존의 텍스트 중심의 단순 EPG에 적용하여 텍스트 뿐만이 아닌 이미지 비디오 등의 멀티미디어 데이터를 활용하여 보다 동적으로 EPG 서비스를 제공하는 방법에 대하여 제안한다.
PDF

에지 및 컬러 양자화를 이용한 모바일 폰 카메라 기반장면 텍스트 검출 (Mobile Phone Camera Based Scene Text Detection Using Edge and Color Quantization)

박종천;이근왕
- 한국산학기술학회논문지
- /
- 제11권3호
- /
- pp.847-852
- /
- 2010
자연 영상 내에 포함된 텍스트는 영상의 다양하고 중요한 특징을 갖는다. 그러므로 텍스트를 검출하고 추출하여 인식하는 것이 중요한 연구대상으로 연구되고 있다. 최근 모바일 폰 카메라를 기반으로 다양한 분야에서 많은 응용 기술이 연구 개발되고 있다. 본 논문은 에지 및 연결요소를 이용한 장면 텍스트 검출 방법을 제안한다. 그레이스케일 영상으로부터 에지 성분 검출과 지역적 표준편차를 이용하여 텍스트 영역의 경계선을 검출하고, RGB 컬러공간의 유클리디안 거리를 기준으로 연결요소를 검출한다. 검출된 에지 및 연결요소를 레이블링하고 각각 영역의 외곽사각형을 구한다. 텍스트의 휴리스틱 이용하여 후보 텍스트를 추출한다. 후보 텍스트 영역을 병합하여 하나의 후보 텍스트 영역을 생성하고, 후보 텍스트의 지역적 인접성과 구조적 유사성으로 후보 텍스트를 검증함으로서 최종적인 텍스트 영역을 검출하였다. 실험결과 에지 및 컬러 연결요소 특징을 상호 보완함으로서 텍스트 영역의 검출률을 향상시켰다.
https://doi.org/10.5762/KAIS.2010.11.3.847 인용 PDF KSCI

공간주파수를 이용한 장면영상에서 텍스트 검출 (Text Detection in Scene Images using spatial frequency)

Sin, Bong-Kee;Kim, Seon-Kyu
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제30권1_2호
- /
- pp.31-39
- /
- 2003
장면 영상 속의 분사 영역에는 다른 부분과는 구분되는 특징적인 공간주파수가 있다. 이 특징은 직관적이며 또한 유용한 정보로서의 가치가 있다. 본 논문에서는 장면 영상에서 수평 텍스트를 찾는 방법을 제안한다. 수직 및 수평 방향으로 걸친 edge 픽셀의 빈도수와 푸리에 변환에 의한 기본 주파수의 두 가지 특징을 이용한 방법이다. 두 가지 특징을 독립적으로 활용하여 그 결과를 결합하거나 연속하여 적용하여 원하는 결과를 얻을 수 있다. 이와 같은 특징은 대체로 언어 또는 문자에 무관함을 확인하였다. 이에 추가하여 Hough 변환을 이용한 장면 속의 사각형을 탐색하였다. 여러 사람들에게 유용한 정보는 보통 강한 색상대비로 눈에 잘 띄는 색깔의 사각형 안에 씌어있는 경우가 보통이므로 사자형의 탐색함으로써 보다 효과적으로 문자를 탐색할 수 있다.
PDF KSCI

모션 그래픽을 이용한 스톱모션 텍스트 콘텐츠 제작에 관한 연구 (A Study on Stop Motion Text Contents Production using Motion Graphics)

주헌식
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
- /
- pp.189-190
- /
- 2015
본 연구에서는 모션 그래픽을 이용하여 스톱 모션 텍스트 제작을 나타내었다. 스톱모션은 컴퓨터애니메이션의 한 종류로서 인형이나 찰흙 같은 소재를 이용하여 한 장면씩 정지 영상을 촬영하여 연속적으로 나타냄으로써 애니메이션으로 이용된다. 본 연구에서는 스톱모션 응용으로 텍스트 애니메이션 기법을 적용하여 텍스트 콘텐츠로 제작하여 나타내었다. 따라서 다양한 영역에서 스톱모션 활용을 할 수 있음을 나타낸다.
PDF

색기반 이진화를 이용한 장면 텍스트 추출과 써포트 벡터머신을 이용한 텍스트 영역 검증 (Scene Text Detection Using Color-Based Binarization and Text Region Verification Using Support Vector Machine)

장대근;김의정
- 한국정보통신학회:학술대회논문집
- /
- 한국해양정보통신학회 2007년도 춘계종합학술대회
- /
- pp.161-163
- /
- 2007
기존의 텍스트 추출을 위한 이진화 방법은 입력 이미지를 명도 이미지로 변환한 뒤 이진화 하는 방법을 사용하였다. 이러한 방법은 칼라 이미지에서는 극명히 구분되는 색이라 할지라도 명도 이미지로 변환하는 과정에서 같은 밝기를 같게 되는 경우(예를 들어, 배경은 붉은색, 텍스트는 초록색), 텍스트를 추출하는 데 어려움이 있다. 본 논문에서는 이러한 문제를 해결하기 위해 입력 이미지를 R, G, B로 분리하고 각각을 이진화 하여 텍스트를 추출하고 다해상도 웨이블릿(Wavelet) 변환을 이용하여 텍스트의 획 특징을 추출하여 추출된 특징들을 SVM(Support Vector Machine) 분류기로 검증하여 최종 텍스트 영역을 확정한다. 제안한 방법을 적용함으로써 명도 정보만으로는 추출하기 어려웠던 텍스트 영역을 효과적으로 추출하고 텍스트와 구별하기 어려운 영역을 획수준으로 검증할 수 있었다.
PDF

장면 텍스트 추출을 위한 캐니 연산자의 적응적 임계값을 이용한 AEMSER (AEMSER Using Adaptive Threshold Of Canny Operator To Extract Scene Text)

박순화;김동현;임현수;김홍훈;백재경;박재흥;서영건
- 디지털콘텐츠학회 논문지
- /
- 제16권6호
- /
- pp.951-959
- /
- 2015
장면 텍스트 추출은 현대 스마트 시대에서 쏟아져 나오는 다양한 영상 기반 응용에 중요한 정보를 제공하기 때문에 중요하다. 기본적인 MSER(Maximally Stable Extremal Regions) 추출 후에 캐니 연산자를 이용하여 경계를 강화시키는 Edge-Enhanced MSER은 텍스트 추출 측면에서 뛰어난 성능을 보인다. 하지만 캐니 연산자의 임계값 설정에 따라 Edge-Enhanced MSER의 결과영상이 다르게 나타나므로 임계값 설정을 계산하는 방법이 필요하다. 본 논문에서는 캐니 연산자의 임계값을 설정하는 방법 중 히스토그램의 중앙값을 이용하여 경계를 추출하고 이를 Edge-Enhanced MSER에 적용한 AEMSER(Adaptive Edge-enhanced MSER)을 제안한다. 이 방법은 명확한 경계에 대해서만 영역을 추출하기 때문에 기존의 방법보다 더 좋은 결과영상을 얻을 수 있다.
https://doi.org/10.9728/dcs.2015.16.6.951 인용 PDF KSCI

검색결과 70건 처리시간 0.02초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)