통합 검색 | Korea Science

실시간 글자 인식을 위한 안드로이드 기반의 글자 영역 추출 기술 (A text region extraction algorithm based on Android for real-time text recognition)

이규철;이상용;유지상
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2016년도 추계학술대회
- /
- pp.194-196
- /
- 2016
본 논문에서는 안드로이드 환경에서 글자 인식을 위한 전처리 과정으로 입력 영상에서 글자 영역만을 추출하는 기법을 제안한다. 대부분의 글자 인식 어플리케이션에서 글자를 인식하는 방법은 RoI(Region of Interest)에 인식하려는 글자를 위치시켜 놓고 사용자가 촬영함으로써 진행된다. 하지만 촬영된 영상 그대로를 인식에 사용하기 때문에 잡음 및 글자가 아닌 영역들을 글자로 인식하는 문제 등으로 인하여 인식률이 현저히 떨어진다. 제안하는 기법에서는 MSER(Maximally Stable Extremal Regions) 기법을 통해 각각의 글자를 추출한 후, 글자의 특성을 이용하여 글자 영역만을 추출한다. 기법의 성능 평가는 무료 OCR(Optical Character Recognition) 엔진인 Tesseract-OCR을 통해 글자 인식률을 비교하였으며, 제안하는 기법을 적용한 글자 인식 시스템이 적용하지 않은 시스템보다 글자의 인식률이 향상되는 것을 확인하였다.
PDF

비디오 자막 추출 기법에 관한 연구 (Extraction of open-caption from video)

김성섭;문영식
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
- /
- pp.481-483
- /
- 2001
본 논문에서는 동영상으로부터 색상, 서체, 크기와 같은 사전 지식 없이도 글자/자막을 효율적으로 추출하는 방법을 제안한다. 해상도가 낮고 복잡한 배경을 포함할 수 있는 비디오에서 글자 인식률 향상을 위해 먼저 동일한 텍스트 영역의 존재하는 프레임들을 자동적으로 추출한 후 이들의 시간적 평균영상을 만들어 향상된 영상을 얻는다. 평균영상의 외각선 영상의 투영 값을 통해 문자영역을 찾고 각 텍스트 영역에 대해 1차 배경제거 과정인 region filling을 적용하여 글자의 배경들을 제거 함으로써 글자를 추출한다. 1차 배경제거의 결과를 검증하고 추가적으로 k-means를 이용한 color clustering을 적용하여 남아있는 배경들을 효율적으로 제거 함으로써 최종 글자영상을 추출한다.
PDF

도메인 어댑테이션을 이용한 폰트 변화에 강인한 한글 분류기 개발

박재우;이은지;조남익
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2019년도 추계학술대회
- /
- pp.50-53
- /
- 2019
본 논문에서는 도메인 어댑테이션을 이용하여 폰트 변화에 강인한 한글 분류기를 학습하는 방법을 제안한다. 제안하는 네트워크 모델은 총 7 개로 이루어져 있으며 각각 이미지로부터 폰트에 무관한 정보를 추출하는 인코더, 추출된 정보의 유효성을 판단하기 위해 이미지 재합성에 사용되는 디코더, 재합성된 이미지의 글자 분류기, 폰트 분류기, 재합성된 글자의 정교함을 판단하는 판별기(discriminator), 그리고 인코더에서 추출된 정보에 대한 글자 분류기, 폰트 분류기이다. 본 논문에서는 적대적 생성 신경망의 학습법을 따르는 도메인 어댑테이션 기법을 이용하여 인코더의 추출 정보가 폰트 정보는 속이면서 글자 분류의 정확성은 높이도록 학습하였다. 학습 결과 인코더로부터 추출되는 정보들은 폰트에 무관한 성질을 지니면서 글자 분류에 높은 정확성을 띄었으며, 추가로 디코더에서 나오는 이미지들도 원본 폰트와 같은 이미지를 생성해 낼 수 있었다.
PDF

만주 글자의 단위를 추출하는 효율적인 방법 (An Efficient Method to Extract Units of Manchu Characters)

스노우버거 아론 다니엘;이충호
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2021년도 춘계학술대회
- /
- pp.617-619
- /
- 2021
만주 문자는 세로로 씌여지며 한 단어 안에서는 띄어쓰기 없이 이어져 있기 때문에 문자를 인식하기 전에 글자영역 분리와 글자를 이루는 단위를 분리해 내는 전처리과정이 필요하다. 본 논문에서는 글자영역을 추출하고 글자의 단위를 끊어내는 전처리 방법을 기술한다. 기존 연구가 단어별 또는 문자단위로 인식하는 방법을 전제로 하거나, 이어져 있는 글자의 줄기를 없앤 후 남는 부분으로 인식하는 것과 달리, 본 방법은 인식 가능한 단위별로 글자를 끊어낸 다음 그 단위의 합성으로 글자를 인식하는 방법에 적용할 수 있다. 실험을 통하여 본 방법의 유효성을 검증하였다.
PDF

색상정보와 행별 Red값 변화량을 이용한 자동차 번호판과 글자 추출 (Extraction of Automobile License Plates and Letter Using Color Information and Red Value Change in Line-by-Line)

유송현;이도경;정제창
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2014년도 추계학술대회
- /
- pp.138-141
- /
- 2014
본 논문에서는 색상 정보를 이용하여 배경 영역이 포함된 자동차의 전,후면 사진에서의 자동차 번호판 영역(녹색, 흰색) 추출과 추출된 번호판에서 글자를 분리해내는 방법을 제안한다. 기존의 색상 정보를 이용하여 번호판을 추출하는 방법은 흰색 번호판(신형 번호판)의 경우에는 배경 영역에서 흰색인 영역도 많고 국내 차량 중에 흰색 차량이 많기 때문에 번호판 영역과 배경 영역 사이의 명확한 구분에 어려움이 있었다. 따라서 행별 Red값 변화도를 조사하여 배경 영역과 번호판 영역 사이의 명확한 구분을 하게 하며, 흰색 번호판의 경우에 추출이 안되면 흰색의 기준을 더 낮추어서 다시 영역 추출을 할 수 있는 재추출 알고리즘을 추가해서 비교적 어두운 사진에서도 번호판영역을 추출할 수 있도록 한다. 추출된 번호판에서 글자를 추출해내는 과정에서도 이진화를 거치면 노이즈가 많이 생기기 때문에 이를 줄이고자 행별 Red값 변화도를 조사하여 번호판 영역에서 위아래 부분의 노이즈를 줄일 수 있도록 하였다.
PDF

의사결정 트리를 이용한 한글 자막 추출 (Korean Caption Extraction with Decision Tree)

정제희;이승훈;김재광;이지형
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
- /
- pp.527-532
- /
- 2008
자막은 영상과 관련이 있는 정보를 포함한다. 이러한 영상의 정보를 이용하기 위해서 자막을 추출하는 연구가 진행되고 있다. 기존의 자막 추출 연구는 언어 독립적인 특징으로 자막을 이루는 획의 에지는 일정한 간격을 유지하거나 수평라인으로 존재하는 글자의 분포를 이용한 방법을 제안하였다. 이러한 방법들은 획의 간격이 일정한 자막이나 하나의 글자가 하나의 획으로 이루어진 글자에서만 정상적인 동작을 보장하였다. 본 논문에서는 한글 자막 특징을 고려한 자막 추출 방법을 제안한다. 먼저, 한글 자막의 특징인 가로 획의 다수 분포를 고려한 적응형 에지 이진화를 수행하여 에지 영상을 생성하고 에지 연결 객체를 생성한다. 그 후에 생성한 연결 객체를 특징을 추출하여 사전에 생성한 의사결정 트리로 연결 객체를 자막과 비자막 연결객체로 분류한다. 의사결정 트리를 생성하기 위해서 사용한 연결 객체는 뉴스, 다큐멘터리 프로그램에서 획득하였으며, 성능 평가를 위해서 뉴스, 다큐멘터리, 스포츠 프로그램과 같은 대중 방송에서 획득한 영상에서 자막을 추출하였다. 평가 방법은 찾아진 연결 객체 중에 자막 연결 객체의 비율과 전체 자막 중에서 찾아진 자막 연결 객체의 비율로 분석하였다. 실험 결과에서는 제안한 방법이 한글 자막의 추출에 적용 가능함을 보여준다.
PDF

글자의 이중상에 의한 심리적 혼란감과 지각 통합 과정 (Psychological Disturbance caused by Letters in Double lmage and its lmplication on Perceptual Integration)

박상호;정찬섭
- 인지과학
- /
- 제6권1호
- /
- pp.47-71
- /
- 1995
글자의 이중상으로 인한 심리적 혼란감을 '글자멀미'라 정의하였고,눈운동 및 글자 인식 과정이 교란될 때 글자 멀미가 발생한다는 가설을 검증하기 위하여 자극의 노출시간과 글자의 친숙도가 글자 멀미에 미치는 효과를 측정하였다.글자 멀미는 자극 노출 시간이 50ms,100ms,3000ms로 길어짐에 따라,덜 친숙한 외국 문자보다는 친숙한 한글에서 유의미한 단어보다는 무의미한 단어에서 큰것으로 나타났다.이러한 실험발견은 이중상을 제거하려는 눈 운동이 실효를 거두지 못함에 따라 글자 멀미가 발생한다는 것,친숙한 글자일수록 글자 인식 과정의 개입을 더 강화하며 그결과 이중상에 의한 교란 효과가 증폭된다는것,글자 형태는 친숙하지만 의미추출이 어렵게 되면 이중상의 교란효과가 가중된다는 것을 암시한다.의미를 처리하는 경향이 클수록 이중상에 의한 글자 멀미가 심해진다는 가설을 좀 더 분명히 검증하기 위하여 여섯 개의 점으로 구성된 점자를 시각적으로 인식하도록 피험자들을 학습시킨 결과,학습율이 증가함에 따라 글자 멀미가 증가하는 것으로 나타나, 하나의 자극을 의미있는 상징으로 취급하여 해석하려 할때 글자멀미가 증가한다는 결론을 얻었다.
PDF

실세계 영상에서 적응적 에지 강화 기반의 MSER을 이용한 글자 영역 추출 기법 (An Extracting Text Area Using Adaptive Edge Enhanced MSER in Real World Image)

박영목;박순화;서영건
- 디지털콘텐츠학회 논문지
- /
- 제17권4호
- /
- pp.219-226
- /
- 2016
일반 생활 속에서 우리 인간의 눈으로 정보를 인식하고 그 정보를 이용하는 것에는 한계가 없을 만큼 다양하고 방대하다. 그러나 인공지능이 발달한 현재의 기술로도, 인간의 시각 처리 능력에 비하면 턱없이 능력이 부족하다. 그럼에도 불구하고 많은 연구자들은 실생활 속에서 정보를 얻고자 하고 있고, 특히 글자로 된 정보를 인식하는데 많은 노력을 기울이고 있다. 글자를 인식하는 분야에서 일반적인 문서에서 글자를 추출하는 것은 일부 정보처리 분야에서 이용되고 있지만, 실영상에서 문자를 추출하고 인식하는 부분은 아직도 많이 부족하다. 그 이유는 실영상에서는 색깔, 크기, 방향, 공통점 등에서 다양한 특징을 갖고 있기 때문이다. 본 논문에서는 이런 다양한 환경에서 문자 영역을 추출하기 위하여 적응적 에지 강화 기반의 MSER을 적용하여 장면 텍스트 추출을 시도하고, 비교적 좋은 방법임을 실험으로 보인다.
https://doi.org/10.9728/dcs.2016.17.4.219 인용 PDF KSCI

해리스 코너 검출기를 이용한 비디오 자막 영역 추출 (Text Region Extraction from Videos using the Harris Corner Detector)

김원준;김창익
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제34권7호
- /
- pp.646-654
- /
- 2007
최근 많은 TV 영상에서 시청자의 시각적 편의와 이해를 고려하여 자막을 삽입하는 경우가 늘어나고 있다. 본 논문에서는 자막을 비디오 내 하단부에 위치하는 인위적으로 추가된 글자 영역으로 정의한다. 이러한 자막 영역의 추출은 비디오 정보 검색(video information retrieval)이나 비디오 색인(video indexing)과 같은 응용에서 글자 추출을 위한 첫 단계로 널리 쓰인다. 기존의 자막 영역 추출은 자막의 색, 자막과 배경의 자기 대비, 에지(edge), 글자 필터 등을 이용한 방법을 사용하였다. 그러나 비디오 영상내 자막이 갖는 낮은 해상도와 복잡한 배경으로 인해 자막 추출에 어려움이 있다. 이에 본 논문은 코너검출기(corner detector)를 이용한 효율적인 비디오 자막 영역 추출 방법을 제안하고자 한다. 제안하는 알고리즘은 해리스 코너 검출기를 이용한 코너 맵 생성, 코너 밀도를 이용한 자막 영역 후보군 추출, 레이블링(labeling)을 이용한 최종 자막 영역 결정, 노이즈(noise) 제거 및 영역 채우기의 네 단계로 구성된다. 제안하는 알고리즘은 색 정보를 이용하지 않기 때문에 여러 가지 색으로 표현되는 자막 영역 추출에 적용가능하며 글자 모양이 아닌 글자의 코너를 이용하기 때문에 언어의 종류에 관계없이 사용 될 수 있다. 또한 프레임간 자막 영역 업데이트를 통해 자막 영역 추출의 효율을 높였다. 다양한 영상에 대한 실험을 통해 제안하는 알고리즘이 효율적인 비디오 자막 영역 추출 방법임을 보이고자 한다.
PDF KSCI

사용자 필적 맞춤형 폰트 생성 서비스 (Custom Handwriting Font Creation Service)

김예진;이수연;심규민;전경구
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2019년도 추계학술발표대회
- /
- pp.946-949
- /
- 2019
한 벌의 한글 글자체를 만드는데 일반적으로 많은 제작 비용과 시간이 소요된다. 따라서 폰트 제작의 어려움을 덜기 위해, 사용자가 대표 글자들을 입력하면 그 글자들의 디자인 특성을 딥러닝 기술을 이용하여 학습한 모델이 나머지 글자들을 자동 생성해주는 시스템 구축한다면 폰트 제작이 훨씬 용이해질 뿐만 아니라 저작권 문제로부터 자유로워질 것이다. 이와 관련된 선행연구를 실행하고 분석해 본 결과 데이터 전처리 과정에서 글자가 잘리거나 크기가 맞지 않아 제대로 된 데이터셋이 구축되지 않는 문제가 있음을 발견하였다. 본 논문에서는 이러한 문제를 해결하기 위해 템플릿에서 자동적으로 글자영역을 추출하고 이미지를 보정하는 전처리 과정과 함께 기존 모델에서 새로운 필터를 추가하여 학습 성능을 높이는 방법을 제안한다. 이를 통해 기존 연구에서 측정된 손실값을 낮춘 결과를 확인했으며 결과적으로 실제 글자체와 더욱 유사한 사용자 맞춤형 글자체를 제공할 수 있을 것이다.
https://doi.org/10.3745/PKIPS.y2019m10a.946 인용 PDF

검색결과 88건 처리시간 0.028초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)