• 제목/요약/키워드: 글자 분할

검색결과 36건 처리시간 0.021초

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

  • 이용주;손종목;강경옥;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF

계층적 신경망을 이용한 주민등록증 성명인식 (Printed Name on ID Card recognition using a Hierachical Organized Neural Network)

  • 서원택;조범준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.325-327
    • /
    • 2003
  • 본 논문에서는 인쇄체 한글을 실용적으로 인식할 수 있는 계층적으로 구성한 신경망을 제안하고, 이를 이용해서 주민등록증의 성명을 인식하는데 적용하였다. 문자영상을 신경망을 이용하여 한글의 6가지 유형으로 먼저 분류한 후, 분류된 문자영상을 각 형식에 따라 자소단위로 분할해서 각 형식에 따른 신경망으로 인식하는 구조로 만들었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른것에 대해서 강인한 훈련을 할 수 있었다. 또한 입력단에서의 잡음을 줄이기 위해 히스토그램의 국부 평균을 적용하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력받아서 테스트한 결과 98.1%의 높은 인식률을 얻을 수 있었다.

  • PDF

모바일 한자 학습 애니메이션 생성 (Animation Generation for Chinese Character Learning on Mobile Devices)

  • 구상옥;장현규;정순기
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권12호
    • /
    • pp.894-906
    • /
    • 2006
  • 모바일 기기의 성능 및 화면, 무선 네트워크의 속도 등의 제약으로 모바일 컨텐츠 개발에는 많은 어려움이 있다. 단순히 유선 웹상에서 기존에 서비스 되던 컨텐츠의 가시적인 축소만으로는 양질의 컨텐츠 제작이 어렵다. 빠르게 변화하는 모바일 컨텐츠 시장에 적응하기 위해서는 컨텐츠 특성에 최적화된 데이타 표현 기법 및 저작 도구의 개발이 이루어져야 한다. 본 논문에서는 모바일 기기 상에서의 한자 학습을 위한 적은 용량의 모바일 컨텐츠 및 저작 도구를 개발하였다. 본 연구에서 개발한 모바일 컨텐츠는 단순히 한자 이미지와 설명 정보를 보여주는 것이 아니라, 한자 획순으로 붓으로 쓰는 것과 같은 애니메이션 효과를 줄 수 있다. 또한 저작 도구는 사용자가 그래픽이나 한자, 모바일 프로그래밍에 관한 전문가가 아니더라도 쉽고 빠르게 컨텐츠를 생성할 수 있는 개발 환경을 제공한다. 본 논문은 트루타입 폰트로부터 글자 모양을 획득하여, 간단한 사용자 입력으로 획 분할 및 획 순서 정보를 얻고, 자동으로 획의 방향을 추출, 각 획마다 붓으로 쓰는 효과의 애니메이션을 생성한다. 다음으로 모바일 기기에서의 효율적인 글자 애니메이션을 위해 애니메이션 데이타를 압축한다. 본 논문은 한자뿐 아니라, 한글 또는 다른 형태의 그래픽에도 이용될 수 있으며, 향후 획 분할 및 획 순서 결정을 자동화하는 방법을 연구하고자 한다.

최단 경로 알고리즘을 이용한 접합 영문자 분할 (Minimum-cost Path Algorithm for Separating Touching English Characters)

  • 이득용;오일석
    • 전자공학회논문지
    • /
    • 제49권10호
    • /
    • pp.102-108
    • /
    • 2012
  • 본 논문은 명암 영상에서 최단 경로 알고리즘을 이용해 인쇄체 접합 문자를 비선형으로 분리하는 방법을 제안한다. 기존의 최단 경로 알고리즘은 특정한 형태의 접합문자를 분할하지 못하는 단점을 가지고 있다. 우리는 기존 알고리즘이 실패하는 상황을 분석하고, 분석 결과를 활용하여 기존 알고리즘이 사용하는 규칙의 문제점을 파악하였다. 그런 후 기존 알고리즘을 두 가지 방향에서 개선하였다. 첫째, 새로운 벌칙항을 추가하여 보다 정교한 경로를 추정하였다. 둘째, 경로 탐색 시 상향 탐색과 하향 탐색을 병행하고 보다 좋은 해를 선택하였다. 실험을 통해 제안하는 알고리즘이 기존 알고리즘에 비해 분할 성공률 면에서 3~4%정도 우수함을 입증하였다.

텍스쳐 특징과 구조적인 정보를 이용한 문서 영상의 분할 및 분류 (Document Image Segmentation and Classification using Texture Features and Structural Information)

  • 박근혜;김보람;김욱현
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.215-220
    • /
    • 2010
  • 본 논문은 문서 영상을 대상으로 표, 그림, 글자 등의 각 구성요소들을 자동으로 분류하기 위한 새로운 텍스쳐 기반의 영상 분할 및 분류 방법을 제안한다. 제안한 방법은 문서 영상 분할 단계와 문서 영상 내 구성요소 분류 단계로 이루어진다. 먼저 영상 분할을 수행한 후, 분할된 영역을 대상으로 문서 영상의 구성 요소들을 분류하는데, 이때 각 구성 요소는 서로 다른 텍스쳐를 가지고 있는 영역이라는 특징을 이용한다. 분할된 영역들을 분류하기 위한 텍스쳐 특징을 추출하기 위해 다양한 텍스쳐 분석에 광범위하게 사용되는 2차원 가보필터를 이용한다. 제안한 방법은 구성 요소와 사용 언어에 대한 사전 지식을 이용하지 않으면서 문서 영상의 분할 및 구성요소 분류에서 좋은 성능을 보인다. 제안한 방법은 멀티미디어 데이터 검색, 실시간 영상 처리 등과 같은 다양한 분야에 적용 될 수 있다.

Exploring the possibility of using ChatGPT and Stable Diffusion as a tool to recommend picture materials for teaching and learning

  • Soo-Hwan Lee;Ki-Sang Song
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.209-216
    • /
    • 2023
  • 본 연구에서는 인공지능 에이전트인 ChatGPT와 Stable Diffusion을 활용하여 교사가 입력한 수업 주제어에 따라 교수·학습용 그림 자료를 추천하는 프로그램을 구현하여 교육적 활용에 대한 가능성을 탐색하였다. 구현한 프로그램은 키워드 당 30가지 내외의 그림 자료를 추천하였으며 부적절한 그림이 생성되는 경우에는 필터링 되었다. 전체 그림자료 추천에 소요된 시간은 평균 6분 내외이다. 대체로 키워드와 관련된 그림을 추천해 주었으며 추천한 그림 속의 글자는 글자를 나타내려는 의도만 알 수 있고 글자를 인식하고 뜻을 알 수는 없었다. 그러나, 추천되는 그림의 종류나 내용이 ChatGPT의 응답에 전적으로 의존하고 있다는 점과 모든 키워드에 대한 그림을 정확하게 추천할 수 있는지 알 수 없는 점은 추가적인 연구가 필요해 보인다. 또한, 추천된 그림이 키워드와 관련된 것은 사실이나 교육적인 가치를 가지고 있는가에 대한 평가는 인간 교사의 판단에 맡겨야 할 논의의 대상이라고 결론지었다.

트루타입폰트 기반 자동 획 분할 (Automatic Stroke Extraction Based on TrueTypeFont)

  • 장현규;구상옥;정순기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.703-705
    • /
    • 2005
  • 이 논문에서는 트루타입 폰트(TrueTypeFont: TTF)로부터 한자의 외곽선 정보를 얻어 자동으로 획을 분리해 내는 방법을 제안한다. 트루타입 폰트는 각 글자에 대한 외곽선 정보를 벡터 형식으로 저장하고 있다. 저장된 벡터의 방향과 위치 정보를 사용하여 한자의 획을 하나씩 분리해 낸 후, 그것을 조합하면 효율적으로 한자 학습 컨텐츠를 완성 할 수 있다. 제안한 방법으로 완성된 컨텐츠는 트루타입 폰트가 갖고 있는 벡터 이미지로서의 특성을 그대로 취할 수 있다는 장점이 있다. 제안한 방법으로 획을 분리하고 분리된 획을 순서대로 조합하여 보다 양질의 학습 컨텐츠를 제작할 수 있을 것으로 기대한다.

  • PDF

다양한 크기 및 활자체를 갖는 인쇄체 한글 영상의 문서화에 관한 연구 (A Study on Documentization of Printed Hangul Image with Multi-size and Multi-style)

  • 김장욱;김경숙;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 추계학술대회 학술발표 논문집
    • /
    • pp.295-298
    • /
    • 2001
  • 본 논문에서는 CCD카메라로 입력 받은 다중 크기 및 활자체로 구성된 한글문서의 화상 데이터를 편집기에서 수정 가능한 문자로 변환시키는 시스템을 구현하였다. 먼저 Dynamic 이 진화 처리 과정을 거친 화상을 흑백 화소의 누적분포에 따라 문자단위로 분할한 후, 다양한 크기로 분할된 문자를 표준패턴 크기로 표준화 시켰다. 한글을 자소 간 공백 위치의 특징에 따라서 6가지 유형으로 분류한 후, 퍼지 이론을 접목시킨 원형 패턴 벡터 알고리즘을 사용해서 표준벡터와 입력된 글자의 특징벡터를 비교하여 문자로 인식하게 하였다. 각 6가지 유형에서 서로 다른 자소로 결합된 문자들을 30개 선정하여 여러 가지 활자체 및 크기에 적용해 본 결과, 모두 문서화가 가능함을 알 수 있었다.

  • PDF

중국어 정보검색을 위한 확장된 바이그램 분할기법 (An Extended Bigram Segmentation Method for Chinese Information Retrieval)

  • 김운;강지훈;맹성현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.490-492
    • /
    • 2003
  • 중국어 문장은 영어와 한국어와 달리 단어에 대한 명확한 한계가 없기 때문에 중국어 정보검색 시스템에서는 중국어 문장에 대한 색인 작업을 각각의 글자를 기본단위로 자르는 방법을 사용하거나 또는 단어의 한계에 관한 정보가 이미 제공된 단어 사전을 이용하여 색인하는 방법을 사용하고 있다. 하지만 이 두 가지 방법은 모두 장단점이 있다. 본 논문에서는 이 두 가지 방법의 장점을 취하고 단점을 보안하는 방법으로 확장한 바이그램 분할기법을 제안하려 한다. 이 방법은 실용성이 있으며, 검색성능 향상을 도모하였다.

  • PDF

지역적 엔트로피와 텍스처의 주성분 분석을 이용한 문서영상의 분할 및 구성요소 분류 (Segmentation and Contents Classification of Document Images Using Local Entropy and Texture-based PCA Algorithm)

  • 김보람;오준택;김욱현
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.377-384
    • /
    • 2009
  • 본 논문은 지역적 엔트로피 기반의 히스토그램을 이용한 문서영상의 분할과 텍스처 기반의 주성분 분석을 이용한 구성요소인 글자, 그림, 그래프 등의 구성요소 분류방안을 제안한다. 지역적 엔트로피와 히스토그램을 이용함으로써 문서영상의 다양한 변형이나 잡음에 강건하며 빠르고 손쉬운 이진화가 가능하다. 그리고 문서영상 내 존재하는 구성요소들이 각기 다른 텍스처 정보를 가지고 있다는 것에 착안하여 각 분할 영역의 텍스처 정보를 기반으로 주성분분석을 수행하였으며 이를 통해 사전에 구성요소들에 대한 구조정보를 설정할 필요가 없다는 장점을 가진다. 실험결과에서 다양한 문서영상의 분할 및 분류결과를 보였으며, 기존 방법보다 우수한 성능을 가져 그 유효함을 보였다.