• Title/Summary/Keyword: 문자정보

Search Result 2,109, Processing Time 0.162 seconds

Nonlinear Character Segmentation and Recognition Using Topographic Features in Hangul String Images (한글 문자열 영상의 지형적 특징을 이용한 비선형 문자 분할 및 인식)

  • Lee, Dong-June;Lee, Seong-Whan
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.201-206
    • /
    • 1994
  • 문서 인식 시스템의 성능을 저하시키는 가장 큰 원인 중의 하나로 문자 분할 오류를 들 수 있는데 보다 우수한 성능의 문서 인식 시스템 개발을 위해서는 정확한 문자 분할 방법이 절실히 요구된다. 기존의 문자 분할에 관한 연구들은 이진 영상을 대상으로 함으로써 접촉되거나 겹치는 문자의 경계 부분에서 문자 분할에 유용한 정보들을 잃어 문자 분할 오류를 초래할 수 있다. 하지만 명도 영상을 분석해 보면 문자의 접촉 부분에서 주로 나타나는 지형적 특징이 있으며, 문자 경계에서 명도값이 변하는 것을 관찰할 수 있는데 이와같은 명도 영상의 정보를 사용하면 보다 효과적으로 문자를 분할할 수 있을 것으로 판단된다. 본 연구에서는 이러한 점에 착안하여 명도 영상으로부터 지형적 특징을 추출하고 다단계 그래프 탐색 방법을 이용하여 명도값을 추적함으로써 비선형 문자 경계를 찾는 새로운 문자 분할 방법을 제안한다. 제안된 방법은 명도 문자열 영상을 입력으로 받아 명도 영상의 투영값과 명도 영상으로부터 추출된 지형적 특성을 이용하여 문자 분할 영역을 결정하고 문자 분할 영역내에서 다단계 그래프 탐색에 의한 비선형 문자 분할 경로를 찾는다. 그리고 문자 인식기와 결항하여 최종 문자 분할 위치를 확정하는 인식 결과를 이용한 문자 분할을 수행함으로써 문자 분할 위치 및 문자 인식 결과를 확정한다. 다양한 문서에 대한 실험 결과 제안된 방법이 이진 정보만을 사용하는 방법보다 접촉 혹은 겹친 문자 분할에 매우 효과적임을 알 수 있었다.

  • PDF

Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation (문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리)

  • 이용주;손종목;강경옥;배건성
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1999.11b
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF

A Construction of and industry DB using spatial information on the Web (웹기반형 농공단지 데이터베이스 설계 및 구현)

  • 전흥구;최관순
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2000.12a
    • /
    • pp.1-4
    • /
    • 2000
  • 지금까지의 데이터베이스는 문자정보만을 사용하여 시스템을 구성하였기 때문에, 공간정보를 접하기가 쉽지 않았다. 본 논문에서는 문자정보와 공간정보가 결합된 시스템을 구현함으로써 공간정보와 문자정보에 대한 서비스를 제공할 수 있었다. 본 연구에서는 먼저 로컬 컴퓨터에서 공간정보와 연계된 데이터베이스시스템을 구현하였고, 다음에 웹에서 구현하였다.

  • PDF

Statistical Approach to the Automatic Korean-English String Conversion (통계적 기법에 의한 한-영 문자열의 자동 전환)

  • Ahn, Young-Hoon;Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.205-208
    • /
    • 2001
  • 한글 혹은 영어 문자열을 입력할 때 입력 모드를 수동으로 전환하지 않더라도 입력된 문자열이 한글인지, 영어인지를 자동으로 판단하여 해당 문자열로 변환하는 방법을 제안한다. 한글 문자열일 확률을 계산하기 위해 음절 구성 요건과 음절 빈도 정보를 이용하고, 영어 문자열일 확률을 계산하기 위해 영어 bigram 및 trigram 정보를 이용한다. 또한, 한글과 영어가 혼합된 문자열은 한글일 확률과 영어일 확률이 교차되는 경계 위치를 인식함으로써 혼합 문자열을 생성한다.

  • PDF

A Research on the User's Cognitive Stress According To Font Size displaying on PDA. (PDA의 정보 표시부에 표시되는 문자 크기와 생리적 부담)

  • Kwon O-Jae
    • Science of Emotion and Sensibility
    • /
    • v.8 no.4
    • /
    • pp.321-332
    • /
    • 2005
  • This study is about the effect on the user's cognitive stress by font size when they read on PDA (Personal Digital Assistant). The evaluation was done through both subjective evaluation and physiological one, which is brain wave test, while the research and analysis were focused on the relationship between the user's cognitive stress and font, size. The two final results were found out as follows. 1) Font sizes, which were tested, were 8, 10, 12, 14, and 16points. Among theses, font size 14 was the least stressful for the users. while the most stressful size was found out 8 points. 2) The cerebral cortex reaction according to the font size activated occipital lobe, parietal lobe of occipital visual area. Here we could come to a very important conclusion that the smaller font size on mobile information appliances mate users the more stressed.

  • PDF

Character Element Recognition and Painting Simulation for the Letters to Road Surface (도로 노면 문자 도색을 위한 문자 요소 인식과 도색 실험)

  • Lee, Kyong-Ho;Seong, Jae-Joon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.07a
    • /
    • pp.113-116
    • /
    • 2016
  • 본 논문에서는 사람의 수작업을 통해서 작업을 하고 있는 도로 노면 문자 도색 작업을 자동화하기 위해 문자의 요소 인식과 인식한 결과로 문자 구성 정보를 전달하고, 이 정보를 이용하여 문자를 도색하는 프로그램을 구성하여 도로 노면 문자 도색 모의실험을 수행하였다. 정보처리기기에 프로그램을 구성하여 작업할 문자들을 입력 받아, 이미지 변환과 세선화와 역세선화를 거쳐 만들어진 영상에서 끝점, 2모음점, 3선 이상 모음점, 고립점 등 특징 점들을 추출하고 특징점들을 이용하여 글자를 인식하고, 특징점들을 이용하여 만든 정보를 도로 노면 문자 도색용 장비로 보낸다는 가정 하에 도색 프로그램을 수행 후, 나타난 결과를 피드백 하여 도색 프로그램을 수정하여 도로 노면 문자 도색 작업에 쓸 수 있는 성능의 결과를 구성하였다.

  • PDF

A Technique to Detect Spam SMS with Composed of Abnormal Character Composition Using Deep Learning (딥러닝을 이용한 비정상 문자 조합으로 구성된 스팸 문자 탐지 기법)

  • Ka-Hyeon Kim;Heonchang Yu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.583-586
    • /
    • 2023
  • 대량 문자서비스를 통한 스팸 문자가 계속 증가하면서 이로 인해 도박, 불법대출 등의 광고성 스팸 문자에 의한 피해가 지속되고 있다. 이러한 문제점을 해결하기 위해 다양한 방법들이 연구되어 왔지만 기존의 방법들은 주로 사전 정의된 키워드나 자주 나오는 단어의 출현 빈도수를 기반으로 스팸 문자를 검출한다. 이는 광고성 문자들이 시스템에서 자동으로 필터링 되는 것을 회피하기 위해 비정상 문자를 조합하여 스팸 문자의 주요 키워드를 의도적으로 변형해 표현하는 경우에는 탐지가 어렵다는 한계가 있다. 따라서, 본 논문에서는 이러한 문제점을 해결하기 위해 딥러닝 기반 객체 탐지 및 OCR 기술을 활용하여 스팸 문자에 사용된 변형된 문자열을 정상 문자열로 복원하고, 변환된 정상 문자열을 문장 수준 이해를 기반으로 하는 자연어 처리 모델을 이용해 스팸 문자 콘텐츠를 분류하는 방법을 제안한다. 그리고 기존 스팸 필터링 시스템에 가장 많이 사용되는 키워드 기반 필터링, 나이브 베이즈를 적용한 방식과의 비교를 통해 성능 향상이 이루어짐을 확인하였다.

character segmentation using histogram (히스토그램을 이용한 문자 영역 추출)

  • Kim, Jieum;Jung, Woo Young
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.173-174
    • /
    • 2012
  • 문자 영역의 추출은 명함 등 문서의 정형화된 문자 인식, 비전 기반 감시 시스템에서의 간판, 부호 등의 자연영상에서의 문자 인식 등 다양한 분야에 활용될 수 있다. 우리가 관심을 갖는 문자는 간판이나 이름표 등 다른 이에게 정보를 전달해주는 기능을 하는 것으로 그 전배경의 구분이 명확하다. 이러한 특징은 히스토그램의 변화와 관련이 되어 있으며 본 논문에서는 그 변화를 분석함으로써 문자 영역 추출 방법을 제안한다.

  • PDF

DOT Classification Code Extraction through 3-Dimensional Features (3차원 특징을 이용한 DOT 분류 코드 추출)

  • 김재한;심재창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.394-396
    • /
    • 2001
  • 본 논문의 목적은 타이어에 각인되어 있는 DOT 코드 문자를 효과적으로 추출하는데 있다. 기존의 DOT 문자 인식 방법에서는 카메라와 조명에 의한 2차원 영상에서 DOT 문자 추출을 시도하였는데, 타이어는 DOT 문자와 배경이 동일한 색상이고, 조명에 민감해서 DOT 문자의 추출이 용이하지 않았다. 그래서, 본 논문에서는 타이어의 DOT 문자를 조명에 거의 영향을 받지 않는 3자원 레이저 스캐너를 이용해서 획득하고, 획득된 영상에서 높이 값 정보를 추출했으며 추출된 높이 값 정보를 가진 영상에 패턴 인식 기법을 적용하여 DOT 문자를 효과적으로 추출할 수 있었다.

  • PDF

문자인식에 관한 연구

  • Lee, Gwang-Ro;Jeong, Hui-Seong;Kim, Myeong-Won
    • Electronics and Telecommunications Trends
    • /
    • v.4 no.2
    • /
    • pp.124-142
    • /
    • 1989
  • 인간의 정보교환이나 기록의 매체로써 인간사회에서 중요한 문자는 시간이 경과함에따라 사용량이 비약적으로 증가해 왔으며, 앞으로도 증가 추세는 더욱 가증될 전망이다. 이러한 계속적인 정보의 증가는 활자를 매체로 하는 수용 한계를 넘어, 이미 computer를 활용하지 않으면 안되게 되었다. 특히, 기존의 문서화 되어있는 필요한 많은 data와 나날이 늘어나는 정보의 양을 database화 하여, 원하는 정보를 신속히 찾아내기 위해서는 기존의 key board를 이용하여 사람의 손으로 입력하는 방법보다 신속하고 정확한 입력장치개발이 요구된다. 이러한 data입력장치의 개발이 선행되지 않는다면 computer의 정보처리 속도와 연산속도가 아무리 향상되어도 효율적인 정보처리를 이룩할 수 없을것이다. 그러므로 이러한 것을 실현하기 위해서는 먼저 문자의 인식이 필요불가결하다. 본 논문에서는 문자인식의 현황과 문제점을 제시함으로써 효율적이고 경제적인 문자인식 sysyem 구축에 도움이 되기 바라며 이하 OCR(Optical Character Recognition)의 역사와 발전, 문자인식 방법과 문자인식 system의 구성, On-line 문자인식과 Off-line 문자인식에 관하여 논하고 결론을 맺는다.