• 제목/요약/키워드: Text line information

검색결과 147건 처리시간 0.029초

비디오 영상 정보 검색을 위한 문자 추출 및 인식 (Caption Detection and Recognition for Video Image Information Retrieval)

  • 구건서
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권7호
    • /
    • pp.901-914
    • /
    • 2002
  • 본 논문에서는 비디오에서 입력된 영상으로부터 내용기반 검색을 위해 자동으로 자막을 추출하여 특징 추출을 기반의 단층 연결 신경망 인식기(FE-MCBP)에 의해 자막 문자를 인식하여 영상 자막의 내용을 검출하는 방법을 제시하였다. 비디오에서 자막 추출은 먼저, 비디오에서 일정한 시간 간격으로 획득한 프레임 중에서 히스토그램 분석을 통하여 키 프레임을 찾는 과정을 수행하며, 그 다음에 각각의 키 프레임에 대하여 칼라 세그먼테이션 후 라인 검사 방법 통하여 자막 영역을 추출하도록 하였다. 마지막으로 추출된 자막영역에서 개별문자를 분리하였다. 본 연구에서는 칼라 히스토그램을 분석 후 지역 최대값을 이용하여 세그먼테이션 후 라인 검사를 수행함으로써 처리 속도와 자막영역 검출의 정확도를 개선하였다. 비디오에서 자막 추출은 비디오 정보를 멀티미디어 데이터베이스화하는 초기 단계로 추출된 자막은 바로 문자 인식기의 입력이 된다. 또한 인식된 자막정보는 데이터베이스로 구축되며 내용기반 검색 기법에 의해 검색되도록 하였다.

  • PDF

오프라인 한글 문자 인식을 위한 효율적인 오인식 단어 교정 방법 (An Efficient Correction Method for Misrecognized Words in Off-line Hangul Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1598-1606
    • /
    • 1996
  • 문자 인식 과정을 거치고 난 후에 발생하게 되는 오인식된 문자들을 언어적 지식 을 이용하여 교정하는 문자 인식 후처리 과정이 반드시 필요하다. 본 논문에서는 한 국어의 형식 측면에서 품사를 재분류하고 사전을 구성하며 한글 어절의 상태 전이도 를 구성하고 형태소 분석을 위해 Head-tail구분법을 적용해 단어를 분리하였다. 또한 본 논문에서는 효율적인 단어분리와 교정을 위해 여러 문서와 책들로부터 새롭게 조 사의 결합형으로 900여개를, 규칙 어미의 활용형으로 800여개를 수집하였다. 그리고 불규칙 용언의 활용형을 위해 국어학에 나오는 9개의 불규칙을 조사하여 활용형을 구 축하였고 자동적 교체와 불구동사의 활용형도 사전에 등록하여 어절을 분석하는데 이 용하였다. 어느 인식 시스템을 가지고 문서를 인식한 결과 93.7%의 인식률을 보인 것 을 본 단어교정방법을 적용한 결과 97% 인식률을 향상시킬 수 있었다.

  • PDF

반 전역 정렬을 이용한 온라인 게임 변형 욕설 필터링 시스템 (The Online Game Coined Profanity Filtering System by using Semi-Global Alignment)

  • 윤태진;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.113-120
    • /
    • 2009
  • 온라인 게임에서의 언어폭력 문제는 매우 심각하지만 그에 대한 효과적인 정책이나 기술적인 방법은 부족한 상황이다. 온라인 게임 서비스 업체에서는 금칙어 리스트를 작성하여 Swear Filter를 이용한 고정된 형식의 문자열 검색 방식을 통해 문제를 해결하려고 하고 있으나 사용자들은 다양한 방법으로 욕설을 조합 또는 변형시켜 기존의 필터링을 회피하고 있다. 특히 한글은 욕설의 변형이 매우 쉬운 특성을 가지고 있다. 본 논문에는 한글에 기초한 변형 욕설을 효율적으로 탐색하여 걸러내는 알고리즘을 제시한다. 이 알고리즘의 주된 특징은 변형 욕설의 표준형 변환과 자소단위의 반 전체 정렬(semi-global alignment), 이다. 실험 결과 저자들이 다양한 인터넷 게임 환경에서 직접 수집한 다종의 욕설 단어들에 대하여 약 90%의 우수한 필터링 성능을 보였다.

외국어 능력 향상을 위한 사용자 안구운동 분석 기반의 지능형 학습도구 개발 (Development of Intelligent Learning Tool based on Human eyeball Movement Analysis for Improving Foreign Language Competence)

  • 신지혜;장영민;김상욱;;배정옥;최성묵;이민호
    • 전자공학회논문지
    • /
    • 제50권11호
    • /
    • pp.153-161
    • /
    • 2013
  • 최근 효율적인 외국어 학습 및 테스트를 위한 교육 콘텐츠 개발에 대한 연구가 많이 되고 있다. 이러한 추세에 기반 하여, 온라인 학습 도구와 방송매체 등의 IT 기술을 이용한 e-learning 교육용 콘텐츠 개발이 급격하게 증가하고 있는 추세이다. 하지만 기존의 IT 기술을 이용한 교육용 콘텐츠들은 단방향의 학습 정보만을 제공하기에, 외국어 글을 이해하는 데는 사용자의 학습 편의를 제공하기 어렵다. 사용자 편의가 제공되려면 사용자의 학습 진단에 대한 부가적인 off-line 분석이 요구된다. 이에 본 논문에서는 사용자의 외국어 능력 향상을 위하여, 실시간(on-line)으로 학습 콘텐츠를 제공하여 외국어 능력을 진단하고, 향상시키기 위한 사용자 안구운동 분석 기반의 지능형 학습 도구를 제안한다. 이에 본 논문에서는 사용자 학습상태를 분석하기 위하여 인지심리학/신경생리학 기반의 사용자 학습상태와 관련된 안구 운동 특징 정보를 추출하고 판별 분석한다. 본 논문에서 제안하는 지능형 학습 도구는 앞서 언급한 사용자 안구운동 특징 정보를 기저로 하여 사용자가 외국어 읽기를 수행할 때, 사용자가 응시하고 있는 단어에 대하여, '안다/모른다'를 분석하여, 모르는 단어일 경우 실시간(on-line)으로 웹에서 단어를 검색하고, 정리하여 사용자에게 제공함으로써, 외국어로 된 글을 읽고 이해하는데 도움을 주는 자가 학습 서비스를 제공한다. 제안하는 시스템은 학습자들에게 자기 주도적 학습 도구를 제공하고, 자동화된 학습 콘텐츠로 외국어로 된 글의 이해에 대한 성취와 만족도를 높일 수 있다.

이커머스에서 정보 탐색을 위한 네비게이션 인터페이스 디자인 유형 연구 (A study on the type of navigation interface design for information search in e-commerce)

  • 정다영;김승인
    • 디지털융복합연구
    • /
    • 제19권10호
    • /
    • pp.411-418
    • /
    • 2021
  • 본 연구에서는 Statista와 National Retail Federation가 선정한 100대 이커머스 서비스들을 대상으로 실제 사용자에게 제공하고 있는 정보 탐색 방식 및 사용자 인터페이스의 유형을 조사하고, 인터페이스를 구성하는 시각화 요소 및 조작에 대한 상호작용 방식을 분석한 후 각 유형이 가지는 특성을 도출하였다. 연구결과, 첫째, 정보의 수와 위계단계가 많을수록 스프레드 형태를, 적을수록 드롭다운과 메가 메뉴 방식을 사용하는 경우가 많았다. 둘째, 정보 위계에 따른 시각적 구분 방식은 배경색상, 서체의 변화, 선을 가장 많이 사용하며 변화에 대한 인지가 가장 빠른 배경 색상과 영역간 구분을 명확하게 할 수 있도록 돕는 선을 사용하는 경우가 많았다. 셋째, 사용자 조작에 대한 상호작용 방식은 배경 컬러, 텍스트 컬러, 선 등 다양한 요소들을 두 가지 이상 동시에 적용하는 경우가 가장 많았다. 본 연구는 이커머스의 정보 탐색을 위한 인터페이스의 유형과 세부 요소들의 선택 기준이 될 수 있는 항목들의 분석을 통해 유형별 특성을 정의하였다는 점에서 의미가 있다.

텍스트 마이닝과 의미 네트워크 분석을 활용한 뉴스 의제 분석: 코로나 19 관련 감정을 중심으로 (Analysis of News Agenda Using Text mining and Semantic Network Analysis: Focused on COVID-19 Emotions)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.47-64
    • /
    • 2021
  • 전 세계적으로 퍼진 코로나 19 상황은 우리의 일상생활의 많은 부분에 영향을 끼쳤을 뿐만 아니라, 경제·사회 등 많은 부분에 걸쳐 막대한 영향력을 미치고 있다. 확진자와 사망자 수가 증가함에 따라 의료진과 대중은 불안, 우울, 스트레스 등 심리적인 문제를 겪고 있다고 한다. 장기적인 부정적인 감정은 사람들의 면역력을 감소시키고 신체적인 균형을 파괴할 수도 있으므로 코로나 19로 인한 심리적인 상태를 이해하는 것이 필수적인 상황이다. 본 연구에서는 코로나 19 감정과 관련된 뉴스 데이터를 수집하여, 텍스트 마이닝을 통해 키워드를 분류하고, 키워드 사이의 의미 네트워크 분석을 통해 단어들의 관계를 시각화하였다. 코로나 감정과 관련된 기사의 키워드에 나타난 단어들의 빈도수를 확인하고 이를 워드 클라우드로 분석하였다. 키워드 빈도 분석 결과 코로나 19 감정과 관련하여 '중국', '불안', '상황', '마음', '사회', '건강'과 같은 단어의 빈도가 높게 나타난 것을 확인할 수 있었다. 각 데이터 간 연결 중심성을 분석한 결과 키워드 중심성 네트워크에서 가장 중심적인 핵심어는 '심리'와 '코로나 19', '블루', '불안'이라는 단어가 높은 연결 중심성을 가지는 것을 확인할 수 있었다. 기사의 헤드라인에 나타난 주요 핵심어 사이의 동시 출현 빈도 네트워크를 그래프로 시각화한 결과, '코로나-블루' 쌍이 가장 굵게 표시되었고, '코로나-감정', '코로나-불안' 쌍이 비교적 굵은 선으로 표시된 것을 알 수 있었다. 코로나와 관련된 '블루'는 우울증을 의미하는 단어로, 코로나와 우울증은 이제 관심을 가져야 할 키워드임을 확인할 수 있었다. 본 연구에서는 장기화한 코로나 19 상황에서 신체적인 방역뿐만 아니라 심리적인 방역에도 힘써야 할 이 시기에 보건 정책담당자가 빠르고 복잡한 의사결정 과정에 도움이 되고자 미디어 뉴스를 모니터링 함으로써, 더욱더 쉬운 소셜 미디어 네트워크 분석 방법을 제시하고자 한다.

효율적인 압축을 위한 영역 세그먼트를 이용한 JBIG2 CODEC 구현 (Implementation of JBIG2 CODEC using Segmentation for Effective Compression)

  • 백옥규;고형화
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.37-40
    • /
    • 2001
  • JBIG2 표준은 그레이 문서를 고압축의 이진 영상으로 부호화 하기위하여 선 영역(region of line-art), 하프톤 영역(region of Halftone), 텍스트 영역(region of Text)으로 세그먼트하여 각각 영역에 최적화 모드를 사용하여 부호화한다. 본 논문에서는 JBIG2에서 제공하는 세가지 모드의 코딩, 즉, 제네릭 영역(region of Generic) 코딩, 텍스트 영역을 위한 패턴 매칭(Pattern Matching) 코딩, 하프톤 영역을 위한 하프톤 코딩을 모두 구현하였다. 그리고, 각 영역을 세그먼트하는 방법을 개선하여 적용하여 세그먼트의 성능 향상을 이루었다. 특히, 부호화량이 많은 하프톤 영역의 세그먼트를 향상시켜 최적화 모드로 부호화 하도록 구현하였다. 팩스 테스트 영상(IEEE-l67a)으로 구현한 JBIC2 CODEC을 실험한 결과, 각 영역에 대한 세그먼트가 [6]의 방법에 의한 세그먼트보다 더 효율적으로 이루어졌으며 주관적 화질 또한 우수하였다.

  • PDF

기하학적 패턴 벡터를 이용한 한.영 글꼴 문자인식 (Hansel and English Text Font Recognition Using Geometrical Pattern Vector)

  • 석영수;홍창희;조정락;강기섭;민종규;이응주
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.425-428
    • /
    • 2001
  • 본 논문에서는 문서 위의 문자를 Off-Line방식으로 컴퓨터에 저장할 수 있도록 기하학적 패턴 벡터를 이용하여 한·영문자 및 글꼴을 인식하는 알고리즘을 제안하였다. 일반적으로 문서에서는 여러 가지 글꼴에 따라 글자의 형태가 다르므로 대표적인 한·영 세 가지 글꼴을 기하학적 패턴(Geometrical Pattern Vector)을 이용하여 크기와 이동에 인식하도록 하였다. 이진 입력 한영혼용 영상에서 잡음을 제거하고 수평·수직 투영 기법을 이용하여 한 문자를 분할하여 문자의 폭에 따라 기하학적 패턴을 추출한다. 추출한 패턴은 각 합계를 계산하여 기준 패턴 합계와 비교한 후 기준 패턴 문자와 글꼴을 인식하게 된다. 마지막으로 제안한 알고리즘의 성능을 평가하기 위해 크기, 이동 변형이 있는 대표적인 한·영 글꼴(신명조, 궁서, 고딕)체와 영어 Time New Roman체를 대상으로 모의 실험을 수행하였다. 제안한 알고리즘은 기존의 원형 패턴 알고리즘보다 문자인식률과 글꼴 그리고 영어의 대·소문자를 구별하는 우수함을 보였다.

  • PDF

기계 도면의 자동 입력을 위한 치수 집합의 인식 및 분류 (Recognition and classification of dimension set for automatic input of mechanical drawings)

  • 정윤수;박길흠
    • 전자공학회논문지S
    • /
    • 제34S권11호
    • /
    • pp.114-125
    • /
    • 1997
  • This paper presents a method that automatically recognizes dimension sets from the mechanical drawings, and that classifies 6 types dimension sets according to functional purpose. In the proposed method, the object and closed-loop symbols are separated from the character-free drawings. Then object lines and interpretation lines are vectorized. And, after recognizing dimension sets(consistings of arrowhead, shape line, tail lines, extension lines, text-string, and feature control frame), we classify recognized dimension sets as horizontal, vertical, angular, diametral, radial, and leader dimension sets. Finally the proposed method converts classified dimension sets into AutoCAD data by using AutoLisp language. By using the methods of geometric modeling, the proposed method readily recognized and classifies dimension sets from complex drawings. Experimetnal results are presented, which are obtained by applying the proposed method to drawings drawn in compliance with the KS drafting standard.

  • PDF

의류를 중심으로 한 전자상거래의 활용 실태에 관한 연구 (Application of Electronic Retailing in Apparel)

  • 원명심
    • 한국생활과학회지
    • /
    • 제8권3호
    • /
    • pp.511-524
    • /
    • 1999
  • This research examines 13 Korean Web sites and 15 foreign Web Sites to explore how companies present apparel products by both layout of graphics and information at the Web sites. The results show that most Web sites display tiny icons next to the item's text description. Clicking on these icons takes the customers to another web page, where the full size photograph of the item appears. The results also revealed that most web sites offer shopping bag function and payment options such as on-line and credit cards. The results indicate that Web sites are constantly evolving and following functions such as virtual dressing room, FAQ, the links, E-Cash payment, currency converter and multilingual sites are becoming standards in the near future.

  • PDF