• 제목/요약/키워드: handwritten

검색결과 355건 처리시간 0.024초

지능형 OCR 시스템을 위한 한글 필기체 생성 및 분류 모델에 관한 연구 (A Study on Hangul Handwriting Generation and Classification Mode for Intelligent OCR System)

  • 백진성;서지윤;정상중;정도운
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.222-227
    • /
    • 2022
  • 본 논문에서는 다양한 산업분야에 적용 가능한 딥러닝 알고리즘 기반의 한글 필기체 생성 및 분류 모델을 구현하였다. 구현된 GAN 기반의 한글 필기체 생성 모델과 CNN 기반의 한글 필기체 분류 모델 2가지로 구성되어 있다. GAN 모델은 가짜 한글 필기체 데이터를 생성하기 위한 생성자 모델과 가짜 필기체 데이터를 판별하기 위한 판별자 모델로 구성된다. CNN 모델의 경우 'PHD08' 데이터세트를 활용하여 모델의 학습을 수행하였으며, 학습 결과 92.45% 정확도로 한글 필기체를 분류하는 것을 확인하였다. 구현된 GAN 모델을 통해 생성된 한글 필기체 데이터를 기존 CNN 모델의 학습 데이터세트와 통합하여 분류 모델의 성능평가를 진행한 결과 96.86%로 기존 분류 성능보다 우수하게 나타남을 확인하였다.

Jacobian 행렬의 주부분 행렬을 이용한 Levenberg-Marquardt 알고리즘의 개선 (Improving Levenberg-Marquardt algorithm using the principal submatrix of Jacobian matrix)

  • 곽영태;신정훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.11-18
    • /
    • 2009
  • 본 논문은 Levenberg-Marquardt 알고리즘에서 Jacobian 행렬의 주부분 행렬을 이용하여 학습속도를 개선하는 방법을 제안한다. Levenberg-Marquardt 학습은 오차함수에 대한 2차 도함수를 계산하기 위해 Hessian 행렬을 사용하는 대신 Jacobian 행렬을 이용한다. 이런 Jacobian 행렬을 가역행렬로 만들기 위해, Levenberg-Marquardt 학습은 ${\mu}$값을 증가시키거나 감소시키는 과정을 수행하고 ${\mu}$값의 변경에 따른 역행렬의 재계산이 필요하다. 따라서 본 논문에서는 ${\mu}$값의 설정을 위해 Jacobian 행렬의 주부분 행렬을 생성하고 주부분 행렬의 고유값 합을 이용하여 ${\mu}$값을 설정한다. 이와 같은 방법은 추가적인 역행렬 계산을 하지 않으므로 학습속도를 개선할 수 있다. 제안된 방법은 일반화된 XOR 문제와 필기체 숫자인식 문제를 대상으로 실험하여 학습속도의 향상을 검증하였다.

스마트 출결 통합 관리 시스템 설계 및 구현 (Design and Implementation of a Smart Attendance Integrated Management System)

  • 강세현;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.136-144
    • /
    • 2022
  • 기존 각 기관에서 수행하는 연수는 출결 관리 시스템의 미비로 인해 신청자들의 출결유무를 현장에서 수기로 작성 후 문서로 관리하고 있었다. 각 기관에서 수기로 작성된 문서를 관리자들이 2차 가공 후 취합하여 보관/관리를 하다 보니 업무의 효율성이 떨어지고 연수신청자들도 수강한 연수의 출결유무와 연수정보를 확인하려면 직접 방문 또는 유선연결을 통해 직접 알아봐야 하는 불편함이 있었다. 더불어 이러한 데이터 수집/저장 방식은 저장 및 검색에 많은 인력과 시간이 소요될 뿐만 아니라 보존과 관리에 많은 어려움이 있다. 본 논문은 바코드를 이용한 스마트 출결 통합 관리 시스템을 설계하고 구현한다. 이를 통해 교육신청자의 출석체계가 구축되고, 출석관련 보안이 강화되며, 교육 참석 자료의 전산화로 데이터를 관리한다. 또한 각 기관이 교육정보 데이터를 효율적으로 관리·활용할 수 있도록 필요한 자료의 기준을 선정한다. 제안하는 시스템은 한 번의 구축으로 다양한 기관을 추가할 수 있어 기관관리 확장성이 용이하며 추가로 비용절감 효과를 기대 할 수 있다. 또한 제공하는 관리시스템을 사용하는 연수담당자들의 업무편의성 증대와 사용자들의 출결데이터 통제/관리를 통해 교육의 질적 향상을 기대한다.

자연어 처리의 개체명 인식을 통한 기록집합체의 메타데이터 추출 방안 (A method for metadata extraction from a collection of records using Named Entity Recognition in Natural Language Processing)

  • 송치호
    • 한국기록관리학회지
    • /
    • 제24권2호
    • /
    • pp.65-88
    • /
    • 2024
  • 본 연구는 인공지능의 하위분야인 자연어 처리(NLP)의 개체명 인식(NER)을 통하여 기록에 내재된 메타데이터 값과 기술 정보를 추출하는 방안에 대한 시험적 연구이다. 연구 대상은 1960~1970년대에 생산된 구로공단 수기 기록물(약 1,200 쪽, 8만여 단어)을 대상으로 하였다. 디지털화를 포함하는 전처리 과정과 함께 기록 텍스트에 대해서 구글의 BERT 언어모델에 기반하여 구현되어 공개된 언어 API를 사용하여 개체명을 인식하였다. 그 결과로 구로공단의 과거 기록에 포함된 173개의 인명과 314개의 조직 및 기관 개체명을 추출할 수 있었고, 이는 기록의 내용에 대한 직접적인 검색어로 사용될 수 있다고 기대된다. 그리고 자연어 처리의 이론적 방법론을 반·비정형의 텍스트로 이루어진 실제 기록물에 적용할 때 발생하는 문제점을 파악하여 해결 방안과 고려해야 할 시사점을 제시했다.

로봇 비전의 영상 인식 AI를 위한 전이학습 정량 평가 (Quantitative evaluation of transfer learning for image recognition AI of robot vision)

  • 정재학
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.909-914
    • /
    • 2024
  • 본 연구에서는 로봇 비전용 영상 인식을 비롯한 다양한 AI 분야에서 널리 활용되는 전이학습에 대한 정량적 평가를 제시하였다. 전이학습을 적용한 연구 결과에 대한 정량적, 정성적 분석은 제시되나, 전이학습 자체에 대해서는 논의되지 않는다. 따라서 본 연구에서는 전이학습 자체에 대한 정량적 평가를 숫자 손글씨 데이터베이스인 MNIST를 기반으로 제안한다. 기준 네트워크를 대상으로 전이학습 동결층의 깊이 및 전이학습 데이터와 사전 학습 데이터의 비율에 따른 정확도 변화를 추적하였다. 이를 통해 첫번째 레이어까지 동결할 때 전이학습 데이터의 비율이 3% 이상일 경우, 90% 이상의 정확도를 안정적으로 유지할 수 있음이 확인되었다. 본 연구의 전이학습 정량 평가 방법은 향후 네트워크 구조와 데이터의 종류에 따라 최적화된 전이학습을 구현하는데 활용 가능하며, 다양한 환경에서 로봇 비전 및 이미지 분석 AI의 활용 범위를 확대할 것이다.

온라인 흘림체 한글 인식을 위한 곡률획 모델링 기법 (Curvature stroke modeling for the recognition of on-line cursive korean characters)

  • 전병환;김무영;김창수;박강령;김재희
    • 전자공학회논문지B
    • /
    • 제33B권11호
    • /
    • pp.140-149
    • /
    • 1996
  • 흘림체 필기 문자는 문자의 가능한 한도 펜의 움직임을 줄이려는 경제성의 원칙에서 비롯된다. 즉, 다음 획을 쓰기 위해 이동할 때 펜을 들지 않거나, 아예 이동을 생략하거나, 또는 연결된 두 획이 서로 닮아가면서 필기하기 쉬운 단순간 형태로 변화한다. 이러한 변화로 인해, 획이나 자소의 형태가 달라질 뿐만 아니라, 획간이나 자소간의 구분이 매우 어려워진다. 따라서 흘림체의 효과적인 인식을 위해서는 획이나 자소의 정확한 분할에 의존하지 않으면서, 일정한 단위로 분할하여 매칭할 수 있는 방법이 필요하다. 이 연구에서는 구조적인 형태의 단위로 분할하고 매칭하는 '곡률획 모델링 방법(curvature stroke modeling method)'을 제안한다. 곡률획(curvature stroke)은 필기의 회전 방향이 바뀌지 않는 부분획으로 정의되며, 곡률에 따라 선분, 호, 원 등의 형태를 갖는다. 흘려 써진 입력 획들을 곡률획의 나열로 변환하기 위해서는, 필기의 회전을 변화시키는 곳, 급격한 방향 변화를 일으키는 곳, 그리고 지나친 회전을 일으키는 곳 등을 분할한다. 각 참조 자소는 정자체로 입력하여 분할 과정에 의해 생성된 곡률획의 나열로 저장되어 있으며, 인식중에 융합과정을 수행함으로써 매칭을 위한 다양한 곡률획의 나열을 만들어낸다. 이때, 가상 획이 필기되거나 생략될 가능성도 고려한다. 인식의 기본 단위로 곡률획을 사용함으로써, 입력 문자의 불필요한 분할점들을 효과적으로 줄일 수 있고, 또한 자소간의 연결점을 찾기 어려운 경우에도 인접한 두 자소에 걸치는 참조 곡률획을 생성해내기 때문에 정확한 매칭이 가능해진다. 실험 결과, 83.60%의 제 1후보 인식률과 0.99초/자(CPU 클럭: 66MHz)의 처리 시간을 보였다./atom으로 추출되었다. 한편 별도의 추가적인 공정없이 일반적인 에피 성장법을 사용하여 고농도로 붕소가 도핑된 실리콘층 위에 부정합 전위가 없는 에피 실리콘을 성장시켰으며, 이 에피 실리콘의 결정성은 매우 양호한 것으로 밝혀졌다. 또 부정합 전위가 없는 에피 실리콘에 n+/p 게이트 다이오드를 제작하고 그 전압-전류 특성을 측정한 결과 5V의 역 바이어스에서 0.6nA/$cm^{2}$의 작은 누설 전류값을 나타내었다.이었다 5. 쌀의 알칼리 붕괴도는 밀양 맥후작산미가 가장 높았고 호남평야지산미가 가장 낮았는데 비해 아밀로그래프의 호화개시온도는 수원과 이리산미가 가장 낮았던 반면 밀양산미가 가장 높았다. 강하점도는 밀양산미가 가장 낮았고 다음이 이천산미가 낮았던데 비해 계화 및 이리산미가 가장 높았으며 치반점도는 이와 정반대의 경향을 나타내었다. 밥의 점성 /경도비율은 지역간 차이가 유의하지는 않았으나 남부평야산미가 중부평야산미에 비해 다소 떨어지는 경향이었다. 6. 식미와 관련이 있는 쌀 외관품질 및 이화학적 특성을 이용한 주성분 분석에서 전정보의 약 59% 설명이 가능한 제 1 및 제 2 주성분치상의 7개 품종별 6개 산지미의 분포로 보아 품종에 따라서 산지 반응이 달랐는데 대체로 자포니카와 통일형 품종군간 구분과 밀양, 중부평야 및 호남평야의 세 산지간 구분이 가능하였다. 산지내 품종간 미질변이는 남양간척지와 이리산미가 비교적 작았는데 수원산미는 이천과 남양산미의 미질변이를, 계화산미는 이리산미의 미질변이를 거의 포괄하였다.는 산불위험지역의 격자점(15km)내에 최소한 1대의 AWS 설치방안을 제시하였지만, 금후에는 15km내에서도 능선, 계곡 등 구체적인 위치확정을 위한 선행연구가 실시되어야할

  • PDF

웹상의 BioAPI에 기반한 서명 다중 인증 시스템 (A Multiple Signature Authentication System Based on BioAPI for WWW)

  • 윤성근;김성훈;전병환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1226-1232
    • /
    • 2004
  • 차세대 보안 시장을 이끌어갈 신기술로 생체 인증 기술이 부상하고 있으나, 기존 시스템들은 대부분 생체 특징에 따라 개별 단위의 인증 방식을 제공하고 있다. 최근에는 이러한 개별 시스템들을 통합할 수 있도록 표준화하기 위한 연구가 활발히 이루어지고 있다. 본 논문에서는 생체 인증 기술의 표준화를 위해서 BioAPI 협회에서 발표한 BioAPI 명세서를 따르면서, 필기 서명이라는 단일 생체측정에 대해 함수적, 매개변수적, 구조적 접근법의 서로 다른 세 가지 검증기를 적용한 웹기반 인증 시스템을 제안한다. 시스템은 클라이언트-서버 구조이고, 클라이언트와 서버는 각각 BioAPI 규격에 따라 크게 세 계층으로 구성된다. 제안한 웹기반 단일 생체측정의 다중 인중 시스템은 사용자의 인증 거부율이 다소 증가되더라도 별도의 여러 생체측정을 요구하지 않으면서도 인증의 신뢰도를 크게 향상시킬 수 있다. 즉 세가지 서명 검증기를 결합한 경우, 사용자의 인증 거부율(FRR)이 약 2.7배 증가하였지만 오류 승인률(FAR)은 4만분의 1로 감소하는 것으로 나타났다. 따라서 제안한 방법은 개방형 네트워크인 인터넷에서의 효과적인 신원확인 방법으로 활용될 수 있으며, 또한 다양한 생체측정을 이용하는 시스템으로 쉽게 확장될 수 있다.

규칙 정보를 이용한 은행 전표 상의 필기 한글 금액 인식 (Handwritten Korean Amounts Recognition in Bank Slips using Rule Information)

  • 지태창;이현진;김은진;이일병
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2400-2410
    • /
    • 2000
  • 한글 인식에 관한 기존의 연구는 한글 낱자 인식에 치우쳐 왔고, 실제 문서 인식 시스템 개발을 위한 연구는 거의 이루어지지 않았다. 그래서, 본 논문에서는 인식된 문자열의 오류 교정에 관한 연구로서 한글 금액열 인식기를 개발하였다. 한글 낱자 인식에서 문제가 되는 부분은 데이터의 방대함 때문에 발생한다. 컴퓨터상에서 표현될 수 있는 한글 낱자의 개수는 2000여 자 이상이다. 따라서, 기존의 연구들은 이러한 문제점을 해결하기 위해서 실생활에서 많이 쓰이는 낱자에 대해서만 실험을 했다. 하지만, 실험 대상 낱자의 개수를 1000여 자 정도로 줄였어도, 여전히 80%대 이하의 저조한 인식률을 보이고 있다. 이렇게 인식률이 저조한 범용 한글 낱자 인식기를 한글 금액 인식이라는 제한된 상황에서 사용하는 것은 적합하지 않다. 따라서, 본 연구에서는 한글 금액에 사용되는 16자의 한글 낱자만 인식할 수 있는 인식기를 제안하였다. 제안한 한글 낱자 인식기는 통계적 인식기를 사용한 다중 인식기 형태로 만들었고, 이를 통해 개별적인 특징으로 인한 인식률의 저하를 방지할 수 있다. 금액의 후처리는 한글 금액열 내에 내재되어 있는 금액에 대한 구조적인 규칙 정보를 이용하였다. 이 규칙을 이용하여 한글 금액의 후처리는 한글 금액열 내에 내재되어 있는 금액애 대한 구조적인 규칙 정보를 이용하였다. 이규칙을 이용하여 한글 금액의 인식 단위에 대한 인식 결과의 오류 보정을 할 수 있다. 실험 결과 제안한 한글 낱자 인식기의 1후보까지 인식률은 95.49%였고, 4후보까지 인식률은 99.72%였다. 그리고, 후처리기의 처리를 거친 금액열에 대해서는 신뢰도가 96.42%였다. 본 논문에서는 사용된 낱자의 개수가 적고, 구조안에 규칙 정보가 존재하는 한글 문자열의 경우에 제한된 글자를 인식하는 낱자 인식기와 오류를 교정할 수 있는 후처리기로 문자열 인식의 신뢰도를 향상시킬수 있는 방법을 제안하였다.

  • PDF

유닛 재구성 방법을 이용한 PDA용 온라인 필기체 한자 인식 (On-line Handwriting Chinese Character Recognition for PDA Using a Unit Reconstruction Method)

  • 진원;김기두
    • 대한전자공학회논문지SP
    • /
    • 제39권1호
    • /
    • pp.97-107
    • /
    • 2002
  • 본 논문에서는 PDA용 온라인 필기체 한자 인식기를 구현하였다. PDA는 PC보다 느린 CPU와 적은 메모리를 사용하기 때문에, 본 논문에서는 적은 연산량과 적은 메모리를 사용하면서 높은 인식률을 갖는 인식기를 개발하는데 초점을 맞추었다. 따라서, 빠른 인식을 위하여 적은 연산 과정을 갖는 인덱스 매칭 방법을 사용하였고, 필기 한자의 획순 변동과 획수 변형을 수용함과 동시에, 문자 모델의 저장을 위한 메모리를 최소화하기 위하여 유닛 재구성 방법을 제안하였다. 사전에 정의된 유닛을 사용하여 1800개의.표준 문자 모델을 설정하였다. 입력된 데이터는 전처리 및 특징 추출 과정을 거친 후 표준 문자 모델과의 획수 및 형태적 특징을 기준으로 선정된 후보 문자들과의 유사도를 측정한다. 실험 대상 문자는 중·고등학교 표준 기초 한자 1800자를 대상으로 하였으며, 획수와 획순에 구애받지 않고 정서체로 필기한 5인의 문자 셀을 사용하였다. 실험은 문자 당 평균 인식 속도와 인식률을 측정하였으며, 이 결과 문자 셀에 대한 평균 인식률 94.3%를 얻었다. 문자 당 평균 인식 속도는 MIPS R4000 CPU를 사용한 PDA에서 0.16 초의 결과를 내었다.

유전 알고리즘을 이용한 퍼지 패턴 매칭 분류기의 설계와 응용 (A design of fuzzy pattern matching classifier using genetic algorithms and its applications)

  • 정순원;박귀태
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.87-95
    • /
    • 1996
  • 본 논문에서는 새로운 퍼지 패턴 매칭 분류기(fuzzy pattern matching classifier) 설계 방법을 제안하였다. 기존의 퍼지 패턴 매칭 분류기를 설계함에 있어 분류기의 성능에 결정적인 영향을 미치는 소속 함수 (membership functions)의 모양과 개수에 대한 정확한 정보를 알 수 없었다. 따라서 소속 함수를 구하기 위하여 시행 착오(trial-error)법 혹은 경험에 의존하는(heuristic) 방법이 사용되어 왔다. 그러나 이러한 방법은 다양한 종류의 패턴에 대하여 적용하기에는 한계가 있다. 본 논문에서는 유전 알고리즘을 사용하여 분류 에러를 최소로 줄이는 소속 함수의 적절한 모양과 개수를 찾기 위한 새로운 방법을 제안한다. 유전 알고리즘(genetic algorithms)은 진화라는 생물학적 모델을 기초로한 통계적 알고리즘의 한 부류이다. 이는 여러 함수 최적화 문제에 적용되어 최적 혹은 최적 근처의 해를 찾아 준다. 본 논문에서 유전 알고리즘은 분류 에러에 반비례하는 적합도 함수(fitness function)를 기본으로 소속 함수의 모양과 개수를 결정하는데 쓰인다. 유전 알고리즘에 있어서의 스트링은 소속 함수를 결정하게 되며 인식 결과는 다음 세대의 재생(reproduction) 연산에 영향을 미치게 된다. 제안되는 방법을 타이어 접지면 패턴과 필기체 영문자 인식에 적용하여 보았다. 실험 결과는 본 방법이 유용함을 보여준다.

  • PDF