• 제목/요약/키워드: address recognition

검색결과 206건 처리시간 0.027초

전표 금액란에 나타나는 필기 한글의 신경망-기반 인식 (Neural Network-based Recognition of Handwritten Hangul Characters in Form's Monetary Fields)

  • 이진선;오일석
    • 한국산업정보학회논문지
    • /
    • 제5권1호
    • /
    • pp.25-30
    • /
    • 2000
  • 한글은 부류수의 방대성과 글자간의 유사성으로 인해 인식이 어려운 문자 집합으로 간주되고 있다. 기존 연구 대부분은 일반적으로 사용되는 2,350 글자를 대상으로 인식을 시도하였는데, 이는 일반성을 제공하는 대신 낮은 성능 문제를 안고 있다. 이에 반해, 우편 영상이나 전표 영상 등의 특정 필드에 나타나는 한글만을 대상으로 하는 접근 방법이 보다 현실적이라 할 수 있다. 본 논문은 금액란에 나타나는 필기 한글을 인식하는 연구를 기술한다. 인식을 위해 모듈러 신경망 인식기를 사용하였으며, 세 종류의 특징을 사용하였다. 표준 한글 데이터베이스 PE92에 대해 실험한 결과 정인식률 97.56%를 얻었다.

  • PDF

SEL-RefineMask: A Seal Segmentation and Recognition Neural Network with SEL-FPN

  • Dun, Ze-dong;Chen, Jian-yu;Qu, Mei-xia;Jiang, Bin
    • Journal of Information Processing Systems
    • /
    • 제18권3호
    • /
    • pp.411-427
    • /
    • 2022
  • Digging historical and cultural information from seals in ancient books is of great significance. However, ancient Chinese seal samples are scarce and carving methods are diverse, and traditional digital image processing methods based on greyscale have difficulty achieving superior segmentation and recognition performance. Recently, some deep learning algorithms have been proposed to address this problem; however, current neural networks are difficult to train owing to the lack of datasets. To solve the afore-mentioned problems, we proposed an SEL-RefineMask which combines selector of feature pyramid network (SEL-FPN) with RefineMask to segment and recognize seals. We designed an SEL-FPN to intelligently select a specific layer which represents different scales in the FPN and reduces the number of anchor frames. We performed experiments on some instance segmentation networks as the baseline method, and the top-1 segmentation result of 64.93% is 5.73% higher than that of humans. The top-1 result of the SEL-RefineMask network reached 67.96% which surpassed the baseline results. After segmentation, a vision transformer was used to recognize the segmentation output, and the accuracy reached 91%. Furthermore, a dataset of seals in ancient Chinese books (SACB) for segmentation and small seal font (SSF) for recognition were established which are publicly available on the website.

얼굴 표정 인식 기술의 동향과 향후 방향: 텍스트 마이닝 분석을 중심으로 (Trends and Future Directions in Facial Expression Recognition Technology: A Text Mining Analysis Approach)

  • 전인수;이병천;임수빈;문지훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.748-750
    • /
    • 2023
  • Facial expression recognition technology's rapid growth and development have garnered significant attention in recent years. This technology holds immense potential for various applications, making it crucial to stay up-to-date with the latest trends and advancements. Simultaneously, it is essential to identify and address the challenges that impede the technology's progress. Motivated by these factors, this study aims to understand the latest trends, future directions, and challenges in facial expression recognition technology by utilizing text mining to analyze papers published between 2020 and 2023. Our research focuses on discerning which aspects of these papers provide valuable insights into the field's recent developments and issues. By doing so, we aim to present the information in an accessible and engaging manner for readers, enabling them to understand the current state and future potential of facial expression recognition technology. Ultimately, our study seeks to contribute to the ongoing dialogue and facilitate further advancements in this rapidly evolving field.

Exploring the feasibility of fine-tuning large-scale speech recognition models for domain-specific applications: A case study on Whisper model and KsponSpeech dataset

  • Jungwon Chang;Hosung Nam
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.83-88
    • /
    • 2023
  • This study investigates the fine-tuning of large-scale Automatic Speech Recognition (ASR) models, specifically OpenAI's Whisper model, for domain-specific applications using the KsponSpeech dataset. The primary research questions address the effectiveness of targeted lexical item emphasis during fine-tuning, its impact on domain-specific performance, and whether the fine-tuned model can maintain generalization capabilities across different languages and environments. Experiments were conducted using two fine-tuning datasets: Set A, a small subset emphasizing specific lexical items, and Set B, consisting of the entire KsponSpeech dataset. Results showed that fine-tuning with targeted lexical items increased recognition accuracy and improved domain-specific performance, with generalization capabilities maintained when fine-tuned with a smaller dataset. For noisier environments, a trade-off between specificity and generalization capabilities was observed. This study highlights the potential of fine-tuning using minimal domain-specific data to achieve satisfactory results, emphasizing the importance of balancing specialization and generalization for ASR models. Future research could explore different fine-tuning strategies and novel technologies such as prompting to further enhance large-scale ASR models' domain-specific performance.

A Study on Non-Contact Care Robot System through Deep Learning

  • Hyun-Sik Ham;Sae Jun Ko
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.33-40
    • /
    • 2023
  • 한국이 초고령사회로 진입하면서 노인 복지에 대한 필요성이 증가하고 있으나 현재 복지 인력 부족이 사회문제로 대두되고 있다. 이에 대한 해결책으로 노인의 사회적 고립감 완화와 위급 상황 시 비상 연락 등의 기능을 하는 노인 돌봄 로봇이 활발히 연구되고 있다. 하지만 이러한 기능들은 사용자의 접촉이 있어야만 작동하여 기존 노인 돌봄 로봇의 한계점으로 자리 잡고 있다. 본 논문에서는 기존의 문제를 해결하기 위해 상용화된 노인 돌봄 로봇과 카메라를 통해 직접적인 접촉 없이도 사용자와 상호작용할 수 있는 돌봄 로봇 시스템을 제안한다. 돌봄 로봇에 연결된 엣지 디바이스에 표정 인식 모델과 행동 인식 모델을 탑재하였고, 공공데이터를 통해 모델의 학습 및 성능검증을 진행했다. 실험 결과를 통해 표정 인식과 행동 인식의 성능이 각각 정확도 96.5%, 90.9%인 것을 확인할 수 있으며, 수행 시간의 경우에는 각각 50ms, 350ms인 것을 확인할 수 있다. 해당 결과는 제안한 시스템의 표정 및 행동 인식 정확도가 높고 추론 시간이 효율적임을 확인하며, 이는 비접촉 상황에서도 원활한 상호작용을 가능하게 한다.

저품질 이진 우편 영상에서의 고속 문자 분할 (High-Speed Character Segmentation from Low-Quality Binary Letter Image)

  • 김두식;남윤석
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(3)
    • /
    • pp.145-148
    • /
    • 2000
  • This paper proposes a character segmentation method for Korean letter address image. The poor quality of image binarization results in broken character strokes. To overcome this problem, two steps of processing ate introduced. The first one is to merge broken characters to generate character candidates, and the other one is to reduce the complexity of segmentation graph path. These two steps do not use recognition information to keep in high-speed.

  • PDF

우편물의 접수과정에서 수취인의 주소, 성명 및 우편번호 인식 (Character Recognition of the Receiver's Address, Name and Postal Code in Postal Reception Process)

  • 김성원;김형원;양윤모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.335-337
    • /
    • 2000
  • 본 연구에서는 문자 인식의 응용으로서 인쇄된 우편봉투의 주소를 인식한다. 스캐너로 입력된 우편봉투 영상으로부터 주소영역과 우편번호 영역을 분리한다. 분리된 각각의 영역에서 문자를 추출하고, 전처리로써 정규화, 특징추출 단계를 거쳐 우편번호와 주소를 각각 인식하였다. 이때, 우편번호 인식에 의하여 알 수 있는 주소와 실제로 인식한 주소의 신뢰도를 계산하여, 주소 인식 결과를 보정하는 과정을 거쳐 우편봉투의 인식을 실행하였다.

  • PDF

포유류 수정과정에서 정자 침체기질의 기능 (Role of Acrosomal Matrix in Mammalian Fertilization)

  • 김계성
    • 한국수정란이식학회지
    • /
    • 제16권1호
    • /
    • pp.61-68
    • /
    • 2001
  • Sperm competent for fertilization can become capacitated, bind to the zona pellucida (ZP) of an egg in a specific manner, and complete acrosomal exocytosis. Failure to carry out these functions results in infertility. Although the interactions between the ZP and the plasma mem-brane overlying the sperm acrosome have been considered important for sperm-egg recognition and signalling, recent results have prompted a reassessment of current paradigms concerning these interactions. In this review, we're going to discuss about the roles of the acrosomal matrix, the particulate component of the acrosomal contents, in fertilization. The general hypothesis is that acrosomal exocytosis leads to the exposure of acrosomal matrix proteins that become de-facto extracellular matrix (ECM) on the surface of the sperm head, and that the dynamic interactions of this newly-exposed sperm ECM with the egg ECM (the ZP) govern sperm-egg recognition and sperm penetration of the ZP Informations from these experiments may provide new ways to address the poor ZP binding of sperm from some human infertility patients and may offer new avenues for contraception through the disruption of purposeful sperm-ZP binding.

  • PDF

사운드스케이프 적용을 위한 옥외 P.A. 시스템 적정 인지레벨에 관한 실험적 연구 (An Experimental Study on the Optimistic Recognition Level of Public Address System as a Soundscape Application Facility)

  • 송민정;장길수;신훈;신용규;이태강
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2006년도 춘계학술대회논문집
    • /
    • pp.726-729
    • /
    • 2006
  • As a active soundscape facility, P.A. system is a useful instrument to give place identity and vitality by letting out music, environmental music, bird singing sound etc. In this study, to know the optimistic distance and sound level range of introducing sound, sound levels due to distance were measured and subject responses were checked by questionnaire. Levels from 64dB to 71dB are recommended by subjects. And the optimistic level of introducing level is related with level variance of sound source. The results of this study could used for street furniture location design and P.A. system output level.

  • PDF

주소 인식 시스템을 위한 필기 한글 단어 인식 (Handwritten Korean Word Recognition for Address Recognition)

  • 권진욱;이관용;변혜란;이일병
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1997년도 춘계학술대회 학술발표 논문집
    • /
    • pp.201-204
    • /
    • 1997
  • 최근 주소를 자동으로 인식하여 우편물 분류와 같은 업무를 효과적으로 수행하기 위한 연구가 진행되고 있다. 기존 연구들은 낱자 단위의 인식을 수행한 후 사전 형태의 간단한 DB를 통해 최종의 결과를 생성한다. 그러나 한글과 같은 복잡한 구조의 필기 문자에 대한 인식기의 성능은 아직도 미흡한 상태이다. 따라서 낱자 인식기의 성능에 의존하는 현재와 같은 방법으로는 만족할 만한 결과를 얻기가 힘들 것으로 생각된다. 본 논문에서는 낱자 인식 결과에 크게 의존하지 않고 주소에 나타나는 단어의 낱자들 사이간 연결 정보를 이용하여 단어를 인식할 수 있는 시스템을 제안한다. 본 시스템은 통계적 인식기를 사용하여 낱자를 인식하는 부분과 낱자 인식 결과를 조합하여 단어 수준의 인식과정을 통해 최종의 결과를 생성하는 부분으로 구성된다. 통계적 인식기는 Nearest neighborhood 방법을 사용하여 간단한 형태로 구현하였다. 단어인식 모듈은 단어에서 모든 문자간의 관계를 표현할 수 있도록 HMM 모형을 사용하여 어휘정보 네트워크를 구성하고 이를 이용하여 주소에 나타나는 단어를 인식하도록 하였다. PE92 한글 문자 데이터를 이용하여 실험을 수 璿\ulcorner 결과, 통계적 인식기의 성능이 저조함에도 불구하고 HMM을 이용한 어휘정보 네트워크가 이를 보완함으로써 좋은 결과를 얻었다. 이러한 단어 인식 방법을 주소 이외의 다른 단어 집합에 대해서도 쉽게 적용될 수 있을 것으로 예상된다.

  • PDF