• 제목/요약/키워드: Script Identification

검색결과 12건 처리시간 0.026초

An Arabic Script Recognition System

  • Alginahi, Yasser M.;Mudassar, Mohammed;Nomani Kabir, Muhammad
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권9호
    • /
    • pp.3701-3720
    • /
    • 2015
  • A system for the recognition of machine printed Arabic script is proposed. The Arabic script is shared by three languages i.e., Arabic, Urdu and Farsi. The three languages have a descent amount of vocabulary in common, thus compounding the problems for identification. Therefore, in an ideal scenario not only the script has to be differentiated from other scripts but also the language of the script has to be recognized. The recognition process involves the segregation of Arabic scripted documents from Latin, Han and other scripted documents using horizontal and vertical projection profiles, and the identification of the language. Identification mainly involves extracting connected components, which are subjected to Principle Component Analysis (PCA) transformation for extracting uncorrelated features. Later the traditional K-Nearest Neighbours (KNN) algorithm is used for recognition. Experiments were carried out by varying the number of principal components and connected components to be extracted per document to find a combination of both that would give the optimal accuracy. An accuracy of 100% is achieved for connected components >=18 and Principal components equals to 15. This proposed system would play a vital role in automatic archiving of multilingual documents and the selection of the appropriate Arabic script in multi lingual Optical Character Recognition (OCR) systems.

Fuzzy-Membership Based Writer Identification from Handwritten Devnagari Script

  • Kumar, Rajiv;Ravulakollu, Kiran Kumar;Bhat, Rajesh
    • Journal of Information Processing Systems
    • /
    • 제13권4호
    • /
    • pp.893-913
    • /
    • 2017
  • The handwriting based person identification systems use their designer's perceived structural properties of handwriting as features. In this paper, we present a system that uses those structural properties as features that graphologists and expert handwriting analyzers use for determining the writer's personality traits and for making other assessments. The advantage of these features is that their definition is based on sound historical knowledge (i.e., the knowledge discovered by graphologists, psychiatrists, forensic experts, and experts of other domains in analyzing the relationships between handwritten stroke characteristics and the phenomena that imbeds individuality in stroke). Hence, each stroke characteristic reflects a personality trait. We have measured the effectiveness of these features on a subset of handwritten Devnagari and Latin script datasets from the Center for Pattern Analysis and Recognition (CPAR-2012), which were written by 100 people where each person wrote three samples of the Devnagari and Latin text that we have designed for our experiments. The experiment yielded 100% correct identification on the training set. However, we observed an 88% and 89% correct identification rate when we experimented with 200 training samples and 100 test samples on handwritten Devnagari and Latin text. By introducing the majority voting based rejection criteria, the identification accuracy increased to 97% on both script sets.

천 커버링의 원리와 알고리즘 그리고 언어 식별에 응용 (Principle and Algorithm of Cloth Covering and Application to Script Identification)

  • 김민우;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제12권3호
    • /
    • pp.67-76
    • /
    • 2012
  • 본 논문은 천 커버링 연산의 개념과 알고리즘을 제안한다. 천 커버링은 물리 법칙에 기반을 둔 연산으로 사물을 덮는 천의 모양을 계산학적으로 흉내낸다. 천 커버링의 목적은 사물을 천으로 덮어 표면의 상세함을 감추고 개략적인 외형이 드러나도록 하는 것이다. 이 연산은 천의 뻣뻣한 정도를 제어하는 하나의 크기 인자를 가지며, 이를 통해 외부로 드러나는 사물에 대한 정보의 상세함을 조절한다. 제안하는 연산의 가능성을 보이기 위해 문서 영상에 사용된 언어를 식별하는 문제에 천 커버링을 적용하였다. 실험 결과 가우시안을 이용한 특징 추출 방법보다 천 커버링을 이용한 특징 추출 방법이 더 우수한 식별 성능을 보였다. 토론에서 제안하는 연산이 우수한 이유를 제시한다.

ArcView와 Avenue$^{TM}$ Language를 활용한 수문지질도 도식 표현 기법 개발

  • 김규범;조민조;이장룡
    • 한국지하수토양환경학회:학술대회논문집
    • /
    • 한국지하수토양환경학회 2000년도 추계학술대회
    • /
    • pp.31-35
    • /
    • 2000
  • We investigate the groundwater distribution and chemical characteristics for 3 or 5 districts every year and make the hydrogeologic map on a scale of 1:50,000. We draw the hydrogeologic digital map based on "The Handbook for the Drawing and Management of Hydrogeologic Map" which was published by MOCT and KOWACO in 1998. But, the Stiff diagram and well's notation are difficult to be presented in the digital map using the commercial Arcview GIS tools. So we develop the script file with Avenue language to represent them in Arcview GIS tool. At first, we design the database for the chemical analysis result of groundwater and well identification, and make the program code with Avenue language to display them on the digital map. And next we test the usefulness of the program code. As a result, we find that the script file is very useful for drawing the symbols and diagrams in hydrogeologic digital map using ArcView GIS.

  • PDF

A Methodology for Urdu Word Segmentation using Ligature and Word Probabilities

  • Khan, Yunus;Nagar, Chetan;Kaushal, Devendra S.
    • International Journal of Ocean System Engineering
    • /
    • 제2권1호
    • /
    • pp.24-31
    • /
    • 2012
  • This paper introduce a technique for Word segmentation for the handwritten recognition of Urdu script. Word segmentation or word tokenization is a primary technique for understanding the sentences written in Urdu language. Several techniques are available for word segmentation in other languages but not much work has been done for word segmentation of Urdu Optical Character Recognition (OCR) System. A method is proposed for word segmentation in this paper. It finds the boundaries of words in a sequence of ligatures using probabilistic formulas, by utilizing the knowledge of collocation of ligatures and words in the corpus. The word identification rate using this technique is 97.10% with 66.63% unknown words identification rate.

LRM 노멘을 수용하기 위한 전거제어시 고려사항에 관한 연구 (A Study on Considerations in the Authority Control to Accommodate LRM Nomen)

  • 이미화
    • 한국도서관정보학회지
    • /
    • 제52권1호
    • /
    • pp.109-128
    • /
    • 2021
  • 본고에서는 LRM 노멘 개체를 수용하기 위한 전거제어시 고려사항을 모색하고자 문헌연구, RDA 규칙분석, 국내 목록 전문가 의견조사를 실시하였다. 그 결과 전거제어를 위해 노멘의 속성 요소, 목록기술, MARC 전거포맷 측면에서 고려사항을 제안하였다. 첫째, 노멘의 속성으로 LRM 노멘의 유형, 스킴, 이용대상자, 이용맥락, 참고정보원, 언어, 문자, 문자변환과 RDA에서 추가한 식별상태, 주기, 구분불가한 이름지시자의 기술을 가능한 상세히 기술해야 한다. 둘째, 노멘의 속성요소 및 관계요소를 기술하기 위해 목록규칙인 RDA에 제시된 대로 비구조화, 구조화, 식별자, IRI로 기술하며, 이중 구조화된 기술을 위해서는 어휘인코딩스킴(VES), 스트링인코딩스킴(SES)이 작성되어야 한다. 또한, 전거형접근점에 대한 구조 및 우선 이름/표제에 대한 목록 규칙도 마련되어야 한다. 셋째, LRM 노멘을 반영할 수 있도록 MARC 21 전거포맷을 마련하기 위해 Maxwell의 확장(안)을 바탕으로 추가 확장 방안을 제안하였다. (1) 노멘 마다 속성이 입력될 수 있도록 4XX, 5XX에 속성이 기술되어야 하며, 1XX, 5XX와 4XX에 기술될 노멘의 속성을 구분하였다. (2) 노멘 속성으로 유형, 언어, 문자, 문자변환, 이용맥락, 유효기간을 기술하기 위해서는 MARC 21내에 표시기호 및 식별기호가 추가되어야 한다. 이에 368, 381, 377의 식별기호 확장과 이용맥락과 유효기간을 기술하기 위한 표시기호를 추가할 것을 제안하였다. 본고에서 제안한 LRM 노멘을 위한 전거제어시 고려사항은 국내에서 LRM을 반영한 전거제어 방안을 마련하는 기반이 될 것이다.

Praat를 이용한 숫자음의 음향적 분석법 (An acoustical analysis method of numeric sounds by Praat)

  • 양병곤
    • 음성과학
    • /
    • 제7권2호
    • /
    • pp.127-137
    • /
    • 2000
  • This paper presents a macro script to analyze numeric sounds by a speech analysis shareware, Praat, and analyzes those sounds produced by three students who were born and raised in Pusan. Recording was done in a quiet office. To make a meaningful comparison, dynamic time points in relation to the total duration of voicing segments were determined to measure acoustical values. Results showed that a strong correlation coefficient was found between the repetitive production of numeric sounds within and across the speakers. Very high coefficients among diphthongal numbers (0 and 6) which usually show wide formant variation were noticed. This supports that each speaker produced numbers quite coherently. Also, the frequency differences between the three subjects were within a perceptually similar range. To identify a speaker among others may require to find subtle individual differences within this range. Perceptual experiments by synthesized numeric sounds may lead to resolve the issue.

  • PDF

미국인 남성이 발음한 영어 모음의 포먼트 궤적 (Formant Trajectories of English Vowels Produced by American Males)

  • 양병곤
    • 말소리와 음성과학
    • /
    • 제1권3호
    • /
    • pp.65-72
    • /
    • 2009
  • Formant values are the most important acoustic correlates of English vowels. Classical studies on English vowels reported the first three formant values measured at a single timepoint on a sustained vowel segment. However, many recent studies revealed that partial onset or offset segments with information of dynamic spectral changes may contribute to the exact identification of English vowels with an accuracy almost comparable to that by the whole vowel segment or word. The purpose of this study was to examine formant trajectories of nine English vowels collected by Hillenbrand et al.(1995). Acoustic analysis was systematically made by a Praat script at six equidistant timepoints over the vowel segment. Results showed that the first formant trajectories played an important role in distinguishing each vowel within the front- or back-vowel groups. The second formant trajectories of the back vowels varied more drastically than those of the front vowels. The third formant value was similar except the high vowel /i/. From the vowel space on F1 by F2 axes, the formant trajectories of each vowel clearly showed a transition toward the locus of the following consonant /d/. Other acoustic data revealed that there were some vowel inherent duration or pitch values. From this study we can conclude that the dynamic spectral changes are very important in specifying acoustic characteristics of the English vowels. Further studies on vowels and diphthongs in different contexts are desirable.

  • PDF

임무 S/W 시험을 위한 피드백 데이터의 기댓값 검증 자동화 도구 개발 (Development of Feedback Data Automated Verification Program for Mission S/W)

  • 권기봉;이하연;하석운
    • 한국항공우주학회지
    • /
    • 제49권10호
    • /
    • pp.871-877
    • /
    • 2021
  • 항공기 결함은 항공기 운영 및 조종사의 생명과 직결된 중요한 사항으로 항공기 조종 중 발생하는 임무 소프트웨어의 결함은 조종사 임무수행 및 안전에 심각한 영향을 미친다. 항공기 개발을 주관하는 단체나 소프트웨어 결함을 개발 초기에 식별하고 제거하기 위해 프로세스를 강화하고 많은 공수와 시간을 할애하고 있지만 임무 소프트웨어의 특성상 타 항전 장비와 강한 기능적 결합도(Coupling) 및 높은 복잡도(Complexity)를 가지고 있어 기존 시험 방법을 통한 소프트웨어 결함 식별 및 제거에 제약이 따른다. 본 연구는 임무 컴퓨터 연동 장비의 통신 데이터 중 피드백 데이터의 기댓값 검증을 자동화하는 도구를 개발하여 데이터 무결성 검증을 통한 임무 소프트웨어 건전성 확보 및 시험 비용 감소 효과를 분석한다.

VRML을 이용한 융합 영상에서 간질환자 발작 진원지의 3차원적 가시화와 위치 측정 구현 (Visualization and Localization of Fusion Image Using VRML for Three-dimensional Modeling of Epileptic Seizure Focus)

  • 이상호;김동현;유선국;정해조;윤미진;손혜경;강원석;이종두;김희중
    • 한국의학물리학회지:의학물리
    • /
    • 제14권1호
    • /
    • pp.34-42
    • /
    • 2003
  • World Wide Web (WWW)에서 Virtual Reality Modeling Language (VRML)를 이용하는 3차원 (3D) 디스플레이는 사용자에게 직관적인 정보를 더 효과적으로 제공해 준다. 웹을 기반으로 하는 해부학적 영상과 융합되는 기능적 영상의 3D 가시화는 아직까지 체계적인 방식으로 연구가 활발히 진행되지 않았다. 이 연구의 목적은 2D 영상들과 함께 웹에서 VRML을 이용하여 구현되는 3D 해부학적 표면 영상들과 기능적 표면 영상들을 동시적으로 관찰할 수 있게 하고 VRML을 통해 만들어진 거리 측정 도구를 가지고 관심영역의 공간적인 위치 정보를 제공하는 것이다. 본 연구에서는 한 명의 간질 환자로부터 Magnetic Resonance (MR) 축면 영상과 발작기 및 발작간기 Single Photon Emission Computed Tomography (SPECT) 축면 영상들을 각각 획득하였다. 발작 진원지의 확인을 향상시키기 위해서 subtractionictal SPECT coregistered to MRI (SISCOM)을 수행하였다 SISCOM 결과로 나타난 각 2D 영상들은 모든 voxel들의 평균값 위로 1-표준편차와 2-표준편차에 해당하는 문턱 이상의 영상 값을 갖도록 하였다. SISCOM으로 나타나는 간질 발작 진원지들과 MRI 영상에서 회색질, 백색질 및 뇌척수액의 경계들을 각각 분할하고 marching cube 알고리즘에 의해 VRML 표면 영상들로 나타내었다. 축면 영상에서 실제 거리를 나타내는 x, y축의 길이를 획득하고 z축선의 길이를 계산하였다. VRML을 이용한 거리 측정도구를 만들어 이전의 VRML 표면 영상들과 융합하였다. MRI 영상을 이용하여 3D 표면 영상들의 단면을 나타내고 3D 표면 영상들의 투명도를 설정하기 위해 Java Script 루틴을 사용자 인터페이스 도구로서 삽입하였다 웹 페이지에서 구현되는 3D 표면 영상들의 투명도와 관찰 위치를 조절함에 따라 모델들 사이의 공간적인 정보를 직관적으로 알 수 있었다. 간질 발작 진원지에 대응하는 해부학적 구조를 3D 표면 영상들을 가로지르는 MRI 평면 영상들을 통해서 확인하였다 간질 발작 진원지는 뇌의 오른쪽 측두엽에서 나타났고 공간적으로 발작 진원지의 실제 위치를 VRML 거리 측정 도구에 의해 알 수 있었다. 결론적으로 본 연구에서 제시하는 웹에 근거한 3D 융합 영상의 가시화와 위치 측정은 진단 및 치료 방사선학과 외과학 등의 분야에서 온라인 방식의 연구와 교육에 있어 많은 도움을 줄 것이다.

  • PDF