• 제목/요약/키워드: 글자 인식

검색결과 184건 처리시간 0.034초

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

언어학에 있어서 음성학의 중요성 (IMPORTANCE OF PHONETICS IN LINGUISTIC STUDIES)

  • 아 에이취 러우빈스
    • 대한음성학회지:말소리
    • /
    • 제3호
    • /
    • pp.34-39
    • /
    • 1981
  • 유 만근 교수 질문 : 음성학에 관하여 질문하고 싶습니다. 영국대학의 언어학 교육 과정에서 음성학이 차지하는 비중이 얼마나 큰 지 알고 싶습니다. 러우비니스 교수 응답 : 네 ,그 질문엔 한마디로 긍정적인 답변을 할 수 있읍니다. 음성학은 언어학에서 대단히 중요한 위치를 차지하며 런던대학뿐만이 아니라, 영국의 어느 대학에서나 음성학은 언어학에 초기부터 도입됩니다. 지금 하신 질문은 대단히 중요한 문제이므로 좀 더 자세히 설명하겠습니다. 런던의 동료와 마찬가지로 나는 음성학이 언어학의 일부일뿐 아니라 실로 필수적인 분야라고 봅니다. 런던 대학내에는 "음성학 및 언어학과" 라는 학과가 두 군데나 있는데 이는 "불어 및 이태리어과" 라는 식의 명칭과는 의미가 다릅니다. 이러한 명칭의 배후에는 역사적인 이유가 있읍니다. 음성학은 언어학의 분과중에서 가장i 먼저 발전하였으며, 영국에서는 음성학 교수직이 언어학 교수직보다 30년이나 먼저 생겼습니다. 바로 내이얼 저운스가 최초로 음성학 교수직을 얻어 30년이나 봉직했던 것입니다. 이러한 이유로 학과의 명칭이 아직도 그대로 존속하는 것입니다. 10년전에 한국에 왔던 헨더슨 교수 역시 음성학 교수입니다만, 그렇다고 그가 언어학에 관심이 없는 것은 아닙니다. 이제는 아무도 언어학의 전분야를 모두 전공할 수는 없습니다. 그래서 언어학에는 역사언어학, 응용언어학, 음성학 같은 분야별 전문가가 있기 마련입니다. 그러나, 통사론을 하지 않고 언어학을 할 수 없는 것과 마찬가지로 음성학을 하지 않고는 언어학을 할 수가 없습니다. 물론, 음성학안에서도 일반음성학이냐 개별어의 음성학이냐에 따라서 전문이 세분될 수 있읍니다마는, "음성학이 영국 대학의 언어학 교육 과정의 일부인가?" 라는 질문에 대한 답변은 자명할 것입니다. 안걸은 더 나아가서, 인간 언어의 역사를 잠시 생각해 보면 음성학이 언어학 연구에 없어서는 안될 필수적인 것을 알겁니다. 결국 언어학이란 인간 언어의 역사와 운용을 연구하는 것이고 인간의 언어란 수천년을 내려왔으나, 글자가 생기기 전까지는 순전히 음성언어, 즉 소리말로 존재했습니다. 한국어이건 영어이건, 라틴러이건 언어는 모두 발음기관으로 발음 할 수 있고 귀로 들을 수 있는 소리로 되어 있으며, 이미 죽은 말을 다를 때에도 결국 화석화한 소리말을 연구한다고 보는 것입니다. 즉 언어란 바로 소리말입니다. 사람은 글자를 배우기 앞서서 말을 배우며 우리같이 고등교육을 받은 사람도 쓰기와 읽기보다는 말하기와 듣기를 훨씬 많이 합니다. 이 같이 언어는 소리말로 운용되는데, 바로 소리 말을 연구하는 것이 음성학으므로 음성학은 언어학의 기본이요, 필수입니다. 음성학이 영국의 언어학에서 중요한 기본을 이루고 있다고 말 할 수 없다면 영국의 언어학은 그 만큼 빈약하게 될 것입니다. 한국에 음성학회가 있고 또 한글학회가 있지만, 그렇다고 하여 한국어 음성학이 한국어와는 다른 것이라거나, 한국어 음성학을 공부하지 않고 한국어를 연구할 수 있다는 뜻은 아닙니다. 의학에도 분야마다 전문의가 있듯이, 언어학도 이제 복잡하고 광범한 학문이 되었으므로 분야별로 전문가가 나오게 된 것뿐입니다. 따라서 "나는 통사론에 관심이 있으므로 소리말에는 관심이 없다"고 말하는 언어학자가 있다면, 이 것은 크게 잘못된 것입니다. 마찬가지로 "나는 소리에만 관심이 있으므로 통사론에는 관심이 없다"고 말하는 음성학자가 있다면, 이 또한 안되는 일입니다. 문의 구성과 어휘 요소와 아무 관련이 없는 말소리의 차이가 무슨 소용이 있으며, 통사 구조를 표현하고 저달하는 말소리를 연구하지 않고 어떻게 통사론을 연구할 수 있겠습니까? 다시 간추리면, 언어는 본질적으로 소리말이고, 언어의 특성과 사용 및 습득도 모두 소리말 형태로 나타납니다. 따라서, 영국의 대학은 음성학이 대단히 중요함을 인식하고, 언어학을 올바르게 다루는 세계의 여러 다른 대학과 마찬가지로 이에 따라 교육 과정을 편성하고 있습니다.

  • PDF

제한된 한글 입력환경을 위한 음소기반 근사 문자열 검색 시스템 (A Phoneme-based Approximate String Searching System for Restricted Korean Character Input Environments)

  • 윤태진;조환규;정우근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권10호
    • /
    • pp.788-801
    • /
    • 2010
  • 모바일 기기가 발전함에 따라 입력 수단에 대한 연구는 중요한 이슈이다 키패드, 쿼티키패드, 터치, 음성인식 등 다양한 입력장치가 사용되고 있으나 아직 데스크톱 입력장치에 비해 편의성이 떨어져서 입력 시의 오타나 탈자 등의 오류가 포함되는 경우가 많다. 이러한 입력 오류는 문자 메시지 등 사람과의 의사소통에는 문제를 일으키지 않으나 사전, 주소록 등의 데이터베이스 검색에는 치명적인 오류로서 원하는 검색 결과를 얻지 못하게 된다. 특히 한글의 경우 자음과 모음의 조합을 통해 글자를 생성하는 특성상 1만자가 넘는 글자의 조합이 가능하여 영문에 비하여 오류의 빈도가 높다. 기존의 검색 시스템은 Suffix Tree등을 이용하여 입력 오류를 처리하지만 다양한 오류에 대응하기에는 한계가 있다. 본 논문에서는 오자, 탈자 등의 입력 오류를 허용하면서 빠른 검색이 가능한 근사 한글 단어 검색 시스템을 제안하고자 한다. 이 시스템은 기존의 알파벳에 적용된 근사 문자열 검색(Approximate String Searching)을 한글에 효과적으로 적용할 수 있는 여러 가지 알고리즘과 기법이 포함되어 있다. 그리고 제안된 시스템을 이용한 변형 욕설 필터링 시스템의 개발에 대해 이야기하고자 한다. 이 시스템은 유저의 각종 변형 욕설 입력에 대해 90% 이상의 필터링 성능을 보였다.

동양의 연월일시 궁위 인식에 관한 고찰 (A Study on the Gungwi Perception of Year, Month, Day and Hour in the East)

  • 신순옥;나혁진
    • 산업진흥연구
    • /
    • 제9권1호
    • /
    • pp.167-177
    • /
    • 2024
  • 본 논문의 목적은 궁위 인식에 대한 학술적 지위를 조금이나마 회복시켜 보는 데 목적이 있다. 근묘화실로 비유되는 궁위론, 즉 연월일시의 상징성은 단순한 통변의 기술이 아니다. 사주의 가장 근간을 이루는 명리 원리에 해당한다는 점을 인식하고 그 학술적 연구가 앞으로 더 많이 이루어져야 한다는 취지에서 연구하였다. 사주를 구성하는 내재적 사상은 음양오행이며, 기록하는 글자는 십간십이지이고, 시공의 자리를 담당하는 요소는 천간, 지지 그리고 4개의 기둥으로 엮인 궁위(宮位)이다. 이번 궁위 인식에 관한 고찰을 통해 인간이 탄생하는 시점, 즉 우주의 에너지가 뇌와 온몸에 포맷되는 그 순간에 과거의 시간과 정보가 시간의 점을 통과하고 스펙트럼처럼 확산되며 미래의 시간과 행동을 이끌어 간다는 '시간의 스펙트럼' 현상을 궁위론의 근거로 제시해 보았다. 임철초가 '원형이정'을 설명하는 근거로 사용한 선・후천팔괘의 변화 포인트와 현대 우주론 중 하나인 평행이론에서 가정하고 있는 현재를 투과하고 있는 두 원뿔형의 시간 변화 혹은 왜곡이 미래의 우주에 잔상을 남긴다는 가정을 궁위론의 연역적 근거로 삼아 논의해 보았다.

초등학교 4학년 학생들의 표집활동 분석: 사례연구 (Fourth Graders Engaged in Sampling: A Case Study)

  • 박민선;고은성
    • 대한수학교육학회지:학교수학
    • /
    • 제16권3호
    • /
    • pp.503-518
    • /
    • 2014
  • 본 연구는 표집활동을 처음 경험하는 4학년 학생들의 활동을 관찰하고 분석한다. 분석의 목적은 두 가지로, 첫째 표집활동을 처음 경험하는 초등학교 4학년 학생들이 직면하는 어려움은 무엇인지 조사한다. 둘째, 서로 다른 맥락의 표집활동은 학생들이 표본 및 표집과 관련하여 어떠한 개념 또는 아이디어를 형성하고 개발하도록 돕는지 조사한다. 분석결과 표집활동을 진행하는데 있어 학생들이 갖는 가장 큰 장애물은 표본 조사에 대한 명확한 이미지 부족이었다. 학교 급식표 작성을 위해 좋아하는 음식을 조사하는 활동에서 학생들은 모집단에 대한 정보를 얻기 위해 표본으로부터 얻은 정보를 사용한다는 표본 조사에 대한 이미지를 형성 할 수 있었다. 구슬의 개수를 추측하는 활동에서 학생들은 모집단의 정보를 얻기 위한 장치로 표본의 위력을 경험하고 표본조사에 대한 신뢰를 갖게 되었다. 특정 글자의 개수를 추측하는 활동에서 학생들은 편의 없는 표본의 필요성을 인식하였다.

  • PDF

텍스트의 효율적 시각흐름을 위한 타이포그래피-한글을 중심으로- (Typography for Efficient Visual Flow of Text Focused on Hangul)

  • 신경주;김지현
    • 디자인학연구
    • /
    • 제11권3호
    • /
    • pp.187-196
    • /
    • 1998
  • 시각적으로 부적절하고 부담스러운 요소 등을 감소시킬 필요성의 인식 하에 시각 흐름상 정보를 보다 효율적으로 파악할 수 있는 구체적이고 실증적인 방법을 제시하고자 정보의 기본적 전달 매개체인 텍스트를 대상으로 지면에서의 시각 흐름의 특징들과 이에 영향을 미치는 타이포그래피적 요인들을 살펴보고, 나아가 시각 흐름에 영향을 미치는 실제 요인들 중에서의 몇 가지를 추출하여 시각 흐름상 유의미한 차이가 있는지 실험으로써 검증하였다. 그 결과, 효율적인 글자 크기와 글줄 길이 간의 관계는 약 1:8의 비율을 보였다. 또한 지면에서의 텍스트 배열 중에서 글줄 길이에 상관없이 세로로 배열의 효율성이 가장 높다는 것을 확인하였다. 더욱이, 세로로 긴 텍스트의 경우에서 왼쪽에서 오른쪽으로 흐르는 층계 배열보다 세로 배열의 읽기 속도가 빠름을 볼 때, 컬럼 간의 실질적인 눈의 이동 거리를 좁히는 것보다 읽는 방향과 배열을 일치시키는 것이 더욱 효율적인 시각 흐름을 알 수 있다.

  • PDF

문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색 (Keyword Spotting on Hangul Document Images Using Character Feature Models)

  • 박상철;김수형;최덕재
    • 정보처리학회논문지B
    • /
    • 제12B권5호
    • /
    • pp.521-526
    • /
    • 2005
  • 본 논문에서는 저 품질의 한글 문서 영상에서 OCR 기반 검색 시스템의 대안으로 키워드 검출 시스템(Keyword Spotting)을 제안하고 OCR 기반 문서 검색 시스템과 비교한다. 제안 시스템은 문자 분할, 키워드 특징 추출 그리고 단어 매칭으로 구성된다. 문자 분할 단계에서는 인접한 두 문자간의 연결을 효과적으로 분리하면서 문자 넓이 값의 분산이 최소가 되도록 하는 문자 분할 방법을 제안한다. 키워드 특징은 서체별 문자 모델의 결합으로 구성한다. 단어 매칭 단계에서는 문자 매칭에 기반한 단어 대 단어 매칭 방법을 적용한다. 본 논문에서 제안한 키워드 검출 시스템의 성능을 평가하기 위해 한글 문서 영상을 대상으로 OCR 기반 문서 검색 시스템과 비교하였다. 그 결과 한글 글자 크기가 작고 문서의 상태가 좋지 않은 경우 제안한 키워드 검출 시스템에 의한 검색 성능이 OCR 기반 검색 시스템 보다 우수함을 입증하였다.

청각적 말소리 자극과 시각적 글자 자극 제시방법에 따른 5, 6세 일반아동의 음소인식 수행력 비교 (Effects of auditory and visual presentation on phonemic awareness in 5- to 6- year-old children)

  • 김명헌;하지완
    • 말소리와 음성과학
    • /
    • 제8권1호
    • /
    • pp.71-80
    • /
    • 2016
  • The phonemic awareness tasks (phonemic synthesis, phonemic elision, phonemic segmentation) by auditory presentation and visual presentation were conducted to 40 children who are 5 and 6 years old. The scores and error types in the sub-tasks by two presentations were compared to each other. Also, the correlation between the performances of phonemic awareness sub-tasks in two presentation conditions were examined. As a result, 6-year-old group showed significantly higher phonemic awareness scores than 5-year-old group. Both group showed significantly higher scores in visual presentation than auditory presentation. While the performance under the visual presentation was significantly lower especially in the segmentation than the other two tasks, there was no significant difference among sub-tasks under the auditory presentation. 5-year-old group showed significantly more 'no response' errors than 6-year-old group and 6-year-old group showed significantly more 'phoneme substitution' and 'phoneme omission' errors than 5-year-old group. Significantly more 'phoneme omission' errors were observed in the segmentation than the elision task, and significantly more 'phoneme addition' errors were observed in elision than the synthesis task. Lastly, there are positive correlations in auditory and visual synthesis tasks, auditory and visual elision tasks, and auditory and visual segmentation tasks. Summarizing the results, children tend to depend on orthographic knowledge when acquiring the initial phonemic awareness. Therefore, the result of this research would support the position that the orthographic knowledge affects the improvement of phonemic awareness.

다문화가정 초등학생의 읽기, 쓰기와 인지처리능력 연구 (A study on reading and writing and congnitive processing from multicultural in elementary)

  • 박순길;조증열;김은희
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제5권2호
    • /
    • pp.157-165
    • /
    • 2015
  • 본 연구는 다문화가정 아동의 문식성을 알아보고 문식성에 영향을 주는 인지-언어적 변인이 무엇인지 밝히고자 하는 목적이 있다. 연구대상은 전라남도에 거주하는 초등 저학년 46명, 초등 고학년 39명, 전체 85명이다. 다문화가정 어머니의 한국 거주기간은 4~16년이고, 국적은 필리핀, 일본, 중국, 베트남, 캄보디아, 태국, 우즈베키스탄, 스리랑카이다. 본 연구의 결과는 다음과 같다. 첫째, 다문화가정 아동의 읽기, 쓰기, 인지-언어적 변인들은 학년이 높을수록 수행능력이 높았다. 둘째, 다문화가정 아동의 읽기 예언변인이 시지각 하위변인인 시각형태항상성으로 나타난 것은 읽기의 선행조건에서 세부특징이 중요하다는 것을 의미한다. 따라서 다문화가정 아동의 읽기는 친숙한 단어보다는 세부특징에 대한 단서를 잘 아는 것이 중요하다고 할 수 있다. 한글을 처음 배우는 단계에서 통글자 위주의 지도보다는 자음과 모음의 특징을 인식시키는 훈련이 먼저 필요함을 시사한다.

키오스크 소비자의 만족수준 연구: Kano, Timko, PCSI 방법론을 중심으로 (A Study on Kiosk Satisfaction Level Improvement: Focusing on Kano, Timko, and PCSI Methodology)

  • 최재훈;김판수
    • 벤처창업연구
    • /
    • 제17권4호
    • /
    • pp.193-204
    • /
    • 2022
  • 본 연구는 키오스크 사용자를 대상으로 소비자 만족 수준 측정 및 개선의 영향력 정도를 분석하였다. 현대에 이르러 기술의 발전과 온라인 환경의 개선으로 인해 단순노동 업무는 10여 년 후 사라질 확률이 90%가 임박한다. 국내 연구에서도 단순 노무 직종'이 약 36%의 확률로 진보된 기술에 영향을 받아 사라질 것으로 예측되며 기업으로서도 인력 구인과 인건비 등의 문제로 인해 점차 무인화를 진행하며 그 대체재로써 키오스크를 선호하고 있다. 특히 최근 전 세계적으로 큰 유행으로 번지고 있는 코로나19 바이러스로 인해 비대면 서비스에 대한 수요가 높아지며 키오스크 도입 경향은 더욱 가속화되어 세계시장에서 2021년 835억 원 규모로 성장하며 연평균 8.9%의 성장세를 보여주고 있다. 하지만, 이러한 키오스크의 무인이라는 특성으로 인해 일부 소비자는 여전히 사용에 어려움을 겪고 있으며 이러한 기술 사용이 익숙지 않은 소비자들을 중심으로 비대면 서비스 자체에 대한 거부감과 서비스 오류에 대한 불안감 등으로 서비스 공동 생산자에 대한 이해가 부족해 점원과 소비자 간의 역할 갈등을 유발하거나 기술 사용이 익숙한 세대와 서비스 제공 측면에서 불평등이 이루어지고 있다. 또한, 키오스크는 대표적인 기술 기반 셀프서비스 산업이기에 사용자가 불편함을 느끼거나 추가적인 노동을 한다고 여기면 전체적인 서비스 가치 하락을 경험하여 키오스크 산업 자체의 성장세를 억제할 수 있다는 점에서 소비자 중심의 키오스크 개선 방향성 연구는 중요하다. 이에 실제 사용자들을 중심으로 직접 사용함에서 중점 사항에 대한 인터뷰를 진행하여 디스플레이 배색, 글자 크기, 기기의 디자인, 기기의 크기, 내부 UI(인터페이스), 정보의 양, 인식 센서(바코드, NFC 등), 디스플레이 밝기, 자체 이벤트, 반응속도 항목을 추출하였다. 이후 설문을 활용하여 각 기대 평가 항목의 Kano 모델 품질 속성 분류를 진행하였으며 최빈값만을 고려하여 차순위의 통계적 의미가 무시된다는 Kano 모델의 단점을 보완하기 위하여 이를 정확한 수치로 계산할 수 있는 Timko의 고객 만족 계수를 활용하였으며 연구를 통해 키오스크 기대 평가 항목들의 개선 영향력을 최종적으로 분별하여 개선 우선순위를 도출하기 위하여 PCSI Index 분석을 추가로 진행하였다. 그 결과 개선의 영향력은 내부 UI(인터페이스), 글자 크기, 인식 센서(바코드, NFC 등), 반응속도, 자체 이벤트, 디스플레이 밝기, 정보의 양, 기기의 크기, 기기의 디자인, 디스플레이 배색 순으로 나타났으며 이를 통해 키오스크 기반 분야별 연구의 종합적인 비교 및 벤처 산업의 개선 방향성 설정에 이바지하고자 한다.