• 제목/요약/키워드: text recognition

검색결과 666건 처리시간 0.026초

Long Song Type Classification based on Lyrics

  • Namjil, Bayarsaikhan;Ganbaatar, Nandinbilig;Batsuuri, Suvdaa
    • Journal of Multimedia Information System
    • /
    • 제9권2호
    • /
    • pp.113-120
    • /
    • 2022
  • Mongolian folk songs are inspired by Mongolian labor songs and are classified into long and short songs. Mongolian long songs have ancient origins, are rich in legends, and are a great source of folklore. So it was inscribed by UNESCO in 2008. Mongolian written literature is formed under the direct influence of oral literature. Mongolian long song has 3 classes: ayzam, suman, and besreg by their lyrics and structure. In ayzam long song, the world perfectly embodies the philosophical nature of world phenomena and the nature of human life. Suman long song has a wide range of topics such as the common way of life, respect for ancestors, respect for fathers, respect for mountains and water, livestock and animal husbandry, as well as the history of Mongolia. Besreg long songs are dominated by commanded and trained characters. In this paper, we proposed a method to classify their 3 types of long songs using machine learning, based on their lyrics structures without semantic information. We collected lyrics of over 80 long songs and extracted 11 features from every single song. The features are the name of a song, number of the verse, number of lines, number of words, general value, double value, elapsed time of verse, elapsed time of 5 words, and the longest elapsed time of 1 word, full text, and type label. In experimental results, our proposed features show on average 78% recognition rates in function type machine learning methods, to classify the ayzam, suman, and besreg classes.

메타버스 콘텐츠의 재미 요소 분류 (Classification of fun elements in metaverse content)

  • 이준석;이대웅
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1148-1157
    • /
    • 2022
  • 2019년 코로나로 인하여 사람들의 많은 생활에 변화를 주었다. 그중 메타버스는 다양한 방식을 통한 비대면 서비스를 지원하여 일상에서 하던 일을 대체하고 있다. 이런 현상은 코로나19의 장기화로 하나의 문화처럼 만들어지고 형성되었다. 본 논문은 메타버스의 재미요인을 알기 위해 기존 게임에서 사용한 재미요소를 정리하여 전문가 5명과 함께 항목, 내용을 메타버스에 맞게 재분류하였다. 분류는 재매개성을 사용하여 분류하였고 감각적 재미[시각(그래픽), 청각, 텍스트, 조작, 감정이입, 유희, 시점], 도전적 재미[몰입, 도전, 성취, 발견, 스릴, 보상, 문제해결], 상상적 재미[새로운 이야기, 사랑, 자유도, 대리자아, 기대감, 변화], 사회적 재미[규칙, 경쟁, 사회적 행위, 지위, 협동, 참여, 교류, 소속, 화폐거래], 상호작용적 재미[의사결정, 커뮤니케이션 공유, 하드웨어, 감정이입, 육성, 자율성], 현실적 재미[현실 일체감, 학습 용이성, 순응, 지적문제해결, 패턴 인식, 실재감, 커뮤니티], 창조적 재미[응용, 창조, 커스텀마이징, 가상세계]로 구분하였다.

악성댓글 판별의 성능 향상을 위한 품사 자질에 대한 분석 연구 (An analysis study on the quality of article to improve the performance of hate comments discrimination)

  • 김형주;문종민;김판구
    • 스마트미디어저널
    • /
    • 제10권4호
    • /
    • pp.71-79
    • /
    • 2021
  • 인터넷의 사용이 광범위 해져감에 따라 변화되는 사회적 측면 중 하나는 온라인 공간에서의 의사소통이다. 과거에는 물리적으로 같은 공간에 있을 때를 제외하고는 일대일 대화만 원격으로 가능했지만, 요즘은 게시판이나 커뮤니티, 소셜네트워크서비스(SNS) 등을 통해 다수의 사람들과 원격으로 소통할 수 있는 기술이 발달했다. 이러한 정보통신망의 발달로 생활이 편리해지고, 동시에 급격한 정보교류에 따른 피해도 끊임없이 증가하고 있다. 최근에는 연예인뿐 아니라 인플루언서 등 인터넷에서 인지도가 높은 특정인에게 성적인 메시지를 보내거나 인신공격을 가하는 등의 사이버 범죄가 발생하고 있으며, 이들 사이버 범죄에 노출된 이들 중 일부는 극단적인 선택을 하기도 하였다. 본 논문에서는 악성 댓글로 인한 피해를 줄이기 위해 음성 부분별 기능추출을 통한 차별적 악성 댓글의 성능향상 방안을 연구하였다.

빅데이터를 활용한 생활밀착형 치유정원 연관키워드 분석 (An Analysis of Keywords Related to Neighborhood Healing Gardens Using Big Data)

  • 황지루이;이애란
    • 토지주택연구
    • /
    • 제13권2호
    • /
    • pp.81-90
    • /
    • 2022
  • 본 연구는 도심내 정신건강의 녹색치유공간의 사회적 필요성에 기인하여 생활밀착형 정원에 대한 현 시대의 사회적 인식요소 분석을 통해 발전방향을 모색하였다. 연구 방법으로 빅데이터 툴 중 덱스톰을 활용하여 웹정보 데이터를 수집하고, 텍스트마이닝을 진행하여 키워드 분석, 네트워크 분석과 담론분석을 통해 요소의 추출과 관계성을 파악하였다. 분석 결과 첫째, 치유공간과 치유환경은 도시 내부인 생활밀착의 공간 안에 친화적 건강 환경을 구축하고 있었다. 둘째, 생활밀착은 시설뿐 아니라 생활문화와 도시환경을 연동하여 국가와 지방행정, 시민이 참여하는 사업과 활동을 담고 있으며 생활밀착형 정원은 녹색복지와 서비스 프로그램을 통해 내실화되고 있다. 결론으로 정신건강에 유익하고 친근한 생활권의 공익형 정원은 긍정적 자극을 줄 수 있는 치유 환경으로서의 녹색인프라이다.

인공지능 컨트롤러를 이용한 전기 시퀀스 제어 안전 모듈 회로 개발 (Development of Electrical Sequence Control Safety Module Circuit Using Artificial Intelligence Controller)

  • 김홍용
    • 한국재난정보학회 논문집
    • /
    • 제18권4호
    • /
    • pp.699-705
    • /
    • 2022
  • 연구목적: 시퀀스제어는 제조, 유통, 건설, 의료 산업분야의 자동화 등에 응용되어 널리 사용하고 있다. 4차산업의 발전으로 제어분야에 인공지능 융합 기술이 산업에 중요한 요소가 되어가고 있다. 특히 기존 시스템에 마이크로프로세서와 인공지능이 융합된 설비의 안전성과 혁신성을 평가하고 신뢰성 높은 장비개발이 요구되고 있어 교육목적의 장비를 개발하여 해당분야의 발전을 견인하고자 한다. 연구방법: 자체 개발한 일체형 인공지능 컨트롤러 모듈은 기존의 시퀀스 및 PLC제어 회로에 인공지능 능력을 융합한 장비이다. 본 장비의 성능평가항목으로 동작, 음성, 문자, 색상 등의 인식 능력과 회로의 안정성, 신뢰성을 평가하였다. 결론: 시퀀스 및 PLC 회로를 설계 후 융합된 일체형 인공지능 컨트롤러 모듈의 성능평가항목이 모두 만족하였고 회로의 안전성과 신뢰성에 문제가 없는 것으로 나타났다.

지능형 OCR 시스템을 위한 한글 필기체 생성 및 분류 모델에 관한 연구 (A Study on Hangul Handwriting Generation and Classification Mode for Intelligent OCR System)

  • 백진성;서지윤;정상중;정도운
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.222-227
    • /
    • 2022
  • 본 논문에서는 다양한 산업분야에 적용 가능한 딥러닝 알고리즘 기반의 한글 필기체 생성 및 분류 모델을 구현하였다. 구현된 GAN 기반의 한글 필기체 생성 모델과 CNN 기반의 한글 필기체 분류 모델 2가지로 구성되어 있다. GAN 모델은 가짜 한글 필기체 데이터를 생성하기 위한 생성자 모델과 가짜 필기체 데이터를 판별하기 위한 판별자 모델로 구성된다. CNN 모델의 경우 'PHD08' 데이터세트를 활용하여 모델의 학습을 수행하였으며, 학습 결과 92.45% 정확도로 한글 필기체를 분류하는 것을 확인하였다. 구현된 GAN 모델을 통해 생성된 한글 필기체 데이터를 기존 CNN 모델의 학습 데이터세트와 통합하여 분류 모델의 성능평가를 진행한 결과 96.86%로 기존 분류 성능보다 우수하게 나타남을 확인하였다.

이미지 추상화 기법을 이용한 반려견 이름 추천 시스템 개발 (Development of Dog Name Recommendation System for the Image Abstraction)

  • 이재헌;정예린;문미경;박승민
    • 한국전자통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.313-320
    • /
    • 2023
  • 반려견의 등록 누계 현황은 2016년도 107만건에서 2020년 232만건을 기록하고 있다. 매년 동물 등록이 10% 이상씩 증가하고 있고, 이에 따라 반려견을 등록 할 때 이름을 정해야 한다. 반려견 외모의 특징에 맞는 이름을 지어주고 싶지만, 이름을 정하는 것은 많은 어려움이 있다. 본 논문에서는 반려견의 이미지를 인식하고 닮은 사물이나 음식을 기반으로 반려견의 이름을 추천해주는 시스템의 개발 내용을 기술한다. 이 시스템은 다양한 사물과 음식의 이미지를 학습한 모델을 통해 반려견의 이미지와의 유사도를 추출하고, 유사도를 기반으로 강아지의 이름을 추천해준다. 또한 결과값으로 나온 이미지 데이터를 기반으로 연관된 연상단어를 추가로 추천해줌으로써 사용자들에게 다양한 선택지를 제공하고 편의를 높이고 흥미와 재미를 높일 수 있다. 본 시스템을 통해 반려견의 이름을 짓는 고민거리를 해결하고 편하게 반려견에게 어울리는 이름을 확인할 수 있으며, 다양한 추천 이름을 통해 폭넓은 선택지를 줌으로써 사용자들의 만족도를 높일 수 있을 것으로 기대한다.

d-vector를 이용한 한국어 다화자 TTS 시스템 (A Korean Multi-speaker Text-to-Speech System Using d-vector)

  • 김광현;권철홍
    • 문화기술의 융합
    • /
    • 제8권3호
    • /
    • pp.469-475
    • /
    • 2022
  • 딥러닝 기반 1인 화자 TTS 시스템의 모델을 학습하기 위해서 수십 시간 분량의 음성 DB와 많은 학습 시간이 요구된다. 이것은 다화자 또는 개인화 TTS 모델을 학습시키기 위해서는 시간과 비용 측면에서 비효율적 방법이다. 음색 복제 방법은 새로운 화자의 TTS 모델을 생성하기 위하여 화자 인코더 모델을 이용하는 방식이다. 학습된 화자 인코더 모델을 통해 학습에 사용되지 않은 새로운 화자의 적은 음성 파일로부터 이 화자의 음색을 대표하는 화자 임베딩 벡터를 만든다. 본 논문에서는 음색 복제 방식을 적용한 다화자 TTS 시스템을 제안한다. 제안한 TTS 시스템은 화자 인코더, synthesizer와 보코더로 구성되어 있는데, 화자 인코더는 화자인식 분야에서 사용하는 d-vector 기법을 적용한다. 학습된 화자 인코더에서 도출한 d-vector를 synthesizer에 입력으로 추가하여 새로운 화자의 음색을 표현한다. MOS와 음색 유사도 청취 방법으로 도출한 실험 결과로부터 제안한 TTS 시스템의 성능이 우수함을 알 수 있다.

Using Roots and Patterns to Detect Arabic Verbs without Affixes Removal

  • Abdulmonem Ahmed;Aybaba Hancrliogullari;Ali Riza Tosun
    • International Journal of Computer Science & Network Security
    • /
    • 제23권4호
    • /
    • pp.1-6
    • /
    • 2023
  • Morphological analysis is a branch of natural language processing, is now a rapidly growing field. The fundamental tenet of morphological analysis is that it can establish the roots or stems of words and enable comparison to the original term. Arabic is a highly inflected and derivational language and it has a strong structure. Each root or stem can have a large number of affixes attached to it due to the non-concatenative nature of Arabic morphology, increasing the number of possible inflected words that can be created. Accurate verb recognition and extraction are necessary nearly all issues in well-known study topics include Web Search, Information Retrieval, Machine Translation, Question Answering and so forth. in this work we have designed and implemented an algorithm to detect and recognize Arbic Verbs from Arabic text.The suggested technique was created with "Python" and the "pyqt5" visual package, allowing for quick modification and easy addition of new patterns. We employed 17 alternative patterns to represent all verbs in terms of singular, plural, masculine, and feminine pronouns as well as past, present, and imperative verb tenses. All of the verbs that matched these patterns were used when a verb has a root, and the outcomes were reliable. The approach is able to recognize all verbs with the same structure without requiring any alterations to the code or design. The verbs that are not recognized by our method have no antecedents in the Arabic roots. According to our work, the strategy can rapidly and precisely identify verbs with roots, but it cannot be used to identify verbs that are not in the Arabic language. We advise employing a hybrid approach that combines many principles as a result.

빅데이터 분석 도구 R 언어를 이용한 비정형 데이터 시각화 (Visualizing Unstructured Data using a Big Data Analytical Tool R Language)

  • 남수태;진금회;신성윤;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.151-154
    • /
    • 2021
  • 빅데이터 분석은 데이터 저장소에 저장된 대용량 데이터 속에서 의미 있는 새로운 상관관계, 패턴, 추세를 발견하여 새로운 가치를 창출하는 과정이다. 또한 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 그리고 빅데이터 분석 도구인 R언어를 이용하여 전-처리된 텍스트 데이터를 이용하여 다양한 시각화 함수를 통해 분석결과를 표현할 수 있다. 본 연구에서 사용된 데이터는 한국정보통신학회 학회지 논문 중에서 2021년 3월호 논문 21편을 대상으로 분석을 하였다. 최종 분석결과는 가장 많이 언급된 키워드는 "데이터"가 305회로 1위를 차지하였다. 따라서 이러한 분석결과를 바탕으로 연구의 한계와 이론적 실무적 시사점을 제시하고자 한다.

  • PDF