• Title/Summary/Keyword: 텍스트형 언어

Search Result 66, Processing Time 0.025 seconds

A Language Model based Knowledge Network for Analyzing Disaster Safety related Social Interest (재난안전 사회관심 분석을 위한 언어모델 활용 정보 네트워크 구축)

  • Choi, Dong-Jin;Han, So-Hee;Kim, Kyung-Jun;Bae, Eun-Sol
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2022.10a
    • /
    • pp.145-147
    • /
    • 2022
  • 본 논문은 대규모 텍스트 데이터에서 이슈를 발굴할 때 사용되는 기존의 정보 네트워크 또는 지식 그래프 구축 방법의 한계점을 지적하고, 문장 단위로 정보 네트워크를 구축하는 새로운 방법에 대해서 제안한다. 먼저 문장을 구성하는 단어와 캐릭터수의 분포를 측정하며 의성어와 같은 노이즈를 제거하기 위한 역치값을 설정하였다. 다음으로 BERT 기반 언어모델을 이용하여 모든 문장을 벡터화하고, 코사인 유사도를 이용하여 두 문장벡터에 대한 유사성을 측정하였다. 오분류된 유사도 결과를 최소화하기 위하여 명사형 단어의 의미적 연관성을 비교하는 알고리즘을 개발하였다. 제안된 유사문장 비교 알고리즘의 결과를 검토해 보면, 두 문장은 서술되는 형태가 다르지만 동일한 주제와 내용을 다루고 있는 것을 확인할 수 있었다. 본 논문에서 제안하는 방법은 단어 단위 지식 그래프 해석의 어려움을 극복할 수 있는 새로운 방법이다. 향후 이슈 및 트랜드 분석과 같은 미래연구 분야에 적용하면, 데이터 기반으로 특정 주제에 대한 사회적 관심을 수렴하고, 수요를 반영한 정책적 제언을 도출하는데 기여할 수 있을 것이다

  • PDF

A Design of a simulated Educational Program based on API (API에 기반한 시뮬레이션형 교육 프로그램 설계)

  • Jang, Yeon-Ju;Choi, Jin-Seek
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10a
    • /
    • pp.124-129
    • /
    • 2006
  • 정보 통신 기술의 발달로 컴퓨터를 활용한 교육 영역이 계속 발전해 나가고 있고, 교수-학습에 도움을 주기 위한 많은 코스웨어 들이 개발되어 사용되고 있다. 기존의 코스웨어는 수업시간에 이미 배운 내용을 단순 반복하거나 형성 평가 형식의 예제를 풀어보는 유형으로, 학습자는 미리 계획된 커리큘럼과 프로그램에 수동적으로 반응하게 되어 코스웨어에서도 교수 중심의 학습이 이루어 지는 것을 극복하기 위해 본 연구에서는 학습자가 능동적으로 학습 과정에 참여하여 학습자 중심의 교육이 이루어 질 수 있고 텍스트가 아닌 프로그래밍 언어나 아이콘화 된 메뉴를 이용해 쉽게 접근이 가능하며 실제 상황과 유사하게 학습환경을 제공하고 수행결과를 확인해 학습의 효과를 극대화 시킬 수 있는 응용 프로그램 인터페이스(Application Program Interface) 기반의 시뮬레이션형 코스웨어를 설계해보고자 한다.

  • PDF

Application Development for Text Mining: KoALA (텍스트 마이닝 통합 애플리케이션 개발: KoALA)

  • Byeong-Jin Jeon;Yoon-Jin Choi;Hee-Woong Kim
    • Information Systems Review
    • /
    • v.21 no.2
    • /
    • pp.117-137
    • /
    • 2019
  • In the Big Data era, data science has become popular with the production of numerous data in various domains, and the power of data has become a competitive power. There is a growing interest in unstructured data, which accounts for more than 80% of the world's data. Along with the everyday use of social media, most of the unstructured data is in the form of text data and plays an important role in various areas such as marketing, finance, and distribution. However, text mining using social media is difficult to access and difficult to use compared to data mining using numerical data. Thus, this study aims to develop Korean Natural Language Application (KoALA) as an integrated application for easy and handy social media text mining without relying on programming language or high-level hardware or solution. KoALA is a specialized application for social media text mining. It is an integrated application that can analyze both Korean and English. KoALA handles the entire process from data collection to preprocessing, analysis and visualization. This paper describes the process of designing, implementing, and applying KoALA applications using the design science methodology. Lastly, we will discuss practical use of KoALA through a block-chain business case. Through this paper, we hope to popularize social media text mining and utilize it for practical and academic use in various domains.

(Speaking by using hands') - Wearable PC for the verbally handicapped (('손으로 말해요') - 언어 장애인의 의사소통을 돕기 위한 웨어러블 PC)

  • Kim, Kyung-Hee;Kim, Kee-Hyung;Kim, Ha-Na;Park, Ji-Woo;Sun, Jung-Hee;Lee, Jae-Hyung;Jung, Jong-Phil
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.52-56
    • /
    • 2006
  • 선천적인 원인으로 인해 언어 장애를 겪고 있는 사람들이나 후두암 등 후천적 질환이 원인이 되어 의사 소통에 불편을 겪는 사람들이 있다. 본 논문에서 제안하는 '손으로 말해요'는 이러한 사람들의 의사 표현을 돕기 위한 장치이다. 뇌에 손상이 있거나 성대에 손상이 있어 말하는 것이 어려운 장애인들이 장갑모양의 입력장치와 목 부위에 부착된 스피커를 이용해 말할 수 있다. 이 스피커를 통해 흘러나오는 인공의 목소리로 의사 소통할 수 있다. 언어장애인을 위한 본 웨어러블 PC 의 특징은 먼저 블루투스 모듈을 이용한 간단한 손가락 동작만으로도 입력이 가능한 장갑 모양의 입력장치이다. 사용이 불편한 엄지 손가락을 제외한 나머지 네 손가락에 각 하나씩 양손 총 8 개의 스위치가 부착되어 있다. 사용자는 손가락을 굽혀 손바닥에 스위치가 닿도록 하거나 책상 등과 같이 편평한 탁자에 손가락 끝을 닿게 하여 스위치를 누를 수 있다. 장갑의 키 배열은 PC 키보드의 배열과 같아 사용자가 쉽게 적응할 수 있다. 다음으로 본 장치는 자연스러운 목소리가 흘러나오는 음성 합성 모듈을 탑재하였다. 모듈의 출력 음성은 실제 말하는 것과 같은 자연스러운 억양을 지니고 있으며, 스피커는 목소리가 흘러나오는 위치가 자연스럽도록 목 부위에 부착되어 있다. 그리고 HMD(Head Mounted Display)를 탑재하여 자신이 텍스트를 정확하게 입력하고 있는지 이를 통해 확인할 수 있다. 장갑을 제외한 모든 장비는 가방에 탑재하여 착용이 편리하도록 하였고, 장갑은 블루투스 모듈을 이용하여 이용에 불편을 주는 전선을 제거하였다. 본 논문에서 제안하는 '손으로 말해요'는 간단한 손가락 동작을 이용하여 자연스러운 목소리로 말하고자 하는 내용을 전달할 수 있기 때문에 언어장애로 불편함을 겪는 사람들에게 도움을 줄 수 있다.

  • PDF

High-Quality Multimodal Dataset Construction Methodology for ChatGPT-Based Korean Vision-Language Pre-training (ChatGPT 기반 한국어 Vision-Language Pre-training을 위한 고품질 멀티모달 데이터셋 구축 방법론)

  • Jin Seong;Seung-heon Han;Jong-hun Shin;Soo-jong Lim;Oh-woog Kwon
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.603-608
    • /
    • 2023
  • 본 연구는 한국어 Vision-Language Pre-training 모델 학습을 위한 대규모 시각-언어 멀티모달 데이터셋 구축에 대한 필요성을 연구한다. 현재, 한국어 시각-언어 멀티모달 데이터셋은 부족하며, 양질의 데이터 획득이 어려운 상황이다. 따라서, 본 연구에서는 기계 번역을 활용하여 외국어(영문) 시각-언어 데이터를 한국어로 번역하고 이를 기반으로 생성형 AI를 활용한 데이터셋 구축 방법론을 제안한다. 우리는 다양한 캡션 생성 방법 중, ChatGPT를 활용하여 자연스럽고 고품질의 한국어 캡션을 자동으로 생성하기 위한 새로운 방법을 제안한다. 이를 통해 기존의 기계 번역 방법보다 더 나은 캡션 품질을 보장할 수 있으며, 여러가지 번역 결과를 앙상블하여 멀티모달 데이터셋을 효과적으로 구축하는데 활용한다. 뿐만 아니라, 본 연구에서는 의미론적 유사도 기반 평가 방식인 캡션 투영 일치도(Caption Projection Consistency) 소개하고, 다양한 번역 시스템 간의 영-한 캡션 투영 성능을 비교하며 이를 평가하는 기준을 제시한다. 최종적으로, 본 연구는 ChatGPT를 이용한 한국어 멀티모달 이미지-텍스트 멀티모달 데이터셋 구축을 위한 새로운 방법론을 제시하며, 대표적인 기계 번역기들보다 우수한 영한 캡션 투영 성능을 증명한다. 이를 통해, 우리의 연구는 부족한 High-Quality 한국어 데이터 셋을 자동으로 대량 구축할 수 있는 방향을 보여주며, 이 방법을 통해 딥러닝 기반 한국어 Vision-Language Pre-training 모델의 성능 향상에 기여할 것으로 기대한다.

  • PDF

Text Detection in Scene Images using spatial frequency (공간주파수를 이용한 장면영상에서 텍스트 검출)

  • Sin, Bong-Kee;Kim, Seon-Kyu
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.1_2
    • /
    • pp.31-39
    • /
    • 2003
  • It is often assumed that text regions in images are characterized by some distinctive or characteristic spatial frequencies. This feature is highly intuitive, and thus appealing as much. We propose a method of detecting horizontal texts in natural scene images. It is based on the use of two features that can be employed separately or in succession: the frequency of edge pixels across vertical and horizontal scan lines, and the fundamental frequency in the Fourier domain. We confirmed that the frequency features are language independent. Also addressed is the detection of quadrilaterals or approximate rectangles using Hough transform. Since texts that is meaningful to many viewers usually appear within rectangles with colors in high contrast to the background. Hence it is natural to assume the detection rectangles may be helpful for locating desired texts correctly in natural outdoor scene images.

Design of the XML Based Educational Adaptive Hypermedia System (XML 기반의 교육용 동적적응 하이퍼미다어 시스템 설계)

  • Baek, Yeong-Tae;Lee, Se-Hoon
    • The Journal of Korean Association of Computer Education
    • /
    • v.7 no.2
    • /
    • pp.67-76
    • /
    • 2004
  • The problems of developing web based adaptive hypermedia for education using XML are discussed in this paper. We define two different markup languages using XML. The one structures the domain model and the another describes the user model. These language can be easily extended and authored, with the result of obtaining a simple methodology for data structuring in the field of web based educational adaptive hypermedia. Also, We have suggested three learning rules that automatically restructures hypertext networks according to their user browsing behavior. The user profile is contained in a user model, while the knowledge about the domain can be represented in the form of a concept based domain model. Accordingly.

  • PDF

An Analysis of the Changes of High School Students' Conceptual Structure about Sedimentary Rocks before and after the Field Trip using the Semantic Network Analysis (언어네트워크분석을 이용한 야외지질학습 전후의 퇴적암에 대한 개념 구조 변화 분석)

  • Park, Kyeong Jin;Chung, Duk Ho;Cho, Kyu Seong
    • Journal of the Korean earth science society
    • /
    • v.34 no.2
    • /
    • pp.173-186
    • /
    • 2013
  • The purpose of the study was to investigate the change of students' conceptual structures about sedimentary rocks through the field trip. A semantic network analysis method was utilized to assess the change. An open-ended questionnaire was developed to assess high school students' knowledge of sedimentary rock including its definition, classification, formation process, and characteristics. Fifteen high school students participated in the field trip of this study. The text data were analyzed using the semantic network analysis method. Results are as follows. First, high school students' conceptual structures about sedimentary rocks were more expanded after the field trip. Second, students' conceptual structures formed a 'small world network' by combining the sub-clusters. Third, the size of students' conceptual structures was decreased after a few month of field trip. Nonetheless, the connection among the clusters remained the same.

A study on Customized Foreign Language Learning Contents Construction (사용자 맞춤형 외국어학습 콘텐츠 구성을 위한 연구)

  • Kim, Gui-Jung;Yi, Jae-Il
    • Journal of Digital Convergence
    • /
    • v.17 no.1
    • /
    • pp.189-194
    • /
    • 2019
  • This paper is a study on the methodology of making customized contents according to user 's tendency through the development of learning contents utilizing IT. A variety of learners around the world use mobile devices and mobile learning contents to conduct their learning activities in various fields, and foreign language learning is one of the typical mobile learning areas. Foreign language learning contents suggested in this study is constructed based on the learner's verbal and text information in accordance with the user's vocal tendency. It is necessary to find out a suitable method to translate the user's native language text into the target language and make it into user friendly content.

Ship s Maneuvering and Winch Control System with Voice Instruction Based Learning (음성지시에 의한 선박 조종 및 윈치 제어 시스템)

  • Seo, Ki-Yeol;Park, Gyei-Kark
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.12 no.6
    • /
    • pp.517-523
    • /
    • 2002
  • In this paper, we propose system that apply VIBL method to add speech recognition to LIBL method based on human s studying method to use natural language to steering system of ship, MERCS and winch appliances and use VIBL method to alternate process that linguistic instruction such as officer s steering instruction is achieved via ableman and control steering gear, MERCS and winch appliances. By specific method of study, ableman s suitable steering manufacturing model embodies intelligent steering gear controlling system that embody and language direction base studying method to present proper meaning element and evaluation rule to steering system of ship apply and respond more efficiently on voice instruction of commander using fuzzy inference rule. Also we embody system that recognize voice direction of commander and control MERCS and winch appliances. We embodied steering manufacturing model based on ableman s experience and presented rudder angle for intelligent steering system, compass bearing arrival time, evaluation rule to propose meaning element of stationary state and correct steerman manufacturing model rule using technique to recognize voice instruction of commander and change to text and fuzzy inference. Also we apply VIBL method to speech recognition ship control simulator and confirmed the effectiveness.