• 제목/요약/키워드: Natural language process

검색결과 244건 처리시간 0.032초

좌최장일치법과 HMM을 결합한 경량화된 한국어 형태소 분석 (Light Weight Korean Morphological Analysis Using Left-longest-match-preference model and Hidden Markov Model)

  • 강상우;양재철;서정연
    • 인지과학
    • /
    • 제24권2호
    • /
    • pp.95-109
    • /
    • 2013
  • 본 논문에서는 제한된 자원을 사용하는 기기에 적합한 경량화된 한국어 형태소 분석 및 품사 부착 방법을 제안한다. 관련된 초기 연구로는 규칙에 기반을 둔 방법들이 적용되었으나 최근에는 통계에 기반을 둔 방법들을 중심으로 연구되고 있다. 계산 처리 능력과 사용 가능한 메모리가 제한되는 환경에서는 규칙에 기반을 둔 방법보다 상대적으로 많은 자원을 사용하는 통계에 기반을 둔 방법을 사용하여 형태소 분석 및 품사 부착을 수행하기에는 한계가 있다. 본 논문에서는 기존의 규칙에 기반을 둔 형태소 분석 방법인 좌최장일치법을 개선하여 형태소 분석을 수행하고, 통계적인 방법인 hidden Markov model을 축소하여 형태소 품사 부착을 수행한다. 제안하는 방법은 기존의 hidden Markov model을 사용한 시스템과 유사한 성능을 보여주며 소량의 메모리 사용과 월등히 빠른 속도로 형태소 분석 및 품사 부착을 수행할 수 있다.

  • PDF

질의응답 시스템에서 처음 보는 단어의 역문헌빈도 기반 단어 임베딩 기법 (Inverse Document Frequency-Based Word Embedding of Unseen Words for Question Answering Systems)

  • 이우인;송광호;심규석
    • 정보과학회 논문지
    • /
    • 제43권8호
    • /
    • pp.902-909
    • /
    • 2016
  • 질의응답 시스템은 사용자의 질문에 대한 답을 찾아주는 시스템으로, 기존의 검색엔진이 사용자의 질의에 대해 관련된 문서의 링크만을 찾아주는 반면 질문에 대한 최종적인 답을 찾아준다는 차이점이 있다. 특정 분야에 국한되지 않고 다양한 질문을 처리해주는 오픈 도메인 질의응답 시스템에 필요한 연구들이 최근 자연어 처리, 인공지능, 데이터 마이닝 등 학계의 다양한 분야들에서 뜨거운 관심을 받고 있다. 하지만 관련 연구에서는 학습 데이터에는 없었던 단어들이 질문에 대한 정확한 답과 유사한 오답을 구별해내는데 결정적인 역할을 할 수 있음에도, 이러한 처음 보는 단어들을 모두 단일 토큰으로 치환해버리는 문제가 있다. 본 논문에서는 문맥 정보를 통해 이러한 모르는 단어에 대한 벡터를 계산하는 방법을 제안한다. 그리고 역문헌빈도 가중치를 활용하여 문맥정보를 더 효율적으로 처리하는 모델을 제안한다. 또한 풍부한 실험을 통해 질의응답 시스템의 모델 학습 속도 및 정확성이 기존 연구에 비해 향상됨을 확인하였다.

Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구 (A Study on Image Generation from Sentence Embedding Applying Self-Attention)

  • 유경호;노주현;홍택은;김형주;김판구
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.63-69
    • /
    • 2021
  • 사람이 어떤 문장을 보고 그 문장에 대해 이해하는 것은 문장 안에서 주요한 단어를 이미지로 연상시켜 그 문장에 대해 이해한다. 이러한 연상과정을 컴퓨터가 할 수 있도록 하는 것을 text-to-image라고 한다. 기존 딥 러닝 기반 text-to-image 모델은 Convolutional Neural Network(CNN)-Long Short Term Memory(LSTM), bi-directional LSTM을 사용하여 텍스트의 특징을 추출하고, GAN에 입력으로 하여 이미지를 생성한다. 기존 text-to-image 모델은 텍스트 특징 추출에서 기본적인 임베딩을 사용하였으며, 여러 모듈을 사용하여 이미지를 생성하므로 학습 시간이 오래 걸린다. 따라서 본 연구에서는 자연어 처리분야에서 성능 향상을 보인 어텐션 메커니즘(Attention Mechanism)을 문장 임베딩에 사용하여 특징을 추출하고, 추출된 특징을 GAN에 입력하여 이미지를 생성하는 방법을 제안한다. 실험 결과 기존 연구에서 사용되는 모델보다 inception score가 높았으며 육안으로 판단하였을 때 입력된 문장에서 특징을 잘 표현하는 이미지를 생성하였다. 또한, 긴 문장이 입력되었을 때에도 문장을 잘 표현하는 이미지를 생성하였다.

유형학적 접근방식에 의한 실내디자인 과정에 관한 연구 (II) (A Study on Interior Design Process by approaching Typological Method)

  • 한경희;이선민
    • 한국실내디자인학회논문집
    • /
    • 제21호
    • /
    • pp.165-172
    • /
    • 1999
  • For the useful method capable of modern expression on traditional residence architecture, a study was performed on the methodological establishment and possibility of typological method could be examinated to interior design process by typological method. First of all, through the establishment verbal of our Korean traditional architecture and further investigation of environmental and cultural idealogical facts, it could be extracted from natural instinct, duality, continuance, flexibility and transitiov. In second process, based on these results, it could be framed and described the individual typological language and, for the sake of drawing for visual and spatial typology, it was made by sketch in terms and view of possibile guidance of prototype, transforming and application method. from these results of investigated sketches, it cold be used for criteria of application method as the parts of visual and spatial typological elements to have an applicable expression of it/s traditionality. Based on above facts, for the subjects of spatial system, form & shape system, circulation system, order system, decoration system, color & material system in interior design fields, we cold propose the practical possibility through the consideration of application method for built-in meaning that could be adaptable for the interior design practices. These facts were extracted from the based on visual & spatial typology, as above mentiov. Also, through preparing and suggesting the criteria of evaluation and measurement of design quality , we could propose the applicable methodology for further & basically Korean traditional embodiment.

  • PDF

퍼지모델을 이용한 인적오류확률의 타당성 검증 (A Validity Verification of Human Error Probability using a Fuzzy Model)

  • 장통일;이용희;임현교
    • 한국안전학회지
    • /
    • 제21권3호
    • /
    • pp.137-142
    • /
    • 2006
  • Quantification of error possibility, in an HRA process, should be performed so that the result of the qualitative analysis can be utilized in other areas in conjunction with overall safety estimation results. And also, the quantification is an essential process to analyze the error possibility in detail and to obtain countermeasures for the errors through screening procedures. In previous studies for the quantification of error possibility, nominal values were assigned by the experts' judgements and utilized as corresponding probabilities. The values assigned by experts' experiences and judgements, however, require verifications on their reliability. In this study, the validity of new error possibility values in new MCR design was verified by using the Onisawa's model which utilizes fuzzy linguistic values to estimate human error probabilities. With the model of error probabilities are represented as analyst's estimations and natural language expression instead of numerical values. As results, the experts' estimation values about error probabilities are well agreed to the existing error probability estimation model. Thus, it was concluded that the occurrence probabilities of errors derived from the human error analysis process can be assessed by nominal values suggested in the previous studies. It is also expected that our analysis method can supplement the conventional HRA method because the nominal values are based on the consideration of various influencing factors such as PSFs.

Untold story about why King Sejong invented the Korean alphabet

  • JUNG, Sanggyu
    • 한류연구
    • /
    • 제1권1호
    • /
    • pp.1-23
    • /
    • 2022
  • HunMinJeongEum, meaning "the right sound to teach the people," was created in 1443 CE by King Sejong the Great, the fourth king of the Joseon Dynasty. In today's modern language, this letter, called Hangeul, is internationally recognized for its linguistic science. However, it is hard to find a comprehensive study on the fact that King Sejong himself created Hangeul, the Confucian perspective on natural disasters and democracy revealed in the process of writing, the independent efforts emphasized from a certain period, and the achievements of King Sejong, who shared the sorrow of the people and carried out national policies despite the extreme opposition of the nobility. Accordingly, I analyzed the consonants of HunMinJeongEum and looked at the essence of humanity and oriental philosophy (Yin-Yang Five Elements, Sangsu Philosophy, Hado). Surprisingly, different meanings from previous studies and interpretations were found, and King Sejong's "Da Vinci Code," which was left behind in the process of making the consonant, is reinterpreted and revealed. King Sejong's achievements were all connected as one. This is the root of democracy in the Republic of Korea today, and this is why King Sejong was selected as the most beloved and respected historical figure by the Korean people. This study will start with more people's understanding of the fundamental perception and philosophy of the world in Asia, including Korea, to reinterpret and reveal the hardships and great achievements experienced by a leader of a country in the process of creating korean alphabet, and to emphasize democracy, which is an important value for Asians and Westerners' mutual respect and co-prosperity.

특허정보의 NLP 분석을 통한 R&D 계획수립 방안 연구: 디스플레이 기술 분석을 중심으로 (Research on R&D Planning Through NLP Analysis of Patent Information: Focusing on Display Technology)

  • 김정희;김영민
    • 한국산업융합학회 논문집
    • /
    • 제25권5호
    • /
    • pp.817-826
    • /
    • 2022
  • Patent information describes the history of technological progress in the relevant field, so it can be usefully used to identify trends in technological development and change and to establish R&D development strategies. This study proposes a method to identify the needs and problems of technology development at the planning stage of the R&D process and to analyze core technologies through patent analysis using Natural Language Processing(NLP) technology. As a big data source, collected patent documents registered in Google Patents for foldable technology, the latest technology in the display industry, and then extracted keywords using NLP analyzer. By classifying the extracted keywords into needs and problems for technology development, developed technology and materials, identified the needs of the market and customers and analyzed the technologies being researched and developed. Unlike previous studies that performed patent analysis, this methodology is different in that it can quickly and conveniently analyze the latest technology trends from big data called patents even if you do not have specialized knowledge and skills in the text mining. This study contributes to the digitalization of the R&D process based on data analysis.

대규모 말뭉치와 전산 언어 사전을 이용한 의미역 결정 규칙의 구축 (Rule Construction for Determination of Thematic Roles by Using Large Corpora and Computational Dictionaries)

  • 강신재;박정혜
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.219-228
    • /
    • 2003
  • 본 논문은 한국어정보처리 과정에서 구문 관계를 의미역으로 사상시키기 위한 규칙을 효과적으로 구축하는 방법을 제시하고 있다. 의미역의 결정은 의미 분석의 핵심 작업 중 하나이며 자연어처리에서 해결해야 하는 매우 중요한 문제 중 하나이다. 일반적인 언어학 지식과 경험만 가지고 의미역 결정 규칙을 기술하는 것은 작업자의 주관에 따라 결과가 많이 달라질 수 있으며, 또 모든 경우를 다룰 수 있는 규칙의 구축은 불가능하다. 하지만 본 논문에서 제시하는 방법은 대량의 원시 말뭉치를 분석하여 실제 언어의 다양한 사용례를 반영하며, 또 수십 명의 한국어 학자들이 심도 있게 구축하고 있는 세종전자사전의 격틀 정보도 함께 고려하기 때문에 보다 객관적이고 효율적인 방법이라 할 수 있다. 의미역을 보다 정확하게 결정하기 위해 구문관계, 의미부류, 형태소 정보, 이중주어의 위치정보 등의 자질 정보를 사용하였으며, 특히 의미부류의 사용으로 인해 규칙의 적용률이 향상되는 효과를 가져올 수 있었다.

Active SLA 기반 서비스 수준 협약의 자동화 (Automation of Service Level Agreement based on Active SLA)

  • 김상락;강만모;배재학
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.229-237
    • /
    • 2013
  • 최근 SOA와 클라우드 컴퓨팅 기반의 IT 서비스에 대한 수요가 증가하면서 서비스 당사자들 간에 SLA(Service Level Agreement, 서비스 수준 협약)에 대한 관심이 증대되고 있다. 통상 SLA는 자연어로 작성된 종이 계약서이다. 상업용 SLA 관리 툴에서 사용하는 SLA는 절차적 언어를 사용하여 계약서 내용을 애플리케이션 안에 암시적으로 구현된다. 이는 SLA 자동화 작업을 어렵게 한다. 또한 계약시스템에 대한 유지관리를 어렵게 하고 새로운 계약 요구사항을 적용하기 위해서는 소스 코드에 대한 광범위한 수정 작업이 뒤따른다. SLA 유지관리 과정에서 발생하는 문제의 근본 원인은 동일한 SLA가 문서형과 실행형으로 이원화 되어 있다는 것이다. 본 논문에서는 이러한 현행 SLA 관리의 문제점을 개선하기 위해서 능동형 SLA(ASLA : Active Service Level Agreement)를 기반으로 하는 능동형 SLM(ASLM : Active Service Level Management) 시스템을 제안한다. 이 시스템에서는 이원화된 SLA 처리 및 관리 과정이 능동형 SLA(ASLA)의 도입으로 일원화될 수 있음을 보였다.

한국어 음운 변동 처리 규칙의 설계 및 구현 (Design and Implementation of Vocal Sound Variation Rules for Korean Language)

  • 이계영
    • 한국정보처리학회논문지
    • /
    • 제5권3호
    • /
    • pp.851-861
    • /
    • 1998
  • 한국어는 음운 변동 현상이 매우 발달되어 있다는 특징을 갖고 있다. 따라서, 음성 인식율의 제고와 음성 합성음의 자연스러움을 향상시키기 위해서는 음운 변동 현상을 비롯한 한국어의 모든 특징에 대한 체계적인 연구가 있어야 한다. 본 논문은 한국어의 제 특징 중에서 음운 변동 현상을 효율적으로 처리할 수 있는 규칙을 설계하고 구현함으로써, 한국어 음성 인식과 합성에 효율적으로 이용될 수 있음을 보인다. 음운 변동 규칙의 설계를 위하여 사용된 규정은 한글 맞춤법 통일안의 표준 발음법(7장 30항)이며, 일차적으로 각 규정별로 설계된 규칙을 최종적으로 27개 그룹으로 정리된 종성별 규칙을 제시하였다. 본 연구에서 제안된 음운 변동 처리 시스템은 한번의 규칙 적용으로 음운 변도 dgus상이 신속히 처리되는 잇점이 있으며, 단어 및 용언의 어간에 접속되는 정보에 대한 처리 내용까지도 제안된 규칙내에 수용하였기 때문에 문장 단위의 음성 인식과 합성 시스템의 연구에 도움을 줄 수 있다.

  • PDF