• 제목/요약/키워드: natural language understanding

검색결과 132건 처리시간 0.024초

현대 패션사진에 나타난 텍스트성 연구 (A Study on the Textuality Represented in Modern Fashion Photographs)

  • 박미주;양숙희
    • 복식문화연구
    • /
    • 제18권5호
    • /
    • pp.977-990
    • /
    • 2010
  • Today, as individuals show their social identities and reflect their being as the members of society with a culture, an art style and communication function are stood out in fashion photographs. Accordingly, the meanings of images into text are expanded in its interpretative width through the acceptor's various terms. This researcher looked into four theories of both positions on the textuality of language and image, and considered the point of discussion on image of each theory through modern fashion photographs. First, the theory which divides language and image as auditory and visual recognitions in the textuality of language and image is limited from the view it focuses on only one side without considering the ambivalent elements of each field. For the textuality in modern fashion photographs, the observer attempts to turn it into text to give meaning to it as the recognition through five senses conforming to the acceptor's condition. Second, the theory dividing language and image into the text of time properties and spacial properties has limitation in the text, for acceptor's experience of the object appears as the structured form in time and space rather than being defined as two things like time and space. Third, the theory classifying the language and image text into conventional taste and natural taste has limitation from the view that image text is hardly an object of consistent classification in ease of recognition by the code accepted in society. Thus, this can't be fundamental approach for the understanding of the text of decoding trend represented in modern fashion photographs. Fourth, accordingly, this researcher focussed on contextual and arbitrary text of fashion photographs through the theory of Nelson Goodman which discusses image text through the differences in textuality. Basic mechanism of perceiving and recognizing and distinguish image is closely related to habit and custom like language. So, each acceptor perceives the image as a text through arbitrary interpretation obtained by individual, empirical, historical, and educational viewpoints. The textuality of modern fashion photographs aims to widen the range of diverse knowledge and understanding, transcending the regulations of simple function of existing fashion photographs. Consequently, this researcher puts forward the opinion of consistent and diverse follow-up studies on instilling meaning into fashion photographs for the understanding de-regulatory and de-constructive through various senses by avoiding only one sense-dependent fixed and regulatory properties of it.

분석 CRM 실무자의 자연어 질의 처리를 위한 기업 데이터베이스 구성요소 인덱싱 방법론 (A PageRank based Data Indexing Method for Designing Natural Language Interface to CRM Databases)

  • 박성혁;황경서;이동원
    • CRM연구
    • /
    • 제2권2호
    • /
    • pp.53-70
    • /
    • 2009
  • 분석 CRM 영역에서는 고객 데이터 분석을 통하여 고객 행동과 관련된 통찰력을 얻는 것이 중요하다. 이러한 분석 과정에서, 사용자 스스로 기업 데이터베이스에서 대용량 고객 이력 데이터를 조회하고 추출하기 위해서는 SQL 을 사용하여 자유롭게 질의구문을 작성할 수 있어야 한다. 그런데 일반 사용자들이 이러한 업무를 수행하고자 할 때, 기업 데이터베이스 구성 요소에 대한 전문적인 지식이 부족하기 때문에 정보 탐색에 있어서 어려움을 겪는다. 이를 해결하기 위한 방안으로 본 연구에서는 사용자가 제공하는 자연어 수준의 질의를 분석하고, 데이터베이스를 구성하는 값을 중심으로 올바른 질의 결과를 제공하기 위한 데이터베이스 구성요소 인덱싱 방법론을 제안한다. 구체적으로 기업 데이터베이스를 구성하는 세 가지 요소인 관계, 속성, 값에 대한 정보를 읽어 들여 요약 정보에 대한 인덱스를 구성한 다음 사용자의 자연어 질의에서 분석된 의미 단위 별로 데이터베이스 요약 정보와 연결해주는 TableRank 기법을 소개한다. 실험용 데이터베이스를 대상으로 테스트를 수행한 결과, 사용자의 자연어 질의 결과가 데이터베이스를 구성하는 값 정보와 연결되는 것이 관찰되었다. 논문의 후반부에서는 자연어 질의를 자동적으로 처리하기 위한 선행 모듈 개발의 시사점을 정리하고, 향후 기업 데이터베이스 자동 검색 시스템으로 발전하기 위한 방안에 대해서도 설명한다.

  • PDF

영어 회화 교육을 위한 예제 기반 대화 시스템 (Example-based Dialog System for English Conversation Tutoring)

  • 이성진;이청재;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.129-136
    • /
    • 2010
  • 본 논문에서는 영어 회화 교육을 위한 예제 기반 대화 시스템에 대해 논한다. 기존의 획일적인 멀티미디어 영어 학습에서 벗어나 자연어 처리 및 대화 기술을 이용하여 지능적인 일대일 영어 회화 교육 제공을 목적으로 한다. 본 시스템은 미숙한 학습자 발화를 이해할 수 있으므로 불완전한 언어 구사 능력으로도 대화를 참여할 수 있는 체험형 학습을 제공한다. 이를 통해 학습자에게 영어를 배우려는 흥미로운 동기를 부여한다. 또한 학습자의 표현력 향상을 위한 교육적인 도움 기능을 갖추고 있다. 이를 위해 우리는 학습자의 미숙한 표현을 이해하는 담화 상황 고려 발화의도 인식 모델, 도메인 확장성이 뛰어난 예제 기반 대화 관리 모델, 교육 및 평가 기능을 개발하였다. 실험 결과 학습자의 발화에 에러가 많아도 높은 발화의도 인식 성능을 보였으며 대화 상황에 적합한 피드백을 제공하여 학습자가 회화 연습을 끝까지 마치도록 도와 교육 효과에 이바지함을 알 수 있었다.

인공지능의 서사 지능 탐구 : 새로운 서사 생태계와 호모 나랜스의 진화 (Exploring Narrative Intelligence in AI: Implications for the Evolution of Homo narrans)

  • 권호창
    • 트랜스-
    • /
    • 제16권
    • /
    • pp.107-133
    • /
    • 2024
  • 내러티브는 인간의 인지와 사회 문화의 기본이며 개인과 사회가 의미를 구성하고 경험을 공유하며 문화적, 도덕적 가치를 전달하는 주요 수단으로 사용된다. 인간의 사고와 행동을 모방하려는 인공지능 분야에서는 오랫동안 스토리 생성과 스토리 이해에 관해서 연구해 왔으며, 오늘날 대규모 언어 모델은 발전된 자연어 처리 기술을 바탕으로 괄목할 만한 서사적 능력을 보여주고 있다. 이런 상황은 다양한 변화와 새로운 문제를 제기하지만 이에 대한 포괄적인 논의를 찾아보기는 어렵다. 본 논문은 인간과 AI의 서사 지능의 교차점과 상호작용을 살펴봄으로써 현재의 상태와 미래의 변화에 대한 전체적인 조망을 제공하는 것을 목표로 한다. 먼저 호모 나랜스라는 용어로 대변되는 인간과 내러티브의 본질적 관계에 관한 다학제적 연구를 살펴보고, 인공지능 분야에서 내러티브에 관한 연구가 어떻게 이루어져 왔는지를 역사적으로 살펴본다. 그리고 오늘날 대규모 언어 모델이 보여주는 서사 지능의 가능성과 한계를 살펴보고, 서사 지능을 갖춘 AI가 갖는 함의를 파악하기 위한 세 가지 철학적 과제를 제시한다.

자연어 처리 기반 멀티 소스 이벤트 로그의 보안 심각도 다중 클래스 분류 (A Multiclass Classification of the Security Severity Level of Multi-Source Event Log Based on Natural Language Processing)

  • 서양진
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.1009-1017
    • /
    • 2022
  • 로그 데이터는 정보 시스템의 주요 동작과 상태를 이해하고 판단하는 근거로 사용되어 왔으며, 여러 보안 분야 응용에서도 중요한 입력 데이터로 사용된다. 로그 데이터로부터 필요한 정보를 얻어 이를 근거로 의사 결정을 하고, 적절한 대응 방안을 취하는 것은 시스템을 보호하고 안정적으로 운영하는 데 있어 필수적인 요소이지만, 로그의 종류와 양이 폭발적으로 증가함에 따라 기존 도구들로는 효과적이고 효율적인 대응이 쉽지 않은 상황이다. 이에 본 연구에서는 자연어 처리 기반의 머신 러닝을 이용해 멀티 소스 이벤트 로그의 보안 심각도를 여러 단계로 분류하는 방법을 제안하였으며, 472,972건의 훈련 및 테스트 샘플을 이용하여 실험을 수행한 결과 99.59%의 정확도를 달성하였다.

학술대회 및 저널별 기술 핵심구 추출 모델 (A Keyphrase Extraction Model for Each Conference or Journal)

  • 정현지;장광선;김태현;신동구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.81-83
    • /
    • 2022
  • 연구 동향을 파악하는 것은 연구 수행 시 필수적인 요소이다. 대부분의 연구자들은 관심분야의 학술대회 및 저널을 대표하는 기술 핵심구나 관심 분야를 검색함으로써 연구 동향을 파악한다. 하지만, 최근 인공지능과 같은 특정 분야의 경우 한 개의 학술대회에 한 해당 수백~수천 개의 논문이 출간되기 때문에 전체 분야의 경향성을 파악하는 데 어려움이 존재한다. 본 논문에서는 학술대회 또는 저널 제목을 활용하여 기술 핵심구를 자동으로 추출함으로써 연도별 학술대회 및 저널의 연구 동향 파악을 지원하고자 한다. 핵심구 추출은 문장 또는 문서를 대표하는 주요 구문을 추출하는 작업으로서 검색, 요약, 내용 파악 등을 위해 근간이 되는 기술이다. 기존 사전학습 언어모델 기반의 핵심구 추출 모델은 문서 단위의 긴 텍스트를 기준으로 모델링 하였기 때문에 제목 단위의 짧은 텍스트에서는 성능이 낮아진다는 단점이 존재한다. 본 논문에서는 짧은 텍스트에 강인하면서 단어 자체의 중요도를 고려한 학술대회 및 저널의 기술 핵심구 추출 모델을 제안하고자 한다.

  • PDF

Understanding recurrent neural network for texts using English-Korean corpora

  • Lee, Hagyeong;Song, Jongwoo
    • Communications for Statistical Applications and Methods
    • /
    • 제27권3호
    • /
    • pp.313-326
    • /
    • 2020
  • Deep Learning is the most important key to the development of Artificial Intelligence (AI). There are several distinguishable architectures of neural networks such as MLP, CNN, and RNN. Among them, we try to understand one of the main architectures called Recurrent Neural Network (RNN) that differs from other networks in handling sequential data, including time series and texts. As one of the main tasks recently in Natural Language Processing (NLP), we consider Neural Machine Translation (NMT) using RNNs. We also summarize fundamental structures of the recurrent networks, and some topics of representing natural words to reasonable numeric vectors. We organize topics to understand estimation procedures from representing input source sequences to predict target translated sequences. In addition, we apply multiple translation models with Gated Recurrent Unites (GRUs) in Keras on English-Korean sentences that contain about 26,000 pairwise sequences in total from two different corpora, colloquialism and news. We verified some crucial factors that influence the quality of training. We found that loss decreases with more recurrent dimensions and using bidirectional RNN in the encoder when dealing with short sequences. We also computed BLEU scores which are the main measures of the translation performance, and compared them with the score from Google Translate using the same test sentences. We sum up some difficulties when training a proper translation model as well as dealing with Korean language. The use of Keras in Python for overall tasks from processing raw texts to evaluating the translation model also allows us to include some useful functions and vocabulary libraries as well.

AUTOMATED HAZARD IDENTIFICATION FRAMEWORK FOR THE PROACTIVE CONSIDERATION OF CONSTRUCTION SAFETY

  • JunHyuk Kwon;Byungil Kim;SangHyun Lee;Hyoungkwan Kim
    • 국제학술발표논문집
    • /
    • The 5th International Conference on Construction Engineering and Project Management
    • /
    • pp.60-65
    • /
    • 2013
  • Introducing the concept of construction safety in the design/engineering phase can improve the efficiency and effectiveness of safety management on construction sites. In this sense, further improvements for safety can be made in the design/engineering phase through the development of (1) an automated hazard identification process that is little dependent on user knowledge, (2) an automated construction schedule generation to accommodate varying hazard information over time, and (3) a visual representation of the results that is easy to understand. In this paper, we formulate an automated hazard identification framework for construction safety by extracting hazard information from related regulations to eliminate human interventions, and by utilizing a visualization technique in order to enhance users' understanding on hazard information. First, the hazard information is automatically extracted from textual safety and health regulations (i.e., Occupational Safety Health Administration (OSHA) Standards) by using natural language processing (NLP) techniques without users' interpretations. Next, scheduling and sequencing of the construction activities are automatically generated with regard to the 3D building model. Then, the extracted hazard information is integrated into the geometry data of construction elements in the industry foundation class (IFC) building model using a conformity-checking algorithm within the open source 3D computer graphics software. Preliminary results demonstrate that this approach is advantageous in that it can be used in the design/engineering phases of construction without the manual interpretation of safety experts, facilitating the designers' and engineers' proactive consideration for improving safety management.

  • PDF

BERT와 지식 그래프를 이용한 한국어 문맥 정보 추출 시스템 (Korean Contextual Information Extraction System using BERT and Knowledge Graph)

  • 유소엽;정옥란
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.123-131
    • /
    • 2020
  • 인공지능 기술의 비약적 발전과 함께 사람의 언어를 다루는 자연어 처리 분야 역시 활발하게 연구가 진행되고 있다. 특히 최근에는 구글에서 공개한 언어 모델인 BERT는 대량의 코퍼스를 활용해 미리 학습시킨 모델을 제공함으로써 자연어 처리의 여러 분야에서 좋은 성능을 보이고 있다. BERT에서 다국어 모델을 지원하고 있지만 한국어에 바로 적용했을 때는 한계점이 존재하기 때문에 대량의 한국어 코퍼스를 이용해 학습시킨 모델을 사용해야 한다. 또한 텍스트는 어휘, 문법적인 의미만 담고 있는 것이 아니라 전후 관계, 상황과 같은 문맥적인 의미도 담고 있다. 기존의 자연어 처리 분야에서는 어휘나 문법적인 의미를 중심으로 연구가 주로 이루어졌다. 텍스트에 내재되어 있는 문맥 정보의 정확한 파악은 맥락을 이해하는 데에 있어 중요한 역할을 한다. 단어들의 관계를 이용해 연결한 지식그래프는 컴퓨터에게 쉽게 문맥을 학습시킬 수 있는 장점이 있다. 본 논문에서는 한국어 코퍼스를 이용해 사전 학습된 BERT 모델과 지식 그래프를 이용해 한국어 문맥 정보를 추출하는 시스템을 제안하고자 한다. 텍스트에서 중요한 요소가 되는 인물, 관계, 감정, 공간, 시간 정보를 추출할 수 있는 모델을 구축하고 제안한 시스템을 실험을 통해 검증한다.

발달장애인을 위한 커뮤니케이션과 언어 학습 증진을 위한 인공지능 서비스 (An AI Service to support communication and language learning for people with developmental disability)

  • 박찬준;김양희;장윤나;;임희석
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.51-57
    • /
    • 2020
  • 언어발달 장애를 가진 아동들은 일상생활 및 사회생활에서 많은 어려움을 겪으며 이는 생애 전반을 걸쳐 지속된다. 언어발달 장애 아동들은 의사소통 수단인 언어를 이해하거나 사용하는 데에 어려움을 겪기 때문에 종종 사회적 활동에 참여할 기회를 박탈당하곤 한다. 이와 관련해서 Augmentative and Alternative Communication(AAC, 보완대체 의사소통)는 언어장애를 앓는 이들에게 실직적인 의사소통 수단으로 사용될 수 있다. 본 논문은 픽토그램을 AAC의 수단으로써 최대한 활용하여 언어발달 장애 아동이 타인과 의사소통하고 언어 이해 능력을 향상시킬 수 있도록 돕는 딥러닝 기반 인공지능 서비스를 제안한다. 본 서비스를 통해 언어 문제를 겪고 있는 이들이 자신의 의도 혹은 욕구를 보다 수월하게 표현하여 삶의 질이 향상 될 수 있을 것으로 기대한다.