• 제목/요약/키워드: 상황적 텍스트

검색결과 295건 처리시간 0.027초

빅데이터 기반의 정성 정보를 활용한 부도 예측 모형 구축 (Bankruptcy Prediction Modeling Using Qualitative Information Based on Big Data Analytics)

  • 조남옥;신경식
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.33-56
    • /
    • 2016
  • 대부분의 부도 예측에 관한 연구는 재무 변수를 중심으로 통계적 방법 또는 인공지능 기법을 적용하여 부도 예측 모형을 구축하였다. 그러나 재무비율과 같은 회계 정보를 이용한 부도 예측 모형은 재무 제표 결산 시점과 신용평가 시점 간 시차를 고려하지 않을 뿐만 아니라 해당 산업의 경제적 상황과 같은 외부 환경적인 요소를 반영하기 어렵다는 한계점이 존재하였다. 기업의 부도 여부를 예측하기 위해 정량 정보인 재무 변수만을 이용하는 것에 한계가 있음에도 불구하고 정성 정보를 부도 예측 모형에 반영한 연구는 아직 미흡한 실정이다. 본 연구에서는 재무 변수를 이용하는 기존 부도 예측 모형의 성과를 개선하기 위해 빅데이터 기반의 정성 정보를 추가적인 입력 변수로 활용하는 부도 예측 모형을 제안하였다. 제안 모형의 성과 향상은 정성 정보를 예측 모형에 통합시키기에 적합한 형태로 정보의 유형을 변환시킬 수 있는가에 따라 달려있다. 이에 본 연구에서는 정성 정보 처리를 위한 방법으로 빅데이터 분석 기법 중 하나인 텍스트 마이닝(Text Mining)을 활용하였다. 해당 산업과 관련된 경제 뉴스 데이터로부터 경제 상황에 대한 감성 정보를 추출하기 위해 도메인 중심의 감성 어휘 사전을 구축하고, 구축된 어휘 사전을 기반으로 감성 분석(Sentiment Analysis)을 수행하였다. 형태소 분석 등을 포함한 텍스트 전처리 과정을 거쳐 감성 어휘를 추출하고, 각 어휘에 대한 극성 및 감성 점수를 부여하였다. 분석 결과, 전통적 부도 예측 모형에 경제 뉴스 데이터에서 도출한 정성 정보를 반영하는 것은 모형의 성과를 개선하는 것으로 나타났다. 특히, 경제 상황에 대한 부정적 감정이 기업의 부도 여부를 예측하는 데 더욱 효과적임을 알 수 있었다.

설비 오류 유형 구조화를 위한 인공신경망 기반 구절 네트워크 구축 방법 (An Artificial Neural Network Based Phrase Network Construction Method for Structuring Facility Error Types)

  • 노영훈;최은영;최예림
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.21-29
    • /
    • 2018
  • 4차 산업혁명 시대의 도래와 함께 스마트 팩토리의 개념이 대두되면서 설비가동률과 생산성에 악영향을 미치는 설비 오류의 발생을 데이터 분석 기법을 통해 예측하고자 하는 노력이 이루어지고 있다. 데이터 분석 기법을 활용하여 설비 오류를 예측하기 위해서는 설비 오류가 발생한 상황과 설비 오류 유형을 명시한 데이터인 설비 오류 이력이 필요하다. 하지만 많은 제조 현장에서는 설비 오류 유형이 정확하게 정의/분류가 되지 않아 설비를 운영하는 작업자가 자신의 경험적 판단에 의거하여 정형화되지 않은 텍스트의 형태로 설비 오류 유형을 작성하고, 이에 따라 데이터 분석 기법의 적용이 어렵다. 따라서 본 논문에서는 수기로 작성된 설비 오류 이력을 활용하여 설비 오류 유형을 파악하고 구조화하기 위한 구절 네트워크 구축 방법을 제안하고자 한다. 구체적으로, 단어를 쓰임새에 따라 분류한 용도 딕셔너리를 활용하여 비정형의 텍스트 데이터로부터 설비 오류 유형을 의미하는 구절을 추출하고, 추출된 구절 간의 유사도를 계산하여 네트워크를 구축한다. 제안하는 방법의 성능을 실제 제조 기업의 설비 오류 이력 데이터를 활용하여 검증하였으며, 본 연구의 결과는 텍스트 데이터에 기반한 설비 오류 유형 구조화와 나아가서는 설비 오류 발생 예측에 이용할 수 있을 것을 기대한다.

한국어 표현능력 향상을 위한 교육연극 기법 (Educational Drama Skills to Improve the Expressive Ability of Korean Language)

  • 박희정
    • 한국콘텐츠학회논문지
    • /
    • 제15권11호
    • /
    • pp.672-679
    • /
    • 2015
  • 초창기 한국어 교육이 문법 이해를 중요시했다면 현재 한국어 교육은 원활한 의사소통능력의 향상을 중요시하고 있다. 그래서 의사소통 능력을 향상시킬 효과적인 방법의 하나로 교육을 위한 교육연극에 관심이 높다. 교육연극은 실제로 대화할 수 있는 기회를 주기 위해 가상적 상황을 만들어 상황에 맞는 단어와 문법을 사용해 볼 수 있으며, 몸짓, 표정 같은 비언어적 표현도 배울 수 있어 실생활에서 자신감 있게 자신의 의사를 표현하는 능력을 기를 수 있는데, 이는 한국어 교육이 추구하는 의사소통 능력의 향상과 같은 목표를 가지고 있다고 할 수 있다. 또한 학습자가 중심이 되어 활동이 이루어지고, 다른 학습자들과의 협동을 통해 문제를 해결하면서 사회성과 자신감도 기를 수 있다. 본고에서 교육연극 기법 중 인터뷰하기, 텍스트를 대본으로 바꾸기, 이어질 글을 상상해 대본으로 바꾸기, 역할극, 토론을 활용한 활동에 대해 알아보았다. 이러한 활동들이 성공하기 위해서는 좋은 동영상이나 학습 자료들을 개발하여 적극적으로 활용할 수 있도록 해야 하고, 교사를 위한 연수프로그램을 만들어 연수프로그램에서 배운 교육연극 기법들을 수업 시간에 활용할 수 있는 교수 능력을 키우도록 도와야 할 것이다.

BERT와 지식 그래프를 이용한 한국어 문맥 정보 추출 시스템 (Korean Contextual Information Extraction System using BERT and Knowledge Graph)

  • 유소엽;정옥란
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.123-131
    • /
    • 2020
  • 인공지능 기술의 비약적 발전과 함께 사람의 언어를 다루는 자연어 처리 분야 역시 활발하게 연구가 진행되고 있다. 특히 최근에는 구글에서 공개한 언어 모델인 BERT는 대량의 코퍼스를 활용해 미리 학습시킨 모델을 제공함으로써 자연어 처리의 여러 분야에서 좋은 성능을 보이고 있다. BERT에서 다국어 모델을 지원하고 있지만 한국어에 바로 적용했을 때는 한계점이 존재하기 때문에 대량의 한국어 코퍼스를 이용해 학습시킨 모델을 사용해야 한다. 또한 텍스트는 어휘, 문법적인 의미만 담고 있는 것이 아니라 전후 관계, 상황과 같은 문맥적인 의미도 담고 있다. 기존의 자연어 처리 분야에서는 어휘나 문법적인 의미를 중심으로 연구가 주로 이루어졌다. 텍스트에 내재되어 있는 문맥 정보의 정확한 파악은 맥락을 이해하는 데에 있어 중요한 역할을 한다. 단어들의 관계를 이용해 연결한 지식그래프는 컴퓨터에게 쉽게 문맥을 학습시킬 수 있는 장점이 있다. 본 논문에서는 한국어 코퍼스를 이용해 사전 학습된 BERT 모델과 지식 그래프를 이용해 한국어 문맥 정보를 추출하는 시스템을 제안하고자 한다. 텍스트에서 중요한 요소가 되는 인물, 관계, 감정, 공간, 시간 정보를 추출할 수 있는 모델을 구축하고 제안한 시스템을 실험을 통해 검증한다.

소셜미디어에 나타난 코로나 바이러스(COVID-19) 인식 분석 (Trend Analysis of Corona Virus(COVID-19) based on Social Media)

  • 윤상후;정상윤;김영아
    • 한국산학기술학회논문지
    • /
    • 제22권5호
    • /
    • pp.317-324
    • /
    • 2021
  • 본 연구는 국내 소셜미디어를 기반으로 코로나 확산 시기에 따른 코로나19 관심사 변화를 텍스트 기반으로 살펴 보았다. 연구자료는 2020년 1월 20일부터 8월 15일까지 네이버와 다음의 블로그와 카페에 올라온 글이다. 코로나 확산시기는 총 3단계로 분류하였다. 중국에서 발견된 코로나19가 한국에 확산되기 시작한 1월 20일부터 2월 17일을 '전조기', 대구를 중심으로 본격적 확산을 진행된 2월 18일부터 4월 20일을 '심각기', 그리고 일 확진자 수가 안정화되는 4월 21일부터 8월 15일을 '안정기'로 명명하였다. 코로나19와 연관된 상위 50개 단어를 추출하여 TF-IDF를 이용하여 군집 분석 하였다. 분석결과 전조기는 코로나 '상황'에 관련된 텍스트가 많았고, 심각기에는 '국가'와 '감염경로'에 관련된 텍스트가 많았다. 안정기에는 '치료'가 주로 언급되었다. 시기와 무관하게 공통적으로 언급이 많이 된 단어는 '감염', '마스크', '사람', '발생', '확진', '정보'이다. 시기별 감정의 변화를 살펴보면 시간이 지남에 따라 긍정의 비율이 높아지고 있다. 카페와 블로그는 글쓴이의 생각과 주관이 담긴 글을 인터넷을 통해 공유하므로 코로나19로 인한 비대면 시대의 주요 정보공유 공간이다. 그러나 정보전달의 선택성과 임의성이 존재하므로 소셜미디어에서 생산되는 정보를 비판적으로 바라보는 시각이 필요하다.

한국어 상대시간관계 추출을 위한 LSTM 기반 모델 설계 (Design of LSTM-based Model for Extracting Relative Temporal Relations for Korean Texts)

  • 임채균;정영섭;이영준;오교중;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.301-304
    • /
    • 2017
  • 시간정보추출 연구는 자연어 문장으로부터 대화의 문맥과 상황을 파악하고 사용자의 의도에 적합한 서비스를 제공하는데 중요한 역할을 하지만, 한국어의 고유한 언어적 특성으로 인해 한국어 텍스트에서는 개체간의 시간관계를 정확하게 인식하기 어려운 경향이 있다. 특히, 시간표현이나 사건에 대한 상대적인 시간관계는 시간 문맥을 체계적으로 파악하기 위해 중요한 개념이다. 본 논문에서는 한국어 자연어 문장에서 상대적인 시간표현과 사건 간의 관계를 추출하기 위한 LSTM(long short-term memory) 기반의 상대시간관계 추출 모델을 제안한다. 시간정보추출 연구에는 TIMEX3, EVENT, TLINK 추출의 세 가지 과정이 포함되지만, 본 논문에서는 특정 문장에 대해서 이미 추출된 TIMEX3 및 EVENT 개체를 제공하고 상대시간관계 TLINK를 추출하는 것만을 목표로 한다. 또한, 사람이 직접 태깅한 한국어 시간정보 주석 말뭉치를 대상으로 LSTM 기반 제안모델들의 상대적 시간관계 추출 성능을 비교한다.

  • PDF

한국어 상대시간관계 추출을 위한 LSTM 기반 모델 설계 (Design of LSTM-based Model for Extracting Relative Temporal Relations for Korean Texts)

  • 임채균;정영섭;이영준;오교중;최호진
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.301-304
    • /
    • 2017
  • 시간정보추출 연구는 자연어 문장으로부터 대화의 문맥과 상황을 파악하고 사용자의 의도에 적합한 서비스를 제공하는데 중요한 역할을 하지만, 한국어의 고유한 언어적 특성으로 인해 한국어 텍스트에서는 개체간의 시간관계를 정확하게 인식하기 어려운 경향이 있다. 특히, 시간표현이나 사건에 대한 상대적인 시간관계는 시간 문맥을 체계적으로 파악하기 위해 중요한 개념이다. 본 논문에서는 한국어 자연어 문장에서 상대적인 시간표현과 사건 간의 관계를 추출하기 위한 LSTM(long short-term memory) 기반의 상대시간관계 추출 모델을 제안한다. 시간정보추출 연구에는 TIMEX3, EVENT, TLINK 추출의 세 가지 과정이 포함되지만, 본 논문에서는 특정 문장에 대해서 이미 추출된 TIMEX3 및 EVENT 개체를 제공하고 상대시간관계 TLINK를 추출하는 것만을 목표로 한다. 또한, 사람이 직접 태깅한 한국어 시간정보 주석 말뭉치를 대상으로 LSTM 기반 제안모델들의 상대적 시간관계 추출 성능을 비교한다.

  • PDF

Validation RDF 저작 툴의 설계 및 구현 (The Design and Implementation of Validation RDF Authoring Tool)

  • 조성훈;이무훈;손덕주;조현규;송병렬;이찬섭;최의인
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.208-210
    • /
    • 2002
  • 웹의 이용이 보편화되면서 웹 상의 자원(Resource) 또한 급격히 증가하고 있다. 이러한 상황에서 웹 자원을 효율적으로 기술할 수 있는 RDF(Resource Description Framework)는 웹 자원을 체계적으로 관리할 수 있는 지평을 열어주었다. 그러나 현재 RDF문서의 저작환경은 저차원적인 텍스트 편집 수준으로 파싱(parsing)과 유효성 검사(validation checking)를 지원하지 못하고 있는 실정이다. 따라서 본 논문에서는 저작환경을 개선함과 동시에 RDF 및 XML 문서에 대한 파싱 및 유효성 검사를 효율적으로 수행하고, RDF로 기술된 웹 자원을 n-triple 형식으로 생성할 수 있는 RDF 저작 툴을 설계 및 구현하여 유효성이 보장된 웹 자원을 효율적으로 생성 및 처리할 수 있도록 하였다.

  • PDF

모바일 환경에서의 챗봇 UX (Chatbot UX in a Mobile Environment)

  • 이영주
    • 디지털융복합연구
    • /
    • 제17권11호
    • /
    • pp.517-522
    • /
    • 2019
  • 많은 비즈니스에서 챗봇은 사용자의 질문에 가장 즉각적이고 직접적인 피드백으로 제공함으로써 사용자 경험을 높여가고 있으며 그 활용 영역이 커져가고 있다. 본 연구에서는 챗봇의 정의를 비롯해 명령방식, 기능, 플랫폼에 따른 세 가지 유형을 구분되는 요소에 따라 분류해 보았다. 그 과정에서 기능적 구분 요소는 패턴인식, 자연어처리, 시멘틱 웹, 텍스트 마이닝, 상황인식 컴퓨팅의 기능적 부분의 핵심 기술 요소가 챗봇 UX를 위해 필요하지만 현재 단계에서의 한계도 알 수 있었다. 이를 바탕으로 더 나은 사용자 경험을 위한 챗봇의 UX요소를 페이스북, 스카이프, 텔레그램, 구글어이스턴트를 대상으로 분석하였으며 카드와 같은 기본 UI요소와 빠른 응답, 명령, 영구 메뉴의 적용이 사용자 경험요소로 필요함을 알 수 있었다.

NCS기반 가상훈련 콘텐츠 분석에 관한 연구 (A Atudy on NCS-based Virtual Training Content Analysis)

  • 송은지;이석희
    • 한국정보통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.651-656
    • /
    • 2017
  • 가상훈련(Virtual Training)은 특정한 훈련을 목적으로 훈련에 필요한 환경이나 상황을 가상으로 구현하여 실제상황처럼 진행하는 교육 훈련으로서 최근 가상현실 기술의 급격한 발전으로 현실세계에서 직접 경험하지 못하는 상황을 실감적으로 체험하는 것에 대한 요구가 더욱 증대하고 있다. 특히, 가상훈련 시스템은 가상현실 기술을 활용하여 몰입감과 상호작용 제공을 통한 학습 효과가 높아 직접 관찰이 어렵거나 텍스트와 2D 자료로 설명하기에 어려운 학습내용, 가시화하기 어려운 내용, 추상적인 학습개념, 고위험 및 경비가 많이 드는 시험 등의 교육 분야에 매우 효과적이다. 본 연구에서는 수요를 반영한 가상훈련 시스템 개발을 위해 최근 교육의 패러다임인 국가직무능력표준 NCS (National Competency) 교육 분야를 분석하여 적용 가능한 가상훈련 콘텐츠를 제안한다. 향후, 제안한 가상훈련 콘텐츠들이 개발되어 NCS 교육과정을 가장 잘 반영하고 있는 폴리텍 대학등 대학 교육에 적용 가능할 것이라 사료된다.