• Title/Summary/Keyword: 학술적 텍스트

Search Result 1,089, Processing Time 0.03 seconds

Collaborative Hangul Editor (한글 공동 편집기)

  • Kim, Sang-Wook;Cha, Kyung-Ae;Kim, Woo-Nyun
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.454-460
    • /
    • 1997
  • 여러 응용 분야에 따라 많은 공동작업 시스템이 있다. 이러한 시스템들은 각 응용 영역에 따라 요구되는 문제가 다르다. 이 논문에서는 공동작업객체의 개념을 제시한다. 이 개념은 어떠한 멀티미디어 공동작업 시스템에도 적용할 수 있는 시스템 소프트웨어의 구조적인 모델이다. 이 모델은 지식베이스에서 이벤트를 자동으로 공유하고 각 이벤트에 대한 동작을 비동기적 동기적으로 수행한다. 이 논문에서의 공동작업객체는 멀티미디어 객체의 집합인데, 개념 그래프와 지식 쉘로 표현된다. 이 공동작업객체에서 수행되는 한글 공동텍스트 편집기는 한글 편집 지식에 의하여 공동으로 편집할 수 있다. 또한 한글 공동텍스트 편집기는 공동작업을 위하여 공동작업 객체를 관리, 유지하는 기능을 제공한다. 앞으로는 일반적인 공동작업 객체의 이론적 모델을 연구한다.

  • PDF

Information extraction wish S-HMM from textual data (5-HMM물 이용한 텍스트 정보추출)

  • 엄재홍;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.328-330
    • /
    • 2002
  • 본 논문에서는 패턴이나 음성데이터와 같이 순차적 데이터론 인식하는데 널리 사용되어온 모델로서, 일련의 순차적인 성질을 내포하고있는 데이터를 다루는 문제에 적합하다고 할 수 있는 HMM을 이용하여 정보추출 문제를 다룬다. 기본적으로는 통상적인 HMM 사용법을 따르나 모델의 구조를 정함에 있어서 HMM을 사용할 때는 주로 목적에 맞는 HMM의 구조를 수동으로 구성하고 모델 내부의 확률 파라미터 값을 학습시켰던 데 반해, 본 논문에서는 데이터의 전처리 정보를 이용하여 초기에 추상적으로 설정한 모델이 학습을 통해서 점차 구체화되어 가는 자기 구성 은닉마르코프 모델(5-HMM)을 제시하여 사용한다. 제시된 방법은 CFP(Call for Paper)등의 텍스트 데이터에 더만 실험에서 기존 방식을 사용한 HMM보다 향상된 결과를 보여준다.

  • PDF

Emotion Recognition of Sentence by using Speech Act (화행 정보를 활용한 문장에서의 감정 인식)

  • Kim, Ki-Tai;Ryu, Pum-Mo;Choi, Yong-Seok;Lee, Sang-Tae
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2009.05a
    • /
    • pp.199-200
    • /
    • 2009
  • 자연스러운 대화가 가능한 인공지능 대화시스템을 구축하기 위해서는 사용자의 문장에 내재된 감정을 이해할 수 있는 시스템이어야만 한다. 또한 상호간의 대화를 통해서 풍겨지는 분위기를 파악할 수 있다면 사용자에게 마치 인간과 대화하는 듯한 자연스러움을 느끼도록 할 수 있을 것이다. 실제 대화에서 감정은 언어적인 표현뿐 아니라 비언어적인 표현으로도 표출되지만, 본 논문은 텍스트 상에서 언어적으로 표현되는 감정 정보를 인식하는데 초점을 둔다. 언어적인 표현으로 한정하여 감정을 인식하는 경우에는 감정을 직접 표현하고 있는 형용사나 동사가 중심이 된다. 본 논문에서는 형용사를 중심으로 하여 화행 정보와 결합하여 감정을 인식하는 시스템에 대해서 제시하고자 한다. 이 논문은 문장에 내재되어 있는 숨겨진 감정이나 분위기 등을 파악하기 위한 연구에 대한 선행 연구로서 텍스트 상에서 직접 드러나는 감정을 인식하기 위한 방법을 제안한다.

  • PDF

Models of XML Update Processing for Refreshing XML Cache Incrementally (XML캐쉬의 점진적 갱신을 위한 XML변경 처리 모델)

  • 한승철;황대현;강현철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.64-66
    • /
    • 2004
  • XML이 웹 상에서 데이터 교환의 표준으로 부각된 이래 XML데이터의 효율적 관리 기법에 관한 연구가 활발히 수행되고 있다. XML 질의의 표준화 작업도 활발히 이루어져 현재 XQuery가 유력한 표준으로 부각되었다. 그러나 XQuery 등이 완전한 XML 질의어가 되기 위해서는 변경 연산을 제공해야 하는데 XML변경어의 표준화 작업이나 XML 변경 처리 기법에 대한 연구는 아직 미미한 실정이다. 본 논문에서는 e-Commerce 등 XML 데이터베이스 기반 웹 응용의 효율적 지원을 위한 XML 캐쉬를 점진적으로 갱신하는 과정에서 발생하는 XML 변경 연산 처리의 세 가지 기본 모델. TD (텍스트/DOM 기반). PD(PDOM 기반), 그리고 IT (인덱스된 텍스트 기반)를 제안한다. 캐쉬된 XML 문서를 어떤 포맷으로 저장하는가는 이후 XML 변경 연산의 처리 및 요청된 XML문서 반환의 효율성에 영향을 미친다. 이들 모델들은 캐쉬된 XML 문서의 저장 포맷에 따라 구분한 것이다. 이들 모델 각각에 대하여 캐쉬된 XML문서의 갱신 및 반환 기능을 제공하는 XML캐쉬 관리 시스템을 구현하여 이들 기능의 성능 및 공간 부담을 평가한 결과를 기술한다.

  • PDF

R3 : Open Domain Question Answering System Using Structure Information of Tables (R3 : 테이블의 구조 정보를 활용한 오픈 도메인 질의응답 시스템)

  • Deokhyung Kang;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.455-460
    • /
    • 2022
  • 오픈 도메인 질의 응답에서 질의에 대한 답변은 질의에 대한 관련 문서를 검색한 다음 질의에 대한 답변을 포함할 수 있는 검색된 문서를 분석함으로써 얻어진다. 문서내의 테이블이 질의와 관련이 있을 수 있음에도 불구하고, 기존의 연구는 주로 문서의 텍스트 부분만을 검색하는 데 초점을 맞추고 있었다. 이에 테이블과 텍스트를 모두 고려하는 질의응답과 관련된 연구가 진행되었으나 테이블의 구조적 정보가 손실되는 등의 한계가 있었다. 본 연구에서는 테이블의 구조적 정보를 모델의 추가적인 임베딩을 통해 활용한 오픈 도메인 질의응답 시스템인 R3를 제안한다. R3는 오픈 도메인 질의 응답 데이터셋인 NQ에 기반한 새로운 데이터셋인 NQ-Open-Multi를 이용해 학습 및 평가하였으며, 테이블의 구조적 정보를 활용하지 않은 시스템에 비해 더 좋은 성능을 보임을 확인할 수 있었다.

  • PDF

A Study For Developing ESG Indicators Through Text Mining And Deriving A Correlation Between ESG Indicators And Stock Prices (텍스트 마이닝을 통한 ESG 지표 개발 및 ESG 지표-주가 상관관계 도출 연구)

  • Cheong, Gae Jun;Lee, Kang San;Cho, Eun Hak
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.1273-1276
    • /
    • 2021
  • 기업의 전통적인 역할은 "이익 추구"였다. 현대 사회에 이르러서는 기업이 기존의 역할을 벗어나 새로운 사회적 기구가 되어야 한다는 주장이 떠오르며 CSR(기업의 사회적 책임)이 대두되었다. 최근 기업과 사회는 ESG 경영(환경, 사회, 지배구조를 고려한 지속가능경영)에 많은 관심을 보이고 있고 이는 더 이상 관심으로 그칠 수 없는 필수적인 요소가 되었다. 이에 본 연구는 텍스트 마이닝을 통해 ESG 지표를 개발하고 [ESG 지표 - 주가]의 상관관계를 도출하였다.

Keyword Extraction Technique for Attractions using Online Reviews - Topic Modeling and Markov Chain (온라인 리뷰를 활용한 관광지 키워드 추출 기법 - 토픽 모델링과 Markov Chain)

  • Kim, MyeongSeon;Lee, KangWoo;Lim, JiWon;Hong, Soon-Goo
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.521-523
    • /
    • 2021
  • 관광 분야에서 온라인 리뷰의 중요성이 커지고 있다. 온라인 리뷰의 텍스트 데이터는 파악이 어렵다. 이에 본 연구에서는 특정 관광지에 대한 온라인 리뷰 텍스트 데이터가 나타내는 전반적인 의견을 직관적으로 도출하는 방법에 대해 알아보고자, 토픽 모델링과 Markov Chain을 시행했다. '해운대'에 대한 온라인 리뷰를 수집한 후, LDA와 BTM을 활용하여 주제를 도출하고, Markov Chain을 시각화하여 키워드 간의 관계와 전체적인 평가 내용을 확인했다. 사용된 기법은 각자 특징적인 결과를 제시했기 때문에 다양한 기법을 상보적으로 이용하기를 제안하였다.

A Study on Korean Pause Prediction based Large Language Model (대규모 언어 모델 기반 한국어 휴지 예측 연구)

  • Jeongho Na;Joung Lee;Seung-Hoon Na;Jeongbeom Jeong;Maengsik Choi;Chunghee Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.14-18
    • /
    • 2023
  • 본 연구는 한국어 음성-텍스트 데이터에서 보편적으로 나타난 휴지의 실현 양상을 분석하고, 이를 토대로 데이터셋을 선별해 보편적이고 규격화된 한국어 휴지 예측을 위한 모델을 제안하였다. 이를 위해 전문적인 발성 훈련을 받은 성우 등의 발화가 녹음된 음성-텍스트 데이터셋을 수집하고 MFA와 같은 음소 정렬기를 사용해 휴지를 라벨링하는 등의 전처리를 하고, 다양한 화자의 발화에서 공통적으로 나타난 휴지를 선별해 학습데이터셋을 구축하였다. 구축된 데이터셋을 바탕으로 LLM 중 하나인 KULLM 모델을 미세 조정하고 제안한 모델의 휴지 예측 성능을 평가하였다.

  • PDF

Topic Modeling based Interdisciplinarity Measurement in the Informatics Related Journals (토픽 모델링 기반 정보학 분야 학술지의 학제성 측정 연구)

  • Jin, Seol A;Song, Min
    • Journal of the Korean Society for information Management
    • /
    • v.33 no.1
    • /
    • pp.7-32
    • /
    • 2016
  • This study has measured interdisciplinarity using a topic modeling, which automatically extracts sub-topics based on term information appeared in documents group unlike the traditional top-down approach employing the references and classification system as a basis. We used titles and abstracts of the articles published in top 20 journals for the past five years by the 5-year impact factor under the category of 'Information & Library Science' in JCR 2013. We applied 'Discipline Diversity' and 'Network Coherence' as factors in measuring interdisciplinarity; 'Shannon Entropy Index' and 'Stirling Diversity Index' were used as indices to gauge diversity of fields while topic network's average path length was employed as an index representing network cohesion. After classifying the types of interdisciplinarity with the diversity and cohesion indices produced, we compared the topic networks of journals that represent each type. As a result, we found that the text-based diversity index showed different ranking when compared to the reference-based diversity index. This signifies that those two indices can be utilized complimentarily. It was also confirmed that the characteristics and interconnectedness of the sub-topics dealt with in each journal can be intuitively understood through the topic networks classified by considering both the diversity and cohesion. In conclusion, the topic modeling-based measurement of interdisciplinarity that this study proposed was confirmed to be applicable serving multiple roles in showing the interdisciplinarity of the journals.

Research Dynamics in Innovation Studies Using Text Mining (텍스트 마이닝을 이용한 혁신 분야의 국외 연구 동향 분석)

  • Jung, Hyojung
    • Journal of Technology Innovation
    • /
    • v.24 no.4
    • /
    • pp.249-275
    • /
    • 2016
  • For the past 50 years, innovation field has gone through an evolution. The range of research topics on innovation has expanded and diversified, along with a quantitative increase. In a multi-disciplinary field like innovation, to explore new topics and understand research trends, it is necessary to possess a comprehensive understanding regarding the current status of, and trends in, the research. In this study, the research trend in innovation studies from 2000 to 2015 was analyzed in a holistic perspective. For this, a novel technique, text mining was used. The result shows that innovation studies has focused on the traditional and emerging topics. Also, the differentiations has appeared in some of the traditional topics. This study provides not only an understanding of research dynamics, but also an opportunity to gain insights into the evolution of a new paradigm from an academic perspective.