Search | Korea Science

KorCAT: Cohesion Analysis Tool for Korean Text (한국어 텍스트 결속성 측정 도구: KorCAT)

Dong-Hyun Kim;Hyun-Jung Kim;Chul-hui Kim;Young-Duk Seo
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.582-587
- /
- 2022
결속성은 텍스트의 의미 관계 분석에서 주요하게 고려되는 요인 중 하나이다. 결속성이 높을 수록 텍스트 내 언어적 의미 관계가 긴밀한 것으로 볼 수 있기 때문이다. 사람에 의한 텍스트 결속성 분석은 주관이 개입되는 문제를 배제할 수 없는데, 영어에는 TAACO라고 불리는 결속성 자동 측정 도구가 있어 다양한 지표들로 텍스트의 결속성을 측정하고 있다. 그러나 한국어에는 이와 같은 텍스트 결속성 자동 측정 도구가 거의 없으며, 관련 연구도 상당히 부족한 실정이다. 따라서 본 논문에서는 한국어 텍스트의 의미 관계 분석을 위한 결속성 지표를 정의하고, 한국어의 특성에 맞는 결속성 측정 도구인 KorCAT을 제안한다.
PDF

A Stochastic Text Structuring using Simulated Annealing (자연스러운 텍스트 생성을 위한 추계적 텍스트 구조화)

Roh, Ji-Eun;Lee, Jong-Hyeok
- Annual Conference on Human and Language Technology
- /
- 2002.10e
- /
- pp.199-206
- /
- 2002
언어가 아닌 다양한 지식원으로부터 그것을 설명하는 텍스트를 생성하는 텍스트 생성 (text generation)은 여러 가지 복합적이고 단계적인 과정을 거쳐 이루어진다. 자연스러운 텍스트를 생성하기 위한 여러 단계 중, 지식원으로부터 텍스트에 포함되기 위해 뽑힌 정보들간의 순서를 적절히 결정하는 과정을 텍스트 구조화(text structuring)라고 한다. 텍스트 구조화는 생성될 텍스트의 결속성(coherence)을 크게 좌우하므로, 양질의 텍스트를 생성하기 위해서는 텍스트 구조화를 다루기 위한 정교한 방법론이 요구된다. 본 논문에서는 SA(simulated annealing) 알고리즘을 이용해 추계적 텍스트 구조화 방안을 제안하며 특히, SA의 평가 함수(evaluation function)로서, 총 4가지의 방법론-중심화 이론(centering theory)을 이용한 센터 전이 유형의 선호도, 추론 비용에 근거한 전이 유형간의 선호도, 서두 문장을 결정하기 위한 가중치 할당에 따른 선호도, 인접한 문장간의 유사도에 따른 선호도-을 제안하고 실험을 통해, 그 효용성을 보였다.
PDF

Text Classification using Cloze Question based on KorBERT (KorBERT 기반 빈칸채우기 문제를 이용한 텍스트 분류)

Heo, Jeong;Lee, Hyung-Jik;Lim, Joon-Ho
- Annual Conference on Human and Language Technology
- /
- 2021.10a
- /
- pp.486-489
- /
- 2021
본 논문에서는 KorBERT 한국어 언어모델에 기반하여 텍스트 분류문제를 빈칸채우기 문제로 변환하고 빈칸에 적합한 어휘를 예측하는 방식의 프롬프트기반 분류모델에 대해서 소개한다. [CLS] 토큰을 이용한 헤드기반 분류와 프롬프트기반 분류는 사전학습의 NSP모델과 MLM모델의 특성을 반영한 것으로, 텍스트의 의미/구조적 분석과 의미적 추론으로 구분되는 텍스트 분류 태스크에서의 성능을 비교 평가하였다. 의미/구조적 분석 실험을 위해 KLUE의 의미유사도와 토픽분류 데이터셋을 이용하였고, 의미적 추론 실험을 위해서 KLUE의 자연어추론 데이터셋을 이용하였다. 실험을 통해, MLM모델의 특성을 반영한 프롬프트기반 텍스트 분류에서는 의미유사도와 토픽분류 태스크에서 우수한 성능을 보였고, NSP모델의 특성을 반영한 헤드기반 텍스트 분류에서는 자연어추론 태스크에서 우수한 성능을 보였다.
PDF

Design of the Signature File Method for Hangul Text (한글 텍스트를 위한 요약 화일 기법의 설계)

Chang, Jae-Woo
- Annual Conference on Human and Language Technology
- /
- 1991.10a
- /
- pp.247-256
- /
- 1991
텍스트를 이용하는 새로운 데이타베이스 응용을 효율적으로 지원하기 위해 여러 가지 텍스트 검색 기법이 연구되었으며, 이러한 연구 가운데 효율적인 검색 기법으로 요약 화일 (signature file) 방법이 제안되었다. 그러나 이러한 연구는 모두 영문 텍스트를 위한 연구이며, 한글 텍스트를 위한 요약 화일 기법에 관한 연구는 거의 전무한 상태이다. 따라서 본 논문에서는 한글의 특성에 맞는 요약 화일 기법을 설계하고 아울러 제안한 기법의 실용성과 타당성을 검토한다.
PDF

A Study on the Game Criticism: Meta-analytical Approach to Game Critiques (게임비평에 대한 연구 : 게임비평 텍스트의 메타분석적 접근)

Jeon, Gyongran
- Journal of Korea Game Society
- /
- v.13 no.3
- /
- pp.19-30
- /
- 2013
Digital games have become a major part of the modern popular culture, but little attention has been paid to understanding the textuality of games and what the game texts have the cultural meanings. As the games develop, however, the academic and journalistic game critiques and reviews that try to understand and to deconstruct the game texts are on the rise. This study explores how the game criticism characterizes the game texts, creates and shapes the understanding of games. The finding shows that game criticism is rich and varied in terms of themes and approaches covered, more generally, games criticism can also help preserve game history by focusing on the distinctive game textuality, forms and meanings, and by contextualizing the links and cultural meanings that exist between games and between games and the cultural context.
https://doi.org/10.7583/JKGS.2013.13.3.19 인용 PDF KSCI

Research Trends of Graph-Based Text Mining (그래프 기반 텍스트 마이닝의 연구 동향)

Chang, Jae-Young;Han, Jong Bin;Jwa, Tae Bin
- Annual Conference of KIPS
- /
- 2013.11a
- /
- pp.1074-1077
- /
- 2013
텍스트 마이닝은 비정형 데이터를 가정하므로 텍스트를 단순화된 모델로 표현하는 것이 필요하다. 현재까지 가장 많이 사용되고 있는 모델은 텍스트를 단순한 단어들의 집합으로 표현한 벡터공간 모델이다. 그러나 최근 들어 단어들의 의미적 관계까지 표현하기 위해 그래프를 이용한 텍스트 표현 모델을 많이 사용하고 있다. 본 논문에서는 텍스트 마이닝을 위한 기존의 연구 중에서 그래프에 기반한 텍스트 표현 모델의 방법들과 그들의 특징들을 주제별로 제시한다.
https://doi.org/10.3745/PKIPS.y2013m11a.1074 인용 PDF

Design of Intelligeng Web Image Search Engine (지능적 웹 이미지 검색 엔진의 설계)

박명선;이석호
- Proceedings of the Korean Information Science Society Conference
- /
- 1999.10a
- /
- pp.51-53
- /
- 1999
기존의 웹 이미지 검색 엔진은 웹 이미지를 검색할 때 웹 이미지의 특징과, 웹 이미지를 포함한 HTML 문서의 텍스트를 이용한다. 그러나, 텍스트는 문맥에 따라 의미가 달라질 수 있으므로, 검색 대상을 미리 분류하면 검색 효율을 높일 수 있다. 본 논문은 웹 문서의 텍스트에서 이미지와 관련이 있는 이미지 설명 텍스트를 자동으로 추출하고, 검색 효율을 높이기 위하여 웹 이미지를 자동으로 분류하는 지능적 웹 이미지 검색 엔진을 제안한다. 지능적 웹 이미지 검색 엔진은 분류와 용어, 용어와 용어 사이의 연관도를 이용하여 분류의 정확도를 높인다.
PDF

Partial Movement of Kinetic Typography Using Sketch-based Interfaces (스케치 기반 인터페이스를 이용한 키네틱 타이포그래피의 부분 이동 기법)

Kim, Min-Woo;Jeon, Jae-Woong;Choy, Yoon-Chul
- Proceedings of the Korean Information Science Society Conference
- /
- 2012.06c
- /
- pp.364-366
- /
- 2012
키네틱 타이포그래피는 오늘날 다양한 분야에서 문자 및 텍스트에 시각적 효과를 주는데 사용되고 있다. 현재 키네틱 타이포그래피 제작을 위한 기존의 저작 도구에서는 주로 키프레임 보간 방식을 이용하여 텍스트에 애니메이션 효과를 적용한다. 그러나 키네틱 타이포그래피에서 자주 쓰이는 효과 중 하나인 텍스트의 일부가 다른 텍스트보다 먼저 특정 위치로 이동한 뒤 나머지 텍스트가 순서대로 도달하는 효과는 기존의 방법으로는 각각의 텍스트를 따로 조작하게 되어 불편하고 저작 시간이 길어진다는 문제가 있다. 본 논문에서는 텍스트 내에서 사용자가 원하는 부분만을 스케치로 선택한 뒤, 선택된 부분을 먼저 이동시키고 나머지 부분은 선형 보간을 활용하여 이동시키는 기법을 제안함으로써 복수의 텍스트를 개별적으로 조작해야만 하는 기존의 문제를 해결할 수 있는 스케치 기반의 인터페이스 및 시스템을 제안한다.

Text Assocation Pattern Extraction using NFP-tree Algorithm (NFP-Algorithm 알고리즘을 기반한 텍스트 연관 패턴 추출)

Yu, Soo-Kung;Kim, Kio-chung
- Annual Conference of KIPS
- /
- 2004.05a
- /
- pp.97-100
- /
- 2004
인터넷상에서 존재하는 많은 데이터베이스들 중 현실적으로 유용한 정보를 가지고 있는 것은 텍스트 데이타베이스이다. 텍스트 마이닝 기법에서 비구조적인 특징을 가진 텍스트 데이타로부터 유용한 정보를 분석하고 추출하여 연관된 패턴을 탐색하는 과정은 중요한 연구과제이다. 이에 본 논문은 인터넷에서 저장된 텍스트 데이터를 가지고 기존 텍스트 마이닝 기법 중 연관탐색 기법을 적용하여 사용자 중심의 연관된 패턴을 찾아서 의미있는 정보를 얻고자 한다. 탐색하기 위해 먼저 전처리 작업으로 용어의 객체를 추출하고. 추출된 각 객체들은 대용량 데이터에서 시간적, 공간적면에서 효율적인 연관탐색 기법인 NFP-Algorithm(N-most interesting k-itemsets Using FP-tree and FP-Growth)을 적용시켜서 의미있는 정보를 추출했다. 또한 Apriori계 Algorithm, FP-Algorithm, NFP-Algorithm을 비교하여 NFP-Algorithm이 시간적면에서 효율적임을 보여주었다.
PDF

Document Structuring and Text Retrieval Using SGML, (SGML을 이용한 문헌의 구조화 및 텍스트 검색에 관한 연구)

오민경;정영미
- Proceedings of the Korean Society for Information Management Conference
- /
- 1995.08a
- /
- pp.29-32
- /
- 1995
본 논문에서는 SGML(Standard Generalized Markup Language)을 사용하여 텍스트 검색시스템을 구축하였다. SGML은 개괄적 마크업언어로서 문헌을 문헌요소라는 객체 단위로 이루어진 것으로 보고 이러한 문헌요소간의 관계를 표현하므로, 텍스트 검색시스템에서 SGML을 이용하면 문헌을 구조화할 수 있고 전문(full text)을 효율적으로 조직하고 검색하는 것이 가능하다.
PDF

Search Result 1,089, Processing Time 0.032 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)