• Title/Summary/Keyword: 학술적 텍스트

Search Result 1,089, Processing Time 0.029 seconds

Quantitative Text Mining for Social Science: Analysis of Immigrant in the Articles (사회과학을 위한 양적 텍스트 마이닝: 이주, 이민 키워드 논문 및 언론기사 분석)

  • Yi, Soo-Jeong;Choi, Doo-Young
    • The Journal of the Korea Contents Association
    • /
    • v.20 no.5
    • /
    • pp.118-127
    • /
    • 2020
  • The paper introduces trends and methodological challenges of quantitative Korean text analysis by using the case studies of academic and news media articles on "migration" and "immigration" within the periods of 2017-2019. The quantitative text analysis based on natural language processing technology (NLP) and this became an essential tool for social science. It is a part of data science that converts documents into structured data and performs hypothesis discovery and verification as the data and visualize data. Furthermore, we examed the commonly applied social scientific statistical models of quantitative text analysis by using Natural Language Processing (NLP) with R programming and Quanteda.

Audio-Visual Scene Aware Dialogue System Utilizing Action From Vision and Language Features (이미지-텍스트 자질을 이용한 행동 포착 비디오 기반 대화시스템)

  • Jungwoo Lim;Yoonna Jang;Junyoung Son;Seungyoon Lee;Kinam Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.253-257
    • /
    • 2023
  • 최근 다양한 대화 시스템이 스마트폰 어시스턴트, 자동 차 내비게이션, 음성 제어 스피커, 인간 중심 로봇 등의 실세계 인간-기계 인터페이스에 적용되고 있다. 하지만 대부분의 대화 시스템은 텍스트 기반으로 작동해 다중 모달리티 입력을 처리할 수 없다. 이 문제를 해결하기 위해서는 비디오와 같은 다중 모달리티 장면 인식을 통합한 대화 시스템이 필요하다. 기존의 비디오 기반 대화 시스템은 주로 시각, 이미지, 오디오 등의 다양한 자질을 합성하거나 사전 학습을 통해 이미지와 텍스트를 잘 정렬하는 데에만 집중하여 중요한 행동 단서와 소리 단서를 놓치고 있다는 한계가 존재한다. 본 논문은 이미지-텍스트 정렬의 사전학습 임베딩과 행동 단서, 소리 단서를 활용해 비디오 기반 대화 시스템을 개선한다. 제안한 모델은 텍스트와 이미지, 그리고 오디오 임베딩을 인코딩하고, 이를 바탕으로 관련 프레임과 행동 단서를 추출하여 발화를 생성하는 과정을 거친다. AVSD 데이터셋에서의 실험 결과, 제안한 모델이 기존의 모델보다 높은 성능을 보였으며, 대표적인 이미지-텍스트 자질들을 비디오 기반 대화시스템에서 비교 분석하였다.

  • PDF

An Optimization Technique for File Generator Module of MPEG-4 Authoring Tool for PDA (PDA환경에서 MPEG-4 컨텐츠 저작도구의 파일생성묘듈에 대한 최적화 기법)

  • 이송록;임영순;김상욱
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.619-621
    • /
    • 2004
  • 유비쿼터스 컴퓨팅에 대한 연구가 활발하게 전개되고 있는 지금, PC에서뿐만 아니라 언제 어디서나 가능한 모바일 환경에서 다양한 사용자 인터랙션에 중점을 두고 떨러 가지 기하객체들과 이미지, 텍스트 객체 등을 지원함으로써 PDA의 고유의 특성을 이용하고 또 이에 알맞은 PDA환경에서 전문적인 저작도구를 개발하는 것이 필요하다. 따라서 PDA와 같은 제한된 스크린 사이즈와 메모리 공간에서 작은 메모리를 사용하여 얼마나 풍부한 컨텐츠가 저작가능한가 하는 것이 아주 중요하다 본 논문은 PDA환경에서 기하객체와 텍스트, 이미지 등 객체들을 이용하여 MPEG-4 컨텐츠 저작함에 있어서 기존의 저작도구의 기초 위에서 PDA환경의 고유 특성을 고려하여 BIFS 텍스트 생성 모듈, BIFS 인코더 모듈. 멀티플렉서 모듈에 대한 최적화 기법을 연구하며 더 나아가서 PDA환경에 보다 적합하면서도 직접적이고도 시각적인 저작이 가능한 MPEG-4 컨텐츠 저작시스템을 제안하고 그 개발 결과를 보인다.

  • PDF

An Implementation and Application Of HTML Text Editor Using Problem-Based Learning (PBL 기반 HTML 텍스트 에디터 구현 및 적용)

  • Lee, Eun-Young;Kim, Kap-Su
    • 한국정보교육학회:학술대회논문집
    • /
    • 2007.01a
    • /
    • pp.197-202
    • /
    • 2007
  • 컴퓨터 관련 인프라가 양적으로 팽창하는 지식 정보화 사회에서 컴퓨터 교육은 기초 기본 교육과 더불어 필수적으로 이루어져야 한다. 본 논문에서는 학생들이 쉽게 그리고 많이 접하는 웹에 관한 내용을 지도함에 있어 단순히 인터넷 검색이 아니라 어떻게 웹 페이지가 만들어지는지에 초점을 두었다. 이를 위해 PBL기반 HTML 텍스트 에디터를 구현하고 이를 수업에 직접 적용하여 배운 내용에 관한 형성 평가와 HTML 수업에 대한 흥미나 관심도 등을 설문지를 통해 알아보았다. 실험 결과 실험 집단과 통제 집단 사이에서 에디터로 인한 형성평가 성취도에는 차이가 없었다. 설문지를 통해 조사한 정의적인 영역은 7문항 중 수업의 난이도를 질문한 문항과 앞으로 홈페이지를 만들 수 있는가를 질문한 문항에서만 유의미한 차이를 보였다. PBL 기반의 HTML 텍스트 에디터는 인지적 영역의 성취도에서는 큰 차이를 보이지 않지만 직접 HTML 태그를 치지 않는 에디터를 이용해도 HTML과 관련된 지식을 습득할 수 있음을 보여준다.

  • PDF

Intelligent Wordcloud Using Text Mining (텍스트 마이닝을 이용한 지능적 워드클라우드)

  • Kim, Yeongchang;Ji, Sangsu;Park, Dongseo;Lee, Choong Ho
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2019.05a
    • /
    • pp.325-326
    • /
    • 2019
  • This paper proposes an intelligent word cloud by improving the existing method of representing word cloud by examining the frequency of nouns with text mining technique. In this paper, we propose a method to visually show word clouds focused on other parts, such as verbs, by effectively adding newly-coined words and the like to a dictionary that extracts noun words in text mining. In the experiment, the KoNLP package was used for extracting the frequency of existing nouns, and 80 new words that were not supported were added manually by examining frequency.

  • PDF

Target extraction in Korean aspect-based sentiment analysis using stepwise feature of multi-task learning model (다중 작업 학습의 단계적 특징을 활용한 한국어 속성 기반 감성 분석에서의 대상 추출)

  • Ho-Min Park;Jae-Hoon Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.630-633
    • /
    • 2022
  • 속성기반 감성 분석은 텍스트 내에 존재하는 속성에 대해 세분화된 감성 분석을 수행하는 과제를 말한다. 세분화된 감성분석을 정확하게 수행하기 위해서는 텍스트에 존재하는 감성 표현과 그것이 수식하는 대상에 대한 정보가 반드시 필요하다. 그리고 순서대로 두 가지 정보는 이후 정보를 텍스트에서 추출하기 위해 중요한 단서가 된다. 따라서 본 논문에서는 KorBERT와 Bi-LSTM을 이용한 단계적 특징을 활용한 다중 작업 학습 모델을 사용하여 한국어 감성 분석 말뭉치의 감성 표현과 대상을 추출하는 작업을 수행하였다. 제안한 모델을 한국어 감성 분석 말뭉치로 학습 및 평가한 결과, 감성 표현 추출 작업의 출력을 추가적인 특성으로 전달하여 대상 추출 작업의 성능을 향상시킬 수 있음을 보였다.

  • PDF

Text Region Extraction using Pattern Histogram of Character-Edge Map in Natural Images (문자-에지 맵의 패턴 히스토그램을 이용한 자연이미지에서의 텍스트 영역 추출)

  • Park, Jong-Cheon;Hwang, Dong-Guk;Lee, Woo-Ram;Kwon, Kyo-Hyun;Jun, Byoung-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2006.11a
    • /
    • pp.220-224
    • /
    • 2006
  • The text to be included in the natural images has many important information in the natural image. Therefore, if we can extract the text in natural images, It can be applied to many important applications. In this paper, we propose a text region extraction method using pattern histogram of character-edge map. We extract the edges with the Canny edge detector and creates 16 kind of edge map from an extracted edges. And then we make a character-edge map of 8 kinds that have a character feature with a combination of an edge map. We extract text region using 8 kinds of character-edge map and 16 kind of edge map. Verification of text candidate region uses analysis of a character-edge map pattern histogram and structural feature of text region. The method to propose experimented with various kind of the natural images. The proposed approach extracted text region from a natural images to have been composed of a complex background, various letters, various text colors effectively.

  • PDF

Development of Hypertext Encyclopedia (하이퍼텍스트 한글백과사전의 개발)

  • Jeon, Kyong-Hun;Kang, Hyun-Kyu;Kim, Young-Il;Park, Sang-Kyu;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.59-70
    • /
    • 1993
  • 개인용 컴퓨터가 많이 보급되고, CD-ROM과 같은 대용량의 기록장치가, 널리 퍼지면서, 전자화된 사전이 널리 사용되게 되었다. 그러나 이러한 전자사전들은 대개 매우 단순화된 탐색기능만을 제공하므로, 전자화의 잇점을 크게 살리지 못하고 있다. 따라서, 컴퓨터의 힘을 빌린, 보통의 종이로된 사전보다 훨씬 유용한 전자사전을 생각해 볼 수 있을 것이다. 이러한 노력이 과거 80년대 말에 하이퍼텍스트로 시작되어 이제는 매우 상업적인 곳에까지 사용되어지고있다. 국내에서도 전자사전의 개발은 다양하게 진행되어오고 있으나, 대부분 컴퓨터를 위한 사전, 다시 말하면, 빠른 접근시간, 적은 메모리사용만을 고려한 사전에 그치고 있다. 본 논문에서는 이러한 필요성에 부합하여, 백과사전자료를 가지고 사람을 위한 전자백과사전을 개발하는 방법을 소개한다. 특히, 이러한 개발과정을 자동화 할 수 있음을 보이고, 백과사전을 하이퍼텍스트로 자동변환하는 방법을 자세히 기술한다. 이 방법은 원시 자료를 하이퍼텍스트로 변환하기 좋은 정형화된 중간자료로 바꾸고, 이 중간자료와 기초적인 명사추출 알고리즘을 이용하여, 각 노드들 사이에 링크를 만드는 것이다. 또한, 이 방법을 이용하여 개발한 HE(Hypertext Encyclopedia) 시스템을 소개한다.

  • PDF

Development of a Script-Based Multimedia Simulator for Representing Spatio-Temporal Situation (스크립트에 기반한 시공간 상황들을 표현하기 위한 멀티미디어 시뮬레이터의 개발)

  • 백경훈;박종희;김남철
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1996.06a
    • /
    • pp.119-124
    • /
    • 1996
  • 본 논문에서는 복잡하고 다양한 시공간적 장면들을 하이퍼텍스트적 구조[1]를 이용하여 서로 연결하고 스크립트 및 프레임이라는 구조를 통해서 장면을 구성함으로써 객체의 재활용도 및 네트워킹을 높이는 객체지향적 멀티미디어 시스템을 설계하고 개발한다. 장면을 구성하는 사물을 객체로 정의하며, 이러한 객체는 2D 그래픽, 텍스트, 사운드와 같은 멀티미디어 정보와 장면에 적용되었을 때 필요한 정보로 구성되어져 있다. 이와 함께 장면과 객체 사이를 연결하는 스크립트와 프래임구조를 통해서 장면 속에서의 객체의 역할을 정의한다.

  • PDF

A Study on Actant Models in the TV Talk-Show Program -Focus on 'Healing Camp'- (TV토크프로그램에서의 행동자 모델 관한 연구 -'힐링캠프'를 중심으로-)

  • Chung, Tae-Sub
    • Proceedings of the KAIS Fall Conference
    • /
    • 2012.05a
    • /
    • pp.197-200
    • /
    • 2012
  • 본 논문에서는 그래마스의 이론을 적용하여 행동자의 모델을 통해 출연자의 관계와 서로의 행동적 모델을 분석하고자 함이다. 본 연구에서는 텍스트의 분석이 아닌 영상에서 나타난 의미를 텍스트적으로 들여다보고 이를 통하여 영상에 대입하여 분석하였다. '힐링캠프'의 3명의 사회자와 초대손님의 관계에 대하여 분석함으로서 그래마스의 행동자 모델에 적용함으로서 서로의 관계에 대하여 연구해 보았다.

  • PDF