• 제목/요약/키워드: text-generation

검색결과 367건 처리시간 0.024초

온톨로지와 텍스트 마이닝 기반 지능형 역사인물 검색 서비스 (Ontology and Text Mining-based Advanced Historical People Finding Service)

  • 정도헌;황명권;조민희;정한민;윤소영;김경선;김평
    • 인터넷정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.33-43
    • /
    • 2012
  • 시맨틱 웹 기술은 특정 개체를 중심으로 의미적 연관 관계를 생성하고 연관 관계를 이용해서 다양한 지능형 정보 서비스를 구축하는데 활용되며, 텍스트 마이닝 기술은 비정형 데이터를 대상으로 의미 분석을 통해서 의미적 연관 관계를 생성하는데 활용될 수 있다. 본 연구에서는 역사인물을 중심으로 온톨로지 스키마, 인스턴스를 생성하는 가이드라인, 인스턴스 생성, 동명이인 해소를 위한 텍스트 마이닝, 추론을 활용한 지능화된 역사인물 검색서비스를 제안한다. 역사분야 전문가들이 생성한 역사적 사건, 기관, 인물 중심의 연관 관계와 국사편찬위원회에서 보유한 다양한 문헌들 간의 연계를 통해, 사용자들의 정보접근성을 향상시킴과 동시에 관계 정보에 기반한 새로운 역사인물 검색 서비스를 제안하였다. 새로운 역사인물 검색 서비스는 인물간의 소셜 네트워크를 사용하여 역사문헌에 나타난 동명이인을 해소함으로써 보다 정확한 검색서비스를 제공하는 것은 물론, 역사 인물 시소러스를 포함한 다양한 외부 정보와의 연계를 통해서 역사인물에 대한 고부가 정보를 제공하고 있다.

한국어 텍스트 문장정렬을 위한 개체격자 접근법과 LSA 기반 접근법의 활용연구 (A comparative study of Entity-Grid and LSA models on Korean sentence ordering)

  • 김영삼;김홍기;신효필
    • 인지과학
    • /
    • 제24권4호
    • /
    • pp.301-321
    • /
    • 2013
  • 본 논문은 텍스트의 응집도 측정과 텍스트 자동생성 시스템을 위한 기초기술 중 하나인 문장정렬 과제에 대한 연구로, 개체기반적(entity-based) 접근의 한 유형인 개체격자 모형(Entity-Grid model)과 벡터공간 모형에 기반한 LSA(Latent Semantic Analysis)를 모두 시도하고 결과를 서로 비교하였다. 개체격자 모형에 대한 기존 연구들에서 논의된 명사들의 통사역(syntactic role) 정보가 한국어 텍스트 정렬과제에 미치는 영향을 실험하고자 하였으며, 기존 독일어권 응용연구 결과와는 달리 긍정적인 결과를 얻었다. 이 과정에서 한국어의 격조사를 활용하는 전략을 취했으며, 이는 한국어의 격표지 정보가 한국어 텍스트의 응집성을 측정하는 데에 유용할 수 있다는 점을 보인 것이다. 그리고 개체격자 모형을 통한 결과를 LSA 기반 모형결과와 비교하여 양 모형의 장단점과 향후 개선점을 아울러 논의하였다.

  • PDF

장면 텍스트 추출을 위한 캐니 연산자의 적응적 임계값을 이용한 AEMSER (AEMSER Using Adaptive Threshold Of Canny Operator To Extract Scene Text)

  • 박순화;김동현;임현수;김홍훈;백재경;박재흥;서영건
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권6호
    • /
    • pp.951-959
    • /
    • 2015
  • 장면 텍스트 추출은 현대 스마트 시대에서 쏟아져 나오는 다양한 영상 기반 응용에 중요한 정보를 제공하기 때문에 중요하다. 기본적인 MSER(Maximally Stable Extremal Regions) 추출 후에 캐니 연산자를 이용하여 경계를 강화시키는 Edge-Enhanced MSER은 텍스트 추출 측면에서 뛰어난 성능을 보인다. 하지만 캐니 연산자의 임계값 설정에 따라 Edge-Enhanced MSER의 결과영상이 다르게 나타나므로 임계값 설정을 계산하는 방법이 필요하다. 본 논문에서는 캐니 연산자의 임계값을 설정하는 방법 중 히스토그램의 중앙값을 이용하여 경계를 추출하고 이를 Edge-Enhanced MSER에 적용한 AEMSER(Adaptive Edge-enhanced MSER)을 제안한다. 이 방법은 명확한 경계에 대해서만 영역을 추출하기 때문에 기존의 방법보다 더 좋은 결과영상을 얻을 수 있다.

중등학교 가정과교사 임용시험의 핵심 키워드 탐색: 내용 분석과 텍스트 네트워크 분석을 중심으로 (Exploring the Core Keywords of the Secondary School Home Economics Teacher Selection Test: A Mixed Method of Content and Text Network Analyses)

  • 박미정;한주
    • Human Ecology Research
    • /
    • 제60권4호
    • /
    • pp.625-643
    • /
    • 2022
  • The purpose of this study was to explore the trends and core keywords of the secondary school home economics teacher selection test using content analysis and text network analysis. The sample comprised texts of the secondary school home economics teacher 1st selection test for the 2017-2022 school years. Determination of frequency of occurrence, generation of word clouds, centrality analysis, and topic modeling were performed using NetMiner 4.4. The key results were as follows. First, content analysis revealed that the number of questions and scores for each subject (field) has remained constant since 2020, unlike before 2020. In terms of subjects, most questions focused on 'theory of home economics education', and among the evaluation content elements, the highest percentage of questions asked was for 'home economics teaching·learning methods and practice'. Second, the network of the secondary school home economics teacher selection test covering the 2017-2022 school years has an extremely weak density. For the 2017-2019 school years, 'learning', 'evaluation', 'instruction', and 'method' appeared as important keywords, and 7 topics were extracted. For the 2020-2022 school years, 'evaluation', 'class', 'learning', 'cycle', and 'model' were influential keywords, and five topics were extracted. This study is meaningful in that it attempted a new research method combining content analysis and text network analysis and prepared basic data for the revision of the evaluation area and evaluation content elements of the secondary school home economics teacher selection test.

에지 및 형태학적 재구성에 의한 연결요소를 이용한 자연영상의 문자영역 검출 (Character Region Detection in Natural Image Using Edge and Connected Component by Morphological Reconstruction)

  • 권교현;박종천;전병민
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제5권1호
    • /
    • pp.127-133
    • /
    • 2011
  • 자연영상에 내포되어 있는 문자는 다양한 내용을 표현하는 중요한 정보이다. 기존의 문자 검출 알고리즘은 영상의 복잡도와 주변의 조명, 문자와 유사한 배경색 등의 환경에서 문자영역을 검출하지 못하는 문제점이 있으므로 본 논문에서는 에지 및 형태학적 재구성에 의한 연결요소를 이용한 자연영상에 포함된 문자영역을 검출하는 방법을 제안한다. 첫 번째 단계로, 명암도 영상에서 캐니에지(Canny-Edge) 검출기를 이용한 에지 성분과 형태학적 연산에 의한 지역적 최소/최대값을 갖는 연결요소를 검출하고, 각각 검출된 연결성분을 레이블링하고, 레이블링 된 각 성분에 대해 문자가 갖는 특징을 이용한 후보 문자영역을 검출한다. 마지막으로 검출된 후보 문자 영역을 서로 합병하여 하나의 후보 문자 영역을 생성하고, 후보 문자 영역의 인접성과 유사성으로 후보 문자 영역을 검증하여 최종 문자 영역을 검출한다. 실험결과 제안한 에지 및 연결요소 성분을 이용한 방법은 문자영역 검출의 정확성이 개선되었다.

삼각 부등식을 이용한 온라인 VQ 코드북 생성 방법 (Online VQ Codebook Generation using a Triangle Inequality)

  • 이현진
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권3호
    • /
    • pp.373-379
    • /
    • 2015
  • 본 논문에서는 실시간으로, 문서, 웹 페이지, 블로그, tweet 등 텍스트 정보와 센서, 머신데이터등 IoT의 데이터가 생성되는 상황에서 새로 추가되는 데이터들을 기존에 만들어진 VQ 코드북에 추가시키면서, 기존 VQ 코드북 모델을 실시간으로 갱신하기 위한 온라인 VQ 코드북 생성 방법을 제안한다. 기존에 일괄 작업으로 만들어진 VQ 코드북의 성능을 저하시키지 않으면서, 새로 추가된 데이터를 활용하여 VQ 코드북을 점진적으로 수정하는 방식으로 삼각 부등식을 활용하여 높은 정확도와 속도를 보일 수 있었다. 테스트 데이터에 적용한 결과 일괄 작업과 유사한 성능을 보이면서, 다른 온라인 K-Means 보다 빠른 속도를 보였다.

이미지 생성을 위한 변동 자동 인코더 분산 제약 (Variational Auto Encoder Distributed Restrictions for Image Generation)

  • 김용길
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.91-97
    • /
    • 2023
  • GAN(Generative Adversarial Networks)이 합성 이미지 생성 및 기타 다양한 응용 프로그램에 현재 사용되고 있지만, 생성 모델을 제어하기가 어렵다. 문제는 생성 모델의 잠재 공간에 있는데, 이미지 생성과 관련하여 입력된 잠재코드를 받아 특정 텍스트 및 신호에 따라 지정된 대상 속성이 향상되도록 하고 다른 속성은 크게 영향을 받지 않도록 하기 위해서는 상당한 제약이 요구된다. 본 연구에서는 이미지 생성 및 조작과 관련하여 변동 자동 인코더의 잠재 벡터에 관해 특정 제약을 수반한 모델을 제안한다. 제안된 모델에 관해 TensorFlow의 변동 자동 인코더를 통해 실험한 결과 이미지의 생성 및 조작과 관련하여 비교적 우수한 성능을 갖는 것으로 확인된다.

Automatic Poster Generation System Using Protagonist Face Analysis

  • Yeonhwi You;Sungjung Yong;Hyogyeong Park;Seoyoung Lee;Il-Young Moon
    • Journal of information and communication convergence engineering
    • /
    • 제21권4호
    • /
    • pp.287-293
    • /
    • 2023
  • With the rapid development of domestic and international over-the-top markets, a large amount of video content is being created. As the volume of video content increases, consumers tend to increasingly check data concerning the videos before watching them. To address this demand, video summaries in the form of plot descriptions, thumbnails, posters, and other formats are provided to consumers. This study proposes an approach that automatically generates posters to effectively convey video content while reducing the cost of video summarization. In the automatic generation of posters, face recognition and clustering are used to gather and classify character data, and keyframes from the video are extracted to learn the overall atmosphere of the video. This study used the facial data of the characters and keyframes as training data and employed technologies such as DreamBooth, a text-to-image generation model, to automatically generate video posters. This process significantly reduces the time and cost of video-poster production.

섭입경계에서의 마그마 형성에 대한 고등학교 「과학」 교과서 분석 (Analysis of High School 「science」 Textbook on the Magma Formation in the Subduction Boundary)

  • 박경은;안건상;임동일
    • 한국지구과학회지
    • /
    • 제25권4호
    • /
    • pp.222-231
    • /
    • 2004
  • 본 연구에서는 제7차 교육과정에 의해 편찬된 21종의 과학 교과서와 지도서에 나타난 섭입경계에서의 마그마 형성 관련 내용에 대한 본문 진술과 제시된 그림들을 분석하여 문제점을 지적하고 그 개선방안을 모색하였다. 분석 결과 교과서간 마그마의 정의에 일관성이 없었으며, 대부분의 교과서에서 마그마의 생성기원에 관한 과학적 개념 진술이 정확하지 않거나 기재되지 않았다. 또한 교과서에 제시된 그림들은 본문 내용과 일치하지 않았으며, 판구조론과 섭입경계에서의 화성활동에 대한 학생들의 과학적 개념형성에 부족하고 잘못된 내용을 포함하고 있다. 이들은 주로 마그마의 생성기작(형성과정), 기원물질, 생성위치와 관련된 것들로서, 본 연구에서는 최근에 발표된 연구결과들을 바탕으로 섭입경계에서 분출되는 대부분의 중성마그마가 쐐기맨틀의 부분용융에 의해 형성된다는 사실을 종합적으로 이해할 수 있는 적절한 개념도를 제시하였다.

근대건축의 역사 서술에 대한 비판적 검토 (A Critical Review on the Historiography of Modern Architecture)

  • 강혁
    • 건축역사연구
    • /
    • 제24권1호
    • /
    • pp.29-40
    • /
    • 2015
  • This study is on historiography of Modern Architecture since its beginning to present. As a critical review of the history of the writing history of Modern Architecture, this study tends to be a meta-history and criticism of historical text. This study try to analyse historiographical project of Modern architecture at specific phase since the beginning of modern architecture. The historiography of Modern architecture shows that writing a history is making a discourse of Modern architecture as a imaginative representation to define and justify Modernism in architecture. The analysis of canonic text since early 20th century proves that the history of writing history of Modern architecture played a critical role not only to shape of our ideal but the practice of architecture with a ideology construction in retrospect. With a name of truth or morality they made myths about the modernity in architecture. So we can find deep 'Hagelean Unconscious' in writing history of Modern architecture not even the first generation of historians but the second generation who were influenced by earlier writer in spite of their intention of revision and overcoming, which is in itself the key concept of Hegel's philosophy of History. Under this kind of 'operative' discourse our view point of Modern architecture were confined and the historiography of Modern architecture itself was narrowly defined as a kind of melodrama that a few architect and work of art matters. The rise of critical history fundamentally has changed the way of seeing and writing the history of Modern architecture. but it has also a new kind of dilemma as regard to writing history and involving practice. This review of historiography traces the texts of historians as like Pevsner, Giedion, Banham, Rowe, Tafuri, Frampton, and Curtis relating to different discours making. When we consider Benjamin's famous concept of constellation, writing history necessarily is a kind of montage making in time and we always need to recognize the historicity of historiography.