• Title/Summary/Keyword: 학술적 텍스트

Search Result 1,089, Processing Time 0.039 seconds

Hangeul Stem Extraction Algorithm for Text Mining Based on Natural Language Processing (자연어 처리 기반 텍스트 마이닝을 위한 한글 어간 추출 알고리즘)

  • Choi, Ki-won;Choi, Seong-hun;Jo, Sang-hyeon;Kim, Hee-cheol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.05a
    • /
    • pp.718-721
    • /
    • 2017
  • Natural language processing, which is the basis of text mining, differs depending on the type of language. Especially, Hangeul, which has relatively high freedom of expression compared to other languages, has various forms of words depending on the use of ending. The part that does not change in these various forms of words is called the stem. For effective text mining, it is essential to extract words and unify various types of words. Therefore, this paper proposes an extraction algorithm for Hangul word for effective text mining of Hangul document.

  • PDF

Applying Method WordNet for Concept based Image Retrieval system (개념 기반 이미지 검색 시스템을 위한 WordNet 적용 방안)

  • 조미영;최준호;김판구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.487-489
    • /
    • 2002
  • 기존의 키워드 기반 이미지 검색에서는 의미적 내용 인식을 위해 일반적으로 어휘적 정보나 텍스트 정보를 인간이 주석 형태로 달아주었다. 그러나 이런 텍스트 정보 기반 이미지 검색은 개념적 매칭이 아닌 스트링 매칭이므로 주석을 달아놓은 단어와 정확한 매칭이 없다면 찾을 수가 없다. 이러한 문제를 해결하기 위해 본 논문에서는 개념 기반 이미지 검색 시스템을 위한 WordNet의 적용 방안에 대해 연구했다. WordNet은 단언형이 아닌 단어의 의미 즉 synset이 구성 요소라는 특징을 이용해 각각의 이미지에 텍스트 정보 대신 적합한 개념의 Synset번호를 저장한다. 그리고 검색시 개념간의 유사성 측정을 이용해 검색어와 개념적으로 유사한 모든 이미지를 검색하도록 한다.

  • PDF

A study on the meaning and the structure of Documentary Photography : its focus on Steve Mcccury's works (다큐멘터리 사진의 의미구조와 이중적 텍스트 구조에 관한 연구 - 스티브 맥커리Steve Mcccury의 작품을 중심으로-)

  • Hham, Hyun
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.11b
    • /
    • pp.781-784
    • /
    • 2010
  • 본 논문은 다큐멘터리 사진의 의미구조와 특성을 스티브 맥커리(Steve Mcccury)의 작품을 통해서 사진이 내포하고 있는 의미구조와 텍스트의 이중적 구조의 전달 방식에 대한 특성을 살펴보고자 하였다. 다큐멘터리 사진이 갖고 있는 시각적 믿음의 생산에 따른 이미지의 진실성은 다양한 양식과 표현 기법을 통해서 전달되고 있는 점을 살펴볼 수 있다. 결국, 다큐멘터리 사진이 갖고 있는 우리 사회의 모습은 단순한 기록매체로의 수단이 아니라는 점을 인식하여야 할 것이다.

  • PDF

Design & Implemention of a Web Based Music Courseware for Using Flash (플래시를 이용한 웹 기반 악보제작 코스웨어의 설계 및 구현)

  • 이영경;우종정
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11b
    • /
    • pp.819-822
    • /
    • 2003
  • 인터넷 기술의 급격한 발달과 함께 인터넷은 교수-학습 도구로서의 중요한 역할을 하게 되었다. 타 교과 교육과 마찬가지로 음악교육에서도 중요성이 나날이 증가하고 있다. 음악교육이 의미 있게 이루어지기 위해서는 음악에 대한 기본 개념을 이해하고 이를 바탕으로 학생 스스로가 능동적으로 참여하는 활동이 필요하다. 본 연구에서는 기존의 교수방법에서 한 단계 발전하여 플래시를 활용한 교수 학습 모형을 제시하고자 한다. 텍스트와 플래시 애니메이션으로 구성된 학습내용은 아동의 적극적인 참여로 진행되도록 설계 구성하였으며 학습내용의 결과를 즉시 확인할 수 있어 텍스트위주로 학습할 때 보다 쉽게 이해할 수 있을 것이다. 플래시를 음악교과에 적극적으로 활용한다면 학습효과는 커질 것으로 예상한다.

  • PDF

A Study on Efficient Extraction of Text frame in MPEG News Video Images (MPEG 뉴스영상에서 효율적인 텍스트 프레임 추출에 관한 연구)

  • 정하영;황보택근
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.234-237
    • /
    • 2000
  • 멀티미디어 데이터를 다루는 기술이 급격하게 발전함에 따라 멀티미디어 데이터베이스를 운용함에 있어서 사용자의 효율적인 검색을 지원하기 위한 연구가 활발히 진행되고 있다. 본 논문에서는 MPEG으로로 압축된 뉴스 영상에서 내용기반 검색을 위한 효율적인 텍스트 프레임 추출방법을 제시한다. 제시하는 방법은 문자가 있는 프레임을 탐색하는 데 있어서 압축된 데이터에 최소한의 복호화만을 함으로써 탐색시간을 줄이고, 뉴스 영상에서의 문자의 특성을 고려하여 중복 추출을 줄이고 시간을 단축한다.

  • PDF

Dictionary Based Hyper e-Mail Document Generator (사전 기반의 하이퍼 e-Mail 문서 생성기)

  • 최지연;민수홍;조동섭
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.720-723
    • /
    • 2003
  • E-Mai1 서비스는 현재 가장 많이 쓰이는 WWW 시스템의 가장 기본적인 기능이다. 그러나 현 e-mai1 서비스는 텍스트 기반 구조를 통한 비동기적인 형태의 서비스를 계속 유지하고 있어, 동기적인 표현방법이 요구되는 실정이다 따라서 단순한 정보의 제공을 위한 서비스로서가 아니라, 사용자가 직접 설정하여 서비스를 받는 형태의 e-mai1 을 제안하고자 한다. 사용자가 지정해놓은 사전을 기반으로 HTML 문서가 재생산되어, 색 지정 기능과 하이퍼 텍스트 기능을 제공하는 한편, 사전에 등록된 정보를 바탕으로 개체에 대한 정보가 tooltip으로 표시될 수 있도록 하는 사전기반 하이퍼 문서 생성기능을 지원하도록 한다

  • PDF

Case Study on Public Document Classification System That Utilizes Text-Mining Technique in BigData Environment (빅데이터 환경에서 텍스트마이닝 기법을 활용한 공공문서 분류체계의 적용사례 연구)

  • Shim, Jang-sup;Lee, Kang-wook
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2015.10a
    • /
    • pp.1085-1089
    • /
    • 2015
  • Text-mining technique in the past had difficulty in realizing the analysis algorithm due to text complexity and degree of freedom that variables in the text have. Although the algorithm demanded lots of effort to get meaningful result, mechanical text analysis took more time than human text analysis. However, along with the development of hardware and analysis algorithm, big data technology has appeared. Thanks to big data technology, all the previously mentioned problems have been solved while analysis through text-mining is recognized to be valuable as well. However, applying text-mining to Korean text is still at the initial stage due to the linguistic domain characteristics that the Korean language has. If not only the data searching but also the analysis through text-mining is possible, saving the cost of human and material resources required for text analysis will lead efficient resource utilization in numerous public work fields. Thus, in this paper, we compare and evaluate the public document classification by handwork to public document classification where word frequency(TF-IDF) in a text-mining-based text and Cosine similarity between each document have been utilized in big data environment.

  • PDF

Automatic Pronunciation Generation System Using Minimum Morpheme Information (최소 형태소 정보를 이용한 자동 발음열 생성 시스템)

  • 김선희;안주은;김순협
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11a
    • /
    • pp.216-219
    • /
    • 2003
  • 본 논문은 최소한의 형태소 정보를 이용한 자동 발음열 생성 시스템을 제안한다 일반적으로 발음열 생성 시스템은 입력된 문장에 대하여 형태소 단위로 분석한 다음, 각 형태소와 형태소의 결함 관계를 고려한 음운 규칙을 적용함으로써 상응하는 발음열을 생성한다. 지금까지의 연구는 이러한 발음열 생성시의 형태소 분석에 관하여 그 범위에 관한 연구 없이, 가능한 최대한의 분석을 상정하고 있다. 본 논문은 한국어 음운현상을 체계적인 텍스트 분석을 통하여 모든 형태론적 음운론적인 환경에서 가능한 모든 음운현상을 분류하여 발음열 생성시에 실제로 필요한 형태소 분석의 범위를 규명하는 것을 그 목적으로 한다. 음운 현상을 분석하기 위해 사용한 텍스트 자료로는 어휘가 중복되지 않으면서도 많은 종류의 어휘가 수록된 5만 여 어휘의 연세한국어사전과 2200 여 개의 어미와 조사를 수록한 어미조사사전을 이용하였다. 이와 같이 텍스트를 분석한 결과, 음운현상은 규칙적인 음운 현상과 불규칙적인 음운현상으로 나뉘는데, 이 가운데 형태소 정보가 필요한 형태음운규칙으로는 두 가지가 있으며, 이러한 형태음운규칙을 위한 형태소 분석의 범위로는 세세한 분류를 필요로 하지 않는 최소한의 정보로 가능함을 보인다. 이러한 체계적인 분석을 기반으로 제안하는 자동 발음열 생성 시스템은 형태음운규칙과 예외규칙, 그리고 일반음운 규칙으로 구성된다. 본 시스템에 대한 성능 실험은 PBS 1637 어절과 ETRI 텍스트 DB 19만 여 어절을 이용하여 99.9%의 성능결과를 얻었다.

  • PDF

한국의 벤처 캐피탈 연구 10년, 성과 그리고 과제

  • Kim, Tae-Gyeong
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2020.06a
    • /
    • pp.31-37
    • /
    • 2020
  • 높은 위험을 안고 사업을 하는 벤처 기업은 자금 조달이 쉽지 않다. 벤처 캐피탈은 벤처의 재정적 필요를 해결하고 부족한 역량을 보충함으로써 벤처의 성공을 돕고 고위험 고수익의 벤처 생태계를 지탱하는 중요한 역할을 담당한다. 국내 벤처 캐피탈의 성장과 지속적인 관심에도 불구하고 학문적 성과가 충분히 축적되고 있는지는 의문이다. 이에 따라 본 연구는 2011년부터 2019년까지 벤처창업을 주제로 한 연구의 주요 흐름을 텍스트 마이닝 방법을 통해 고찰함으로써 문제를 진단하고 시사점을 도출하고자 한다. KCI 키워드 트렌드와 벤처 캐피탈의 성장에 관한 시계열 상관분석의 결과 학술적 성과가 벤처 캐피탈의 성장 추이를 따라가지 못하는 것으로 보인다. 또한 벤처창업연구의 주제 흐름을 바이그램과 TF-IDF로 관찰한 결과 2016 이후 창업 기업에 대한 연구 관심이 두드러지고 2019년에 들어 벤처 캐피탈에 관한 연구 커뮤니티의 관심이 높아진 것으로 나타났다. 본 연구의 결과는 벤처 캐피탈에 관한 주요 연구 토픽을 보다 더 적극적으로 발굴하고 탐구함으로써 연구 커뮤니티의 책무를 강화하고 한국의 벤처 캐피탈 성장과 그에 따른 이슈들을 논의할 이론적 기틀 마련이 필요함을 환기한다.

  • PDF

A Development of XML-Based ]Repository Management System for a thesis database (XML 기반 학술지 데이터베이스 저장관리시스템의 개발)

  • 조남선;김우성;서인홍
    • Proceedings of the KAIS Fall Conference
    • /
    • 2001.05a
    • /
    • pp.330-333
    • /
    • 2001
  • 학술지 데이터 베이스 구축에 있어서 가장 주요한 문제점온 기존 문헌의 디지털화이다. 기존 문헌을 디지털화함에 있어서 택할 수 있는 방법은 문서 인식기(OCR)를 통한 자동인식과 수작업을 통해서 컴퓨터로 입력하는 방법이 있다. 전자의 방법은 현재의 한글 문서 인식기술로 볼 때 인식률이 저조하고, 인식기를 통한 자동인식에서 발생된 오류를 수정하는 비용이 수작업으로 입력하는 비용에 비해 더 크다고 판단된다. 따라서 자료의 입력은 수작업으로 하는 것이 효율적이다 학술지 데이터 베이스들 구축하고 이를 서비스하기 위해 서는 입력된 텍스트 데이터를 표준화하여 구조적으로 변환/편집해야 한다. 이는 구조문서 표준이라 할 수 있는 XML의 이용이 필요하다는 말이기도 할 것이다. 또한 디지털화 된 문서를 효율적으로 활용하고 관리하기 위해서는 비쥬얼한 구조문서 저장 관리기가 필요하다. 본 논문에서는 디지털화 된 텍스트를 구조적인 XML문서로 변환하여 효과적으로 저장 관리 할 수 있는 저장관리기를 설계하고 개발하였다.