• Title/Summary/Keyword: 학술적 텍스트

Search Result 1,089, Processing Time 0.043 seconds

XML Document Editing System for Structural Processing of the Digital Document to Including Mathematical Formula (수식을 포함한 전자문헌의 구조적 처리를 위한 XML 문서편집시스템)

  • 윤화묵;유범종;김창수;정회경
    • Journal of the Korean Society for information Management
    • /
    • v.19 no.4
    • /
    • pp.96-111
    • /
    • 2002
  • A lot of accumulated data of many quantity exist within a institution or an organization, but most data is remained in form of standardization as each institution or organization. There are difficulty in exchange and share of information. New concept of knowledge information resource management to overcome this disadvantage was introduced, and the digitization of knowledge information resources to share and manage accumulated data is been doing. Specially, in science technic or education scholarship it, the tendency that importing XML to process necessary data to exchange and share of knowledge information resources structurally, and limitation of back for search and indexing or reusability is happened according as expression of great many mathematics used inside electron document of these sphere is processed to nonstructural data of image or text and so on. There is interest converged in processing of mathematics that use MathML to overcome this, and we require the solution to be able to process MathML easily and efficiently on structural document. In this paper, designed and implemented of XML document editing system which easy structural process of electronic document for knowledge information resources, and create and express MathML easily on structural document without expert knowledge about MathML.

An Extension to Music Player MAF and Implementation of its Player and Authoring tool (Music Player MAF 의 확장 포맷 연구 및 XMT를 이용한 저작 툴 개발)

  • Yang, Chan-Suk;Lim, Jeong-Yeon;Kim, Mun-Churl
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.413-418
    • /
    • 2006
  • 개인용 미디어 단말로서 MP3 플레이어는 이제 음악 파일을 감상하기 위한 일상 생활에서 중요한 휴대 필수품이 되었으며 단순히 음악을 재생하는데 그치지 않고, 각종 정보들을 표시하기 위한 작은 화면이 부착되고 있으며 더 나아가 이미지 정보나 동영상을 표현할 수 있는 기능들이 추가 되고 있다. 이처럼 변화하는 멀티미디어 서비스에 발맞추어 MPEG 에서는 Multimedia Application Format (MAF) (ISO/IEC 23000) 라는 새로운 표준안을 제안하였다. MAF 표준안의 기본 방식은 산업 현장 및 사용자의 요구에 빠르게 부응하기 위해, 기존에 존재하는 표준안들을 결합시켜 새로운 멀티미디어 파일 포맷을 정립하였다. 그 첫 번째 결과물로서, 이미 널리 쓰이고 있는 MP3 파일 포맷에 새로운 기능을 추가하기 위한 Music Player MAF 포맷의 FDIS 가 제안되었다. Music Player MAF 는 MPEG-1 Audio Layer III(MP3) 와 MPEG-7 MDS 메타데이터 정보를 결합한 파일 포맷으로. 기존 ID3 태그에서 표현되는 정보 보다 훨씬 풍부한 메타데이터 정보와 더불어 선택적으로 하나의 JPEG 이미지를 포함한 형태로 이루어져 있다. 그러나, 현재의 파일 포맷은 시간이 고려되지 않은 하나의 JPEG 이미지만을 포함할 수 있기 때문에, 오늘날 사용자가 요구하는 다양한 멀티미디어 서비스를 제공하기에는 많은 한계점을 갖고 있다. 본 논문에서는 Music Player MAF FDIS 에 제안된 세가지 형태의 Music Player MAF 파일 포맷에 관해 기술 한다. 복수의 JPEG 이미지 및 텍스트를 저장하기 위하여 각각의 파일 포맷이 갖는 문제점을 언급하고 하나 이상의 JPEG 이미지와 자막 정보를 MP3 음악 정보와 동기화 시켜 추가 할 수 있는 기능을 추가를 제안한다. 또한 제안된 파일 포맷을 쉽게 생성할 수 있도록 기존의 XMT-O 스키마를 기반으로 MAF 를 위하여 새롭게 MAF XMT 스키마를 정의하고 정의된 스키마를 기반으로 구현된 Music Player MAF 의 저작툴과 제안된 확장 뮤직 플래이어 MAF 을 위한 재생툴을 구현한다.

  • PDF

Natural Language based Video Retrieval System with Event Analysis of Multi-camera Image Sequence in Office Environment (사무실 환경 내 다중카메라 영상의 이벤트분석을 통한 자연어 기반 동영상 검색시스템)

  • Lim, Soo-Jung;Hong, Jin-Hyuk;Cho, Sung-Bae
    • 한국HCI학회:학술대회논문집
    • /
    • 2008.02a
    • /
    • pp.384-389
    • /
    • 2008
  • Recently, the necessity of systems which effectively store and retrieve video data has increased. Conventional video retrieval systems retrieve data using menus or text based keywords. Due to the lack of information, many video clips are simultaneously searched, and the user must have a certain level of knowledge to utilize the system. In this paper, we suggest a natural language based conversational video retrieval system that reflects users' intentions and includes more information than keyword based queries. This system can also retrieve from events or people to their movements. First, an event database is constructed based on meta-data which are generated by domain analysis for collected video in an office environment. Then, a script database is also constructed based on the query pre-processing and analysis. From that, a method to retrieve a video through a matching technique between natural language queries and answers is suggested and validated through performance and process evaluation for 10 users The natural language based retrieval system has shown its better efficiency in performance and user satisfaction than the menu based retrieval system.

  • PDF

Implementation of Anti-Porn Spam System based on Hyperlink Analysis Technique's of the Web Robot Agent (웹 로봇 에이전트의 하이퍼링크 분석기법을 이용한 음란메일 차단 시스템의 구현)

  • Lee, Seung-Man;Jung, Hui-Sok;Han, Sang;Song, Woo-Seok;Lee, Do-Han;Hong, Ji-Young;Ban, Eui-Hwan;Yang, Joon-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.332-335
    • /
    • 2007
  • 이메일은 누구나 쉽게 정보를 교환할 수 있는 편리함 때문에 인터넷에서 가장 중요한 수단으로 사용되고 있다. 그러나 순수한 의사소통의 수단이 아닌 스팸메일의 범람은 성인뿐만 아니라, 어린이 청소년에게도 무차별적으로 전송됨으로써 심각한 부작용을 낳고 있다. 본 논문은 점차 지능화 되는 신 유형의 음란 스팸메일로부터 청소년을 보호하기 위하여 새로운 방법의 음란메일 차단시스템을 제안하고자 한다. 기존의 스팸메일 차단시스템은 사용자가 직접 음란한 메일이라고 판단되는 메일에 대해 일일이 키워드를 설정하거나, 메일 내용 중에 텍스트만을 추출하여 패턴 매칭방법으로 분류하는 것이 대부분이었지만, 본 논문은 기존 방법의 문제점을 해결하기 위하여 이미지 내 Skin-Color분포의 Human Detection 알고리즘과 웹 로봇 에이전트의 하이퍼링크 분석기법을 사용하였다. 성능 측정결과, 형태소 분석과 Human Detection 알고리즘을 병합하여 적용한 경우 성능 측정에서 90% 정도의 F-measure를 보였지만, 추가적으로 웹 로봇 에이전트의 하이퍼링크 분석기법을 병합하여 적용한 경우 97% 이상의 F-measure를 보이며, 신뢰성이 높은 음란스팸메일 차단 시스템을 구현할 수 있다는 것을 증명하였다.

  • PDF

The Algorithm For Spatial XQuery2SQL Converter (Spatial XQuery2SQL Converter를 위한 알고리즘)

  • Choi, Young Nn;Seo, Hyun-Ho
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2004.11a
    • /
    • pp.442-447
    • /
    • 2004
  • XML is normalized text form that is designed to transmit structured document in web as that propose in W3C (World Wide Web Consortium) in 1996. Function that this can overcome HTML's limit that use in existing in Internet and user define new tag to HTML by way to solve SGML's complexity added. There is many efforts to use storing this XML document in RDBMS but to relation style DB because XML document is tree structure structurally data SQL and perfect disaster caused by things that is language to ask a question accomplish XQuery that so it is W3C's XML standard query appear. After store XML informations including space information to RDBMS in this paper, Spatial XQuery through converter that is Sqatial XQuery2SQL through Spatial operator, Spatial function SQL of by Sqatial XQuery2SQL conversion algorithm that draw information in RDBMS after change embody wish to.

  • PDF

A development on Ontology Instance Management Tool (온톨로지 인스턴스 생성 지원 도구 개발)

  • Lee, Mikyoung;Jung, Hanmin;Kim, Mun Seok;Sung, Won-Kyung
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2007.11a
    • /
    • pp.386-390
    • /
    • 2007
  • In this paper we present an Ontology Instance Management Tool. OntoManager is a user-friendly interactive ontology Instance management tool with webpage annotation tool and an image annotation tool. It supports the user with the task of creating and maintaining ontology-based OWL-markup, creating of OWL-instances, attributes and relationships. It include an ontology browser for the exploration of the ontology and instances and a HTML browser that will display the annotated parts of the text. And OntoManager is an image annotation tool that allows users to markup regions of an image with respect to concepts in an ontology. It provides the functionality to import images, ontologies, instance bases, perform markup, and export the resulting annotations to disk or the Web.

  • PDF

A Fast XML Encoding System for Fast Web Services (Fast 웹서비스를 위한 Fast XML 인코딩 시스템)

  • Kim, Jong-Moon;Yu, Lei;Hong, Xian-Yu;Choi, Bong-Kyu;Jung, Hoe-Kyung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.06a
    • /
    • pp.865-868
    • /
    • 2007
  • Web service in operating environment independent XML about under using, It dose so, Integration of the platform for it is different each other possibly it is doing. But XML in order to have the text data which is unnecessary plentifully with wireless Internet or the mobile communication modem in together relatively will connect frequently slow communication medium and there is a problem point which decreases the case prerequisite efficiency which the resources will use from the limited small-sized machinery and tools. Hereupon XML about under make binary the standard which reduces the size of the document from ITU-T and ISO/IEC it was under proposing with commonness, currently binary XML encoding where it is in the process of advancing standard there are Fast Infoset and Fast Schema. In this paper, implementation of Fast XML encoding system through introduction Fast Infoset algorithm and Fast Schema algorithm for web services increase performance.

  • PDF

Competitor Extraction based on Machine Learning Methods (기계학습 기반 경쟁자 자동추출 방법)

  • Lee, Chung-Hee;Kim, Hyun-Jin;Ryu, Pum-Mo;Kim, Hyun-Ki;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.107-112
    • /
    • 2012
  • 본 논문은 일반 텍스트에 나타나는 경쟁 관계에 있는 고유명사들을 경쟁자로 자동 추출하는 방법에 대한 것으로, 규칙 기반 방법과 기계 학습 기반 방법을 모두 제안하고 비교하였다. 제안한 시스템은 뉴스 기사를 대상으로 하였고, 문장에 경쟁관계를 나타내는 명확한 정보가 있는 경우에만 추출하는 것을 목표로 하였다. 규칙기반 경쟁어 추출 시스템은 2개의 고유명사가 경쟁관계임을 나타내는 단서단어에 기반해서 경쟁어를 추출하는 시스템이며, 경쟁표현 단서단어는 620개가 수집되어 사용됐다. 기계학습 기반 경쟁어 추출시스템은 경쟁어 추출을 경쟁어 후보에 대한 경쟁여부의 바이너리 분류 문제로 접근하였다. 분류 알고리즘은 Support Vector Machines을 사용하였고, 경쟁어 주변 문맥 정보를 대표할 수 있는 언어 독립적 5개 자질에 기반해서 모델을 학습하였다. 성능평가를 위해서 이슈화되고 있는 핫키워드 54개에 대해서 623개의 경쟁어를 뉴스 기사로부터 수집해서 평가셋을 구축하였다. 비교 평가를 위해서 기준시스템으로 연관어에 기반해서 경쟁어를 추출하는 시스템을 구현하였고, Recall/Precision/F1 성능으로 0.119/0.214/0.153을 얻었다. 제안 시스템의 실험 결과로 규칙기반 시스템은 0.793/0.207/0.328 성능을 보였고, 기계 학습기반 시스템은 0.578/0.730/0.645 성능을 보였다. Recall 성능은 규칙기반 시스템이 0.793으로 가장 좋았고, 기준시스템에 비해서 67.4%의 성능 향상이 있었다. Precision과 F1 성능은 기계학습기반 시스템이 0.730과 0.645로 가장 좋았고, 기준시스템에 비해서 각각 61.6%, 49.2%의 성능향상이 있었다. 기준시스템에 비해서 제안한 시스템이 Recall, Precision, F1 성능이 모두 대폭적으로 향상되었으므로 제안한 방법이 효과적임을 알 수 있다.

  • PDF

Study on Research Trends in Airline Industry using Keyword Network Analysis: Focused on the Journal Articles in Scopus (키워드 네트워크를 이용한 항공관련 글로벌 연구동향 분석: 스코퍼스(Scopus)게재 논문을 중심으로)

  • Lee, Ju-Yang;Jang, Phil-Sik
    • Journal of the Korea Convergence Society
    • /
    • v.8 no.5
    • /
    • pp.169-178
    • /
    • 2017
  • In various research fields, it is important to identify the trends and meaningful patterns in large volumes of text data. We examined the research trends and patterns in global journal articles related to aviation and airlines from 1997 to 2016 using keyword network analysis. Keyword network models were constructed, and centrality (degree and betweenness) analysis was performed using 25,959 articles from the Scopus database. The results suggested that the recent research trends in aviation and airlines could be quantitatively described through keyword network analysis. The engineering and social science fields were the most relevant fields with keywords related to aviation and airlines. In addition, it was shown that betweenness centrality increased with the degree centrality of keywords. The results of this study could be applied to establish policies and suggest further research topics in the field of aviation and airlines based on empirical data.

Recognition of Korean Implicit Citation Sentences Using Machine Learning with Lexical Features (어휘 자질 기반 기계 학습을 사용한 한국어 암묵 인용문 인식)

  • Kang, In-Su
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.16 no.8
    • /
    • pp.5565-5570
    • /
    • 2015
  • Implicit citation sentence recognition is to locate citation sentences which lacks explicit citation markers, from articles' full-text. State-of-the-art approaches exploit word ngrams, clue words, researcher's surnames, mentions of previous methods, and distance relative to nearest explicit citation sentences, etc., reaching over 50% performance. However, most previous works have been conducted on English. As for Korean, a rule-based method using positive/negative clue patterns was reported to attain the performance of 42%, requiring further improvement. This study attempted to learn to recognize implicit citation sentences from Korean literatures' full-text using Korean lexical features. Different lexical feature units such as Eojeol, morpheme, and Eumjeol were evaluated to determine proper lexical features for Korean implicit citation sentence recognition. In addition, lexical features were combined with the position features representing backward/forward proximities to explicit citation sentences, improving the performance up to over 50%.