• 제목/요약/키워드: 내포된 문서

검색결과 55건 처리시간 0.025초

내포된 공노드를 포함하는 RDF 문서의 변경 탐지 기법 (A Change Detection Technique Supporting Nested Blank Nodes of RDF Documents)

  • 이동희;임동혁;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권6호
    • /
    • pp.518-527
    • /
    • 2007
  • RDF 문서들은 빈번히 갱신이 발생하므로 RDF 문서간의 변경부분을 찾아내는 것은 중요한 관심사가 된다. RDF 문서 내에 공노드가 존재할 경우 변경부분을 탐지해내려면 공노드간의 매칭을 지원하는 기법이 필요하다. RDF 문서에서 공노드는 내포된 형태로 존재하며 실제 사용되는 RDF 문서 대부분이 공노드를 포함하고 있다. RDF 문서를 그래프로 모델링하면 하나의 문서는 여러 개의 트리로 나누어진다. 따라서 문서간의 변경탐지는 동일한 루트를 가지는 트리간의 최소 비용 매칭 문제로 생각할 수 있다. 본 논문에서는 공노드에 대한 레이블링 기법을 기용하여 내포된 공노드를 포함한 RDF문서의 변경탐지 기법을 제안한다. 또한 공노드가 아닌 일반 트리플들의 비교에 있어서도 효율성을 높이는 술어 그룹화와 분할 기법을 제안한다. 실험을 통해 제안한 기법이 기존의 방법보다 더 정확하며 효율적임을 보였다.

감정 자질을 이용한 한국어 문장 및 문서 감정 분류 시스템 (A Korean Sentence and Document Sentiment Classification System Using Sentiment Features)

  • 황재원;고영중
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권3호
    • /
    • pp.336-340
    • /
    • 2008
  • 최근 감정 분류에 대한 관심이 높아져 연구가 활발히 진행되고 있다. 문서 전체에 관한 감정의 분류도 중요하지만, 문서를 이루고 있는 문장에 관한 분류도 점차 그 필요성이 높아지고 있다. 본 논문에서는 한국어 감정 분류 시스템 구축을 위해서 추출된 한국어 감정 자질을 이용한 한국어 문장 및 문서 감정 분류에 관해 연구한다. 한국어 감정 분류의 시작은 감정을 내포한 대표적인 어휘로부터 시작하며, 이와 같은 감정 자질들은 문장 및 문서의 감정을 분류하는데 결정적인 관여를 한다. 한국어 감정 자질의 추출을 위하여 영어 단어 시소러스 정보를 이용하여 자질들을 확장하고, 영한사전을 통해 확장된 자질들을 번역함으로써 감정 자질들을 추출하였다. 추출된 감정 자질들을 사용하여, 단어 벡터로 표현된 입력문서를 이진 분류기인 지지벡터 기계(SVM: Support Vector Machine)를 이용하여 문장과 문서에 내포된 감정을 판단하고 평가하였다.

유사성 기반 XML 문서 분석 기법 (XML Document Analysis based on Similarity)

  • 이정원;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.367-376
    • /
    • 2002
  • XML 문서가 가지고 있는 태그의 자유로운 정의와 내포된 구조 정보는 정보 검색 및 문서 관리 분야에 많은 이점을 제공할 수 있다. 본 논문은 XML 요소(element)의 의미와 구조 정보를 반영한 문서간의 유사성을 검사할 수 있는 XML 문서 분석 기법을 제시하고자 한다. 도출된 문서간 유사성은 많은 정보 검색 및 마이닝 등의 기초 자료로 사용될 수 있다. 먼저 XML 요소를 시소러스를 이용하여 유사어와 합성어로 구성된 확장-요소 벡터로 확장하고 유사 행렬을 구축하여 요소간 유사성을 판별한다. 또한 오토마타(NFA(Nondeterministic Finite Automata)와 DFA(Deterministic Finite Automata)(를 이용하여 XML 문서의 내포된 구조를 발견하고 최소화 한다. 요소간의 유사 행렬과 최소화된 XML 구조를 이용하여 구조간의 유사성을 판별한다. 본 논문의 XML의 의미를 반영한 유사성 분석 기법은 온라인 서점의 실제 문서의 카테고리를 인식하는 데 있어 100% 정확도를 보였다.

XML 기반 가상문서에서의 멀티미디어 및 구조적 문서의 표현과 처리 (Representing and Processing Multimedia and Structured Documents For XML-Based Virtual Documents)

  • 박천수;임동수;박종현;강민구;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.246-248
    • /
    • 2000
  • 가상문서는 웹 상에 존재하는 내용 중에서 원하는 부분만을 링크를 이용해 새로운 문서를 생성하는 개념이다. 본 논문에서는 가상문서를 지원하는 디지털 도서관 시스템에서 텍스트, 이미지 데이터뿐 아니라 멀티미디어 데이터와 구조적 의미를 갖는 데이터를 처리 가능하도록 DTD의 표기법을 확장하였다. 또한, 저작도구에서 생성된 내포링크, 참조링크, 총칭링크 등 다양한 의미의 가상무서를 브라우징 가능하도록 문서 변환기에서 멀티미디어와 구조적 문서를 처리하기 위한 방법을 제시하였다.

  • PDF

능동문서에 대한 새로운 접근법과 그 응용 (A New Approach to Active Documents and its Application)

  • 남철기;배재학;장길상
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.347-357
    • /
    • 2003
  • 웹은 중요한 정보인천이며, 대부분의 웹 응용프로그램은 HTML 작성된 서식문서를 기반으로 한다. 이러한 HTML 기반의 서식문서는 사용자 인터페이스를 제공하는 역할을 할 뿐, 문서서식 설계자가 지향하는 업무처리 절차나 로직을 내포하지는 않는다 그러나 서식문서에는 그것에 대한 처리방법이 함축되어 있고. 이렇게 내재된 전차적 지신을 업무치리 과정의 자동화에 적극적으로 활용할 수 있다. 이에, 본 논문에서는 서신문서에 기반한 업무치리 전차를 자동화시키기 위해 인지과학적인 측면에서 문서의 능동성을 파악하였나. 이를 통해 능동문서(Active Documents)에 대한 새로운 개념과 그 적용 가능성을 제시하고자 한다. 이 능동문서는 문서에 함축되어 있는 업무규칙과 문서처리의 자동화를 지원하기 위한 선언적 지식을 문서 사제에 내포하고 있다. 또한, 본 논문에서는 제시된 능동문서를 처리하기 위한 프레임워크를 제안한다. 제안된 프레임워크는 크게 생성단계와 실행단계로 구성된다. 본 논문에서 제안한 프레임워크의 유용성을 보이기 위해, 인터넷 구매 시스템의 구매 요청서 처리에 능동문서를 적용한 ActiveForm이라는 원형시스템을 설계하고 구현하였다. 그 결과, 본 논문은 서식설계자의 지식이 Prolog로 명시적으로 표현되어 있는 능동문서를 추론엔진에서 처리함으로써 인터넷 응용프로그램의 지능화에 기여할 수 있음을 확인하였다.

시급한 전자문서의 개념통일과 법적효력인정

  • 신동진
    • 정보화사회
    • /
    • 통권100호
    • /
    • pp.23-27
    • /
    • 1996
  • 컴퓨터의 발명은 인간의 사회생활을 혁신적으로 변화시켰다. 이러한 변화의 특징은 한마디로 정보화사회 또는 정보사회란 말로 표현되고 있다. 정보사회가 내포하는 의미는 수 없이 다양하지만 그 중에서 인류 문명의 계속적인 발전을 뒷받침해 온 기록방식 또는 문서화 방식의 혁신을 빠뜨릴 수 없다. 전통적으로 인간의 문서활동은 종이 위에 문자를 사용해서 자신의 의사를 표현하였고, 이러한 기록은 문서로 남아 차후 분쟁이 발생할 경우 증거로서의 기능을 발휘하였다.

  • PDF

전문용어 및 정보추출에 기반한 문서분류시스템 (Text Categorization Based on Terminology and Information Extraction)

  • 이경순;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 1999
  • 본 연구에서는 문서분류시스템에서 자질의 표현으로 전문분야사전을 이용한 분야정보와 개체정보추출을 통한 개체정보를 이용한다. 또한 지식정보를 보완하기 위해 통계적인 방법으로 범주 전문용어를 인식하여 자질로 표현하는 방법을 제안한다. 문서에 나타난 용어들이 어떤 특정 전문분야에 속하는 용어들이 많이 나타나는 경우 그 문서는 용어들이 속한 분야의 문서일 가능성이 높다. 또한, 정보추출을 통해 용어가 어떠한 개체를 나타내는지를 인식하여 문서를 표현함으로써 문서가 내포하는 의미를 보다 잘 반영할 수 있게 된다. 분야정보나 개체정보를 알 수 없는 용어에 대해서는 학습문서로부터 전문분야를 자동 인식함으로써 문서표현의 지식정보를 보완한다. 전문분야, 개체정보 및 범주전문용어에 기반해서 표현된 문서의 자질에 대해서 지지벡터기계 학습에 기반한 문서분류기틀 이용하여 각 범주에 대해 이진분류를 하였다. 제안된 문서자질표현은 용어기반의 자질표현에 비해 좋은 성능을 보이고 있다.

  • PDF

XML 기반 가상문서의 브라우징을 위한 문서 처리 (Document Processing for Browsing XML-Based Virtual Documents)

  • 양중식;임동수;강지훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.234-239
    • /
    • 2000
  • XML을 기반으로 하는 가상문서는 인터넷 상의 정보 공유를 가능하게 하여 새로운 지식을 생성할 수 있도록 한다. 본 논문에서는 가상문서를 지원하는 디지털도서관 시스템에서 XML로 표현된 가상문서를 효과적으로 처리하도록 하는 문서처리기를 설계 구현하였다. 클라이언트의 요청에 따라 문서 처리 시스템은 가상문서를 클라이언트 브라우저에서 볼 수 있는 형태로 변환하여 전달한다. 그러므로 가장 중요한 기능은 내포링크, 참조링크, 총칭링크 등 다양한 의미의 링크들을 포함하는 가상문서를, 변환을 통하여 클라이언트에게 정확하게 전달하는 것이다. 부가적인 기능으로 우리의 디지털도서관 시스템의 다른 구성 요소인 저장 서버, 검색 서버, 링크 서버, 이름 서비스 등을 지원한다.

  • PDF

응답시간 향상을 위한 커넥션 스케줄링 기법 (Connection Scheduling for Improving the Response Time)

  • 방지호;하란
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권1_2호
    • /
    • pp.69-78
    • /
    • 2006
  • 웹서버가 클라이언트들의 요청을 처리하는 방법은 요청된 문서의 크기를 고려한 스케줄링 기법과 요청된 문서의 크기를 고려하지 않는 스케줄링 기법으로 구분할 수 있다. 웹 문서의 크기를 고려한 스케줄링 기법은 크기를 고려하지 않은 스케줄링 기법 보다 평균 응답시간이 우수하다. 크기기반의 스케줄링 기법인 SRPT(Shortest Remaining Processing Time first)는 웹 문서의 크기를 고려한 대표적인 스케줄링 기법으로 대부분의 연구들이 SRPT 스케줄링 기법을 기반으로 하고 있다. 그러나, 기존 연구들 대부분은 HTTP/1.0 기반으로 클라이언트들이 각각의 커넥션을 통해 HTML 문서에 포함된 다수의 문서들을 동시에 요청할 수 있는 HTTP/1.1 프로토콜의 특성을 고려하지 않았다. 본 논문은 HTTP/1.1 프로토콜을 기반에서 스케줄링 윈도우를 사용하여 커넥션의 전체 응답시간을 향상시키는 커넥션 스케줄링 기법을 제시하고, 성능분석을 통해 제안한 커넥션 스케줄링 기법의 커넥션 응답시간이 SRPT를 이용한 커넥션스케줄링보다 $10\%$ 정도 향상됨을 보인다.

동적 구문지향 SGML 문서편집기 (Dynamic Syntax-Directed SGML Document Editor)

  • 강춘길;신경희;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.71-73
    • /
    • 2000
  • 본 논문에서 다루는 SGML 문서편집기는 파서를 내포하는 구조로서, 문서편집을 위하여 DTD 가 입력되고, 입력된 DTD 는 DTD 파서에 의해 적합성을 점검하게 된다. DTD 파서는 표준규칙에 따라 DTD를 파싱하고, 결과를 편집처리에 적합한 BNF-스타일 형태로 변환된 문법 테이블을 생성한다. SGML 문서 편집은 문법테이블 정보에 따라 처리된다. 문법 테이블의 크기는 엘리먼트 선언내용 중 컨텐트 모델의 표현에 따라 결정된다. 그 중 and(&) 접속자는 엘리먼트 개수에 따라 문법수가 기하급수적으로 증가하므로 DTD 파서에 의해 처리된다면 속도나 비용면에서 비효율적이다. 이에 본 논문에서는 고정된 문법테이블을 이용하는 SGML 편집기에 and 접속자로 표현된 엘리먼트 문법을 동적으로 확정 처리할 수 있는 기능이 추가 향상된 구문지향적 SGML 문서편집기를 제시한다. 그러므로 향상된 구문지향 SGML 문서편집기는 고정된 문법을 이용한 문서편집 뿐 아니라 편집처리에 따른 변환에 능동적으로 처리할 수 있다는 특징을 갖게된다.

  • PDF