• Title/Summary/Keyword: 정보 단위

Search Result 5,293, Processing Time 0.03 seconds

A Text Reuse Measuring Model Using Circumference Sentence Similarity (주변 문장 유사도를 이용한 문서 재사용 측정 모델)

  • Choi, Sung-Won;Kim, Sang-Bum;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.179-183
    • /
    • 2005
  • 기존의 문서 재사용 탐지 모델은 문서 혹은 문장 단위로 그 내부의 단어 혹은 n-gram을 비교를 통해 문장의 재사용을 판별하였다. 그렇지만 문서 단위의 재사용 검사는 다른 문서의 일부분을 재사용하는 경우에 대해서는 문서 내에 문서 재사용이 이루어지지 않은 부분에 의해서 그 재사용 측정값이 낮아지게 되어 오류가 발생할 수 있는 가능성이 높아진다. 반면에 문장 단위의 문서 재사용 검사는 비교문서 내의 문장들에 대한 비교를 수행하게 되므로, 문서의 일부분에 대해 재사용물 수행한 경우에도 그 재사용된 부분 내의 문장들에 대한 비교를 수행하는 것이므로 문서 단위의 재사용에 비해 그런 경우에 더 견고하게 작동된다. 그렇지만, 문장 단위의 비교는 문서에 비해 짧은 문장을 단위로 하기 때문에 그 신뢰도에 문제가 발생하게 된다. 본 논문에서는 이런 문장단위 비교의 단점을 보완하기 위해 문장 단위의 문서 재사용 검사를 수행 후, 문장의 주변 문장의 재사용 검사 결과를 이용하여 문장 단위 재사용 검사에서 일어나는 오류를 감소시키고자 하였다.

  • PDF

A Study on Improvement of NCS Duty Components in 'Library and Information Management' by Evaluation of the Importance and Utilization (NCS '문헌정보관리' 직무 구성요소의 중요도 및 활용도 평가를 통한 개선방안 연구)

  • Cha, Sung-Jong
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.50 no.3
    • /
    • pp.215-247
    • /
    • 2016
  • This study was performed in order to derive components that librarians think preferentially necessary and realistically important when applying the NCS 'Library and Information Administration's duty' to the library working environments. It was possible by evaluating and analyzing the importance and utilization of ability unit and its element which are the components of NCS 'Library and Information Administration's duty'. First, ability units of 'User Information Services', 'Reading and Culture Programs' were higher in importance and utilization at the same time. Ability units of 'Library and Information Practical Research Perform', 'Library and Information Curation', 'Library and Information System Operation' were lower in importance and utilization when we evaluate the importance and utilization of ability unit and its element which are the components of NCS 'Library and Information Administration's duty'. Second, components of 'Reading and Culture Programs', 'User Information Service', 'Library and Information Collection' were higher in the order, and components of 'Library and Information Curation', 'Library and Information System Operation', 'Library and Information Practical Research Perform' were found lower in demands as the desirable level and the current level appear less common when we analyzed the demands on the duty components utilizing Borich requirements analysis model. Third, six ability units of 'Reading and Culture Programs', 'User Information Services', 'Library and Information Collection', 'Library and Information Services Marketing', 'Library and Information Preservation', 'Library and Information Use Analysis' were derived as priority components when we analyzed the priority of the duty component (ability unit) utilizing The Locus for Focus model.

KACTEIL-NER: Named Entity Recognizer Using Deep Learning and Ensemble Technique (KACTEIL-NER: 딥러닝과 앙상블 기법을 이용한 개체명 인식기)

  • Park, Geonwoo;Park, Seongsik;Jang, Yoengjin;Choi, Kihyoen;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.324-326
    • /
    • 2017
  • 개체명 인식은 입력 문장에서 인명, 지명, 기관명, 날짜, 시간 등과 같은 고유한 의미를 갖는 단어 열을 찾아 범주를 부착하는 기술이다. 기존의 연구에서는 단어 단위나 음절 단위를 입력으로 사용하였다. 하지만 단어 단위의 경우 미등록어 처리가 어려우며 음절 단위의 경우 단어 고유의 의미가 희석되는 문제가 발생한다. 이러한 문제들을 해결하기 위해 본 논문에서는 형태소 단위 개체명 인식기와 음절 단위 개체명 인식기를 앙상블하여 보정된 결과를 예측하는 개체명 인식기를 제안한다. 제안된 모델은 각각의 단일 입력 모델보다 향상된 F1-점수(0.8049)를 보였다.

  • PDF

Comparison of K-ary tree, Document-unit parser tree and Element-unit parser tree for SGML IR index design (SGML 정보검색 인덱스 설계를 위한 K-ary 트리, 문서단위 구문 트리와 에리먼트 단위 구문 트리의 비교)

  • 손정한;한성근;장재우;주종철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.383-385
    • /
    • 1998
  • ISO에서 문서 교환에 대한 표준으로 제시된 SGML(Standard Generalized Markup Language)은 논문이나 보고서와 같이 내부적으로 복잡한 구조를 가지는 문서를 효과적으로 처리하기 위해 매우 융통성 있는 문법을 제공하고 있다. 이에 각 기업체나 행정기관에서는 기존의 전자 문서들을 SGML 문서로 변환하는 작업이 활발히 진행되고 있다. 따라서 문서의 논리적 구조에 기반한 검색에 대한 요구도 크게 증가하고 있다. 본 연구에서는 SGML 문서의 기본단위인 엘리먼트 단위의 검객과 문서의 논리적인 구조에 기반한 검색을 효율적으로 지원하는 인텍스를 설계하기 위해, K-ary 트리, 문서단위 구문트리와 엘리먼트단위 구문 트리의 3가지 방법에 대해 저장 시간, 삭제 시간, 검색 시간, 부가 저장 공간 측면에서 수학적 모델로서 성능평가를 수행한다.

Structure Design for Unit Testing based on Stack Frame to use GDB (GDB를 사용한 스택 프레임 기반 단위 테스팅을 위한 구조 설계)

  • Lee, Sunghee;Park, Heungjun;Jha, Ajay Kumar;Lee, Woo Jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.07a
    • /
    • pp.9-10
    • /
    • 2015
  • 최근 임베디드 소프트웨어는 전자기기뿐만 아니라 의료기기, 자동차, 항공 등 광범위하게 적용되고 있다. 임베디드 소프트웨어의 규모가 커지는 만큼 비중도 높아지고 있어 임베디드 소프트웨어 테스팅의 비중도 높아지고 있다. 따라서 본 논문에서는 디버깅 도구인 GDB를 테스팅에 과정에 연계하여 현재 실행중인 프로세스에서 겸사하고자 하는 단위 소프트웨어의 스택 프레임으로부터 정보를 얻어 단위 테스팅 수행이 가능한 구조를 제안한다. 이를 통해 별도의 코드를 수정하지 않고도 단위 테스팅이 가능해지며 런타임 테스팅과 자동 단위 테스팅이 가능해진다.

  • PDF

Korean and English Text Chunking Using IG Back-off Smoothing and Probabilistic Model (IG back-off 평탄화와 확률 기반 모델을 이용한 한국어 및 영어 단위화)

  • Yi, Eun-Ji;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.118-123
    • /
    • 2002
  • 많은 자연언어처리 분야에서 문장의 단위화는 기본적인 처리 단계로서 중요한 위치를 차지하고 있다. 한국어 단위화에 대한 기존 연구들은 규칙 기반 방법이나 기계 학습 기법을 이용한 것이 대부분이었다. 본 논문에서는 통계 기반 방식의 일환으로 순수 확률기반 모델을 이용한 단위화 방법을 제시한다. 확률 기반 모델은 처리하고자 하는 해당 언어에 대한 깊은 지식 없이도 적용 가능하다는 장점을 가지므로 다양한 언어의 단위화에 대한 기본 모델로서 이용될 수 있다. 또한 자료 부족 문제를 해결하기 위해 메모리 기반 학습 시에 사용하는 IG back-off 평탄화 방식을 시스템에 적용하였다. 본 논문의 모텔을 적용한 단위화 시스템을 이용하여 한국어와 영어에 대해 실험한 결과 비교적 작은 규모의 말뭉치를 학습하였음에도 불구하고 각각 90.0%, 90.0%의 정확도를 보였다.

  • PDF

Development of Decline Diagnosis System for District Level Decline (지구단위 도시쇠퇴 진단시스템 개발)

  • Yang, Dong-suk;Yu, Yeong-hwa;Cho, Seong-Yeoun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.1302-1305
    • /
    • 2012
  • 본 연구의 선행 연구에서는 시군구단위 도시쇠퇴를 진단할 수 있는 시스템을 개발하였다. 본 연구에서는 시군구 단위보다 더 세밀한 읍명동 단위 및 지구단위의 도시쇠퇴 현황을 파악할 수 있는 시스템을 개발하였다. 개발된 지구단위 쇠퇴진단 모듈을 기존의 도시재생 종합정보시스템과 통합하여 도시의 세밀한 쇠퇴현황을 파악할 수 있게 하였다. 개발된 시스템은 중앙정부차원의 도시재생 사업 의사결정 담당자뿐만 아니라 지자체의 도시재생 사업 담당자들이 사업을 계획하고 우선순위 대상지를 선정하는 업무 등에 활용 가능할 것으로 판단된다.

Word Sense Disambiguation of Polysemy Predicates using UWordMap (어휘지도(UWordMap)를 이용한 용언의 다의어 중의성 해소)

  • Bae, Young-Jun;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.167-170
    • /
    • 2013
  • 한국어 어휘의 의미를 파악하기 위하여 어휘의 의미 중의성을 해결하는 것은 중요한 일이다. 본 논문에서는 한국어 다의어 기반의 어휘 의미망과 용언의 논항정보 등의 관계가 포함된 어휘지도(UWordMap)를 사용하여 용언의 의미 중의성 해소에 대한 연구를 진행한다. 기존의 의미 중의성 해소 연구와 같은 동형이의어 단위가 아닌 다의어 단위의 용언 의미 중의성 해소 시스템을 개발하였다. 실험결과 실험말뭉치로 품사 태그 부착 말뭉치를 사용했을 때 동형이의어 단위 정확률은 96.44%였고, 다의어 단위 정확률은 67.65%였다. 실험말뭉치로 동형이의어 태그 부착 말뭉치를 사용했을 때 다의어 단위 정확률은 77.22%로 전자의 실험보다 약 10%의 높은 정확률을 보였다.

  • PDF

An Implementation of Full Virtualization based Intelligent Building System for Interface Overload Prevention (인터페이스 부하방지를 위한 전가상화 기반 지능형 빌딩 시스템 구현)

  • Kim, Oh Beom;Chung, Kwang Sik;Shon, Jin Gon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.1694-1697
    • /
    • 2010
  • 지능형 빌딩 시스템은 빌딩을 운영하는 다양한 단위시스템 정보를 통합하여 빌딩 거주자에게 쾌적하고, 안전한 생활을 할 수 있도록 운영하는 시스템을 말한다. 하드웨어적인 방법은 단위시스템에 비례하게 비용이 증가하는 단점이 있다. 소프트웨어적인 방법은 하나의 서버에서 정보를 수집하기 때문에 단위시스템에 통신량 증가로 인한 오류가 발생하면 전체 시스템에 영향을 미치는 단점을 가지고 있다. 본 논문에서는 소프트웨어적인 방법의 단점을 개선하기 위해서 부하 및 오류를 격리화할 수 있는 가상화를 이용하여 통합 관리 시스템과 인터페이스 관리 시스템으로 운영한다. 시스템의 구조는 통합 관리 모듈, 가상 관리 모듈, 구성 관리 모듈, 그리고 단위시스템 관리 모듈로 분리되며 제안 시스템을 사용함으로써 인터페이스 관리 시스템에서 발생하는 오류 및 부하로 인한 전체 시스템 오류를 축소시킬 수 있다.

Automated Unitary Phrases Extraction for Aligning Phrases in Korean-English Bilingual Corpus (한국어/영어 병렬 코퍼스에서 구 단위 정렬을 위한 단위 구 자동 추출)

  • 김기태;김동주;김한우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.181-183
    • /
    • 2001
  • 정렬(alignment)은 병렬 코퍼스에서 원문서의 문단, 문장, 혹은 단어와 같은 단위 요소에 대해, 대역문서에서의 상응하는 단위 요소를 찾는 일로, 코퍼스 기반 기계번역 방식에서 매우 중요한 과정이다. 동일 어족간의 원문과 대역문에서는 어순이나 단위 요소들이 거의 일치하여 정렬에 큰 어려움이 없으나, 한국어와 영어와 같이 어족이 다른 언어간의 정렬은 언어의 단위 요소의 상이성과 어순의 차이 등으로 인해 않은 어려움이 존재한다. 본 논문은 어족이 다른 언어 사이의 정렬을 위해 상대 구문 고립성(Relative Syntactic Isolativity)이라는 개념을 적용하여 언어 단위의 상이성을 극복할 수 있는 단위 구를 제안하고 이들을 추출하는 방법에 대해 보인다.

  • PDF