• Title/Summary/Keyword: 정보조직화

Search Result 297, Processing Time 0.025 seconds

Feature Selection for Document Classifier for IT documents based on SVM (SVM 기반 기술정보 문서분류를 위한 특징 선택 기법)

  • Kang, Yun-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.577-580
    • /
    • 2002
  • 인터넷상의 정보의 급증에 따라 필요한 정보를 발견하고 관련된 정보를 조직화하기가 더욱 어려워지고 있으며 정보 접근의 부하를 줄이기 위한 효율적인 문서 분류의 중요성 및 필요성이 증가하고 있다. 본 논문에서는 디렉토리 내의 학습 문서 집합을 기반으로 구성된 디렉토리 내의 대표 용어 집합으로 구성된 모델을 학습 및 분류하기 위해 SVM을 사용한다. 문서분류를 위해 정보통신 웹 디렉토리 내의 문서로부터 추출된 용어 집합을 기반으로 학습을 수행한 후 문서 분류를 수행한다. 또한 TFiDF를 기반으로 특징을 표현하기 위해 벡터공간 모델을 사용하였고 이를 기반으로 성능 평가를 수행한다.

  • PDF

XQuery 작성기 설계 및 구현

  • 김태권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.22-24
    • /
    • 2004
  • XML은 관계형 데이터는 물론 구조화 또는 반구조화 된 데이터를 효과적으로 조직화하여 표현할 수가 있다. XQuery는 구조화된 XML 데이터를 대상으로 필요한 정보를 검색하는 질의어이다. 평면적인 테이블 형태의 SQL과는 달리 XQuery는 데이터의 내부구조 정보 없이는 질의어를 작성하는데 어려움이 따른다. 이 논문은 내부적으로 구조화된 XML데이터에서 필요한 정보를 검색하는 검색언어 XQuery질의를 효과적으로 작성할 수 있도록 질의 대상이 되는 XML 데이터 구조를 트리 형태로 보여주고, 필요한 경로식을 효과적으로 지정함으로써 질의어를 보다 쉽게 작성하도록 도와주는 XQuery 작성기를 설계하고 구현한다.

  • PDF

Automatic Structuralization of Thesaurus (시소러스 자동 구조화)

  • 김해수;이남경;이원규
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1994.12a
    • /
    • pp.97-100
    • /
    • 1994
  • 정보과학 분야에서 필요로 하는 의미해석 기술 개발에 중요한 역할을 하는 것이 시소러스이다. 정확한 관계 정의 및 대량정보 수용의 필요성은 시소러스 구축의 커다란 장애 요인이다. 시소러스 구축에은 다방면의 전문지식 활용과 막대한 비용 및 시간 투자가 요구된다. 기계적으로 관리 운영이 가능한 시소러스내의 관계는 BT, NT로 표현되는 계층관계와 USE, UF로 표현되는 등가관계로 이루어 진다. 본 연구는 개념적인 관계를 정의하는 두 관계를 기계적으로 추출하고, 기존의 평면적인 시소러스 구조를 실세계의 정보 구조에 적합하게 조직화하여 시소러스 구축에 있어서의 문제점을 개선하는데 그 목적이 있다. 제시되는 알고리즘은 단일 언어내의 시소러스 구축 뿐만 아니라, 구축된 시소러스들의 융합 및 다국어 시소러스 구축에도 적용된다.

  • PDF

네트워크 중심전에서의 정보보장

  • Kim Gwan-Ho
    • Review of KIISC
    • /
    • v.16 no.2
    • /
    • pp.13-17
    • /
    • 2006
  • 정보화의 선진국인 미국은 정보전 시대에서는 인적자원의 능력에 따라 전쟁의 승패가 좌우됨으로 교육을 통해 관련 개념을 통일시키고, 통일된 개념 하에 소요되는 인력을 분야별로 육성 및 관리하여 수행해야 할 작전 범위와 영역에 적합하게 조직화를 시키고, 수행절차를 각종 규정을 통해 강력하게 추진하고 있는데 우리도 이와 같은 선진국의 사례를 분석하여 단순히 소프트웨어나 하드웨어, 기술적인 도구를 확보하면 정보보호가 가능하다는 생각에서 벗어나 개념정립으로부터, 방어전략의 수립, 규정과 지침작성, 필요한 인적자원의 확보 및 관리, 작전수행 방법의 정립, 필요한 기술의 확보 등 체계적인 준비가 필요할 것으로 판단이 된다.

A Method For Autonomous Determination Of Corrosion State Of Gas-pipeline Using RPM-based SOM (관계적시점지도로 구성된 SOM을 이용한 가스배관 부식상태의 자율적 판단 방법)

  • Sohn, Choong-Yeon;Yeo, Ji-Hye;Ko, Il-Ju
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2011.01a
    • /
    • pp.137-140
    • /
    • 2011
  • 시설의 안전성 평가에 대한 연구는 안전성에 영향을 주는 데이터를 정량화하여 획일적인 자동 수행하는 안전관리가 주를 이루고 있다. 이와 달리 자율수행은 수집 된 상황 정보나 상태 데이터를 이용하여 안전성을 예측하고 사고 위험성을 경보하여 사고를 예방 할 수 있다. 본 연구에서는 다양한 시설물 중에서 가스배관의 부식에 대한 판단을 위해서 신경망의 대표적 비지도학습인 자기조직화지도를 적용한다. SOM의 적용에서는 주변효과를 보완하기 위해서 관계적관점지도로 맵을 구성한다. 학습 할 데이터는 가스배관의 방식전위이다. 배관의 부식상태를 확인하기 위하여 수집 된 데이터인 방식전위에는 부식에 대한 위험요인이 내재되어 있다. 학습 후 새로운 데이터가 입력되면 각 상태 군집의 중심뉴런과 맵핑된 뉴런의 유사도를 측정하여 배관의 부식상태를 결정한다. 제안 된 방법으로 판단 된 결과를 기존에 사람이 판단한 결과와 비교하여 검증한다. 이를 통해 배관의 부식상태를 자율적이고 신속하게 판단하여 지능화 된 가스배관 관리로 활용한다.

  • PDF

Sparse Web Data Analysis Using MCMC Missing Value Imputation and PCA Plot-based SOM (MCMC 결측치 대체와 주성분 산점도 기반의 SOM을 이용한 희소한 웹 데이터 분석)

  • Jun, Sung-Hae;Oh, Kyung-Whan
    • The KIPS Transactions:PartD
    • /
    • v.10D no.2
    • /
    • pp.277-282
    • /
    • 2003
  • The knowledge discovery from web has been studied in many researches. There are some difficulties using web log for training data on efficient information predictive models. In this paper, we studied on the method to eliminate sparseness from web log data and to perform web user clustering. Using missing value imputation by Bayesian inference of MCMC, the sparseness of web data is removed. And web user clustering is performed using self organizing maps based on 3-D plot by principal component. Finally, using KDD Cup data, our experimental results were shown the problem solving process and the performance evaluation.

Comparative Analysis of Classification Schemes for Internet Resources (인터넷 정보자원의 조직을 위한 분류체계에 관한 비교분석)

  • 최희윤
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • /
    • pp.177-182
    • /
    • 1998
  • 인터넷 정보자원의 폭발적인 증가에 따라 이를 효율적으로 조직화하고 체계화하는 시스템의 중요성이 증가하고 있다. 이에 따라 주제접근을 용이하게 하고 검색 효율성을 높이는 도구로서 분류체계에 대한 관심이 커지고 있다. 본고에서는 인터넷 서비스의 분류체계 응용사례중 주제별 디렉토리의 인터넷 기반 분류체계와 기존 문헌 분류체계를 비교 분석함으로써 인터넷 환경에 적합한 분류체계의 구성방안을 제시하였다.

  • PDF

A study on the Character Correction of the Wrongly Recognized Sentence Marks, Japanese, English, and Chinese Character in the Off-line printed Character Recognition (오프라인 인쇄체 문장부호, 일본 문자, 영문자, 한자 인식에서의 오인식 문자 교 정에 관한 연구)

  • Lee, Byeong-Hui;Kim, Tae-Gyun
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.1
    • /
    • pp.184-194
    • /
    • 1997
  • In the recent years number of commercial off-line character recognition systems have been appeared in the Korean market. This paper describes a "self -organizing" data structure for representing a large dictionary which can be searched in real time and uses a practical amount of memory, and presents a study on the character correction for off-line printed sentence marks, Japanese, English, and Chinese character recognition. Self-organizing algorithm can be recommenced as particularly appropriate when we have reasons to suspect that the accessing probabilities for individual words will change with time and theme. The wrongly recognized characters generated by OCR systems are collected and analyzed Error types of English characters are reclassified and 0.5% errors are corrected using an English character confusion table with a self-organizing dictionary containing 25,145 English words. And also error types of Chinese characters are classified and 6.1% errors are corrected using a Chinese character confusion table with a self-organizing dictionary carrying 34,593 Chinese words.ese words.

  • PDF

Hand Shape Detection and Recognition using Self Organized Feature Map(SOMF) and Principal Component Analysis (자기 조직화 특징 지도(SOFM)와 주성분 분석을 이용한 손 형상 검출 및 인식)

  • Kim, Kyoung-Ho;Lee, Kee-Jun
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.11
    • /
    • pp.28-36
    • /
    • 2013
  • This study proposed a robust detection algorithm. It detects hands more stably with respect to changes in light and rotation for the identification of a hand shape. Also it satisfies both efficiency of calculation and the function of detection. The algorithm proposed segmented the hand area through pre-processing using a hand shape as input information in an environment with a single camera and then identified the shape using a Self Organized Feature Map(SOFM). However, as it is not easy to exactly recognize a hand area which is sensitive to light, it has a large degree of freedom, and there is a large error bound, to enhance the identification rate, rotation information on the hand shape was made into a database and then a principal component analysis was conducted. Also, as there were fewer calculations due to the fewer dimensions, the time for real-time identification could be decreased.

An Exploratory Methodology for Longitudinal Data Analysis Using SOM Clustering (자기조직화지도 클러스터링을 이용한 종단자료의 탐색적 분석방법론)

  • Cho, Yeong Bin
    • Journal of Convergence for Information Technology
    • /
    • v.12 no.5
    • /
    • pp.100-106
    • /
    • 2022
  • A longitudinal study refers to a research method based on longitudinal data repeatedly measured on the same object. Most of the longitudinal analysis methods are suitable for prediction or inference, and are often not suitable for use in exploratory study. In this study, an exploratory method to analyze longitudinal data is presented, which is to find the longitudinal trajectory after determining the best number of clusters by clustering longitudinal data using self-organizing map technique. The proposed methodology was applied to the longitudinal data of the Employment Information Service, and a total of 2,610 samples were analyzed. As a result of applying the methodology to the actual data applied, time-series clustering results were obtained for each panel. This indicates that it is more effective to cluster longitudinal data in advance and perform multilevel longitudinal analysis.