• Title/Summary/Keyword: 정보 모델

Search Result 23,596, Processing Time 0.049 seconds

An Indexing Model for Efficient Structure Retrieval of XML Documents (XML 문서의 효율적인 구조 검색을 위한 색인 모델)

  • Park, Jong-Gwan;Son, Chung-Beom;Gang, Hyeong-Il;Yu, Jae-Su;Lee, Byeong-Yeop
    • The KIPS Transactions:PartD
    • /
    • v.8D no.5
    • /
    • pp.451-460
    • /
    • 2001
  • In this paper, we propose an indexing model for efficient structure retrieval of XML documents. The proposed indexing model consists of structured information that supports a wide range of queries such as content-based queries and structure-attribute queries at all levels of the document hierarchy and index organizations that are constructed based on the information. To support structured retrieval, a new representation method for structured information is presented. Using this structured information, we design content index, structure index, and attribute index for efficient retrieval. also, we explain processing procedures for mixed queries and evaluate the performance of proposed indexing model. It is shown that the proposed indexing model achieves better retrieval performance than the existing method.

  • PDF

Comparison Study of the Performance of CNN Models for malicious code image classification (악성코드 이미지 분류를 위한 CNN 모델 성능 비교)

  • Kang, Chae-Hee;Oh, Eun-Bi;Lee, Seung-Eon;Lee, Hyun-Kyung;Kim, Sung-Wook
    • Annual Conference of KIPS
    • /
    • 2022.05a
    • /
    • pp.432-435
    • /
    • 2022
  • 최근 IT 산업의 지속적인 발전으로 사용자들을 위협하는 악성코드, 피싱, 랜섬웨어와 같은 사이버 공격 또한 계속해서 발전하고 더 지능화되고 있으며 변종 악성코드도 기하급수적으로 늘어나고 있다. 지금까지의 시그니처 패턴 기반의 탐지법으로는 이러한 방대한 양의 알려지지 않은 악성코드를 탐지할 수 없다. 따라서 CNN(Convolutional Neural Network)을 활용하여 악성코드를 탐지하는 기법들이 제안되고 있다. 이에 본 논문에서는 CNN 모델 중 낮은 인식 오류율을 지닌 모델을 선정하여 정확도(Accuracy)와 F1-score 평가 지표를 통해 비교하고자 한다. 두 가지의 악성코드 이미지화 방법을 사용하였으며, 2015 년 이후 ILSVRC 에서 우승을 차지한 모델들과, 추가로 2019 년에 발표된 EfficientNet 을 사용하여 악성코드 이미지를 분류하였다. 그 결과 2 바이트를 한 쌍의 좌표로 변환하여 생성한 256 * 256 크기의 악성코드 이미지를 ResNet-152 모델을 이용해 분류하는 것이 우수한 성능을 보임을 실험적으로 확인하였다.

A Case Study on an Educational Model of Medical AI Using Chest X-ray Synthetized by GAN (GAN 으로 합성된 흉부 X-ray 를 활용한 의료 인공지능 교육 모델에 관한 사례 연구)

  • Lee, Gyubin;Yoon, Yebin;Ham, Sojin;Bae, Hyun-Jin;You, Wonsang
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.887-890
    • /
    • 2021
  • 최근 AI 를 활용한 의료 진단 솔루션 시장이 크게 성장함에 따라 의료 인공지능 기술에 대한 대학 교육에 대한 수요가 증가하고 있지만, 개인정보 유출의 위험성 등으로 인하여 의료 데이터를 대학 교육에 활용하기 어려운 실정이다. 본 논문에서는 실제 의료 데이터 대신 생성적 적대 신경망(GAN)으로 합성된 흉부 X-ray 영상을 활용한 의료 인공지능 교육 모델의 사례를 제시한다. 프로메디우스(주)에 의해 제공받은 흉부 X-ray 합성영상을 사용하여, VGG-16 모델을 훈련하고 성능을 검증 및 평가하며 미세조정을 통해 성능을 개선하는 교육 모델을 구성하였다. 또한 교육모델이 의료 인공지능에 대한 학생들의 이해력 향상에 기여한 효과를 정량적으로 평가하였다.

A Study on Cost Models for Energy-based Query Optimization on Embedded DBMS (임베디드 DBMS의 전력 기반 질의 최적화를 위한 비용 모델에 관한 연구)

  • Kim, Do-Yun;Park, Wonjoo;Jang, Ju-Yeon;Park, Sung-Hwan;Park, Sangwon
    • Annual Conference of KIPS
    • /
    • 2007.11a
    • /
    • pp.286-289
    • /
    • 2007
  • PC 및 서버 급에서 DBMS가 아주 폭넓게 사용되어지고 있으며 그 뿐 아니라 컴퓨팅 파워가 높아짐에 따라서 임베디드 시스템에서도 DBMS가 필요해졌다. 임베디드 시스템에서 DBMS가 충분히 동작할 만큼의 성능을 발휘하게 되었고, 이에 따라 임베디드 시스템에서 동작하는 응용프로그램들도 임베디드 DBMS를 사용하게 되었다. 임베디드 시스템이 점차 플래시 메모리를 사용하는 추세에 맞추어 플래시 기반 임베디드 DBMS 기술 개발이 중요하다. 플래시 메모리의 특성에 맞춘 임베디드 DBMS를 개발하지 않으면, 결과적으로 플래시 메모리의 성능을 저하시키며, 수명도 단축시키는 결과를 초래하게 될 것이다. 특히 임베디드 환경에서는 전기 에너지 자원이 한정되어 있기 때문에 전력 소모를 줄이는 것이 관건이다. 따라서 임베디드 DBMS에서 디스크에서 정의한 비용 모델을 따르는 것은 한계가 있다. 본 논문은 임베디드 DBMS에서 전력 기반 비용 모델을 새롭게 제시하고, 디스크 기반 비용 모델과 비교하여 제시한 비용 모델과의 차이를 보인다.

Ordinal Depth Based Deductive Weakly Supervised Learning for Monocular 3D Human Pose Estimation (단안 이미지로부터 3D 사람 자세 추정을 위한 순서 깊이 기반 연역적 약지도 학습 기법)

  • Youngchan Lee;Gyubin Lee;Wonsang You
    • Annual Conference of KIPS
    • /
    • 2024.05a
    • /
    • pp.826-829
    • /
    • 2024
  • 3D 사람 자세 추정 기술은 다양한 응용 분야에서의 높은 활용성으로 인해 대량의 학습 데이터가 수집되어 딥러닝 모델 연구가 진행되어 온 반면, 동물 자세 추정의 경우 3D 동물 데이터의 부족으로 인해 관련 연구는 극히 미진하다. 본 연구는 동물 자세 추정을 위한 예비연구로서, 3D 학습 데이터가 없는 상황에서 단일 이미지로부터 3D 사람 자세를 추정하는 딥러닝 기법을 제안한다. 이를 위하여 사전 훈련된 다중 시점 학습모델을 사용하여 2D 자세 데이터로부터 가상의 다중 시점 데이터를 생성하여 훈련하는 연역적 학습 기반 교사-학생 모델을 구성하였다. 또한, 키포인트 깊이 정보 대신 2D 이미지로부터 레이블링 된 순서 깊이 정보에 기반한 손실함수를 적용하였다. 제안된 모델이 동물데이터에서 적용 가능한지 평가하기 위해 실험은 사람 데이터를 사용하여 이루어졌다. 실험 결과는 제안된 방법이 기존 단안 이미지 기반 모델보다 3D 자세 추정의 성능을 개선함을 보여준다.

A Study on the Foundation of the Infrastructure for National Geospatial Information Distribution (국가 지리공간 정보 유통기반 구축에 관한 연구)

  • Choi, Jae-Hun;Chyung, Nan-Soo;Kim, Young-Sup
    • Journal of Korea Spatial Information System Society
    • /
    • v.1 no.2 s.2
    • /
    • pp.63-80
    • /
    • 1999
  • This study presents NGDM(National Geospatial Information Distribution Model) in order to effectively utilize and differently apply geospatial information which is important in the dispersion of GIS. In order to establish the NGDM, this study draws the guideline of NGDM in Korea by analyzing its present condition of domestic and foreign geospatial information distribution. It also investigates some major factors forming the infrastructure of NGDM in regulative, technical, physical, and social aspects. Based on these factors, this study presents a three-staged NGDM that is applicable in Korea. The NGDM consists of four components that are the consumer, supplier, gateway for the clearinghouse and the clearinghouse of the geospatial information. According to the management form of geospatial information, the types of NGDM are classified as the concentration type, the distribution type, and compound type. Also, this study explains the mutual relationship between the NGDM's components and suggests a three-staged NGDM of planting, growth, and maturity period considering comparison results of classified models and development direction of regulation, protocol, communication network, electronic commerce, and etc.

  • PDF

Labeled Statistical Korean Dependency Parsing with Global and Local Information (전역 및 지역 정보를 이용한 SVM 기반 한국어 문장 구조 및 격 레이블 분석)

  • Lim, Soojong;Lee, Changki;Jang, Myung-Gil;Ra, DongRyul
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.207-212
    • /
    • 2009
  • 한국어 문장의 구조 및 격 레이블 분석을 위해서 SVM 모델을 이용하여 얻어진 전역 및 지역 정보 통계 모델에 기반한 방법을 제안한다. 제안하는 방법은 후방 beam search 알고리즘을 이용하여 부분 구문 분석을 하는 과정에서 지역 의존 정보를 사용하였고 이렇게 구성된 문장의 후보 구조에 대해서는 전역 정보 모델를 사용하여 최적의 문장 구조 및 격 레이블을 분석하였다. 제안하는 방법은 지역이나 전역 중 한 개의 모델만을 사용할 때 발생할 수 있는 오류를 최소화하였다. 지식 DB 사업의 한국어 의존 구문 분석 말뭉치를 이용하여 실험한 결과 전역 정보나 지역 정보만을 사용한 결과보다 각각 1.2%, 3.3% 높은 79.1%의 문장 구조 및 격 레이블 분석 정확률을 나타냈고 전역 정보만을 사용할 때보다 약 76배 이상의 빠른 속도 향상을 보였다. 향후 연구로는 지배소 단위, 구 묶음 단위 등으로 통계 정보를 세분화하여 좀더 높은 성능 향상을 기대한다.

  • PDF

Multi-Decoder Conversational Model for Generating Robust Response Based on Denoising Mechanism (강건한 응답 생성을 위한 디노이징 메커니즘 기반 다중 디코더 대화 모델)

  • Kim, Tae-Hyeong;Park, Seong-Bae;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.141-146
    • /
    • 2018
  • 최근 대화 모델 학습에는 시퀀스-투-시퀀스 모델이 널리 활용되고 있다. 하지만 기본적인 시퀀스-투-시퀀스 모델로 학습한 대화 모델은 I don't know 문제와 사오정 문제를 내포한다. I don't know 문제는 입력 발화에 대해 안전하고 무미건조한 단편적인 대답을 많이 생성하는 문제이다. 사오정 문제는 입력 발화에 대해 적절한 응답을 생성했지만 입력 발화와 동일한 의미를 지니지만 어순, 어미 등의 변화가 있는 발화에는 적절한 응답을 생성하지 못하는 문제이다. 이전 연구에서 디노이징 메커니즘을 활용하여 각각의 문제를 완화하는 대화 모델들을 학습할 수 있음을 보였으나 하나의 모델에서 두 문제를 동시에 해결하지는 못하였다. 본 논문에서는 디노이징 메커니즘을 활용하여 각각의 문제에 강점을 지닌 디코더들을 학습하고 응답 생성 시 입력 발화에 따라 두 디코더를 적절하게 반영하여 언급한 문제 모두에 대해 강건한 응답을 생성할 수 있는 모델을 제안한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 한국어 대화 데이터로 실험을 수행하였다. 실험 결과 단일 문제를 해결하는 모델들과 비교하여 ROUGE F1 점수와 사람이 평가한 정성 평가에서 성능 향상을 보였다.

  • PDF

A Spatio-temporal model for simple objects with a broad boundary (불확실한 경계를 가진 시공간 객체의 모델 설계)

  • Kim, Dae-Jung;Chi, Jung-Hee;Ryu, Keun-Ho
    • Annual Conference of KIPS
    • /
    • 2002.04a
    • /
    • pp.83-86
    • /
    • 2002
  • 최근 지리 정보 시스템이나 공간 데이터 베이스 시스템이 발전하면서 실세계를 효율적으로 모델링하려는 맡은 연구가 수행되고 있다. 기존의 단순한 point, line, polygon으로 모델링했던 방법들을 multipoint, multiline, multipolygon과 같은 복잡한 객체를 표현하기 위한 연구로 확장되었다. 또한 이러한 공간 객체의 이력을 효율적으로 관리하기 위해 공간 객체를 시간으로 확장하는 연구가 수행되고 있다. 이러한 모델들은 명확한 경계를 가진 시공간 객체를 대상으로 한다. 자연, 사회 문화 현상, 생태 같은 경계가 명확하지 않은 객체를 단순한 경계를 가진 공간 객체로 모델링하기에는 그 표현력이 부족하다. 따라서 이 논문에서는 이런 문제점을 해결하기 위해서 불확실한 경계를 가진 시공간 데이터 모델을 제시한다. 이 논문에서 제시한 불확실한 경제를 가진 시공간 모델의 설계는 상호 운용을 증진하기 위하여 OGC(OpenGIS Consortium)에서 제시한 2차원 기하 객체 모델을 기반으로 불확실한 경계를 가지는 공간 데이터 모델로 확장한다. 또한, 이 불확실한 경계를 가지는 단순한 공간 모델을 시간 영역으로 확장하여 유효시간을 갖는 불확실한 시공간 데이터 모델을 설계한다. 또한, 이 논문에서 제시한 불확실한 경계를 가진 시공간 객체 모델을 바탕으로 실세계의 다양하고 복잡한 객체에 대한 효율적인 질의가 가능한 시공간 연산자를 제시한다.

  • PDF

DART: Data Augmentation using Retrieval Technique (DART: 검색 모델 기술을 사용한 데이터 증강 방법론 연구)

  • Seungjun Lee;Jaehyung Seo;Jungseob Lee;Myunghoon Kang;Hyeonseok Moon;Chanjun Park;Dahyun Jung;Jaewook Lee;Kinam Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.313-319
    • /
    • 2022
  • 최근 BERT와 같은 트랜스포머 (Transformer) 기반의 모델이 natural language understanding (NLU)와 같은 여러 자연어 처리 태스크에서 좋은 성능을 보인다. 이러한 모델은 여전히 대용량의 학습을 요구한다. 일반적으로, 데이터 증강 기법은 low-resource 환경을 개선하는 데 도움을 준다. 최근 생성 모델을 활용해 합성 데이터를 생성해 데이터를 증강하는 시도가 이루어졌다. 이러한 방법은 원본 문장과 의미론적 유사성을 훼손하지 않으면서 어휘와 구조적 다양성을 높이는 것을 목표로 한다. 본 논문은 task-oriented 한 어휘와 구조를 고려한 데이터 증강 방법을 제안한다. 이를 위해 검색 모델과 사전 학습된 생성 모델을 활용한다. 검색 모델을 사용해 학습 데이터셋의 입력 문장과 유사한 문장 쌍을 검색 (retrieval) 한다. 검색된 유사한 문장 쌍을 사용하여 생성 모델을 학습해 합성 데이터를 생성한다. 본 논문의 방법론은 low-resource 환경에서 베이스라인 성능을 최대 4% 이상 향상할 수 있었으며, 기존의 데이터 증강 방법론보다 높은 성능 향상을 보인다.

  • PDF