• Title/Summary/Keyword: 정보 모델

Search Result 23,596, Processing Time 0.072 seconds

Automatic Classification of Patent Documents Using Doc2Vec (Doc2Vec을 이용한 특허 문서 자동 분류)

  • Song, Jinjoo;Kang, Seung-Shik
    • Annual Conference of KIPS
    • /
    • 2019.05a
    • /
    • pp.239-241
    • /
    • 2019
  • 지식과 정보의 중요성이 강조되는 지식기반사회에서는 지식재산권의 대표적인 유형인 특허의 중요성이 날로 높아지고 있고, 그 수 또한 급증하고 있다. 특허 문서의 효과적 검색과 이용을 위해서는 새롭게 출원되는 특허 문서의 체계적인 분류 작업이 선행되어야 하고, 따라서 방대한 양의 특허 문서를 자동으로 분류해주는 시스템이 필요하다. 본 연구에서는 Doc2Vec 모델을 이용하여 국내 특허 문서의 특징(feature)을 추출하고, 추출된 특징을 바탕으로 한 특허 문서의 자동 분류 모형을 제안한다. 먼저 국내에 등록된 31,495 건의 특허 문서의 IPC(International Patent Classification)와 요약정보를 바탕으로 Doc2Vec 모델을 구축하였다. 구축된 Doc2Vec 모델을 통하여 훈련데이터의 특징을 추출한 후, 이 특징 벡터를 이용하여 분류기를 학습하였다. 마지막으로 Doc2Vec 모델을 이용하여 실험데이터의 특징 벡터를 추출하고 분류기의 성능을 실험한 결과, 43%의 분류 정확도를 얻었다. 이를 통해, 특허 문서 분류 문제에 Doc2Vec 모델의 사용 가능성을 확인할 수 있었다.

Design of Brain-computer Korean typewriter using N-gram model (N-gram 모델을 이용한 뇌-컴퓨터 한국어 입력기 설계)

  • Lee, Saebyeok;Lim, Heui-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.143-146
    • /
    • 2010
  • 뇌-컴퓨터 인터페이스는 뇌에서 발생하는 생체신호를 통하여 컴퓨터나 외부기기를 직접 제어할 수 있는 기술이다. 자발적으로 언어를 생성하지 못하는 환자들을 위하여 뇌-컴퓨터 인터페이스를 이용하여 한국어를 자유롭게 입력할 수 있는 인터페이스에 대한 연구가 필요하다. 본 연구는 의사소통을 위한 뇌-컴퓨터 인터페이스에서 낮은 정보전달률을 개선하기 위해서 음절 n-gram과 어절 n-gram 모델을 이용하여 언어 예측 모델을 구현하였다. 또한 실제 이를 이용한 뇌 컴퓨터 한국어 입력기를 설계하였다, 이는 기존의 뇌-컴퓨터 인터페이스 연구에서 특징 추출이나 기계학습 방법의 성능향상을 위한 연구와는 차별적인 방법이다.

  • PDF

A Study of Enhanced Test Maturity Model with Test Process Improvement next (테스트 프로세스 개선 모델(TPI next)을 통한 테스트 성숙도 모델 확장에 관한 연구)

  • Kim, Kidu;Kim, R.YoungChul
    • Annual Conference of KIPS
    • /
    • 2012.04a
    • /
    • pp.1243-1246
    • /
    • 2012
  • 소프트웨어 산업 발전과 함께 소프트웨어에 대한 사용자 기대치가 높아지게 되었다. 그로인해 소프트웨어 개발사는 기존의 소프트웨어 보다 나은 품질의 소프트웨어를 원하게 되었다. 보다 높은 품질의 소프트웨어를 개발 위해서는 우선적으로 올바른 개발 절차와 방법에 따라 개발하여야하며 최종적으로 완벽한 테스트를 통해 사용자에게 전해져야한다. 하지만 완벽한 테스트를 수행하는 것은 불가능하기 때문에 본 논문에서는 테스트 프로세스 개선 모델(TPI next)을 통해 기존 모델을 확장한 테스트 성숙도 모델(Enhanced TMMi)을 활용하여 정형화된 테스트 프로세스를 통한 보다 높은 품질의 소프트웨어를 확보하는 방안을 제안하고자 한다.

A Study on improvement of Korea Enterprise Architecture's meta model using UML Diagram (UML 다이어그램을 이용한 범정부 엔터프라이즈 아키텍처 메타모델 개선에 관한 연구)

  • Park, Ga-Young;Lee, Yong-Hoon;Jung, Hyun-Ho;Lee, Sang-Bum
    • Annual Conference of KIPS
    • /
    • 2010.11a
    • /
    • pp.218-221
    • /
    • 2010
  • 본 논문은 범정부 엔터프라이즈 아키텍처(EA)의 메타모델을 UML 다이어그램을 이용하여 개선 연구에 관한 논문이다. 여러 공공기관과 기업에서는 '범정부 정보기술아키텍처 적용'이란 전자정부 로드맵 과제로 정보기술을 그들의 경영혁신을 위한 전략적 도구로 도입하였으며, 조직 전체의 최적화 및 통합, 조직의 진화관리, 조직업무의 효율성 및 효과성 등을 제공하는 방법으로 EA를 개발 및 적용하고 있다. 하지만 EA 프레임워크에서 제안하는 메타모델들은 단순한 네모 박스와 선으로 연결된 의미가 부족한 메타모델들을 제안하고 있다. 본 논문에서는 메타모델에 의미를 부여하는 작업으로 UML 다이어그램을 이용한 새로운 메타모델 다이어그램들을 제안한다. UML에서 사용된 의미를 가진 다이어그램을 범정부 엔터프라이즈 아키텍처의 메타모델에 적용함으로써 의미적인 메타모델의 다이어그램을 통해 보다 의미 전달이 용이한 메타모델로 사용되어 질 수 있을 것이다.

Comparison of KoBART and KoBERT models for Korean paper summarization (한국어 논문 요약을 위한 KoBART와 KoBERT 모델 비교*)

  • Jaesung Jun;Suan Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.562-564
    • /
    • 2022
  • 통신 기술의 발전으로 일반인들도 다양한 자료들을 인터넷에서 손쉽게 찾아볼 수 있는 시대가 도래하였다. 개인이 접근할 수 있는 정보량이 기하급수적으로 많아 짐에 따라, 이를 효율적으로 요약, 정리하여 보여주는 서비스들의 필요성이 높아지기 시작했다. 본 논문에서는, 자연어 처리 모델인 BART를 40GB 이상의 한국어 텍스트로 미리 학습된 한국어 언어 모델 KoBART를 사용한 한국어 논문 요약 모델을 제안하고, KoBART와 KoBERT 모델의 한국어 논문 요약 성능을 비교한다.

  • PDF

Topic-based Knowledge Graph-BERT (토픽 기반의 지식그래프를 이용한 BERT 모델)

  • Min, Chan-Wook;Ahn, Jin-Hyun;Im, Dong-Hyuk
    • Annual Conference of KIPS
    • /
    • 2022.05a
    • /
    • pp.557-559
    • /
    • 2022
  • 최근 딥러닝의 기술발전으로 자연어 처리 분야에서 Q&A, 문장추천, 개체명 인식 등 다양한 연구가 진행 되고 있다. 딥러닝 기반 자연어 처리에서 좋은 성능을 보이는 트랜스포머 기반 BERT 모델의 성능향상에 대한 다양한 연구도 함께 진행되고 있다. 본 논문에서는 토픽모델인 잠재 디리클레 할당을 이용한 토픽별 지식그래프 분류와 입력문장의 토픽을 추론하는 방법으로 K-BERT 모델을 학습한다. 분류된 토픽 지식그래프와 추론된 토픽을 이용해 K-BERT 모델에서 대용량 지식그래프 사용의 효율적 방법을 제안한다.

The Delegation Model of the Role-based Access Control considering Context and Privacy for the Telemedicine service (원격의료 서비스를 위한 상황 및 프라이버시를 고려한 역할기반 접근제어 위임모델)

  • Hwang, Yu-Dong;Park, Dong-Gue
    • Annual Conference of KIPS
    • /
    • 2011.04a
    • /
    • pp.960-963
    • /
    • 2011
  • 본 논문에서는 유비쿼터스 환경에서의 원격 의료 서비스를 위한 상황 및 프라이버시를 고려한 역할기반 접근제어 모델에서의 위임 모델을 제안한다. 제안 모델은 원격 의료 서비스에서 반드시 필요하고 빈번히 발생할 수 있는 사용자 대 사용자 위임, 역할 대 역할 위임, 다단계 위임, 다중 위임 등의 기능을 제공한다. 따라서 본 논문에서 제안하는 모델을 이용하여 원격의료 서비스를 위한 사용자의 프라이버시 보호와 세밀한 접근제어가 가능하다.

A Multi-Level Mobile Context Model for Complex User Context Awareness (사용자의 복합 상황 인지를 위한 다중 레벨 모바일 컨텍스트 모델)

  • Lee, Meeyeon;Lee, Jung-Won;Park, Seung Soo
    • Annual Conference of KIPS
    • /
    • 2011.11a
    • /
    • pp.273-276
    • /
    • 2011
  • 스마트 폰을 비롯한 다양한 모바일 기기는 사용자 중심의 정보 수집과 상황 인지 및 서비스 제공에 적합한 환경이다. 하지만 사용자에게 의미 있는 서비스를 제공하기 위해서는 단순한 환경 상태 또는 행동에 대한 추론보다는 사용자의 행동에 대한 목적과 의도를 파악할 수 있어야 한다. 즉, 주변 환경 상태와 사용자의 행동 이력, 현재의 행동 등을 종합하여 사용자가 필요로 하는 서비스를 예측하고 결정할 수 있는 상황 모델이 필요하다. 따라서 본 논문에서는 사용자의 일상 생활 상에서의 중요한 일정을 추적하여 적합한 모바일 서비스를 제공하기 위한 기반 지식 모델로서 계층적인 모바일 컨텍스트 모델을 제안하고자 한다. 기존의 상-하위 컨텍스트 모델을 세분화하고 의미 있는 컨텍스트를 추가하여 서비스를 결정하는데 중요한 기반 정보로 활용될 수 있도록 한다.

A Lightweight Deep Learning Model for Line-Art Colorization Using Two Stage Generator Model (이중 생성자를 사용한 저용량 선화 자동채색 모델)

  • Lee, Yeongseop;Lee, Seongjin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.01a
    • /
    • pp.19-20
    • /
    • 2020
  • 미디어 산업의 발전으로 스토리보드와 같은 선화 이미지의 자동채색 연구가 국내외에서 진행되고 있다. 하지만 자동채색 모델 용량에 초점을 두는 연구는 아직 진행되고 있지 않다. 기존 자동채색 연구는 모델 용량이 최소 567MB 이상으로 모델 용량이 큰 단점을 가지고 있다. 본 논문에서는 채색을 2단계로 나누는 이중 생성자 구조와 기존 U-Net을 개선한 생성자를 사용해 기존 U-Net에 비해 30%, VGG16/19를 사용한 기법과 비교해 최대 85% 작은 106MB 모델을 생성했고 FID(Fréchet Inception Distance)를 통한 이미지 평가결과 512x512px에서 153.69의 채색성능을 얻었다.

  • PDF

Korean Dependency Parsing using Second-Order TreeCRF (Second-Order TreeCRF를 이용한 한국어 의존 파싱)

  • Min, Jinwoo;Na, Seung-Hoon;Shin, Jong-Hoon;Kim, Young-Kil
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.108-111
    • /
    • 2020
  • 한국어 의존 파싱은 전이 기반 방식과 그래프 기반 방식의 두 갈래로 연구되어 왔으며 현재 가장 높은 성능을 보이고 있는 그래프 기반 파서인 Biaffine 어텐션 모델은 입력 시퀀스를 다층의 LSTM을 통해 인코딩 한 후 각각 별도의 MLP를 적용하여 의존소와 지배소에 대한 표상을 얻고 이를 Biaffine 어텐션을 통해 모든 의존소에 대한 지배소의 점수를 얻는 모델이다. 위의 Biaffine 어텐션 모델은 별도의 High-Order 정보를 활용하지 않는 first-order 파싱 모델이며 학습과정에서 어떠한 트리 관련 손실을 얻지 않는다. 본 연구에서는 같은 부모를 공유하는 형제 노드에 대한 점수를 모델링하고 정답 트리에 대한 조건부 확률을 모델링 하는 Second-Order TreeCRF 모델을 한국어 의존 파싱에 적용하여 실험 결과를 보인다.

  • PDF