• 제목/요약/키워드: 전자문서처리

검색결과 457건 처리시간 0.032초

BIT 표기법을 활용한 한국어 개체명 인식 (Korean Named Entity Recognition Using BIT Representation)

  • 윤호;김창현;천민아;박호민;남궁영;최민석;김재균;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.190-194
    • /
    • 2019
  • 개체명 인식이란 주어진 문서에서 개체명의 범위를 찾고 개체명을 분류하는 것이다. 최근 많은 연구는 신경망 모델을 이용하며 하나 이상의 단어로 구성된 개체명을 BIO 표기법으로 표현한다. BIO 표기법은 개체명이 시작되는 단어의 표지에 B(Beginning)-를 붙이고, 개체명에 포함된 그 외의 단어의 표지에는 I(Inside)-를 붙이며, 개체명과 개체명 사이의 모든 단어의 표지를 O로 간주하는 방법이다. BIO 표기법으로 표현된 말뭉치는 O 표지가 90% 이상을 차지하므로 O 표지에 대한 혼잡도가 높아지는 문제와 불균형 학습 문제가 발생된다. 본 논문에서는 BIO 표기법 대신에 BIT 표기법을 제안한다. BIT 표기법이란 BIO 표기법에서 O 표지를 T(Tag) 표지로 변환하는 방법이며 본 논문에서 T 표지는 품사 표지를 나타낸다. 실험을 통해서 BIT 표기법이 거의 모든 경우에 성능이 향상됨을 확인할 수 있었다.

  • PDF

패션앱 후기글 평가분석에 기반한 의류 검색추천 챗봇 개발을 위한 학습데이터 EVAD 구축 (Construction of Evaluation-Annotated Datasets for EA-based Clothing Recommendation Chatbots)

  • 최수원;황창회;유광훈;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.467-472
    • /
    • 2021
  • 본 연구는 패션앱 후기글에 나타나는 구매자의 의견에 대한 '평가분석(Evaluation Analysis: EA)'을 수행하여, 이를 기반으로 상품의 검색 및 추천을 수행하는 의류 검색추천 챗봇을 개발하는 LICO 프로젝트의 언어데이터 구축의 일환으로 수행되었다. '평가분석 트리플(EAT)'과 '평가기반요청 쿼드러플(EARQ)'의 구성요소들에 대한 주석작업은, 도메인 특화된 단일형 핵심어휘와 다단어(MWE) 핵심패턴들을 FST 방식으로 구조화하는 DECO-LGG 언어자원에 기반하여 반자동 언어데이터 증강(SSP) 방식을 통해 진행되었다. 이 과정을 통해 20여만 건의 후기글 문서(230만 어절)로 구성된 EVAD 평가주석데이터셋이 생성되었다. 여성의류 도메인의 평가분석을 위한 '평가속성(ASPECT)' 성분으로 14가지 유형이 분류되었고, 각 '평가속성'에 연동된 '평가내용(VALUE)' 쌍으로 전체 35가지의 {ASPECT-VALUE} 카테고리가 분류되었다. 본 연구에서 구축된 EVAD 평가주석 데이터의 성능을 평가한 결과, F1-Score 0.91의 성능 평가를 획득하였으며, 이를 통해 향후 다른 도메인으로의 확장된 적용 가능성이 유효함을 확인하였다.

  • PDF

S-100 표준 기반 피처 카탈로그 제작지원 시스템의 설계 및 구현 (Design and Implementation of Feature Catalogue Builder based on the S-100 Standard)

  • 박대원;권혁철;박수현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권8호
    • /
    • pp.571-578
    • /
    • 2013
  • 국제수로기구(IHO)의 공간지리 공통 데이터 모델에 관한 표준인 S-100을 기반으로 하는 S-10x 데이터 제품사양(Product Specification)은 해양의 특정 분야 데이터를 제작, 배포하는 기준에 관한 표준이다. 전자해도 데이터와 같은 피처 중심의 데이터는 피처 카탈로그를 S-10x 데이터 제품사양의 주요 구성 요소로 포함한다. 피처 카탈로그는 대상 분야 및 대상 분야의 데이터에 관한 전문 지식을 갖춘 도메인 전문가에 의해 제작되어 진다. 그러나 도메인 전문가가 피처 카탈로그를 구조화된 XML 문서로 오류 없이 작성하는 것은 쉬운 일이 아니다. 국제수로기구의 TSMAD 워킹그룹 회의에서도 카탈로그의 제작을 지원하는 시스템 개발의 필요성을 제기하였다. 이에 본 논문에서는 도메인 전문가가 S-10x 제품사양의 피처 카탈로그를 일관되고 구조화된 XML 문서로 제작할 수 있도록 지원하는 시스템 도구로 피처 카탈로그 빌더를 설계, 구현하였다. 피처 카탈로그 빌더는 자바 기반의 그래픽 유저 인터페이스(GUI) 프로그램으로 개발하였다. 그리고 피처 개념 사전(Feature Concept Dictionary) 레지스터의 등록 아이템 간의 관계를 확인하고 대상 분야에 적합한 아이템을 선택할 수 있도록 피처 카탈로그 빌더를 개발하였다.

효과적인 추천과 세분화를 위한 트랜잭션 기반 여러 형태 사용자 프로파일의 구축 (The Construction of Multiform User Profiles Based on Transaction for Effective Recommendation and Segmentation)

  • 고재진;안형근
    • 정보처리학회논문지D
    • /
    • 제13D권5호
    • /
    • pp.661-670
    • /
    • 2006
  • 쉽게 접할 수 있는 정보의 양이 증가하고 전자상거래가 발전함에 따라, 드넓은 정보공간을 축소하기 위하여 추천과 SDI 시스템과 같은 정보 필터링 시스템이 사용되어지게 되었으며, 이에 따라 사용자들은 그들의 요구와 취향에 가장 적합한 정보들을 바로 접근할 수 있게 되었다. 지금까지 다양한 정보 필터링 방법들이 추천시스템을 지원하기 위해 제안되었다. 최근에는 새로운 정보교환 표준으로 떠오르고 있는 XML 문서를 필터링 하는 시스템들에 있어서도 다른 접근 방법을 요구하고 있다. 따라서, 본 논문에서 제안하는 시스템은 XML이 가진 구조 정보를 이용하여 여러 형태의 사용자 프로파일을 생성하는 방법을 제안한다. 시스템은 구매와 같은 트랜잭션이 발생하기 전에 사용자 구매 패턴을 분석하기 위해서 필요한 프로파일을 운영자가 직접 정의하는 운영자 프로파일과 이를 적용한 사용자 프로파일의 두 부분으로 구성된다. 운영자 프로파일은 DTD로부터 선택된 항목을 이용하여 DTD를 따르는 문서내의 특정부분을 가리킬 수 있도록 만들어진다. 제안하는 시스템은 사용자의 구매 행위에 적응력을 가질 수 있도록 보다 정확한 사용자 프로파일을 구축하고, 이와 같은 사용자 프로파일을 기반으로 사용자에게 불필요한 검색과정 없이 필요한 상품 정보를 제공할 수 있도록 한다.

차세대 표준정보유통시스템 구축 및 운용에 관한 연구 (A Study on Development and Operation of Standards Information System)

  • 구경철;이준섭;송기평;박기식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2000년도 춘계종합학술대회
    • /
    • pp.93-97
    • /
    • 2000
  • 최근 주요 선진국 및 표준화 기구들은 급변하는 시장의 요구 및 기술변화를 수용하기 위해 더 많은 새롭고 복잡한 표준들을 보다 짧은 시간 내에 개발하여, 표준화를 통한 동 분야의 경쟁력강화는 물론 이를 시장선점용 전략수단으로 활용하고 있으며, 이를 효과적으로 실현하기 위해 전자적 (표준) 문서 처리시스템(EDH: Electronic Document Handling) 혹은 표준정보유통시스템 개발에 박차를 가하고 있다. 본 논문에서는 이러한 정보통신분야의 환경변화에 효율적으로 대처하기 위해 국내 환경을 고려한 전자적 표준개발환경의 기본 시스템 구성과 이를 지원하기 위한 XML기반 표준 정보 공유 및 교환을 가능하게 하는 차세대 표준 정보 유통망의 구조, 그리고 표준화관련 종합정보의 One-stop Service 통한 표준화 로드맵 역할을 포함하는 차세대 표준정보유통망기능 중 정보서버역할을 하는 표준화전용 보털 사이트(Standardization Vortal Site) 구축 프레임워크를 제시한다.

  • PDF

Wiki기반 건설 사업관리 전자매뉴얼 : 도시환경정비사업 사례연구를 통해 (Wiki-based Interactive Electronic Technical Manuals (IETM) for Construction Project Management : Through a Case Study of Urban Regeneration Projects)

  • 박문서;강성훈;이현수
    • 한국건설관리학회논문집
    • /
    • 제11권3호
    • /
    • pp.3-12
    • /
    • 2010
  • 최근 국내 외의 건설 프로젝트는 이해관계가 복잡해서 업무 흐름을 파악하기 어렵기 때문에 IETM(Interactive Electronic Technical Manual)을 이용하여 사업 참여자들의 의사결정을 지원하려는 연구가 진행되고 있다. 본래 IETM은 신속한 정보 처리가 가능해서 타 분야에 도입되었으나, 건설 사업은 정보의 변화 가능성이 높아서 정보 유지관리에 어려움이 있어 활성화 되지 못했다. 본 연구에서는 건설 사업관리 IETM이 정보 변화성을 수용하고 정보를 지속적으로 유지관리하기 위한 방법으로 위키의 정보 관리기능에 주목하여 위키 기반 시스템의 성공사례를 바탕으로 특성을 분석하고 건설 분야 적용을 위한 요소를 추출하였다. 이를 바탕으로, 건설 사업의 이해관계로 인한 의도적 파괴를 방지하고 프로세스 중심의 특성을 반영하기 위한 IETM 시스템 모델을 제시하고 건설 사업관리 분야의 특성을 대표할 수 있는 도시환경정비사업 절차에 대한 IETM 프로토타입을 구현하였다. 파일럿테스트 결과, 위키 기반 전자매뉴얼은 유지관리측면에서 기존의 결과 중심적인 지식 형성 과정에 의사소통을 가능하게 함으로써 건설 사업 수행 중의 의사소통 프로세스를 개선할 수 있는 것으로 나타났다.

디지털 홀로그래픽 보안 인증 시스템 (Digital Holographic Security Identification System)

  • 김정회;김남;전석희
    • 대한전자공학회논문지SP
    • /
    • 제41권2호
    • /
    • pp.89-98
    • /
    • 2004
  • 본 논문에서는 랜덤 위상 암호화된 기준빔을 이용한 광 보안 기술과 생체 인식기술을 접목시킨 새로운 디지털 홀로그래픽 보안 시스템을 제안하고 구현하였다. 일반적인 광보안 시스템의 암호화된 아날로그 영상이 아닌 지문 및 얼굴사진, 문서 정보 등을 포함하는 디지털 정보가 홀로그래픽 메모리의 다중화 기술에 의해 저장되었다. 랜덤 위상 마스크는 기준빔을 암호화하여 불법 복제를 방지하는 복호화 키로 사용되었고, 64×64 크기를 갖는 2차원 위상 마스크를 통해 3.6×10-4의 Raw BER과 4㎛의 매우 높은 위치 선택도를 얻을 수 있었다. 또한 실시간 정보 추출을 위해 위치 제어 센서가 필요 없는 저가의 판독기 구현에 적합한 기록패턴과 영상 신호처리를 개발하였으며, 홀로그램 지문 정보와 사용자의 지문 정보를 비교 검증함으로서 타인에 의한 불법 도용의 위험성을 제거하였다.

VR 핸드트레킹을 통한 상호작용 인터페이스 설계 (Interactive Interface Design Through VR Hand Tracking)

  • 이주상;이효승;최우진
    • 한국전자통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.213-218
    • /
    • 2023
  • VR HMD를 사용하기 위해서는 양손에 별도의 컨트롤러를 통한 조작이 요구된다. VR 내에서의 텍스트 입력을 위한 방식으로는 컨트롤러를 사용하여 화면상의 가상 키보드 자판을 하나씩 선택하는 방식, 컴퓨터와 VR을 연결하여 컴퓨터의 자원인 키보드를 통해 입력하는 방식, 또는 무선 키보드를 구매하여 VR과 무선키보드 연결 방식으로 입력할 수 있다. 이처럼 현재 VR 장비에서의 텍스트 입력 방식은 사용자에게 불편 및 추가적인 비용을 발생시킨다. 이러한 이유 등으로 VR관련 콘텐츠의 대부분은 게임 또는 뷰어 등 단순 기능에 국한되어 VR 장비가 단순 게임기로 인식될 우려가 있다. 이에 본 연구에서는 Oculus Quest2 디바이스에서 제공되는 핸드 트래킹을 이용한 멀티입력 인터페이스를 설계하고 일부 구현한다. 이를 통해 VR 장비를 사용하여 게임 뿐만 아니라 문서작업, 업무처리 등 다양한 작업을 편리하게 사용할 수 있기를 기대한다.

양방향 RNN과 학술용어사전을 이용한 영문학술문서 교정 방법론 (Methodology of Automatic Editing for Academic Writing Using Bidirectional RNN and Academic Dictionary)

  • 노영훈;장태우;원종운
    • 한국전자거래학회지
    • /
    • 제27권2호
    • /
    • pp.175-192
    • /
    • 2022
  • 자연어 처리 기술을 접목한 컴퓨터 보조 언어 학습 연구가 진행되고 있지만, 기존 영문교정은 일반적인 영어 문장을 기반으로 연구되어, 격식을 갖춘 문체와 전문적인 기술 용어를 사용하는 학술 영문의 경우 그 특성을 반영하지 못한 교정 결과를 제공한다. 또한 문장의 문법적 완성도 향상을 위한 다수의 기존 연구는 교정을 통한 문장 전달력 향상의 한계점이 존재한다. 따라서, 본 논문은 전문적인 기술 용어 사용을 기반으로 문장의 명확한 의미 전달을 목적으로 하는 학술 영문을 위한 자동 교정 방법론을 제안한다. 제안 방법론은 오탈자 교정과 문장 전달력 개선 두 단계로 구성된다. 오탈자 교정 단계는 입력된 오탈자와 문맥에 적합한 교정 단어를 제공한다. 문장 전달력 개선 단계는 원문과 교정문의 쌍으로부터 학습할 수 있는 양방향 순환신경망 기계번역 사후교정 모델을 기반으로 문장의 전달력을 개선한다. 실제 교정 데이터를 이용한 실험을 수행하였으며, 정량적·정성적 분석을 통해 제안 방법론의 우수성을 검증하였다.

한국의 기록물 둥록 및 기술에 대한 기록관리적 접근 (Registration and Description of Public Records in Korea : A Comparative Analysis of Korean Recordskeeping System with the International Standards)

  • 시귀선
    • 한국기록관리학회지
    • /
    • 제3권1호
    • /
    • pp.69-92
    • /
    • 2003
  • 기록물의 등록과 기술은 기록물의 생산배경과 업무행위 관련 정보를 제공함과 동시에 그 이용을 가능하게 하고 검색을 편리하게 하는 데 있어 중요한 항목이다. 전자문서체제에서는 기록물이 일정기간 생산기관에서 활용되다가, 준활용단계가 되거나 비활용단계가 되어 기록물을 처리할 때에도 등록시 입력되었던 data 요소들이 그대로 활용되기 때문에, 전자기록체제 하에서 기록물의 등록사항은 과거 어느 때보다 중요한 요소가 되었다. 본고에서는 한국에서의 기록물 등록 및 기술사항을 국제표준과 비교 분석하여 다음과 같이 제안하였다. 우선 등록부분에서는 기본등록단계에 내용기술을 넣어, 첨부여부 쪽수 결재사항 등을 기술하도록 하고, 각기 항목으로 되어 있는 첨부번호, 결재권자, 확인란 등은 생략한다. 세부등록단계에서는 발송방법, 발송등록 분류등록 전체 수정, 특수목록 등을 생략하되, 등록할 필요가 있는 것은 내용기술에서 서술한다. 다음으로 체제 판본 문서링크 적요 등 기록물의 구조와 등록된 체제가 어떤 것인지에 대한 정보 즉 생산맥락 및 링크 등을 등록항목에 넣도록 한다. 기술부분에서는 우선 다층기술을 채택하되, 퐁과 시리즈 계층의 기술을 도입한다. 국제표준정리기술규칙인 ISAD(G)와 ISAAR(CPF)를 적용하여 전거통제 정보 및 비고영역과 마찬가지로 체계와 구조에 관한 정보, 예컨대 기록물의 범위 및 내용, 기술단위의 한도 및 매체, 행정 기관연혁 검색도구 등과 아키비스트의 주기 및 기록물 이력 기록물처리 기록(Documentation)을 기술할 수 있는 새로운 기술표준을 마련하되, 전자기록물 관리에 필수적으로 요구되는 항목들을 편입한다. 또한 제안된 사항을 실행하기 위해 법령개정이나 통합적으로 자동화도니 영구보존기록물관리 시스템을 조정하며, 등록과 기술을 수행할 훈련받은 전문인을 배치한다.