• 제목/요약/키워드: 전자문서처리

검색결과 457건 처리시간 0.035초

CIS를 이용한 그레이레벨 이미지 스케닝시스템 구현에 관한 연구 (A Study on Graylevel Image Scanning System Realization Using CIS)

  • 김영빈;김윤호;류광렬
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.581-584
    • /
    • 2002
  • 본 논문은 CIS를 이용한 문서의 전자문서화 또는 OMR, OCR 인식에 적합한 고속 스캐너스케닝시스템 설계 및 구현에 관한 연구이며 설계기법은 CIS스케닝 센서를 고정한 상태에서 스텝모터를 이용한 기구적 조사방식을 적용하였다. 최적화 시스템을 구현하기 위해 전용의 영상처리프로세서를 사용하였다. 센서를 통해 피딩 스텝단위의 라인 당 입력된 데이터는 시스템 메모리에 저장되고 스케닝 종료위치에 이르면 페이지 당 보관된 메모리의 데이터는 USB 인터페이스 방식을 이용하여 PC로 전송하도록 설계하였다. 구현된 시스템은 소형이며 최대 A4 사이즈의 이미지 스케닝이 가능하고 이미지 스케닝 시스템 처리속도는 초당 300mm를 유지한다. 인식률은 OCR과 바 코드에서 98%이다.

  • PDF

문어체에서 대화체 문장 패턴기반 영한 번역기로의 특화 (Customizing a Pattern-based English-Korean MT System: From Written Style to Spoken Style)

  • 최승권;이기영;노윤형;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.136-140
    • /
    • 2010
  • 본 논문은 지식경제부의 지원 하에 한국전자통신연구원 언어처리연구팀에서 2010년에 개발하고 있는 패턴기반 영한 메신저 대화체 문장 번역 시스템에 관한 것이다. 본 논문의 목표는 문어체 문장 위주의 패턴기반 영한 웹문서 자동번역 시스템을 대화체 문장 위주의 패턴기반 영한 메신저 자동번역 시스템으로 전환하고자 할 때, 특화하는 방법 및 모듈에 관해 기술하는 것이다. 영어권 Native speaker로부터 수집한 메신저 대화체 문장을 대상으로 번역률을 평가한 결과, 문어체 위주의 영한 웹 자동번역 시스템은 71.83%인 반면, 대화체 위주의 영한 메신저 자동번역 시스템은 76.88%였다. 대화체 문장을 대상으로 번역률을 5.05% 향상시킬 수 있었던 이유는 본 논문에서 제시한 특화 방법을 따른 결과라고 할 수 있다.

  • PDF

공공 정보자원 가치증대 방안에 관한 연구 (A Study on ways to increase the value of Information Resource in the public sector)

  • 이재두;이종우;김은주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1742-1745
    • /
    • 2012
  • 올해 초 한국 전자정부가 유엔에서 연속 세계 정상수준으로 평가 받았다. 이는 지난 20여 년간 약 20여조의 예산을 정보화 부문에 투자한 결과라 해도 과언이 아니다. 다른 한편에서는 그동안 국가정보화를 추진하면서 기투자한 정보자원에 대한 운영부담이 가중되고 있다. 이제 정보자원들을 어떻게 관리하고 활용할 것인가는 공공부문에서 중요한 현안이 되고 있다. 이는 주위 환경변화에 따른 정보자원의 의미와 가치를 재점검할 필요성과 바뀐 상황에 맞게 체계화가 필요한 시기임을 시사하고 있다. 본 고에서는 이러한 문제의식을 갖고 공공부분의 정보자원관리에 대한 전반적 상황에 대한 개관과 함께 대응방안을 제시하고자 한다. 이를 위해서 지금까지는 정보자원을 조직 활동을 위한 투입요소의 시각에서만 접근했지만, 향후는 조직 활동 수행에 필수적인 정보자산의 개념으로 접근해야 할 필요성이 있다. 이를 위해 공공부문 정보자원관리에 대한 제반현상을 문서중심으로 조망하고 이에 따른 대응방안을 살펴보고자 한다. 이 연구결과는 정보자원 관리와 관련된 업무 및 연구를 할 때 정책적 시사점으로 참조하거나, 향후 실증적인 관련연구를 위한 기초자료로 활용되기를 기대한다.

RFID를 이용한 언어 학습기의 설계 및 구현 (Design and Implementation of Language Learning Device by Using RFID)

  • 최광원;김남형;박진웅;유영준;안정호;김진환;박찬영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.3-5
    • /
    • 2010
  • 최근 학습 패러다임은 문서 중심에서 지식 및 정보 기반으로 크게 변화하고 있다. 또한 유비쿼터스 사회로의 전환을 맞이하여 다양한 USN 기술 기반의 학습 연구가 활발히 진행 중이다. 그 중 RFID 기술 기반의 학습 연구에서는 대부분 유비쿼터스 학습 환경 구축에 관한 연구가 주를 이루고 있다. 따라서 실질적인 학습에 적용하는 연구의 결과는 미미하다. 본 논문에서는 RFID기술 기반의 다국어 학습기를 구현하였다. 태그를 인식하여 특정 사물을 사용자로 하여금 모국어뿐만 아니라 다국어로도 변역하여 여러 가지 언어들을 학습할 수 있게 지원하는 장치이다. 실험에서는 13.56Mhz의 RFID 및 PXA255A ARM보드 사용하여 학습기를 제작하여 효율성 테스트를 하였다.

FPGA를 이용한 하드웨어 기반 고성능 XML 파싱 기법 (Hardware-Based High Performance XML Parsing Technique Using an FPGA)

  • 이규희;서병석
    • 한국통신학회논문지
    • /
    • 제40권12호
    • /
    • pp.2469-2475
    • /
    • 2015
  • 다양한 웹 서비스들은 서비스의 제공을 위해서 구조화된 표준문서인 XML(eXtensible Markup Language)을 널리 사용하고 있으며, 모바일 환경에서의 전자문서 및 전자서명 그리고 메일시스템에서도 XML이 사용되고 있다. XML을 사용하기 위해서는 문서의 파싱이 요구되며, 이는 XML 처리에서 가장 계산 집중적 작업이다. 따라서, XML 파싱 성능을 높이기 위해 하드웨어 기반의 파서들이 제안되어 성능 향상에 초점을 맞추고 있지만 실제 파싱 기법들에 대한 연구는 거의 이루어지지 않았다. 본 논문에서는 파서의 종류와 상관없이 사용될 수 있는 고성능 XML 파싱 기법을 제안하고 FPGA를 이용하여 파서를 설계하여 검증하였다. 제안된 파싱 기법은 상태머신 대신에 엘리먼트 분석기들을 사용하며 다중바이트 단위 엘리먼트 매칭을 수행한다. 제안된 파싱 기법은 CPB 항목에서 약 2~4배의 소비 클록을 감소시켰으며 파싱 이전에 전처리작업을 요구하지 않는다. 다른 파서들과 비교하여 제안된 파서는 약 1.33~1.82배 속도를 향상시켰다. 따라서, 제안된 파싱 기법은 실시간 XML 파싱이 가능하며 일반적인 XML 파서들에서도 적용할 수 있는 적합한 구조를 갖는다.

프리픽스 매취 조인을 이용한 XML 문서에 대한 분기 경로 질의 처리 (Branching Path Query Processing for XML Documents using the Prefix Match Join)

  • 박영호;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.452-472
    • /
    • 2005
  • 본 논문에서는 정보 검색(Information Retrieval, IR) 기술과 새로운 인스턴스 조인 기술을 이용하여 방대하고도 이질적인 XML 문서들에 대한 부분 매취 질의(Partial Match Query)를 처리하는 새로운 방법으로, XIR-Branching을 제안한다. 부분 매취 질의는 경로 표현식에 조상-후손 관계성(descendent-or-self axis) "//"를 가지는 질의로 정의되며, 선형 경로 표현식(Linear Path Expression, LPE)과 분기 경로 표현식(Branching Path Expression, BPE)으로 구분된다 일반적 형식의 부분 매취 질의는 분기하는 경로들을 만드는 분기 조건들을 가진다. XIR-Branching의 목적은 이질적인 스키마들을 가진 방대한 문서들에 주어지는 부분 매취 질의를 효과적으로 지원하는 것이다. XIR-Branching은 관계형 테이블을 사용하는 전통적인 스키마-레벨 방법들(XRel, XParent, XIR-Linear[21])에 그 기초를 두고, 역 인덱스(inverted index) 기술과 새롭게 소개하는 인스턴스-레벨 조인 기술인 프리픽스 매취 조인(Prefix Match Join)을 사용하여 질의 처리 효율성과 확장성을 향상시킨다. 전자는 LPE를 처리하기 위한 기술로 XIR-Linear[21]에서 사용한 방법이다. 후자는 BPE를 처리하기 위한 기술로 본 논문에서 새롭게 제안하는 기술이며, 전통적인 방법에서 사용하는 포함 관계 조인(containment join) 보다 효과적인 방법으로 결과 노드(result node)를 찾는다. 기존 연구인 XR-Linear는 역 인덱스를 사용하여 LPE 처리에 우수한 성능을 보이고 있지만, BPE 처리 방법을 다루지 않았다. 그러나. 더욱 구체적이고 일반적인 질의를 위해서는 BPE도 처리할 수 있어야 한다. 본 논문에서는 BPE까지 다룰 수 있는 새로운 방법으로 기존의 XIR-Linear를 확장한 XIR-Branching을 제안한다. 제안하는 방법은 스키마-레벨 방법으로 질의 대상 후보 집합을 크게 줄인 후, 인스턴스-레벨 조인 방법인 프리픽스 매취 조인으로 최종 결과 집합을 효과적으로 구하는 방법이다. XIR-Branching의 우수성을 보이기 위해 기존 BP포 처리 방법인 XRei, XParent와 비교 분석을 수행한다. 마지막으로, 성능 평가를 통하여 XIR-Branching이 기존 방법들에 비해 수십에서 수백배 효과적이고 확장성 또한 뛰어남을 보인다.

교육용 PDA 컨텐츠 브라우저의 설계 및 구현 (Design and Implementation of a Browser for Educational PDA Contents)

  • 신재룡
    • 한국정보통신학회논문지
    • /
    • 제6권8호
    • /
    • pp.1223-1233
    • /
    • 2002
  • 최근 들어 언제 어디서나 손쉽게 사용할 수 있는 PDA를 기반으로 한 다양한 종류의 전자책(E-Book)들이 개발되고 있다. 이 전자책의 부피와 무게가 기존의 책에 비해 작기 때문에 휴대하기 편하다. 그리고 검색, 책갈피, 사전 기능과 칼라 이미지, 사운드, 동영상 재생 기능 등과 같은 다양한 기능이 제공됨에 따라 내용 전달이 손쉽다 이러한 장점들 때문에 전자책 관련 제품들이 많이 출시되고 있다. 그러나 교육용 컨텐츠 관련 상품은 극히 적은 실정이다. 그 이유는 교육용 컨텐츠의 경우 전자책의 일반적인 기능뿐만 아니라 문제풀이와 같은 추가적인 기능을 갖추어야 하기 때문이다. 따라서 교육용 컨텐츠를 위한 컨텐츠 브라우저와 편집기 개발이 현실적으로 필요한 상황이다. 이에 렬 논문에서는, 교육용 컨텐츠를 XML로 표현하고 문서 구조를 XML 스키마로 정의한다. 그리고 컨텐츠 작성용 편집기와 PDA 상에서 교육용 컨텐츠를 처리할 수 있는 브라우저를 설계하고 구현한다.

텍스트 마이닝 기반의 온라인 상품 리뷰 추출을 통한 목적별 맞춤화 정보 도출 방법론 연구 (A Study on the Method for Extracting the Purpose-Specific Customized Information from Online Product Reviews based on Text Mining)

  • 김주영;김동수
    • 한국전자거래학회지
    • /
    • 제21권2호
    • /
    • pp.151-161
    • /
    • 2016
  • 개방, 공유, 참여를 특징으로 하는 웹 2.0 시대로 들어서면서 인터넷 사용자들의 데이터 생산 및 공유가 쉬워졌다. 이에 따른 데이터의 기하급수적인 증가와 함께 디지털 정보의 대부분인 비정형적 데이터(Unstructured Data)의 양도 증가하고 있다. 인터넷에서 정해진 형식 없이 자연어 형태로 만들어진 비정형 데이터 중, 특정 상품들에 대해 개인이 평가한 리뷰들은 해당 기업이나 해당 상품에 관심이 있는 잠재적 고객에게 필요한 데이터이다. 많은 양의 리뷰 데이터에서 상품에 대한 유용한 정보를 얻기 위해서는 데이터 수집, 저장, 전처리, 분석, 및 결론 도출의 과정이 필요하다. 따라서 본 연구는 R을 이용한 텍스트 마이닝(Text Mining) 기법을 사용하여 텍스트 형식의 비정형 데이터에서 자연어 처리 기술 및 문서 처리 기술을 적용하여 정형화된 데이터 값을 도출하는 방법에 대해 소개한다. 또한, 도출된 정형화된 리뷰 정보를 데이터 마이닝 기법에 적용하여 목적에 맞게 맞춤화된 리뷰 정보를 도출시키는 방안을 제시하고자 한다.

The LEX System : HL7을 사용하는 전자의무기록의 효율적인 교환과 공유를 위한 XML기반 통합의료환경의 구축 (A Medical Integration Framework based on XML for efficient exchange and sharing of Electronic Health Record using HL7)

  • 이민경;정재헌;전종훈;유수영;김보영;최진욱
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.769-778
    • /
    • 2002
  • LEX(Lifelong EHR based on XML)시스템은 이질적인 병원정보시스템을 가진 병원들이 HL7 메시지를 생성하고, 이를 통해 의료정보를 효율적으로 공유하고 교환할 수 있는 중앙의 임상데이터베이스(Central Clinical DataBase/CCDB)를 구축하는 XML 기반의 의료정보통합 프래임 워크이다. 본 논문에서는 기존의 병원정보시스템에 독립적인 HL7 메시지 서버 연동방식을 제안하여 HL7 메시지를 생성하고, 생성된 메시지를 효율적으로 저장하고 검색하기 위한 환자중심의 XML데이터베이스 스키마를 제안한다. 또한 HL7 메시지를 새로운 구조의 XML문서로 변환하기 위한 DTD를 제안함으로써 기존의 방식보다 저장공간을 절약하고, 효율적인 환자중심의 검색을 지원하는 방안을 제시한다.

다중바이트 기반 스트리밍 XML 하드웨어 파서의 설계 (Design of Multibyte-based Streaming XML Hardware Parser)

  • 이규희;서병석
    • 전자공학회논문지
    • /
    • 제52권9호
    • /
    • pp.135-140
    • /
    • 2015
  • 웹 서비스들은 데이터의 표현과 전송을 위해 구조화된 문서 XML을 채택하고 있다. SOAP나 REST는 XML을 이용하여 메시지를 송/수신하는 대표적 시스템들이다. XML 파서는 이벤트 기반과 DOM 기반 파서들로 나눌 수 있는데, 고속의 작업을 위해서 이벤트 기반인 스트리밍 파서가 널리 사용되지만, 순차 처리되는 특성을 갖기 때문에 성능향상에 제약이 있다. 본 논문에서는 스트리밍 파서에서의 순차 처리 특성을 해결하여 고성능 파서를 제안하기 위해 다중바이트 기반 하드웨어 파서를 제안한다. 제안된 구조는 다른 파서들과 비교하여 문자 비교에 사용되는 소비 클록의 수가 약 2.72배 감소하였고 약 7.8Gbps의 시스템 성능을 갖는다. 따라서, 제안된 MStreXHP 파서는 고성능 시스템들에서 스트리밍 XML 파서에 적합한 구조를 갖는다.