• 제목/요약/키워드: 문서 처리 자동화

검색결과 115건 처리시간 0.022초

RFID ODS 연동 e-Commerce 자동화 모델 (An Automated e-Commerce model based on RFID ODS)

  • 김태상;이긍해
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.519-522
    • /
    • 2007
  • 최근 인터넷이 대중화되면서 웹을 통한 전자상거래가 점차 늘고 있다. 이에 따라 웹 기반전자상거래를 위한 문서교환의 표준화 연구는 여러 기업의 참여 하에 활발히 진행 중에 있으나 아직까지 전자상거래의 일부 절차는 체계화되어 있지 않다. 가장 활발한 전자상거래형태인 오픈마켓을 통한 중계판매에서 상품제조업체, 판매업체, 오픈마켓(중계판매업체) 간의 전자적 상품정보(e-Catalogue)교환은 거의 이루어지지 않고 있다. 이런 이유로 오픈마켓을 통한 전자상거래에서 상품을 판매하는 판매업체는 상품정보를 직접 수집하거나 가공하여 이를 오픈마켓에 등록한다. 실제로 이러한 상품정보 교환 과정에서 많은 인력과 시간이 소비된다. 본 논문은 이러한 문제점을 해결하기 위해 RFID ODS 기술과 ebXML 기술을 활용하여 상품제조업체와 판매업체, 판매업체와 오픈마켓 간의 상품정보를 공유할 수 있도록 하는 새로운 모델을 제안한다.

통합전자문서체계구현을 위한 요구기능 분석 연구 -A사의 전자문서관리 사례를 중심으로- (A Study on System Requirements for Integrated Electronic Document Management System (IEDMS))

  • 권택문
    • 정보기술응용연구
    • /
    • 제2권1호
    • /
    • pp.55-81
    • /
    • 2000
  • 21세기 정보화 시대를 맞이하여 요즈음 전자행정에 대한 논의가 활발히 진행되고 있다. 종래의 작고 효율적인 사무행정조직이라는 협의의 시각에서 탈피하여 이제는 보다 광의의 관점에서 고객 중심적이고 양질의 정보서비스를 제공함으로써 행정의 효율성과 생산성을 증진시키는 것이 전자사무행정이라고 라고 보는 것이 타당하다. 그러나 지금까지 정부 기관을 중심으로 의욕적으로 추진되어온 전자행정을 위한 사무자동화 시스템 즉 전자결재 시스템은 업무의 생산성 향상에 크게 도움이 되지 못하였는데, 그 가장 큰 이유는 통합적 차원에서의 문서관리시스템 구축이 이루어지지 않고 전자결재위주의 시스템을 구축함으로서 문서의 생성 및 결재기능의 정보화에는 기여하였으나 생산된 문서에 대한 보관/보존/활용 및 폐기 활동에는 큰 도움이 되지 못하였기 때문이다. 따라서 문서의 생성, 결재, 유통, 배포, 검색, 활용, 보존, 폐기에 이르는 일련의 과정을 연속적으로 처리하는 통합전자문서관리시스템(IEDMS)의 구축이 필요하게 되었다. 본 연구는 이러한 인식을 바탕으로 현행전자문서관리체계의 문제점을 사례연구를 통해 분석한 후 통합전자문서관리체계 구현을 위한 시스템 요구기능을 도출함으로서 향후 전자문서관리체계 구축시 이를 하나의 기준으로 활용하도록 함으로서 효과적인 전자문서관리체계 정착에 기여하고자 한다.

  • PDF

개념간 관계의 추출과 명명을 위한 통계적 접근방법 (A Statistical Approach for Extracting and Miming Relation between Concepts)

  • 김희수;최익규;김민구
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.479-486
    • /
    • 2005
  • 온톨로지는 차세대 시맨틱 웹을 위한 논리의 기반을 구성하기 위해 제안되었다. 이러한 온톨로지는 특정 분야에 대한 지식을 정형화된 형태로 표현함으로써 기계에 의한 지식의 이해를 가능하게 하고, 이를 사용하여 사용자의 요구에 알맞은 지능화된 서비스를 제공할 수 있게 한다. 하지만, 온톨로지의 구축과 유지는 많은 사람의 시간과 노력을 요구한다. 본 고에서는 온톨로지 구축 방법의 일환으로, 문서로부터 온톨로지를 구성하는 개념간의 관계를 정의하는 자동화된 방법을 제안한다. 본 고에서 제안된 방법은 특정 분야의 문서에 존재하는 개념을 기반으로 개념간의 연관 규칙을 형성하는 개념 쌍을 찾고, 두 개념 사이에 존재하는 내용의 군집화를 통해 두 개념간의 관계를 설명하는 패턴을 찾는다. 마지막으로 패턴간의 군집화를 사용하여 개념 사이의 일반화된 관계를 명시한다. 본 고에서는 제안된 방법을 검증하기 위한 방법으로 TREC(Text REtrieval Conference)에서 제공하는 문서집합을 사용하여 개념간의 관계를 추출, 평가하였으며, 그 결과 제안된 방법은 개념간의 관계를 설명하는 유용한 정보를 제공할 수 있음을 보여준다.

후방향 추론기법을 이용한 시멘틱 추론 시스템 (Semantic Inference System Using Backward Chaining)

  • 함영경;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.97-99
    • /
    • 2003
  • 대부분의 웹 문서들은 HTML이나 XML로 표현된 웹의 정보들은 Syntactic 구조를 기반으로 표현되기 때문에, 소프트웨어가 정보를 처리하는데 한계가 있다. HTML은 문서의 display안을 위한 tag기반의 문서 표현 방식이고, XML은 문서의 구조를 사람이 이해하기 쉽도록 제안된 표현 방식이기 때문이다. 따라서, HTML 및 XML로 표현된 정보들을 가지고 서비스를 제공하는 웹 에이전트들은 사용자들에게 의미있는 서비스를 제공하기 위해 오프라인 상에서 많은 수작업을 수행해야만 했다. 이와 같은 문제점을 극복하기 위해서 미국과 유럽에서는 시멘틱 웹에 대한 연구를 활발히 진행하고 있다. 시멘틱 웹은 기존의 웹과는 달리 소프트웨어가 이해하고 처리 할 수 있는 형태(machine processable)로 정보를 표현하기 때문에 오프라인 상에서 수행되던 많은 작업들을 에이전트가 이해하고 처리할 수 있게 되었다. 그러나. 온톨로지를 구축하는 과정에서도 필연적으로 정보의 31(Incorrect, incomplete, Inconsistence)가 나타나고, 서비스의 결과 또한 온톨로지에 의해 좌우된다는 단점이 있다. 본 논문에서 제안하는 후방향 추론기법을 이용한 추론엔진은 다음과 같은 시스템을 제안한다. 첫째. 시멘틱 웹을 이용함으로써 소프트웨어 에이전트의 자동화 시스템을 제안한다. 둘째 은톨로지 정보의 한계성을 극복하기 위해 규칙기반의 후방향 추론 기법을 사용하는 시멘틱 추론엔진을 제안한다. 본 논문에서 제안하는 후방향 추론기법을 이용한 시멘틱 추론시스템은 사용자의 질의를 입력받아. 온톨로지와 시멘틱 웹 문서의 정보를 이용하여 후방향 추론을 수행함으로써 웹 정보의 불완전성을 완화하고, 온톨로지의 영향력를 감소시킴으로써 웹 서비스의 질을 향상시키는데 목적이 있다.RED에 비해 향상된 성능을 보여주었다.웍스 네트워크상의 다양한 디바이스들간의 네트워크 다양화와 분산화 기능을 얻을 수 있었고, 기존의 고가의 해외 솔루션인 Echelon사의 LonMaker 소프트웨어를 사용하지 않고도 국내의 순수 솔루션인 리눅스 기반의 LonWare 3.0 다중 바인딩 기능을 통해 저 비용으로 홈 네트워크 구성 관리 서버 시스템 개발에 대한 비용을 줄일 수 있다. 기대된다.e 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의 임신 기간에, 출산시체중(出産時體重) $3.50{\sim}3.99kg$사이의 아이에서 그 주산기사망률(周産基死亡率)이 각각 가장 낮았다. 2. 사산(死産)과 초생아사망(初生兒死亡)을 구분(區分)하여 고려해 볼때 사산(死産)은 모성(母性)의 임신력(姙娠歷)과 매우 밀접한 관련이 있는 것으

  • PDF

다중 기계학습 방법을 이용한 한국어 커뮤니티 기반 질의-응답 시스템 (A Korean Community-based Question Answering System Using Multiple Machine Learning Methods)

  • 권순재;김주애;강상우;서정연
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1085-1093
    • /
    • 2016
  • 커뮤니티 기반 질의 응답 시스템은 사용자 질의에 대한 정답을 인터넷 커뮤니티에 사용자들이 게시했던 문서 중에서 선택하여 제공하는 시스템이다. 기존 방법들은 질의 분석의 성능 향상을 위하여 목적 영역에 적합한 규칙을 구축하거나 일부 처리 과정에 기계 학습을 적용하였다. 하지만 기존 방법들은 적용 영역을 확장하거나 수정하는 경우 많은 비용이 소요되며 경우에 따라서는 시스템이 특정 영역에 과적합되는 경우가 발생한다. 본 논문에서는 커뮤니티 기반 질의-응답 시스템의 효과적인 처리를 위해서 시스템의 각 과정에 적합한 기계 학습 방법을 적용하여 전체 과정을 자동화하는 다중 기계학습 방법을 제안한다. 제안 시스템은 사용자 질의를 분석하는 부분과 정답 문서를 선택하는 부분으로 나눌 수 있다. 질의 분석 과정은 질의의 초점 구문을 분석하는 질의 핵심부 추출기와 질의의 주제를 분류하는 질의 유형 분류기로 구성하였으며, 전자는 조건부 무작위장을 사용하고 후자는 지지 벡터 기계를 사용한다. 정답 문서 선택에서는 유사도 측정에서 사용하는 가중치를 인공 신경망으로 학습한다. 또한 인터넷에 커뮤니티에 게시된 데이터는 형태소 분석 결과를 신뢰할 수 없는 경우가 많이 발생한다. 따라서 음절 자질을 사용하여 질의를 분석 단계에서 형태소 분석의 영향을 최소화하는 방법을 제안한다. 제안하는 시스템은 Mean Average Precision 기준으로 0.765, R-Precision 기준으로 0.872의 성능을 보여 기존 시스템보다 성능이 우수하다.

검증 자료를 활용한 가짜뉴스 탐지 자동화 연구 (A Study on Automated Fake News Detection Using Verification Articles)

  • 한윤진;김근형
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권12호
    • /
    • pp.569-578
    • /
    • 2021
  • 오늘날 웹의 발전으로 우리는 각종 언론 매체를 통해 온라인 기사를 쉽게 접하게 된다. 온라인 기사를 쉽게 접할 수 있게 된 만큼 거짓 정보를 진실로 위장한 가짜뉴스 또한 빈번하게 찾아볼 수 있다. 가짜뉴스가 전 세계적으로 대두되면서 국내에서도 가짜뉴스를 탐지하기 위한 팩트 체크 서비스가 제공되고 있으나, 이는 전문가 기반의 수동 탐지 방법을 기반으로 하며 가짜뉴스 탐지를 자동화하는 기술에 대한 연구가 계속해서 활발하게 이루어지고 있다. 기존 연구는 기사 작성에 사용된 문맥의 특성이나, 기사 제목과 기사 본문의 내용 비교를 통한 탐지 방법이 가장 많이 사용되고 있으나, 이러한 시도는 조작의 정밀도가 높아졌을 때 탐지가 어려워질 수 있다는 한계를 가진다. 따라서 본 논문에서는 기사 조작의 발달에 따른 영향을 받지 않기 위하여 기사의 진위 여부를 판단할 수 있는 검증기사를 함께 사용하는 방법을 제안한다. 또한 가짜뉴스 탐지 정확도를 개선시킬 수 있도록 실험에 사용되는 기사와 검증기사를 문서 요약 모델을 통해 요약하는 과정을 추가했다. 본 논문에서는 제안 알고리즘을 검증하기 위해 문서 요약 기법 검증, 검증기사 검색 기법 검증, 그리고 최종적인 제안 알고리즘의 가짜뉴스 탐지 정확도 검증을 진행하였다. 본 연구에서 제안한 알고리즘은 다양한 언론 매체에 적용하여 기사가 온라인으로 확산되기 이전에 진위 여부를 판단하는 방법으로 유용하게 사용될 수 있다.

SPICE 유지보수 프로세스 심사 시스템 설계 및 구현 (Design and Implementation of Assessment System for SPICE Maintenance Process)

  • 권영오;고영철;김진원;구연설
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권2호
    • /
    • pp.141-154
    • /
    • 2002
  • 소프트웨어에 관련된 문제들을 프로세스 심사를 통하여 해결하고자 하는 노력이 확산되고 그 표준으로 IS0/1EC 15504(SPICE)가개발되었다. 이 논문에서는 SPICE에 근거한 프로세스 심사를 한국 SPICE 위원회의 심사운영 절차에 맞게 자동화 심사 도구로 설계하고 구현했다. 설계근거 문서는 ISO/[EC 15504의 표준문서와 SPICE 한국 위원회의 심사운영규정 그리고 적용사례 분석 논문을 기준으로 했으며 심사 대상 프로세스를 (ENG2)로 한정했다. 제안된 심사 시스템은 심사의 전 과정을 지원하고 각 심사단계의 목표와 결과물을 제시해 주며, 심사 결과물은 화면상에서 직접 작성되고 저장된다. 또한 등급 결정 시에는 저장된 모든 자료와 문서를 검색하여 참조함으로 심사의 신뢰성을 높이도록 설계했다. 예비심사 7단계와 현장심사 9단계의 모든 화면을 표준화시켜 친근감을 높였고, 표준 문서의 세부 내용과 심사 대상 프로세스의 목적, 성공적 구현결과 그리고 기본활동 및 입출력 산출물이 무엇인지 확인할 수 있도록 했다. 또한 달성도 입력과 동시에 자동으로 등급이 계산되어 그래픽 처리되어 나타난다. 제안된 심사 지원 시스템은 소프트웨어 개발 프로세스의 객관적인 심사와, 심사 프로세스의 정형화와 자동화를 통한 심사 비용의 절감 그리고 소프트웨어 개발 조직의 능력 판정과 자체 프로세스의 개선을 위한 프로세스 심사의 활성화에 기여할 것이다.

인터넷 문서의 자동분류 서비스 시스템에 관한 구현 (A Structure on Classification Service System of Internet Documents)

  • 황성하;최광남;이대규;이상호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 추계 종합학술대회 논문집
    • /
    • pp.66-71
    • /
    • 2005
  • 인터넷 정보를 검색하고 활용하는 것은 쉽고도 어려운 일이다. 많은 정보 중에서 원하는 정보를 얻기 위한 노력은 단순히 검색뿐만 아니라 정보의 수집에서 분류 및 가공, 활용에까지 각 분야별로 그 범위와 용도에서 다양한 기술의 발전이 급속히 진행되고 있다. 특히, 이러한 발전은 다양한 용도의 에이전트와 분류, 변환 등의 가공 기술에서 더욱 두드러지게 나타나고 있다. 또한, 시스템의 자동화를 통한 편리성을 제공한 다면 더욱 효과적인 정보관리가 이루어 질 것이다. 본 논문에서는 이러한 배경에서 인터넷 정보의 수집에서 자동 분류, 검색 서비스까지를 하나의 시스템에서 처리 할 수 있는 인터넷 문서 자동분류 서비스 시스템을 소개한다.

  • PDF

상향식 계층분류의 최적화 된 병합을 위한 후처리분석과 피드백 알고리즘 (Reinforcement Post-Processing and Feedback Algorithm for Optimal Combination in Bottom-Up Hierarchical Classification)

  • 최윤정;박승수
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.139-148
    • /
    • 2010
  • 본 논문은 자동화된 분류시스템의 성능향상을 위한 것으로 오분류율이 높은 불확실성이 강한 문서들의 범주결정방식을 개선하기 위한 후처리분석 방법과 피드백 알고리즘을 제안한다. 전통적인 분류시스템에서 분류의 정확성을 결정하는 요인으로 학습방법과 분류모델, 그리고 데이터의 특성을 들 수 있다. 특성들이 일부 공유되어 있거나 다의적인 특성들이 풍부한 문서들의 분류문제는 정형화된 데이터들에서 보다 심화된 분석과정이 요구된다. 특히 단순히 최상위 항목으로 지정하는 기존의 결정방법이 분류의 정확도를 저하시키는 직접적인 요인이 되므로 학습방법의 개선과 함께 분류모델을 적용한 이후의 결과 값인 순위정보 리스트의 관계를 분석하는 작업이 필요하다. 본 연구에서는 경계범주의 자동탐색기법으로 확장된 학습체계를 제안한 이전 연구의 후속작업으로써, 최종 범주를 결정하기까지의 후처리분석 방법과 이전의 학습단계로 피드백하여 신뢰성을 높일 수 있는 알고리즘을 제안하고 있다. 실험결과에서는 제안된 범주결정방식을 적용한 후 1회의 피드백을 수행하였을 때의 결과들을 단계적이고 종합적으로 분석함으로써 본 연구의 타당성과 정확성을 보인다.

문장 의도 분류와 개체명 인식을 활용한 개인정보 검출 및 비식별화 시스템 (Personal Information Detection and De-identification System using Sentence Intent Classification and Named Entity Recognition)

  • 서동국;김건우;김재영;이동호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1018-1021
    • /
    • 2020
  • 최근 개인정보가 포함된 비정형 텍스트 문서들이 유출되거나 무분별하게 공개됨으로써 정보의 주체는 물론 기업들까지 피해를 받고 있다. 데이터를 공개 및 활용하기 위해 개인정보 검출 및 비식별화 과정이 필수적이지만 정형 데이터와는 달리 비정형 데이터의 경우 해당 과정을 자동으로 처리하는 데 한계가 있다. 이를 위해 딥러닝 모델들을 사용하여 자동화하려는 연구들이 있었지만 문장 내 단어의 모호성에 대한 고려 없이 단어 개체명 정보에만 의존하여 개인정보를 검출하는 형태로 진행되었다. 따라서 문장 내 단어들 중 식별 대상인 단어들도 비식별화 되어 데이터에 대한 유용성을 저해할 수 있다는 문제점을 남겼다. 본 논문에서는 문장의 의도 정보를 단어의 개체명 학습 과정에 부가적인 정보로 활용하는 개인정보 검출 모델과 개인정보 데이터의 유용성을 고려한 비식별화 기법을 제안한다.