• Title/Summary/Keyword: 온라인 문서

Search Result 215, Processing Time 0.026 seconds

Feature Expansion based on LDA Word Distribution for Performance Improvement of Informal Document Classification (비격식 문서 분류 성능 개선을 위한 LDA 단어 분포 기반의 자질 확장)

  • Lee, Hokyung;Yang, Seon;Ko, Youngjoong
    • Journal of KIISE
    • /
    • v.43 no.9
    • /
    • pp.1008-1014
    • /
    • 2016
  • Data such as Twitter, Facebook, and customer reviews belong to the informal document group, whereas, newspapers that have grammar correction step belong to the formal document group. Finding consistent rules or patterns in informal documents is difficult, as compared to formal documents. Hence, there is a need for additional approaches to improve informal document analysis. In this study, we classified Twitter data, a representative informal document, into ten categories. To improve performance, we revised and expanded features based on LDA(Latent Dirichlet allocation) word distribution. Using LDA top-ranked words, the other words were separated or bundled, and the feature set was thus expanded repeatedly. Finally, we conducted document classification with the expanded features. Experimental results indicated that the proposed method improved the micro-averaged F1-score of 7.11%p, as compared to the results before the feature expansion step.

A Study on the Risk of Personal Information-related Damage through the Exposure of Personal Information Documents and the Combination of pseudonym Information (개인정보 문서 노출과 가명정보 조합을 통한 개인정보 관련 피해 위험성 연구)

  • Kim, Min-Ju;Kim, Young-Eun;Lee, Jun-Min;Lee, Chang-Hyun;Ha, Jeong-Hee;Jeong, Jae-Wan;Kang, Dae-Myung;Kim, Yung-Chul;Heo, Won-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.207-210
    • /
    • 2020
  • 대부분의 공공기관과 기업에서 개인정보가 포함된 문서를 마스킹 처리하여 온라인상에 게재하고 있다. 이 때, 여러 검색 엔진에서 특정 키워드를 통한 검색 결과를 통해 개인정보가 포함된 문서들이 대량으로 노출되고 있으며 마스킹 처리가 된 정보라 하더라도 2개 이상의 부가 정보들을 조합해서 개인을 특정할 수 있는 문제가 발생할 수 있다. 이를 통해 얻은 개인정보와 개인을 특정할 수 있는 정보는 다양한 범죄 피해를 발생시킬 우려가 있다. 따라서 본 논문은 검색 엔진과 온라인상에서 노출되고 있는 개인정보가 포함된 문서들을 탐지한다. 그 후 발견된 문서들의 통계와 조사를 통해 온라인상에 노출 중인 개인정보와 가명정보 등이 초래하는 피해의 심각성을 재고하고, 대안을 제시하고자 한다.

온라인 인증서 상태 검증 프로토콜(OCSP)의 최근 연구 동향에 관한 분석

  • Kwak, Jin;Lee, Seung-Woo;Cho, Suk-Hyang;Won, Dong-Ho
    • Review of KIISC
    • /
    • v.12 no.2
    • /
    • pp.50-61
    • /
    • 2002
  • 최근 전자상거래의 활성화 및 안전한 네트워크의 구현에 공개키 기반구조의 응용이 확대되면서 공개키의 무결성과 신뢰성을 제공하기 위해 공개키 인증서 상태 검증에 관한 연구가 활발히 진행되고 있다. 본 고에서는 PKI 응용 프로토콜 중에서 인증서의 유효성을 검증하기 위한 온라인 인증서 상태 검증 프로토콜(Outline Certificate Status Protocol)의 최근 연구 동향에 대하여 분석하였으며, 현재 상용화되어 있는 제품들에 대하여 조사하였다. 또한, 특정 인증서에 대한 온라인 취소 상태 확인 서비스(ORS: Online Revocation Status), 인증 경로의 발견을 서버로 위임하는 대리 인증 경로 발견 서비스(DPD: Delegated Path Discovery), 그리고 중앙 집중 서버에게 인증 경로 검증의 기능을 위임하는 대리 인증 경로 검증 서비스(DPV: Delegated Path Validation) 등의 온라인 인증서 상태 검증 프로토콜에서 제공하는 서비스들에 대해서도 살펴보았다. 현재 온라인 인증서 상태 검증 프로토콜(OCSP)에 관한 문서는 IETF에서 표준화한 RFC2560과 2000년 11월과 2001년 3월에 제안된 드래프트가 있으며, 본 고에서는 RFC2560과 제안된 드래프트를 비교 분석하였으며 국내\ulcorner외 제품의 동향과 온라인 인증서 상태 검증 프로토콜의 활용 범위에 대해서 간략하게 살펴보았다.

TradeCard System for International Electronic Payment (국제전자결제를 위한 무역카드시스템에 관한 고찰)

  • Kang, Won-Jin
    • International Commerce and Information Review
    • /
    • v.2 no.2
    • /
    • pp.155-169
    • /
    • 2000
  • 본 연구는 새로운 국제 전자결제수단으로 개발된 무역카드(TadeCard)에 대한 검토와 활용 가능성에 관하여 검토한 것이다. 무역카드는 세계무역센터협회가 인터넷을 통하여 국제무역대금을 결제할 수 있는 전자결제시스템으로 개발되었다. 무역카드시스템은 제시되는 전자문서의 일치성 점검 및 국제무역거래의 모든 이행과정을 온라인(on-line) 상에서 전자적으로 이행되는 것을 특징으로 하고 있으며 부대비용 등 경제성 측면에서 여타 결제수단보다 우월한 결제시스템이라고 하고 있다. 그러나 가상공간을 통한 전자결제시스템은 거래당사자에게 대금지급의 확실성과 거래의 안정성 및 신속성 보장이 전제되어야 한다. 실제로 무역카드시스템은 특정 보증보험회사의 보증에 기반을 두고 있어 국제 기업간 거액거래상의 신용취급의 한계점과 금융네트워크 등에서의 취약점을 가지고 있다. 따라서 무역카드가 국제전자결제시스템으로 정착되기 위해서는 정보보안 등 기술적인 안정성이 검증되고 결제상의 신뢰성 보장을 위하여 상업은행들의 참여가 확대되어야 한다. 또한 인터넷상에서 결제가 이루어지기 위해서는 담보권과 유통성이 보장되는 볼레로전자선화 증권 등의 활용과 기존의 모든 종이문서에 의한 결제서류도 전자문서로 대체되어야 한다.

  • PDF

XML 기반의 기업간 수주처리시스템의 설계 및 구현

  • 조찬영;서준용;김재균;장길상
    • Proceedings of the Korea Association of Information Systems Conference
    • /
    • 2001.12a
    • /
    • pp.31-36
    • /
    • 2001
  • 최근 기업간 거래는 인터넷을 기반으로 하는 기업간 전자상거래(B2B: business to business electronic commerce)로 시간과 공간을 초월하여 이루어지고 있다. 따라서 국내·외 많은 기업들은 인터넷 기반의 비즈니스와 정보교환으로 업무 효율화 및 기업 경쟁력 강화에 중점을 두고 있다. 최근 온라인 환경의 인터넷 EDI 방식에 많은 기업들이 관심을 가지고 있으며, 전통적 EDI방식의 문제 해결방안으로 웹 문서를 많이 활용하고 있다. 또한, 현재까지 웹 문서는 HTML을 사용하여 정의되고 있는데, 이러한 HTML은 간편한 사용과 높은 이식성을 가진다. 그러나 기업간 발생하는 다양한 문서양식을 표현하기 힘들며, 기업간 서로 상이한 정보시스템에서 발생되는 거래 데이터 등의 통합이 불가능하다 그래서 최근 HTML의 한계를 극복할 수 있는 새로운 언어로 XML이 등장하여 인터넷 기반의 B2B에서 기업간 정보 교환에 적용되어 질 수 있다. 따라서 본 연구에서는 기존 웹 기반의 기업간 수주처리시스템에 XML 언어를 사용한 기업간 데이터 통합 방안을 제시한다. 또한 이를 ‘H’기업에 적용하여 프로토타입 시스템을 구현하고, 그 기대효과를 제시한다.

  • PDF

Development of Internet Online Survey System (인터넷 온라인 설문조사 시스템 개발)

  • Jeon, Seung-Won;Lee, Won-Ho;Jung, Jin-Ho;Shim, Jae-Jeong;Ko, Sung-Jea
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.403-405
    • /
    • 1998
  • 인터넷을 이용한 설문조사는 기존의 설문조사에 비해 저렴한 비용으로 빠른 시간내에 결과를 분석할 수 있다는 장점으로 인해 점점 이용이 증가하고 있다. 본 논문에서는 인터넷 상에서 온라인으로 설문문서의 작성에서부터 설문조사, 결과분석, 처리 및 가시화에 이르는 전 광정을 자동화한 새로운 설문조사 시스템을 제안한다. 제안하는 시스템은 설문문서 자동생성기를 통하여 설문조사 웹 페이지를 누구나 쉽게 만들 수 있고 CGI를 이용하여 인터넷과 데이터베이스를 자동으로 연동하였으며 자바 애플릿을 사용하여 설문결과를 그래프로 가시화 하였다. 또한 음성이나 동영상 등의 멀티미디어 파일을 첨부함으로써 설문대상자들의 관심과 흥미를 유도하여 설문결과의 신뢰도를 높였다. 그리고 제안하는 시스템을 이용하여 인터넷 상에서 실제 설문조사를 실시하여 시스템의 활용 가능성을 확인하였다.

  • PDF

A Study on the Types of Online Shopping Queries using Topic Modeling and Principal Components Analysis (토픽모델링과 주성분 분석을 활용한 온라인 쇼핑 검색 질의 유형 분류)

  • Kang, Hyeonah;Lim, Heuiseok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.765-768
    • /
    • 2020
  • 검색 질의 연구 분야의 대부분 선행 연구는 검색 질의 주제 분류에 집중되어 있으며 질의 자체에 대한 연구자의 정성적인 판단으로 분석되었다. 이는 검색 이후 클릭 된 문서를 고려하지 않고 진행되었다는 점과 분석 주제 및 활용 데이터가 제한적이라는 것에 한계가 있다. 이에 본 연구는 국내 대형 온라인쇼핑몰의 1년간의 검색로그를 활용하여 검색 질의와 검색 이후 조회한 문서명 정보를 기반으로 토픽모델링을 수행하여 검색 질의 주제를 정의하였다. 또한 검색 행동특성에 따른 주제별 성격을 정의하기 위하여 주성분 분석을 통해 주요 변수 추출 후 각 주제별 검색 행동특성을 분석하였다. 본 연구 결과는 효과적인 검색 서비스 구축 및 검색 시스템 개발에 기여 할 것으로 기대된다. 향후 연구로는 텍스트 분류기 모델링 실험을 통해 자동 분류 시스템을 구현할 수 있을 것이다.

A NIE Platform for Effective High-school Social Study (효과적인 고등학교 사회과 교육을 위한 온라인 NIE 플랫폼)

  • Lee, Jinhee;Jung, Guenseong;Cha, Jaehyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1644-1647
    • /
    • 2015
  • 신문을 활용하는 교육 방식을 NIE(Newspaper in Education)라고 한다. 매일 새로운 정보가 실리는 신문을 활용함으로써 교육적인 효과를 볼 수 있다. 신문 활용의 교육적인 장점으로 고등학교 사회과 수업에서 신문은 읽기 형태의 교재로 쓰이고 있다. 그런데 최근 인터넷의 발전으로 NIE활동에 온라인 신문의 활용이 늘고 있다. 하지만 온라인 신문을 교육에 활용하는 데는 몇 가지 문제점이 있다. 첫째, 신문을 직접 수집하는 자체의 번거로움. 둘째, 온라인에서 제공되는 신문에는 광고와 같은 노이즈에 노출이다. 마지막으로 인터넷 특성상 신뢰성이 낮은 정보가 많다는 점이다. 이러한 문제점을 해결하기 위해 본 논문은 온라인 신문기사를 문서형태로 수집하고 제공하는 시스템을 구현했다. 수집 시스템에 의해 저장된 기사는 구성주의 학습을 위한 온라인 토론학습 활동을 위해 쓰인다. 따라서 본 연구는 고등학교 사회과 NIE활동에 양질의 기사 정보를 제공하고 편리함을 주어 학습효과를 높이기 위한 시스템의 구현을 목표로 했다.

XML Document Analysis based on Similarity (유사성 기반 XML 문서 분석 기법)

  • Lee, Jung-Won;Lee, Ki-Ho
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.6
    • /
    • pp.367-376
    • /
    • 2002
  • XML allows users to define elements using arbitrary words and organize them in a nested structure. These features of XML offer both challenges and opportunities in information retrieval and document management. In this paper, we propose a new methodology for computing similarity considering XML semantics - meanings of the elements and nested structures of XML documents. We generate extended-element vectors, using thesaurus, to normalize synonyms, compound words, and abbreviations and build similarity matrix using them. And then we compute similarity between XML elements. We also discover and minimize XML structure using automata(NFA(Nondeterministic Finite Automata) and DFA(Deterministic Finite automata). We compute similarity between XML structures using similarity matrix between elements and minimized XML structures. Our methodology considering XML semantics shows 100% accuracy in identifying the category of real documents from on-line bookstore.

Development of Automatic Reference-Citation-Mark Attachment Support System (참고문헌 인용부호 자동부착 지원 시스템 개발)

  • Song, Kwangho;Min, Jihong;Kim, Yoo-sung
    • KIISE Transactions on Computing Practices
    • /
    • v.21 no.10
    • /
    • pp.623-630
    • /
    • 2015
  • In this paper, the design and implementation of an automatic reference-citation-mark attachment system are introduced. The system automatically attaches a citation mark to the end of a sentence in a technical document if the corresponding statement has a high similarity to another statement in the same document; simultaneously, the corresponding bibliographic data is automatically created from the cited-document information. In accordance with functional specifications, a Web-based, online service model and the development of its prototype system are proposed. The developed system can help in the elimination of unexpected plagiarism issues, and will alleviate the burdens of reference citation and reference-list creation for technical writers.