• 제목/요약/키워드: 문서과

검색결과 2,264건 처리시간 0.033초

가중치가 부여된 베이지안 분류자를 이용한 스팸 메일 필터링 시스템 (Spam-Mail Filtering System Using Weighted Bayesian Classifier)

  • 김현준;정재은;조근식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1092-1100
    • /
    • 2004
  • 최근 인터넷의 급속한 성장과 더불어 전자메일(E-Mail)은 통신 및 정보, 의사교환의 필수적인 매체로 사용되어지고 있다. 그러나 편리하고 비용이 들지 않는 장점을 이용해 엄청난 양의 스팸 메일이 매일같이 쏟아져 오고, 그 문제의 심각성에 정보통신부는 ‘정보통신망 이용촉진 및 정보보호등에 관한 개정안’이라는 새로운 법률까지 만들었다. 본 논문에서는 기존의 문서 분류에 널리 쓰이던 나이브 베이지안 분류자(naive Bayesian classifier)보다 개선된 가중치가 부여된 베이지안 분류자 (weighted Bayesian classifier)와 정보통신부의 개정안을 준수하는 매일을 분류하기 위한 전처리 단계, 그리고 사용자의 행동을 학습하여 보다 정확한 분류를 가능하게 지능형 에이젼트(intelligent agent)가 결합된 형태의 스팸 메일 필터링 시스템(spam mail filtering system)을 제안한다. 제안된 시스템에서는 사용자가 직접 규칙을 넣을 필요 없이 학습한 데이타를 가지고 자동적으로 스팸 메일을 분류할 수가 있는데, 특히 이메일의 특징 추출(feature extraction)을 이용하여 상대적으로 스팸/논스팸 판별에 비중이 큰 단어들에 대해 가중치를 부여함으로서 필터링의 성능향상을 도모하였다. 실험에서는 제안된 시스템의 최적의 성능 평가를 위해서 일반 나이브 베이지안 필터링시의 성능과 이메일 헤더정보, 특정 Tag들 그리고 하이퍼링크 부분에 가중치를 준 베이지안 필터링, 마지막으로 4가지를 결합한 상태의 필터링 성능을 각각 비교 분석하였다. 그 결과 제안하는 시스템이 나이브 베이지안 분류자를 이용한 시스템보다 정확도에서는 5.7% 저조한 성능을 보였으나, 재현율에서 33.3%, F-measure에서 31.2% 우수한 성능향상을 보였다.

효율적 XML키워드 검색을 인덱스 분할 및 합병 (Partitioning and Merging an Index for Efficient XML Keyword Search)

  • 김성진;이형동;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.754-765
    • /
    • 2006
  • 일반적으로 XML 키워드 검색에서 검색 결과는 질의 키워드들을 모두 포함하는 가장 작은 원소(최소 공통 선조)로 정의되며 색인의 기본 단위는 XML 원소가 된다. 기존의 인덱스 구조 하에서는 질의 키워드를 포함한 각 원소의 조합으로 생성된 모든 최소 공통 선조가 검색 결과로 고려된다. 본 논문에서는-불필요한 최소 공통 선조 산출 연산을 피하고 검색 시간을 단축시키기 위한 목적으로-인덱스를 파티션이라고 불리는 물리적 단위로 분할하고 질의 처리 시 필요에 따라 파티션을 동적으로 합병하여 검색 결과를 산출하는 기법을 기술한다. 주어진 깊이 이상의 최소 공통 선조가 검색 결과로 반환되어야할 경우, 검색 시스템은 제안된 인덱스 구조 하에서 동일 파티션에 속한 원소들 간의 조합만으로 검색 결과를 반환함으로써 검색 시간을 단축시킬 수 있다. 검색 결과에 대한 깊이 제한이 주어지지 않을 경우에도 검색 시스템은 분할된 인덱스를 사용하여 검색 결과를 얻을 수 있으며, 이때 분할되지 않은 기존의 인덱스를 사용하는 검색과 동일한 시간이 소요된다. 실험은 DBLP 사이트와 INEX2003에서 제공되는 XML 문서들로 진행되었으며, 제안된 인덱스는 검색 결과의 최소 깊이가 주어질 경우 질의 처리 시간을 상당히 감소시켰다.

기록물용 KORMARC 데이터필드 개발을 위한 메타데이터 요소에 관한 연구 (The Study on the Metadata Elements to Develop KORMARC Datafield for Archives)

  • 박진희
    • 정보관리학회지
    • /
    • 제22권3호
    • /
    • pp.351-378
    • /
    • 2005
  • 본 연구는 기존의 도서관정보시스템에서 기록물을 검색 이용할 수 있도록 기록물용 KORMARC 데이터필드 개발을 위한 메타데이터 요소를 설정하였다. 본 연구의 결과를 요약하면 다음과 같다. 첫째, 본 연구에서는 ISAD(G)2에서 제시하고 있는 7개 영역 외에 보존영역(conservation area)과 물리적 기술영역(physical description area)을 추가하였다. 그리고 ISAD(G)2는 26가지 요소만을 제시하고 있어 상세수준의 기술요소를 필요로 하는 기관에서는 불충분하다는 선행연구에서 제시된 문제점을 보완하기 위해 분석결과를 토대로 영역별 하위요소를 종합하여 선정하였다. 둘째 우리나라 기록물의 특수성을 기술요소에 반영하기 위해 사무관리규정시행규칙과 전자정부 구현을 위한 행정업무 등의 전자화 촉진에 관한 법률에서 제시하고 있는 종이 공문서 및 전자문서 서식의 분석을 통해 선정한 기록물 기술요소를 추가하였다. 또한 공공기관의 기록물 관리에 관한 법률 시행령에서 규정하고 있는 공개여부 및 등급, 공개일자, 공개범위, 보존기간, 보존등급, 보존가치, 기록물의 상태기술 요소를 추가하였다. 셋째, 기록물 관리를 위해 512 생산일자 관련주기(creation dates note)와 555 검색보조도구주기(finding aids note), 583 작업현황 주기(action note), 584 추가주기(accumulation note) 데이터필드를 새롭게 설정하였다. 또한 245 표제저자 사항(title statement), 300 물리적 기술(physical description), 306 재생/연주시간(playing time), 506 접근제한주기(restriction on access note), 534 원본주기(origin version note), 535 원본/사본의 소장처주기(location of originals/duplicates note) 540 이용과 복제제한에 관한 주기(terms governing use and reproduction notes), 541 직접적 출처주기(immediate source of acquisition note), 545 행정연혁/개인이력주기(biographical or historical note), 581 출판주기(publication note), 850 소장처(holding institution) 데이터필드의 식별기호를 재구성, 추가하였다.

자질 선택 기법을 이용한 한국어 화행 결정 (Decision of the Korean Speech Act using Feature Selection Method)

  • 김경선;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.278-284
    • /
    • 2003
  • 화행(speech act)이란 화자의 발화를 통해 나타나는 화자의 의도를 가르키며 자연어로 된 발화를 이해하고 이에 대한 응답을 생성하기 위해 중요한 요소이다. 본 논문에서는 한국어 화행 결정의 성능을 높이기 위해 두 단계 방법을 제안한다. 첫 번째 단계는 형태소 분석결과만을 이용하여 추출된 문장자질과 이전 화행을 이용하여 추출된 문맥자질 중 정보량이 높은 자질을 선택하는 단계이다. 이 단계에서는 형태소 분석 시스템을 사용하여 전체 자질을 구성하고 문서분류 분야의 자질 선택에서 높은 성능을 보인 카이제곱 통계량을 이용하여 효과적인 자질 선택한다. 두 번째 단계는 선택된 자질과 신경망을 이용하여 화행을 분석하는 단계이다. 본 논문에서 제시한 방법은 형태소 분석 결과만을 이용하여 자동적으로 화행을 결정할 수 있는 가능성을 제시하였으며 효과적인 자질 선택을 통해 자질의 수를 감소시키고 정보량이 높은 자질을 사용하여 속도와 성능을 향상 시켰다 본 논문은 제안된 시스템을 실제 영역에서 수집되어 전사된 10,285개의 발화와 17개의 화행으로 이루어진 대화 코퍼스에 대해 실험하였다. 본 논문은 이 코퍼스에서 8,349개 발화를 학습 코퍼스로 사용하여, 실험 코퍼스의 1,936개 발화에 대해 1,709개에 대해 정확한 화행을 제시하여, 88.3%의 정확도를 보였다. 이는 자질 선택을 하지 않았을 때 보다 약 8%가 증가된 결과이다.

개념적 시간관계 기반의 멀티미디어 프레젠테이션 저작 시스템 (A Multimedia Presentation Authoring System based on Conceptual Temporal Relations)

  • 노승진;장진희;성미영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권3호
    • /
    • pp.266-277
    • /
    • 2003
  • 모든 개념적 시간관계는 7가지의 관계(‘before’,‘meets’,‘starts’,‘finishes’,‘overlaps’, ‘during’,‘equals') 중 하나로 표현될 수 있다. 개념적 표현은 멀티미디어’저작 시스템의 자동 생성에 필요한 세부적 시간에 대해 효과적인 수단을 제공한다. 본 연구에서는 서로 다른 미디어들 간의 시간관계를 개념적으로 표현하는 사용하기 쉽고 효과적인 멀티미디어 프레젠테이션 저작 시스템을 개발하였다. 본 시스템을 구성하는 시간관계 편집기는 사용자에게 다른 편집기들로부터의 시간 정보를 간단하고 직접적인 그래픽 조작을 이용하여 프레젠테이션의 개념적 흐름을 직관적으로 표현할 수 있는 메커니즘을 제공한다. 본 시스템은 SMIL(Synchronized Multimedia Integration Language)에 기반한다. 본 시스템의 편집기들은 SMIL 객체 관리자를 통해 실시간으로 정보를 서로 교환하여 SMIL 코드를 자동 생성한다. 그리고, 본 시스템에서는 멀티미디어 프레젠테이션의 내부표현 구조로 TRN(Temporal Relation Network) 을 제안한다. TRN은 프레젠테이션의 흐름을 방향 그래프 구조로 표현한 것이다. TRN의 모든 병렬관계는 하나의 동기화된 블록으로 간소화될 수 있다. 이것은 컴포넌트들 간의 재생시간을 결정하는데 유용하며, 이미 구성되어 있는 프레젠테이션 문서를 재사용 할 때 그 기본단위로 이용될 수 있다. 또한, 멀티미디어 프레젠테이션 플레이어의 스케줄러로의 응용에도 적합하다.

오픈소스 도구를 이용한 기록정보 링크드 오픈 데이터 구축 절차 연구 (A Study on the Procedure for Constructing Linked Open Data of Records Information by Using Open Source Tool)

  • 하승록;임진희;이해영
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.341-371
    • /
    • 2017
  • 웹을 통해 제공되는 서비스는 현재 문서중심에서 데이터 중심으로 변화를 겪고 있으며, 그 변화의 중심에는 Linked Open Data(LOD)가 존재한다. 본 연구는 이러한 흐름에 부응하여 기록정보의 LOD 구축을 위한 구체적인 절차와 방법을 살펴보고자 하였다. 또한 소규모 아카이브의 서비스 지속가능성을 염두에 두고, 오픈소스 소프트웨어를 활용하여 LOD 구축 절차를 진행하는 범례를 제시하고자 했다. 이에 본 연구에서는 LOD 구축을 위한 5단계의 프레임워크를 제안했다. 그리고 일상아카이브인 '인간과 기억 아카이브'의 일기 기록물 컬렉션을 수집하여, 제안된 5단계 프레임워크에 따라 오픈소스 소프트웨어인 Protege와 Apache Jena Fuseki를 활용하여 POC(Proof of concept)를 진행하였다. 오픈소스를 활용하여 기록정보의 LOD를 구축한 뒤, 상호연결(Interlinking)과 SPARQL 검색을 통해서 외부 LOD와 연결되는 모습을 확인할 수 있었다. 또한 기록정보의 LOD 구축 절차 진행과정의 경험을 바탕으로 내용정보 기술의 품질 향상, 아키비스트의 역량 고도화, 기록정보의 접근성 향상을 위한 상호연결 고도화, LOD 서비스의 수준 결정, LOD 구축을 위한 도구 선정 등, 기록관 LOD 구축을 위한 필요요건을 제시했다.

적응형 웹 서핑 지원을 위한 에이전트 시스템 (An Agent System for Supporting Adaptive Web Surfing)

  • 국형준
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.399-406
    • /
    • 2002
  • 본 연구는 웹 서핑 지원을 위한 적응형 사용자 에이전트의 설계를 위해 사용자 데이터 수집, 데이터 처리를 통한 사용자 프로파일 구축 및 개선, 그리고 사용자 프로파일의 적용을 통한 적응 등 세 가지 이슈를 집중 연구하였다. 그 결과 웹 상에서 작동하는 적응형 사용자 에이전트를 위한 기능 정의 및 주요 구성 요소들을 설계하고 세부 모형을 구현하였다. 내부적으로는 두 개의 독립된 에이전트의 협동 체제에 의해 작업 목표를 성취한다. 이들은 각각 IIA(Interactive Interface Agent) 및 UPA(User Profiling Agent)이다. 사용자 인터페이스를 관장하는 IIA는 사용자에게 현재 웹 문서의 대강을 파악하고 나아가서 검색 질의어를 선택할 수 있게 하는 키워드 색인(Keyword Index)과, 계층 구조 방식의 사용자 검색 과정을 나타내는 제안 링크(Suggest Link)를 제공함으로서 사용자 친숙한 인터페이스 환경을 제시한다. UPA는 사용자에 관한 정적 정보와 브라우징 행위에서 나타나는 동적 정보를 사용자 프로파일에 반영한다. 특히, 사용자 관심을 반영하는 관심 벡터(Interest Vector)의 개념을 정립하고 근접도(similarity) 평가에 의해 이들을 갱신하고 추가함으로써 사용자 관심을 동적으로 프로파일링하는 체계를 제시하였다.

시공성을 위한 Dependency Structure Matrix 기반의 설계 프로세스 관리 모델 개발 (Development of Design Process Management Model using Dependency Structure Matrix for Constructability)

  • 박문서;함영집;이현수;김우영
    • 한국건설관리학회논문집
    • /
    • 제11권5호
    • /
    • pp.65-74
    • /
    • 2010
  • 시공단계의 경험 및 지식을 반영한 설계 결과물은 시공 효율성을 향상시키고 설계변경을 최소화하여 프로젝트의 낭비요인 제거와 전체적인 생산성 향상을 가능하게 해준다. 설계자가 설계단계에서 시공단계의 경험 및 지식을 효과적으로 활용하기 위해서는, 설계과정에서 필요한 시공성 지식을 필요한 시점에 활용할 수 있어야 한다. 설계단계에서 시공성 지식의 효과적인 활용을 위한 기존의 접근방법은 체크리스트와 같이 설계단계 별로 활용되는 시공성 지식의 구조화에 초점을 맞추고, 설계의 사결정과정의 기본단위가 되는 액티비티 수준에서 시공성 지식의 활용시점에 대한 고려가 부족하다. 하지만 적절하지 않은 시점에서 고려된 시공성 지식은 설계자에게 불필요한 재작업을 야기해 설계생산성을 저하시키는 문제를 발생시킬 수 있다. 이러한 비효율적인 정보교환을 최소화하기 위해서는, 설계 프로세스 상에서 정보흐름에 중점을 둔 설계관리를 통해 각 시공성 지식들을 요구하는 설계 액티비티가 무엇인지를 파악해야 한다. 이에 본 연구는 Dependency Structure Matrix(DSM)를 이용하여 설계의사결정과정의 기본단위가 되는 설계 익티비티와 설계과정에서 고려해야 하는 시공성 지식간의 상호관계를 고려한 정보흐름기반의 설계프로세스관리를 제안한다. 이는 설계프로세스관리를 설계단계에서의 단순한 설계검토보다 한 단계 높은, 건설프로젝트 전 과정과 연계된 포괄적인 관리활동으로 발전시켜 건설생산합리화에 크게 기여할 수 있으리라 예상된다.

전기지상지원장비 및 관제시스템 통합 개발을 위한 유럽 표준안 현황 (ECSS E70 Standard for developing common EGSE and MCS)

  • 허윤구;최종연
    • 항공우주산업기술동향
    • /
    • 제6권1호
    • /
    • pp.56-64
    • /
    • 2008
  • 위성체 총조립 및 시험(AIT; Assembly, Integration & Test)을 위한 전기지상지원장비(EGSE ; Electrical Ground Support Equipment)와 위성 임무 준비 및 운용을 위한 관제시스템(MCS; Mission Control System)은 동일한 시스템은 아니지만 많은 공통점과 호환 가능성을 갖고 있다. 하지만 우주 사업의 핵심 지상시스템인EGSE와 MCS는 사용 시기와 개발 조직이 달라서 오랫동안 별도로 개발 및 발전되어 왔다. 그러나 두 시스템이 기술적인 측면에서 유사한 기능과 역할을 하기 때문에 통합 또는 공통 개발에 대한 요구가 끊임없이 제기되고 있으며, 이미 세계적으로ECSS E70과 같은 관련 표준화 작업과 이를 바탕으로 실제 구현된 핵심 지상운영시스템의 개발이 최근에 기술적인 성숙을 이루고 있어 현재 거의 모든 우주 사업에서 핵심 지상운영시스템을 활용하거나 더 나아가 상용 제품을 적용하여 공통지상시스템을 개발하고 있다. EGSE와 MCS의 공통 기능에 관련된 표준화 작업은 ECSS를 통해 국제 표준(ISO, CCSDS 등)을 바탕으로 한 위성의 지상시스템에 대한 유럽 표준화 작업이 ECSS-E-70 Working Group에서 진행되고 있다. 여기서는 우주 산업에 관련된 표준화 단체인 ECSS에 대한 역사, 정책, 조직 및 문서 구조를 포함하여 ECSS에서 현재 진행되고 있는 지상시스템 및 운용 분야 관련 ECSS E70 표준화 작업의 내용 및 현황에 대해서 살펴보고자 한다.

  • PDF

멀티 캐스팅 기법을 통한 학습지원도구의 분석 및 설계 (Analysis and Design of Learning Support Tool through Multi-Casting Techniques)

  • 김정수;신호준;한은주;김행곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.727-730
    • /
    • 2001
  • 초고속 인터넷 서비스의 확대에 따라 이를 교육에 직 간접적으로 응용하기 위한 노력이 지속적으로 진행되어 왔다. 특히 웹 기반의 가상강의 저작도구를 통한 웹 코스웨어는 원거리 학습자들의 학습 욕구를 자기 주도적인 학습을 통해 가능케 했고 기존의 텍스트, 사운드를 통한 가상강의에서 동영상이 가미된 주문형 교육 서비스(EOD: Education On Demand)가 가능해졌다. 그러나 이를 이용하는 학습자는 전체적인 모듈의 이해를 통해 수업이 진행됨에 따라 학습과정에서는 질의응답을 튜터를 통해 웹 캐스팅이 이루어졌다. 따라서, 질의응답은 텍스트 형식의 E-mail, 채팅, 게시판, 방명록을 통해 이루어지므로 학습자가 요구한 질의 내용을 잘못 이해하고 튜터가 학습 과정에서의 피드백을 제공하지 못함으로써 개인 학습의 동기부여가 감소됨에 따라 흥미를 잃게 되었다. 본 논문에서는 이러한 문제점을 개선하기 위해 멀티 캐스팅 기법을 통해 교육용 서버를 이용한 학습지원도구를 분석, 설계한다. 가상강의는 기본적인 컨텐츠를 제시하고 그를 통해 수업이 진행되는 과정에서의 질의응답을 일대다(One-To-Many)의 멀티 캐스팅 서비스를 튜터가 지정한 교육용 서버를 통해 텍스트 형식이 아닌 강의자료로 쓰인 문서 파일에 직접 작성하여 전송하게 된다. 따라서 튜터는 메일링 서비스를 통해 질문사항을 자신의 폴더 서비스로 확인하고 즉시 학습자에게 피드백을 제공함으로써 튜터와 학습자들간의 커뮤니케이션이 활발히 이루어지며, 상호작용의 증가를 통해 웹 기반의 컨퍼런싱(WBC: Web Based Conferencing)을 가질 수 있게 된다.rver는 Client가 요청한 Content(services)를 전달 해 주는 컨텐트 전달 모듈(Content Deliver Module)과 서버 Phonebook 엑세스 모들(Server Phonebook Access Module)로 구성되어 있다.외 보다 높았다(I/O ratio 2.5). BTEX의 상대적 함량도 실내가 실외보다 높아 실내에도 발생원이 있음을 암시하고 있다. 자료 분석결과 유치원 실내의 벤젠은 실외로부터 유입되고 있었고, 톨루엔, 에틸벤젠, 크실렌은 실외뿐 아니라 실내에서도 발생하고 있었다. 정량한 8개 화합물 각각과 총 휘발성 유기화합물의 스피어만 상관계수는 벤젠을 제외하고는 모두 유의하였다. 이중 톨루엔과 크실렌은 총 휘발성 유기화합물과 좋은 상관성 (톨루엔 0.76, 크실렌, 0.87)을 나타내었다. 이 연구는 톨루엔과 크실렌이 총 휘발성 유기화합물의 좋은 지표를 사용될 있고, 톨루엔, 에틸벤젠, 크실렌 등 많은 휘발성 유기화합물의 발생원은 실외뿐 아니라 실내에도 있음을 나타내고 있다.>10)의 $[^{18}F]F_2$를 얻었다. 결론: $^{18}O(p,n)^{18}F$ 핵반응을 이용하여 친전자성 방사성동위원소 $[^{18}F]F_2$를 생산하였다. 표적 챔버는 알루미늄으로 제작하였으며 본 연구에서 연구된 $[^{18}F]F_2$가스는 친핵성 치환반응으로 방사성동위원소를 도입하기 어려운 다양한 방사성의 약품개발에 유용하게 이용될 수 있을 것이다.었으나 움직임 보정 후 영상을 이용하여 비교한 경우, 결합능 변화

  • PDF