• 제목/요약/키워드: 동적 문서

검색결과 228건 처리시간 0.021초

전자상거래 머천트 시스템에서의 원투원 마케팅을 위한 데이터마이닝 시스템의 설계 및 구현 (Design and Implementation of A Data Mining System for One-to-One Marketing in EC Merchant Systems)

  • 김종달;홍정희;김성민;남도원;이동하;김성훈;이전영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.117-119
    • /
    • 1999
  • 전자상거래에서 판매 실적을 높이기 위한 효과적인 방법의 하나는 사용자에 따라 개별화된 정보의 제공, 즉 원투원 마케팅의 개념을 도입하는 것이다. 이를 위해서는 사용자의 구매 성향이나 사용자의 특성에 대한 지식베이스가 있어야 한다. 이러한 지식베이스로 데이터마이닝 기법중의 하나인 연관규칙을 도입하였다. 본 논문에서는 연관규칙을 기본 연산으로 하는 데이터마이닝 시스템의 설계와 구현을 기술하였다. 사용자와 제품간의 연관규칙을 추출하여 동적으로 제공되는 웹 문서를 생성하는데 필요한 지식베이스를 구축하였다. 또한 구축된 데이터마이닝 시스템은 연관규칙 탐사 엔진과 개념 계층 관리기로 구성되어 있으며, 대용량의 데이터를 다루기 위해 기존의 방법과는 다른 파일을 기반으로 한 빈번항목집합 인덱싱 기법을 제시하였다.

  • PDF

주제어 문장거리를 이용한 뉴스 편향성 분석 그래프 학습 (Graph Learning System for Analyzing Bias among News Using Keyword Distance Model)

  • 조찬우;조찬형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.533-538
    • /
    • 2023
  • 문서에서 저자의 의도와 주제, 그 안에 포함된 감성을 분석하는 것은 자연어 연구의 핵심적인 주제이다. 이와 유사하게 특정 글에 포함된 정치적 문화적 편향을 분석하는 것 역시 매우 의미 있는 연구주제이다. 우리는 최근 발생한 한 사건에 대하여 여러 신문사와 해당 신문사에서 생산한 기사를 중심으로 해당 글의 정치적 편향을 정량화 하는 방법을 제시한다. 그 방법은 선택된 주제어들의 문장 공간에서의 거리를 중심으로 그래프를 생성하고, 생성된 그래프의 기계학습을 통하여 편향과 특징을 분석하였다. 그리고 그 그래프들의 시간적 변화를 추적하여 특정 신문사에서 특정 사건에 대한 입장이 시간적으로 어떻게 변화하였는지를 동적으로 보여주는 그래프 애니메이션 시스템을 개발하였다. 실험을 위하여 최근 이슈에 대하여 12개의 신문사에서 약 2000여 개의 기사를 수집하였다. 그 결과, 약 82%의 정확도로 일반적으로 알려진 정치적 편향을 예측할 수 있었다. 또한, 학습 데이터에 쓰이지 않은 신문기사를 활용하여도 같은 정도의 정확도를 보임을 알 수 있었다. 우리는 이를 통하여 신문기사에서의 정치적 편향은 작성자나 신문사의 특성이 아니라 주제어들의 문장 공간에서의 거리 관계로 특성화할 수 있음을 보였다. 할 수 있다.

  • PDF

Fuzzy-FMEA를 이용한 동적위치제어 시스템의 고장유형 우선순위 도출 (Prioritizing for Failure Modes of Dynamic Positioning System Using Fuzzy-FMEA)

  • 백경동;김성신;천성표;서흥원;이대형
    • 한국지능시스템학회논문지
    • /
    • 제25권2호
    • /
    • pp.174-179
    • /
    • 2015
  • 동적 위치제어 시스템(Dynamic Positioning System)의 위험성과 신뢰성 평가에 FMEA(Failure Mode and Effect Analysis)를 적용하고 있으나, 해양 프로젝트가 가진 특징으로 인해 다음과 같은 한계를 가진다. 1) SCADA(Supervisory Control and Data Acquisition) 시스템을 통해 수집되는 고장 데이터의 일부는 환경의 영향으로 인한 오작동이나 단순한 센서고장으로 인해 생성되는 데이터를 포함하고 있으므로 불완전하고 신뢰할 수 없다. 따라서, FMEA의 세 가지 변수인 심각도(Severity), 발생빈도(Occurrence), 검출빈도(Detection)의 평가는 전문가 지식에 근거한다. 2) 전문가들의 주관적인 판단에 전적으로 의존할 경우 위험 요소들을 정밀하게 평가하기 어렵다. 3) 위험 요소들 사이의 상대적인 중요도는 고려되지 않아 위험우선순위가 명료하게 표현되지 않는다. 4) 서로 다른 고장모드에 대해 동일한 위험 우선순위 값을 가질 경우 상대적인 중요도를 판단하기 어렵다. 이러한 문제점을 극복하고 기존의 FMEA의 효과를 높이기 위해, Fuzzy-FMEA를 제안하고, 선박/해양 프로젝트의 동적 위치제어 시스템의 FMEA 문서에 적용하였다. 본 논문은 DP FMEA, DP FMEA 입증 시험서(DP FMEA Proving Trials)에 나타낸 전문가 지식을 퍼지 모델로 구현하여 FMEA 위험우선순위(RPN; Risk Priority Number)에 위험요소들의 상대적인 중요성을 포함시켰다. 제안한 방법은 해양 프로젝트의 동적 위치제어 시스템의 기계 및 전장 장비에 적용하여 기존의 FMEA와 비교하였다.

사용자 기기에서 이용한 웹 데이터 분석을 통한 사용자 취향 분석 방법 (An Analysis Method of User Preference by using Web Usage Data in User Device)

  • 이승화;최형기;이은석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.189-199
    • /
    • 2009
  • 최근 인터넷 상에 정보가 방대해지면서 사용자의 요구에 맞는 정보 필터링과 개인화 서비스가 매우 중요해지고 있다. 특히 전자상거래 분야에서 상거래를 활성화시키고 정보 제공자에 대한 만족도와 충성도를 높이기 위해, 사용자의 취향을 기반으로 한 정보 추천은 필수적인 요소가 되었다. 기존 추천 시스템은 사용자의 관심 정보를 기술한 사용자 프로파일을 대부분 정보 제공자 측에서 각각 개별적으로 수집하고 이를 기초로 추천 서비스를 제공한다. 따라서 사용자의 정보는 각 정보 제공자 측에 분산되어 존재하며, 사용자 정보가 부족한 서버에서는 초기에 추천 전략을 세우기 어렵다는 문제가 있다. 또한 사용자정보를 가지고 있는 서버의 경우에도 사용자가 해당 서버를 주기적으로 방문하지 않았다면, 사용자의 동적인 취향 변화를 반영하기 어렵다. 따라서 본 논문에서는 사용자의 행동을 통합적이고, 지속적으로 관찰할 수 있는 사용자 기기에서, 사용자가 이용한 웹 문서 분석을 통해 사용자의 관심 분야를 추론하고, 이를 다른 정보 제공자가 이용하는 새로운 구조의 추천 시스템을 제안한다. 또한 제안 시스템은 보다 효율적인 프로파일 생성을 위해, 웹 페이지에서 식별된 정보 블록에서 관심 단어를 추출하고, 앵커 태그를 분석하여 사용자의 이동 경로를 추적하는 특징을 포함하고 있다. 이러한 제안 시스템의 특징을 통해, 사용자 정보가 부족한 상점에서도 초기에 개인화 서비스 제공이 가능해지며, 사용자가 평소에 이용하는 웹 문서로부터 프로파일을 생성함으로써, 사용자의 동적인 취향 변화를 반영할 수 있다. 또한 정보 블록에서 취향 정보를 추출하는 알고리즘을 통해 보다 빠르고 정확한 프로파일 생성이 가능해진다. 본 논문에서는 최근 구매 활동이 있었던 사용자들의 웹 검색 히스토리와 구매 데이터를 이용하여 제안 시스템의 추천 정확도와 프로파일 분석에 소요되는 시간 측면의 이득을 실험하였으며, 그 결과를 통해 시스템의 유효성을 확인하였다.

부정적 피드백과 강화학습을 이용한 사용자 프로파일 학습 (Learning for User Profile Based on Negative Feedback and Reinforcement Learning)

  • 손기준;임수연;이상조
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.754-759
    • /
    • 2007
  • 정보추천은 동적인 사용자의 정보요구를 기준으로 문서들을 선별하여 제시한다. 사용자의 정보요구는 하나 이상의 단어들로 구성된 프로파일로 표현이 되며, 문서의 추천 과정 동안에 발생하는 사용자의 관련성 평가를 통해 구체적인 내용으로 변할 수 있다. 기존 연구의 경우 사용자는 자신이 직접 관련성 평가에 참여하여 평가 정보를 입력하고, 사용자가 평가한 긍정적 피드백 정보를 이용하여 사용자 프로파일을 학습한다. 본 연구는 사용자가 평가한 긍정적 피드백, 부정적 피드백 정보와 강화학습을 이용한 사용자 프로파일의 학습 방법을 제안한다. 제안된 방법과 기존의 긍정적 평가 정보만을 이용한 방법의 성능을 측정하기 위해 동일한 토픽에 대한 추천 성능을 비교 실험하였다. 실험한 결과 제안된 방식에 의한 추천성능이 긍정적 평가 정보만을 이용한 피드백 방법보다 나은 성능을 보였다.

Multi-pass Sieve를 이용한 한국어 상호참조해결 (Korean Coreference Resolution using the Multi-pass Sieve)

  • 박천음;최경호;이창기
    • 정보과학회 논문지
    • /
    • 제41권11호
    • /
    • pp.992-1005
    • /
    • 2014
  • 상호참조해결은 문서 내에서 선행하는 명사구와 현재 등장한 명사구 간에 같은 개체를 의미하는 지를 결정하는 문제로 정보 추출, 문서분류 및 요약, 질의응답 등에 적용된다. 본 논문은 상호참조해결의 규칙기반 방법 중 가장 성능이 좋은 Stanford의 다 단계 시브(Multi-pass Sieve) 시스템을 한국어에 적용한다. 본 논문에서는 모든 명사구를 멘션(mention)으로 다루고 있으며, Stanford의 다 단계 시브 시스템과는 달리 멘션 추출을 위해 의존 구문 트리를 이용하고, 동적으로 한국어 약어 리스트를 구축한다. 또한 한국어 대명사를 참조하는데 있어 중심화 이론 중 중심의 전이적인 특성을 적용하여 가중치를 부여하는 방법을 제안한다. 실험 결과 F1 값은 MUC 59.0%, B3 59.5%, Ceafe 63.5%, CoNLL(평균) 60.7%의 성능을 보였다.

구조화된 그래픽 표현을 위한 XML 기반의 SVG 저작 시스템 (SVG Editing System based on XML for Structured Graphic Representation)

  • 김택천;김진수;정회경
    • 한국정보통신학회논문지
    • /
    • 제8권8호
    • /
    • pp.1661-1669
    • /
    • 2004
  • 인터넷의 급속한 발전은 기존의 정적인 웹을 탈피하여 사용자들로 하여금 더욱더 동적이고 다양한 컨텐츠를 요구하는 형태로 바뀌어 가는 실정이다. 이에 따라, SVG(Scalable Vector Graphics)는 기존의 인터넷에서 사용되던 비트맵 기반의 디스플레이 보다 훨씬 정교한 그래픽 표현을 제공하기 때문에 기능이나 장치 호환성의 문제없이 벡터 그래픽을 표현한다. 또한, 그래픽에 대한 논리적인 구조를 기술함으로써 인덱싱, 검색, 저장 또는 공유가 가능하도록 정의하고 있다. 그러나 복잡한 SVG 구문을 자세히 모르고도 편리하고 SVG 그래픽을 구현할 수 있는 SVG 저작 시스템이 요구되고 있다. 이에 본 논문에서는 SVG에 관한 기초기술 연구 및 구조화된 SVG 문서를 사용자 중심의 편집 인터페이스를 통해 일반 사용자들이 손쉽게 그래픽 객체를 직접 저작함에 따라 복잡한 SVG 구문을 자동으로 생성하는 SVG 문서 저작 시스템을 설계 및 구현한다.

XML을 이용한 전자카달로그 편집기 설계 및 구현 (The Design and Implementation of EDI Editor using XML)

  • 백현기
    • 한국콘텐츠학회논문지
    • /
    • 제2권2호
    • /
    • pp.42-46
    • /
    • 2002
  • 전자상거래의 급속한 성장으로 기업간이나 기업과 고객간에 많은 정보나 문서의 이동이 불가피하게 되었다. 그래서 전자상거래에 있어서 정보의 표준을 만들고 관리하는 것이 중요한 성공 요소로 작용하고 있다. 전자 카달로그 시스템이나 EDI 환경에서의 정보의 표준을 만드는 작업은 XML이 나오기 전까지 매우 어렵고 비용이 많이 드는 작업이었다. 그러나 SGML과 HTML의 장점들을 가진 XML의 등장으로 정보의 표준을 만드는 것이 용이해 졌다. 특히 전자상거래는 이질적인 시스템이 존재하고 표준화가 절실히 요구되는 분야로서 XML 활용하는 것이 아주 적절하다. 즉 XML은 웹 환경을 기본 인터페이스로 하기 때문에 이질적인 시스템 환경 하에서도 잘 운용될 수 있는 측면과 표준화된 형태로 정보를 저장하기 때문에 표준화된 문서를 만들고 전송하는데 효율적으로 사용될 수 있는 측면에서 큰 장점이 있다. 이에 본 논문은 XSLT를 사용하여 브라우저 컨트롤에서 미리 볼 수 있게 하였다. 그리고 동적 DLL을 이용하여 XML 카달로그 편집 시스템을 설계 및 구현한다.

  • PDF

Spark 프레임워크 기반 비정형 빅데이터 토픽 추출 시스템 설계 (A Design on Informal Big Data Topic Extraction System Based on Spark Framework)

  • 박기진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.521-526
    • /
    • 2016
  • 온라인상에서 다루어지는 비정형 텍스트 데이터는 대용량이면서 비구조적 형태의 특성을 가지고 있기 때문에, 기존 관계형 데이터 모델의 저장 방식과 분석 방법만으로는 한계가 있다. 더군다나, 동적으로 발생하는 대량의 소셜 데이터를 활용하여 이용자의 반응을 실시간으로 분석하기란 어려운 상황이다. 이에 본 논문에서는 대용량 비정형 데이터(문서)의 의미를 빠르고, 용이하게 파악하기 위하여 데이터 셋에 대한 사전학습 없이, 문서 내 단어 비중에 따라 자동으로 토픽(주제)이 추출되는 시스템을 설계 및 구현하였다. 제안된 시스템의 토픽 모델링에 사용될 입력 단어는 N-gram 알고리즘에 의하여 도출되어 복수 개의 단어도 묶음 처리할 수 있게 했으며, 또한, 대용량 비정형 데이터 저장 및 연산을 위하여 Hadoop과 분산 인메모리 처리 프레임워크인 Spark 기반 클러스터를 구성하여, 토픽 모델 연산을 수행하였다. 성능 실험에서는 TB급의 소셜 댓글 데이터를 읽어 들여, 전체 데이터에 대한 전처리 과정과 특정 항목의 토픽 추출 작업을 수행하였으며, 대용량 데이터를 클러스터의 디스크가 아닌 메모리에 바로 적재 후, 처리함으로써 토픽 추출 성능의 우수성을 확인할 수 있었다.

경계변수 값의 동적인 변경을 이용한 점층적 클러스터링 알고리즘 (Incremental Clustering Algorithm by Modulating Vigilance Parameter Dynamically)

  • 신광철;한상용
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1072-1079
    • /
    • 2003
  • 본 논문은 점층적으로 대규모 문서 분류를 할 수 있는 새로운 클러스터링 알고리즘에 대한 것으로, 고차원의 대규모 문서 집합에 대한 클러스터링을 수행하는 spherical k-means (SKM) 알고리즘과 점층적인 방식으로 클러스터링을 수행하는 퍼지(fuzzy) ART(adaptive resonance theory) 신경망의 특징을 이용하였다. 즉, SKM의 벡터 공간 모델과 개념벡터를 토대로 퍼지 ART의 경계변수의 개념을 결합한 것이다. 제시하는 알고리즘은 점층적 클러스터링의 지원과 함께 최적의 클러스터 수를 자동으로 결정할 뿐 아니라 이상치(outlier)와 노이즈(noise)에 의한 overfitting의 문제도 해결하였다. 또한 생성된 클러스터들의 질을 평가할 수 있는 응집도를 측정하는 목적 함수의 값에 있어서도 CLASSIC3 데이타 집합으로 실험한 결과 기존의 SKM에 비해 평균 8.04%의 향상된 응집도를 나타냈다.