• 제목/요약/키워드: Line-Clustering

검색결과 206건 처리시간 0.356초

쇼핑 웹사이트 탐색 유형과 방문 패턴 분석 (Analysis of shopping website visit types and shopping pattern)

  • 최경빈;남기환
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.85-107
    • /
    • 2019
  • 온라인 소비자는 쇼핑 웹사이트에서 특정 제품군이나 브랜드에 속한 제품들을 둘러보고 구매를 진행할 수 있고, 혹은 단순히 넓은 범위의 탐색 반경을 보이며 여러 페이지들을 돌아보다 구매를 진행하지 않고 이탈할 수 있다. 이러한 온라인 소비자의 행동과 구매에 관련된 연구는 꾸준히 진행되어왔으며, 실무에서도 소비자들의 행동 데이터를 바탕으로 한 서비스 및 어플리케이션이 개발되고 있다. 최근에는 빅데이터 기술의 발달로 소비자 개인 단위의 맞춤화 전략 및 추천 시스템이 활용되고 있으며 사용자의 쇼핑 경험을 최적화하기 위한 시도가 진행되고 있다. 하지만 이와 같은 시도에도 온라인 소비자가 실제로 웹사이트를 방문해 제품 구매 단계까지 전환될 확률은 매우 낮은 실정이다. 이는 온라인 소비자들이 단지 제품 구매를 위해 웹사이트를 방문하는 것이 아니라 그들의 쇼핑 동기 및 목적에 따라 웹사이트를 다르게 활용하고 탐색하기 때문이다. 따라서 단지 구매가 진행되는 방문 외에도 다양한 방문 형태를 분석하는 것은 온라인 소비자들의 행동을 이해하는데 중요하다고 할 수 있다. 이러한 관점에서 본 연구에서는 온라인 소비자의 탐색 행동의 다양성과 복잡성을 설명하기 위해 실제 E-commerce 기업의 클릭스트림 데이터를 기반으로 세션 단위의 클러스터링 분석을 진행해 탐색 행동을 유형화하였다. 이를 통해 각 유형별로 상세 단위의 탐색 행동과 구매 여부가 차이가 있음을 확인하였다. 또한 소비자 개인이 여러 방문에 걸친 일련의 탐색 유형에 대한 패턴을 분석하기 위해 순차 패턴 마이닝 기법을 활용하였으며, 같은 기간 내에 제품 구매까지 완료한 소비자와 구매를 진행하지 않은 채 방문만 진행한 소비자들의 탐색패턴에 대한 차이를 확인할 수 있었다. 본 연구의 시사점은 대규모의 클릭스트림 데이터를 활용해 온라인 소비자의 탐색 유형을 분석하고 이에 대한 패턴을 분석해 구매 과정 상의 행동을 데이터 기반으로 설명하였다는 점에 있다. 또한 온라인 소매 기업은 다양한 형태의 탐색 유형에 맞는 마케팅 전략 및 추천을 통해 구매 전환 개선을 시도할 수 있으며, 소비자의 탐색 패턴의 변화를 통해 전략의 효과를 평가할 수 있을 것이다.

유사성 기반 XML 문서 분석 기법 (XML Document Analysis based on Similarity)

  • 이정원;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.367-376
    • /
    • 2002
  • XML 문서가 가지고 있는 태그의 자유로운 정의와 내포된 구조 정보는 정보 검색 및 문서 관리 분야에 많은 이점을 제공할 수 있다. 본 논문은 XML 요소(element)의 의미와 구조 정보를 반영한 문서간의 유사성을 검사할 수 있는 XML 문서 분석 기법을 제시하고자 한다. 도출된 문서간 유사성은 많은 정보 검색 및 마이닝 등의 기초 자료로 사용될 수 있다. 먼저 XML 요소를 시소러스를 이용하여 유사어와 합성어로 구성된 확장-요소 벡터로 확장하고 유사 행렬을 구축하여 요소간 유사성을 판별한다. 또한 오토마타(NFA(Nondeterministic Finite Automata)와 DFA(Deterministic Finite Automata)(를 이용하여 XML 문서의 내포된 구조를 발견하고 최소화 한다. 요소간의 유사 행렬과 최소화된 XML 구조를 이용하여 구조간의 유사성을 판별한다. 본 논문의 XML의 의미를 반영한 유사성 분석 기법은 온라인 서점의 실제 문서의 카테고리를 인식하는 데 있어 100% 정확도를 보였다.

서명 검증을 위한 특정 기반의 FE-SONN (Feature Extraction based FE-SONN for Signature Verification)

  • 구건서
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.93-102
    • /
    • 2005
  • 본 논문은 퍼지 c-means 알고리즘의 퍼지 멤버십 등식을 신경망과 융합한 서명의 특징정보를 기반으로 하는 자율적인 자기조직화 신경망 모델 이용하여 서명 검증하는 방법을 제안하였다. 기존 온라인 서명인식 방법인 함수적 접근법과 매개변수적 접근법의 한계점을 개선하기 위해 자율적 클러스터 특징정보에 의해 서명 패턴 분류 접근법을 제안했다. 본 논문의 중요한 요소는 서명의 특징 정보를 36개의 전역적 특징 정보 정의와 12개의 지역적 특징 정보를 정의하였고, 이를 기반으로 FE-SONN에 학습하여 서명의 진위여부를 검증하는 검증시스템 구현에 있다. 총 713개의 서명을 가지고 실험하였으며, 원본 서명 155개와 시험용으로 위조 서명 180개와 본인이 작성한 진본 서명 378개를 테스트한 결과 97.67$\%$이상의 검증률을 얻을 수 있었다. 그러나 눈으로 식별이 불가능한 정교한 위조서명은 검증 시스템에서도 진위여부 판단에 어려움이 있다.

  • PDF

Imperatorin을 처리한 HL-60 백혈병 세포주에서 대규모 유전자 분석 발현 연구 (Studies on Gene Expression of Imperatorin treated in HL-60 cell line using High-throughput Gene Expression Analysis Techniques)

  • 강봉주;차민호;전병훈;윤용갑;윤유식
    • 동의생리병리학회지
    • /
    • 제18권4호
    • /
    • pp.1028-1035
    • /
    • 2004
  • Imperatorin, a biologically active furanocoumarin from the roots of Angelica dahurica (Umbelliferae), was mutagenic and induced transformation of mouse fibroblast cell lines, whereas it provided inhibiting effects on mutagenesis and carcinogenesis induced by various carcinogens. Furthermore, it has been suggested that imperatorin may have potential anticarcinogenic effects when administered orally in the diet. In addition to its anticarcinogenic properties, imperatorin has been shown to possess anticancer activities. We investigated the macro scale gene expression analysis on the HL-60 cells treated with imperatorin. Imperatorin (10μM) were used to treat the cells for 6h, 12h, 24h, 48h, and 72h. In a human cDNAchip study of 10,000 genes evaluated 6, 12, 24, 48, 72 hours after treated with imperatorin in HL-60 cells. Hierarchical cluster against the genes which showed expression changes by more than 2 fold. Three hundred eighty six genes were grouped into 6 clusters by a hierarchical clustering algorithm. Pathway analysis using gene microarray pathway prof Her that is a computer application designed to visualize gene expression data on screen representing biological pathways and groupings of genes.

공간 연속질의 처리에서 영역 기반의 저장 구조를 이용한 효율적인 디스크 접근 방법 (Efficient Disk Access Method Using Region Storage Structure in Spatial Continuous Query Processing)

  • 정원일
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2383-2389
    • /
    • 2011
  • 유비쿼터스 응용은 실시간으로 입력되는 데이터 스트림과 저장된 공간 데이터를 동시에 처리하는 이중적인 공간 연속 질의 처리 기술이 요구된다. 이러한 공간 연속 질의 처리에서는 대용량 공간 데이터에 대한 디스크 접근 비용을 최소화가 요구되나 기존 공간색인 기법은 논리적 인접성을 공간 데이터의 물리적인 인접성을 보장할 수 없으므로 공간 데이터 탐색에 있어 비용이 증가한다. 또한 데이터 인접성 보장을 위한 공간 순서화 기법의 경우에도 빈번하게 접근되는 질의 공간 영역에 대한 클러스터링을 고려하지 않고 있다. 본 논문에서는 이중적인 공간 연속질의 처리에서 공간 데이터의 효율적인 접근을 위한 영역 기반 저장 구조를 제안한다. 제안 기법에서는 영역을 기반으로 데이터를 인접하게 저장하고 사용자 질의를 영역 기반으로 그룹 처리함으로써 질의 처리 비용을 감소시킬 수 있다.

능동적 학습을 위한 군집화 기반의 다양한 복수 문의 예제 선정 방법 (Cluster-Based Selection of Diverse Query Examples for Active Learning)

  • 강재호;류광렬;권혁철
    • 지능정보연구
    • /
    • 제11권1호
    • /
    • pp.169-189
    • /
    • 2005
  • 능동적 학습은 훈련 예제의 수가 제한적일 때 효율적으로 분류기를 생성할 수 있는 학습 방법이다. 이 방법에서는 분류하기 모호한 예제에 카테고리를 부여하기 위한 문의 과정과 이렇게 얻어진 예제들을 추가해 가면서 분류기를 재생성 하는 과정을 반복적으로 수행한다. 특히 온라인 환경에서는 반복적으로 예제에 카테고리를 부여해야 하는 사용자의 부담을 줄이기 위해 문의 예제의 총 수뿐만이 아니라 문의 횟수 또한 최소화하여야 한다. 예제 수와 문의 횟수를 줄이면서도 좋은 분류기를 생성하기 위해서는 매 문의 시 사용자에게 다양하면서도 대표성이 높은 복수의 모호한 예제들을 선정하여 제시하는 것이 좋다. 본 논문에서는 다양하면서, 대표적이며, 또한 모호성이 높아 능동적 학습에 효과적인 복수의 문의 예제를 선별하기 위하여 군집화 기법을 활용하는 방안을 제안한다. 문서 분류 문제를 대상으로 본 제안 방안을 실험한 결과 모호성만을 기준으로 복수의 문의 예제를 선정하는 방법보다 우수한 분류기를 생성할 수 있음을 확인하였다.

  • PDF

청크 기반 MOLAP 큐브를 위한 비트맵 인덱스 (A Bitmap Index for Chunk-Based MOLAP Cubes)

  • 임윤선;김명
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.225-236
    • /
    • 2003
  • 다차원 온라인 분석처리 (MOLAP, Multidimensional On-line Analytical Processing) 시스템은 데이타를 큐브라고 불리는 다차원 배열에 저장하고 배열 인덱스를 이용하여 데이타를 엑세스한다. 큐브를 디스크에 저장할 때 각 변의 길이가 같은 작은 청크들로 조각내어 저장하게 되면 데이타 클러스터링 효과를 통해 모든 차원에 공평한 질의 처리 성능이 보장되며, 이러한 큐브 저장 방법을 ‘청크기반 MOLAP 큐브’ 저장 방법이라고 부른다. 공간 효율성을 높이기 위해 밀도가 낮은 청크들은 또한 압축되어 저장되는데 이 과정에서 데이타의 상대 위치 정보가 상실되며 원하는 청크들을 신속하게 엑세스하기 위해 인덱스가 필요하게 된다. 본 연구에서는 비트맵을 사용하여 청크기반 MOLAP 큐브를 인덱싱하는 방법을 제시한다. 인덱스는 큐브가 생성될 때 동시에 생성될 수 있으며, 인덱스 수준에서 청크들의 상대 위치 정보를 보존하여 청크들을 상수 시간에 검색할 수 있도록 하였고, 인덱스 블록마다 가능한 많은 청크들의 위치 정보가 포함되도록 하여 범위 질의를 비롯한 OLAP 주요 연산 처리 시에 인덱스 엑세스 회수를 크게 감소시켰다. 인덱스의 시간 공간적 효율성은 다차원 인덱싱 기법인 UB-트리, 그리드 파일과의 비교를 통해 검증하였다.

리얼 서버의 실시간 서버 모니터에 의한 최적 로드 밸런싱 알고리즘에 관한 연구 (A Study for an Optimal Load Balancing Algorithm based on the Real-Time Server Monitor of a Real Server)

  • 한일석;김완용;김학배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.201-204
    • /
    • 2003
  • At a consequence of WWW large popularity, the internet has suffered from various performance problems, such as network congestion and overloaded servers. These days, it is not uncommon to find servers refusing connections because they are overloaded. Web server performance has always been a key issue in the design and operation of on-line systems. With regard to Internet, performance is also critical, because users want fast and easy access to all objects (e.g., documents, graphics, audio, and video) available on the net. To solve this problem, a number of companies are exploring the benefits of having multiple geographically or locally distributed Internet sites. This requires a comprehensive scheme for traffic management, which includes the principle of an optimal load balancing of client requests across multiple clusters of real servers. This paper focuses on the performance analysis of Web server and we apply these results to load balancing in clustering web server. It also discusses the mam steps needed to carry out a WWW performance analysis effort and shows relations between the workload characteristics and system resource usage. Also, we will introduce an optimal load balancing algorithm base on the RTSM (Real-Time Server Monitor) and Fuzzy Inference Engine for the local status of a real server, and the benefits is provided with of the suggested method.

  • PDF

Whole Genomic Expression Analysis of Rat Liver Epithelial Cells in Response to Phenytoin

  • Kim, Ji-Hoon;Kim, Seung-Jun;Yeon, Jong-Pil;Yeom, Hye-Jung;Jung, Jin-Wook;Oh, Moon-Ju;Park, Joon-Suk;Kang, Kyung-Sun;Hwang, Seung-Yong
    • Molecular & Cellular Toxicology
    • /
    • 제2권2호
    • /
    • pp.120-125
    • /
    • 2006
  • Phenytoin is an anti-epileptic. It works by slowing down impulses in the brain that cause seizures. The recent microarray technology enables us to understand possible mechanisms of genes related to compounds which have toxicity in biological system. We have studied that the effect of a compound related to hepatotoxin in vitro system using a rat whole genome microarray. In this study, we have used a rat liver epithelial cell line WB-F344 and phenytoin as a hepatotoxin. WB-F344 was treated with phenytoin for 1 to 24 hours. Total RNA was isolated at times 1, 6 and 24h following treatment of phenytoin, and hybridized to the microarray containing about 22,000 rat genes. After analysis with clustering methods, we have identified a total of 1,455 differentially expressed genes during the time course. Interestingly, about 1,049 genes exhibited differential expression pattern in response to phenytoin in early time. Therefore, the identification of genes associated with phenytoin in early response may give important insights into various toxicogenomic studies in vitro system.

Screening for MiRNAs Related to Laryngeal Squamous Carcinoma Stem Cell Radiation

  • Huang, Chang-Xin;Zhu, Ying;Duan, Guang-Liang;Yao, Ji-Fen;Li, Zhao-Yang;Li, Da;Wang, Qing-Qing
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제14권8호
    • /
    • pp.4533-4537
    • /
    • 2013
  • Objective: To use microarray chip technology for screening of stem cell radiation related miRNAs in laryngeal squamous cell carcinoma; study and explore the relationship of miRNAs with radiosensitivity of laryngeal squamous cells. Method: After conventional culture and amplification of the laryngeal squamous carcinoma cell line Hep-2, CD 133+ cells were screened out with combination of isolated culture of stem cell microspheres and FACS for preparation of laryngeal cancer stem cells. After radiation treatment, miRNAs of laryngeal squamous carcinoma stem cells before and after radiation were enriched and purified. After microarray hybridization with mammalian miRNA and scanning of fluorescence signal, the miRNAs of laryngeal squamous carcinoma stem cells before and after radiation was subject to differential screening and clustering analysis. Real-time quantitative RT-PCR was used to verify part of the differentially expressed miRNAs. Results: 70 miRNAs related to laryngeal cancer stem cell radiation with 2-fold difference in expression were screened out, in which 62 were down-regulated and 8 were up-regulated. Fluorescent quantitative RT-PCR results were consistent with miRNAs chip results. Conclusion: Some miRNAs may be involved in self-regulation with laryngeal squamous carcinoma stem cell radiation.