• 제목/요약/키워드: 이론 기반 데이터 과학

검색결과 120건 처리시간 0.037초

라이브 스트리밍 전자 상거래에서 소비자 신뢰에 영향을 미치는 요인에 관한 연구 (Research on factors influencing consumer trust in livestreaming e-commerce)

  • 려효영;심재연
    • 산업진흥연구
    • /
    • 제8권3호
    • /
    • pp.181-199
    • /
    • 2023
  • 전자상거래는 전통적인 그래픽 및 텍스트 형식에서 짧은 동영상 및 라이브스트리밍 형식으로 업그레이드되고 있다. 라이브 전자상거래는 정보전달 및 상품전시의 내용과 형식을 풍부하게 하고 소비자의 쇼핑경험을 향상시키며 점차 새로운 소비패턴이 되고 있다. 그러나 생방송 전자상거래의 발전에는 허위선전, 위조상품, 각종 부정적인 사건 등으로 라이브스트리밍 전자상거래에 대한 소비자의 신뢰도에 심각한 영향을 미치고 있다. 신뢰는 라이브스트리밍 전자상거래의 핵심 경쟁요소이다. 본 논문에서는 신뢰이론에 대한 선행연구를 기반으로 라이브커머스의 "사람, 상품, 장면" 특성 요소를 결합하여 라이브커머스의 신뢰도 모형을 구축하고 가설을 세웠다. 설문조사를 통한 데이터 수집, 라이브커머스의 특성, 쇼호스트 특성, 브랜드 이미지, 제품 정보, 플랫폼 평판, 라이브 상황 및 신뢰성 경향 등의 요인이 소비자 신뢰도에 높은 긍정적인 영향을 미친다는 것을 증명하였다. 연구결과로 매장특성지표를 구축하고, 바람직한 쇼호스트의 특성을 창출하며, 제품브랜드를 구축하고 선택하고, 제품정보를 유지하며, 특성에 적합한 라이브 플랫폼을 선택하고, 라이브 상황에 적절한 컨텐츠를 창출하는 등을 제언하였다.

대용량 공유디스크 파일 시스템에 적합한 메타 데이타 구조의 설계 및 구현 (Design and Implementation of a Metadata Structure for Large-Scale Shared-Disk File System)

  • 이용주;김경배;신범주
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권1호
    • /
    • pp.33-49
    • /
    • 2003
  • 인터넷의 확산으로 대용량 멀티미디어 데이타에 대한 요구가 증가하고 있으며 이를 효율적으로 관리하기 위한 스토리지에 대찬 연구가 진행되고 있다. 기하급수적으로 늘어나는 스토리지에 대한 요구를 해결하기 위해서 제시된 방법중의 하나가 공유디스크 환경을 제공하는 SAN(Storage Area Network)이다. SAN은 fibre channel이라는 고속 전송망을 이용해서 고속의 저장장치를 위한 네트워크를 구성한 것이다. 하지만 저장장치 네트워크의 구성만으로는 스토리지에 대한 요구는 해결하였지만 이를 사용자에게 제공하기 위한 공유디스크 환경에서의 파일시스템에 대한 연구는 미진하다. 특히 기존에 제시된 로컬 파일 시스템, 분산 파일시스템에서는 공유디스크환경에 적합하지 않으며 대용량 스토리지에 적합한 메타 데이터 구조 측면에서의 설계는 부족한 실정이다. 이를 해결하기 위해 본 논문에서는 공유디스크 환경에 적합한 메타 데이타 구조를 설계 및 구현하여 대용량 스토리지에 적합한 공유디스크 파일 시스템을 제시한다. 구현한 공유디스크 파일시스템은 SAN fabric에 참여하는 호스트들 사이의 균형적인 할당 블록을 주기 위한 파일시스템 레이아웃과 비트맵 관리기법, 대용량 파일을 위한 효율적인 익스텐트 기반의 SEMI FLAT구조를 제안하였으면, 대용량의 디렉토리를 사용할 수 있게 확장해싱을 이용한 2단계 디랙토리 관리 구조를 설계 및 구현하였다. 또한 리눅스 커널 상에서 제시한 메타 데이타 구조에 대한 구현에 필요한 구조 정보와 알고리즘을 제시하였으며. 성능의 우수성을 보이기 위해 리눅스 환경의 대표적인 파일 시스템인 EXT2, 공유디스크 환경의 GFS와의 성능을 파일 생성, 디렉토리 생성, I/O횟수 측면에서 비교하였다.

디스크 배열-기반 주문형 비디오 서버에서의 탐색 시간 단축을 위한 효율적인 주기적 요청 묶음 기법 (An Efficient Periodic-Request-Grouping Technique for Reduced Seek Time in Disk Array-based Video-on-Demand Server)

  • 김운석;김지홍;민상렬;노삼혁
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권12호
    • /
    • pp.660-673
    • /
    • 2001
  • 주문형 비디오 서버에서 동시에 서비스 될 수 있는 사용자의 수는 서버의 단위 시간당 처리량에 의해 결정되는데, 서버의 처리량은 대부분 디스크의 처리량에 의해 제약을 받는다. 따라서, 디스크의 처리량은 서버 설계에 있어서 매우 중요한 요소가 되며, 대부분의 서버의 경우, 이를 높이기 위해 디스크 배열을 이용한다. 본 논문에서는 디스크 배열에서 디스크들의 탐색 시간을 줄여 전반적으로 디스크의 처리량을 증대시킬 수 있는 효율적인 주기적 요철 묶음 기법을 제안한다. 제안된 기법에서는 디스크 내 인접 영역에 저장된 데이터를 요청하는 주기적 요청들을 하나의 묶음으로 만들고, 각 묶음들이 동일 디스크를 순차적으로 접근할 수 있도록 좌대칭 혹은 우대칭 형식으로 정렬하여 각 디스크에서 요청들이 겪게되는 탐색 시간을 줄인다. 이는 단일 데이터 스트림에 의해 요구되는 디스크 대역폭을 줄일 수 있으므로, 서버는 주어진 시스템 자원 하에서 보다 많은 사용자들을 서비스 할 수 있다. 모의 실험 결과, 제안된 기법은 기존의 기법들에 비해 보다 많은 사용자들을 서비스 할 수 있음이 확인되었다. 일반적인 192KB의 블록 크기를 이용할 경우, 일반 디스크 배열에 비해 평균 20%의 사용자 대기 시간 감소와 평균 8%의 동시 이용자 증가를 보였다. 또한, 본 논문에서는 비디오 스트림들에 대한 사용자 선호도 변화에 맞추어 묶음들을 재구성하는 적응 기법을 제시한다.

  • PDF

병렬 시스템 환경하에서 비정형 응용 프로그램을 위한 입출력 시스템의 설계 및 구현 (Design and Implementation of An I/O System for Irregular Application under Parallel System Environments)

  • 노재춘;박성순;알록샤우드리;권오영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권11호
    • /
    • pp.1318-1332
    • /
    • 1999
  • 본 논문에서는 입출력 응용을 위해 collective I/O 기법을 기반으로 한 실행시간 시스템의 설계, 구현 그리고 그 성능평가를 기술한다. 여기서는 모든 프로세서가 동시에 I/O 요구에 따라 스케쥴링하며 I/O를 수행하는 collective I/O 방안과 프로세서들이 여러 그룹으로 묶이어, 다음 그룹이 데이터를 재배열하는 통신을 수행하는 동안 오직 한 그룹만이 동시에 I/O를 수행하는 pipelined collective I/O 등의 두 가지 설계방안을 살펴본다. Pipelined collective I/O의 전체 과정은 I/O 노드 충돌을 동적으로 줄이기 위해 파이프라인된다. 이상의 설계 부분에서는 동적으로 충돌 관리를 위한 지원을 제공한다. 본 논문에서는 다른 노드의 메모리 영역에 이미 존재하는 데이터를 재 사용하여 I/O 비용을 줄이기 위해 collective I/O 방안에서의 소프트웨어 캐슁 방안과 두 가지 모형에서의 chunking과 온라인 압축방안을 기술한다. 그리고 이상에서 기술한 방안들이 입출력을 위해 높은 성능을 보임을 기술하는데, 이 성능결과는 Intel Paragon과 ASCI/Red teraflops 기계 상에서 실험한 것이다. 그 결과 응용 레벨에서의 bandwidth는 peak point가 55%까지 측정되었다.Abstract In this paper we present the design, implementation and evaluation of a runtime system based on collective I/O techniques for irregular applications. We present two designs, namely, "Collective I/O" and "Pipelined Collective I/O". In the first scheme, all processors participate in the I/O simultaneously, making scheduling of I/O requests simpler but creating a possibility of contention at the I/O nodes. In the second approach, processors are grouped into several groups, so that only one group performs I/O simultaneously, while the next group performs communication to rearrange data, and this entire process is pipelined to reduce I/O node contention dynamically. In other words, the design provides support for dynamic contention management. Then we present a software caching method using collective I/O to reduce I/O cost by reusing data already present in the memory of other nodes. Finally, chunking and on-line compression mechanisms are included in both models. We demonstrate that we can obtain significantly high-performance for I/O above what has been possible so far. The performance results are presented on an Intel Paragon and on the ASCI/Red teraflops machine. Application level I/O bandwidth up to 55% of the peak is observed.he peak is observed.

점진적 EM 알고리즘에 의한 잠재토픽모델의 학습 속도 향상 (Accelerated Loarning of Latent Topic Models by Incremental EM Algorithm)

  • 장정호;이종우;엄재홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1045-1055
    • /
    • 2007
  • 잠재토픽모델(latent topic model)은 데이타에 내재된 특징적 패턴이나 데이타 정의 자질들 간의 상호 관련성을 확률적으로 모델링하고 자동 추출하는 모델로서 최근 텍스트 문서로부터의 의미 자질 자동 추출, 이미지를 비롯한 멀티미디어 데이타 분석, 생물정보학 분야 등에서 많이 응용되고 있다. 이러한 잠재토픽모델의 대규모 데이타에 대한 적용 시 그 효과 증대를 위한 중요한 이슈 중의 하나는 모델의 효율적 학습에 관한 것이다. 본 논문에서는 대표적 잠재토픽모델 중의 하나인 PLSA (probabilistic latent semantic analysis) 기법을 대상으로 점진적 EM 알고리즘을 활용한, 기본 EM 알고리즘 기반의 기존 학습에 대한 학습속도 증진 기법을 제안한다. 점진적 EM 알고리즘은 토픽 추론 시 전체 데이타에 대한 일괄적 E-step 대신에 일부 데이타에 대한 일련의 부분적 E-step을 수행하는 특징이 있으며 이전 데이터 일부에 대한 학습 결과를 바로 다음 데이타 학습에 반영함으로써 모델 학습의 가속화를 기대할 수 있다. 또한 이론적인 측면에서 지역해로의 수렴성이 보장되고 기존 알고리즘의 큰 수정 없이 구현이 용이하다는 장점이 있다. 논문에서는 해당 알고리즘의 기본적인 응용과 더불어 실제 적용과정 상에서의 가능한 데이터 분할법들을 제시하고 모델 학습 속도 개선 면에서의 성능을 실험적으로 비교 분석한다. 실세계 뉴스 문서 데이타에 대한 실험을 통해, 제안하는 기법이 기존 PLSA 학습 기법에 비해 유의미한 수준에서 학습 속도 증진을 달성할 수 있음을 보이며 추가적으로 모델의 병렬 학습 기법과의 조합을 통한 실험 결과를 간략히 제시한다.

Learning Progression을 적용한 중·고등학생의 '물질의 입자성'에 관한 지식과 미시적 표상에 대한 특성 분석 (Using a Learning Progression to Characterize Korean Secondary Students' Knowledge and Submicroscopic Representations of the Particle Nature of Matter)

  • 신남수;고은정;최취임;정대홍
    • 한국과학교육학회지
    • /
    • 제34권5호
    • /
    • pp.437-447
    • /
    • 2014
  • Learning Progressions(학습진행과정, 이하 LP)은 "과학의 핵심 아이디어(core idea) 혹은 과학 활동(scientific practices) 이해 과정을 상대적으로 단순한 체계에서 전문가의 지식체계로 논리적이고, 순차적인 단계로 정교하게 설명한 틀"로서, 한 교과 내 및 다른 과학영역들(물리, 지구과학, 생물, 화학)과 연결하여 연계적 교육과정을 구성하는 이론적 기반을 제공한다. 학습은 개개인의 선지식, 선경험, 교과교육과정, 교육과정 등의 여러 요소에 영향을 받는 복잡한 이해 과정으로, LP 단계를 모든 학생들이 동일하게 이동하지 않는다. 학생과 학습환경의 특성에 따른 이동 가능한 학습경로의 서술을 위해서는 다양한 학생데이터의 수집과 분석이 필요하다. 이러한 과정을 통해서 가설의 LP는 과학적으로 증명된 LP로 규명되며. 비로소 교과과정 개발의 틀(framework)로 역할을 할 수 있다. 본 연구는 미시간 대학 연구팀이 개발한 "물질의 본성(nature of matter)" 주요 개념에서, 하위개념인 "물질의 입자성(particule nature of matter)과 입자적 표상(submicroscophic representation)"의 LP와 관련 평가지를 우리나라 과학교육과정과 연계, 수정하여 개발하였다. 수정된 평가지와 LP는 124명의 중고등학생의 LP 경로 특성을 분석하는데 사용되었다. 학생들의 입자적 개념과 표상의 이해도, 개념과 표상 이해도 연관성을 중점으로 분석하여 관련 과학교육과정과 현장 수업의 문제점과 시사점을 도출하였다. 본 연구결과를 종합해 보면, 높은 레벨 문항의 정답을 고른 빈도수는 낮은 레벨 문항을 모두 정답으로 고른 경우에 높았으며 이는 학생들이 본 연구팀이 개발한 LP 경로로 이해과정을 정교화시킴을 알 수 있다. 하지만, 대부분의 학생들, 특히 고등학생들은 초등학교 수준의 거시적 물질의 본성 개념 LP 단계에 머물고 있으며, 중학교 수준인 미시적 표상 LP 단계에 있다. 입자적 개념과 표상 이해 실패의 주요 원인은 1) 과학적 모델의 본질, 2) 관련 선지식, 3) 미립자 표상의 이해부족으로 정리된다. 본 연구결과는 물질의 입자성과 관련된 개념, 과학활동(특히 모델링)을 증진시키고 개개인 특성에 맞는 맞춤형 학습환경 제공을 위한 학습, 교수, 평가자료 개발에 기여하는 바가 크다. 더 나아가 '물질의 본성'에 대한 LP연구와 과학적 소양 증진에 긍정적 역할을 할 것으로 기대한다.

대용량 분산파일시스템을 위한 비공유 메타데이타 관리 기법 (A Non-Shared Metadata Management Scheme for Large Distributed File Systems)

  • 윤종현;박용훈;이석재;장수민;유재수;김홍연;김영균
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권4호
    • /
    • pp.259-273
    • /
    • 2009
  • 최근 많은 연구가 진행 중인 대부분의 클러스터 기반 분산파일시스템은 파일에 대한 읽기, 쓰기 작업으로부터 메타데이타의 처리를 분리했다는 특징을 가지고 있다. 즉 파일시스템에 기록된 파일에 대한 권한 정보, 파일의 실제 데이타가 저장된 저장소의 위치 정보, 파일시스템의 네임스페이스 유지 등 메타데이타와 관련된 정보 및 이를 처리하는 기능을 별도의 메타데이타 서버가 관리한다. 하지만 기존 시스템의 메타데이타 관리기법들은 데이타의 분산 관리 및 입출력 성능만 중점을 두고 설계되어 있어 파일시스템 확장에 따른 메타데이타 입출력 성능 및 확장성에서 한계를 나타내고 있는 상황이다. 따라서 본 논문에서는 클러스터 기반 분산파일시스템에서 보다 나은 성능과 확장성을 제공하는 수 있는 비공유 메타데이타 관리 기법을 제안한다. 먼저 본 논문에서는 새로운 메타데이터 분할 기법으로 사전식 분할 기법을 제안한다. 다음으로 제안하는 메타데이타 분할 기법을 지원하기 위한 부하 분산 기법을 제시한다. 본 논문에서 제안하는 메타데이타 관리 기법은 기존 메타데이타 관리기법과 비교하여 확장성 및 부하 분산에서 우수함을 보인다.

SVM기반의 선택적 주의집중을 이용한 중첩 패턴 인식 (Recognition of Superimposed Patterns with Selective Attention based on SVM)

  • 배규찬;박형민;오상훈;최용선;이수영
    • 대한전자공학회논문지SP
    • /
    • 제42권5호
    • /
    • pp.123-136
    • /
    • 2005
  • 본 논문에서는 신경회로망보다 우수한 성능을 보이는 학습 이론인 SVM을 기반으로, 인간의 인지 과학에서 많은 연구가 이루어지고 있는 선택적 주의집중을 응용한 중첩 패턴 인식 시스템을 제안한다. 제안된 선택적 주의집중 모델은 SVM의 입력단에 주의집중층을 추가하여 SVM의 입력을 직접 변화시키는 학습을 하며 선택적 필터의 기능을 수행한다. 주의집중의 핵심은 학습을 멈추는 적절한 시점을 찾는 것과 그 시점에서 결과를 판단하는 주의집중 척도를 정의하는 것이다. 지지벡터는 주변에 존재하는 패턴들을 대표하는 표본이므로 입력 패턴이 초기상태일 때 주의집중을 하고자 하는 클래스의 가장 가까운 지지벡터를 기준으로 그 지지벡터와의 거리가 최소가 되었을 때 주의집중을 멈추는 것이 적절하다. 일반적인 주의집중을 적용하면 주의집중 척도를 정의하기가 난해해지기 때문에 변형된 입력이 원래 입력의 범위를 넘지 않는다는 제약조건을 추가하여 사용할 수 있는 정보의 폭을 넓히고 새로운 척도를 정의하였다. 이때 사용한 정보는 변형된 입력과 원래 입력의 유클리드 거리, SVM의 출력, 초기상태에 가장 가까웠던 히든뉴런의 출력값이다. 인식 실험을 위해 USPS 숫자 데이터를 사용하여 45개의 조합으로 중첩시켰으며, 주의집중을 적용시켰을 때 단일 SVM보다 인식 성능이 월등히 우수함을 확인하였고, 또한 제한된 주의집중을 사용하였을 때 일반적 주의집중을 이용하는 것 보다 성능이 더 뛰어났음을 확인하였다.

시계열 서브시퀀스 매칭을 위한 최적의 다중 인덱스 구성 방안 (Optimal Construction of Multiple Indexes for Time-Series Subsequence Matching)

  • 임승환;김상욱;박희진
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.201-213
    • /
    • 2006
  • 일정 기간 동안 객체의 변화한 값들을 기록한 것을 그 객체에 대한 시계열 데이타 시퀀스라고 부르며, 이들의 집합을 시계열 데이타베이스라고 한다. 서브시퀀스 매칭은 주어진 질의 시퀀스와 변화의 추세가 유사한 서브시퀀스들을 시계열 데이타베이스로부터 검색하는 연산이다. 본 논문에서는 서브시퀀스 매칭의 성능을 극대화하기 위한 방안을 제시한다. 먼저, 윈도우 크기 효과로 인한 서브시퀀스 매칭의 심각한 성능 저하 현상을 정량적으로 관찰하여, 하나의 윈도우 크기를 대상으로 만든 단 하나의 인덱스만을 이용하는 것은 실제 응용에서 만족할만한 성능을 제공할 수 없다는 것을 규명하였다 또한, 이러한 문제로 인해 다양한 윈도우 크기들을 기반으로 다수의 인덱스들을 구성하여 서브시퀀스 매칭을 수행하는 인덱스 보간법의 응용이 필요함을 보였다. 인덱스 보간법을 응용하여 서브시퀀스 매칭을 수행하기 위해서는 먼저 다수의 인덱스들을 위한 윈도우 크기들을 결정해야 한다. 본 연구에서는 물리적 데이타베이스 설계 방식을 이용하여 이러한 최적의 다수의 윈도우 크기들을 선정하는 문제를 해결하였다. 이를 위하여 시계열 데이터 베이스에서 수행될 예정인 질의 시퀀스들의 집합과 인덱스 구성의 기반이 되는 윈도우들의 크기의 집합이 주어질 때, 전체 서브시퀀스 매칭들을 수행하는 데에 소요되는 비용을 예측할 수 있는 공식을 산출하였다. 또한, 이 비용 공식을 이용하여 전체 서브시퀀스 매칭들의 성능을 극대화 할 수 있는 최적의 윈도우 크기들을 결정하는 알고리즘을 제안하였으며, 이 알고리즘의 최적성과 효율성을 이론적으로 규명하였다. 끝으로, 실제 주식 데이타와 대량의 합성 데이타를 이용한 실험 결과, 제안된 기법은 기존의 단순한 기법과 비교하여 1.5배에서 7.8배 성능이 향상됨을 보였다.

MIS Quarterly 연구동향 탐색: 토픽모델링 및 키워드 네트워크 분석 활용 (An Exploration of MIS Quarterly Research Trends: Applying Topic Modeling and Keyword Network Analysis)

  • 강은경;정연식;양선욱;권지윤;양성병
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.207-235
    • /
    • 2022
  • 지식과 정보산업이 경제의 주축인 지식기반 사회에 있어 지식의 공유와 확산 및 체계적인 관리는 국가 경쟁력 향상뿐만 아니라 지속 가능한 사회 발전의 필수 전략으로 인식되고 있다. 정보기술과 경영의 융합이 다양한 방식으로 일어나고 있는 정보시스템(Information Systems: IS) 연구분야에서, 연구자들이 서로 협력하여 오래된 지식을 과학적 지식네트워크의 관점에서 새로운 지식으로 만들어 낼 때 비로소 지식의 진화가 일어난다. 특히, 인용과 공저, 키워드와 같은 네트워크 기반의 학제적 접목을 통해 해당 연구분야의 관심 주제와 적용된 방법론, 연구동향 등을 파악함으로써 새로운 통찰을 이끌어낼 수 있다. 선행연구에서는 연구주제와 방법론, 공동저자 등의 관계를 밝혀 해당 커뮤니티의 지식체계 구조와 연구동향을 파악하려는 다양한 시도가 있어 왔으나, 두 개 이상의 저널을 일부 기간으로 한정해서 비교한 연구가 대부분을 차지하였으며, IS 연구의 전 역사를 아우르면서 연구동향을 살펴본 연구는 부족한 실정이다. 이에 본 연구에서는 IS 연구분야에서 관련 지식을 넓히는 데 주도적인 역할을 수행하고 있는 MIS Quarterly (MISQ) 저널을 중심으로 창간호(1977년)부터 최근(2022년 1분기)까지 게재된 모든 논문으로부터 (1) 키워드를 추출하고, (2) 추출된 키워드를 연구주제와 방법론, 이론 등으로 각각 구분한 후, (3) 토픽모델링과 키워드 네트워크 분석을 활용하여 IS 연구분야의 태동부터 현재까지의 변화 양상을 연대기적으로 파악하였다. 본 연구를 통해 MISQ에 게재된 IS 연구의 변화 양상을 살펴봄으로써, IS 연구분야의 발전 방향을 예측하고, IS 분야의 연구자들에게 새로운 연구방향을 제시하여 미래 지향적인 연구를 진행하는 데 실질적인 도움을 줄 수 있을 것으로 기대한다.