• 제목/요약/키워드: variable step search

검색결과 25건 처리시간 0.023초

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.

DV에서 MPEG-2로의 주파수 영역 변환 부호화 (A Frequency Domain DV-to-MPEG-2 Transcoding)

  • 김도년;윤범식;최윤식
    • 대한전자공학회논문지SP
    • /
    • 제38권2호
    • /
    • pp.138-148
    • /
    • 2001
  • 디지털 캠코더에서 이용하는 영상 압축 방식인 DY 부호화 방식은 DCT와 가변장 부호화 방식을 이용한다. DV 방식은 하드웨어 복잡도가 낮은 반면 압축된 비트율이 악 26Mb/s로 높은 편이다. 따라서 스튜디오에서 낮은 복잡도로 영상을 부호화 한 후 VOD 시스템에 이용하기 위하여 MPEG-2로 변환부호화 할 필요가 있다. 이때의 두 압축방식이 DCT를 이용하므로, DCT 영역에서 변환부호화 하면 중간 과정을 줄일 수 있어서 계산상의 복잡도를 줄일 수 있다. DV 방식에서 MPEG-2 인트라로 변환부호화 시에, DV 방식의 4:1:1 색차 포맷을 MPEG-2의 4:2:2 영상 포맷으로 변환할 때 와 2-4-8 DCT 모드에서 8-8 DCT 모드로 변환 시 변환 영역에 있는 데이터에 미리 계산된 행렬을 곱함으로써 병렬처리가 가능하게 하였다. MPEG-2 율제어 시에 서브 블록의 분산을 완전히 DCT 영역에서 계산하였다. 실험을 통하여 제안한 방식들을 검증하였다. MPEG-2 인터 프레임 부호화로 변환 부호화 할 때 DCT 계수를 이용하여 계층적으로 움직임을 추정하였다. 먼저 4개의 서브 블록에 있는 4개의 DC 값으로 하나의 매크로 블록에 대한 움직임을 추정한 다음 각 서브 블록의 저주파수에 해당하는 2×2에 IDCT를 취하여 16 포인트로 구성된 매크로 블록을 만든 후 이에 대한 움직임을 추정하며, 다섯 번째 단계에서 서브 화소에 대한 움직임을 추정함으로써 움직임 추정을 마친다. 탐색영역을 겹치는 방식이 겹치지 않는 방식보다 좋은 PSNR값을 보여 주었다.

  • PDF

집행관배훈안례연구(阐述工商业背景下的有限合理性):집행관배훈안례연구(执行官培训案例研究) (Interpreting Bounded Rationality in Business and Industrial Marketing Contexts: Executive Training Case Studies)

  • Woodside, Arch G.;Lai, Wen-Hsiang;Kim, Kyung-Hoon;Jung, Deuk-Keyo
    • 마케팅과학연구
    • /
    • 제19권3호
    • /
    • pp.49-61
    • /
    • 2009
  • 本文为执行官提供了他们在处理日常业务问题和市场机会时如何阐述自己思考过程的培训. 本研究建立在Schank提出的教学基础上, 包括: (1)经验学习和最好的指导提供给学习者从诸如全球背景, 团队项目和专家经历等的互动的故事提炼知识和技能的机会. (2) 告诉不会导致学习, 因为在学习需要的行动训练环境中, 应强调积极使用故事, 案例和项目. 每个培训案例包括执行官解释自己的决策系统分析(DSA, 还需要执行官做DSA简报. 在训练时要求执行官写DSA简报. 在执行官学员写书面报告的说明中包括(1) DSA路线图的本质的细节(2) 警告和机会的陈述, 读者的行政地图及图内的DSA解释. 该报告的最大长度为500字, 其规则就是使行政人员培训课程行之有效. 引言之后是第二部分文献综述, 简要地总结了有关人们在对问题和机会的背景下的想法及文献. 第三部分通过使用对不同的贴牌生产客户定价相同的化学产品的培训练习来解释DSA的起源和过程, 第四部分展示一个炼油设备公司订价决策的培训练习. 第五部分提供一个商业客户办公家具采购的市场策略案例. 第六部分是结论和建议. 这些建议是关于使用培训课程和发展其他培训课程来磨练执行官制定决策的能力. 文章引导读者利用工具箱研究综合的报告, (DSA)路线图根据生态合理性理论将战略与环境相匹配. 这三个案例的研究让学习者在意愿层面征求建议来作出决策. Todd and Gigerenzer 提出人们使用简单启发式,因为他们在自然的决策环境中通过探索信息的结构使适应性行为有可能产生. "简单是一种美德, 而不是诅咒", 有限理性理论强调了西蒙的命题中心, "人类理性的行为仿佛一把剪刀, 其刀片则是任务环境的结构和执行者的计算能力". Gigerenzer的观点和西蒙的环境的危害相关, 也和本文中三个环境结构的案例相关. "环境这个词, 在这里, 并不是指总的物理和生理的环境, 而只是指被给予需要和目标的重要有机体 本文关注了结合任务环境的结构和使用适应的工具箱启发的报告. (DSA)路线图根据生态理性理论将战略与环境相匹配. 渴望适应理论是这一方针的核心. 渴望适应理论将决策制定作为一个没有把目标整合的多目标问题模拟成一个把所有决策选项进行完全的优先顺序化. 这三个案例研究让学习者在意愿层面征求建议来作出决策. 渴望适应用一系列的调整步骤的形式. 一个调整步骤通过仅一个目标变量的变化就可以改变在渴望网格上邻近点当前的渴望水平. 上调步骤是目标变量的提高, 下调步骤是目标变量的下降. 创造和使用渴望适应水平是对有限理性理论的整合. 文章通过提供学习者经验和实践环节增加了意愿采纳和有限合理性的理解和特点. 利用DSA图排列CTSs和撰写TOP可以清晰和深化Selten的观点 "清晰, 意愿采纳必须作为研究的解决方案整合到整个蓝图中". 这些有限理性的研究许可了在现实生活中为什么, 如何作决策的理论和在自然的环境中利用启发式的学习训练两方面的发展. 本文中的练习鼓励根据不同使用目的学习快速而简洁的启发式技巧和原则. 这也正回应了Schank的思想 "从本质上来看, 教育不是让学生们知道发生了什么, 而是让他们感受到所发生的事情. 这不容易做到. 在如今的学校教育是没有情感的, 这是一个很大的问题". 这三个案例和附加的练习问题遵守了Schank的观点. "这种教育过程最好是通过参与他们其中来实现, 也可以这样认为, 精神层面的积极讨论".

  • PDF

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.