• 제목/요약/키워드: 설계안

검색결과 3,093건 처리시간 0.023초

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

액티브 시니어의 경력지향성과 창업교육 만족이 창업의지와 창업준비행동에 미치는 영향 (The Effect of Active Senior's Career Orientation and Educational Entrepreneurship Satisfaction on Entrepreneurship Intention and Entrepreneurship Preparation Behavior)

  • 박종범;양영석;김명숙
    • 벤처창업연구
    • /
    • 제15권1호
    • /
    • pp.285-301
    • /
    • 2020
  • 국내의 고령화 문제를 인구학적 관점에서 바라보면 전체 인구수의 문제가 아니라 인구구조가 문제이다. 국내에서 규모가 가장 큰 인구집단은 베이비부머, 포스트 베이비부머 세대이다. 베이비부머 세대는 1955~1963년생으로 현재 인구는 700만 1,333명이며, 전체인구의 약 13.6%(2015년 기준)를 차지한다. 포스트 베이비부머 세대는 1964~1974년생으로 총인구는 956만 7,171명으로 총인구의 18.8%에 해당한다. 베이비부머 세대와 포스트 베이비부머 세대(총 인구대비 32.4%)가 은퇴를 시작하였고, 조만간 은퇴할 예정이다. 의학기술의 발달로 평균 수명이 지속해서 증가하고 있으며, 신생아의 출산율 저하, 생산인구의 감소는 국내의 경제를 어둡게 하고 있다. 이런 사회적 문제 인식과 문제 해결안으로 본 연구는 액티브 시니어들의 다양한 경력기반에 기초한 경력지향성과 창업 교육 만족도가 창업 의지, 창업 준비 행동에 미치는 영향 관계를 살펴보고, 또한 이들 간의 관계를 규명함으로써 액티브 시니어의 다양성에 대한 맞춤형 창업 교육중요성을 제안하고 시니어 창업정책 설계 및 자금지원, 창업 교육의 바람직한 방향을 제시하고자 한다. 이를 위해 이론적 배경을 바탕으로 액티브 시니어, 경력 지향성, 창업 교육 만족도, 창업 의지, 창업 준비 행동의 5개 요소의 개념을 정의하고, 특히 핵심이 되는 액티브 시니어의 개념적 정의를 베이비부머 세대인 50대, 60대로 비즈니스의 핵심소비 주체나 복지혜택의 수급대상자로 보는 것이 일반적이지만, 본 연구에서는 국내의 창업 시장에서의 40대, 50대, 60대 순으로 연령별 창업기업 수가 높은 것을 반영하여 액티브 시니어 창업가를 예비시니어(Pre Senior)를 포함한 경력, 경제력, 소비력을 갖추고 활발한 활동과 건강한 삶을 지향하는 40대에서 60대까지 세대를 액티브 시니어로 정의하였다. 가설검증 결과로 가설 1과 가설 5에서 경력 지향성은 창업 의지와 창업 준비 행동 영향을 미치는 것으로 검증되었다. 가설 3에서 창업 의지는 창업 준비 행동 간에 영향을 미치는 것으로 검증되었다. 가설 4에서 창업 교육 만족도는 창업 준비 행동에 영향을 미치는 것으로 검증되었다. 그러나 가설 2에서 창업 교육 만족도는 창업 의지에 영향을 미치지 않는 것으로 나타났다. 이와 같은 결과는 창업교육 만족도가 창업 의지에 직접적인 효과는 미치지 못하고 개인적인 경력 지향성의 영향을 통해 창업 의지를 높이는 것으로 나타났다. 본 연구 결과를 활용하여 액티브시니어 창업정책 수립 방향 수립에 의미를 제공한다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.