• 제목/요약/키워드: task-graph

검색결과 150건 처리시간 0.033초

Spark SQL 기반 고도 분석 지원 프레임워크 설계 (Design of Spark SQL Based Framework for Advanced Analytics)

  • 정재화
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권10호
    • /
    • pp.477-482
    • /
    • 2016
  • 기업의 신속한 의사결정 및 전략적 정책 결정을 위해 빅데이터에 대한 고도 분석이 필수적으로 요구됨에 따라 대량의 데이터를 복수의 노드에 분산하여 처리하는 하둡 또는 스파크와 같은 분산 처리 플랫폼이 주목을 받고 있다. 최근 공개된 Spark SQL은 Spark 환경에서 SQL 기반의 분산 처리 기법을 지원하고 있으나, 기계학습이나 그래프 처리와 같은 반복적 처리가 요구되는 고도 분석 분야에서는 효율적 처리가 불가능한 문제가 있다. 따라서 본 논문은 이러한 문제점을 바탕으로 Spark 환경에서 고도 분석 지원을 위한 SQL 기반의 빅데이터 최적처리 엔진설계와 처리 프레임워크를 제안한다. 복수의 조건과 다수의 조인, 집계, 소팅 연산이 필요한 복합 SQL 질의를 분산/병행적으로 처리할 수 있는 최적화 엔진과 관계형 연산을 지원하는 기계학습 최적화하기 위한 프레임워크를 설계한다.

3차원 가상환경에서 동작하는 지능형 에이전트의 구조와 경로 찾기 행위 (Architecture and Path-Finding Behavior of An Intelligent Agent Deploying within 3D Virtual Environment)

  • 김인철;이재호
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.1-12
    • /
    • 2003
  • 본 논문에서는 대표적인 3차원 일인칭 액션 게임인 Unreal Tournament 게임과 이것에 기초한 지능형 에이전트 연구용 테스트베드인 Gamebots 시스템을 소개한다. 그리고 이들이 제공하는 3차원 가상환경에서 동작하는 지능형 NPC인 KGBot의 설계와 구현에 대해 설명한다. KGBot는 Gamebots 시스템 내의 하나의 보트 클라이언트이다. KGBot는 3차원 가상환경 안에 숨겨진 목표점들을 찾아 효과적으로 점령하는 임무를 수행한다. KGBot는 범용의 BDI 에이전트 구조인 UM-PRS를 제어엔진으로 채용하고 있으며, 복잡한 행위들을 여러 계층으로 표현한 계층화된 지식베이스를 가지고 있다. 본 논문에서는 미지의 월드를 효과적으로 탐색함으로써 숨겨진 목표점들의 위치를 빨리 파악하고, 흩어져 있는 이동점들과 경로들을 찾아내어 경로 그래프를 작성하며, 이것에 기초하여 특정 목적지까지 지적의 이동 경로를 계획하는 KGBot의 지능 행위들에 대해 자세히 설명한다. 그리고 끝으로 다양한 3차원 지도를 이용한 실험을 통해 KGBot의 월드 탐색 전략과 제어엔진의 성능을 분석해본다.

3차원 물체인식과 하이브리드 세선화 기법을 이용한 이동로봇의 최적위치 추정 (Estimation of optimal position of a mobile robot using object recognition and hybrid thinning method)

  • 이우진;윤상석
    • 한국정보통신학회논문지
    • /
    • 제25권6호
    • /
    • pp.785-791
    • /
    • 2021
  • 본 연구는 서비스 로봇이 물건배달 서비스를 수행하기 위해 인식된 물체의 위치기반 정보로부터 최적의 작업 목적지를 추정하기 위한 방법론을 제안한다. 위치 추정 프로세스는 격자지도에 일반화된 보로노이 그래프를 적용하여 노드와 링크로 구성되는 초기 위상학 지도 작성, RGB-D센서를 이용하여 물체의 인식과 위치정보 추출, 장애물의 형상 및 거리정보를 수집한 후 ,무게중심법과 세선화를 병행하는 하이브리드 기법을 적용하여 서비스 로봇이 물건잡기 작업을 수행할 수 있는 최적의 이동위치를 추정하게 된다. 그런 다음, 노드 위치선정 규칙에 따라 추정된 위치와 기존 노드의 기하학적 거리비교를 통해 로봇의 작업 목적지에 대한 최적의 노드정보를 갱신하게 된다.

IoT 환경에서 AI 기반의 당뇨발 진단을 위한 깔창 개발 (Development of Insole for AI-Based Diagnosis of Diabetic Foot Ulcers in IoT Environment)

  • 최원후;정태명;박지웅;이서후
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권3호
    • /
    • pp.83-90
    • /
    • 2022
  • 당뇨병은 오늘날 주변에서 흔히 찾아볼 수 있는 질병이며, 당뇨병성 족부 궤양(당뇨발)이라는 심각한 합병증으로 발전하는 사례 또한 많이 나타난다. 따라서 이를 사전에 진단하고 예방하는 것은 중요한 과제이며 본 논문에서 그 방안을 제시한다. 본문에서 소개하는 기존의 연구들을 바탕으로 발의 압력과 온도 정보는 당뇨발과 깊은 상관관계가 있음을 알 수 있으며, 해당 지표들을 측정하는 IoT 기기인 스마틴솔을 개발과정 및 아키텍쳐를 소개한다. 또한, 더 나아가 스마틴솔로 측정한 데이터들의 실제 당뇨발 진단을 위한 AI 분석 전처리 과정을 기술하며, 측정된 압력 그래프와 실제 사람의 발걸음 분포의 비교 등을 통해 실시간으로 수집하는 다중 정보들이 기존의 IoT 기기들보다 효율적이고 신뢰성 있다는 결과를 제시한다.

초등과학 영재의 논증활동에서 사용된 증거의 수준 분석 (An Analysis on the Level of Evidence used in Gifted Elementary Students' Debate)

  • 조현준;양일호;이효녕;송윤미
    • 한국과학교육학회지
    • /
    • 제28권5호
    • /
    • pp.495-505
    • /
    • 2008
  • 이 연구의 목적은 초등 과학영재들의 논증활동에서 활용되는 증거들의 전개 양상과 수준을 Perella's Hierarchy of Evidence를 바탕으로 분석하는 것이다. 연구를 위하여 K대학 부설 과학영재교육원 초등과학 영재반 (5학년 5명, 6학년 10명) 15명을 연구 대상으로 선정하였으며 논증과제를 2주전 미리 부여한 뒤, 논증과제에 대한 찬성 또는 반대의 입장을 학생들이 각자 자유롭게 선택하여 총 2시간 동안 논증활동을 하였다. 연구자는 논증과정을 관찰하고 촬영, 녹음한 뒤 전 과정을 전사하여 분석하였다. 전사한 자료를 발화순서에 따라 Protocol Number를 부여한 뒤, 찬성팀과 반대팀이 논증활동을 전개하는 흐름을 파악하고 그 과정에서 나타나는 특징을 살펴보았다. 그리고 주장이나 반론, 답변 등에 사용되는 증거를 Perella's Hierarchy of Evidence 에 따라 Level 1부터 Level 6까지 등급화하여 각 수준별 빈도수를 구하였다. 이 연구 결과를 통하여 초등 과학영재들은 전체적으로 주장-반론-재반론의 순서가 반복되는 논증활동을 하며 사용된 50%이상의 증거가 Level 1과 Level 2였으며 Level 4 이상의 높은 수준의 증거는 20% 내외인 것을 알 수 있었다. 초등과학영재들은 논증과제에 대한 찬성, 반대 입장에 관계없이 통계 자료나 연구결과와 같이 신뢰할 수 있는 객관적 증거들을 사용하기 보다는 개인의 생각이나 경험, 타인의 경험, 개인의 추측 등 출처와 진위 여부를 확인할 수 없는 낮은 수준의 증거를 사용하여 약한 논증을 하고 있었다. 반면에, 상대방의 주장에 따르는 증거가 신뢰할 수 없거나 납득하기에 부족할 때에는 증거가 부족함을 지적하면서 상대방의 주장을 반박하는 상반되는 모습을 보이기도 하였다. 그리고 상대방이 상황이나 용어에 대한 인식이 부족하여 질문을 하거나 구체적 설명 또는 주장에 따르는 증거 제시를 요청할 경우, 답변을 하기도 하지만 답변이 어렵거나 증거가 부족하면 요청을 무시하고 새로운 화제로 급전환하였다. 또한 논증활동 중에 상대방이 자신의 주장에 대해 실험 연구 결과와 같은 높은 수준의 증거를 제시하며 반론할 경우, 수용하거나 재반론하기 보다는 자신의 주장을 반복하여 진술하거나 갑자기 다른 주장으로 돌려 회피하려 하였으며 논증활동 중에 주장의 일치에 도달하지 못하고 계속적으로 대립될 경우, 수 초간 침묵이 흐르다가 의견이 합의되지 않은 채 다른 화제로 전환하는 경향이 있었다. 이러한 연구 결과로부터 초등 과학영재들이 보다 높은 수준의 증거를 사용하여 강한 논증을 할 수 있도록 논증과정을 활용한 교수 프로그램 및 교사 인식 재고를 위한 교사 교육 프로그램을 개발할 필요가 있다.

챗봇 환경에서 데이터 시각화 인터랙션을 위한 자연어처리 모델 (Natural Language Processing Model for Data Visualization Interaction in Chatbot Environment)

  • 오상헌;허수진;김성희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권11호
    • /
    • pp.281-290
    • /
    • 2020
  • 스마트폰의 보급으로 인해 개인화된 데이터를 활용하고자 하는 서비스들이 증가하고 있다. 특히, 헬스케어와 관련된 서비스들은 다양한 데이터를 다루며, 이를 효과적으로 보여주기 위해 데이터 시각화 기법을 활용하고 있다. 데이터 시각화 기법이 활용되면서 자연스럽게 시각화에서의 인터랙션 또한 함께 강조되고 있다. PC 환경에서 데이터 시각화에 대한 인터랙션은 마우스로 이루어지기 때문에, 데이터에 대한 필터링이 다양하게 제공되고 있다. 반면, 모바일 환경에서의 인터랙션은 화면의 크기가 작고, 인터랙션 가능 여부를 인지하기 어려워 버튼 터치 방식으로 앱에서 제공하는 제한된 시각화만을 제공받을 수 있다. 이러한 모바일 환경에서의 인터랙션 한계를 극복하기 위해, 챗봇과의 대화를 통해 데이터 시각화 인터랙션을 가능하게 하여 사용자들에게 개개인의 데이터를 다양한 시각화를 통해 확인할 수 있도록 하고자 한다. 이를 위해서는 사용자의 질의를 쿼리로 변환하여, 주기적으로 데이터를 축적하고 있는 데이터베이스에서 변환된 쿼리를 통해 결과 데이터를 불러올 수 있어야 한다. 자연어를 쿼리로 변환하는 연구는 현재 많이 이루어지고 있지만, 시각화를 기반으로 하여 사용자의 질의를 쿼리로 변환하는 연구에 대해서는 아직 이루어지지 않았다. 따라서, 본 논문에서는 사전에 데이터 시각화 기법이 정해진 상황에서의 쿼리 생성에 초점을 맞추고자 한다. 지원하는 인터랙션은 태스크 x-축 값에 대한 필터링 및 두 그룹 간 비교이다. 테스트 시나리오는 걸음 수에 대한 데이터를 활용하였으며, x-축 기간에 대한 필터링은 바 그래프, 두 그룹간 비교는 라인 그래프로 나타내었다. 시각화를 통해 요청한 정보를 제공받을 수 있는 자연어처리 모델을 개발하기 위해 1,000명을 대상으로 한 설문조사를 통해 약 15,800개의 학습 데이터를 수집하였다. 알고리즘 개발 및 성능 평가를 진행한 결과, 분류 모델에서는 약 89%, 쿼리 생성 모델에서는 약 99% 정확도를 보였다.

작업기반 지역사회 재활이 뇌졸중 재가 장애인의 일상생활과 작업수행 기술에 미치는 효과 (The Effects of Occupation-Based Community Rehabilitation for Improving Occupational Performance Skills and Activity Daily Living of Stroke Home Disabled People: A Single Subject Design)

  • 문광태;박혜연;김종배
    • 재활치료과학
    • /
    • 제9권2호
    • /
    • pp.99-117
    • /
    • 2020
  • 목적 : 지역사회에서 생활하는 뇌졸중 장애인을 대상으로 작업기반 지역사회 재활이 뇌졸중 장애인의 작업수행기술에 미치는 영향을 연구하고, 작업 수행의 질과 만족도 변화에 대해 알아보고자 하였다. 연구방법 : 단일대상연구(Single subject research) 중 ABA 설계를 사용하였고, 뇌졸중 진단을 받은 심한 장애인 1명을 선정하였다. 연구 과정은 2019년 5월 21일부터 2019년 9월 7일까지 17주간 총 25회기(기초선 A 5회기, 중재 기간 B 14회기, 기초선 기간 A' 5회기, 추적 기간 1회기)로 진행하였다. 중재는 연구자가 대상자의 집으로 방문하여 진행되었다. 작업치료중재과정모델에 따라 중재 모델 선정 및 적용하였으며, 중재에는 과제 제공 및 피드백, 관련 정보 교육, 가정환경 수정, 지역자원 연계가 포함되었다. 작업기반 지역사회 재활 프로그램을 적용한 이후 일상생활에서 작업수행기술의 빈도 변화, 작업수행 만족도, 일상생활활동과 삶의 질의 변화를 알아보았으며, 추적 관찰하였다. 결과는 선형그래프와 막대그래프를 이용하여 시각적으로 분석하였다. 결과 : 작업기반 지역사회 재활 프로그램을 적용했을 때, 손 닿는 곳의 상의 입기, 침대에서 양말과 실내화 신기, 의자에 앉아 신발 신기 기술과 일상생활활동이 향상되었다. 작업수행기술 평가 결과 대상자의 작업수행 기술의 질이 향상되었음을 확인하였으며, 작업수행 만족도 또한 향상되었다. 결론 : 본 연구를 통해 작업기반 지역사회 재활 프로그램이 지역사회에 거주하는 뇌졸중 장애인의 작업수행기술을 향상할 수 있으며, 일상생활활동과 삶의 질, 작업수행 만족도에 긍정적인 영향을 미쳤다. 마지막으로 뇌졸중 대상자 뿐만 아니라 지역사회에 거주하는 장애 유형별로 작업기반 지역사회 재활 프로그램이 보편화 되기를 기대해 본다.

조합에서 모든 경우의 수를 만들기 위한 CPU와 GPU의 효율적 협업 방법 (Efficient Collaboration Method Between CPU and GPU for Generating All Possible Cases in Combination)

  • 손기봉;손민영;김영학
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제7권9호
    • /
    • pp.219-226
    • /
    • 2018
  • 조합에서 모든 경우의 수를 생성하는 체계적인 방법 중 하나는 조합 트리를 구성 하는 것이며 조합 트리를 구성하는 시간 복잡도는 O($2^n$)이다. 조합 트리는 그래프 동형 문제나 빈발 항목집합을 계산하는 초기 모델 등 다양한 목적으로 활용된다. 그러나 조합의 모든 경우의 수를 탐색해야 하는 알고리즘은 높은 시간 복잡도로 인해 현실적으로 활용되기 어렵다. 그럼에도 불구하고 데이터의 양이 방대해지고 이를 활용하기 위한 다양한 연구가 진행되면서 모든 경우의 수를 탐색해야만 하는 경우가 늘고 있다. 최근 GPU환경이 보급되고 쉽게 접할 수 있게 되면서 직렬 환경에서 높은 시간 복잡도를 가지는 알고리즘들을 병렬화 하여 시간을 줄이려는 다양한 시도가 이루어지고 있다. 조합에서 모든 경우의 수를 생성하는 방법은 순차적으로 진행되고 하부 작업의 크기가 편향되기 때문에 병렬 구현에 적합하지 않다. 병렬 알고리즘의 성능은 모든 스레드가 비슷한 크기의 작업을 가질 때 극대화될 수 있다. 본 논문에서는 모든 경우의 수를 구하는 문제를 병렬화하기 위하여 CPU와 GPU가 효율적으로 협업하기 위한 방법을 제안한다. 제안한 알고리즘의 성능을 검증하기 위하여 이론적인 측면에서 시간 복잡도를 분석하고, CPU와 GPU환경에서 다른 알고리즘과 본 연구에서 제안한 알고리즘의 실험 시간을 비교한다. 실험 결과 본 연구에서 제안한 CPU와 GPU의 협업 알고리즘은 이전 알고리즘에 비하여 CPU의 수행시간과 GPU의 수행시간의 균형을 유지하였고 아이템의 개수가 커질수록 괄목할 만한 시간 개선을 보였다.

중소기업 환경에서의 합목적적 정보시스템 활용을 위한 최종사용자 피드백 탐색행위의 중요성 (Importance of End User's Feedback Seeking Behavior for Faithful Appropriation of Information Systems in Small and Medium Enterprises)

  • 신영미;이주량;이호근
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.61-95
    • /
    • 2007
  • Small-and-medium sized enterprises(SMEs) represent quite a large proportion of the industry as a whole in terms of the number of enterprises or employees. However researches on information system so far have focused on large companies, probably because SMEs were not so active in introducing information systems as larger enterprises. SMEs are now increasingly bringing in information systems such as ERP(Enterprise Resource Planning Systems) and some of the companies already entered the stage of ongoing use. Accordingly, researches should deal with the use of information systems by SME s operating under different conditions from large companies. This study examined factors and mechanism inducing faithful appropriation of information systems, in particular integrative systems such as ERP, in view of individuals` active feedback-seeking behavior. There are three factors expected to affect end users` feedback-seeking behavior for faithful appropriation of information systems. They are management support, peer IT champ support, and IT staff support. The main focus of the study is on how these factors affect feedback-seeking behavior and whether the feedback-seeking behavior plays the role of mediator for realizing faithful appropriation of information systems by end users. To examine the research model and the hypotheses, this study employed an empirical method based on a field survey. The survey used measurements mostly employed and verified by previous researches, while some of the measurements had gone through minor modifications for the purpose of the study. The survey respondents are individual employees of SMEs that have been using ERP for one year or longer. To prevent common method bias, Task-Technology Fit items used as the control variable were made to be answered by different respondents. In total, 127 pairs of valid questionnaires were collected and used for the analysis. The PLS(Partial Least Squares) approach to structural equation modeling(PLS-Graph v.3.0) was used as our data analysis strategy because of its ability to model both formative and reflective latent constructs under small-and medium-size samples. The analysis shows Reliability, Construct Validity and Discriminant Validity are appropriate. The path analysis results are as follows; first, the more there is peer IT champ support, the more the end user is likely to show feedback-seeking behavior(path-coefficient=0.230, t=2.28, p<0.05). In other words, if colleagues proficient in information system use recognize the importance of their help, pass on what they have found to be an effective way of using the system or correct others' misuse, ordinary end users will be able to seek feedback on the faithfulness of their appropriation of information system without hesitation, because they know the convenience of getting help. Second, management support encourages ordinary end users to seek more feedback(path-coefficient=0.271, t=3.06, p<0.01) by affecting the end users' perceived value of feedback(path-coefficient=0.401, t=6.01, p<0.01). Management support is far more influential than other factors that when the management of an SME well understands the benefit of ERP, promotes its faithful appropriation and pays attention to employees' satisfaction with the system, employees will make deliberate efforts for faithful appropriation of the system. However, the third factor, IT staff support was found not to be conducive to feedback-seeking behavior from end users(path-coefficient=0.174, t=1.83). This is partly attributable to the fundamental reason that there is little support for end users from IT staff in SMEs. Even when IT staff provides support, end users may find it less important than that from coworkers more familiar with the end users' job. Meanwhile, the more end users seek feedback and attempt to find ways of faithful appropriation of information systems, the more likely the users will be able to deploy the system according to the purpose the system was originally meant for(path-coefficient=0.35, t=2.88, p<0.01). Finally, the mediation effect analysis confirmed the mediation effect of feedback-seeking behavior. By confirming the mediation effect of feedback-seeking behavior, this study draws attention to the importance of feedback-seeking behavior that has long been overlooked in research about information system use. This study also explores the factors that promote feedback-seeking behavior which in result could affect end user`s faithful appropriation of information systems. In addition, this study provides insight about which inducements or resources SMEs should offer to promote individual users' feedback-seeking behavior when formal and sufficient support from IT staff or an outside information system provider is hardly expected. As the study results show, under the business environment of SMEs, help from skilled colleagues and the management plays a critical role. Therefore, SMEs should seriously consider how to utilize skilled peer information system users, while the management should pay keen attention to end users and support them to make the most of information systems.

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.