• 제목/요약/키워드: Information-platform

검색결과 5,675건 처리시간 0.037초

L1/L2 혼합형 중계 방법을 적용한 이더넷 기반 비압축 오디오 분배 시스템의 성능 분석 (Performance of Uncompressed Audio Distribution System over Ethernet with a L1/L2 Hybrid Switching Scheme)

  • 남위정;윤종호;박부식;조남홍
    • 대한전자공학회논문지TC
    • /
    • 제46권12호
    • /
    • pp.108-116
    • /
    • 2009
  • 본 논문에서는 고품질 비압축 오디오 트래픽의 분배 시에 요구되는 낮은 지연 및 지터를 보장하고 이더넷 환경에서 데이터 트래픽의 효율적인 교환을 가능하게 하는 새로운 L1/L2 혼합형 중계 방식을 적용한 이더넷 기반 오디오 분배 시스템을 제안하고 성능을 분석하였다. 제안하는 방식이 적용된 오디오 분배 시스템은 마스터 노드와 다수의 중계 노드로 구성되며 이들은 상호간에 상향 하향 링크를 통하여 데이지 체인 형태로 연결된다. 마스터 노드는 스테레오 24채널에서 PCM샘플링된 16비트 오디오 채널을 수납할 수 있는 오디오 프레임을 125us의 주기마다 생성하여 하향 링크를 통해 전송한다. 하향 링크를 통하여 오디오 프레임을 수신한 중계 노드들은 생성한 오디오 트래픽을 해당 노드에게 할당된 오디오 채널에 수납하고 다음 중계노드로 물리 계층 기반(L1)의 전송을 한다. 망의 종단 노드는 수신되는 오디오 프레임을 상향 링크를 통하여 마스터 노드로 루프백시키고 오디오가 상향 링크를 통하여 전송되는 과정에서 모든 중계 노드들은 자신이 수신해야 할 오디오 채널을 복사하여 오디오를 재생한다. 오디오 프레임의 송신이 완료되면 남은 기간 동안 중계 노드들은 L2 스위치로 동작하면서 데이터 프레임을 데이터 링크 계층 기반(L2)에서 교환한다. 이와 같은 L1/L2 혼합형 중계 방식의 동작을 위해 노드 입력 부의 물리 계층과 데이터 링크 간에 존재하는 MII에 오디오 프레임과 데이터 프레임을 구분하는 기능을 가지는 글루로직을 새로 추가하였다. 제안된 방식에 대하여 네트워크 시뮬레이터인 OMNeT++를 사용하고 다양한 파라미터를 통하여 제안된 방식이 오디오 트래픽의 지연 특성과 데이터 트래픽의 전송 효율 면에서 우수한 특성을 제공할 수 있음을 보였다. 제안된 방식은 물리 계층 기반의 전송 또는 데이터 링크 기반의 전송 방식을 사용하는 기존 이더넷 기반 오디오 분배 기술에 비하여 향상된 지연 성능 및 전송 효율을 제공할 수 있어 오디오분배 시스템뿐만 아니라 비디오분배 시스템, 디지털 AV장치 간의 연결 등에도 활용될 수 있다.

말기암환자 정보시스템을 이용한 우리나라 암환자 완화의료기관의 이용현황 (The Current Status of Utilization of Palliative Care Units in Korea: 6 Month Results of 2009 Korean Terminal Cancer Patient Information System)

  • 신동욱;최진영;남병호;서원석;김효영;황은주;강진아;김소희;김양혁;박은철
    • Journal of Hospice and Palliative Care
    • /
    • 제13권3호
    • /
    • pp.181-189
    • /
    • 2010
  • 목적: 최근 보건의료 정책 결정은 근거에 기반하여 이루어지는 추세에 있으며, 말기암환자 정보시스템은 이러한 필요에 부응하기 위하여 개발되었다. 본 고에서는 말기암환자 정보시스템의 개발과정 및 6개월 데이터로부터의 통계 결과를 보고하고자 한다. 방법: 말기암환자 정보시스템의 입력항목은 실무 전문가들의 자문을 받아 개발되었으며, 이벨로스 임상연구관리시스템을 기반으로 구축하였다. 2009년 보건복지가족부에서 지정된 34개 암환자완화의료 기관에 2009년 1월 1일부터 6월 30일까지 등록된 환자들에 대한 정보가 수집되었다. 분석은 기술적 통계를 이용하였다. 결과: 총 2,940명의 전국적으로 대표성 있는 데이터로부터 아래와 같은 결과를 얻었다. 평균연령은 $64.8{\pm}12.9$ 세였고, 56.6%가 남자였다. 폐암(18.0%)이 가장 많았다. 2인 이상의 의사에 의하여 말기진단을 받은 경우는 50.3% 였으며, 입원 당시 말기라는 사실을 알고 있는 환자는 69.7%였고, 거의 절반에 가까운 환자가 특별한 의뢰 없이 입원하였다. 평균 통증 및 최고 통증은 입원 1주 후에 통계적으로 유의하게 감소하였다. 사망 퇴원한 환자가 73.4%였으며, 집으로 퇴원하는 경우는 13.3%에 불과했다. 1회당 평균 입원일수는 $20.2{\pm}21.2$일이었으며, 중위값은 13일이었다. 결론: 말기암환자 정보시스템의 운영을 통하여 완화의료 기관 이용 환자 및 가족의 특성, 서비스 제공에 관한 현황 등에 관한 전국적으로 대표성 있는 자료를 얻을 수 있었다.

대표 패턴 마이닝에 활용되는 패턴 압축 기법들에 대한 분석 및 성능 평가 (Analysis and Performance Evaluation of Pattern Condensing Techniques used in Representative Pattern Mining)

  • 이강인;윤은일
    • 인터넷정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.77-83
    • /
    • 2015
  • 데이터 마이닝에서 활발히 연구되고 있는 주요 분야들 가운데 하나인 빈발 패턴 마이닝은 대규모의 데이터 집합 또는 데이터베이스로부터 숨겨진 유용한 패턴 정보를 추출하기 위한 방법이다. 또한 이 기법으로 얻을 수 있는 결과물을 통해 데이터베이스내의 다양하고 중요한 특징들을 더욱 손쉽게 자동적으로 분석할 수 있기 때문에 많은 응용영역에도 활발히 적용되고 있다. 하지만 이러한 데이터베이스로부터 단순히 사용자에 의해 설정된 최소 지지도 임계값만을 가지고 이를 만족하는 모든 패턴들을 추출하는 기존의 전통적인 빈발 패턴 마이닝 방식은 데이터베이스의 특성과 임계값 설정의 정도에 따라 극도로 많은 수의 결과 패턴을 생성하는 문제를 가지며, 이에 따른 시간 및 공간 자원의 낭비를 초래한다. 또한 과도하게 생성된 패턴에 대한 분석의 어려움 역시 심각한 문제가 된다. 기존의 빈발 패턴 마이닝 접근방법들이 직면한 이러한 문제를 해결하고자, 데이터베이스로부터 가능한 모든 빈발 패턴들을 마이닝하는 것이 아닌, 이들에 대한 대표 패턴들만은 선별적으로 추출할 수 있도록 하는 대표 패턴 마이닝의 개념과 다양한 관련 기법들이 제안되었다. 본 논문에서는 생성되는 각 패턴의 최대성 또는 폐쇄성을 고려하는 패턴 압축 기법들에 대한 특성들을 기술하고, 이에대한 비교 및 분석을 진행한다. 최대 빈발 패턴 혹은 닫힌 빈발 패턴들을 마이닝함으로써, 효과적인 패턴 압축이 가능하며, 더 적은 시공간 자원으로 마이닝 작업을 수행할 수 있다. 또한 압축된 패턴들은 필요시 다시 원래의 패턴 형태로 복구가 가능한 특징이 있으며, 특히 닫힌 패턴 접근 방법을 이용하면 패턴을 압축하고 다시 해제하는 과정에서 어떠한 정보의 손실도 일어나지 않는다. 본 논문에서는 같은 플랫폼 상에서 동일한 구현 수준의 알고리즘에 대해 실세계로부터 축적된 실 데이터셋들을 가지고 상기 기법들에 대한 성능평가를 진행함으로써, 각 기법이 패턴 생성, 수행 시간, 메모리 사용량과 같은 실제적인 마이닝 성능에 대해 어떠한 영향을 미치는지에 대한 심층적 분석결과를 보인다.

인공위성 원격탐사를 이용한 백두산 화산 감시 연구 리뷰 (A Review on Monitoring Mt. Baekdu Volcano Using Space-based Remote Sensing Observations)

  • 홍상훈;장민정;정성우;박서우
    • 대한원격탐사학회지
    • /
    • 제34권6_4호
    • /
    • pp.1503-1517
    • /
    • 2018
  • 백두산은 중국과 북한의 국경 경계에 위치하고 있는 성층화산으로 신생대 올리고세 이후 주요 분화 단계를 거쳐 형성된 것으로 알려져 있다. 2010년 이후 마그마 재활동으로 인한 백두산 화산활동 여부에 대한 관심이 증대되고 있다. 백두산 화산 활동을 감시하기 위한 연구는 기상청, 한국지질자원연구원 등 국가기관 중심으로 활발히 수행되고 있다. 2018년에는 한-중 백두산 공동 관측 장기연구 과제가 선정되었으며 이로부터 화산특화연구센터가 설립되기도 하였다. 그러나 백두산은 우리나라로부터 지리적으로 멀리 떨어져 있어 접근에 대한 제약이 있을 뿐만 아니라 백두산 화산 주변에 설치되어 있는 현장 관측 장비로부터 수집된 현장 자료의 공유 혹은 접근이 쉽지 않은 상황이다. 원격탐사는 직접적인 물리적 접촉 없이 대상 물체에 대한 특성을 원격으로 측정하는 수단으로서, 대상물의 관측을 위해 자동차, 무인기, 항공기, 인공위성 등 여러 형태의 플랫폼이 사용된다. 지난 수십 년 간, 다양한 파장 대역에서의 전자기파를 이용한 원격탐사 자료를 활용하여 화산 감시 연구가 수행되어 왔다. 특히 레이더 원격탐사는 주야조건, 기상조건에 관계없이 자료를 획득할 수 있을 뿐만아니라 위상정보를 이용한 레이더 위상간섭기법을 통한 미세 지표 변위 관측이 가능하여 매우 널리 이용되고 있는 화산 감시 기술이다. 본 논문의 목적은 백두산 화산 관측을 위해 수행된 기존 원격탐사 연구 문헌을 수집하고 동향을 파악하는 것이다. 또한 지속적인 화산 감시를 위한 가용 영상레이더 위성정보를 조사하여 향후 이를 바탕으로 백두산 화산 지표 변위의 주기적 탐지 연구를 수행하는데 활용할 예정이다.

미세먼지 예측 성능 개선을 위한 시공간 트랜스포머 모델의 적용 (Application of spatiotemporal transformer model to improve prediction performance of particulate matter concentration)

  • 김영광;김복주;안성만
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.329-352
    • /
    • 2022
  • 미세먼지는 폐나 혈관에 침투해 각종 심장 질환이나 폐암 등의 호흡기 질환을 일으키는 것으로 보고되고 있다. 지하철은 일 평균 천만 명이 이용하는 교통수단으로, 깨끗하고 쾌적한 환경조성이 중요하나 지하터널을 통과하는 지하철의 운행 특성과 터널에 갇힌 미세먼지가 열차 풍으로 인해 지하역사로 이동하는 등의 문제로 지하역사의 미세먼지 오염도는 높은 것으로 나타나고 있다. 환경부와 서울시는 지하역사 공기질 개선대책을 수립하여 다양한 미세먼지 저감 노력을 기울이고 있다. 스마트 공기질 관리 시스템은 공기질 데이터 수집 및 미세먼지 농도를 예측하여 공기질을 관리하는 시스템으로 미세먼지 농도 예측 모델이 중요한 구성 요소이다. 그동안 시계열 데이터 예측에 관한 다양한 연구가 진행되어왔지만, 지하철 역사의 미세먼지 농도 예측과 관련해서는 통계나 순환신경망 기반의 딥러닝 모델 연구에 국한되어 있다. 이에 본 연구에서는 시공간 트랜스포머를 포함한 4개의 트랜스포머 기반 모델을 제안한다. 서울시 지하철 역사의 대합실을 대상으로 한 시간 후의 미세먼지 농도 예측실험을 수행한 결과, 트랜스포머 기반 모델들의 성능이 기존의 ARIMA, LSTM, Seq2Seq 모델들에 비해 우수한 성능을 나타냄을 확인하였다. 트랜스포머 기반 모델 중에서는 시공간 트랜스포머의 성능이 가장 우수하였다. 데이터 기반의 예측을 통하여 운영되는 스마트 공기질 관리 시스템은 미세먼지 예측의 정확도가 향상될수록 더욱더 효과적이고 에너지 효율적으로 운영될 수 있다. 본 연구 결과는 스마트 공기질 관리 시스템의 효율적 운영에 기여할 수 있을 것으로 기대된다.

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

소비자 감성 기반 뷰티 경험 패턴 맵 개발: 화장품을 중심으로 (Development of Beauty Experience Pattern Map Based on Consumer Emotions: Focusing on Cosmetics)

  • 서봉군;김건우;박도형
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.179-196
    • /
    • 2019
  • 최근의 '똑똑한 소비자(Smart Consumer)'라 불리는 소비자가 많아지고 있는데, 이들은 제조사나 광고를 통해 전달되는 정보에 의존하지 않고, 기존 사용자나 전문가들의 후기, 여러 과학 지식을 획득하여 제품에 대한 이해를 높이고, 본인 스스로가 직접 판단하여 구매하고 있다. 특히나 화장품 분야는 인체 유해성과 같은 부정적인 요소에 대한 민감도가 높고, 자신의 고유한 피부 특성과의 조화도 고려되어야 하기 때문에, 전문적인 지식과 타인의 경험, 본인의 과거 경험 등을 종합적으로 생각하여 구매 의사결정을 내려야 하고, 이에 대해서 적극적인 소비자가 많아지고 있다. 이러한 움직임은 '셀프 뷰티' 와 같은 '셀프' 문화의 열풍과 함께, 문화 현상인 '그루밍족'의 등장, 사회적 트렌드인 'K-뷰티' 와도 동행한다고 할 수 있다. 맞춤형 화장품에 대한 관심의 급부상도 이러한 현상 중 하나라 볼 수 있다. 소비자들의 맞춤형 화장품의 니즈를 충족시키기 위해, 화장품 제조사나 관련 기업들은 ICT기술과의 융합을 통하여 프리미엄 서비스를 중심으로 소비자의 니즈에 대응하고 있다. 그러나 기업 및 시장 현황이 맞춤형 화장품을 향해 진화하고 있지만, 소비자의 피부 상태, 추구하는 감성, 실제 제품이나 서비스까지 소비자 경험을 전체적으로 완전하게 다루는 지능형 데이터 플랫폼은 부재한다. 본 연구에서는 소비자 경험에 대한 지능형 데이터 플랫폼 구축을 위한 첫 단계로 소비자 언어 기반의 화장품 감성 분석을 수행하였다. 소비자들 개인의 선호나 취향이 분명한 앰플/세럼 카테고리를 중심으로 매출 순위 1위에서 99위까지의 99개 제품을 선정하여, 블로그와 트위터 등의 SNS 상에 언급되는 후기 내에 화장품 경험에 대한 소비자 감성을 수집하였다. 총 357개의 감성 형용사를 수집하였고, 고객 여정 워크샵을 통해 유사 감성을 합치고, 중복 감성을 통합하는 작업을 수행하였으며, 최종 76개 형용사를 구축했다. 구축한 형용사에 대한 SOM 분석을 통해 화장품에 대한 소비자 감성에 대한 클러스터링을 실시했다. 분석 결과, 총 8개의 클러스터를 도출했고, 클러스터 별 각 노드의 벡터 값을 기준으로 소비자 감성 Top 10을 도출했다. 소비자 감성을 기준으로 클러스터별 소비자 감성에 서로 다른 특징이 발견됐으며, 소비자에 따라 다른 소비자의 감성을 선호, 기존과는 다른 소비자 감성을 고려한 추천 및 분류 체계가 필요함을 확인했다. 연구 결과를 통해 감성 분석의 활용 도메인이 화장품만이 아닌 다양한 영역으로 확장될 수 있음 확인했으며, 감성 분석을 통한 소비자 인사이트를 도출할 수 있다는 점을 시사했다. 또한, 본 연구에서 활용한 디자인 씽킹(Design Thinking)의 방법론의 적용하여 화장품 특화된 감성 사전을 과학적인 프로세스로 구축했으며, 화장품에 대한 소비자의 인지 및 심리에 대한 이해를 도울 수 있을 것으로 기대한다.

데이터마이닝을 활용한 기업 R&D역량 특성에 관한 탐색 연구 (A Study on the Characteristics of Enterprise R&D Capabilities Using Data Mining)

  • 김상국;임정선;박완
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.1-21
    • /
    • 2021
  • 글로벌 경영환경 변화로 기술개발과 시장니즈의 불확실성이 커지고 기업 간 상호 경쟁이 심화되면서 개별 기업들의 연구개발 활동에 대한 관심과 요구가 증가하고 있다. 이러한 환경변화에 대응하기 위하여 연구개발 기업들은 설비투자에 더욱 신중을 가하면서 연구개발의 질적인 경쟁력을 제고시키기 위한 수단 중 하나로 연구개발 투자를 강화하고 있다. 결과적으로 설비나 연구개발 투자 요소는 연구개발 기업들의 입장에서는 미래 불확실성을 떠안아야하는 부담이 될 수 밖에 없다. 단지 연구개발 역량을 제고시키기 위한 수단으로 연구개발 투자를 증가시키는 경영 전략은 기업성과측면에서 불확실성이 높은 것이 사실이다. 본 연구에서는 데이터마이닝 기법을 활용하여 기업들의 연구개발 역량에 영향을 주는 특성들을 기술경영능력, 연구개발능력, 그리고 기업분류 속성 관점에서 탐색하고 이러한 개별 요인들이 연구개발 역량의 수준에 따라 나타나는 특성들을 탐색하였다. 이를 위해서 국내 연구개발 기업 전체를 대상으로 증거데이터에 근거해 군집분석과 실험결과를 제시하였다. 상기의 3개 관점마다 세부 평가지표를 각각 7개, 2개, 4개로 구성하여 해당 영역에서의 개별적인 수준을 정량적으로 측정하고자 하였다. 기술경영능력과 연구개발능력의 경우 현행 기술력 평가기관들이 주도적으로 활용하고 있는 소항목 평가지표를 참조하였으며, 이때 정량적으로 자료 확보가능한지 여부를 고려하여 최종적인 세부 평가지표를 새롭게 구성하였다. 기업분류 속성의 경우에는 가장 기본적인 기업 분류 프로파일 정보를 고려하여 구성하였다. 특히 연구개발 역량수준의 동질성 파악을 위해서 기술경영능력과 연구개발능력의 세부평가지표를 활용하여 개별기업별 종합점수를 부여하였으며, 이때 역량수준을 5개의 등급으로 분류하여 군집분석 결과와 비교하였다. 분석된 군집과 역량수준 등급과의 비교평가에 따른 의미를 부여하기 위해서 군집별로 연구개발 역량수준이 높은 경향과 낮은 경향이 존재하는 군집들을 탐색하였다. 이후 해당 군집에서 세부 평가지표에 따른 특징들을 분석하였다. 이와 같은 연구수행 방법을 통해 연구 개발 역량수준이 높은 군집이 2개, 낮은 군집이 1개로 분석되었으며, 나머지 2개의 군집들은 역량수준이 거의 높은 발생 빈도로 유사하게 나타났다. 결과적으로 본 연구에서는 역량수준이 높은 2개 군집과 낮은 1개의 군집들을 대상으로 세부 평가지표에 따른 개별적 특징들을 분석하였다. 본 연구의 결과가 제시하고 있는 시사점은 기술변화 속도와 시장수요의 변화에 효과적으로 대응할 수 있는 전문 경영자의 교체주기가 빠를수록 연구개발 역량 제고에 기여할 가능성이 높다는 점이다. 개인기업의 경우에 법인기업으로의 전환을 통해 연구개발 인력들의 기업에 대한 소속감을 제고시킴으로써 연구개발 역량의 투입강도를 높일 필요가 있으며, 조직적 측면에서도 팀단위의 조직구성을 통해 책임과 권한의 정확성을 제공할 필요가 있다는 점이다. 기술상용화 실적건수나 기술인증건수는 역량제고에 기여하는 경우와 그렇지 않은 경우 모두 발생되고 있어, 경영자 입장에서 연구개발 역량제고를 위한 중요 인자로 검토하는데 한계가 있는 것으로 확인되었다. 마지막으로 실용신안출원의 경험 여부는 연구개발 역량에 중요한 영향을 미치는 요인으로 파악되어, 연구개발 역량 제고를 위해서는 실용신안출원 장려를 위한 동기부여를 제공할 필요성을 확인하였다. 이처럼 본 연구결과는 개별 기업들의 연구개발 역량 제고를 위한 기업 경영전략의 중요한 시사점을 제공할 수 있을 것으로 기대된다.

사용자 행동 기반의 사회적 관계를 결합한 사용자 협업적 여과 방법 (Incorporating Social Relationship discovered from User's Behavior into Collaborative Filtering)

  • 타이쎄타;하인애;조근식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.1-20
    • /
    • 2013
  • 소셜 네트워크는 사용자들의 공통된 관심사, 경험, 그리고 일상 생활들을 함께 공유하기 위해 소셜 네트워크 상 사람들을 서로 연결시켜주는 거대한 커뮤니케이션 플랫폼이다. 소셜 네트워크상의 사용자들은 포스팅, 댓글, 인스턴스 메시지, 게임, 소셜 이벤트 외에도 다양한 애플리케이션을 통해 다른 사용자들과 소통하고 개인 정보 관리하는데 많은 시간을 소비한다. 소셜 네트워크 상의 풍부한 사용자 정보는 추천시스템이 추천 성능을 향상시키기 위해 필요한 큰 잠재력이 되었다. 대부분의 사용자들은 어떤 상품을 구매하기 전 가까운 관계이거나 같은 성향을 가진 사람들의 의견을 반영하여 의사 결정을 하게 된다. 그러므로 소셜 네트워크에서의 사용자 관계는 추천시스템을 위한 사용자 선호도 예측을 효율적으로 높이는데 중요한 요소라 할 수 있다. 일부 연구자들은 소셜 네트워크에서의 사용자와 다른 사용자들 사이의 상호작용 즉, 소셜 관계(social relationship)와 같은 소셜 데이터가 추천시스템에서 추천의 질에 어떠한 영향을 미치는가를 연구하고 있다. 추천시스템은 아마존, 이베이, Last.fm과 같은 큰 규모의 전자상거래 사이트 또한 채택하여 사용되는 시스템으로, 추천시스템을 위한 방법으로는 협업적 여과 방법과 내용 기반 여과 방법이 있다. 협업적 여과 방법은 사용자들의 선호도 학습에 의해 사용자가 아직 평가하지 않은 아이템 중 선호할 수 있는 아이템을 정확하게 제안하기 위한 추천시스템 방법 중 하나이다. 협업적 여과는 사용자들의 데이터에 초점을 맞춘 방법으로 유사한 배경과 선호도를 가지는 사용자들로부터 정보를 수집하여 사용자들의 선호도 예측을 자동으로 발생시킨다. 특히 협업적 여과는 근접한 이웃 사용자들에 의해서 목적 사용자가 선호할 수 있는 아이템을 제시하는 것으로 유사한 이웃 사용자를 찾는 것이 중요하다. 좋은 이웃 사용자 발견은 사용자와 아이템을 고려하는 방법이 일반적이다. 각 사용자는 아이템 즉, 영화, 상품, 책 등에 자신의 선호도를 나타내기 위하여 평가 값을 입력하고, 시스템은 이를 바탕으로 사용자-평가 행렬을 구축한다. 이 사용자-평가 행렬은 목적 사용자와 유사하게 아이템을 평가한 사용자 그룹을 찾기 위한 것으로, 목적 사용자가 아직 평가하지 않은 아이템에 대하여 사용자-평가 매트릭스를 통해 그 평가 값을 예측한다. 현재 이 협업적 여과 방법은 전자상거래와 정보 검색에서 적용되어 개인화 시스템에 효율적으로 사용되고 있다. 하지만 초기 사용자 문제, 데이터 희박성 문제와 확장성 그리고 예측 정확도 향상 등 해결해야 할 과제가 여전히 남아 있다. 이러한 문제들을 해소하기 위해 많은 연구자들은 하이브리드, 신뢰기반, 소셜 네트워크 기반 협업적 여과와 같은 다양한 방법을 제안하였다. 본 논문에서는 전통적인 협업적 여과 방식의 예측 정확도와 추천 성능을 향상시키기 위해 소셜 네트워크에 존재하는 소셜 관계를 이용한 협업적 여과 시스템을 제안한다. 소셜 관계는 소셜 네트워크 서비스 중 하나인 페이스북 사용자들이 남긴 포스팅과 사용자의 소셜 네트워크 친구와 의견 교류 중 남긴 코멘트와 같은 사용자 행동을 기반으로 정의된다. 소셜 관계를 구축하기 위해 소셜 네트워크 사용자의 포스팅과 댓글을 추출하고, 추출된 텍스트에 불용어 및 특수 기호 제거와 스테밍 등 전처리를 수행하였다. 특징 벡터는 TF-IDF를 이용하여 전처리된 텍스트에 나타난 각 단어에 대한 특징 점수를 계산함으로써 구축된다. 본 논문에서 이웃 사용자를 결정하기 위해 사용되는 사용자 간 유사도는 특징 벡터를 이용한 사용자 행동 유사도와 사용자의 영화 평가를 기반으로 한 전통적 방법의 유사도를 결합하여 계산된다. 제안하는 시스템은 목표 사용자와 제안한 방법을 통해 결정된 이웃 사용자 집단을 기반으로 목표 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고 Top-N 아이템을 선별하여 사용자에게 아이템을 추천하게 된다. 본 논문에서 제안하는 방법을 확인하고 평가하기 위하여 IMDB에서 제공하는 영화 정보 기반으로 영화 평가 시스템을 구축하였다. 예측 정확도를 평가하기 위해 MAE 값을 이용하여 제안하는 알고리즘이 얼마나 정확한 추천을 수행하는지에 대한 예측 정확도를 측정하였다. 그리고 정확도, 재현율 및 F1값 등을 활용하여 시스템의 성능을 평가하였으며, 시스템의 추천 품질은 커버리지를 이용하여 평가되었다. 실험 결과로부터 본 논문에서 제안한 시스템이 보다 더 정확하고 좋은 성능으로 사용자에게 아이템을 추천하는 것을 볼 수 있었다. 특히 소셜 네트워크에서 사용자 행동을 기반으로 한 소셜 관계를 이용함으로써 추천 정확도를 6% 향상시킴을 보였다. 또한 벤치마크 알고리즘과의 성능비교 실험을 통해 7% 향상된 추천 성능의 결과를 보여준다. 그러므로 사용자의 행동으로부터 관찰된 소셜 관계를 CF방법과 결합한 제안한 방법이 정확한 추천시스템을 위해 유용하며, 추천시스템의 성능과 품질을 향상시킬 수 있음을 알 수 있다.

클라우드 컴퓨팅을 이용한 유시티 비디오 빅데이터 분석 (An Analysis of Big Video Data with Cloud Computing in Ubiquitous City)

  • 이학건;윤창호;박종원;이용우
    • 인터넷정보학회논문지
    • /
    • 제15권3호
    • /
    • pp.45-52
    • /
    • 2014
  • 유비쿼터스 시티(유시티)에서는 수많은 비디오 카메라들이 설치된다. 이렇게 설치된 많은 카메라로부터 대용량의 비디오 데이터가 실시간으로 끊임없이 발생하고 유시티의 관리 시스템으로 전달된다. 유시티의 다양한 서비스들을 뒷받침하기 위해서는 이러한 비디오 데이터를 저장하고, 이렇게 저장된 대용량의 비디오 데이터를 분석할 수 있는 방법과 관리 시스템이 요구된다. 그래서, 이 논문에서는 클라우드 컴퓨팅을 기반으로 한 유시티 비디오 관리 시스템을 제안한다. 또한, 근래 주목받고 있는 데이터 병렬처리 프레임워크인 Hadoop MapReduce를 이용하여 이러한 빅데이터 비디오를 분석하는 방법을 제안하고, 이에 따른 우리의 성능 평가를 소개한다.