• 제목/요약/키워드: Matrix Vector

검색결과 759건 처리시간 0.03초

근거리 신호 모델링을 기반으로 한 어레이 형상 추정 기법들의 성능 분석 (Performance Analysis of the Array Shape Estimation Methods Based on the Nearfield Signal Modeling)

  • 박희영;이충용
    • 한국음향학회지
    • /
    • 제27권5호
    • /
    • pp.221-228
    • /
    • 2008
  • 소나 시스템에서 참조 신호를 이용하여 어레이 형상을 추정하는 경우, 참조 신호는 어레이와 충분히 떨어져 있지 않기 때문에 근거리 신호 모델링이 필요하다. 근거리 신호 모델링을 기반으로 하는 어레이 형상 추정 기법은 일반적으로 수신된 참조 신호의 공간 공분산 행렬을 이용한다. 이러한 기법 중 1개의 참조 신호만을 이용하여 공간 공분산 행렬의 고유치 분해 후 최대 고유치에 해당하는 고유 벡터를 참조 신호의 조향 벡터로 구성하여 어레이 형상을 추정하는 근거리 고유벡터 기법이 있다. 본 논문에서는 1개 이상의 참조 신호를 이용하여 공간 공분산 행렬로부터 구한 잡음 부공간과 신호 부공간이 서로 직교한다는 특성을 이용하여 Newton-type 반복 기법으로 센서 위치를 추정해 나가는 간략화된 부공간 근사 기법을 제안한다. 또한 근거리 고유 벡터 기법과 간략화된 부공간 근사 기법의 성능을 다양한 환경에서 분석해 본다. 모의 실험 결과 한 개의 참조 신호를 이용하는 경우에 근거리 고유 벡터 기법과 간략화된 부공간 근사 기법이 거의 동일한 성능을 보임을 확인할 수 있었다. 또한 근거리 고유 벡터 기법이 참조 신호를 2개 이상 사용할 수 없는데 반해 간략화된 부공간 근사 기법은 두 개의 참조 신호를 이용함으로써 참조 신호의 입사 방향에 관계없이 안정적인 형상 추정 결과를 얻을 수 있음을 확인하였다.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

Sentinel-1 위성 영상을 활용한 침수 탐지 기법 방법론 비교 연구 (Comparative study of flood detection methodologies using Sentinel-1 satellite imagery)

  • 이성우;김완엽;이슬찬;정하규;박종수;최민하
    • 한국수자원학회논문집
    • /
    • 제57권3호
    • /
    • pp.181-193
    • /
    • 2024
  • 기후변화에 의해 발생하는 대기 불균형은 강우량의 증가로 이어지고, 침수 발생 빈도가 증가함에 따라 이를 탐지할 수 있는 기술의 필요성이 증가하고 있다. 침수 피해를 최소화하기 위해 지속적인 모니터링이 필요하며, 날씨의 영향을 받지 않는 합성개구레이더(Synthetic Aperture Radar, SAR) 영상을 활용하여 침수지역을 탐지하였다. 관측된 데이터는 median 필터를 통해 노이즈를 감소시키는 전처리 과정을 진행하였으며, 객체 탐지 기법을 통해 수체와 비수체를 분류하여 각 기법의 침수탐지 활용성을 평가하고자 하였다. 본 연구에서는 Otsu 기법과 SVM 기법을 통해 수체 및 침수 탐지를 수행하였으며, Confusion Matrix를 통해 전체적인 모델의 성능을 평가하였다. Otsu 기법은 수체와 비수체의 경계를 구분하는데 적합함을 보였으나, 혼합물의 영향을 받아 오탐지의 비율이 높게 나타났다. 반면, SVM 기법을 사용한 경우, 오탐지 비율이 낮고 혼합물에 의한 영향에 민감하지 않은 것으로 관측되었다. 이에 따라 침수 상태를 제외한 다른 조건에서 SVM 기법의 정확도가 높게 나타났다. Otsu 기법이 침수 조건에서 SVM 기법보다 다소 높은 정확도를 보였지만, 정확도의 차이가 5% 미만임을 확인할 수 있었다(Otsu: 0.93, SVM: 0.90). SVM 기법이 Otsu 기법보다 침수 전, 침수 후의 조건에서 정확도 차이가 최대 15% 이상 발생하여 수체 및 침수탐지에 더 적합하게 나타났다(Otsu: 0.77, SVM: 0.92). 이러한 결과는 SVM 기법이 수체 및 침수탐지에서 효과적으로 활용될 수 있음을 시사하며, 미래의 수재해 탐지 시스템에 적용될 때 유용한 정보를 제공할 수 있을 것으로 기대된다.

음악요약 생성에 관한 연구 (A Study on Music Summarization)

  • 김성탁;김상호;김회린;최지훈;이한규;홍진우
    • 방송공학회논문지
    • /
    • 제11권1호
    • /
    • pp.3-14
    • /
    • 2006
  • 음악요약이란 주어진 음악 컨텐츠에서 가장 중요하고 특징적인 한 부분이나 여러 부분들을 제공하는 것을 말한다. 음악요약 기술에는 크게 두 가지 종류의 음악요약을 위한 기술들이 연구되고 있다. 음악 컨텐츠 내에서 반복되는 구간을 음악요약으로 제공하는 기술과 특정이 다른 부분들의 일정구간을 모두 제공하는 기술이 있다. 본 논문에서는 두 가지 종류의 음악요약을 제공하는 알고리즘들을 제안하고 평가하였다. 반복되는 구간을 음악요약으로 제공하는 다중 레벨 벡터양자화를 이용한 알고리즘은 고정된 길이와 최적의 길이를 가지는 음악요약을 제공하는 알고리즘들을 객관적인 방법으로 성능을 평가하였고, 음악 내에서 특정이 다른 부분들을 일정부분씩 취합하여 제공하는 2-D 유사도 행렬과 k-mean 알고리즘을 이용하는 집단화 방법을 이용한 방법의 평가는 주관적인 평가인 MOS 테스트로 평가하였다. 다중 레벨 벡터양자화를 이용한 음악요약을 제공하는 알고리즘에서 고정된 길이의 음악요약을 제공하는 알고리즘은 사람이 직접 요약한 결과와 제안한 방법으로 구한 요약과의 중첩도 (Overlapping Ratio)를 이용한 결과 기존의 방법들이 42.2% 와 47.3% 임에 비해 제안된 방법은 67.1%로 높은 성능을 보여주었고, 최적의 길이를 가지는 음악요약을 제공하는 알고리즘은 음악에 따라 다른 길이를 가지는 반복되는 부분의 포함 정도를 나타내는 최적 중첩비율 (Optimal Overlapping Ratio) 을 측정한 결과 고정된 길이를 가지는 음악요약 보다 최적의 길이로 음악마다 다른 길이 의 반복되는 부분을 효과적으로 표현함을 알 수 있었다. 집단화 방법을 이용한 알고리즘은 두 가지 질문들 (제공된 세그먼트들 중 특정이 비슷한 것의 개수, 제공된 세그먼트들 중 같은 구조에 속하는 것의 개수)을 이용한 MOS 테스트에서 우수한 결과를 보여주었다. 환자에서 완전관해를 보였고, 원격전이와 국소재발이 각각 2명과 1명에서 관찰되었다. 결론: SMART를 사용한 IMRT를 도입하여 임상적으로나 선량측정상 이하선의 기능 보존이 가능하였으며, 또한 생물학적으로 더욱 효과적일 것으로 생각되었다 향후 정확한 종양억제 효과와 만기 독성을 알기 위해서는 추가적인 연구대상과 추적관찰이 필요하다고 생각한다.ty modulated radiation therapy, IMRT)를 이용한 최근의 결과와 비교하여 CK를 이용한 정위 방사선 치료는 생존율 측면에서 비슷하거나 나은 결과를 보였다. 또한 심각한 부작용은 관찰되지 않았으며 짧은 기간의 치료로 환자에게 편의를 제공할 수 있어 결과적으로 삶의 질을 향상시킬 수 있을 것이다. 따라서, 이 새로운 치료 방법은 국소 진행된, 절제 불가능한 췌장암 환자에서 심각한 부작용 없는 효과적인 치료가 될 것으로 생각된다. 또한 계획용 표적 체적은 CK 치료의 유용한 예후 인자로 사용될 것이다.인위적 활동에 의한 부분이 높은 것으로 추정되었다.가>에는 이 시교의 외면적인 따스함과 내면적인 정(情)과 성(性)의 부드러움이 적고. 그 반대로 풍간하여 지절사정(指切事情)함이 강하였던 모양이다. 풍간하여 사정(事情)을 매몰차게 지적하여 논평하였음을 퇴계는 '완세불공(玩迷不恭)'이라고 판단했을 것이다. 장육당은 청(淸)과 탁(濁)이 있음을 알지 못하고. 그것의 분별도 하지 못하는 세상 사람들을 완농(玩弄)하였다. 그러므로 그는 진환(塵 )에서 초연(超然)했던 것이다. 천석고황(泉石膏 )으로 태평성대(太平聖代)에 사시가흥(四時佳興)을 한가지로 하는 퇴계와는 그래서 다르다. 퇴계는 순풍(淳風)과 어진 인성(人性)을 긍정하였기에 만족하고. '고인(古人)의 녀던 길'을 끊임없이 행(行)하고자 하였다. 여기에서 '완세불공(玩世不恭)'과 '온유돈후(溫柔敦厚)'가 판별되어진다.

X-선회절과 Raman 분광분석을 이용한 2성분계(CaO-, $Y_2O_3$-, MgO-$ZrO_2$) 및 3성분계(MgO-$ZrO_2-Al_2O_3)$ Zirconia의 상전이연구 (Phase Transformation of 2 Components(CaO-, $Y_2O_3$-, MgO-$ZrO_2$) and 3 Components(MgO-$ZrO_2-Al_2O_3)$ Zirconia by X-ray Diffraction and Raman Spectroscopy)

  • 은희태;황진명
    • 한국세라믹학회지
    • /
    • 제34권2호
    • /
    • pp.145-156
    • /
    • 1997
  • 2성분계(CaO-, Y2O3-, MgO-ZrO2) 및 3성분계(MgO-ZrO2-Al2O3)ZrO2분말의 안정화제 종류, 첨가량 및 열처리온도 변화에 따른 ZrO2의 상전이를 X-선 회절과 Raman분광법으로 연구하였다. CaO-, 및 Y2O3-ZrO2계에서 CaO와 Y2O3의 첨가량이 각각 6~15mol% 및 3~15mol%로 증가에 따른 정방정상에서의 입방정상으로의 상전이를 X-선회절 pattern으로는 판별하기 어려웠으나, Raman spectra에서는 모든 Raman band가 저파수쪽으로 이동하고 band의 수 및 그 세기가 현저히 감소함을 관찰할 수 있었다. 이것은 정방정$\longrightarrow$입방정의 상전이가 발생한 것으로 ZrO2 격자내에서 Zr4+ 이온과 Ca2+ 혹은 Y3+이온의 치환에 의해 산소이온의 빈자리 생성으로 인한 구조적 불규칙성과 선택규칙(k=0)의 파괴에 기인한 것으로 해석된다. MgO의 경우에는 10mol%에서 단사정에서 입방정으로 상전이가 발생하였다. MgO-ZrO2-Al2O3계에서는 Al2O3의 첨가에 의해 입방정$\longrightarrow$단사정의 상전이가 발생하는데 이것은 MgO와 Al2O3의 반응에 의해 spinel(MgAl2O4)의 형성으로 인하여 MgO가 충분히 안정화제로서의 역할을 하지 못하기 때문으로 판단된다. 또한, 안정화제의 종류와 첨가량 변화에 따른 ZrO2의 상전이를 ZrO2의 격자상수값의 변화와 관련하여 설명할 수 있는데, 즉, 안정화제의 첨가량이 증가할수록 격자상수 a값은 증가하고 c값은 감소하여 10~13mol%사이에서는 c/a의 축비가 1에 근접하고, 따라서 정방정$\longrightarrow$입방정의 상전이가 진행됨을 알 수 있었다.

  • PDF

종자내 아미노산 합성 조절 유전자에 관한 연구 (Amino Acid Biosynthesis and Gene Regulation in Seed)

  • 임용표;서미정;조수진;이정희;이효연
    • 한국식물학회:학술대회논문집
    • /
    • 한국식물학회 1996년도 제10회 식물생명공학심포지움 고등식물 발생생물학의 최근 진보
    • /
    • pp.61-74
    • /
    • 1996
  • Human and monogastric animals can not synthesize 10 out of the 20 amino asids and therefor need to obtain these from their diet. The plant seed is a major source of dietary protein. It is particular important in their study to increase nutritional quality of the seed storage proteins. The low contents of lysine, asparagine and threonenein various cereal seeds and of cystein and methionine. In legume seeds is due to the low proportions of these amino acids in the major storage proteins, we have tried to apply the three strategies; (1) mutagenesis and selection of specific amino acid analogue resistance, (2) cloning and expression study of lysine biosynthesis related gene, (3) transfomation of lysine rich soybean glycinin gene. The 5-methyltryptophan (5MT) resistant cell lines, SAR1, SAR2 and SAR3 were selected from anther derived callus of rice (Oryza sativa L. "Sasanishiki"). Among these selected cell lines, two (SAR1 and SAR3) were able to grow stably at 200 mg/L of 5MT. Analysis of the freed amino acids in callus shows that 5MT resistant cells (SAR3) accumulated free tryptophan at least up to 50 times higher than those that of the higher than of SAS. These results indicated that the 5MT resistant cell lines are useful in studies of amino acid biosynthesis. Tr75, a rice (Oryza sativa L., var. Sasanishiki) mutant resistant to 5MT was segregated from the progenies of its initial mutant line, TR1. The 5MT resistant of TR75 was inherited in the M8 generations as a single dominant nuclear gene. The content of free amino acids in the TR75 homozygous seeds increased approximately 1.5 to 2.0 fold compared to wild-type seeds. Especially, the contents of tryptophan, phenylalanine and aspartic acid were 5.0, 5.3 and 2.7 times higher than those of wild-type seeds, respectively. The content of lysine is significantly low in rice. The lysine is synthesized by a complex pathway that is predominantly regulated by feedback inhibition of several enzymes including asparginase, aspatate kinase, dihydrodipicolinat synthase, etc. For understanding the regulation mechanism of lysine synthesis in rice, we try to clone the lysine biosynthetic metabolism related gene, DHPS and asparaginase, from rice. We have isolated a rice DHPS genomic clone which contains an ORF of 1044 nucleotides (347 amino acids, Mr. 38, 381 daltons), an intron of 587 nucleotides and 5'and 3'-flanking regions by screening of rice genomic DNA library. Deduced amino acid sequence of mature peptide domain of GDHPS clone is highly conserved in monocot and dicot plants whereas that of transit peptide domain is extremely different depending on plant specie. Southern blot analysis indicated that GDHPS is located two copy gene in rice genome. The transcripts of a rice GDHPS were expressed in leaves and roots but not detected in callus tissues. The transcription level of GDHPS is much higher in leaves indicating enormous chloroplast development than roots. Genomic DNA clones for asparaginase genes were screened from the rice genomic library by using plaque hybridization technique. Twelve different genomic clones were isolated from first and second screening, and 8 of 12 clones were analyzed by restriction patterns and identified by Southern Blotting, Restriction enzyme digestion patterns and Southern blot analysis of 8 clones show the different pattern for asparaginase gene. Genomic Southern blot analysis from rice were done. It is estimated that rice has at least 2-3 copy of asparaginase gene. One of 8 positive clones was subcloned into the pBluescript SK(+) vector, and was constructed the physical map. For transformation of lysine rich storage protein into tobacco, soybean glycinin genes are transformed into tobacco. To examine whether glycinin could be stably accumulated in endosperm tissue, the glycinin cDNA was transcriptionally fused to an endosperm-specific promotor of the rice storage protein glutelin gene and then introduced into tobacco genomic via Agrobacterium-mediated transformation. Consequently the glycinin gene was expressed in a seed-and developmentally-specific manner in transgenic tobacco seeds. Glycinin were targeted to vacuole-derived protein bodies in the endosperm tissue and highly accumulated in the matrix region of many transgenic plant (1-4% of total seed proteins). Synthesized glycinin was processed into mature form, and assembled into a hexamer in a similar manner as the glycinin in soybean seed. Modified glycinin, in which 4 contiguous methionine residues were inserted at the variable regions corresponding to the C - teminal regions of the acidic and basic polypeptides, were also found to be accumulated similarly as in the normal glycinin. There was no apparent difference in the expression level, processing and targeting to protein bodies, or accumulation level between normal and modified glycinin. glycinin.

  • PDF

음악과 플레이리스트의 메타데이터를 활용한 하이브리드 음악 추천 시스템에 관한 연구 (Research on hybrid music recommendation system using metadata of music tracks and playlists)

  • 이현태;임규건
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.145-165
    • /
    • 2023
  • 추천 시스템은 인터넷의 발달로 급격하게 증가하는 정보의 양으로 인해 생긴 정보 선택의 어려움을 소비자에게 덜어주고 각 개인의 취향에 맞는 정보를 효율적으로 보여주는 중요한 역할을 한다. 특히, E-commerce와 OTT 기업은 상품과 콘텐츠 양이 급격하게 증가하면서 추천 시스템의 도움 없이는 인기 있는 상품만 소비되는 현상을 극복하지 못한다. 이러한 현상을 극복하고 고객 개인 취향에 맞는 정보 혹은 콘텐츠를 제공해 고객의 소비를 유도하기 위해 추천 시스템의 연구가 활발히 진행되고 있다. 일반적으로 유저(user)의 과거 행동 이력을 활용한 협업 필터링이 유저가 선호한 콘텐츠의 정보를 활용하는 콘텐츠 기반 필터링에 비해 높은 성능을 보여준다. 하지만 협업 필터링은 과거 행동 데이터가 부족한 유저에 대해서는 추천의 성능이 낮아지는 콜드 스타트(Cold Start) 문제를 겪게 된다. 본 논문에서는 카카오 아레나 경진대회에서 주어진 음악 스트리밍 서비스 멜론의 플레이리스트 데이터를 기반으로 앞에서 언급한 콜드 스타트 문제를 해결할 수 있는 하이브리드 음악 추천 시스템을 제시했다. 본 연구에서는 플레이리스트에 수록된 곡 목록과 각 음악과 플레이리스트의 메타데이터를 활용해 절반 혹은 전부 가려진 플레이리스트의 다른 수록 곡을 예측하는 것을 목표로 하였다. 이를 위해 플레이리스트 안에 곡이 있는 경우와 아예 곡이 없는 경우를 나눠서 추천을 진행하였다. 플레이리스트 안에 곡이 있는 경우에는 해당 플레이리스트의 곡 목록과 각 곡의 메타데이터를 활용하기 위해 LightFM을 활용하였다. 그 다음에 Item2Vec을 활용해 플레이리스트에 있는 수록 곡과 태그 및 제목의 임베딩 벡터를 생성하고 이를 추천에 활용하였다. 최종적으로 LightFM과 Item2Vec 모델의 앙상블을 통해 최종 추천 결과를 생성하였다. 플레이리스트 안에 곡이 없고 태그 혹은 제목만이 존재할 경우에는 플레이리스트의 메타데이터인 태그와 제목을 FastText를 활용해 사전 학습을 시켜 생성된 플레이리스트 벡터를 기반으로 플레이리스트 간의 유사도를 활용하여 추천을 진행하였다. 이렇게 추천한 결과, 기존 Matrix Factorization(MF)에서 해결하지 못한 콜드 스타트 문제를 해결할 수 있었을 뿐만 아니라 곡과 플레이리스트의 메타데이터를 활용해 기존 MF 모델인 ALS와 BPR 그리고 Word2Vec 기반으로 추천해 주는 Item2Vec 기술보다 높은 추천 성능을 낼 수 있었다. 또한, LightFM을 토대로 다양한 곡의 메타데이터를 실험한 결과, 여러 메타데이터 중에서 아티스트 정보를 단독으로 활용한 LightFM 모델이 다른 메타데이터를 활용한 LightFM 모델들과 비교해 가장 높은 성능을 보여준다는 것을 확인할 수 있었다.

빅데이터와 딥러닝을 활용한 동물 감염병 확산 차단 (Animal Infectious Diseases Prevention through Big Data and Deep Learning)

  • 김성현;최준기;김재석;장아름;이재호;차경진;이상원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.137-154
    • /
    • 2018
  • 조류인플루엔자와 구제역 같은 동물감염병은 거의 매년 발생하며 국가에 막대한 경제적 사회적 손실을 일으키고 있다. 이를 예방하기 위해서 그간 방역당국은 다양한 인적, 물적 노력을 기울였지만 감염병은 지속적으로 발생해 왔다. 최근 빅데이터와 딥러닝 기술을 활용하여 감염병의 예측모델을 개발하고자 하는 시도가 시작되고 있지만, 실제로 활용가능한 모델구축 연구와 사례보고는 활발히 진행되고 있지 않은 실정이다. KT와 과학기술정보통신부는 2014년부터 국가 R&D사업의 일환으로 축산관련 차량의 이동경로를 분석하여 예측하는 빅데이터 사업을 수행하고 있다. 동물감염병 예방을 위하여 연구진은 최초에는 차량이동 데이터를 활용한 회귀분석모델을 기반으로 한 예측모델을 개발하였다. 이후에는 기계학습을 활용하여 좀 더 정확한 예측 모델을 구성하였다. 특히, 2017년 예측모델에서는 시설물에 대한 확산 위험도를 추가하였고 모델링의 하이퍼 파라미터를 다양하게 고려하여 모델의 성능을 높였다. 정오분류표와 ROC 커브를 확인한 결과, 기계 학습 모델보다 2017년 구성된 모형이 우수함을 확인 할 수 있었다. 또한 2017에는 결과에 대한 설명을 추가하여 방역당국의 의사결정을 돕고 이해관계자를 설득할 수 있는 근거를 확보하였다. 본 연구는 빅데이터를 활용하여 동물감염병예방시스템을 구축한 사례연구로 모델주요변수값, 이에따른 실제예측성능결과, 그리고 상세하게 기술된 시스템구축 프로세스는 향후 감염병예방 영역의 지속적인 빅데이터활용 및 분석 모델 개발에 기여할 수 있을 것이다. 또한 본 연구에서 구축한 시스템을 통해 보다 사전적이고 효과적인 방역을 할 수 있을 것으로 기대한다.

사용자 행동 기반의 사회적 관계를 결합한 사용자 협업적 여과 방법 (Incorporating Social Relationship discovered from User's Behavior into Collaborative Filtering)

  • 타이쎄타;하인애;조근식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.1-20
    • /
    • 2013
  • 소셜 네트워크는 사용자들의 공통된 관심사, 경험, 그리고 일상 생활들을 함께 공유하기 위해 소셜 네트워크 상 사람들을 서로 연결시켜주는 거대한 커뮤니케이션 플랫폼이다. 소셜 네트워크상의 사용자들은 포스팅, 댓글, 인스턴스 메시지, 게임, 소셜 이벤트 외에도 다양한 애플리케이션을 통해 다른 사용자들과 소통하고 개인 정보 관리하는데 많은 시간을 소비한다. 소셜 네트워크 상의 풍부한 사용자 정보는 추천시스템이 추천 성능을 향상시키기 위해 필요한 큰 잠재력이 되었다. 대부분의 사용자들은 어떤 상품을 구매하기 전 가까운 관계이거나 같은 성향을 가진 사람들의 의견을 반영하여 의사 결정을 하게 된다. 그러므로 소셜 네트워크에서의 사용자 관계는 추천시스템을 위한 사용자 선호도 예측을 효율적으로 높이는데 중요한 요소라 할 수 있다. 일부 연구자들은 소셜 네트워크에서의 사용자와 다른 사용자들 사이의 상호작용 즉, 소셜 관계(social relationship)와 같은 소셜 데이터가 추천시스템에서 추천의 질에 어떠한 영향을 미치는가를 연구하고 있다. 추천시스템은 아마존, 이베이, Last.fm과 같은 큰 규모의 전자상거래 사이트 또한 채택하여 사용되는 시스템으로, 추천시스템을 위한 방법으로는 협업적 여과 방법과 내용 기반 여과 방법이 있다. 협업적 여과 방법은 사용자들의 선호도 학습에 의해 사용자가 아직 평가하지 않은 아이템 중 선호할 수 있는 아이템을 정확하게 제안하기 위한 추천시스템 방법 중 하나이다. 협업적 여과는 사용자들의 데이터에 초점을 맞춘 방법으로 유사한 배경과 선호도를 가지는 사용자들로부터 정보를 수집하여 사용자들의 선호도 예측을 자동으로 발생시킨다. 특히 협업적 여과는 근접한 이웃 사용자들에 의해서 목적 사용자가 선호할 수 있는 아이템을 제시하는 것으로 유사한 이웃 사용자를 찾는 것이 중요하다. 좋은 이웃 사용자 발견은 사용자와 아이템을 고려하는 방법이 일반적이다. 각 사용자는 아이템 즉, 영화, 상품, 책 등에 자신의 선호도를 나타내기 위하여 평가 값을 입력하고, 시스템은 이를 바탕으로 사용자-평가 행렬을 구축한다. 이 사용자-평가 행렬은 목적 사용자와 유사하게 아이템을 평가한 사용자 그룹을 찾기 위한 것으로, 목적 사용자가 아직 평가하지 않은 아이템에 대하여 사용자-평가 매트릭스를 통해 그 평가 값을 예측한다. 현재 이 협업적 여과 방법은 전자상거래와 정보 검색에서 적용되어 개인화 시스템에 효율적으로 사용되고 있다. 하지만 초기 사용자 문제, 데이터 희박성 문제와 확장성 그리고 예측 정확도 향상 등 해결해야 할 과제가 여전히 남아 있다. 이러한 문제들을 해소하기 위해 많은 연구자들은 하이브리드, 신뢰기반, 소셜 네트워크 기반 협업적 여과와 같은 다양한 방법을 제안하였다. 본 논문에서는 전통적인 협업적 여과 방식의 예측 정확도와 추천 성능을 향상시키기 위해 소셜 네트워크에 존재하는 소셜 관계를 이용한 협업적 여과 시스템을 제안한다. 소셜 관계는 소셜 네트워크 서비스 중 하나인 페이스북 사용자들이 남긴 포스팅과 사용자의 소셜 네트워크 친구와 의견 교류 중 남긴 코멘트와 같은 사용자 행동을 기반으로 정의된다. 소셜 관계를 구축하기 위해 소셜 네트워크 사용자의 포스팅과 댓글을 추출하고, 추출된 텍스트에 불용어 및 특수 기호 제거와 스테밍 등 전처리를 수행하였다. 특징 벡터는 TF-IDF를 이용하여 전처리된 텍스트에 나타난 각 단어에 대한 특징 점수를 계산함으로써 구축된다. 본 논문에서 이웃 사용자를 결정하기 위해 사용되는 사용자 간 유사도는 특징 벡터를 이용한 사용자 행동 유사도와 사용자의 영화 평가를 기반으로 한 전통적 방법의 유사도를 결합하여 계산된다. 제안하는 시스템은 목표 사용자와 제안한 방법을 통해 결정된 이웃 사용자 집단을 기반으로 목표 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고 Top-N 아이템을 선별하여 사용자에게 아이템을 추천하게 된다. 본 논문에서 제안하는 방법을 확인하고 평가하기 위하여 IMDB에서 제공하는 영화 정보 기반으로 영화 평가 시스템을 구축하였다. 예측 정확도를 평가하기 위해 MAE 값을 이용하여 제안하는 알고리즘이 얼마나 정확한 추천을 수행하는지에 대한 예측 정확도를 측정하였다. 그리고 정확도, 재현율 및 F1값 등을 활용하여 시스템의 성능을 평가하였으며, 시스템의 추천 품질은 커버리지를 이용하여 평가되었다. 실험 결과로부터 본 논문에서 제안한 시스템이 보다 더 정확하고 좋은 성능으로 사용자에게 아이템을 추천하는 것을 볼 수 있었다. 특히 소셜 네트워크에서 사용자 행동을 기반으로 한 소셜 관계를 이용함으로써 추천 정확도를 6% 향상시킴을 보였다. 또한 벤치마크 알고리즘과의 성능비교 실험을 통해 7% 향상된 추천 성능의 결과를 보여준다. 그러므로 사용자의 행동으로부터 관찰된 소셜 관계를 CF방법과 결합한 제안한 방법이 정확한 추천시스템을 위해 유용하며, 추천시스템의 성능과 품질을 향상시킬 수 있음을 알 수 있다.