• 제목/요약/키워드: 소셜 데이터 분석

검색결과 737건 처리시간 0.036초

트위터에서 팔로워의 행태분석 모델 (Modeling Twitter Follower's Behavior Analysis)

  • 정광용;설재욱;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.604-607
    • /
    • 2012
  • 소셜 네트워크 서비스의 하나인 트위터는 팔로우를 통하여 사용자 간의 관계를 맺을 수 있다. 트위터 사용자들은 다양한 팔로워들이 존재한다. 이 팔로워들은 사용자에 대한 호감을 가지고 팔로우 하거나, 맹목적으로 추종하거나, 부정적인 의견을 지니고 사용자의 행동과 글을 관찰하기 위해 팔로우할 수도 있다. 본 논문에서 사용자에게 팔로워들이 어떠한 목적으로 그 사용자를 팔로워의 행태를 분석하는 모델을 제안한다. 대상사용자의 영향력 있는 팔로워를 추출하고, 팔로워의 리트윗 정보, 프로파일, 최신 트윗의 감정분석을 통해 지지자, 중립, 비지지자로 분류한다. 제안 방법의 유효성을 검증하기 위해 트윗 데이터에서 정치인과 언론인 5 명의 팔로워들 중 무작위로 3 만명을 추출하여 실험하였다. 실험 결과 영향력 있는 사용자 추출을 통한 지지 팔로워 추출이 효과적임을 알 수 있다.

프리겔 기반의 효율적인 그래프 순환 검출 기법 (An Efficient Graph Cycle Detection Technique based on Pregel)

  • 김태연;김현욱;박기성;이영구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.152-154
    • /
    • 2013
  • 페타 바이트 이상의 규모의 빅 데이터 분석은 다양한 분야에서 연구되고 있다. 최근 소셜 네트워크, XML 등과 같은 구조적인 정보를 갖는 대용량의 그래프들을 분석하는 기술이 활발히 연구되고 있다. 이러한 대용량의 그래프를 분석하기 위한 연산중의 하나로 순환 그래프가 사용되고 있다. 대용량의 그래프 환경에서 순환을 검출하는 연산은 단일 컴퓨팅 시스템에서 처리가 불가능하거나 많은 시간 비용이 발생하여 분산처리가 필요하다. 본 논문에서는 그래프 처리에 효율적인 프리겔 프레임워크를 이용하여 효율적으로 순환을 검출하고, 중복 순환을 제거하기 위해 정규 순환 코드를 제안한다. 실험을 통하여 제안하는 기법이 대용량 그래프에서 효율적으로 순환을 찾을 수 있음을 보인다.

빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 (A Study on Structural Holes of Privacy Protection for Life Logging Service as analyzing/processing of Big-Data)

  • 강장묵;송유진
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.189-193
    • /
    • 2014
  • 네트워크 서비스는 로컬서비스와 결합하면서 생활밀착형 서비스로 발전하고 있다. 생활밀착형 서비스는 기존의 모바일 서비스와는 달리, 위치정보와 로컬정보 그리고 소셜 네트워크서비스 정보 등을 모아 개인화된 서비스를 제공할 것으로 예상된다. 여러 정보를 모아 처리하는 과정에서 빅데이터 기술, 클라우드 기술 등이 필요하다. 이미 이에 대한 효율성 높은 알고리즘이 연구되고 있으나 반면, 생활 밀착형 서비스 모델 또는 빅데이터 환경에서의 프라이버시 보호 모델에 대한 연구는 상대적으로 미흡한 편이다. 이 글은 생활밀착형 서비스에 활용될 빅데이터 기술이 야기하는 프라이버시 문제에 대하여 구조혈 중심으로 다룬다.

T-Commerce를 위한 위치인식 및 텍스트마이닝 기반 사용자 구매 패턴 연구 (A Study on User's Purchasing Pattern based on Text mining and Location awareness for T-Commerce)

  • 송혜진;김진아;이선민;문남미
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.134-136
    • /
    • 2016
  • 최근 TV시청은 다양한 매체를 통해서 이루어지고 있으며, 특히 스마트폰을 통한 시청률이 늘고 있는 상황이다. 광고시장에서도 TV시청 중에 스마트기기를 함께 이용하는 멀티태스킹 사용자가 급증하고 있으며 특히 10~30대의 사용이 적극적이다. TV시청 중 스마트 기기의 사용분야는 메신저, 정보검색, SNS 순이며 스마트 기기사용 내용 중 69%는 시청하던 TV 시청과 관련된 것이었다. 이 중에 75%는 TV에 등장한 제품, 브랜드, 장소에 관한 것이다[1]. TV를 시청하는 상황에 스마트기기의 소셜 활동의 문자를 분석하는 것은 사용자 의도를 파악할 수 있는 의미가 있으며, 시청자의 현재 위치를 파악함으로써 시청자의 의도에 반영되는 상황을 파악할 수 있다. T-Commerce 구매 의도는 사용자의 현재 상황에 대한 순간 의도를 파악하는것이 중요하며, 이와 같은 구매의도를 파악하기 위해서 본 연구에서는 GPS와, Wi-Fi 기반 Fingerprinting 측위기법을 사용하여 특별한 도구나 장비의 설치 없이 현재위치와 멀티태스킹 데이터를 분석하여 구매의도를 파악한다. T-Commerce 소비환경 패턴이 바뀜에 따라, 다양한 소비 환경 데이터 분석은 효율적인 광고 제공과 만족도를 높일 것으로 기대된다.

  • PDF

빅데이터와 AI를 활용한 교육용 자료의 분석에 대한 조사 (A Survey on Deep Learning-based Analysis for Education Data)

  • 노영욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.240-243
    • /
    • 2021
  • 최근에 빅 데이터와 AI 기술을 교육의 평가와 개별 학습에 적용하는 연구 성과가 있었다. 정보 기술의 혁신으로 소셜 미디어, MOOC, 지능형 개인지도 시스템, LMS, 센서 및 모바일 장치 등으로부터 학생들의 개인 기록, 생리학적 데이터, 학습 로그 및 활동, 학습 성과 및 결과를 포함하는 동적이고 복잡한 데이터를 수집 가능하였다. 또한 COVID-19 환경에서 e-러닝이 활성화 되어 많은 양의 학습 데이터가 생성되었다. 이 데이터로부터 학습 분석과 AI 기술을 적용하여 의미있는 패턴의 추출과 지식의 발견이 될 것으로 예상된다. 학습자 측면에서 학생의 학습 및 정서적 행동 패턴과 프로필을 식별하고, 평가 및 평가 방법을 개선하고, 개별 학생의 학습 성과 또는 중퇴를 예측하고, 개인화 된 지원을 위한 적응 시스템에 대한 연구는 필요하다. 본 연구에서는 교육용 데이터를 대상으로 이상탐지와 추천시스템에서 사용하는 기계학습 기술에 대한 조사와 분류를 하여 교육 분야의 연구에 기여하고자 한다.

  • PDF

일상생활 맥락 정보요구 기반의 이미지 접근점 확장에 관한 연구 (An Approach Toward Image Access Points based on Image Needs in Context of Everyday Life)

  • 정은경;정선영
    • 정보관리학회지
    • /
    • 제29권4호
    • /
    • pp.273-294
    • /
    • 2012
  • 세대적 특성과 정보기술의 발달은 이미지의 생산과 이용을 가속화한다. 본 연구는 이미지 이용자의 일상생활 맥락에서 정보요구를 분석하여 이미지 접근점 확장에 관한 논의를 목적으로 하였다. 이를 위하여 소셜 Q&A 서비스인 네이버 지식인에서 이미지를 검색하고자 하는 질문 105건을 추출하였다. 이미지 질문은 이용 목적과 이미지 속성으로 구분한 프레임워크를 이용하여 분석하였다. 분석결과로서 이용 목적은 총 8가지로, 이미지를 데이터로서 이용하고자 하는 목적이 두드러졌으며, 이중에서 '보고그리기'는 기존 연구결과에서 찾아볼 수 없었던 이용 목적으로 새롭게 도출되었다. 이미지 속성에서는 의미, 비시각적, 구성 측면에서 의미와 비시각적 속성이 우세하게 나타났다. 전통적으로 이미지 검색과 접근에서 의미 측면의 속성은 중요하게 인식되어 왔으나, 본 연구의 분석결과에서 보여주는 바와 같이 비시각적 측면 특히, 맥락 요소의 비중은 접근점 제공에 있어서 중요한 시사점으로 볼 수 있다.

특허 출원인 간 상호협력이 기술혁신에 미치는 영향 (The effect of mutual cooperation between the Patent applicants on the Technological Innovation in ICT)

  • 주성환
    • 디지털융복합연구
    • /
    • 제14권10호
    • /
    • pp.83-93
    • /
    • 2016
  • 본 논문은 우리나라 정보통신 분야의 특허출원인 간 네트워크 특성이 기술혁신에 미치는 영향을 알아보기 위해 연구하였다. 이를 위해 특허 데이터를 토대로 정부 공공기관, 대학교, 대기업, 중소기업 등 각 혁신 주체의 네트워크 특성 요인과 특허피인용 횟수 간 관계를 소셜네트워크분석법(Social Network Analysis)과 부정적 이항분포 모델(Negative Binomial Regression)을 사용하여 분석하였다. 분석 결과, 우리나라 정보통신분야 혁신 네트워크는 밀도 0.009의 좁은세상 네트워크 유형을 보이고 있다. 또한, 연결중심성, 근접중심성은 특허피인용수로 대표되는 혁신 성과에 긍정적인 영향을 미치는 것으로 나타났는데에 반해, 구조적공백 지수 중 효율성은 유의미한 영향을 미치지 못했고, 제약성은 유의미한 부정적인 영향을 미치는 것으로 나타났다. 이것은 본 네트워크의 혁신 주체 간 연결이 매우 가까워 정보 지식의 확산이 빠르다는 것이고, 이에 반해 정보 지식의 원천이 한정되어 있어 다양하고 창의적인 혁신에는 한계가 있다는 것을 의미한다. 이에 이 결과를 토대로 각 혁신 주체의 효율성 및 다양성을 개선하기 위한 정책을 수립해야 한다.

의료 산업에 있어 현대인의 비대면 의학 상담에 대한 관심도 분석 기법 (Analysis of interest in non-face-to-face medical counseling of modern people in the medical industry)

  • 강유성;박종훈;오하영;이세욱
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1571-1576
    • /
    • 2022
  • 코로나 바이러스의 발병 이후, 의료 산업은 침체기에 들어섰으며, 이에 대한 대응책으로 정부는 일시적으로 비대면 진료를 허용한 상태이다. 본 연구에서는, 이런 시대 흐름에 맞추어 의료 산업에 있어 현대인의 비대면 의학상담에 대한 관심도를 분석하고자 한다. 전문가에게 의학상담을 받을 수 있는 플랫폼인 지식인과, 유튜브 두가지 소셜 플랫폼에서 빅데이터를 수집해 연구를 진행했다. 전화 상담 상위 5개 키워드인 "내과", "일반의", "산경과", "정신건강의학과", "소아청소년과"와 더불어, "전문의", "의학상담", "건강정보" 총 8개의 검색어를 가지고 각 플랫폼으로부터 데이터 세트를 구축했다. 이후 크롤링 된 데이터를 바탕으로 형태소 분류, 질병 추출, 정규화 등 전처리 과정을 거쳤다. 단어 빈도수를 기준으로 한 워드 클라우드, 꺾은선 그래프, 분기별 그래프, 질병 등장 빈도별 막대 그래프 등으로 데이터 시각화를 하였다. 유튜브 데이터에 한해 감성 분류 모델을 구축하였고, GRU와 BERT 기반 모델의 성능을 비교하였다.

Automatic Classification of Department Types and Analysis of Co-Authorship Network: Focusing on Korean Journals in the Computer Field

  • Byungkyu Kim;Beom-Jong You;Min-Woo Park
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.53-63
    • /
    • 2023
  • 과학기술 문헌을 활용한 계량정보분석에서 학과정보의 활용은 매우 유용하다. 본 논문에서는 국내 과학기술 분야 학술지 논문에 출현하는 대학기관 소속 저자의 학과정보 선별, 데이터 정제와 학과유형 분류 처리 과정을 통해 학과정보 데이터셋을 구축하고 학습데이터와 검증데이터로 이용하여 딥러닝 기반의 자동분류 모델을 구현하였다. 또한 학과정보 데이터셋과 국내 학술지 저자소속 정보를 활용하여 컴퓨터 분야의 공저 구성 현황과 네트워크를 분석하였다. 연구결과, 자동분류 모델은 한글 학과정보 기준 98.6% 정확률을 보였으며 컴퓨터 분야 연구자들의 공저 패턴과 기관유형, 지역, 기관, 학과유형 측면별 공저 네트워크의 속성과 중심성이 자세히 파악되고 맵으로 시각화되었다.

정형 및 비정형 빅데이터를 이용한 양파 소비 예측 (Prediction of Onion Purchase Using Structured and Unstructured Big Data)

  • 나형철;오은화;유도일;조완섭;아지즈 나스리디노프;박성호;조용빈;류관희
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.30-37
    • /
    • 2018
  • 인터넷 시대를 살아가는 현대인의 식품 소비는 다양한 대충 매체 및 소셜 미디어를 통해 신속하고 방대한 정보 전달에 영향을 받는 것으로 알려져 있다. 2018년 4월 국내 언론 보도에 따르면, 양파 재배 면적이 증가하고 양파 생산량이 증가할 것으로 예상되며, 이후에 양파 가격은 폭락할 것으로 예상되었다. 이러한 상황을 고려하여 SNS, 인터넷 정보 검색, 방송 프로그램에서 언급된 양파 관련 정보를 분석하여, 실제 가격폭락이 발생하기 전에, 양파 소비를 촉진할 수 있는 요인을 파악할 필요가 있다. 2018년 양파 생산량 증가에 따른 양파 가격 폭락이 예상되는 상황에, 가장 최근 양파 생산량 증가에 따라 가격 폭락을 경험하였던 2014년의 방송 프로그램 및 SNS가 양파 소비와 연계되었는지 파악하고자, 양파 소비 촉진과 관련된 정형 및 비정형 빅데이터를 수집하여, 양파 소비 촉진과 관련된 변수를 찾아 양파 가격 하락이 예상되는 2018년에 소비 촉진에 활용하고자 본 연구를 수행하였다. 연구 결과, 방송 뉴스의 양파 언급 기사 수(3~6주), 양파와 건강을 언급하는 방송 프로그램 수(11주), 양파의 효능을 언급하는 블로그의 댓글 빈도(5주)가 양파 구매금액 증가에 시차를 두고 양의 상관관계를 갖는 것을 확인한 본 연구 결과를 근거로, 양파 생산량 증가에 따른 양파 가격 폭락 시, 양파 소비 촉진을 위한 홍보에, 뉴스, 먹방, 쿡방 등의 방송 프로그램 및 블로그 등의 매체를 활용하는 소비촉진에 기여할 것으로 여겨진다.