• 제목/요약/키워드: JAVA language

검색결과 423건 처리시간 0.018초

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

텍스트 마이닝 기법을 활용한 인공지능 기술개발 동향 분석 연구: 깃허브 상의 오픈 소스 소프트웨어 프로젝트를 대상으로 (A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github)

  • 정지선;김동성;이홍주;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2019
  • 제4차 산업혁명을 이끄는 주요 원동력 중 하나인 인공지능 기술은 이미지와 음성 인식 등 여러 분야에서 사람과 유사하거나 더 뛰어난 능력을 보이며, 사회 전반에 미치게 될 다양한 영향력으로 인하여 높은 주목을 받고 있다. 특히, 인공지능 기술은 의료, 금융, 제조, 서비스, 교육 등 광범위한 분야에서 활용이 가능하기 때문에, 현재의 기술 동향을 파악하고 발전 방향을 분석하기 위한 노력들 또한 활발히 이루어지고 있다. 한편, 이러한 인공지능 기술의 급속한 발전 배경에는 학습, 추론, 인식 등의 복잡한 인공지능 알고리즘을 개발할 수 있는 주요 플랫폼들이 오픈 소스로 공개되면서, 이를 활용한 기술과 서비스들의 개발이 비약적으로 증가하고 있는 것이 주요 요인 중 하나로 확인된다. 또한, 주요 글로벌 기업들이 개발한 자연어 인식, 음성 인식, 이미지 인식 기능 등의 인공지능 소프트웨어들이 오픈 소스 소프트웨어(OSS: Open Sources Software)로 무료로 공개되면서 기술확산에 크게 기여하고 있다. 이에 따라, 본 연구에서는 온라인상에서 다수의 협업을 통하여 개발이 이루어지고 있는 인공지능과 관련된 주요 오픈 소스 소프트웨어 프로젝트들을 분석하여, 인공지능 기술 개발 현황에 대한 보다 실질적인 동향을 파악하고자 한다. 이를 위하여 깃허브(Github) 상에서 2000년부터 2018년 7월까지 생성된 인공지능과 관련된 주요 프로젝트들의 목록을 검색 및 수집하였으며, 수집 된 프로젝트들의 특징과 기술 분야를 의미하는 토픽 정보들을 대상으로 텍스트 마이닝 기법을 적용하여 주요 기술들의 개발 동향을 연도별로 상세하게 확인하였다. 분석 결과, 인공지능과 관련된 오픈 소스 소프트웨어들은 2016년을 기준으로 급격하게 증가하는 추세이며, 토픽들의 관계 분석을 통하여 주요 기술 동향이 '알고리즘', '프로그래밍 언어', '응용분야', '개발 도구'의 범주로 구분하는 것이 가능함을 확인하였다. 이러한 분석 결과를 바탕으로, 향후 다양한 분야에서의 활용을 위해 개발되고 있는 인공지능 관련 기술들을 보다 상세하게 구분하여 확인하는 것이 가능할 것이며, 효과적인 발전 방향 모색과 변화 추이 분석에 활용이 가능할 것이다.

확률 뇌 지도를 이용한 뇌 영역의 위치 정보 추출 (Probabilistic Anatomical Labeling of Brain Structures Using Statistical Probabilistic Anatomical Maps)

  • 김진수;이동수;이병일;이재성;신희원;정준기;이명철
    • 대한핵의학회지
    • /
    • 제36권6호
    • /
    • pp.317-324
    • /
    • 2002
  • 목적: SPM 기법을 이용하여 뇌 영상을 분석할 때 Talairach 뇌 지도를 찾아 해부학적 정보를 추측함으로 생기는 문제점들을 해결하기 위하여 통계적 확률 뇌지도(SPAM)을 이용하여 뇌 영역에 대한 해부학적 위치와 확률을 추출하는 프로그램을 개발하였다. 대상 및 방법: 몬트리얼 신경과학연구소에서 개발한 MNI152 표준지도에 기반한 SPAM을 이용하였다. SPM 분석 결과로 주어진 x, y, z 좌표 값을 입력하면 SPAM의 해당 좌표에서 0이 아닌 확률 값을 갖는 영역의 이름 및 확률을 추출하여 출력하게 하였으며 가장 높은 확률을 갖는 영역의 SPAM을 표준지도 위에 표시하도록 하였다. IDL 및 자바를 기반으로 프로그램을 개발하였으며 향후 인터넷 기반 프로그램으로 확장이 용이하게 하였다. 이 프로그램의 유용성을 보이고자 기존의 SPM 결과보고 형식과 이 프로그램의 결과 형식을 비교하였다. 또한 이 프로그램에 대한 예비적인 검증을 위하여 활성화되는 영역이 국소화되고 또한 그 영역이 잘 알려져 있는 기억 활성화 PET 실험 분석에 이 프로그램을 이용하여 보았다. 결과: 기존의 SPM 분석한 결과는 MNI 좌표계에서의 좌표 값만을 보여주나 이 프로그램을 이용하여 그 좌표에 대한 확률적 해부학적 정보를 얻을 수 있었다. 기억 실험 결과 유의한 활성화를 보인 영역에 대해서 이 프로그램을 적용한 결과 좌측해마구성체일 확률이 80% 이상임을 알 수 있었으며 이는 이 영역이 기억기능을 담당한다는 기존의 널리 알려진 사실과 잘 부합되었다. 결론: 이 연구에서 개발한 프로그램을 이용하여 MNI 좌표에 대한 해부학적 위치와 확률을 빠르고 정확하게 찾을 수 있어서 뇌영상 분석에 유용할 것이다.