• 제목/요약/키워드: Web-based Retrieval

검색결과 457건 처리시간 0.023초

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

한국문헌정보학 교과과정 운영모형 및 표준교과목 개발에 관한 연구 (A Study of the Curriculum Operating Model and Standard Courses for Library & Information Science in Korea)

  • 노영희;안인자;최상기
    • 한국문헌정보학회지
    • /
    • 제46권2호
    • /
    • pp.55-82
    • /
    • 2012
  • 본 연구에서는 국내외 문헌정보학과의 교과과정 운영모형을 조사하여 국내 현실에 맞는 운영모형을 제안하고자 하며, 운영모형에 기반하여 한국문헌정보학 표준교과목도 제안하고자 한다. 이를 위해 국외 교과과정 분석결과, 국내 교과과정 분석결과, 국내 현장사서를 대상으로 한 설문조사 결과, 그리고 현장사서를 대상으로 한 관종별 직무분석결과를 종합적으로 분석하여 문헌정보학 필수교과목, 핵심교과목, 그리고 선택교과목을 선정하여 제시하였다. 최종 제안된 문헌정보학 필수과목은 6개 과목으로서, 문헌정보학개론, 정보조직학, 정보서비스론, 도서관경영론, 정보검색론, 사서실습이다. 핵심과목은 6개 과목으로서, 정보자료분류목록실습, 주제별정보원(참고정보원), 장서개발론, 디지털도서관론, 서지학개론, 기록관리학개론이다. 선택과목은 총 20개 과목으로서, 문헌정보학 영역 4개 과목(도서및도서관사, 지식정보사회와 도서관, 도서관과저작권, 문헌정보학연구방법론), 정보조직학 영역 2개 과목(메타데이터의 이해, 한국문헌자동화목록실습), 정보조사제공학 영역 3개 과목(정보활용교육론, 독서지도론, 정보이용자연구), 도서관 정보센터경영학 영역 4개 과목(도서관협력론, 관종별도서관운영론, 도서관마케팅, 비도서자료관리론), 정보학 영역 6개 과목(데이터베이스운영론, 색인초록론, 정보학개론, 정보시스템론, 도서관시스템자동화, 도서관정보네트워크), 기록관리학 영역 1개 과목(기록보존론)이다.

국내 정보학분야 연구동향 분석, 2000-2011 (Detecting Research Trends in Korean Information Science Research, 2000-2011)

  • 서은경;유소영
    • 정보관리학회지
    • /
    • 제30권4호
    • /
    • pp.215-239
    • /
    • 2013
  • 21세기에 들어서서 디지털 정보환경이 발빠르게 변화함에 따라 국내 정보학 연구 역시 많은 발전과 변화를 겪고 있는 것을 산학계 모두 인지하고 있지만 실제 2000년부터 현재까지 어느 정도로 변화되었는지를 분석한 논문은 많지 않다. 이에 따라 본 연구는 2000년에서부터 2011기간동안 연구재단에 등재된 문헌정보학 관련 학회지에 수록된 정보학분야 논문 1,007편의 논문을 대상으로 정보학분야의 연구동향을 분석하였다. 먼저 시간에 따른 연구주제의 변화를 살펴보기 위하여 논문 데이터를 주제 범주화 한 후, 각 주제 범주 내에서의 논문 및 주요 키워드의 성장률을 시계열적으로 분석하였다. 그리고 단어 동시출현 네트워크를 2000-2011년뿐 아니라 2000-2005년과 2006-2011년의 두 시기로 나누어 시각화하고 분석함으로써, 한국의 정보학 분야의 연구경향의 변화를 살펴보았다. 분석 결과, 지난 12년간의 한국의 정보학 연구는 정보시스템중심적 연구에서 이를 도서관에 적용하는 도서관응용적 연구로 나아가고 있는 것을 확인하였다. 특히 지식관리, 웹기반 시스템 평가, 정보검색 분야에서 두드러지게 변화가 나타났다. 다른 연구의 결과와 비교해 볼 때, 이 연구는 정보학 연구분야의 한국 로컬화의 변화를 찾아냈다는 점에서 의의가 있다고 할 수 있다.

청소년 소아암 생존자의 슬픔: 상황분석 (Grieving among Adolescent Survivors of Childhood Cancer: A Situational Analysis)

  • 진주혜
    • Child Health Nursing Research
    • /
    • 제20권1호
    • /
    • pp.49-57
    • /
    • 2014
  • 목적 본 연구는 함께 치료를 받았던 암 환우의 죽음이라는 간헐적이나 지속적으로 발생하는 사건에 노출된 청소년 소아암 생존자의 슬픔을 탐색하기 위해 시도되었다. 방법 자료는 만 13-18세의 소아암 청소년 생존자 12명과 반구조화된 면접(일대일면접, 전화면접, 인터넷 채팅), 자조 집단의 참여관찰, 그리고 인터넷 개인 홈페이지나 블로그에 올려 있는 참여자들의 글을 수집하였다. 근거이론방법론 분석의 일환인 Clarke (2005)의 상황분석을 이용하여 자료를 분석하였다. 결과 상황분석에 의거하여 세 가지 수준의 지도를 도식화하였다. 암 환우를 잃은 슬픔에 빠진 청소년 소아암 생존자와 관련된 모든 상황적 구성요소들이 첫 번째 상황적 지도의 두 가지 버전에 의해 마련되었고, 두 번째로 슬픔에 처한 청소년 소아암 생존자를 중심으로 주변 인물들의 관계 및 슬픔이 일어나는 주요 장소에 대한 사회적 세계 지도가 그려졌다. 마지막으로 타인과의 관계 수준에 따른 슬픔의 표출 정도를 위치 지도에 도식화하였다. 청소년 소아암 생존자의 슬픔은 어두운 잔존 기억에 대처하기 위해 내면의 자아와 의사소통하는 동시에 친구 및 가족과의 상호작용 속에서 끊임없이 자신의 생각, 감정, 행동을 협상하였다. 슬픔은 특히 어머니에게 표출하지 않고자 노력하였으며, 슬픔으로 초래되는 정신적 힘듦을 피하기 위해 아무렇지 않은 듯 혼자 시간 보내거나 의식적으로 암을 앓고 있지 않은 건강한 친구와의 관계맺음을 선호하였다. 결론 청소년 소아암 생존자의 슬픔은 다양한 상황적 맥락에 연루된 사회 환경적 요소들에 따라 숨겨지거나 표출되었다. 상황분석은 이러한 요소들 간의 관계를 시각적으로 정렬하며 비교, 분석하는 데 있어서 유용하였다.

웹툰의 사운드 표현에 관한 연구 (A Study of Sound Expression in Webtoon)

  • 목혜정
    • 만화애니메이션 연구
    • /
    • 통권36호
    • /
    • pp.469-491
    • /
    • 2014
  • 웹툰은 출판만화에서 사운드를 시각적으로 표현했던 방법을 발전시켜왔으며, 웹 기술의 발전을 토대로 직접 소리를 들려주기까지 한다. 직접 들리는 소리는 당연히 사운드 분석의 대상이 된다. 그러나 들리지 않는 사운드도 분석 대상이 될 수 있다. 본 연구는 들리지 않는 소리를 분석할 수 있다는 것의 이론적 토대를 인지심리학의 이중부호 개념에 둔다. 작가는 자신의 청각적 기억을 시각적으로 기호화할 수 있고, 독자는 기억과 인출의 과정을 통해 시각화된 기호를 보고 사운드를 떠올릴 수 있다. 이와 같은 웹툰의 들리지는 않지만 떠올릴 수 있는 사운드와 직접 들리는 사운드 두 경우를 본 연구는 함께 분석대상으로 한다. 구체적 분석을 위해서는 이론적 성과물이 있는 영화 사운드 분석 방법을 활용할 수 있다. 소리를 구성하는 세 요소인 음량, 음조, 음색은 음향학에서는 주파수 등으로 설명되고 직접 들을 때는 느낌으로 알지만, 시각적으로는 사운드를 표현한 글자나 이미지의 선의 굵기와 위치, 음원의 이미지 등으로 알 수 있다. 내화면 사운드와 외화면 사운드의 시각적 표현은 만화의 칸과 관련이 있다. 일반적으로는 칸 외부로 외화면 사운드를 표현하지만 웹툰에서는 듣는 자를 강조하는 방법으로 칸 내부에 외화면 소리를 표현하기도 한다. 그리고 영화의 호러 장르가 장르 효과를 높이기 위해 사운드를 많이 사용하는데 웹툰에서도 호러 장르가 같은 효과를 위해 사운드를 많이 사용한다. 이러한 영화 사운드 분석 방법을 활용해 사운드를 이미지로 표현한 작품들을 분석해볼 때, 초창기 출판만화에서부터 시작한 사운드의 청각적 표현들이 계속 발전해서 웹툰에서 창의적으로 표현되고 있음을 알 수 있다. 특히 세로 이동을 활용한 칸의 배치 및 소리표현의 방식들은 웹툰이 보여준 새로운 방법들이며, 칸 모양도 훨씬 다양해졌다. 직접 들려주는 소리로는 BGM이 가장 먼저 사용되었는데 최근에는 한 회의 분위기에 맞춰 음향효과까지 섞어 맞춤 작곡된 곡들이 사용된다. 그리고 스크롤 이동에 맞춰 소리를 들려주는 프로그램이 개발되면서 특정 순간의 음향효과나 특정 장면에 어울리는 음악들을 들을 수 있게 되었다. 특히 호러 장르에서는 특정한 이미지와 공포를 불러일으키는 사운드를 같이 사용하여 장르적 효과를 배가시킨다. 이렇게 웹툰에서는 다양한 사운드 시각화 방법이 계속 창조되고 있으며 기술과 접목된 새로운 시도들이 이루어지고 있다. 이러한 발전은 웹툰이 하나의 문화콘텐츠로서의 융합의 장이 될 수 있음을 보여준다.

트윗 데이터를 활용한 IT 트렌드 분석 (An Analysis of IT Trends Using Tweet Data)

  • 이진백;이충권;차경진
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.143-159
    • /
    • 2015
  • 불확실한 환경변화에 대처하고 장기적 전략수립을 위해 기업에게 있어서 IT 트렌드에 대한 예측은 오랫동안 중요한 주제였다. IT 트렌드에 대한 예측을 기반으로 새로운 시대에 대한 인식을 하고 예산을 배정하여 빠르게 변화하는 기술의 추세에 대비할 수 있기 때문이다. 해마다 유수의 컨설팅업체들과 조사기관에서 차년도 IT 트렌드에 대해서 발표되고는 있지만, 이러한 예측이 실제로 차년도 비즈니스 현실세계에서 나타났는지에 대한 연구는 거의 없었다. 본 연구는 현존하는 빅데이터 기술을 활용하여 서울지역을 중심으로 지난 8개월동안(2013년 5월1일부터 2013년12월31까지) 정보통신산업진흥원과 한국정보화진흥원에서 2012년 말에 발표한 IT 트렌드 토픽이 언급된 21,589개의 트윗 데이터를 수집하여 분석하였다. 또한 2013년에 나라장터에 올라온 프로젝트들이 IT트렌드 토픽과 관련이 있는지 상관관계분석을 실시하였다. 연구결과, 빅데이터, 클라우드, HTML5, 스마트홈, 테블릿PC, UI/UX와 같은 IT토픽은 시간이 지날수록 매우 빈번하게 언급되어졌으며, 이 같은 토픽들은 2013년 나라장터 공고 프로젝트 데이터와도 매우 유의한 상관관계를 가지고 있는 것을 확인할 수 있었다. 이는 전년도(2012년)에 예측한 트렌드들이 차년도(2013년)에 실제로 트위터와 한국정부의 공공조달사업에 반영되어 나타나고 있는 것을 의미한다. 본 연구는 최신 빅데이터툴을 사용하여, 유수기관의 IT트렌드 예측이 실제로 트위터와 같은 소셜미디에서 생성되는 트윗데이터에서 얼마나 언급되어 나타나는지 추적했다는 점에서 중요한 의의가 있고, 이를 통해 트위터가 사회적 트랜드의 변화를 효율적으로 추적하기에 유용한 도구임을 확인하고자 할 수 있었다.