• 제목/요약/키워드: 키워드 구성 단어

검색결과 57건 처리시간 0.018초

소셜네트워크서비스에 활용할 비표준어 한글 처리 방법 연구 (Research on Methods for Processing Nonstandard Korean Words on Social Network Services)

  • 이종화;레환수;이현규
    • 한국산업정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.35-46
    • /
    • 2016
  • 특정한 관심이나 활동을 공유하는 관계망을 구축해주는 온라인 서비스인 소셜네트워크서비스(SNS), 자신의 관심사에 따라 자유롭게 글, 사진, 동영상 등을 올릴 수 있는 공간인 블로그(Blog) 등은 자신을 알리고 표현하는 사회현상으로 자리 매김하고 있다. 이러한 SNS나 블로그를 통해 사용자들이 자유롭게 표현한 글들을 분석하여 의미있는 정보와 가치, 그리고 패턴을 찾기 위한 텍스트 마이닝(Text Mining), 오피니언 마이닝(Opinion Mining), 의미 분석(Semantic Analysis) 등의 연구가 활발히 이루어지고 있다. 또한, 연구자들의 연구 효율을 보다 높이기 위하여 키워드 기반 연구들도 이루어져있다. 하지만 대부분의 연구들은 한글의 맞춤법에 많은 한계점을 나타내고 있다. 본 연구는 어근을 찾기 힘든 이상한 외계 언어, 무분별하게 표현되는 속어, 알기 힘든 한글 이모티콘 인터넷 언어, 마이닝 처리 과정에서 파악하기 어려운 단어들을 데이터베이스에 구축하여 데이터 사전 기반 마이닝 처리 기법의 한계를 극복하고자 한다. 특정 주제에 대한 주관적 견해로 구성된 블로그를 사례 분석 대상으로 연구를 진행하였으며 유니코드를 활용한 비표준어 추출은 텍스트 마이닝 처리에 유용함을 발견할 수 있었다.

비디오 서버에서 온톨로지를 이용한 의미기반 장면 검색 (Semantic-based Scene Retrieval Using Ontologies for Video Server)

  • 정민영;박성한
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.32-37
    • /
    • 2008
  • 최근 멀티미디어 정보의 양이 빠른 속도로 증가함에 따라 비디오 자료에 대한 효율적 관리는 매우 중요한 의미를 가지게 되었다. 비디오는 대용량적인 특성과 비정형적인 특성을 가지고 있어 신속하고 효율적으로 비디오 검색을 하기 위해서는 정확한 특징 정보를 추출하여 비디오 색인 구조를 구축해야 한다. 비디오 색인 구조는 전통의 데이터베이스와는 다른 모델링 방법과 검색 방법을 사용한다. 따라서 비디오 색인 구조에서 검색의 속도와 정확도를 향상시키기 위해서는 새로운 비디오 색인 구조가 필요하다. 본 논문에서는 의미적으로 비디오를 장면단위로 검색할 수 있는 비디오 온톨로지 시스템을 제안한다. 비디오 온톨로지 시스템은 장면의 내용에 대한 키워드를 구조화 시킨 장면이름 온톨로지와 장면이 가지는 특징 정보에 대한 정보를 가지는 장면 모델 온톨로지로 구성된다. 장면 이름 온톨로지는 색인된 내용에 대한 의미적 검색이 가능하도록 단어들을 트리구조로 저장된다. 그리고 장면 모델 온톨로지는 색상, 모양, 재질과 같은 저수준 정보와 객체, 이벤트 같은 고수준 정보의 의미적 차이를 극복해 줌으로써 의미기반 검색이 가능하게 해준다.

ICT+디자인 융합 교육과정 개발연구 (Research on the Curriculum for Integration of ICT+Design)

  • 정상훈
    • 감성과학
    • /
    • 제20권1호
    • /
    • pp.105-114
    • /
    • 2017
  • 지금은 그 어느 때보다도 급변하는 시대로 3D 프린팅, 사물 인터넷, 웨어러블 등 새로운 기술이 정신을 차릴 수 없을 만큼 빠른 속도로 쏟아져 나오고 있다. 새로운 개념에 익숙해지기도 전에 또 다른 개념을 익혀야 하는 요즘 융합, 다학제, 디자인 혁신과 같은 단어는 시대를 규정짓는 중요한 키워드임에 틀림없다. 이처럼 이종 기술간, 산업간, 학문간 융합 트렌드의 확산으로 융합 신제품 및 창의적 서비스 개발에서 디자인의 역할이 더욱 중요해지고 있다. 정부에서도 'ICT 중심의 융합'을 통하여 새로운 산업을 일으키고 고급 일자리를 창출함으로써 '창조경제를 실현'한다는 정책을 일관성 있게 추진해오고 있다. 이러한 글로벌 트렌드 변화에 능동적으로 대처할 수 있는 'ICT+디자인 융합형 인재'를 양성하기 위한 체계적인 교육과정을 개발할 필요성이 대두되고 있다. 본 연구에서는 다양한 문헌연구와 세계 우수대학 및 국내 대학에 대한 벤치마킹, 산업체, 연구소, 관련기관 등에 속한 ICT분야 전문가 혹은 디자인 분야에 종사하는 디자이너를 대상으로 하는 설문조사 등을 통하여 글로벌 산업 환경의 변화와 산업체의 구체적인 수요 분석을 통하여 ICT+디자인 융합 교육과정을 제안하였다. ICT+디자인 융합 교육과정에서는 ICT+디자인 융합분야에 대한 전문적인 지식을 함양하고 연구하기 위하여 디자인적 사고와 방법론을 학습하고 ICT+디자인 통합프로젝트 수행 및 실제적인 ICT+디자인 융합 과제를 창의적으로 해결할 수 있는 교과목으로 구성하였다. 디자인과 ICT 전공자들이 어울려 '디자인적 사고(Design Thinking)'를 기반으로 각자의 전문성을 가지고 서로를 이해하고 소통 협력할 수 있도록 극단적 협력(Radical Collaboration)을 통한 창의적인 협업이 가능한 교과목으로 구성하였다. 또한 산업체 전문가를 멘토로 선임하여 다양한 형태의 통합프로젝트를 수행함으로써 현장 중심형 실무 프로젝트를 경험할 수 있는 교과목으로 구성하였다. 전체적으로 단순히 연구만 하는 것이 아니라 창의융합 공작소에서 직접 만들어 볼 수 있는 환경을 구축하여 어떠한 아이디어라도 실제 구현해 볼 수 있는 교과목으로 구성하였다.

사회학 분야의 연구데이터 특성과 지적구조 규명에 관한 연구 (An Investigation on Characteristics and Intellectual Structure of Sociology by Analyzing Cited Data)

  • 최형욱;정은경
    • 정보관리학회지
    • /
    • 제34권3호
    • /
    • pp.109-124
    • /
    • 2017
  • 여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 'Sociology'로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 'Sociology'로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.

문헌동시인용 분석을 통한 한국학 지식구조 파악: 주체 인식과 타자 인식의 차이 (Detection of Knowledge Structure of Korean Studies Using Document Co-citation Analysis: the Difference between Self-perception and Others' Perception)

  • 김혜진
    • 한국도서관정보학회지
    • /
    • 제51권1호
    • /
    • pp.179-200
    • /
    • 2020
  • 한국학의 연구 범위는 한국의 역사, 문학, 정치, 사회, 경제, 종교 등 한국과 관련된 모든 영역을 망라하고 있다. 본 연구는 문헌동시인용 분석과 텍스트마이닝 기법을 사용하여 한국학 지식구조를 정의하였다. 그리고 한국학을 다룬 주체에 따라 한국에서 논의된 한국 연구를 주체 인식 한국학, 한국 이외의 지역에서 논의된 한국 연구를 타자 인식 한국학으로 나누어 하위영역을 비교·분석하였다. 이를 위해서 SCOPUS 데이터베이스에서 'Korea' 또는 'Korean' 이라는 단어를 키워드로 포함하고 있는 인문·사회 분야 문헌 10,929건을 수집하였다. 분석결과 주체 인식 한국학의 지식구조에서는 총 20개의 하위영역이 발견되었고, 타자 인식 한국학의 지식구조에서는 총 14개의 하위영역이 발견되었다. 주체 인식의 한국학과 타자 인식의 한국학의 하위영역 구성에 있어서 차이점은 첫째, 주체 인식 한국학의 하위영역이 타자 인식 한국학의 하위영역보다 더 다양한 영역으로 세분되어 있다는 것, 둘째, 주체 인식 한국학은 마케팅/소비자와 서비스, 산업화, 다문화, 정신건강, 관광, 한국어, 환경과 도시 등이 주요 영역을 차지하고 있고, 타자 인식 한국학은 크게 한국 대내외의 상황, 한국 대중문화, 미국 이민자로서의 한국인, 한국어/한국어 습득이 주요 영역을 차지하고 있는 것으로 나타났다. 마지막으로 주체 인식과 타자 인식에서 공통적으로 보이는 영역은 정신건강, 관광, 한국어, 탈주민, 청소년 비행 등이었다.

주경로 분석과 연관어 네트워크 분석을 통한 '구전(WoM)' 관련 연구동향 분석 (Analysis of Research Trends of 'Word of Mouth (WoM)' through Main Path and Word Co-occurrence Network)

  • 신현보;김혜진
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.179-200
    • /
    • 2019
  • 구전(Word-of-Mouth) 활동은 오래 전부터 기업의 마케팅 과정에서 중요성을 인식하고 특히 마케팅 분야에서 많은 주목을 받아왔다. 최근에는 인터넷의 발달에 따라 온라인 뉴스, 온라인 커뮤니티 등에서 사람들이 지식과 정보를 주고 받는 방식이 다양해지면서 구전은 후기, 평점, 좋아요 등으로 입소문의 양상이 다각화되고 있다. 이러한 현상에 따라 구전에 관한 다양한 연구들이 선행되어왔으나, 이들을 종합적으로 분석한 메타 분석 연구는 부재하다. 본 연구는 학술 빅데이터를 활용해 구전 관련 연구동향을 알아내기 위해서 텍스트 마이닝 기법을 적용하여 주요 연구들을 추출하고 시기별로 연구들의 주요 쟁점을 파악하는 기법을 제안하였다. 이를 위해서 1941년부터 2018년까지 인용 데이터베이스인 Scopus에서 'Word-of-Mouth'라는 키워드로 검색되는 총 4389건의 문헌을 수집하였고, 영어 형태소 분석과 불용어 제거 등 전처리 과정을 통해 데이터를 정제하였다. 본 연구는 학문 분야의 발전 궤적을 추적하는 데 활용되는 주경로 분석기법을 적용해 구전과 관련된 핵심 연구들을 추출하여 연구동향을 거시적 관점에서 제시하였고, 단어동시출현 정보를 추출하여 키워드 간 네트워크를 구축하여 시기별로 구전과 관련된 연관어들이 어떻게 변화되었는지 살펴봄으로써 연구동향을 미시적 관점에서 제시하였다. 수집된 문헌 데이터를 기반으로 인용 네트워크를 구축하고 SPC 가중치를 적용하여 키루트 주경로를 추출한 결과 30개의 문헌으로 구성된 주경로가 추출되었고, 연관어 네트워크 분석을 통해서는 시기별로 온라인 시대, 관광 산업 등 다양한 산업군 등 산업 변화가 반영돼 시대적 변화와 더불어 발전하고 있는 학술적 영역의 변화를 확인할 수 있었다.

유교경전의 동이 인식에 관한 연구 - 13경 및 그 주석서를 중심으로 - (A study on the awareness about "Dong-YI(東夷)" in Confucianism scripture)

  • 함현찬
    • 한국철학논집
    • /
    • 제30호
    • /
    • pp.123-159
    • /
    • 2010
  • 본 연구는 한국사상의 원류를 연구하는데 필수적인 이(夷) 또는 동이(東夷) 관련 유교경전 자료를 정리 분석 및 주해하는 한편, 동이 관련 유교경전 자료에 대한 대중적 접근성이 용이한 연구 자료를 제공하기 위하여 기획되었다. '동이'는 동아시아의 역사뿐만 아니라 한국의 사상과 문화의 원형을 탐구하는 데서도 필요한 핵심적 키워드이다. 또한 동이와 관련된 유교경전 자료는 시간적으로 선진시대부터 현대에 이르기까지 동아시아의 역사 전반에 걸쳐 있으며, 공간적으로는 중국, 한국, 일본에 이르기까지 매우 광범위하게 분포되어 있다. 그럼에도 불구하고 국내에서 아직까지 이(夷) 또는 동이(東夷)와 관련된 자료가 체계적으로 분류 정리 되지 못하였을 뿐만 아니라, 그 자료의 번역과 주석 또한 이루어지지 않아서 연구자들이나 일반인들이 쉽게 접근할 수 없는 상황이다. 따라서 본 연구는 동이와 관련된 유교경전 자료를 종합적이고도 체계적으로 분석하고, 아울러 유교경전 관련 주석서에서 시대별로 이 혹은 동이에 대한 인식이 어떻게 변화하고 있는지를 파악하여, 이를 토대로 이(夷) 내지는 동이(東夷)에 대한 인식과 그 정체성을 규명해 보았다. 일반적으로 이(夷) 또는 동이(東夷)라고 하면 '동쪽 오랑캐' 또는 '중국 사람들이 그들의 동쪽에 있는 족속들을 멸시하여 일컫던 말', '사이(四夷)의 하나. 동쪽 오랑캐. 중국(中國)이 동쪽 나라의 이민족(異民族)을 멸시(蔑視)하여 일컫던 말', "자세히는 황하의 중간쯤으로부터 하류 동쪽의 이민족, 곧 한국 만주 일본 등을 가리킴" 등으로 알려져 있고, 또 "중국 역사에서 동쪽에 사는 오랑캐(이민족)를 일컬어 부르는 말이다. '사이(四夷)'와 같이 이(夷)는 오랑캐 전체를 일컫는 대명사로도 사용되었으나, 일반적으로 동서남북의 각 방위에 따라 오랑캐를 구분하여 동이 서융(西戎) 남만(南蠻) 북적(北狄)으로 불렀다." 라는 식으로 알려져 왔다. 그러나 유교경전에 언급된 이(夷) 개념에 대한 분석을 통해 그것이 오랑캐 라기 보다는 오히려 군자(君子) 재지는 군자국(君子國)을 의미하는 뜻을 내포하고 있음을 알 수 있다. 따라서 이상에서의 동이관련 유교경전 자료를 분석해 볼 때 과거 "'동쪽 오랑캐' 또는 '중국 사람들이 그들의 동쪽에 있는 족속들을 멸시하여 일컫던 말' 이라는 식의 인식은 매우 잘못되고 왜곡되어진 인식임이 분명하다는 것을 알 수 있고, 이(夷)는 인(仁)이며, 인(人)이고, 또한 군자(君子)이다. 따라서 이(夷)라는 단어가 함축하고 있는 의미는 바로 '사람다운 사람' '군자', 내지는 '군자국(君子國)'을 나타내는 의미가 내재되어 있는 단어라는 것을 분명하게 확인할 수 있다. 한 민족의 정체성을 구성하는 요소는 여러 가지가 있겠지만, 가장 중요한 것은 언어와 역사 그리고 정신 혹은 사상이라고 말할 수 있다. 이 가운데 가장 변하기 쉽고 또 지키기 어려운 것이 정신일 것이다. 그것은 보이지 않는 것이고 다른 것과 구별하거나 정의하기 어려운 특성 때문이다. 정신 혹은 사상은 변하는 것이고 변해야 한다. 그러나 모든 것이 그렇듯 변하지 않는 것, 변해서는 안 되는 부분이 있다. 어떤 상황에서도 변해서는 안 되는 그 부분이 바로 정체성의 뼈대에 해당한다. 따라서 동이와 관련된 유교경전 자료를 종합적으로 정리하고 분석하는 것은 이러한 뼈대를 구축하는 초석이며, 무엇보다 시급한 역사적 당면과제라고 할 수 있다. 그리고 이를 통한 한국의 정체성 확립은 정치 사회적 측면에서도 우리에게 가장 적합한 우리 국가와 문화 및 사회 발전의 효율성을 극대화할 수 있을 것이다.