• 제목/요약/키워드: World Wide Web

검색결과 645건 처리시간 0.025초

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.

비주얼 컬처로서 만화영상의 확장된 장(場, fest)에 대한 논의: 뉴 테크놀로지를 중심으로 (Discussions about Expanded Fests of Cartoons and Multimedia Comics as Visual Culture: With a Focus on New Technologies)

  • 이화자;김세종
    • 만화애니메이션 연구
    • /
    • 통권28호
    • /
    • pp.1-25
    • /
    • 2012
  • 만화는 1990년 이후 사회 문화 전반에 디지털화가 급속하게 이루어지면서 만화의 디지털화를 이끌었고 지면에서 웹으로의 매체변화가 이동하면서 강력한 시각문화 발전하였으며 멀티미디어 기술과의 만남으로 영상문화로까지 진화하고 있다. 따라서 만화는 이제 문자문화로 보기 보다는 '확장된 장(마당, 場, fest)'으로 시각문화와 영상문화로서 다루고 더욱 넓은 의미의 만화영상으로 주목해야 한다. 연구자는 본 연구에서 빠르게 변화하는 디지털 시대에 맞춰 변화되는 만화의 현주소를 진단하고 이에 따르는 앞으로 만화가 지향해야 할 방향에 대한 이야기를 하고자 한다. 그러기 위해서 우선 만화의 디지털화와 대학에서 만화영상 전문교육을 시작했던 시점인 1990년대부터 현재의 만화영상의 장에 이르기까지의 변화들을 사례 중심으로 논의하였다. 뉴 테크놀로지와 만화의 만남에 따라 기존의 만화의 형태는 깨지고 있다. 특히 뉴 테크놀로지 기술을 작품에 적극 활용하는 작가들이 대거 등장함에 따라 만화의 내용적, 형식적 변화와 캐릭터 활용의 확장이 빠르게 이뤄지고 있다. 이러한 첨단기술의 발달은 작품에만 영향을 끼치는데 그치지 않고 감상자의 역할까지 변화 시키고 있다. 이제 독자는 적극적으로 작품에 대한 의견을 제시하고 팬덤을 형성하여 자신이 좋아하는 작품과 작가를 홍보하고 스타의 자리로 올려놓기도 한다. 더 나아가 스스로 창작물을 만들고 스스로 작가가 되는 새로운 형식의 등용시스템을 만들어 내기도 한다. 결과적으로 이러한 다양한 장르의 작가군의 형성으로 인해 새로운 이야기 텍스트 개발의 가능성과 다양한 스타일, 세계관이 등장 되면서 만화텍스트의 본질이 확장되고 있다고 볼 수 있다. 또한 만화문화, 산업, 교육, 기관, 기술 등 전반적인 만화시스템 역시 확장되고 있다. 앞으로도 만화영상은 차세대의 문화를 반영하고 매개하고 소통하는 메신저로도 공헌해 나갈 것이라고 기대한다. 오늘날의 만화는 인쇄만화와 영상만화로 구분 지을 수 없겠고, 설치개념의 만화와 더불어 블록버스터 디지털영상, 팬시용품과 서사를 바탕으로 하는 테마파크의 캐릭터 활용을 볼 때 다양한 형태와 양식으로 각 영역을 확장해 갈 것이다. 그러므로 지금보다 만화영상 교육을 다양성 있게 다각화시킬 필요가 있다. 창의적 예술 능력에 인문사회학적 기반과 뉴 테크놀로지 교육이 접목되어 문자문화와 영상문화의 감각종합형 문화 분야를 이끌어 갈 수 있는 그러한 능력을 가진 미래 세대를 키우는 것이 오늘날 우리의 과제일 것이다.

소비자대함유한국전통시상설계원소적편복적소비행위지우생활방식적조절작용(消费者对含有韩国传统时尚设计元素的便服的消费行为之于生活方式的调节作用) (Moderating Effect of Lifestyle on Consumer Behavior of Loungewear with Korean Traditional Fashion Design Elements)

  • Ko, Eun-Ju;Lee, Jee-Hyun;Kim, Angella Ji-Young;Burns, Leslie Davis
    • 마케팅과학연구
    • /
    • 제20권1호
    • /
    • pp.15-26
    • /
    • 2010
  • 由于生产的全球化以及国家之间的文化交流, 东方元素越来越吸引世界的眼球. 在时装界, 一个时装设计师的文化背景往往可以催生新颖的设计理念, 使他卓尔不群. 人们对于东方元素的喜爱, 给传统时装市场带来了巨大的商机, 并且把基于文化的业务拓展到全球时装市场. 然而, 包含韩国传统文化的国际品牌还有待开发. 为了发展有韩国特色的国际品牌, 韩国人首先要在国内服装市场上认同本国文化, 然后才能进军国外市场. 便服非常适合采纳韩国元素, 因为这种衣服有很多用途, 很容易被广泛接受和使用. 而且, 多用途便服和时尚内衣的市场需求越来越大. 尽管便服市场在快速发展, 但是对便服的专门研究尚不多见, 目前在对发展中的现代化传统服装、时尚产品和品牌的研究中, 并不包括对便服的研究. 因此, 本论文调查了韩国的便服市场, 研究了消费者对含有韩国传统时装设计特色的便服的评价. 分析了对于韩国传统时装设计元素有购买意向的先例之间的关系, 并且比较了不同生活群体的消费目标. 产品质量, 零售服务质量, 感受价值以及对拥有韩国传统设计元素的便服的喜好被作为购买意向的先决条件. 同时, 本文设计了一个结构方程模型, 用于探讨它们之间的关系以及它们对购买意图的影响. 产品质量和市场营销中的零售服务质量结合在一起, 成为影响人们对韩国特色便服的偏好和价值感知的因素. 而且, 偏好和价值感知对购买意向的影响可以用同一模型来检验. 通过网上调查系统由女性消费者完成了一共357份的自填式问卷, 并制定了一份调查样本人群的生活方式、对于产品和销售服务的标准、对于韩国特色便服的价值感知、偏好以及购买意向的调查问卷. 此外, 问卷还将调查便服的采购和使用行为, 以便检验韩国便服的市场地位. 并且使用描述性分析, 因素分析, 聚类分析来分析数据, 以及使用AMOS 7.0.来进行方差分析和建立结构方程模型. 对于韩国便服市场地位的调查结果显示, 在我们的样本人群中大多数消费者都购买了便服. 便服在目前被认为是在家里穿的衣服, 是消费者比较而言投入较低的衣服. 在调查中显示, 大多数消费者每年仅仅购买2到3次便服, 花费在10美元以下. 购买便服的消费者们的生活方式共有四类: 传统价值导向的生活方式, 品牌影响的生活方式, 追求休闲的生活方式以及健康导向的生活方式, 这四类共计有12个项目. 基于这些生活方式要素, 便服消费者们又可以分为两类: 安乐派和保守派. 文章估量了对含有韩国传统时尚设计元素的便服的购买行为各组成部分之间的关系, 产品质量和零售服务质量都会影响到购买便服的偏好和价值感知. 这个研究结论证明, 高质量的产品和零售服务会对便服形成积极的优先效应. 价值感知和对便服的偏好会对购买意图产生积极的影响. 这个结果表明, 对便服所含有的韩国传统时尚设计因素的强烈偏好和价值感知能增强购买意图. 在两种不同生活方式的群体(即安乐派和保守派)的模型比较中, 结果显示产品质量和零售服务质量对安乐派群体的偏好和感知价值都有积极影响. 然而, 对保守派来说, 只有零售服务质量对偏好和购买意图有积极的影响. 由于安乐派对购买意图显示出更重大的影响, 包含韩国传统时尚设计因素的便服品牌应该关注安乐派的这些特征. 然而, 保守派对包含韩国传统时尚设计因素的便服在偏好和购买意图的关系中显得更强. 因此对包含韩国传统时尚设计因素的便服品牌来说, 它应该把重点放在如何激发保守群体消费者对便服的积极偏爱上. 这些结果提供了关于韩国便服消费者生活方式的信息, 也对那些计划进入韩国便服市场的时尚品牌, 尤其是那些与现行研究样本相似的, 目标为女性消费者的时尚品牌提供了有用的信息. 这一研究也为便服品牌和那些打算创造含有韩国传统时尚因素的高价值品牌提供了策略和市场洞察力. 考虑到不同生活方式群体的类型和便服或传统时尚商品之间的关系, 品牌设计者和市场策划人员可以运用这一研究成果作为市场定位, 目标设定, 以及市场销售策略的一个参考.