• Title/Summary/Keyword: cluster management

검색결과 1,334건 처리시간 0.022초

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.

ICT 인프라 이상탐지를 위한 조건부 멀티모달 오토인코더에 관한 연구 (A Study of Anomaly Detection for ICT Infrastructure using Conditional Multimodal Autoencoder)

  • 신병진;이종훈;한상진;박충식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.57-73
    • /
    • 2021
  • ICT 인프라의 이상탐지를 통한 유지보수와 장애 예방이 중요해지고 있다. 장애 예방을 위해서 이상탐지에 대한 관심이 높아지고 있으며, 지금까지의 다양한 이상탐지 기법 중 최근 연구들에서는 딥러닝을 활용하고 있으며 오토인코더를 활용한 모델을 제안하고 있다. 이는 오토인코더가 다차원 다변량에 대해서도 효과적으로 처리가 가능하다는 것이다. 한편 학습 시에는 많은 컴퓨터 자원이 소모되지만 추론과정에서는 연산을 빠르게 수행할 수 있어 실시간 스트리밍 서비스가 가능하다. 본 연구에서는 기존 연구들과 달리 오토인코더에 2가지 요소를 가미하여 이상탐지의 성능을 높이고자 하였다. 먼저 다차원 데이터가 가지고 있는 속성별 특징을 최대한 부각하여 활용하기 위해 멀티모달 개념을 적용한 멀티모달 오토인코더를 적용하였다. CPU, Memory, network 등 서로 연관이 있는 지표들을 묶어 5개의 모달로 구성하여 학습 성능을 높이고자 하였다. 또한, 시계열 데이터의 특징을 데이터의 차원을 늘리지 않고 효과적으로 학습하기 위하여 조건부 오토인코더(conditional autoencoder) 구조를 활용하는 조건부 멀티모달 오토인코더(Conditional Multimodal Autoencoder, CMAE)를 제안하였다. 제안한 CAME 모델은 비교 실험을 통해 검증했으며, 기존 연구들에서 많이 활용된 오토인코더와 비교하여 AUC, Accuracy, Precision, Recall, F1-score의 성능 평가를 진행한 결과 유니모달 오토인코더(UAE)와 멀티모달 오토인코더(Multimodal Autoencoder, MAE)의 성능을 상회하는 결과를 얻어 이상탐지에 있어 효과적이라는 것을 확인하였다.

코로나 19 하에서 재난문자 내의 정보유형 및 특성: 서울특별시 재난문자를 중심으로 (Information types and characteristics within the Wireless Emergency Alert in COVID-19: Focusing on Wireless Emergency Alerts in Seoul)

  • 윤성욱;남기환
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.45-68
    • /
    • 2022
  • 대한민국 중앙부처, 지방자치단체는 코로나 19가 급속도로 확산하는 팬데믹 상황에서 재난상황 극복을 위해 재난대응에 필요한 정보를 재난문자를 통해 제공하였다. 재난문자는 국민들이 가장 많이 접하는 재난정보 전달수단으로서, 휴대폰에 직접 방송하는 CBS(Cell Broadcast Service) 방식을 채택하고 있어 직접 찾아보는 수고스러움 없이 휴대폰을 통해 쉽게 정보를 접할 수 있다는 장점이 있다. 본 연구는 지난 1년 1개월간(2020년 1월~2021년 1월) 서울특별시에 발송된 재난문자의 특성을 다양한 텍스트마이닝 방법론 등을 통해 도출하고 재난문자에 포함된 다양한 유형의 정보가 국민들의 이동 행태에 어떠한 영향을 미쳤는지를 서울특별시 지역구의 연령별 유동인구의 이동성을 통해 확인하였다. 각 문자에 포함된 주요 단어와 포함된 정보를 분류하는 과정을 거치고 포함된 단어를 기반으로 하는 문서 군집 분석 기법을 적용해 개별 발송 문자를 분석 단위로써 활용할 수 있도록 텍스트 분석을 시행하였다. 이후, 텍스트마이닝을 통해 추출한 재난문자의 특성이 지역별, 연령별 인구이동성에 미친 영향을 규명하였다. 구조화된 모형을 활용하여 재난정보가 인구이동성에 미치는 영향을 기본효과, 누적효과로 구분하여 측정하였다. 지자체가 보유한 재난문자 발송권한으로 인해 재난문자 발송 특성은 지자체별로 상이함을 계량 분석에 활용하였다. 분석 결과 인구이동성에 변화를 유발하는 정보유형은 연령별로 상이함을 확인할 수 있었다. 날짜와 순서에 관련된 정보는 60-70대의 인구이동성을 유의미하게 감소시키는 것을 확인할 수 있었다. 온라인 정보는 20대의 이동성을 감소시켰고, 증상과 관련된 정보는 30대의 인구이동성을 감소시켰다. 한편, 방역 정책 준수를 당부하는 의미를 포함하는 규범적 단어 등은 전 연령의 인구이동성에 유의미한 변화를 불러일으키지 못함을 확인할 수 있었다. 이는 재난대응에 도움이 되는 유의미한 정보들만 재난문자에 포함되어야 함을 의미한다. 한편, 인구이동성에 유의미한 변화를 불러일으키는 정보유형 또한 재난문자가 반복됨에 따라 효과가 상쇄함을 음의 누적효과 추정 결과를 통해 확인할 수 있었다.

관우한국생태학적일개예설(关于韩国生态学的一个预设): 기우복장탑배적행위(基于服装搭配的行为) (Typology of Korean Eco-sumers: Based on Clothing Disposal Behaviors)

  • Sung, Hee-Won;Kincade, Doris H.
    • 마케팅과학연구
    • /
    • 제20권1호
    • /
    • pp.59-69
    • /
    • 2010
  • 绿色环保或者环境意识已经成为商业、政府机关, 以及消费者和世界关注的重要问题. 针对这一情况, 韩国政府宣布, 在本世纪初, "环保建设" 将被作为一种用以鼓励与环保相关的商业活动的方式. 不同层次的韩国服装业, 提出了不同的产品环保的绿色计划. 这些服装产品包括有机产品和回收的衣服. 要想使这些公司成功, 他们需要那些, 在做产品购买,使用, 处置时, 将绿色问题(如环境的可持续性发展)作为一个人判断的一个组成部分的顾客的信息. 这些消费者可以被看成是生态学的关注者. 过去的研究已经对消费者对于环保产品的购买意愿进行了检测. 此外, 还研究了影响生态保护者或绿色消费者的因素. 但是, 只是关注生态保护者在处置或者回收利用衣服上与采购绿色产品相比较是不够的. 服装处置行为有多种途径, 消费者可以用淘汰, 传承(例如: 把它送给一个年幼的弟弟), 赠与, 交换, 出售或者简单的把他扔掉等多种方式来暂时或者永久的摆脱闲置的衣服或贷款项目. 因此, 购买环保产品的行为应该结合服装处置的行为, 从而进一步了解消费者的消费行为与对环境的态度. 本项研究的目的在于提供韩国生态保护者从有利于生态学的角度出发来购买和处理衣服的生活方式的相关信息. 本研究的目标有: 1, 基于韩国对服装处置行为进行分类; 2, 调查人 们人口统计数据, 生活方式和服装消费价值观赏的差异; 3, 在环保的时尚物品的购买意愿和影响因素之间进行比较. 自填式的调查问卷是基于以往的研究设置出来的. 问卷包括10项处置衣服的条款, 22项可持续并且健康的生活方式的条款, 以及19项消费观念的条款. 根据利克特模板的五分量表设置. 此外, 购买两个时尚物品的意愿和每个物品属性的11项特征都是根据利克特模板的七分量表而来, 两种制成羊毛套衫的可以从PET识别代码的回收瓶子中创造出来的涤纶织物这两种套衫选自一个韩国和一个美国的户外运动服装的品牌. 我们对每一种产品的简介和颜色都进行了调查, 人口统计学(即性别, 年龄, 婚姻状况, 教育程度, 收入, 职业)也被包括在内. 在2009年5月份, 研究数据通过一个专业网站的调查机构进行采集, 最后有600份调查问卷可供分析, 这个调查的受访者年龄从20到49岁不等, 平均年龄为34岁. 百分之50的调查者为男性, 大约58%的受访者是已婚者, 其中62%的受访者有大学学位. 主要成分分析和因素最大方法差的方法用以识别衣服处理规模的潜在尺度. 共有三个因素生成(比如: 倒卖行为, 捐赠行为, 不回收利用行为). 基于他们处置衣服的方式对受访者进行了分类, 群类分析被使用, 最终得到了三个部分. 不同的消费者, 被分别贴上 "转售集团", "捐资团体" 以及 "不回收组织" 的标签加以分类, 其中98%是正确的分类. 从人口统计学角度来看, 这三个类别的人在性别, 婚姻状况, 职业和年龄上有显著的差异. 健康可持续的生活方式被缩减为以下5个因素: 自我满意度, 家庭定位, 健康问题, 环境问题和自愿的服务. 这是三个群体中健康可持续的生活方式的最显著的差异. 转售集团和捐赠组表现出在健康可持续的生活方式上的相同倾向, 同时, 不回收集团在生活方式方面呈现最低的平均值. 转售和捐赠团体自称享受和满意这种生活和消费方式, 并且能够利用空余的时间陪伴家人. 另外, 这两组的人关心健康和有机食品, 并试图保护能源和资源. 对服装消费的价值观产生主要影响的三个因素是: 个人价值, 社会价值和实用价值. 因素的方差测试表明转售集团和其他两组之间的因素差异最大. 转售集团相比其他价值更关注个人价值和社会价值. 相比之下, 非回收集团比捐赠集团更关注高层次的社会价值. 比较购买环保产品的意愿上, 转售集团表现出最高的购买A类产品的意愿. 另一方面, 捐赠集团则在小市场中表现出购买B类产品的最高意愿. 此外, 平均分数表明, 购买韩国的产品(B类产品)相比购买美国的产品(A类产品)更合韩国人的心意. 多元线性回归分析法确定了对环保产品的购买的意愿对制造业产品属性的影响. 产品的设计, 价格, 贡献, 对环境的保护, 价格, 兼容性是影响转售集团的显著因素, 另外, 以及对自身形象的影响是捐赠团体的重要因素. 对于非回收集团来说, 设计, 价格等因素是相同的, 自我的形象,对环保运动的贡献, 和环境保护也是很重要的. 而价格因素具有显著性的共通性. 对于B类产品来说, 设计, 合理的价格, 形象等因素是同等的重要, 但是不同的组对购买的特征和意愿有不同的倾向. 健康可持续的生活方式以及服装消费的意向对购买A类产品和B类产品的影响同样被我们所关注. 实际操作者的健康状况和个人价值都是影响购买意愿的重要因素; 然而, 在这三个群体中说服的力度都很低. 结果表明, 分类出来的每组处理服装的行为, 显示着不同服装产品的属性, 个人价值, 和实践者的特点, 这些都影响了他们的购买环保产品的意愿, 结果会使生态保护者提出并组织更合理的生态设计的战略决策.