통합 검색 | Korea Science

유사도 알고리즘을 활용한 시맨틱 프로세스 검색방안 (Semantic Process Retrieval with Similarity Algorithms)

이홍주
- Asia pacific journal of information systems
- /
- 제18권1호
- /
- pp.79-96
- /
- 2008
One of the roles of the Semantic Web services is to execute dynamic intra-organizational services including the integration and interoperation of business processes. Since different organizations design their processes differently, the retrieval of similar semantic business processes is necessary in order to support inter-organizational collaborations. Most approaches for finding services that have certain features and support certain business processes have relied on some type of logical reasoning and exact matching. This paper presents our approach of using imprecise matching for expanding results from an exact matching engine to query the OWL(Web Ontology Language) MIT Process Handbook. MIT Process Handbook is an electronic repository of best-practice business processes. The Handbook is intended to help people: (1) redesigning organizational processes, (2) inventing new processes, and (3) sharing ideas about organizational practices. In order to use the MIT Process Handbook for process retrieval experiments, we had to export it into an OWL-based format. We model the Process Handbook meta-model in OWL and export the processes in the Handbook as instances of the meta-model. Next, we need to find a sizable number of queries and their corresponding correct answers in the Process Handbook. Many previous studies devised artificial dataset composed of randomly generated numbers without real meaning and used subjective ratings for correct answers and similarity values between processes. To generate a semantic-preserving test data set, we create 20 variants for each target process that are syntactically different but semantically equivalent using mutation operators. These variants represent the correct answers of the target process. We devise diverse similarity algorithms based on values of process attributes and structures of business processes. We use simple similarity algorithms for text retrieval such as TF-IDF and Levenshtein edit distance to devise our approaches, and utilize tree edit distance measure because semantic processes are appeared to have a graph structure. Also, we design similarity algorithms considering similarity of process structure such as part process, goal, and exception. Since we can identify relationships between semantic process and its subcomponents, this information can be utilized for calculating similarities between processes. Dice's coefficient and Jaccard similarity measures are utilized to calculate portion of overlaps between processes in diverse ways. We perform retrieval experiments to compare the performance of the devised similarity algorithms. We measure the retrieval performance in terms of precision, recall and F measure? the harmonic mean of precision and recall. The tree edit distance shows the poorest performance in terms of all measures. TF-IDF and the method incorporating TF-IDF measure and Levenshtein edit distance show better performances than other devised methods. These two measures are focused on similarity between name and descriptions of process. In addition, we calculate rank correlation coefficient, Kendall's tau b, between the number of process mutations and ranking of similarity values among the mutation sets. In this experiment, similarity measures based on process structure, such as Dice's, Jaccard, and derivatives of these measures, show greater coefficient than measures based on values of process attributes. However, the Lev-TFIDF-JaccardAll measure considering process structure and attributes' values together shows reasonably better performances in these two experiments. For retrieving semantic process, we can think that it's better to consider diverse aspects of process similarity such as process structure and values of process attributes. We generate semantic process data and its dataset for retrieval experiment from MIT Process Handbook repository. We suggest imprecise query algorithms that expand retrieval results from exact matching engine such as SPARQL, and compare the retrieval performances of the similarity algorithms. For the limitations and future work, we need to perform experiments with other dataset from other domain. And, since there are many similarity values from diverse measures, we may find better ways to identify relevant processes by applying these values simultaneously.
PDF KSCI

문서 요약 기법이 가짜 뉴스 탐지 모형에 미치는 영향에 관한 연구 (A Study on the Effect of the Document Summarization Technique on the Fake News Detection Model)

심재승;원하람;안현철
- 지능정보연구
- /
- 제25권3호
- /
- pp.201-220
- /
- 2019
가짜뉴스가 전세계적 이슈로 부상한 최근 수년간 가짜뉴스 문제 해결을 위한 논의와 연구가 지속되고 있다. 특히 인공지능과 텍스트 분석을 이용한 자동화 가짜 뉴스 탐지에 대한 연구가 주목을 받고 있는데, 대부분 문서 분류 기법을 이용한 연구들이 주를 이루고 있는 가운데 문서 요약 기법은 지금까지 거의 활용되지 않았다. 그러나 최근 가짜뉴스 탐지 연구에 생성 요약 기법을 적용하여 성능 개선을 이끌어낸 사례가 해외에서 보고된 바 있으며, 추출 요약 기법 기반의 뉴스 자동 요약 서비스가 대중화된 현재, 요약된 뉴스 정보가 국내 가짜뉴스 탐지 모형의 성능 제고에 긍정적인 영향을 미치는지 확인해 볼 필요가 있다. 이에 본 연구에서는 국내 가짜뉴스에 요약 기법을 적용했을 때 정보 손실이 일어나는지, 혹은 정보가 그대로 보전되거나 혹은 잡음 제거를 통한 정보 획득 효과가 발생하는지 알아보기 위해 국내 뉴스 데이터에 추출 요약 기법을 적용하여 '본문 기반 가짜뉴스 탐지 모형'과 '요약문 기반 가짜뉴스 탐지 모형'을 구축하고, 다수의 기계학습 알고리즘을 적용하여 두 모형의 성능을 비교하는 실험을 수행하였다. 그 결과 BPN(Back Propagation Neural Network)과 SVM(Support Vector Machine)의 경우 큰 성능 차이가 발생하지 않았지만 DT(Decision Tree)의 경우 본문 기반 모델이, LR(Logistic Regression)의 경우 요약문 기반 모델이 다소 우세한 성능을 보였음을 확인하였다. 결과를 검증하는 과정에서 통계적으로 유의미한 수준으로는 요약문 기반 모델과 본문 기반 모델간의 차이가 확인되지는 않았지만, 요약을 적용하였을 경우 가짜뉴스 판별에 도움이 되는 핵심 정보는 최소한 보전되며 LR의 경우 성능 향상의 가능성이 있음을 확인하였다. 본 연구는 추출요약 기법을 국내 가짜뉴스 탐지 연구에 처음으로 적용해 본 도전적인 연구라는 점에서 의의가 있다. 하지만 한계점으로는 비교적 적은 데이터로 실험이 수행되었다는 점과 한 가지 문서요약기법만 사용되었다는 점을 제시할 수 있다. 향후 대규모의 데이터에서도 같은 맥락의 실험결과가 도출되는지 검증하고, 보다 다양한 문서요약기법을 적용해 봄으로써 요약 기법 간 차이를 규명하는 확장된 연구가 추후 수행되어야 할 것이다.
https://doi.org/10.13088/jiis.2019.25.3.201 인용 PDF KSCI

딥러닝 오픈소스 프레임워크의 사례연구를 통한 도입 전략 도출 (Deriving adoption strategies of deep learning open source framework through case studies)

최은주;이준영;한인구
- 지능정보연구
- /
- 제26권4호
- /
- pp.27-65
- /
- 2020
많은 정보통신기술 기업들은 자체적으로 개발한 인공지능 기술을 오픈소스로 공개하였다. 예를 들어, 구글의 TensorFlow, 페이스북의 PyTorch, 마이크로소프트의 CNTK 등 여러 기업들은 자신들의 인공지능 기술들을 공개하고 있다. 이처럼 대중에게 딥러닝 오픈소스 소프트웨어를 공개함으로써 개발자 커뮤니티와의 관계와 인공지능 생태계를 강화하고, 사용자들의 실험, 적용, 개선을 얻을 수 있다. 이에 따라 머신러닝 분야는 급속히 성장하고 있고, 개발자들 또한 여러가지 학습 알고리즘을 재생산하여 각 영역에 활용하고 있다. 하지만 오픈소스 소프트웨어에 대한 다양한 분석들이 이루어진 데 반해, 실제 산업현장에서 딥러닝 오픈소스 소프트웨어를 개발하거나 활용하는데 유용한 연구 결과는 미흡한 실정이다. 따라서 본 연구에서는 딥러닝 프레임워크 사례연구를 통해 해당 프레임워크의 도입 전략을 도출하고자 한다. 기술-조직-환경 프레임워크를 기반으로 기존의 오픈 소스 소프트웨어 도입과 관련된 연구들을 리뷰하고, 이를 바탕으로 두 기업의 성공 사례와 한 기업의 실패 사례를 포함한 총 3 가지 기업의 도입 사례 분석을 통해 딥러닝 프레임워크 도입을 위한 중요한 5가지 성공 요인을 도출하였다: 팀 내 개발자의 지식과 전문성, 하드웨어(GPU) 환경, 데이터 전사 협력 체계, 딥러닝 프레임워크 플랫폼, 딥러닝 프레임워크 도구 서비스. 그리고 도출한 성공 요인을 실현하기 위한 딥러닝 프레임워크의 단계적 도입 전략을 제안하였다: 프로젝트 문제 정의, 딥러닝 방법론이 적합한 기법인지 확인, 딥러닝 프레임워크가 적합한 도구인지 확인, 기업의 딥러닝 프레임워크 사용, 기업의 딥러닝 프레임워크 확산. 본 연구를 통해 각 산업과 사업의 니즈에 따라, 딥러닝 프레임워크를 개발하거나 활용하고자 하는 기업에게 전략적인 시사점을 제공할 수 있을 것이라 기대된다.
https://doi.org/10.13088/jiis.2020.26.4.027 인용 PDF KSCI

랜드마크 윈도우 기반의 빈발 패턴 마이닝 기법의 분석 및 성능평가 (Analysis and Evaluation of Frequent Pattern Mining Technique based on Landmark Window)

편광범;윤은일
- 인터넷정보학회논문지
- /
- 제15권3호
- /
- pp.101-107
- /
- 2014
본 논문에서는 랜드마크 윈도우 기반의 빈발 패턴 마이닝 기법을 분석하고 성능을 평가한다. 본 논문에서는 Lossy counting 알고리즘과 hMiner 알고리즘에 대한 분석을 진행한다. 최신의 랜드마크 알고리즘인 hMiner는 트랜잭션이 발생할 때 마다 빈발 패턴을 마이닝 하는 방법이다. 그래서 hMiner와 같은 랜드마크 기반의 빈발 패턴 마이닝을 온라인 마이닝이라고 한다. 본 논문에서는 랜드마크 윈도우 마이닝의 초기 알고리즘인 Lossy counting와 최신 알고리즘인 hMiner의 성능을 평가하고 분석한다. 우리는 성능평가의 척도로 마이닝 시간과 트랜잭션 당 평균 처리 시간을 평가한다. 그리고 우리는 저장 구조의 효율성을 평가하기 위하여 최대 메모리 사용량을 평가한다. 마지막으로 우리는 알고리즘이 안정적으로 마이닝이 가능한지 평가하기 위해 데이터베이스의 아이템 수를 변화시키면서 평가하는 확장성 평가를 수행한다. 두 알고리즘의 평가 결과로, 랜드마크 윈도우 기반의 빈발 패턴 마이닝은 실시간 시스템에 적합한 마이닝 방식을 가지고 있지만 메모리를 많이 사용했다.
https://doi.org/10.7472/jksii.2014.15.3.101 인용 PDF KSCI

상처와 주름이 있는 지문 판별에 효율적인 심층 학습 비교연구 (A Comparative Study on the Effective Deep Learning for Fingerprint Recognition with Scar and Wrinkle)

김준섭;림빈 보니카;성낙준;홍민
- 인터넷정보학회논문지
- /
- 제21권4호
- /
- pp.17-23
- /
- 2020
인간의 특성과 관련된 측정 항목을 나타내는 생체정보는 도난이나 분실의 염려가 없으므로 높은 신뢰성을 가진 보안 기술로서 큰 주목을 받고 있다. 이러한 생체정보 중 지문은 본인 인증, 신원 파악 등의 분야에 주로 사용된다. 신원을 파악할 때 지문 이미지에 인증을 수행하기 어려운 상처, 주름, 습기 등의 문제가 있을 경우, 지문 전문가가 전처리단계를 통해 직접 지문에 어떠한 문제가 있는지 파악하고 문제에 맞는 영상처리 알고리즘을 적용해 문제를 해결한다. 이때 지문에 상처와 주름이 있는 지문 영상을 판별해주는 인공지능 소프트웨어를 구현하면 손쉽게 상처나 주름의 여부를 확인할 수 있고, 알맞은 알고리즘을 선정해 쉽게 지문 이미지를 개선할 수 있다. 본 연구에서는 이러한 인공지능 소프트웨어의 개발을 위해 캄보디아 왕립대학교의 학생 1,010명, Sokoto 오픈 데이터셋 600명, 국내 학생 98명의 모든 손가락 지문을 취득해 총 17,080개의 지문 데이터베이스를 구축했다. 구축한 데이터베이스에서 상처나 주름이 있는 경우를 판별하기 위해 기준을 확립하고 전문가의 검증을 거쳐 데이터 어노테이션을 진행했다. 트레이닝 데이터셋과 테스트 데이터셋은 캄보디아의 데이터, Sokoto 데이터로 구성하였으며 비율을 8:2로 설정했다. 그리고 국내 학생 98명의 데이터를 검증 데이터 셋으로 설정했다, 구성된 데이터셋을 사용해 Classic CNN, AlexNet, VGG-16, Resnet50, Yolo v3 등의 다섯 가지 CNN 기반 아키텍처를 구현해 학습을 진행했으며 지문의 상처와 주름 판독에서 가장 좋은 성능을 보이는 모델을 찾는 연구를 수행했다. 다섯가지 아키텍처 중 지문 영상에서 상처와 주름 여부를 가장 잘 판별할 수 있는 아키텍처는 ResNet50으로 검증 결과 81.51%로 가장 좋은 성능을 보였다.
https://doi.org/10.7472/jksii.2020.21.4.17 인용 PDF KSCI HTML

합성곱 신경망(Convolutional Neural Network)을 활용한 지능형 아토피피부염 중증도 진단 모델 개발 (Development of Intelligent Severity of Atopic Dermatitis Diagnosis Model using Convolutional Neural Network)

윤재웅;전재헌;방철환;박영민;김영주;오성민;정준호;이석준;이지현
- 경영과정보연구
- /
- 제36권4호
- /
- pp.33-51
- /
- 2017
제4차 산업혁명의 등장과 경제성장으로 인한 '국민 삶의 질 향상' 요구 증대로 인해 의료서비스의 질과 의료비용에 대한 국민들의 요구수준이 향상되고 있으며, 이로 인해 인공지능이 의료현장에 도입되고 있다. 하지만 인공지능이 의료분야에 활용된 사례를 살펴보면 '삶의 질'에 직접적인 영향을 끼치는 만성피부질환에 활용된 사례는 부족한 실정이며, 만성피부질환 중 대표적 질병인 아토피피부염은 정성적 진단 방법으로 인해 진단의 객관성을 확보할 수 없다는 한계가 존재한다. 본 연구에서는 아토피피부염의 객관적 중증도 평가 방법을 마련하여 아토피피부염 환자의 삶의 질을 향상시키고자 다음과 같은 연구를 수행하였다. 첫째, 가톨릭대학교 의과대학 성모병원의 데이터베이스로부터 아토피피부염 환자의 이미지 데이터를 수집했으며, 수집된 이미지 데이터에 대한 정제 및 라벨링 작업을 수행하여 모델 학습과 검증에 적합한 데이터를 확보했다. 둘째, 지능형 아토피피부염 중증도 진단 모형에 적합한 이미지 인식 알고리즘을 파악하기 위해 다양한 CNN 알고리즘들을 병변별 학습용 데이터로 학습시키고, 검증용 데이터를 활용하여 해당 모델의 이미지 인식 정확도를 측정했다. 실증분석 결과 홍반(Erythema)의 경우 'ResNet V1 101', 긁은 정도(Excoriation)의 경우 'ResNet V2 50'이 90% 이상의 정확도를 기록하였으며, 태선화(Lichenification)의 경우 학습용 데이터 부족의 한계로 인해 두 병변보다 낮은 89%의 정확도를 보였다. 해당 결과를 통해 이미지 인식 알고리즘이 단순한 사물 인식 분야뿐만 아니라 전문적 지식이 요구되는 분야에도 높은 성능을 나타낸다는 것을 실증적으로 입증했으며, 본 연구는 실제 아토피피부염 환자의 이미지 데이터를 활용했다는 측면에서 실제 임상환경에서 활용성이 높을 것으로 사료된다.
PDF

O4O 선택속성이 고객만족도 및 고객충성도에 미치는 영향: 중국 허마셴셩 사례를 중심으로 (The Impact of O4O Selection Attributes on Customer Satisfaction and Loyalty: Focusing on the Case of Fresh Hema in China)

최성국;양성병
- 지식경영연구
- /
- 제21권3호
- /
- pp.249-269
- /
- 2020
최근 온라인 시장이 성숙해지면서, 추가 성장을 가로막는 많은 문제점이 드러나고 있는데, 이 중 가장 대표적인 문제는 온라인 상품의 동질화로 인한 고객수의 정체를 꼽을 수 있다. 최근 몇 년 사이 온라인 시장의 비중은 많이 증가하였지만, 이제 오프라인으로 영역을 확장하지 않고서는 더 이상의 발전을 기대하기 힘든 상황에 이른 것이다. 이에, 국내외 많은 온라인 기업들은 온라인 채널의 장점에 더해 온라인 플랫폼의 한계를 보완할 수 있는 오프라인 공간을 함께 확보함으로써, 사업영역 및 마케팅 채널을 확대하고자 노력하고 있다. 정보기술(빅데이터, 인공지능 등)을 활용한 대량의 고객 데이터 분석이라는 그들의 경쟁우위를 바탕으로, O4O(Online for Offline) 비즈니스 모델을 구현함으로써, 오프라인으로의 영향력을 꾸준히 강화해나가고 있는 것이다. 한편, 기존의 관련 연구들은 대부분 O2O(Online to Offline) 비즈니스 모델에만 초점을 맞추고 있으며, 최근 몇 년 동안 다양한 산업 분야에서 활발히 시도되고 있는 O4O 비즈니스 모델에 대한 학문적 시도는 아직 많이 부족한 실정이다. 그나마 존재하는 몇몇의 O4O 관련 연구들도 사례분석 및 체험마케팅 기반의 연구에 그치고 있어, O4O 기반 선택속성들과 이들이 고객만족도 및 고객충성도에 미치는 영향에 대한 실증연구가 시급한 상황이다. 이에 본 연구에서는 중국의 대표적인 O4O 비즈니스 모델인 허마셴셩(盒馬鮮生)을 중심으로, 고객의 관점에서 O4O 서비스에 특화된 주요 선택속성을 도출한 후, 이러한 선택속성들이 고객만족도 및 고객충성도에 미치는 영향을 실증해 보고자 한다. 300명의 O4O(허마셴셩) 이용 경험이 있는 고객을 대상으로 한 설문 표본을 구조방정식모델을 활용해 분석한 결과, 총 7개의 O4O 선택속성 가운데 4개(모바일앱품질, 모바일결제, 상품품질 및 매장시설)가 고객만족도에 영향을 미치는 것으로 나타났으며, 고객만족도는 다시 고객충성도(재이용의도, 추천의도 및 브랜드애착)에 유의한 영향을 미치는 것으로 조사되었다. 본 연구의 결과는 O4O 서비스 분야의 관리자가 빠르게 변화하는 고객요구에 잘 적응하고, 나아가 어떤 선택속성에 더 많은 자원을 할당함으로써 고객만족도 및 고객충성도를 제고할 수 있는지를 알려주는 중요한 가이드라인 역할을 할 수 있을 것으로 기대한다.
https://doi.org/10.15813/kmr.2020.21.3.014 인용 PDF KSCI

상호 대칭적 만족성을 고려한 온라인 데이트시스템 (A Match-Making System Considering Symmetrical Preferences of Matching Partners)

박윤주
- 지능정보연구
- /
- 제18권2호
- /
- pp.177-192
- /
- 2012
최근 추천시스템에 대한 연구는 고객에게 적합한 상품을 추천하는 것에서 진일보하여, 고객이 선호할만한 친구나 배우자를 추천해주는 인맥 연결분야로 확장되고 있다. 이러한 인맥 연결의 주요한 분야로 미혼남녀를 소개시키는 온라인 데이트시스템을 생각할 수 있다. 본 연구는 사용자에게 적합한 데이트 상대를 추천해주는 온라인 매칭시스템을 제안한다. 제안된 시스템은 기존의 상품추천 시스템과는 다르게, 추천 받는 고객뿐만 아니라, 추천 되는 상대방의 호감도를 함께 고려하여, 양자가 상호 대칭적인 만족도를 갖도록 설계하였다. 또한, 인기인에게 추천이 편중되거나, 비인기인들이 추천에서 소외되지 않고, 시스템 참여자들이 전체적으로 일관된 추천 만족도를 가질 수 있도록 하였다. 본 연구에서 제안한 매칭 시스템은 Mutually Beneficial Matching(MBM) 시스템이라 명명하였으며, 이를 다른 두 일반적인 매칭 기법인 Preference-Based Matching(PBM) 기법 및 Arithmetic Mean-Based Matching(AMM) 기법과 비교하여 성능평가를 수행하였다. 즉, 위의 세 가지 기법을 Java를 사용하여 prototype으로 구현한 후, 가상의 미혼남녀 200명의 데이터에 적용하여 비교 분석하였다. 그 결과, 제안된 MBM 기법이 PBM 및 AMM 기법에 비하여 통계적으로 유의하게 높은 상호호감도(Mutual Preference)를 보임을 알 수 있었고, 호감도의 대칭성(Symmetric Ratio)도 대부분의 경우 높게 도출됨을 확인하였다. 뿐만 아니라, 제안된 MBM 기법은 PBM 기법보다 추천에서 소외된 고객 수(Number of Outsiders)가 적어서, 매칭 pool안의 사용자들에게 전체적으로 호혜적이고 일관된 추천서비스를 제공할 수 있을 것으로 기대된다.
https://doi.org/10.13088/jiis.2012.18.2.177 인용 PDF KSCI

검색결과 578건 처리시간 0.105초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)