• 제목/요약/키워드: Open Source Software

검색결과 617건 처리시간 0.023초

오령산 구성성분-타겟 네트워크 분석 (Analysis of a Compound-Target Network of Oryeong-san)

  • 김상균
    • 한국지식정보기술학회논문지
    • /
    • 제13권5호
    • /
    • pp.607-614
    • /
    • 2018
  • 오령산은 몸 속의 수분을 순환시키고 소변으로 배출이 잘 되게 하는 효능이 있어 수분이 정체되어 나타나는 질환에 많이 쓰이는 처방이다. 본 연구에서는 시스템 약리학 접근 방법을 이용해서 오령산의 작용 기전을 탐색하기 위해서 오령산의 구성약재의 성분-타겟 네트워크를 구축하고 분석하였다. 우선, 오령산의 475개 성분에 대해서 STITCH 데이터베이스에서 연관된 타겟을 검색하였으며, 성분과 타겟의 상호작용에 대한 검색 결과는 XML 파일로 다운로드하였다. 본 연구에서 성분-타겟 네트워크는 Gephi를 이용해서 시각화하고 탐색하였다. 노드는 성분과 타겟이 되고, 링크는 성분과 타겟들간에 상호작용이 존재하면 연결되며, 상호작용의 신뢰도에 따라 링크에 가중치를 부여하였다. MCL 알고리즘을 이용해서 네트워크를 클러스터링 하였으며, 총 130개의 클러스터가 생성되었다. 가장 많은 노드를 가지는 클러스터에서 노드의 개수는 32개였다. 성분-타겟 네트워크에서 약재의 유효 성분들이 신장의 혈압 조절 기능과 관련된 타겟들과 연결되어 있는 것을 발견할 수 있었다. 향후에는 질병 데이터베이스와 연계해서 보다 명확한 오령산의 작용 기전을 밝힐 수 있도록 할 계획이다.

인공지능 문장 분류 모델 Sentence-BERT 기반 학교 맞춤형 고등학교 통합과학 질문-답변 챗봇 -개발 및 1년간 사용 분석- (A School-tailored High School Integrated Science Q&A Chatbot with Sentence-BERT: Development and One-Year Usage Analysis)

  • 민경모;유준희
    • 한국과학교육학회지
    • /
    • 제44권3호
    • /
    • pp.231-248
    • /
    • 2024
  • 본 연구에서는 오픈소스 소프트웨어와 인공지능 문서 분류 모델인 한국어 Sentence-BERT로 고등학교 1학년 통합과학 질문-답변 챗봇을 제작하고 2023학년도 1년 동안 독립형 서버에서 운영했다. 챗봇은 Sentence-BERT 모델로 학생의 질문과 가장 유사한 질문-답변 쌍 6개를 찾아 캐러셀 형태로 출력한다. 질문-답변 데이터셋은 인터넷에 공개된 자료를 수집하여 초기 버전을 구축하였고, 챗봇을 1년 동안 운영하면서 학생의 의견과 사용성을 고려하여 자료를 정제하고 새로운 질문-답변 쌍을 추가했다. 2023학년도 말에는 총 30,819개의 데이터셋을 챗봇에 통합하였다. 학생은 챗봇을 1년 동안 총 3,457건 이용했다. 챗봇 사용 기록을 빈도분석 및 시계열 분석한 결과 학생은 수업 중 교사가 챗봇 사용을 유도할 때 챗봇을 이용했고 평소에는 방과 후에 자습하면서 챗봇을 활용했다. 학생은 챗봇에 한 번 접속하여 평균적으로 2.1~2.2회 정도 질문했고, 주로 사용한 기기는 휴대폰이었다. 학생이 챗봇에 입력한 용어를 추출하고자 한국어 형태소 분석기로 명사와 용언을 추출하여 텍스트 마이닝을 진행한 결과 학생은 과학 질문 외에도 시험 범위 등의 학교생활과 관련된 용어를 자주 입력했다. 학생이 챗봇에 자주 물어본 주제를 추출하고자 Sentence-BERT 기반의 BERTopic으로 학생의 질문을 두 차례 범주화하여 토픽 모델링을 진행했다. 전체 질문 중 88%가 35가지 주제로 수렴되었고, 학생이 챗봇에 주로 물어보는 주제를 추출할 수 있었다. 학년말에 학생을 대상으로 한 설문에서 챗봇이 캐러셀 형태로 결과를 출력하는 형태가 학습에 효과적이었고, 통합과학 학습과 학습 목적 이외의 궁금증이나 학교생활과 관련된 물음에 답해주는 역할을 수행했음을 확인할 수 있었다. 본 연구는 공교육 현장에서 학생이 실제로 활용하기에 적합한 챗봇을 개발하여 학생이 장기간에 걸쳐 챗봇을 사용하는 과정에서 얻은 데이터를 분석함으로써 학생의 요구를 충족할 수 있는 챗봇의 교육적 활용 가능성을 확인했다는 점에 의의가 있다.

딥러닝 프레임워크의 비교: 티아노, 텐서플로, CNTK를 중심으로 (Comparison of Deep Learning Frameworks: About Theano, Tensorflow, and Cognitive Toolkit)

  • 정여진;안성만;양지헌;이재준
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.1-17
    • /
    • 2017
  • 딥러닝 프레임워크의 대표적인 기능으로는 '자동미분'과 'GPU의 활용' 등을 들 수 있다. 본 논문은 파이썬의 라이브러리 형태로 사용 가능한 프레임워크 중에서 구글의 텐서플로와 마이크로소프트의 CNTK, 그리고 텐서플로의 원조라고 할 수 있는 티아노를 비교하였다. 본문에서는 자동미분의 개념과 GPU의 활용형태를 간단히 설명하고, 그 다음에 logistic regression을 실행하는 예를 통하여 각 프레임워크의 문법을 알아본 뒤에, 마지막으로 대표적인 딥러닝 응용인 CNN의 예제를 실행시켜보고 코딩의 편의성과 실행속도 등을 확인해 보았다. 그 결과, 편의성의 관점에서 보면 티아노가 가장 코딩 하기가 어렵고, CNTK와 텐서플로는 많은 부분이 비슷하게 추상화 되어 있어서 코딩이 비슷하지만 가중치와 편향을 직접 정의하느냐의 여부에서 차이를 보였다. 그리고 각 프레임워크의 실행속도에 대한 평가는 '큰 차이는 없다'는 것이다. 텐서플로는 티아노에 비하여 속도가 느리다는 평가가 있어왔는데, 본 연구의 실험에 의하면, 비록 CNN 모형에 국한되었지만, 텐서플로가 아주 조금이지만 빠른 것으로 나타났다. CNTK의 경우에도, 비록 실험환경이 달랐지만, 실험환경의 차이에 의한 속도의 차이의 편차범위 이내에 있는 것으로 판단이 되었다. 본 연구에서는 세 종류의 딥러닝 프레임워크만을 살펴보았는데, 위키피디아에 따르면 딥러닝 프레임워크의 종류는 12가지가 있으며, 각 프레임워크의 특징을 15가지 속성으로 구분하여 차이를 특정하고 있다. 그 많은 속성 중에서 사용자의 입장에서 볼 때 중요한 속성은 어떤 언어(파이썬, C++, Java, 등)로 사용가능한지, 어떤 딥러닝 모형에 대한 라이브러리가 잘 구현되어 있는지 등일 것이다. 그리고 사용자가 대규모의 딥러닝 모형을 구축한다면, 다중 GPU 혹은 다중 서버를 지원하는지의 여부도 중요할 것이다. 또한 딥러닝 모형을 처음 학습하는 경우에는 사용설명서가 많은지 예제 프로그램이 많은지 여부도 중요한 기준이 될 것이다.

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

유전자 알고리즘을 이용한 다분류 SVM의 최적화: 기업신용등급 예측에의 응용 (Optimization of Multiclass Support Vector Machine using Genetic Algorithm: Application to the Prediction of Corporate Credit Rating)

  • 안현철
    • 경영정보학연구
    • /
    • 제16권3호
    • /
    • pp.161-177
    • /
    • 2014
  • 기업신용등급은 금융시장의 신뢰를 구축하고 거래를 활성화하는데 있어 매우 중요한 요소로서, 오래 전부터 학계에서는 보다 정확한 기업신용등급 예측을 가능케 하는 다양한 모형들을 연구해 왔다. 구체적으로 다중판별분석(Multiple Discriminant Analysis, MDA)이나 다항 로지스틱 회귀분석(multinomial logistic regression analysis, MLOGIT)과 같은 통계기법을 비롯해, 인공신경망(Artificial Neural Networks, ANN), 사례기반추론(Case-based Reasoning, CBR), 그리고 다분류 문제해결을 위해 확장된 다분류 Support Vector Machines(Multiclass SVM)에 이르기까지 다양한 기법들이 학자들에 의해 적용되었는데, 최근의 연구결과들에 따르면 이 중에서도 다분류 SVM이 가장 우수한 예측성과를 보이고 있는 것으로 보고되고 있다. 본 연구에서는 이러한 다분류 SVM의 성능을 한 단계 더 개선하기 위한 대안으로 유전자 알고리즘(GA, Genetic Algorithm)을 활용한 최적화 모형을 제안한다. 구체적으로 본 연구의 제안모형은 유전자 알고리즘을 활용해 다분류 SVM에 적용되어야 할 최적의 커널 함수 파라미터값들과 최적의 입력변수 집합(feature subset)을 탐색하도록 설계되었다. 실제 데이터셋을 활용해 제안모형을 적용해 본 결과, MDA나 MLOGIT, CBR, ANN과 같은 기존 인공지능/데이터마이닝 기법들은 물론 지금까지 가장 우수한 예측성과를 보이는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안모형이 더 우수한 예측성과를 보임을 확인할 수 있었다.

인터넷 기반 중재프로그램을 통한 성인 당뇨 환자의 HbA1c 중재효과: 메타분석 (Effectiveness of Internet-based Interventions on HbA1c Levels in Adult Patients with Diabetes: A Meta-Analysis of Randomized Controlled Trials)

  • 정창숙;노현정;구민정;김이영;이순영
    • Journal of health informatics and statistics
    • /
    • 제43권4호
    • /
    • pp.307-317
    • /
    • 2018
  • 목적: 본 연구의 목적은 메타분석을 이용하여 2000년 이후 국내외 당뇨병을 가진 성인을 대상으로 수행된 인터넷 기반 중재 프로그램의 효과를 검증하고 실무 적용의 타당성을 확인하기 위함이다. 방법: 2000년 1월부터 2015년 12월까지 시행된 연구 중 국내외 학술지에 게재된 연구 논문을 대상으로 체계적 검토를 시행하였으며, 이중 분석 대상 기준에 적합한 최종 9편의 논문을 선정하였다. 자료 분석은 Internet-based Intervention의 실험군과 대조군에 따른 효과성을 파악하기 위하여 오픈 소스 통계 소프트웨어인 R 3.5.0을 사용하여 분석하였다. 결과: 분석 결과 성인 당뇨 환자의 HbA1c 조절을 위한 인터넷 기반 중재 프로그램의 효과 크기에 관한 연구는 국외 8편, 국내 1편이었다. 연구에 사용된 중재는 Internet-based Management가 7편(77.8%)으로 가장 많았고, Internet-based Education이 2편(22.2%)이었으며, 중재 프로그램 적용기간은 6개월이 4편(33.4%)으로 가장 많았다. 선행연구와의 중재 효과 비교에서는 모바일 전용 중재에서의 HbA1c 조절에 대한 가중평균 차이(WMD -0.20%, 95% CI: -0.43-0.03; p = 0.09)의 효과는 통계적으로 유의하지 않았으며, 모바일과 인터넷을 기반으로 한 중재를 통합했을 경우 가중평균 차이(WMD 0.54%, 95% CI: 0.72-0.37; p< 0.001)의 효과를 나타냈다. 본 연구의 메타분석 결과에서도 인터넷을 기반으로 한 중재활동에서 통계적으로 유의한 효과를 보였다. 중재기간에 따른 효과 크기 분석 결과에서는 약 89%인 8편에서 3개월, 6개월, 12개월 모두 인터넷을 기반으로 한 중재활동 시행 시, 실험군에서 높은 효과를 보였으나, 중재 지속 기간의 증가에 따라 중재 효과는 감소하는 경향을 나타내었다. 결론: 본 연구의 결과에서는 인터넷 기반 중재 프로그램의 효과를 확인할 수 있었으며, 이는 인터넷을 기반으로 한 중재활동이 성인의 대표적 만성질환인 당뇨관리를 위한 HbA1c 및 혈당조절에 효과적임을 의미한다. 이와 함께 만성질환인 당뇨의 꾸준한 관리를 위한 인터넷 중재 프로그램의 활용 방안에 대한 연구와 중재활동의 구체적인 지침, 프로토콜 수립의 필요성이 제기된다.

PaaS 클라우드 컴퓨팅 환경에서 전자정부 표준프레임워크 성능평가: 공간영상 정보처리 사례 (A Performance Evaluation of the e-Gov Standard Framework on PaaS Cloud Computing Environment: A Geo-based Image Processing Case)

  • 김광섭;이기원
    • 한국지리정보학회지
    • /
    • 제21권4호
    • /
    • pp.1-13
    • /
    • 2018
  • 클라우드 컴퓨팅 서비스 모델 중 하나인 PaaS(Platform as a Service)와 행정안전부 전자정부 표준프레임워크는 모두 웹 서비스 개발자가 개발 목적을 만족하는 핵심 기능 개발에 집중할 수 있도록 기본 공통자원을 제공하기 위한 컴퓨팅 환경이다. 웹 기반 공간정보 서비스를 구축하는 경우에도 이러한 기술들을 사용하면 미들웨어 소프트웨어 또는 플랫폼 공통 기능들을 바로 활용할 수 있다. 그러나 공간정보 서비스 개발 분야에서 이러한 기반 기술들의 적용 가능성을 검토하거나 적용 시스템의 성능을 평가한 연구는 아직 발표된 사례가 없다. 따라서 이번 연구에서는 공간정보 서비스에 대한 적용 가능성을 살펴보고자 성능평가 실험을 수행하였다. 실험 대상 시스템은 OGC WPS 2.0 표준을 적용한 공간영상 정보처리 서비스를 대상으로 하였다. 실험 시스템은 Cloud Foundry 오픈소스를 이용한 PaaS 환경을 구축한 뒤 전자정부 표준프레임워크를 적용한 웹 서비스로 설계, 구축하였다. 실제 성능 평가실험은 영상처리 기능을 PaaS 클라우드 환경에서 구동하는 경우와 PaaS에 전자정부 표준프레임워크를 같이 적용한 경우를 비교하는 방식으로 수행하였다. 실험 조건은 300명과 500명에 해당하는 동시 사용자가 3,600초 동안 이 시스템에 접속하여 정보처리를 요청하고 실험 환경으로 구축한 웹 서비스가 이에 대하여 응답하는 시간을 기록하는 방식으로 하였다. 성능 측정 결과 PaaS 클라우드 환경에서 전자정부 표준프레임워크를 기반으로 시스템 구축하였을 때 성능이 우수한 것을 확인할 수 있었다. 앞으로 공공 부분의 웹 기반 공간정보 응용 서비스 구축에서 PaaS 클라우드 컴퓨팅과 전자정부 표준프레임워크가 중요한 요소가 될 것으로 기대한다.