• 제목/요약/키워드: Natural language process

검색결과 244건 처리시간 0.024초

한의진단 Ontology 구축과 평가 (Development and Evaluation of Ontology for Diagnosis in Oriental Medicine)

  • 신상우;정길산;박경모;김선호;박종현
    • 동의생리병리학회지
    • /
    • 제20권1호
    • /
    • pp.202-208
    • /
    • 2006
  • The goal of this study is to develop knowledge representation method for the construction and evaluation of ontology for diagnosis in oriental medicine. To develop the expert system for decision making on diagnosis and treatment, the systematic and structural knowledge which can be processible in EMR(Electronic Medical Record) must be precedent, and the Computational Process which control the system as well. This study set up an ontology as a trial model to represent the oriental medical knowledge into the machine processible one. Protege 2.1 has been used to build the ontology, and the serialization format of our ontology is the XML document based on OWL. The components of oriental medical diagnosis was arranged with the combination of symptoms which belong to the certain symptom patterns. Then natural language which expresses the oriental medical diagnosis components were converted into the logical sentence, and individual characteristic symptoms into each values of specific properties. In addition to the study, the diagnosis software for oriental medicine was developed and it used the ontology which we developed. Sequently, we tested the software to confirm the appropriateness of ontology. The result of the test shows that diagnostic questions are automatically formulated according to the diagnosis components of this ontology and that as such diagnostic results are induced. Therefore, the ontology system in this study will be efficient to develop the diagnosis program and useful as a tool for doctors to make decision. But, it is not recommendable to apply the system to the clinical environment until the clear diagnosis standards are introduced, and the more reliable diagnosis program can be developed based on the more appropriate ontology mentioned above.

병렬 말뭉치 필터링을 적용한 Filter-mBART기반 기계번역 연구 (Filter-mBART Based Neural Machine Translation Using Parallel Corpus Filtering)

  • 문현석;박찬준;어수경;박정배;임희석
    • 한국융합학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-7
    • /
    • 2021
  • 최신 기계번역 연구 동향을 살펴보면 대용량의 단일말뭉치를 통해 모델의 사전학습을 거친 후 병렬 말뭉치로 미세조정을 진행한다. 많은 연구에서 사전학습 단계에 이용되는 데이터의 양을 늘리는 추세이나, 기계번역 성능 향상을 위해 반드시 데이터의 양을 늘려야 한다고는 보기 어렵다. 본 연구에서는 병렬 말뭉치 필터링을 활용한 mBART 모델 기반의 실험을 통해, 더 적은 양의 데이터라도 고품질의 데이터라면 더 좋은 기계번역 성능을 낼 수 있음을 보인다. 실험결과 병렬 말뭉치 필터링을 거친 사전학습모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 본 실험결과를 통해 데이터의 양보다 데이터의 질을 고려하는 것이 중요함을 보이고, 해당 프로세스를 통해 추후 말뭉치 구축에 있어 하나의 가이드라인으로 활용될 수 있음을 보였다.

지식베이스를 이용한 작업자 증상 기반 화학물질 추정 시스템 설계 (Worker Symptom-based Chemical Substance Estimation System Design Using Knowledge Base)

  • 주용택;이동훈;신은지;유상우;신동일
    • 한국가스학회지
    • /
    • 제25권3호
    • /
    • pp.9-15
    • /
    • 2021
  • 본 논문에서는 산업현장 화학물질 인체 접촉 증상 기반 지식베이스 구축 및 화학물질 추정 시스템 설계에 대한 연구이다. 미국NIH에서 제공하는 WISER 프로그램의 499개의 화학물질 접촉 증상 정보로 활용하였다. 지식베이스 구축을 위해 AllegroGraph 7.0.1 프로그램을 이용하였으며 입력된 Chemical structure로 Triple 값인 Cas No., Synonyms, Symptom, SMILES, InChl, Formula를 사용 하였다. 또한 작업자의 증상을 안내하는 방법은 AI 스피커를 활용한 방식이 가능하며 지식베이스 구축 결과 암모니아(CAS No: 7664-41-7)를 기준으로 39개의 증상이 WISER 프로그램과 동일함을 확인 하였다. 이를 통해 화학물질 추정 시스템의 증상 추출 과정에 지식베이스 구축이 가능하였다.

지도학습 머신러닝 기반 카테고리 목록 분류 및 추천 시스템 구현 (Development of Supervised Machine Learning based Catalog Entry Classification and Recommendation System)

  • 이형우
    • 인터넷정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.57-65
    • /
    • 2019
  • 200 만명 이상의 회원을 보유하고 있는 "도매꾹" B2B 온라인 쇼핑몰인 경우70% 이상의 시장 점유율로 하루에 80만개 이상의 아이템이 판매되고 있다. 하지만, 동일하거나 유사한 물품이 서로 다른 카탈로그 엔트리에 저장 및 등록되어 있기 때문에 구매자가 아이템을 검색하는 과정에서 어려움을 느끼며 B2B 대형 쇼핑몰 관리에도 문제점이 발생하고 있다. 따라서 이에 대한 해결 방안으로 본 연구에서는 대단위 쇼핑몰 구매 정보를 기반으로 지도-학습 머신러닝 기법을 적용하여 상품에 대한 카탈로그 목록 자동 분류 및 추천 시스템을 개발하였다. 구체적으로 판매자가 자연어 형태로 물품 등록 정보를 입력하면 KoNLPy 형태소 분석 과정을 수행하였으며, Naïve Bayes 분류 방식을 응용하여 물품에 가장 적합한 카탈로그 정보를 자동으로 추천해주는 시스템을 구현하였다. 정확도가 향상된 카테고리 목록을 구축하여 결과적으로 검색 속도와 쇼핑몰 매출을 향상시키는 효과가 있었다.

음표 임베딩과 마디 임베딩을 이용한 곡의 생성 및 정량적 평가 방법 (Creating Songs Using Note Embedding and Bar Embedding and Quantitatively Evaluating Methods)

  • 이영배;정성훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.483-490
    • /
    • 2021
  • 인공신경망을 이용해서 기존 곡을 학습시키고 새로운 곡을 생성하기 위해서는 전처리 과정으로 곡을 신경망이 인식할 수 있는 숫자로 변환해야 하며, 지금까지는 원-핫 인코딩이 사용되어 왔다. 본 논문에서는 음표 임베딩과 마디 임베딩을 제안하고 기존의 원-핫 인코딩과 성능을 비교하였다. 성능비교는 어떤 방식이 작곡가가 작곡한 곡과 유사한 곡을 생성하는지를 정량적 평가에 근거해서 수행하였으며, 평가방법으로는 자연어 처리 분야에서 사용되는 정량적 평가 방법들을 이용하였다. 평가결과 마디 임베딩으로 생성한 곡이 가장 좋았으며 그 다음으로 음표 임베딩이 좋았다. 이는 본 논문에서 제안한 음표 임베딩과 마디 임베딩이 원-핫 인코딩보다 작곡가가 작곡한 곡과 유사한 곡을 생성한 것으로서 의의가 있다.

System for Supporting the Decision about the Possibility of Concluding the Civil Law Agreements for Medical, Therapeutic and Dental Services

  • Hnatchuk, Yelyzaveta;Hovorushchenko, Tetiana;Shteinbrekher, Daria;Kysil, Tetiana
    • International Journal of Computer Science & Network Security
    • /
    • 제22권10호
    • /
    • pp.155-164
    • /
    • 2022
  • The review of known decisions showed that currently there are no systems and technologies for supporting the decision about the possibility of concluding the civil law agreements for medical, therapeutic and dental services. The paper models the decision-making support process on the possibility of concluding the civil law agreements for medical, therapeutic and dental services, which is the theoretical basis for the development of rules, methods and system for supporting the decision about the possibility of concluding the civil law agreements for medical, therapeutic and dental services. The paper also developed the system for supporting the decision about the possibility of concluding the civil law agreements for medical, therapeutic and dental services, which automatically and free determines the possibility or impossibility of concluding the corresponding civil law agreement for the provision of a corresponding medical service. In the case of formation of a conclusion about the possibility of concluding the agreement, further conclusion and signing of the corresponding agreement takes place. In the case of forming a conclusion about the impossibility of concluding the agreement, a request is made for finalizing the relevant agreement for the provision of the relevant medical service, indicating the reasons for the impossibility of concluding the agreement - missing essential conditions in the agreement. After finalization, the agreement can be analyzed again by the developed system for supporting the decision.

Technology of Decision-Making Support Regarding the Possibility of Donation and Transplantation Considering Civil Law

  • Hnatchuk, Yelyzaveta;Hovorushchenko, Tetiana;Drapak, Georgii;Kysil, Tetiana
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.307-315
    • /
    • 2022
  • The review of known decision-making support systems and technologies regarding the possibility of donation and transplantation showed that currently there are no systems and technologies of decision-making support regarding the possibility of donation and transplantation considering civil law. The paper models the decision-making support process regarding the possibility of donation and transplantation, which is a theoretical basis for the development of rules, methods and technology of decision-making support regarding the possibility of donation and transplantation considering civil law. The paper also developed the technology of decision-making support regarding the possibility of donation and transplantation considering civil law as a component of the Unified State Information System for Organ and Tissue Transplantation, which automatically and free of charge determines the possibility/impossibility of donation and transplantation. In the case of the possibility of donation, the admissible type of donation is also determined - over-life or after-life donation - and data about potential donor is entered in the relevant Donor Register. In the case of the possibility of transplantation, if the recipient needs a transplant of one of the paired organs or a part of the organ/tissue, then data about potential recipient are entered in the Transplantation List from both over-life and after-life donor, otherwise, if the recipient needs a transplant of a non-paired organ or both paired organs, then data about potential recipient are entered only in the Transplantation List from after-life donor.

리뷰 정보를 활용한 이용자의 선호요인 식별에 관한 연구 (Identification of User Preference Factor Using Review Information)

  • 송성전;심지영
    • 정보관리학회지
    • /
    • 제39권3호
    • /
    • pp.311-336
    • /
    • 2022
  • 본 연구는 도서관 정보서비스 환경에서 도서 이용자의 도서추천에 영향을 미치는 선호요인을 파악하기 위해 전 세계 도서 이용자의 참여로 이루어지는 사회적 목록 서비스인 Goodreads 리뷰 데이터를 대상으로 내용분석하였다. 이용자 선호의 내용을 보다 세부적인 관점에서 파악하기 위해 샘플 선정 과정에서 평점 그룹별, 도서별, 이용자별 하위 데이터 집합을 구성하였으며, 다양한 토픽을 고루 반영하기 위해 리뷰 텍스트의 토픽모델링 결과에 기반하여 층화 샘플링을 수행하였다. 그 결과, '내용', '캐릭터', '글쓰기', '읽기', '작가', '스토리', '형식'의 7개 범주에 속하는 총 90개 선호요인 관련 개념을 식별하는 한편, 평점에 따라 드러나는 일반적인 선호요인은 물론 호불호가 분명한 도서와 이용자에서 드러나는 선호요인의 양상을 파악하였다. 본 연구의 결과는 이용자 선호요인의 구체적 양상을 파악하여 향후 추천시스템 등에서 보다 정교한 추천에 기여할 수 있을 것으로 보인다.

초·중등 인공지능 교육을 위한 데이터 리터러시 정의 연구 (A Study on the Definition of Data Literacy for Elementary and Secondary Artificial Intelligence Education)

  • 김슬기;김태영
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2021년도 학술논문집
    • /
    • pp.59-67
    • /
    • 2021
  • AI 기술의 발달은 우리 삶의 큰 변화를 가져왔다. 생활 속에서부터 사회, 경제에 이르기 까지 AI의 영향력이 커짐에 따라 AI와 데이터에 대한 교육에 대한 중요성이 함께 커지고 있다. 특히 OECD 교육 연구 보고서 및 다양한 국내 정보과 교육과정 연구에서 데이터와 데이터 리터러시를 다루고 필수 역량으로 제시하고 있다. 국내외 연구를 살펴 보면 데이터 리터러시에 대한 정의는 연구자들 마다 그 구체적인 내용과 범위가 다른 것을 알 수 있다. 이에 데이터 리터러시 관련 주요 연구의 정의를 다각도로 분석하여 도출하고자 하였다. 주요 연구에서 데이터 리터러시를 정의를 하는데 사용된 단어 빈도 분석과 함께 Word2vec 자연어 처리 방법을 활용하여 의미 유사도를 분석하고 교육과정 연구의 내용요소를 바탕으로 최종적으로 유목화하여 '데이터를 읽고 쓸 수 있으며, 실생활의 문제를 해결하기 위해 데이터를 이해하고 사용하여 정보로 처리하는 지식 구성의 기초 능력' 의 정의를 도출하였다. 본 연구를 통해 도출된 데이터 리터러시의 정의를 바탕으로 내용이 수정 보완되고 더 많은 연구가 이루어져 학생들의 미래 역량을 키워주는 교육 연구에 좋은 기초 자료가 될 수 있기를 기대한다.

  • PDF

북스캔을 이용한 도서 손상 단계에 따른 딥 러닝 기반 도서 복구 방법에 관한 연구 (A Study on Book Recovery Method Depending on Book Damage Levels Using Book Scan)

  • 석경호;이주희;박병찬;김석윤;김영모
    • 반도체디스플레이기술학회지
    • /
    • 제22권4호
    • /
    • pp.154-160
    • /
    • 2023
  • Recently, with the activation of eBook services, books are being published simultaneously as physical books and digitized eBooks. Paper books are more expensive than e-books due to printing and distribution costs, so demand for relatively inexpensive e-books is increasing. There are cases where previously published physical books cannot be digitized due to the circumstances of the publisher or author, so there is a movement among individual users to digitize books that have been published for a long time. However, existing research has only studied the advancement of the pre-processing process that can improve text recognition before applying OCR technology, and there are limitations to digitization depending on the condition of the book. Therefore, support for book digitization services depending on the condition of the physical book is needed. need. In this paper, we propose a method to support digitalization services according to the status of physical books held by book owners. Create images by scanning books and extract text information from the images through OCR. We propose a method to recover text that cannot be extracted depending on the state of the book using BERT, a natural language processing deep learning model. As a result, it was confirmed that the recovery method using BERT is superior when compared to RNN, which is widely used in recommendation technology.

  • PDF