• Title/Summary/Keyword: 바이오 데이터

Search Result 1,361, Processing Time 0.031 seconds

Strawberry Pests and Diseases Detection Technique Optimized for Symptoms Using Deep Learning Algorithm (딥러닝을 이용한 병징에 최적화된 딸기 병충해 검출 기법)

  • Choi, Young-Woo;Kim, Na-eun;Paudel, Bhola;Kim, Hyeon-tae
    • Journal of Bio-Environment Control
    • /
    • v.31 no.3
    • /
    • pp.255-260
    • /
    • 2022
  • This study aimed to develop a service model that uses a deep learning algorithm for detecting diseases and pests in strawberries through image data. In addition, the pest detection performance of deep learning models was further improved by proposing segmented image data sets specialized in disease and pest symptoms. The CNN-based YOLO deep learning model was selected to enhance the existing R-CNN-based model's slow learning speed and inference speed. A general image data set and a proposed segmented image dataset was prepared to train the pest and disease detection model. When the deep learning model was trained with the general training data set, the pest detection rate was 81.35%, and the pest detection reliability was 73.35%. On the other hand, when the deep learning model was trained with the segmented image dataset, the pest detection rate increased to 91.93%, and detection reliability was increased to 83.41%. This study concludes with the possibility of improving the performance of the deep learning model by using a segmented image dataset instead of a general image dataset.

On Building the Solar Dataset Form using the Kaggle Platform: The applicability of Machine Learning (캐글 플랫폼 활용한 태양광 데이터셋 형태 구축: 머신 러닝의 적용 가능성)

  • Ko, Ju-won;Park, Jung-jin;Park, Jin-woo;Oh, Do-hee;Kim, Mincheol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.05a
    • /
    • pp.255-258
    • /
    • 2022
  • As environmental pollution continues, attention on renewable energy is on the constant rise in recent days. Although various kinds of renewable energy such as solar, wind power and biomass energy have been generated in Jeju, opening and analyzing cases on related data seem insufficient. Therefore, this study is being conducted to deduce the variables which have high relation with solar panel&s output and to understand machine learning methods that can be applied to solar power generation data by utilizing Kaggle platform, which is actively used by a number of scientists. Then, it is planned to propose a form of solar power generation dataset by researching machine learning methods that could be applied to the data. To be specific, analyzing solar power generation data with the Kaggle platform, this study will provide complements on gathering solar power data in Jeju. This study is anticipated to be utilized on data analysis for developing the solar power industry in Jeju. That is, this study is expected to reveal the room for improvement inherent in existing open datasets in Jeju, so that they could be constructed in a suitable form for machine learning for AI analytics. Through this process, a method to increase efficiency of solar power generation is anticipated to be prepared.

  • PDF

Spine Information Search Service using Linked Data (링크드 데이터를 활용한 척추정보 검색 서비스)

  • Seo, Dong-Min;Lee, Seungwoo;Lee, Sang-Ho;Jung, Hanmin;Sung, Won-Kyung
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2013.05a
    • /
    • pp.73-74
    • /
    • 2013
  • 차세대 웹 기술인 시맨틱 웹(Semantic Web)이 각광을 받음에 따라, 시맨틱 웹과 관련된 다양한 기술들이 활발히 연구되고 있다. 특히, 시맨틱 웹의 핵심 사례인 링크드 데이터(Linked Data)는 웹으로 접근 가능한 형태의 URI로 시맨틱 데이터를 표현하고 서로 연결함으로써, 오픈 데이터로서 상호운용성 극대화 및 데이터의 통합을 용이하게 한다. 이는 바이오인포매틱스 기술 발전과 결합하여 웹에서 바로 이용 가능한 많은 의학 링크드 데이터 생산과 이를 활용한 다양한 의학용어 검색 서비스 개발 결과를 가져왔다. 하지만, 기존 의학용어 검색 서비스들은 각 기관이 보유하고 있는 의학정보를 기반으로 서비스되기 때문에 다양하고 정확한 정보를 얻기 위해서는 많은 시간과 노력을 투자해야 한다. 그래서 본 논문에서는 척추 분야 의학 관련 링크드 데이터를 활용해 정확도가 높고 확장이 용이한 척추정보 검색 서비스를 제안한다.

  • PDF

KoCED: English-Korean Critical Error Detection Dataset (KoCED: 윤리 및 사회적 문제를 초래하는 기계번역 오류 탐지를 위한 학습 데이터셋)

  • Sugyeong Eo;Suwon Choi;Seonmin Koo;Dahyun Jung;Chanjun Park;Jaehyung Seo;Hyeonseok Moon;Jeongbae Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.225-231
    • /
    • 2022
  • 최근 기계번역 분야는 괄목할만한 발전을 보였으나, 번역 결과의 오류가 불완전한 의미의 왜곡으로 이어지면서 사용자로 하여금 불편한 반응을 야기하거나 사회적 파장을 초래하는 경우가 존재한다. 특히나 오역에 의해 변질된 의미로 인한 경제적 손실 및 위법 가능성, 안전에 대한 잘못된 정보 제공의 위험, 종교나 인종 또는 성차별적 발언에 의한 파장은 실생활과 문제가 직결된다. 이러한 문제를 완화하기 위해, 기계번역 품질 예측 분야에서는 치명적 오류 감지(Critical Error Detection, CED)에 대한 연구가 이루어지고 있다. 그러나 한국어에 관련해서는 연구가 존재하지 않으며, 관련 데이터셋 또한 공개된 바가 없다. AI 기술 수준이 높아지면서 다양한 사회, 윤리적 요소들을 고려하는 것은 필수이며, 한국어에서도 왜곡된 번역의 무분별한 증식을 낮출 수 있도록 CED 기술이 반드시 도입되어야 한다. 이에 본 논문에서는 영어-한국어 기계번역 분야에서의 치명적 오류를 감지하는 KoCED(English-Korean Critical Error Detection) 데이터셋을 구축 및 공개하고자 한다. 또한 구축한 KoCED 데이터셋에 대한 면밀한 통계 분석 및 다국어 언어모델을 활용한 데이터셋의 타당성 실험을 수행함으로써 제안하는 데이터셋의 효용성을 면밀하게 검증한다.

  • PDF

Parallel Corpus Filtering and Korean-Optimized Subword Tokenization for Machine Translation (병렬 코퍼스 필터링과 한국어에 최적화된 서브 워드 분절 기법을 이용한 기계번역)

  • Park, Chanjun;kim, Gyeongmin;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.221-224
    • /
    • 2019
  • 딥러닝을 이용한 Neural Machine Translation(NMT)의 등장으로 기계번역 분야에서 기존의 규칙 기반,통계기반 방식을 압도하는 좋은 성능을 보이고 있다. 본 논문은 기계번역 모델도 중요하지만 무엇보다 중요한 것은 고품질의 학습데이터를 구성하는 일과 전처리라고 판단하여 이에 관련된 다양한 실험을 진행하였다. 인공신경망 기계번역 시스템의 학습데이터 즉 병렬 코퍼스를 구축할 때 양질의 데이터를 확보하는 것이 무엇보다 중요하다. 그러나 양질의 데이터를 구하는 일은 저작권 확보의 문제, 병렬 말뭉치 구축의 어려움, 노이즈 등을 이유로 쉽지 않은 상황이다. 본 논문은 고품질의 학습데이터를 구축하기 위하여 병렬 코퍼스 필터링 기법을 제시한다. 병렬 코퍼스 필터링이란 정제와 다르게 학습 데이터에 부합하지 않다고 판단되며 소스, 타겟 쌍을 함께 삭제 시켜 버린다. 또한 기계번역에서 무엇보다 중요한 단계는 바로 Subword Tokenization 단계이다. 본 논문은 다양한 실험을 통하여 한-영 기계번역에서 가장 높은 성능을 보이는 Subword Tokenization 방법론을 제시한다. 오픈 된 한-영 병렬 말뭉치로 실험을 진행한 결과 병렬 코퍼스 필터링을 진행한 데이터로 만든 모델이 더 좋은 BLEU 점수를 보였으며 본 논문에서 제안하는 형태소 분석 단위 분리를 진행 후 Unigram이 반영된 SentencePiece 모델로 Subword Tokenization를 진행 하였을 시 가장 좋은 성능을 보였다.

  • PDF

A Study on Data Linkage Between Public Data Portals and Individual Portals (공공데이터 포털과 개별 포털 간의 데이터 연계방안 연구)

  • Jin Ho, Park;Sang Woo, Han
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.33 no.4
    • /
    • pp.249-269
    • /
    • 2022
  • The Public Data Portal(data.go.kr) is a gateway for searching and using public data in South Korea. In 2021, the Ministry of Public Administration and Security established individual portal maintenance plans. Individual portals refer to portals built by public institutions in Korea other than the public data portal. According to the maintenance plan, the Korea Intelligence Information Society, the operator of the public data portal, needs to establish operating and data integration plans to link the public data portal and individual portals. In this study, we investigated the current operating status and data integration methods of the public data portal in South Korea, the United States, the United Kingdom, and France, and proposed that the adoption of a top-down approach is efficient when integrating data. In addition, we divided the specific procedures that should be pursued when integrating data into five stages: determination of data integration standard methods, analysis of metadata status, expansion of operating infrastructure, confirmation of data import, and launch of services.

Implementation of Secur ed Remote EMR Medical Information using Encryption Algorithm (암호화 알고리즘을 이용한 안전한 원격 EMR 의료정보 구현)

  • Yang, Jaesoo;Lee, You-Sik;Hong, Yousik
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.14 no.4
    • /
    • pp.133-139
    • /
    • 2014
  • Nowadays, telemedicine and remote prescription has been operating as a pilot basis. However, in case of remote hospitals without encrypting the biometric data transmission and its contents, the patient prescription data hacked from hackers who changed prescription medications can be serious obstacles to the patient. Therefore, in this paper, to solve this problem, password encryption, personal identification information, biometric data security on the patient's prescription and remote medical information system, and implementation of the encryption algorithm are proposed.

An Improvement of Personalized Computer Aided Diagnosis Probability for Smart Healthcare Service System (스마트 헬스케어 서비스를 위한 통계학적 개인 맞춤형 질병예측 기법의 개선)

  • Min, Byung-won
    • Journal of Convergence Society for SMB
    • /
    • v.6 no.4
    • /
    • pp.79-84
    • /
    • 2016
  • A novel diagnosis scheme PCADP(personalized computer aided diagnosis probability) is proposed to overcome the problems mentioned above. PCADP scheme is a personalized diagnosis method based on ontology and it makes the bio-data analysis just a 'process' in the Smart healthcare service system. In addition, we offer a semantics modeling of the smart healthcare ontology framework in order to describe smart healthcare data and service specifications as meaningful representations based on this PCADP. The PCADP scheme is a kind of statistical diagnosis method which has real-time processing, characteristics of flexible structure, easy monitoring of decision process, and continuous improvement.

대기압 저온 아르곤 플라즈마 제트의 분광 분석

  • Han, Guk-Hui;Kim, Yun-Jung;Kim, Jung-Gil;Kim, Yeon-Jeong;Jo, Hyeon;Jo, Gwang-Seop
    • Proceedings of the Korean Vacuum Society Conference
    • /
    • 2016.02a
    • /
    • pp.191-191
    • /
    • 2016
  • 대기압 저온 Ar 플라즈마 제트에서 발생되는 플라즈마에 대해 연구하였다. 플라즈마 제트의 본체는 주사기 바늘, 유리관 그리고 테프론 튜브로 구성되어 있다. 바늘의 앞부분은 유리관에 삽입되어 있으며 바늘의 뒷부분은 테프론 튜브와 연결되어 있다. 주사기 바늘에는 수십 kHz의 사인파를 발생시키는 DC-AC 인버터로 수 kV의 고전압을 인가해준다. 기체는 테프론 튜브를 통해 바늘의 안쪽으로 흐른다. 사용 기체는 Ar이며 유량은 3 lpm이다. 주사기 바늘형 전극의 내경은 1.3 mm, 외경은 1.8 mm, 총 길이는 39.0 mm이며 재질은 스테인레스강이다. 유리관의 내경은 2.0 mm, 외경은 2.4 mm, 총 길이는 80.0 mm이다. 자외선-근적외선 분광계를 이용하여 대기압 저온 Ar 플라즈마 제트에서 발생된 플라즈마의 분광 분석을 하였다. 플라즈마 제트에서 발생되는 플라즈마의 휘도는 대략 $10{\sim}30cd/m^2$이다. 플라즈마의 측정 위치, 플라즈마 제트의 입력 전압과 입력 전류, 기체 종류 등의 변수에 따른 분광 실험을 하였으며 이를 통해 얻은 분광 데이터를 일반적인 볼츠만 기울기법에 대입하여 플라즈마의 들뜸 온도를 측정하였다. 또한 Ar 플라즈마 제트의 분광 데이터를 수정된 볼츠만 기울기법에 대입하여 플라즈마의 전자 온도를 측정하였다. 이는 바이오-의료용 플라즈마 및 플라즈마 공정 등의 다양한 응용 분야에서 유용하게 활용할 수 있을 것이다.

  • PDF

Developing RDF Meta data Graph for Transportation Open Data Platform (교통데이터 유통을 위한 RDF 메타 데이터 그래프 구축방안)

  • Park, Eun Mi;Kang, Jung Hyun
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.20 no.6
    • /
    • pp.110-116
    • /
    • 2021
  • W3C enacted RDF(Resource Description Framework based DCAT meta data standard, which is world-widely accepted so far. To guarantee the inter-operability and integrity of data from various sources and even from various countries, it is considered that transportation meta data should also follow the DCAT standard. But still, to represent the transportation domain-specific features, it is necessary to define new properties and vocabularies in addition to the DCAT standard. This research identified the additional properties and vocabularies for transportation metadata, considering uniqueness of transportation data. The revised RDF schema and RDF graph proposed in this research should be able to lead the transportation open data platform revitalization.