• 제목/요약/키워드: 바이오 데이터

검색결과 1,361건 처리시간 0.03초

딥러닝을 이용한 병징에 최적화된 딸기 병충해 검출 기법 (Strawberry Pests and Diseases Detection Technique Optimized for Symptoms Using Deep Learning Algorithm)

  • 최영우;김나은;볼라파우델;김현태
    • 생물환경조절학회지
    • /
    • 제31권3호
    • /
    • pp.255-260
    • /
    • 2022
  • 본 논문은 딥러닝 알고리즘을 이용하여 딸기 영상 데이터의 병충해 존재 여부를 자동으로 검출할 수 있는 서비스 모델을 제안한다. 또한 병징에 특화된 분할 이미지 데이터 세트를 제안하여 딥러닝 모델의 병충해 검출 성능을 향상한다. 딥러닝 모델은 CNN 기반 YOLO를 선정하여 기존의 R-CNN 기반 모델의 느린 학습속도와 추론속도를 개선하였다. 병충해 검출 모델을 학습하기 위해 일반적인 데이터 세트와 제안하는 분할 이미지 데이터 세트를 구축하였다. 딥러닝 모델이 일반적인 학습 데이터 세트를 학습했을 때 병충해 검출률은 81.35%이며 병충해 검출 신뢰도는 73.35%이다. 반면 딥러닝 모델이 분할 이미지 학습 데이터 세트를 학습했을 때 병충해 검출률은 91.93%이며 병충해 검출 신뢰도는 83.41%이다. 따라서 분할 이미지 데이터를 학습한 딥러닝 모델의 성능이 우수하다는 것을 증명할 수 있었다.

캐글 플랫폼 활용한 태양광 데이터셋 형태 구축: 머신 러닝의 적용 가능성 (On Building the Solar Dataset Form using the Kaggle Platform: The applicability of Machine Learning)

  • 고주원;박정진;박진우;오도희;김민철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.255-258
    • /
    • 2022
  • 최근 환경 오염이 지속되면서 신재생 에너지에 대한 사람들의 관심이 높아지고 있다. 제주 지역은 태양광, 태양열, 바이오, 풍력 발전 등 신재생 에너지 발전이 많이 이루어지고 있지만, 그에 비하여 관련 데이터의 개방과 분석 사례는 부족한 상황이다. 이에 본 연구에서는 전 세계 데이터 사이언티스트(Data Scientists)들이 활동하고 있는 캐글(Kaggle) 플랫폼을 활용하여 태양광 생산량과 관련된 변수를 추출하고, 데이터에 적용할 수 있는 머신러닝(Machine Learning) 기법을 탐구하여 머신 러닝 설계를 위한 제주 지역의 태양광 발전 데이터셋(Dataset) 형태(Form)를 제시하고자 한다. 구체적으로는 캐글 데이터 플랫폼을 활용하여 태양광 에너지 분석을 진행한 후 제주 지역 태양광 데이터 수집에 대한 보완점을 제안할 수 있다. 이러한 시도는 제주 지역의 태양광 산업의 발전을 위한 데이터 분석에 활용이 가능할 것으로 기대할 수 있다. 즉, 현재 개방되어 있는 제주 지역의 태양광 발전 데이터셋 형태를 인공지능(Artificial Intelligent) 분석을 위한 머신러닝에 적합한 형태로 구축이 될 수 있도록 제안할 수 있다. 이를 통하여 제주 지역 태양광 산업의 발전의 효율을 높이는 방안을 마련하는데 기반 연구가 될 것이다.

  • PDF

링크드 데이터를 활용한 척추정보 검색 서비스 (Spine Information Search Service using Linked Data)

  • 서동민;이승우;이상호;정한민;성원경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
    • /
    • pp.73-74
    • /
    • 2013
  • 차세대 웹 기술인 시맨틱 웹(Semantic Web)이 각광을 받음에 따라, 시맨틱 웹과 관련된 다양한 기술들이 활발히 연구되고 있다. 특히, 시맨틱 웹의 핵심 사례인 링크드 데이터(Linked Data)는 웹으로 접근 가능한 형태의 URI로 시맨틱 데이터를 표현하고 서로 연결함으로써, 오픈 데이터로서 상호운용성 극대화 및 데이터의 통합을 용이하게 한다. 이는 바이오인포매틱스 기술 발전과 결합하여 웹에서 바로 이용 가능한 많은 의학 링크드 데이터 생산과 이를 활용한 다양한 의학용어 검색 서비스 개발 결과를 가져왔다. 하지만, 기존 의학용어 검색 서비스들은 각 기관이 보유하고 있는 의학정보를 기반으로 서비스되기 때문에 다양하고 정확한 정보를 얻기 위해서는 많은 시간과 노력을 투자해야 한다. 그래서 본 논문에서는 척추 분야 의학 관련 링크드 데이터를 활용해 정확도가 높고 확장이 용이한 척추정보 검색 서비스를 제안한다.

  • PDF

KoCED: 윤리 및 사회적 문제를 초래하는 기계번역 오류 탐지를 위한 학습 데이터셋 (KoCED: English-Korean Critical Error Detection Dataset)

  • 어수경;최수원;구선민;정다현;박찬준;서재형;문현석;박정배;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.225-231
    • /
    • 2022
  • 최근 기계번역 분야는 괄목할만한 발전을 보였으나, 번역 결과의 오류가 불완전한 의미의 왜곡으로 이어지면서 사용자로 하여금 불편한 반응을 야기하거나 사회적 파장을 초래하는 경우가 존재한다. 특히나 오역에 의해 변질된 의미로 인한 경제적 손실 및 위법 가능성, 안전에 대한 잘못된 정보 제공의 위험, 종교나 인종 또는 성차별적 발언에 의한 파장은 실생활과 문제가 직결된다. 이러한 문제를 완화하기 위해, 기계번역 품질 예측 분야에서는 치명적 오류 감지(Critical Error Detection, CED)에 대한 연구가 이루어지고 있다. 그러나 한국어에 관련해서는 연구가 존재하지 않으며, 관련 데이터셋 또한 공개된 바가 없다. AI 기술 수준이 높아지면서 다양한 사회, 윤리적 요소들을 고려하는 것은 필수이며, 한국어에서도 왜곡된 번역의 무분별한 증식을 낮출 수 있도록 CED 기술이 반드시 도입되어야 한다. 이에 본 논문에서는 영어-한국어 기계번역 분야에서의 치명적 오류를 감지하는 KoCED(English-Korean Critical Error Detection) 데이터셋을 구축 및 공개하고자 한다. 또한 구축한 KoCED 데이터셋에 대한 면밀한 통계 분석 및 다국어 언어모델을 활용한 데이터셋의 타당성 실험을 수행함으로써 제안하는 데이터셋의 효용성을 면밀하게 검증한다.

  • PDF

병렬 코퍼스 필터링과 한국어에 최적화된 서브 워드 분절 기법을 이용한 기계번역 (Parallel Corpus Filtering and Korean-Optimized Subword Tokenization for Machine Translation)

  • 박찬준;김경민;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.221-224
    • /
    • 2019
  • 딥러닝을 이용한 Neural Machine Translation(NMT)의 등장으로 기계번역 분야에서 기존의 규칙 기반,통계기반 방식을 압도하는 좋은 성능을 보이고 있다. 본 논문은 기계번역 모델도 중요하지만 무엇보다 중요한 것은 고품질의 학습데이터를 구성하는 일과 전처리라고 판단하여 이에 관련된 다양한 실험을 진행하였다. 인공신경망 기계번역 시스템의 학습데이터 즉 병렬 코퍼스를 구축할 때 양질의 데이터를 확보하는 것이 무엇보다 중요하다. 그러나 양질의 데이터를 구하는 일은 저작권 확보의 문제, 병렬 말뭉치 구축의 어려움, 노이즈 등을 이유로 쉽지 않은 상황이다. 본 논문은 고품질의 학습데이터를 구축하기 위하여 병렬 코퍼스 필터링 기법을 제시한다. 병렬 코퍼스 필터링이란 정제와 다르게 학습 데이터에 부합하지 않다고 판단되며 소스, 타겟 쌍을 함께 삭제 시켜 버린다. 또한 기계번역에서 무엇보다 중요한 단계는 바로 Subword Tokenization 단계이다. 본 논문은 다양한 실험을 통하여 한-영 기계번역에서 가장 높은 성능을 보이는 Subword Tokenization 방법론을 제시한다. 오픈 된 한-영 병렬 말뭉치로 실험을 진행한 결과 병렬 코퍼스 필터링을 진행한 데이터로 만든 모델이 더 좋은 BLEU 점수를 보였으며 본 논문에서 제안하는 형태소 분석 단위 분리를 진행 후 Unigram이 반영된 SentencePiece 모델로 Subword Tokenization를 진행 하였을 시 가장 좋은 성능을 보였다.

  • PDF

공공데이터 포털과 개별 포털 간의 데이터 연계방안 연구 (A Study on Data Linkage Between Public Data Portals and Individual Portals)

  • 박진호 ;한상우
    • 한국비블리아학회지
    • /
    • 제33권4호
    • /
    • pp.249-269
    • /
    • 2022
  • 공공데이터 포털(data.go.kr)은 우리나라 공공데이터 검색과 활용을 위한 통합창구이다. 2021년 행정안전부는 개별 포털 정비방안을 수립한 바 있다. 개별 포털은 공공데이터 외 국내 공공기관들이 구축한 포털을 통칭하는 표현이다. 정비방안에 따라 공공데이터 포털 운영 주체인 한국지능정보사회진흥원은 공공데이터 포털과 개별 포털을 연계하기 위한 운영 및 데이터 연계방안 수립이 필요하다. 이에 본 연구에서는 우리나라 공공데이터 포털, 미국, 영국, 프랑스 데이터 포털 운영현황과 데이터 연계방식을 조사하여 데이터 연계 시 상향식 방법 채택이 효율적임을 제안하였다. 또한, 연계 시 추진해야 하는 구체적인 절차를 데이터 연동 표준방식 결정, 메타데이터 현황분석, 운영 인프라 확충, 데이터 반입 확인, 서비스 개시 5단계로 나누어 제시하였다.

암호화 알고리즘을 이용한 안전한 원격 EMR 의료정보 구현 (Implementation of Secur ed Remote EMR Medical Information using Encryption Algorithm)

  • 양재수;이유식;홍유식
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.133-139
    • /
    • 2014
  • 요즈음, 원격 처방전 및 원격 진료가 시범적으로 운영되고 있다. 그러나 대부분의 원격지 병원에서 환자 생체 데이터를 암호화 하지 않고 전송하는 경우, 해커가 환자 처방전 데이터를 해킹해서 처방전 약물을 바꾸면 환자는 심각한 장애를 받을 수 있다. 따라서, 본 논문에서는, 이러한 문제점을 해결하기 위해 원격 처방전과 의료 정보시스템에 환자의 비밀번호, 개인 식별 정보, 바이오 정보 등을 암호화하는 알고리즘과 안전한 보안 구현 방안이 제시되었다.

스마트 헬스케어 서비스를 위한 통계학적 개인 맞춤형 질병예측 기법의 개선 (An Improvement of Personalized Computer Aided Diagnosis Probability for Smart Healthcare Service System)

  • 민병원
    • 중소기업융합학회논문지
    • /
    • 제6권4호
    • /
    • pp.79-84
    • /
    • 2016
  • 본 논문에서는 스마트 헬스케어 서비스 시스템의 바이오 데이터 분석 과정을 프로세스로 해석하기 위하여, 온톨로지 기반 통계학적 개인 맞춤형 질병예측 기법인 PCADP(Personalized Computer Aided Diagnosis Probability)를 제안하였다. 또한 이러한 개인 맞춤형 질병예측 기법을 바탕으로 스마트 헬스케어 데이터 및 헬스케어 서비스 명세의 의미 있는 표현을 위하여 헬스케어 온톨로지 프레임워크를 시맨틱스형으로 모델링하였다. PCADP 기법은 스마트 헬스케어 환경에서 개인 맞춤형 판별 기법이 갖추어야 할 조건인 실시간 처리, 유연한 구조, 판별과정의 모니터링, 지속적인 개선 등에 부합하는 통계학적 질병예측 기법임을 확인하였다.

대기압 저온 아르곤 플라즈마 제트의 분광 분석

  • 한국희;김윤중;김중길;김연정;조현;조광섭
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2016년도 제50회 동계 정기학술대회 초록집
    • /
    • pp.191-191
    • /
    • 2016
  • 대기압 저온 Ar 플라즈마 제트에서 발생되는 플라즈마에 대해 연구하였다. 플라즈마 제트의 본체는 주사기 바늘, 유리관 그리고 테프론 튜브로 구성되어 있다. 바늘의 앞부분은 유리관에 삽입되어 있으며 바늘의 뒷부분은 테프론 튜브와 연결되어 있다. 주사기 바늘에는 수십 kHz의 사인파를 발생시키는 DC-AC 인버터로 수 kV의 고전압을 인가해준다. 기체는 테프론 튜브를 통해 바늘의 안쪽으로 흐른다. 사용 기체는 Ar이며 유량은 3 lpm이다. 주사기 바늘형 전극의 내경은 1.3 mm, 외경은 1.8 mm, 총 길이는 39.0 mm이며 재질은 스테인레스강이다. 유리관의 내경은 2.0 mm, 외경은 2.4 mm, 총 길이는 80.0 mm이다. 자외선-근적외선 분광계를 이용하여 대기압 저온 Ar 플라즈마 제트에서 발생된 플라즈마의 분광 분석을 하였다. 플라즈마 제트에서 발생되는 플라즈마의 휘도는 대략 $10{\sim}30cd/m^2$이다. 플라즈마의 측정 위치, 플라즈마 제트의 입력 전압과 입력 전류, 기체 종류 등의 변수에 따른 분광 실험을 하였으며 이를 통해 얻은 분광 데이터를 일반적인 볼츠만 기울기법에 대입하여 플라즈마의 들뜸 온도를 측정하였다. 또한 Ar 플라즈마 제트의 분광 데이터를 수정된 볼츠만 기울기법에 대입하여 플라즈마의 전자 온도를 측정하였다. 이는 바이오-의료용 플라즈마 및 플라즈마 공정 등의 다양한 응용 분야에서 유용하게 활용할 수 있을 것이다.

  • PDF

교통데이터 유통을 위한 RDF 메타 데이터 그래프 구축방안 (Developing RDF Meta data Graph for Transportation Open Data Platform)

  • 박은미;강정현
    • 한국ITS학회 논문지
    • /
    • 제20권6호
    • /
    • pp.110-116
    • /
    • 2021
  • W3C(World Wide Web Consortium)에서는 DCAT(Data Catalog Vocabulary)이라는 RDF(Resource Description Framework) 기반의 메타 데이터 표준을 제시한 바 있고 세계 각국에서 적용되고 있다. DCAT은 웹에서 발행된 데이터 카탈로그 간의 상호운용성 향상을 위해 설계된 RDF 어휘로 W3C에서 2014년 웹 표준으로 권고 승인되었다. 상호운용성 및 통합성을 고려할 때, 교통부문의 메타 데이터도 RDF 기반의 DCAT 형식을 채택하되, 교통데이터 특성에 맞게 수정 보완하는 것이 필요할 것이다. 교통데이터의 복잡한 관계를 이용자가 직관적으로 이해할 수 있도록 하는 데에 RDF 그래프 형태의 시각화가 효과적일 것으로 판단된다. 본 연구에서는 RDF 기반의 메타 데이터 표준이 제정되고 광범위하게 사용되는 추세에 맞춰, 교통데이터에서 나타내어야 하는 데이터 간의 관계를 RDF 그래프 형식으로 표현하기 위한 어휘를 개발하고, RDF 그래프 형식으로 나타낸 데이터 맵을 예로 제시하였다. 본 연구결과는 DCAT 기반의 교통 메타 데이터 구축의 방향을 제시하고, 복잡한 데이터 관계를 시각적으로 직관적으로 이해하고 이용자가 필요한 데이터를 효율적으로 검색하는 데이터 검색시스템의 기반이 될 것으로 기대된다.