• Title/Summary/Keyword: 인공지능모델

검색결과 1,552건 처리시간 0.027초

KE-T5: 한국어-영어 대용량 텍스트를 활용한 이중언어 사전학습기반 대형 언어모델 구축 (Construction of bilingually pre-trained language model from large-scaled Korean and English corpus)

  • 신사임;김산;서현태
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.419-422
    • /
    • 2021
  • 본 논문은 한국어와 영어 코퍼스 93GB를 활용하여 구축한 대형 사전학습기반 언어모델인 KE-T5를 소개한다. KE-T5는 한국어와 영어 어휘 64,000개를 포함하는 대규모의 언어모델로 다양한 한국어처리와 한국어와 영어를 모두 포함하는 번역 등의 복합언어 태스크에서도 높은 성능을 기대할 수 있다. KE-T5의 활용은 대규모의 언어모델을 기반으로 영어 수준의 복잡한 언어처리 태스크에 대한 연구들을 본격적으로 시작할 수 있는 기반을 마련하였다.

  • PDF

언어학 관점에서의 한국어 대조학습 기반 문장 임베딩의 허위 문맥화에 대한 고찰 (Analyzing Spurious Contextualization of Korean Contrastive Sentence Representation from the Perspective of Linguistics)

  • 정유현;한명수;채동규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.468-473
    • /
    • 2023
  • 본 논문은 사전 학습 언어 모델의 특성인 이방성과 문맥화에 주목하여 이에 대한 분석 실험과 한국어 언어 모델만의 새로운 관점을 제안한다. 최근 진행된 영어 언어 모델 분석 연구에서 영감을 받아, 한국어 언어 모델에서도 대조학습을 통한 이방성과 문맥화의 변화를 보고하였으며, 다양한 모델에 대하여 토큰들을 문맥화 정도에 따라 분류하였다. 또한, 한국어의 언어학적 특성을 고려하여, 허위 문맥화를 완화할 수 있는 토큰을 문맥 중심어로, 문맥 중심어의 임베딩을 모방하는 토큰을 문맥 기능어로 분류하는 기준을 제안하였다. 간단한 적대적 데이터 증강 실험을 통하여 제안하는 분류 기준의 가능성을 확인하였으며, 본 논문이 향후 평가 벤치마크 및 데이터셋 제작, 나아가 한국어를 위한 강건한 학습 방법론에 기여하길 바란다.

  • PDF

의료인공지능 연구/개발 및 실용화를 위한 지능형 병원정보시스템 모델 (Intelligent Hospital Information System Model for Medical AI Research/Development and Practical Use)

  • 손병은;정성문
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.67-75
    • /
    • 2022
  • 의료정보는 의료기기뿐만 아니라 카메라 등의 기기로부터 다양하게 생성된다. 최근 의료빅데이터 수집 및 관리에서부터 환자의 상태분석을 위한 의료인공지능 제품 및 관련 융합기술들이 급격히 증가하고 있지만, 실용화까지의 절차들이 산재되어 있어 실적용에 어려움을 겪고 있다. 본 논문에서는 의료인공지능 기술 연구, 개발 및 실용화 절차를 간소화하고, 관련 산업 발전 가속화를 위한 지능형 병원정보시스템 모델을 제안한다. 제안한 모델은 의료기관에서 (1)다양한 기기로부터 환자 데이터의 실시간 관리, (2)의료인공지능 기술 개발에 특화된 데이터 정제 및 관리, (3)개발된 의료인공지능 기술의 실시간 적용을 통합 지원한다. 이를 이용하여 환자모니터링기기로부터 실시간 생체데이터 수집 및 의료인공지능 특화 데이터 생성 사례와 기 개발된 카메라 기반 환자 보행분석 및 뇌MRA 기반 뇌혈관질환분석 기술의 구체적 적용사례를 소개한다. 제안한 모델을 기반으로 인공지능 개발에 필요한 데이터의 보안성 증대 및 일관된 인터페이스의 플랫폼화를 통한 실용화 증대로 병원정보시스템 개선에 활용되기를 기대한다.

인공지능 기술기반의 통합보안관제 서비스모델 개발방안 (Development of Integrated Security Control Service Model based on Artificial Intelligence Technology)

  • 오영택;조인준
    • 한국콘텐츠학회논문지
    • /
    • 제19권1호
    • /
    • pp.108-116
    • /
    • 2019
  • 본 논문에서는 인공지능기술을 통합보안관제 기술에 효율적으로 적용하는 방안을 제안하였다. 즉, 통합보안관제시스템에 수집된 빅 데이터를 기반으로 머신러닝 학습을 인공지능에 적용하여 사이버공격을 탐지하도록 하고 적절한 대응을 한다. 기술의 발달에 따라서 늘어나는 보안장비와 보안 프로그램들로부터 쌓이는 수많은 대용량의 로그들을 사람이 일일이 분석하기에는 한계에 부딪히고 있다. 분석방법 또한 한 가지 로그가 아닌 여러 가지 이기종간의 보안장비의 로그까지 서로 상관분석을 해야 하기 때문에 더욱 더 통합보안관제에 적용되어서 신속한 분석이 이루어져야 하겠다. 이런 행위를 분석하고 대응하는 과정들이 효과적인 학습방법을 통해서 점진적으로 진화를 거쳐 성숙해가는 인공지능기반 통합보안관제 서비스모델을 새롭게 제안하였다. 제안된 모델에서 예상되는 핵심적인 문제점들에 대한 해결방안을 모색하였다. 그리고 정상 행위 기반의 학습모델을 개발하여 식별되지 않는 비 정상행위 위협에 대응력을 강화하는 학습방법을 도출하였다. 또한, 제안된 보안 서비스모델을 통하여 보안담당자들의 분석과 대응을 효율적으로 지원할 수 있는 보안관제에 대한 향후 연구방향을 제시하였다.

이미지 기반 적대적 사례 생성 기술 연구 동향

  • 오희석
    • 정보보호학회지
    • /
    • 제30권6호
    • /
    • pp.107-115
    • /
    • 2020
  • 다양한 응용분야에서 심층신경망 기반의 학습 모델이 앞 다투어 이용됨에 따라 인공지능의 설명 가능한 동작 원리 해석과, 추론이 갖는 불확실성에 관한 분석 또한 심도 있게 연구되고 있다. 이에 심층신경망 기반 기계학습 모델의 취약성이 수면 위로 드러났으며, 이러한 취약성을 이용하여 악의적으로 모델을 공격함으로써 오동작을 유도하고자 하는 시도가 다방면으로 이루어짐에 의해 학습 모델의 강건함 보장은 보안 분야에서의 쟁점으로 부각되고 있다. 모델 추론의 입력으로 이용되는 이미지에 교란값을 추가함으로써 심층신경망의 오분류를 발생시키는 임의의 변형된 이미지를 적대적 사례라 정의하며, 본 논문에서는 최근 인공지능 및 컴퓨터비전 분야에서 이루어지고 있는 이미지 기반 적대적 사례의 생성 기법에 대하여 논한다.

오픈 도메인 대화를 위한 노이징된 가이드 기반 생성 모델 (Noised Guide-based Generative Model for Open-domain Conversation)

  • 금빛나;김홍진;박상민;김재은;황금하;권오욱;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.82-87
    • /
    • 2022
  • 대화 모델은 대표적으로 검색 모델 또는 생성 모델을 기반으로 구현된다. 최근에는 두 모델의 장점은 융합하고 단점은 보완하기 위해 검색 기법과 생성 기법을 결합하는 연구가 활발히 이루어지고 있다. 그러나 생성 모델이 검색된 응답을 전혀 반영하지 않고 응답을 생성하여 검색 모델을 간과하는 문제 또는 검색된 응답을 그대로 복사해 생성하여 검색 모델에 과의존하는 문제가 발생한다. 본 논문에서는 이러한 문제들을 완화하며 검색 모델과 생성 모델을 모두 조화롭게 활용할 수 있는 대화 모델을 제안한다. 생성 모델이 검색 모델을 간과하는 문제를 완화하기 위해 학습 시 골드 응답을 검색된 응답과 함께 사용한다. 또한, 검색 모델에 과의존하는 문제를 완화하기 위해 검색된 응답들의 내용어 일부를 마스킹하고 순서를 무작위로 섞어 노이징한다. 검색된 응답은 대화 컨텍스트와의 관련성이 높은 것만을 선별하여 생성에 활용한다. 정량 평가 및 정성 평가를 통해 제안한 방법의 성능 향상 효과를 확인하였다.

  • PDF

인공지능 기반의 백내장 검출 플랫폼 개발 (Ai-Based Cataract Detection Platform Develop)

  • 박도영;김백기
    • Journal of Platform Technology
    • /
    • 제10권1호
    • /
    • pp.20-28
    • /
    • 2022
  • 인공지능기반의 건강 데이터 검증은 임상 연구에 도움을 줄 뿐만 아니라, 새로운 치료법을 개발하는데 필수 요소가 되었다. 미국 식품의약 관리국이 의학진단 분야 중 인공지능을 이용하여 성인 당뇨병 환자의 경증 이상 당뇨병성 망막증을 감지하는 의료기기 마케팅을 승인한 이래, 인공지능을 이용한 테스트가 증가하고 있다. 본 연구에서는 구글에서 지원하는 Teachable Machine 을 이용하여 이미지 분류 기반의 인공지능모델을 생성하고, 학습을 통한 예측 모델을 완성하였다. 이는 현재 만성질환의 환자들 중 발생하는 안구 질환 중 백내장의 조기 발견하는데 용이하게 할 뿐만 아니라, 눈 건강을 위해 헬스케어 프로그램으로 안 질환 예방을 위한 디지털 개인건강 헬스케어 앱을 개발하기 위한 기초 연구로 진행되었다.

누적 가중치 변화의 시각화를 통한 심층 신경망 분석시스템 (Deep Neural Network Analysis System by Visualizing Accumulated Weight Changes)

  • 양태린;박진호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권3호
    • /
    • pp.85-92
    • /
    • 2023
  • 최근 ChatGPT나 자율주행 자동차 등의 인공지능 분야의 급속한 발전으로 인해 인공지능에 대한 관심이 높아졌다. 그러나 아직 인공지능은 학습 과정에서 알 수 없는 요소가 많이 존재하여 모델을 개선하거나 최적화하기 위해서 필요 이상의 시간과 노력을 들여야 하는 경우가 많다. 따라서, 인공지능 모델의 학습 과정에서 가중치 변화를 명확하게 이해하고 해당 변화를 효과적으로 분석할 수 있는 도구 또는 방법론이 절실하게 요구되고 있다. 본 연구에서는 이러한 점을 해결하기 위해 누적 가중치 변화량을 시각화해주는 시스템을 제안한다. 시스템은 학습의 일정한 기간마다 가중치를 구하고 가중치의 변화를 누적시켜서 누적 가중치로 저장하여 3차원 공간상에 나타내게 된다. 이로 인해 보는 이로 하여금 한눈에 레이어의 구조와 현재의 가중치 변화량이 이해되기 쉽게 구성하였다. 이러한 연구를 통해 인공지능 모델의 학습 과정이 어떻게 진행되는지에 대한 이해와 모델의 성능 향상에 도움이 되는 방향으로 하이퍼 파라미터를 변경할 수 있는 지표를 얻게 되는 등 인공지능 학습 과정의 다양한 측면을 탐구할 수 있을 것이다. 이러한 시도를 통해 아직 미지의 영역으로 여겨지는 인공지능 학습 과정의 일부를 보다 효과적으로 탐색하고 인공지능 모델의 발전과 적용에 기여할 수 있을 것으로 기대된다.

인공지능 모델에 의한 지하수위 모의결과의 적절성 판단을 위한 허용가능한 예측오차 범위의 추정 (Estimation of the allowable range of prediction errors to determine the adequacy of groundwater level simulation results by an artificial intelligence model)

  • 신문주;문수형;문덕철;류호윤;강경구
    • 한국수자원학회논문집
    • /
    • 제54권7호
    • /
    • pp.485-493
    • /
    • 2021
  • 지하수는 지표수와 함께 용수로 사용가능한 중요한 수자원이며 특히 섬 지역의 경우 전체 수자원 중 지하수의 이용 비율이 상대적으로 높기 때문에 안정적인 이용을 위해 지하수위 변동성에 대한 연구는 필수적이다. 지하수위 변동성의 예측 및 분석을 위해 인공지능 모델을 활용한 연구들이 지속적으로 증가하고 있으나 지하수위 예측결과의 적절성을 판단할 수 있는 평가기준을 제시한 연구는 충분하지 않다. 본 연구에서는 허용가능한 지하수위 예측오차의 범위를 제시하기 위해 과거 20년 동안 전 세계 다양한 지역을 대상으로 인공지능 모델을 활용하여 지하수위를 예측한 연구결과들을 종합적으로 분석하였다. 그 결과 관측지하수위의 변동성이 커질수록 인공지능 모델에 의한 지하수위 예측오차는 증가하였다. 따라서 관측지하수위 최대변동폭과 예측오차 간의 상관성과 기존 연구들에서 제시한 평가지수들을 고려하여 평가기준을 산정하였으며, 인공지능 모델에 의한 지하수위 예측결과의 적절한 평가기준은 도출된 선형회귀식에 의한 평균제곱근오차 또는 최대오차 이하이거나, NSE ≥ 0.849 또는 R2 ≥ 0.880 이다. 이 허용가능한 오차범위는 인공지능 모델을 활용한 지하수위 예측결과의 적절성 판단을 위한 참고자료로 사용할 수 있다.

다양한 외벽 균열에 강인한 딥러닝 검출 모델 개발 (Robust Detection Deep Learning Model in the Various Exterior Wall Cracks)

  • 김경영;이호령;김동주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.53-56
    • /
    • 2021
  • 국내 산업화가 들어선 후 산업화 당시 지었던 낙후된 건물의 증가에 따라 구조물의 손상 조사 및 검사 방법의 수요가 늘어나고 있다. 일반적으로 구조물의 손상은 전문 검사원이 현장에서 직접 측량도구와 시각적인 방식으로 검사한다. 그러나 전문 검사원들이 직접 조사하는 수고에 비해 균열을 검사하는 방식 자체가 단순하고, 일반 사람이 검사하기에는 객관성이 떨어지는 한계가 있어 균열을 자동적으로 검출함으로써 객관성과 편의성을 보장할 기술이 필요하다. 본 연구에서는 이미지 기반으로 다양한 환경에서의 외벽 균열을 검출할 수 있는 딥러닝 모델 개발을 소개한다. 균열 검출을 위해 다양한 외벽 균열 관련 데이터셋을 확보 및 구축하고 각 데이터셋의 검출 정보를 보완할 반자동(semi-auto) 라벨링 작업을 수행하였다. 두 번째로 기존 높은 검출 성능을 보였던 모델들을 선정 및 비교하여 YOLO v5 모델을 최종적으로 선정하였고, 도메인이 각각 다른 데이터셋에 대한 교차 학습을 통해 각 데이터셋의 mAP의 편차가 31%에서 11%로 좁히는 작업을 수행하였다. 이를 통해 실제 상황에서의 균열 영상에서 균열을 검출할 수 있는 측량 시스템을 개발함으로써 실질적인 검사의 도구로 활용될 수 있길 기대한다.

  • PDF