• 제목/요약/키워드: 학습 데이터

검색결과 6,438건 처리시간 0.041초

생성형 AI의 법적 문제와 규제 논의 동향 (Legal Issues and Regulatory Discussions in Generative AI)

  • 김법연
    • 정보화정책
    • /
    • 제31권3호
    • /
    • pp.3-33
    • /
    • 2024
  • 본 논문은 생성형 AI와 관련하여 제기되는 법적 문제점과 쟁점들을 정리한 것이다. 그리고 이러한 쟁점을 해결하거나 대응하기 위하여 혹은 생성형 AI가 제기하는 위험성을 최소화하기 위하여 개별 국가 또는 국제기구 등은 어떠한 규제적 논의들을 하고 있는지에 대하여 살펴보았다. 생성형 AI로 인해 제기되는 개인의 기본권 침해 문제, 새로운 범죄의 등장과 통제가능성, 특정 시장의 독점화 문제와 환경 문제 등이 주로 논의되고 있고, 규제의 필요성과 방향성에 대해 약간의 차이는 있지만 대부분의 국가들이 유사한 시각을 지니고 있는 것으로 보인다. AI와 관련하여서는 등장 초기부터 현재 제기되고 있는 문제들이 지속적으로 논의되어 왔었다. 특정 쟁점들은 상대적으로 많은 논의가 이루어졌지만 국가별로 조금씩 차이가 존재하기도 하고 과거와 다른 현상에 대한 고려가 필요한 상황들도 생겨나고 있다. 개별 국가의 상황에 맞추어 규제와 정책 등을 세밀화하고 있는 것으로 보인다. 다양한 쟁점들이 빠르게 등장하고 변화하는 상황에서, AI의 위험성을 최소화하고 안전한 AI의 활용을 통해 AI로 인한 효용과 이익을 향유하기 위한 방안들을 모색하여야 할 것이다. 국제적인 동향을 지속적으로 파악 및 분석하면서 국내에 적합한 AI 관련 규제와 세부 정책 등을 정비하는 것이 필요할 것이다.

화생방 오염확산 시나리오 분석 시스템 구축 및 활용 (Development and Application of a Scenario Analysis System for CBRN Hazard Prediction)

  • 이병헌;서지윤;남현우
    • 한국시뮬레이션학회논문지
    • /
    • 제33권3호
    • /
    • pp.13-26
    • /
    • 2024
  • 화생방 확산 예측 모델은 전쟁 상황에서 생화학 작용제 및 방사능 물질을 활용한 공격 시 사건 발생 시간, 위치, 작용제 종류 및 투발 수단과 기상정보의 필수 시나리오 정보와 지형 및 건물정보를 바탕으로 피해 예측 정보를 생성하여 보다 나은 지휘관의 결심을 돕는 시스템이다. 국방과학연구소에서 개발한 화생방 보고관리 및 모델링 S/W 시스템(Nuclear, Biological, and Chemical Reporting And Modeling S/W System)은 화생방 사건 분석을 위해 독자적으로 개발된 모델로 여러 군사작전과 훈련 계획 수립을 지원한다. 본 논문에서는 NBC_RAMS의 오염확산 및 피해 예측 핵심 엔진을 사용하여 다양한 화생방 시나리오가 반영된 대용량 오염확산 예측 결과를 생성하고 분석할 수 있는 화생방 오염확산 시나리오 분석 시스템을 소개하고 이 시스템의 시나리오 입력정보 요소인 사건, 기상, 지형 및 건물정보를 상세히 설명하고 이에 대한 활용방안을 기술하였다. 실사용 사례로 화생방 오염확산 시나리오 분석 시스템을 활용하여 생성된 대용량 데이터를 인공지능 기술로 학습하여 오염운의 원점을 추적하는 기술과 화생방 탐지 센서 최적의 위치를 선정하는 기술 개발 사례를 소개하고자 한다. 해당 시스템을 통해 인공지능에 특화된 화생방 상황 분석 자료를 생성할 수 있으며 화생방 야전 상황 예측 및 분석으로 군사작전 지원 등의 다방면으로 활용이 가능할 것으로 기대된다.

네트노그라피를 이용한 공개 소프트웨어의 개발 및 확산 패턴 분석에 관한 연구 - 자바스크립트 프레임워크 사례를 중심으로 - (Tracing the Development and Spread Patterns of OSS using the Method of Netnography - The Case of JavaScript Frameworks -)

  • 강희숙;윤인환;이희상
    • 경영과정보연구
    • /
    • 제36권3호
    • /
    • pp.131-150
    • /
    • 2017
  • 본 연구의 목적은 공개 소프트웨어(Open Source Software, 이하 OSS)가 운영 기간 내 주변의 행위자들과 관계를 수립하는 동안 OSS의 개발 및 확산 패턴을 확인하는 것으로, OSS 참여자들의 변화 패턴을 조사하기 위해 OSS 통과시간을 기반으로 그 변화 양상을 추적할 수 있는 온라인 데이터와 네트노그라피 방법을 이용하였다. 이를 위해 대표적인 OSS 자바스크립트 프레임워크인 jQuery, MooTools, YUI 등 이상 세 가지 사례에 대하여 블로그, 웹 서치와 함께 GitHub 공개 API(Application Programming Interface)로 수집된 데이터를 활용하였다. 본 연구에서는 OSS 변형 과정의 변화 패턴을 분류하기 위하여 행위자-네트워크 이론의 전환(translation) 과정을 적용하였으며, 관찰된 OSS 변형 과정을 살펴보면 다음과 같다. 먼저, '프로젝트 개시' 단계에서 소스 코드, 프로젝트 책임자 및 관계자, 내부 참여자 등과 같은 세 가지 유형의 OSS 관련 행위자들을 확인하였고, 그들 사이의 관계성을 개념화 하였다. 이후 프로젝트 책임자가 최초로 프로젝트를 착수하는 '프로젝트 성장' 단계는 관계자들에 의해 소스 코드가 유지 보수되는 과정을 통해 개선된다. 마지막으로 OSS는 홍보 활동을 통해 참여자들의 관찰기를 갖고, 소스 코드 사용을 통해 학습기를 거친 사용자가 본격적으로 등장함으로써 '참여자의 도약' 단계로 진입한다. 이 시기에는 기업과 외부 관계자들도 출현하는 모습도 살펴볼 수 있다. 본 연구결과는 OSS 참여자들이 OSS를 선택하는데 있어 홍보 과정의 중요성을 강조하고, OSS의 급속한 개발속도가 오히려 참여자의 출현을 지연시키는 구축 효과(crowding-out effec)가 발생하는 것을 확인하였다. 본 연구는 행위자-네트워크 이론을 토대로 주요 OSS 사례를 네트노그라피를 활용하여 종단적인 관점에서 분석함으로써 OSS의 발전 과정을 일반화시키기 위한 노력을 시도했다는 점에서 학술적인 의의가 있으며, OSS가 지배적인 위치에 오르기 위한 단계별 영향 요인, 세부적인 변화 양상 등을 확인함으로써 OSS 개발자와 관리자들에게 다양한 시사점을 제공할 것으로 기대된다.

  • PDF

추천 시스템의 성능 안정성을 위한 예측적 군집화 기반 협업 필터링 기법 (Predictive Clustering-based Collaborative Filtering Technique for Performance-Stability of Recommendation System)

  • 이오준;유은순
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.119-142
    • /
    • 2015
  • 사용자의 취향과 선호도를 고려하여 정보를 제공하는 추천 시스템의 중요성이 높아졌다. 이를 위해 다양한 기법들이 제안되었는데, 비교적 도메인의 제약이 적은 협업 필터링이 널리 사용되고 있다. 협업 필터링의 한 종류인 모델 기반 협업 필터링은 기계학습이나 데이터 마이닝 모델을 협업 필터링에 접목한 방법이다. 이는 희박성 문제와 확장성 문제 등의 협업 필터링의 근본적인 한계를 개선하지만, 모델 생성 비용이 높고 성능/확장성 트레이드오프가 발생한다는 한계점을 갖는다. 성능/확장성 트레이드오프는 희박성 문제의 일종인 적용범위 감소 문제를 발생시킨다. 또한, 높은 모델 생성 비용은 도메인 환경 변화의 누적으로 인한 성능 불안정의 원인이 된다. 본 연구에서는 이 문제를 해결하기 위해, 군집화 기반 협업 필터링에 마르코프 전이확률모델과 퍼지 군집화의 개념을 접목하여, 적용범위 감소 문제와 성능 불안정성 문제를 해결한 예측적 군집화 기반 협업 필터링 기법을 제안한다. 이 기법은 첫째, 사용자 기호(Preference)의 변화를 추적하여 정적인 모델과 동적인 사용자간의 괴리 해소를 통해 성능 불안정 문제를 개선한다. 둘째, 전이확률과 군집 소속 확률에 기반한 적용범위 확장으로 적용범위 감소 문제를 개선한다. 제안하는 기법의 검증은 각각 성능 불안정성 문제와 확장성/성능 트레이드오프 문제에 대한 강건성(robustness)시험을 통해 이뤄졌다. 제안하는 기법은 기존 기법들에 비해 성능의 향상 폭은 미미하다. 또한 데이터의 변동 정도를 나타내는 지표인 표준 편차의 측면에서도 의미 있는 개선을 보이지 못하였다. 하지만, 성능의 변동 폭을 나타내는 범위의 측면에서는 기존 기법들에 비해 개선을 보였다. 첫 번째 실험에서는 모델 생성 전후의 성능 변동폭에서 51.31%의 개선을, 두 번째 실험에서는 군집 수 변화에 따른 성능 변동폭에서 36.05%의 개선을 보였다. 이는 제안하는 기법이 성능의 향상을 보여주지는 못하지만, 성능 안정성의 측면에서는 기존의 기법들을 개선하고 있음을 의미한다.

비용효율적 지능형 침입탐지시스템 구현을 위한 유전자 알고리즘 기반 통합 모형 (An Integrated Model based on Genetic Algorithms for Implementing Cost-Effective Intelligent Intrusion Detection Systems)

  • 이현욱;김지훈;안현철
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.125-141
    • /
    • 2012
  • 본 연구는 최근 그 중요성이 한층 높아지고 있는 침입탐지시스템(IDS, Intrusion Detection System)의 침입탐지모형을 개선하기 위한 방안으로 유전자 알고리즘에 기반한 새로운 통합모형을 제시한다. 본 연구의 제안모형은 서로 상호보완적 관계에 있는 이분류 모형인 로지스틱 회귀분석(LOGIT, Logistic Regression), 의사결정나무(DT, Decision Tree), 인공신경망 (ANN, Artificial Neural Network), 그리고 SVM(Support Vector Machine)의 예측결과에 적절한 가중치를 부여해 최종 예측결과를 산출하도록 하였는데, 이 때 최적 가중치의 탐색을 위한 방법으로는 유전자 알고리즘을 사용한다. 아울러, 본 연구에서는 1차적으로 오탐지율을 최소화하는 최적의 모형을 산출한 뒤, 이어 비대칭 오류비용 개념을 반영해 오탐지로 인해 발생할 수 있는 전체 비용을 최소화할 수 있는 최적 임계치를 탐색, 최종적으로 가장 비용 효율적인 침입탐지모형을 도출하고자 하였다. 본 연구에서는 제안모형의 우수성을 확인하기 위해, 국내 한 공공기관의 보안센서로부터 수집된 로그 데이터를 바탕으로 실증 분석을 수행하였다. 그 결과, 본 연구에서 제안한 유전자 알고리즘 기반 통합모형이 인공신경망이나 SVM만으로 구성된 단일모형에 비해 학습용과 검증용 데이터셋 모두에서 더 우수한 탐지율을 보임을 확인할 수 있었다. 비대칭 오류비용을 고려한 전체 비용의 관점에서도 단일모형으로 된 비교모형에 비해 본 연구의 제안모형이 더 낮은 비용을 나타냄을 확인할 수 있었다. 이렇게 실증적으로 그 효과가 검증된 본 연구의 제안 모형은 앞으로 보다 지능화된 침입탐지시스템을 개발하는데 유용하게 활용될 수 있을 것으로 기대된다.

초등학생의 시스템 사고 요인 구조 검증과 선호 과목에 따른 시스템 사고 비교 (Verification the Systems Thinking Factor Structure and Comparison of Systems Thinking Based on Preferred Subjects about Elementary School Students')

  • 이효녕;전재돈;이현동
    • 한국과학교육학회지
    • /
    • 제39권2호
    • /
    • pp.161-171
    • /
    • 2019
  • 이 연구의 주요 목적은 초등학생의 시스템 사고 요인 구조를 검증하고 초등학생의 선호 과목군에 따른 시스템 사고를 비교하여 추후 연구에 대한 시사점을 얻는 것이다. 이를 위하여 사전 검사에서는 Lee et al.(2013)이 개발한 STMI로 초등학생 732명의 데이터를 수집하였다. 그리고 탐색적 요인분석을 실시하여 초등학생이 STMI를 어떤 요인 구조로 인식하는지를 확인하였다. 그리고 사전 검사 결과를 기초로 전문가 협의회를 거쳐 초등학생들이 STMI가 의도한 5요인 구조에 응답할 수 있도록 검사지를 수정하였다. 사후 검사에서는 수정된 STMI로 초등학생 503명의 데이터를 수집하고 탐색적 요인분석을 실시하였다. 연구 결과는 다음과 같다. 첫째, 사전 검사에서 초등학생들은 STMI를 2개 요인(개인 내적 요인, 개인 외적 요인)으로 구성된 검사지로 응답하였다. 검사지에 대한 전체 신뢰도는 .932였으며 요인별 신뢰도는 .857과 .894로 나타났다. 둘째, 수정된 STMI에 대해서는 초등학생은 4개 요인으로 구성된 검사지로 응답하였다. 초등학생은 팀 학습, 공유 비전, 개인 숙련은 각각 독립된 요인으로 응답하였으며 정신 모델과 시스템 분석을 하나의 요인으로 응답하였다. 전체 검사지에 대한 신뢰도는 .886이었으며 요인별 신뢰는 .686~.864로 나타났다. 셋째, 초등학생의 선호 과목군에 따른 시스템 사고를 비교한 결과 자연과학(공학) 과목군을 선택한 학생들과 예술(예체능)을 선택한 학생들 사이에 유의미한 차이가 나타났다. 결론적으로 초등학생에게 적합한 용어와 문장 구조로 수정된 시스템 사고 검사지를 활용할 경우 시스템 사고를 비교하는 연구에서 통계적으로 유의미한 결과를 얻을 수 있음을 확인하였으며, 추후 선호하는 과목군 등 여러 학생 변인들과 시스템 사고와의 관련성 연구도 이루어질 필요성이 제기된다.

역 원근변환 기법을 이용한 터널 영상유고시스템의 원거리 감지 성능 향상에 관한 연구 (A study for improvement of far-distance performance of a tunnel accident detection system by using an inverse perspective transformation)

  • 이규범;신휴성
    • 한국터널지하공간학회 논문집
    • /
    • 제24권3호
    • /
    • pp.247-262
    • /
    • 2022
  • 국내 200 m 이상 연장의 터널에서는 CCTV 설치가 의무화되어 있으며, 터널 내 돌발 상황을 자동으로 인지한 다음 터널 관리자에게 알릴 수 있는 터널 영상유고시스템의 운영이 권고된다. 여기서 터널 내 설치된 CCTV는 터널 구조물의 공간적인 한계로 인해 낮은 높이로 설치된다. 이에 따라 이동차량과 매우 인접하므로, 이동차량과 CCTV와의 거리에 따른 원근현상이 매우 심하다. 이로 인해, 기존 터널 영상유고시스템은 터널 CCTV로부터 멀리 떨어질수록 차량의 정차 및 역주행, 보행자 출현 및 화재 발생과 같은 터널 내 유고상황을 인지하기 매우 어려우며, 100 m 이상의 거리에서는 높은 유고상황 인지 성능을 기대하기 어려운 것으로 알려져 있다. 이 문제를 해결하기 위해 관심영역 설정 및 역 원근변환(Inverse perspective transform)을 도입하였으며, 이 과정을 통해 얻은 변환영상은 먼 거리에 있는 객체의 크기가 확대된다. 이에 따라 거리에 따라 객체의 크기가 비교적 일정하게 유지되므로, 거리에 따른 객체 인식 성능과 영상에서 보이는 차량의 이동속도 또한 일관성을 유지할 수 있다. 이를 증명하기 위해 본 논문에서는 터널 CCTV의 원본영상과 변환영상을 바탕으로 동일한 조건을 가지는 데이터셋을 각각 제작 및 구성하였으며, 영상 내 차량의 실제 위치의 변화에 따른 겉보기 속도와 객체 크기를 비교하였다. 그 다음 딥러닝 객체인식 모델의 학습 및 추론을 통해 각 영상 데이터셋에 대한 거리에 따른 객체인식 성능을 비교하였다. 결과적으로 변환영상을 사용한 모델은 200 m 이상의 거리에서도 객체인식 성능과 이동차량의 유고상황 인지 성능을 확보할 수 있음을 보였다.

딥러닝 기반 옥수수 포장의 잡초 면적 평가 (Deep Learning Approaches for Accurate Weed Area Assessment in Maize Fields)

  • 박혁진;권동원;상완규;반호영;장성율;백재경;이윤호;임우진;서명철;조정일
    • 한국농림기상학회지
    • /
    • 제25권1호
    • /
    • pp.17-27
    • /
    • 2023
  • 포장에서 잡초의 발생은 농작물의 생산량을 크게 떨어트리는 원인 중 하나이고 SSWM을 기반으로 잡초를 변량 방제하기 위해서 잡초의 발생 위치, 밀도 그리고 이를 정량화하는 것은 필수적이다. 본 연구에서는 2020년의 국립식량과학원에서 잡초 피해를 입은 옥수수 포장의 영상데이터를 무인항공기를 활용해서 수집하였고 이를 배경과 옥수수로 분리하여 딥러닝 기반 영상 분할 모델 제작을 위한 학습데이터를 획득하였다. DeepLabV3+, U-Net, Linknet, FPN의 4가지의 영상 분할 네트워크들의 옥수수의 검출 정확도를 평가하기 위해 픽셀정확도, mIOU, 정밀도, 재현성의 지표를 활용해서 정확도를 검증하였다. 검증 결과 DeepLabV3+ 모델이 0.76으로 가장 높은 mIOU를 나타냈고, 해당 모델과 식물체의 녹색 영역과 배경을 분리하는 지수인 ExGR을 활용해서 잡초의 면적을 정량화, 시각화하였다. 이러한 연구의 결과는 무인항공기로 촬영된 영상을 활용해서 넓은 면적의 옥수수 포장에서 빠르게 잡초의 위치와 밀도를 특정하고 정량화하는 것으로 잡초의 밀도에 따른 제초제의 변량 방제를 위한 의사결정에 도움이 될 것으로 기대한다.

기침 소리의 다양한 변환을 통한 코로나19 진단 모델 (A COVID-19 Diagnosis Model based on Various Transformations of Cough Sounds)

  • 김민경;김건우;최근호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.57-78
    • /
    • 2023
  • 2019년 11월 중국 우한시에서 발병한 코로나19는 2020년 중국을 넘어 세계로 퍼져나가 2020년 3월에는 전 세계적으로 확산되었다. 코로나19와 같이 전염성이 강한 바이러스는 예방과 확진시 적극적인 치료도 중요하지만 우선 전파 속도가 빠른 바이러스인 점을 감안할 때, 확진 사실을 재빠르게 파악하여 전파를 차단하는 것이 더욱 중요하다. 그러나 감염여부를 확인하기 위한 PCR검사는 비용과 시간이 많이 소요되고, 자가키트검사 또한 접근성은 쉽지만 매번 수시로 받기에는 키트의 가격이 부담이 될 수밖에 없는 실정이다. 이러한 상황에서 기침 소리를 기반으로 코로나19 양성 여부를 판단할 수 있게 된다면 누구나 쉽게 언제, 어디서든 확진 여부를 체크할 수 있어 신속성과 경제성 측면에서 큰 장점을 가질 수 있을 것이다. 따라서 본 연구는 기침 소리를 기반으로 코로나19 확진 여부를 식별할 수 있는 분류 모델을 개발하는 것을 목적으로 하였다. 이를 위해, 본 연구에서는 먼저 MFCC, Mel-Spectrogram, Spectral contrast, Spectrogram 등을 통해 기침 소리를 벡터화 하였다. 이 때, 기침 소리의 품질을 위해 SNR을 통해 잡음이 많은 데이터는 삭제하였고, chunk를 통해 음성 파일에서 기침 소리만 추출하였다. 이후, 추출된 기침 소리의 feature를 이용하여 코로나 양성과 음성을 분류하기 위한 모델을 구축하였으며, XGBoost, LightGBM, FCNN 알고리즘을 통해 모델 학습을 수행하고 각 알고리즘별 성능을 비교하였다. 또한, 기침 소리를 다차원 벡터로 변환한 경우와, 이미지로 변환한 경우에 대해 모델 성능에 대한 비교 실험을 수행하였다. 실험 결과, 건강상태에 대한 기본정보와 기침 소리를 MFCC, Mel-Spectogram, Spectral contrast, 그리고 Spectrogram을 통해 다차원 벡터로 변환한 feature를 모두 활용한 LightGBM 모델이 0.74의 가장 높은 정확도를 보였다.

다이내믹 토픽 모델링의 의미적 시각화 방법론 (Semantic Visualization of Dynamic Topic Modeling)

  • 연진욱;부현경;김남규
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.131-154
    • /
    • 2022
  • 최근 방대한 양의 텍스트 데이터에 대한 분석을 통해 유용한 지식을 창출하는 시도가 꾸준히 증가하고 있으며, 특히 토픽 모델링(Topic Modeling)을 통해 다양한 분야의 여러 이슈를 발견하기 위한 연구가 활발히 이루어지고 있다. 초기의 토픽 모델링은 토픽의 발견 자체에 초점을 두었지만, 점차 시기의 변화에 따른 토픽의 변화를 고찰하는 방향으로 연구의 흐름이 진화하고 있다. 특히 토픽 자체의 내용, 즉 토픽을 구성하는 키워드의 변화를 수용한 다이내믹 토픽 모델링(Dynamic Topic Modeling)에 대한 관심이 높아지고 있지만, 다이내믹 토픽 모델링은 분석 결과의 직관적인 이해가 어렵고 키워드의 변화가 토픽의 의미에 미치는 영향을 나타내지 못한다는 한계를 갖는다. 본 논문에서는 이러한 한계를 극복하기 위해 다이내믹 토픽 모델링과 워드 임베딩(Word Embedding)을 활용하여 토픽의 변화 및 토픽 간 관계를 직관적으로 해석할 수 있는 방안을 제시한다. 구체적으로 본 연구에서는 다이내믹 토픽 모델링 결과로부터 각 시기별 토픽의 상위 키워드와 해당 키워드의 토픽 가중치를 도출하여 정규화하고, 사전 학습된 워드 임베딩 모델을 활용하여 각 토픽 키워드의 벡터를 추출한 후 각 토픽에 대해 키워드 벡터의 가중합을 산출하여 각 토픽의 의미를 벡터로 나타낸다. 또한 이렇게 도출된 각 토픽의 의미 벡터를 2차원 평면에 시각화하여 토픽의 변화 양상 및 토픽 간 관계를 표현하고 해석한다. 제안 방법론의 실무 적용 가능성을 평가하기 위해 DBpia에 2016년부터 2021년까지 공개된 논문 중 '인공지능' 관련 논문 1,847건에 대한 실험을 수행하였으며, 실험 결과 제안 방법론을 통해 다양한 토픽이 시간의 흐름에 따라 변화하는 양상을 직관적으로 파악할 수 있음을 확인하였다.